作者: 赵广立 来源: 中国科学报 发布时间:2022-12-1
选择字号:
百度CTO王海峰:为千行百业提供低门槛、高效率的大模型服务
从一帧老电影的修复讲起:AI普惠在提速

 

■本报记者 赵广立

在老电影《横空出世》中,中国第一颗原子弹成功爆炸的一幕被搬上银幕,成为影史经典。20多年后的今天,人们不但可以重温这一幕,甚至可以在高清设备上获得更佳的观看体验。这背后,少不了“胶片医生”的贡献。

新“胶片医生”

以前,“胶片医生”是电影修复工作者的别称。在电影频道节目制作中心(以下简称电影频道)拥有的约2万部中外电影资源中,超半数是用胶片拍摄的。为让影视经典色彩更丰富、画面更高清,“胶片医生”们往往要在老电影“分辨率低、噪点高、色彩饱和度低”等问题上“动刀”。

影片主要靠人工手动逐帧修复,费时耗力。随着人工智能(AI)技术的进步,AI一度成为“胶片医生”的得力助手。然而,面对有诸多细分环节的电影修复工作,传统的模型研发所需数据和时间成本都很高,AI修片的效率和效果不孚众望。

转机出现在AI超大规模预训练技术的突破后。

近日,百度联合电影频道,发布业内首个影视行业“智感超清大模型”——电影频道-百度·文心。智感超清大模型深度结合百度AI技术能力和电影频道长期积累的视频修复数据,通过对超分辨率、去噪、去模糊、去压缩等多任务的联合预训练、亿级参数量的学习,可实现对多种损坏情况的修复,并通过画质提升、边缘锐化等方式增强视频的清晰度,全方位提升视频修复效率和观感体验。

另外,智感超清大模型可以用一个模型同时处理影片修复的多个任务,全方位助力电影频道提升视频修复效率。

测试数据显示,使用电影频道-百度·文心大模型每天可修复视频28.5万帧,解决了绝大部分画面的修复问题。即便是需要人工进一步精修,修复速度也能提升3~4倍。

11月30日,Wave Summit+ 2022深度学习开发者峰会线上举行,电影频道-百度·文心也与一众行业大模型一起亮相。在电影频道-百度·文心的加持之下,AI成了新的“胶片医生”。

这一案例表明,AI正随着深度学习平台与大模型技术的成熟逐渐变得更稳健和更有效率,而这也为AI普惠的加速到来铺平了道路。

AI普惠,脚步加快

在Wave Summit+ 2022深度学习开发者峰会上,百度首席技术官(CTO)、深度学习技术及应用国家工程研究中心主任王海峰道出了AI普惠加速背后的关键:“深度学习平台+大模型”能够贯通AI全产业链,夯实了产业智能化的基座。

“深度学习平台+大模型,贯通了从硬件适配、模型训练、推理部署到场景应用的AI全产业链,进一步加速产业智能化升级。”王海峰解释说,作为基础共性平台,开源开放的深度学习开发平台下接芯片、上承应用,堪比智能时代的操作系统;而大模型具有效果好、泛化能力强、研发过程标准化程度高等特点,对深度学习模型的开发、训练和推理部署都提出了更高的要求,引领着深度学习平台的发展方向。

王海峰表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。“大数据、大算力、大模型能力仅需少数企业操心,千行百业直接应用即可。”

这样的产业化路径已经在文心大模型的产业实践中得到验证,联合行业头部企业研制行业大模型就是其中的重要实践之一。

“冰城”哈尔滨拿出城市跨业务、跨结构、跨部门的数据知识和多种任务算法,基于文心基础大模型ERNIE 3.0打造面向城市领域的行业大模型——冰城-百度·文心。通过构建统一预训练模型,冰城-百度·文心具备超强的语言理解、语义分析等能力,有望支撑城市各领域AI规模化应用的开发效率和效果提升。

人民网引入其舆情数据中心积淀的行业知识与任务样本数据,联合百度共建媒体行业大模型——人民网-百度·文心,目前已在“新闻摘编报告生成”等应用场景取得明显的效果。未来,该模型还将被用于新闻事件抽取分析、新闻评论聚合分析、新闻信息个性化推荐等更多场景。

吉利汽车的专家携手百度AI专家,向文心大模型“投喂”吉利汽车行业数据进行预训练,得到性能更强、稳定性更高的汽车领域大模型吉利-百度·文心,目前已应用于吉利的智能客服系统、车载语音系统和汽车领域知识库构建等业务场景中。

此外,还有共同研发燃气行业大模型“深燃-百度·文心”的深燃集团、联合发布电子制造行业大模型“TCL-百度·文心”的TCL、共同打造知识增强的社科行业大模型“辞海-百度·文心”的上海辞书出版社……它们通过行业数据学习、知识挖掘、模型训练,让AI的触角深入到安全质检、电子制造、知识产权保护等各个领域。加之此前已与百度共创行业大模型的国网电力、浦发银行、中国航天,百度已与合作伙伴在十多个行业共创共建行业大模型,推动大模型“下场”,加快了AI普惠的脚步。

大模型生态初现峥嵘

峰会上,王海峰披露,作为开源开放的深度学习平台, 飞桨生态持续繁荣,截至2022年11月,平台已凝聚535万开发者、服务20万家企事业单位、基于飞桨创建67万个模型。

在深度学习平台和预训练大模型的加持下,越来越多领域的行业关键业务实现了AI“替补”人类“出场”,大模型生态初现峥嵘。

农业应用——农作物生长,防虫害是关键。要防虫害,及时、准确的虫情监测是前提。以往,虫情监测要耗费大量的人力、物力,即便如此也难以做到及时、准确监测。宁波“微能物联”通过与百度合作,借助飞桨EasyDL平台产品及背后的文心CV大模型VIMER-CAE,研发了“微能虫情测报系统”。这套系统通过“预训练+微调”范式,实现资源复用和知识积累,提升模型的复用性,目前它已能够根据引诱抓拍的图像分析识别对应虫害,并定制防治方案。

工业应用——韦士肯(厦门)机器人系统有限公司专注于汽车零部件的无损检测。此前该公司针对汽车零部件轴承、电池等的质检工作,采用的智能化方案准确率仅70%多,无法满足需求。后来,借助飞桨EasyDL(背后预置了百度大规模预训练模型)图像任务中的图像分割应用,韦士肯降低了数据标注量,得到了优于原方案的模型效果。

银行业应用——光大银行过去各业务环节比较依赖线下人工流程处理各类文档,经营成本高、运营效率低。为降本增效,光大银行积极向智能化靠拢。然而,业务对AI需求多而复杂,模型生产成本、周期和效果有待改善。后来,光大银行以文心大模型为底座,统一规划建设企业级AI平台,不断整合和升级AI应用能力、响应各类业务需求,目前已在手写签名OCR识别引擎、终端登记智能识别、私行代销产品审核、合格投资者审核等场景实现应用,成果显著。

科研应用(生物医药领域)——化合物的药物代谢动力学(简称ADMET)预测对于制药行业来说是一个极为重要的场景,若能在药物研发早期就排除ADMET性质不佳的分子,针对ADMET性质对候选化合物进行优化,可大幅节省药物研发的时间和资金投入。在大规模的无标注化合物数据库上训练化合物表征大模型HELIX-GEM,使大模型学习到化合物中蕴含的物理化学规律和知识,进而将其应用在众多的ADMET成药性预测任务上,可一举提升ADMET任务的效果。与传统实验方法相比,该模型高效、准确,计算1000个分子的ADMET相关指标只需不到1分钟的时间,且准确率更高。

谈到大模型应用进展,在百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜看来,当下的大模型机制,封装了复杂的模型生产过程和过程中各种各样的消耗。如此一来,行业应用面对的是一个清晰、简单、低门槛的界面。因此,大模型与深度学习平台结合,“给上层的应用带来了更大的想像空间”。

《中国科学报》 (2022-12-01 第3版 综合)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
中国超重元素研究加速器装置刷新纪录 彩色油菜花又添7色!总花色达70种
考研复试,导师心仪这样的学生! 地球刚刚经历最热2月
>>更多
 
一周新闻排行
 
编辑部推荐博文