作者:赵广立 来源:中国科学报 发布时间:2023/5/12 14:19:08
选择字号:
走近首个“吴文俊人工智能科技进步奖特等奖”
“一个让人更加兴奋的技术时代来了”

 

5月6日,代表着我国人工智能科技领域最高荣誉的“吴文俊人工智能科学技术奖”在京揭晓表彰名单。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰带领团队完成的“知识与深度学习融合的通用对话技术及应用”成果,获得了吴文俊人工智能科技进步奖特等奖。

这是该奖项12年来首次评出特等奖。人们不禁想要知道,这是一项怎样的成果、它有何特别之处?让它能在人工智能大潮汹涌的今天,从群雄逐鹿中脱颖而出、独占鳌头?近日,《中国科学报》通过走访百度,试探其中究竟。

王海峰团队获颁吴文俊人工智能科技进步特等奖 百度 供图  ?


谈技术:有何过人之处?

众所周知,近段时间以来,引爆人工智能“能量场”的,正是以ChatGPT为代表的对话机器人。与以往的对话机器人相比,ChatGPT等产品不仅可以与人多轮交互对话,它们还能结合上下文,对对话内容进行记忆、理解、规划等,以给出更贴合用户想法的答案。

事实上,真实应用中的对话机器人背后,是涵盖对话语音识别、管理、生成等一系列复杂技术的人机对话系统。“知识与深度学习融合的通用对话技术”,正是这些复杂技术面向通用场景的系统性突破。

“通用对话技术是人工智能领域最具挑战性的方向之一,也被认为是通用人工智能的必备能力。”在发表获奖感言时,王海峰提到,人工智能(AI)通过学习海量人类知识,在一问一答之间,逐渐能够给出令人们满意的答案,这个过程并不容易。

比如,对话知识统一表示与构建是通用对话的知识基础,若AI不能对对话内容有全局规划,对话的连贯性和条理性就会大打折扣;在语音输入输出的对话中,提升对话语音识别精度与降低延迟很难兼顾,若无法妥善解决,会很影响语音交互的体验感;还有一些知识场景,训练数据稀缺,需要引入小样本学习、反馈驱动持续学习等机制,否则AI难以准确理解对话内容;在对话生成方面,也存在对话行为多样性建模等难题。诸此种种,都对AI能否自然、准确、流畅地与人对话有着显著影响。

基于百度在人工智能技术领域的长年积累,王海峰团队加快脚步,围绕上述通用对话技术中的关键技术和重难点展开攻关,取得了一系列技术突破。

比如,在这项获得吴文俊人工智能科技进步奖特等奖的研究成果中,他们提出了基于知识统一表示的通用对话管理技术,致力解决对话不连贯的难题;优化了融合知识的流式对话语音识别技术,瞄准解决对话听不清的难题;提出了知识增强的通用对话理解技术,以冀解决理解不准确的难题;提出了基于隐变量与知识的对话生成技术,通过攻克对话行为多样性建模难题、研制百亿参数对话预训练生成模型等手段,推动实现内容丰富、知识准确、自然流畅的对话。

颁奖典礼上,中国人工智能学会对这项特等奖成果不吝赞誉:“整体技术指标与应用效果达到国际领先水平,极大地提升了我国在这一领域的科技竞争力和产业影响力。”

看应用:加速缩小与国外最好水平的差距

也正如中国人工智能学会所评说的那样,这项成果的产业影响力同样引人关注。

项目资料显示,“知识与深度学习融合的通用对话技术及应用”这项成果,已获授权发明专利 82 项,发表高水平论文 36 篇,在国际权威评测中获世界冠军11项。目前项目成果已经实现了大规模产业应用,支持5亿台智能设备,服务超过10亿用户,覆盖包括通信、金融、汽车、能源等20多个行业。

“知识与深度学习融合的通用对话技术目前已广泛应用于各行各业和人们生产生活中。”在发表获奖感言时王海峰说道。

备受关注的新一代知识增强大语言模型“文心一言”,也使用了通用对话技术方面的研发创新。文心一言基于文心大模型 ERNIE 及对话大模型 PLATO研发,具备知识增强、检索增强和对话增强等优势。其中,在对话增强方面,文心一言在相应技术的赋能下,具备记忆机制、上下文理解能力和对话规划能力,可以实现更好的对话连贯性、合理性和逻辑性。

通用对话技术在文心一言上的应用,加快了后者追赶世界领先水平的脚步。王海峰在受访中谈到,如果说我们之前跟国外最好的系统还有些差距,“现在这个差距正在加速缩小”。

他告诉记者,百度很早就将自然语言处理技术中的语义理解、语义匹配等技术嵌入到搜索引擎的升级之中,目前搜索应用也在与文心一言协同“进化”;在 ToB业务端,基于知识增强大模型的开发应用正在改变云计算的游戏规则,百度智能云也正借力MaaS(模型即服务)让智能服务变得更易用、更快捷。

人工智能发展已进入新的临界点

亲身经历着一个个新技术从积蓄力量到奋力起飞的故事,看到人工智能不断在模拟、延伸和拓展人的智能的道路上加速进步,这让王海峰不由得感叹:一个让人更兴奋的技术时代到来了。

“因为这意味着AI将给人类带来越来越多的价值。”王海峰回忆说,在2011年百度翻译上线之前,他已经投身于机器翻译领域18年。但百度翻译上线仅一周,增长的用户量就超过了过去18年的总和。如今,百度翻译每天的翻译量达千亿字符。类似地,今天以文心一言为代表的大语言模型技术也面临着大量真实需求。

特别是随着文心一言的迭代升级,王海峰发现,人工智能技术(如通用对话技术)在深度理解与生成、推理计算、跨模态等方方面面都在产生新的突破,这让他更进一步确信:“人工智能技术和产业发展正进入一个新的临界点。”

“人工智能在围棋比赛中第一次击败人类顶尖棋手时,人们都很兴奋,因为这个里程碑事件让人们看到了人工智能进步的程度和它带来的想象。”王海峰说,现在,我们仿佛可以看到未来人工智能将会有全方位的进步,并最终为人类带来方方面面的价值,“这个影响是更深远的”。

值得一提的是,随着人工智能技术进步走向深入,智能化时代信息技术架构传统的“芯片—操作系统—应用”的三层架构或将被颠覆,进而走向“芯片—框架—模型—应用”的四层架构。百度认为,四层架构可顺滑实现层与层反馈、端到端优化,进而让AI在大数据、大模型、大算力上如鱼得水、左右逢源。目前,百度在这四个技术层面全面攻坚,并逐渐成为中国人工智能技术和产业的领航者。

 

 

 

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
研究生怎样快速融入学科圈子? 肉眼可见!JUICE将飞越地球和月球
航迹云带来更多气候变暖 韦布观测到巨行星
>>更多
 
一周新闻排行
 
编辑部推荐博文