作者:孟凌霄 来源: 中国科学报 发布时间:2024-5-27
选择字号:
“秒懂”30种方言中国电信用人工智能守护方言

 

■本报记者 孟凌霄

“唔该查吓电话费吖”“侬帮阿拉查下话费好伐?”“帮看哈儿搜机还有好多钱嘛?”过去,当不会说普通话的老年人在中国电信万号智能客服查话费时,“听得懂”是解决问题的第一步。

在中国电信CTO、人工智能研究院院长李学龙的带领下,中国电信人工智能研究院(TeleAI)于5月25日发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。该大模型的最大亮点是摆脱了单一模型只能识别特定单一方言的困境,解译了包括上海方言、粤语、四川方言,以及有“中国最难懂的语言”之称的客家话、温州方言在内的30种方言,一跃成为国内支持最多方言语音识别的大模型。

“作为央企,我们有责任和担当解决老年人及老少边穷地区人群跟不上人工智能时代的难题,让所有人都能享受人工智能带来的便利。”中国电信人工智能研究院语音大模型负责人李杰表示。

发起“守护方言计划”

普通话语音识别已非常成熟,而因为难度大,方言识别发展较为缓慢,中国电信却持续在这一领域发力。

李杰介绍,中国电信作为头部运营商,万号智能客服每天会接到几百万通电话,其中很大比例是方言。目前中国约20%的人口尚未普及普通话,面临着信息服务难以触及的困境。

与此同时,语言文化保护面临严峻挑战。教育部国家语言文字工作委员会发布的《国家中长期语言文字事业改革和发展规划纲要(2012—2020年)》明确提出,要“建立和完善语言资源库,探索方言使用和保护的科学途径”。

在市场导向、业务需求和使命感驱动下,中国电信人工智能研究院致力于使用前沿语音识别技术,让方言沟通更加自然流畅,极大解决老年人及老少边穷地区人群无法触及信息服务的问题,为人们搭建一条通往人工智能时代的沟通桥梁。

在解决现实需求的同时,人工智能正为传承语言文化注入全新生命力。传统方言研究人力工程量巨大且难以系统标注,而中国电信人工智能研究院构建的高质量方言数据库,将更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。

这是一场与时间赛跑的“守护方言计划”。“超多方言语音识别大模型只是我们规划设想中的第一步,接下来我们会持续拓展方言种类、提高识别精确度,争取早日覆盖全国333个地市和主要少数民族语言。”李杰介绍。

“三驾马车”实现高精准识别

如何实现单个语音大模型同时识别多种方言?李杰介绍,数据、算法、算力是星辰超多方言语音识别大模型实现方言识别的“三驾马车”。

“关于方言的数据较少,数据标注后的高质量数据更少,标注成本也更加高昂。”李杰介绍,构建高质量方言数据库是方言保护和研究的基础。当前,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等方面均居于业内前列。

算法层面,研究团队首创了“蒸馏+膨胀”联合训练算法,解决了超大规模、多场景数据集和大规模参数条件下预训练坍缩问题,实现80层模型稳定训练。通过“从语音到token再到文本”的建模新范式,大大降低推理时语音传输比特率。

此外,在算力基础设施方面,中国电信具有得天独厚的优势。作为国内最早进入云计算领域的运营商,中国电信积累了大量算力建设和算力调度的核心技术。今年,中国电信陆续投产了京津冀智算中心、中南智算中心等多个满足大模型训练需求的公共智算中心。

目前,星辰超多方言语音识别大模型以绝对领先的性能,斩获多个国际权威赛事冠军,并不断刷新方言语音识别准确率纪录。

进一步探索新兴应用场景

目前,星辰超多方言语音识别大模型已广泛落地,并深入推动人工智能与各行各业的融合,积极探索新兴应用场景。

借助该大模型,中国电信万号智能客服“秒懂”30种方言,自然流畅地服务用户,实现日均处理约200万通电话;智能客服翼声平台接入该大模型的语音理解和分析能力,实现31个省份全覆盖,每天处理125万通客服电话。如今,该大模型已在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服系统试点应用。

在中国国际大数据产业博览会上,中国电信数字人“数数”“C位”亮相,成为主持人康辉的新搭档。星辰超多方言语音识别大模型已赋予诸多数字人“能听会说”的能力,后者不仅能自然流畅地对话,还能中英文随意切换。

据悉,该大模型已赋能多地市的12345市民服务平台,使每位客服人员“秒懂”30种方言,更了解市民需求,提高沟通效率,助力政务工作智能化升级,更高效、便捷地为市民提供服务。

不仅如此,能用方言沟通的星辰超多方言语音识别大模型,未来将通过广泛的场景应用满足更多群体的情感需求。如有大模型“加持”的智能座驾助手,能与全国各地的司机用他们家乡的方言流畅沟通。该大模型为老年人提供方言版语音交流、智能看护、亲情互动等服务,从精神层面给予慰藉。

“我们已将语音识别大模型全面开源,希望联合开发者共建覆盖更多方言的大模型,打破沟通壁垒。”李杰表示,团队呼吁更多专家、方言爱好者及大众用户一起加入“守护方言计划”,共同传承语言文化,推动人工智能普惠。

《中国科学报》 (2024-05-27 第3版 综合)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
“研0”科研入门需要作哪些准备? 中国科学家首次发现“无摩擦的冰”
冰表面长啥样?原子级分辨图像揭晓答案 北方中纬高频雷达网发布首批科学探测结果
>>更多
 
一周新闻排行
 
编辑部推荐博文