美国科学家开发了一个能将大脑中言语活动实时转换成有声词汇的新设备。该技术可以帮助失语者重拾实时流畅交流的能力。相关研究3月31日发表于《自然—神经科学》
当前,面向言语的脑机接口一般在个人无声地尝试说话与计算机的有声输出间会延迟几秒,无法实现流畅清晰的交流,这会在聆听者与说话者之间造成交流不畅和困扰。一个实时系统有望恢复对话的自然流动,或能提高失语患者的生活质量。
加州大学旧金山分校的Edward Chang和伯克利分校的Gopala Anumanchipalli等开发了一款无声脑机接口,并作为一个临床试验的一部分,将它植入了一名47岁四肢麻痹(四肢和躯干瘫痪)女性的大脑,这名女性在一次卒中发作后已有18年无法说话或发声。
研究者让她在大脑中用意念讲出包含1024个独特词汇的完整句子,同时用她的脑活动训练了一个深度学习神经网络,这些脑活动利用植入该患者言语感觉运动皮质的电极进行记录。他们随后用该模型以80毫秒递增的速度解码在线语音,与受试者的发声意图同步,再生成用受试者受伤前说话片段训练的模拟她声音的音频。这个脑机接口还可以推广至该受试者训练中没有接触过的词汇,且可以连续运作,而非短暂的每次几秒。
研究者表示,虽然仍需对更多受试者开展进一步研究,但该设备有望让言语瘫痪患者更自然流畅地实时说话,提高他们的生活质量。
在线文本解码和基于脑活动的文本到语音合成。图片来自作者
相关论文信息:https://doi.org/10.1038/s41593-025-01905-6
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。