今后,人们或许无需再大声说出“嗨,现在几点了”这样的指令。一款名为AlterEgo的人工智能(AI)神经接口设备,有望让用户只在内心默念词语就能实现无声交流。该设备佩戴在耳部,通过与互联网实时交互,为日常生活提供便利。
“它能赋予你‘心灵感应’的能力,但仅限于你希望分享的想法。”美国AlterEgo公司首席执行官Arnav Kapur表示。他于9月8日发布了这款设备。
AlterEgo公司首席执行官Arnav Kapur展示一款可穿戴设备。图片来源:AlterEgo公司
?
该设备并不读取大脑活动,而是通过说话时用到的肌肉信号,预测佩戴者想说的内容,随后将音频信息传回他们的耳中。研究人员称,这项非侵入性技术不仅能帮助患有运动神经元疾病(肌萎缩侧索硬化症,ALS)和多发性硬化症(MS)且存在语言障碍的人群,还计划将其商业化,供普通大众使用。
在AlterEgo公司官网的宣传视频中,Kapur表示:“这是一项革命性突破,有望改变我们与科技、与他人以及与周围世界的互动方式。”
“关于这项技术,核心问题在于其潜力实现的可能性有多大?”美国西雅图华盛顿大学的Howard Chizeck认为,该技术从原理上看具备可行性,且相比美国亚马逊公司的Alexa这类语音监听设备,隐私风险更低,但他不确定这款设备能否在商业应用中流行起来。
像埃隆·马斯克旗下公司Neuralink研发的脑机接口那样,通常需要通过手术将电极植入大脑,以记录神经元间的信号并进行信号传输。而AlterEgo的工作原理完全不同。“它利用了说话时会用到的神经肌肉信号,本质上就像你在无声地‘说话’。”Chizeck解释说,“显著优势在于非侵入性——无需将芯片植入大脑,从而规避了手术风险和感染风险。”
该设备通过捕捉面部的说话模式实现功能。当你大声说话、无声默念、在心里“说”话时,即便面部没有明显动作,大脑也会将信号传递给脑神经和发音肌肉。AlterEgo会检测发音肌肉产生的电信号,然后将这些数据传输至AI模型,由模型预测佩戴者想要表达的内容。之后,设备会通过骨传导耳机,将音频信息反馈给佩戴者。
AlterEgo项目于2018年诞生于美国麻省理工学院媒体实验室。Kapur表示,最初的头戴设备体积庞大、设计笨拙,且受当时AI技术水平所限,其语音检测能力较弱。它的功能有限,仅能实现网页搜索和订购披萨等简单操作。此后,工程师融入了更先进的AI语音识别技术。今年早些时候,该项目从实验室剥离,成立了一家营利性公司。
这项技术的主要目标用户是存在语言障碍的人群,例如患有构音障碍或发声障碍的人。目前,AlterEgo正在ALS和MS患者中开展试验。
“全身无法活动的患者无法使用该设备,但多数情况下,患者的语言系统仍会残留微弱信号,而这些微弱信号已足够驱动设备。”Kapur说,“我们的试验从早期ALS患者开始,后来发现晚期ALS患者也能使用该设备。”目前相关试验仍在进行中,试验结果尚未公布。
Chizeck则认为,该设备可能对早期ALS患者有帮助,但由于ALS是进行性疾病,患者控制发音肌肉的能力逐渐衰退,因此在疾病晚期,设备的实用性可能会降低。“设备效果完全取决于患者对发音肌肉的控制能力。”
Kapur希望AlterEgo能在更广泛的商业市场获得成功。他表示,这款设备能让佩戴者“以思维的速度进行语音输入”、无声搜索互联网、与其他佩戴该设备的人展开无声对话,还能向AI提问。
在宣传视频中,Kapur展示了如何利用AlterEgo的内置摄像头,根据手绘图生成应用程序,以及如何通过设备下达折纸步骤指令。不过,他尚未公布该设备的上市时间和定价。
Chizeck对AlterEgo的商业可行性持更谨慎的态度。“从概念上讲,我认为他们的技术没有问题。但如今与AI交互的方式有很多,而且人们通常对佩戴硬件设备存在抵触情绪。例如,很多人不愿意戴助听器,就是因为担心戴起来‘与众不同’。”
不过,Chizeck并不担心该设备的隐私问题,这类问题在植入式脑机接口中较为常见。“它并不会读取你的想法。”相比与聊天机器人语音交互,AlterEgo的隐私性更有保障,因为第三方很难“偷听”到设备与佩戴者的交互内容。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。