作者:李洪均 孙晓虎 来源:中国科学报 发布时间:2021/5/8 14:31:56
选择字号:
“情感+”助力智能人机交互

 

百度研发的对话情绪识别平台可自动检测用户日常对话文本中蕴含的情绪特征,旷视科技研发的人工智能平台已可以通过输入图片得到愤怒、厌恶、惊恐等七类情绪,深圳安视宝科技公司生产的动态情绪识别系统可用于情绪预警……随着人工智能的迅速发展,情感计算方面的移动应用程序和初创企业大量增长,其中目前移动应用程序主要用于商务谈判、健康医疗、远程教育、安全驾驶以及公共服务等行业。

情感识别作为智能人机交互的基石,其主要任务就是建立一种可以从语音、文本、视频等多种模态中分析和识别人类情感的计算系统,实现人与机器的人性化交流,具有十分重要的理论意义和实际应用价值。

相关技术仍不成熟

为提高人机交互的智能性,需要先正确理解用户的需求。目前,针对交互行为而产生的情感分析及意图理解的研究正逐步发展,并已有不少应用型产品问世。例如,在国外,Brain Power公司设计的Empower Me可以帮助自闭症患者解读情绪、教授他们社交技能和认知技能,并及时反馈其自身的紧张或焦虑状态;苹果公司的EmoWatch可帮助用户追踪到自己的情绪状态,被应用于机器人理解和监测客户的情绪上;南加州大学创新技术研究院开发的“Ellie虚拟治疗师”,负责治疗创伤后应激障碍和抑郁症患者。

不过,虽然情感识别相关产品在一定程度提升了人们的生活体验感、缓解了社会资源的短缺问题,并成为特殊群体情感交流的有力工具,但目前其相关技术仍不成熟,只能分辨出少量的特定情绪,还涉及到用户的隐私问题且相关产品的费用较高,很难进行大范围的推广。

实际上,情感隶属人类的高级属性,而情感识别是一门生理学、心理学、认知科学等领域相交叉的学科,即便是进化了超过万年的人类有时也无法清晰地识别出对方的情感,这给当前情感分析领域带来了巨大机遇与挑战。具体表现在:(1)情感的稀疏性。语音、视频等模态中的情感信息具有稀疏性,并非语音中所有的时刻或视频中所有帧都包含情感信息,如何利用这种稀疏性并按照信号不同位置与情感的相关性自适应地分配不同的权重是一个巨大的挑战。(2)情感的模态性。与单模态数据相比,多模态数据包含了更多的信息且多个模态之间可以相互补充,可以帮助机器更好地理解情感。但如何处理和分析多模态信息、如何融合不同模态的信息、利用不同模态数据之间的对齐信息、建模不同模态数据之间的关联以及多源信息的实时获取仍是目前所需要面对的主要难题。(3)情感的类别化。科研工作者直接将情感定位为若干种类别,把其当成一个分类任务来进行。然而一段情感信息中不同时段的情感状态随时间的变化而变化,因此应该把情感识别作为一个检测任务来分析每个时刻情感状态的变化,但这种方案目前难以实现。(4)情感的个性化。研究人员对情感的划分具有一定的主观性且并不适用于每一种应用场景。人的情感具有宽泛的主观性,不同人对同一情感的反应程度是不同的,而且同一个人在不同时刻对同一场景下的情感反映也有可能出现不同。因此,如何偏向于自然条件下的更多应用场景、更个性化背景下的情感研究仍是目前尚未解决的难点问题。

除上述特性外,目前情感识别研究还面临着模型的泛化能力和实时性问题,而且现有的情感数据库不尽相同且规模较小,存在着语言、情感种类等差异,缺乏统一的标准。

应用前景可观

情感识别是一个跨领域的学科,有着广阔的应用前景,但目前尚未达到成熟阶段,还需要进行语料库的丰富、理论的加强以及方法的创新。

一是情感+大数据。情感本身是非常抽象的,且情感分析不单单是对特定的人物情感进行分析,同时还要结合特定相关事件一起来分析从而得出更科学、全面的结果。在大数据时代,应用大数据技术联系社会实际的客观现象和行为,通过大数据分析技术分析特定人物的情感变化及与情感相关的属性,准确地分析情感的真实内容是下一步研究的方向之一。

二是情感+仿生学。基于生理信息的情感识别技术是切实可行的。其中,脑电信号不仅含有丰富的有用信息,还能直接反映大脑的活动情况,不同的情绪变化在不同的大脑皮层位置反映出不同的脑电信号。所以,将多生理信号(如脑电信号、心电信号、肌电信号等)和特征(如面部表情、语音等特征)结合使用,实现机器仿生对于情感识别的研究具有重要意义。

三是情感+多模态。随着多媒体信息方式的快速发展,人们倾向于从各种模式中获取信息,以解决更为复杂的问题。人们可以通过控制自己的面部表情来隐藏自己的情绪,基于单一视觉模态很难对情感进行有效识别,而多模态情感分析技术的发展更加符合实际生活的需求。因此,将识别模型由简单算法向组合模型发展,将特征级与决策级进行融合,搭建一个擅长提升情感识别收敛性与准确性的专用多模态网络已成为新的研究热点。

四是情感+跨媒体。人类的情感不仅仅包含于语音变化之中,在表情、文字、肢体语言中也包含富的情感。可考虑采用跨语料库的方法扩充语料,构建一个跨语音、图片、视频、文本以及脑电信号等的情感语料库。同时考虑跨性别、文化差异等来优化识别效果,进一步集结科研力量,推动情感识别的进一步发展。

综上所述,人工智能时代引领着新一波的技术进步,而情感识别作为人工智能领域的一个重要课题,它可以帮助计算机智能识别人类情感,使人机交互更加友好。相信在不久的将来,情感识别技术的研究会取得更大的进展,并更好地应用于实际产品中。

(作者单位系南通大学)

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: