你可能已经习惯了用智能手机、智能手表监测自己的心率、血糖等数据,但你是否知道,未来你的手机或许还能客观化评估心理健康状况?
随着现代社会生活节奏的加快,抑郁、焦虑等心理健康问题日益凸显。世界卫生组织预测,到2030年,重度抑郁症将成为全球疾病负担日益加重的主要原因,全球约有3.5亿人受到抑郁症的影响。但问卷调查和临床访谈等传统的抑郁评估方法,往往受限于主观性,难以真实反映心理健康状况。
兰州大学信息科学与工程学院杨民强副教授团队锚定这一痛点,致力于探索更加客观、普适的心理健康状况评估方法。“我们希望通过普适化的传感技术,如摄像头、麦克风等普适化传感器或智能手机、智能手环等普适化智能终端,来实现对心理障碍的客观评估。”杨民强说道。
近日,杨民强团队基于智能手机数据的心理障碍检测方面的研究成果,对普适感知技术和抑郁识别相关的多个关键问题展开了全面深入的剖析。系统地阐述了团队在该成果为抑郁症早期筛查、个性化治疗提供了新的手段和依据,也为其他心理障碍的检测和研究提供了借鉴和启示。相关论文发表于《Proceedings of the IEEE》。
心理疏导大预言模型。兰州大学供图。
?
智能手机里的“心理密码”
智能手机作为现代人生活中不可或缺的伙伴,其内置的传感器如加速度计、麦克风、GPS等,能够持续采集多模态数据流,涵盖环境参数、生理指标和行为模式等多个维度。杨民强的研究就是探索这些数据背后隐藏的“心理密码”。
“智能手机几乎是人们使用时间最长的可穿戴设备,可以记录大量与用户行为相关的数据,这些数据正是抑郁症评估的重要依据。”杨民强说。
然而,从海量的智能手机数据中精准提取出能够有效表征抑郁症的数字表型特征并非易事。“手机原始数据的时空异质性使得稳定数字表型的萃取困难重重。”杨民强说。
通过深入分析当前智能手机数据进行数字表型的研究现状,团队创新性地总结出了五类具有代表性的特征,进行抑郁的有效表征:位置特征、运动特征、睡眠特征、节律特征和社交与设备使用特征。
“位置特征可以反映一个人的活动范围和轨迹,如果一个人长期待在同一个地方,很少外出参与社交活动,这可能暗示其心理状态不佳;运动特征则通过加速度计等传感器捕捉个体的运动状态和活动量,热爱运动的人往往心理健康状况更好。”杨民强介绍,这些特征从不同角度反映了个体的心理状态。
“睡眠特征、节律特征和社交与设备使用特征也分别从睡眠质量、日常活动规律和社交互动模式等方面为抑郁检测提供了重要线索。”杨民强解释说。
在研究过程中,隐私保护问题是亟待解决的关键。杨民强表示,在数据采集和实验研究过程中,团队通过伦理审批,严格遵守伦理规范,通过数据脱敏、数据加密以及访问控制等多种措施,确保用户隐私得到充分保护。
“用户可接受的数据采集边界是研究成果能获得应用的前提。”杨民强说,“我们通过采集加速度、陀螺仪、环境光传感器等弱隐私数据开展心理健康状况评估,既保护隐私,实际应用场景也更广阔。”
团队还积极探索隐私计算框架先进技术,以进一步确保用户数据的安全。“我们在另一项研究中提出了基于联邦学习的分布式框架,该框架通过层次学习结构,在保护数据隐私的同时,允许大用户量数据参与模型训练。”杨民强说。
利用高精度眼动追踪技术开展心理健康状况评估。兰州大学供图。
?
“追踪”眼睛里的秘密
“眉目传情”“眉来眼去”通常用来形容通过眉眼的传递,表达某种情感或交流信息的行为。“眉开眼笑”“愁眉锁眼”则形容不同的情感状态。在探索更加客观、普适的心理健康状况评估方法过程中,杨民强团队不仅关注表情、语音,也聚焦通过眼动来分析人的心理状态。
“眼睛是心灵的窗口,蕴藏着丰富的情感信息,而这些信息往往是难以掩饰的。”杨民强解释,眼睛的运动和瞳孔的变化能够反映个体的注意分布、情感状态和认知过程,这些信息对于心理健康评估具有重要的意义。
眼动追踪技术作为认知科学、心理学和神经科学研究的重要工具,能精确捕捉人类视觉行为的微观动态。在广告研究中,通过分析消费者的眼动数据,可以了解他们对广告的关注点和兴趣偏好;在语言学研究中,可以观察人们阅读时的眼动模式,从而揭示语言认知的规律。
杨民强团队则将高精度眼动追踪技术的应用重点放在了心理健康领域。2020年,杨民强团队发明了一款名为UEYE的可穿戴眼动仪,能够以高达480帧/秒的频率捕捉眼动图像,这一高帧率使其能够精准地记录眼睛的每一个微小动作,包括快速的微眼动、瞳孔变化以及注视点的转移。其核心参数领先国际同类产品,实现了可穿戴高帧率眼动追踪技术的自主可控和国产替代。
“传统的生理信号监测设备如脑电图仪、功能性磁共振成像等虽然能够提供高精度的生理数据,但这些设备通常价格昂贵、操作复杂,且需要专业的技术人员和特定的实验环境。相比之下,眼动仪在成本、便携性和易用性方面具有显著优势。”杨民强介绍,其团队研制的可穿戴眼动抑郁评估系统对抑郁的评估准确率达79%。
“眼动数据能够反映个体的注意力和情感状态,这对于心理健康评估至关重要。”杨民强解释道,抑郁患者往往表现出对负面信息较高的注意偏向。
这种注意偏向可以通过眼动数据清晰地反映出来,从而为心理健康评估提供更全面的依据。“该设备目前在国内的用户大概有十多家,北京协和医院、湘雅二医院等单位的研究团队也在使用我们的眼动仪。”杨民强说。
有效表征抑郁症的代表性特征及其数字表型示例。兰州大学供图。
?
智能干预的“心理咨询师”
通过智能手机数据的数字表型分析、高精度眼动追踪等技术可以对心理障碍进行有效的识别和评估。但在评估以后,如何给予有效干预呢?
杨民强及团队进一步开展了面向抑郁干预的大语言模型多模态行为信息反馈技术研究。这项研究的核心是利用大语言模型(LLM)和认知行为疗法(CBT)相结合的方式,开发一种能够进行智能心理干预的系统。
这一系统不仅能够理解患者的文本信息,还能通过摄像头和麦克风捕捉患者的表情、语音和肢体动作等非语言信息,从而更全面地感知患者的心理状态。
“在人与人的交流中,93%的信息是通过非语言信息传递的。”杨民强说,“我们的系统通过多模态感知技术,能够实时分析患者的非语言信息,并据此调整对话策略,从而实现更有效的心理干预。”
杨民强介绍,当系统检测到患者的表情显得悲伤时,它会调整对话策略,采用更加温和、安慰性的语言与患者交流;如果患者的语音出现颤抖或语速加快,系统会判断患者可能处于紧张状态,从而采取措施缓解患者的紧张情绪。
通过这种方式,系统能够像专业的心理咨询师一样,与患者进行有针对性的沟通,帮助他们缓解抑郁情绪。此外,该系统还具备苏格拉底式的提问和结构化对话能力,“这意味着系统不只是进行简单的聊天,而是能够像心理咨询师一样,可以通过提问引导患者深入思考自己的情绪和行为模式,从而达到认知行为干预的效果。”杨民强说。
据了解,智能心理干预系统最初的单机版本主要目标是验证大语言模型在心理干预中的可行性,并初步探索多模态信息融合技术。单机版系统通过摄像头和麦克风采集患者的非语言信息,结合患者的语言输入,利用大语言模型进行初步的心理状态分析和对话生成。
“在单机版本中,我们主要关注的是如何让大语言模型理解患者的文本信息,并结合非语言信息进行有效的对话。”杨民强研究团队发现,通过多模态信息的融合,系统能够更准确地感知患者的情绪和心理状态,从而提供更有针对性的干预建议。
在单机版的基础上,团队进一步开发了网页版系统。网页版系统不仅继承了单机版的核心功能,还通过网络平台实现了更广泛的用户覆盖和更便捷的使用体验,用户只需通过网页登录,即可与系统进行实时对话,无需安装任何额外的软件或应用程序。
“网页版系统的开发,旨在降低用户的使用门槛,提高系统的可及性和便利性。”杨民强表示,“我们希望通过这项技术,让更多人能够方便地获得心理健康干预服务,尤其是在精神卫生资源匮乏的地区。”
“我们希望能够在更多的地区推广这一技术,让更多人受益。”杨民强对可穿戴设备和具身智能在心理健康诊疗领域的未来充满信心。目前,杨民强团队已经开始着手准备成果转化,共同推动相关技术的落地应用。“随着技术的不断进步和产业的深度参与,可穿戴设备和具身智能将为心理健康诊疗带来更加便捷和高效的解决方案,让人们能够随时随地了解自己的心理状态,并及时获得帮助。”杨民强说。
相关论文链接:https://doi.org/10.1109/JPROC.2025.3542324
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。