■本报记者 叶满山 通讯员 王耀辉
你可能已经习惯了用智能手机、智能手表监测自己的心率、血糖等数据,但你是否知道,未来手机还能客观化评估心理健康状况?
随着现代社会生活节奏的加快,抑郁、焦虑等心理健康问题日益凸显。但问卷调查和临床访谈等传统的抑郁评估方法,往往受限于主观性,难以真实反映心理健康状况。
兰州大学信息科学与工程学院副教授杨民强团队锚定这一痛点,致力于探索更加客观、普适的心理健康状况评估方法。“我们希望通过普适化的传感技术,如摄像头、麦克风等普适化传感器或智能手机、智能手环等普适化智能终端,实现对心理障碍的客观评估。”杨民强说。
近日,杨民强团队基于智能手机数据在心理障碍检测方面的研究成果,对普适感知技术和抑郁识别相关的多个关键问题展开了全面深入的剖析。该成果为抑郁症早期筛查、个性化治疗提供了新的手段和依据,也为其他心理障碍的检测与研究提供了借鉴和启示。相关论文发表于《电气与电子工程师学会会报》。
智能手机里的“心理密码”
智能手机的内置传感器,如加速度计、麦克风、GPS等,能够持续采集多模态数据流,涵盖环境参数、生理指标和行为模式等多个维度。杨民强的研究就是探索这些数据背后隐藏的“心理密码”。
“智能手机几乎是人们使用时间最长的可穿戴设备,可以记录大量与用户行为相关的数据,这些数据正是抑郁症评估的重要依据。”杨民强说。
然而,从海量数据中精准提取出能够有效表征抑郁症的数字表型特征并非易事。“手机原始数据的时空异质性使得稳定数字表型的提取困难重重。”杨民强说。
通过深入分析当前智能手机数据进行数字表型的研究现状,团队创新性总结出5类具有代表性的特征——位置特征、运动特征、睡眠特征、节律特征和社交与设备使用特征,进行抑郁的有效表征。
“位置特征可以反映一个人的活动范围和轨迹,如果一个人长期待在同一个地方,很少外出参与社交活动,可能暗示其心理状态不佳;运动特征则通过加速度计等传感器捕捉个体的运动状态和活动量,热爱运动的人往往心理健康状况更好;睡眠特征、节律特征和社交与设备使用特征分别从睡眠质量、日常活动规律和社交互动模式等方面为抑郁检测提供了重要线索。”杨民强介绍,这些特征从不同角度反映了个体的心理状态。
值得一提的是,在数据采集和实验研究过程中,团队经过伦理审批,严格遵守伦理规范,通过数据脱敏、数据加密、访问控制等多种措施,确保用户隐私得到充分保护。
“用户可接受的数据采集边界是研究成果能获得应用的前提。”杨民强说,“我们通过加速度计、陀螺仪、环境光传感器等采集弱隐私数据开展心理健康状况评估,既保护了隐私,实际应用场景也更广阔。”
团队还积极探索隐私计算框架先进技术,以进一步确保用户数据的安全。“我们在另一项研究中提出了基于联邦学习的分布式框架。该框架通过层次学习结构,在保护数据隐私的同时,允许大用户量数据参与模型训练。”杨民强说。
追踪眼睛里的秘密
“眉目传情”“眉来眼去”形容通过眉眼的传递,表达某种情感或交流信息的行为;“眉开眼笑”“愁眉紧锁”则形容不同的情感状态。在探索更客观、普适的心理健康状况评估方法过程中,杨民强团队不仅关注表情、语音,也聚焦眼动,以分析人的心理状态。
“眼睛是心灵的窗口,蕴藏着丰富的情感信息,而这些信息往往难以掩饰。”杨民强解释,眼睛的运动和瞳孔的变化能够反映个体的注意分布、情感状态与认知过程,这些信息对于心理健康评估具有重要意义。
2020年,杨民强团队发明了一款名为UEYE的可穿戴眼动仪,能够以高达480帧/秒的频率捕捉眼动图像。这一高帧率使其能够精准记录眼睛的每个微小动作,包括快速微眼动、瞳孔变化、注视点转移。其核心参数领先国际同类产品,实现了可穿戴高帧率眼动追踪技术的自主可控和国产替代。
“传统的生理信号监测设备,如脑电图仪、功能性磁共振成像等,虽然能够提供高精度的生理数据,但通常价格昂贵、操作复杂,且需要专业技术人员和特定的实验环境。相比之下,眼动仪在成本、便携性和易用性方面具有显著优势。”杨民强介绍,“该设备目前在国内有10多家用户,北京协和医院、湘雅二医院等单位的研究团队也在使用我们的眼动仪。”
团队研制的可穿戴眼动抑郁评估系统对抑郁的评估准确率达79%。“眼动数据能够反映个体的注意力和情感状态。”杨民强解释,抑郁患者往往表现出对负面信息较高的注意偏向。这种注意偏向可以通过眼动数据清晰反映出来,从而为心理健康评估提供更全面的依据。
智能干预的“心理咨询师”
通过智能手机数据的数字表型分析、高精度眼动追踪等技术可以对心理障碍进行有效识别和评估。但在评估后,如何给予有效干预?
杨民强团队进一步开展了面向抑郁干预的大语言模型多模态行为信息反馈技术研究。其核心是采用大语言模型和认知行为疗法相结合的方式,开发一种能够进行智能心理干预的系统。
这一系统不仅能够理解患者的文本信息,还能通过摄像头和麦克风捕捉患者的表情、语音、肢体动作等非语言信息,从而更全面感知其心理状态。
“在人与人的交流中,93%的信息是通过非语言信息传递的。”杨民强说,“我们的系统利用多模态感知技术,能够实时分析患者的非语言信息,并据此调整对话策略,从而实现更有效的心理干预。”
杨民强介绍,当系统检测到患者的表情悲伤时,会调整对话策略,采用更温和、安慰性的语言与患者交流;如果患者的语音出现颤抖或语速加快,系统会判断患者可能处于紧张状态,从而采取措施缓解其紧张情绪。
通过这种方式,系统能够像专业心理咨询师一样,与患者进行有针对性的沟通,帮助他们缓解抑郁情绪。此外,该系统还具备苏格拉底式的提问和结构化对话能力。“这意味着系统不是进行简单的聊天,而是像心理咨询师一样,通过提问引导患者深入思考自己的情绪和行为模式,从而达到认知行为干预的效果。”杨民强说。
据了解,智能心理干预系统最初是单机版本,主要目标是验证大语言模型在心理干预中的可行性,并初步探索多模态信息融合技术。单机版系统通过摄像头和麦克风采集患者的非语言信息,结合患者的语言输入,利用大语言模型进行初步的心理状态分析并生成对话。
“在单机版本中,我们主要关注如何让大语言模型理解患者的文本信息,并结合非语言信息进行有效对话。”研究团队发现,通过多模态信息的融合,系统能够更准确感知患者的情绪和心理状态,从而提供更有针对性的干预建议。
在单机版的基础上,团队进一步开发了网页版系统。网页版系统不仅拥有单机版的核心功能,还通过网络平台实现了更广泛的用户覆盖和更便捷的使用体验。用户只需通过网页登录,即可与系统进行实时对话,无需安装任何额外的软件或应用程序。
“网页版系统旨在降低用户的使用门槛,提高系统可及性和便利性。”杨民强表示,“我们希望通过这项技术,让更多人能够方便地获得心理健康干预服务,尤其是在精神卫生资源匮乏的地区。”
“希望能够在更多地区推广这一技术,让更多人受益。”目前,杨民强团队已经着手成果转化,推动相关技术落地应用。
“随着技术的不断进步和产业的深度参与,可穿戴设备和具身智能将为心理健康诊疗带来更便捷和高效的解决方案,让人们能够随时随地了解自己的心理状态,并及时获得帮助。”杨民强对可穿戴设备和具身智能在心理健康诊疗领域的未来充满信心。
相关论文信息:
https://doi.org/10.1109/JPROC.2025.3542324
《中国科学报》 (2025-05-07 第4版 综合)