|
经过160项心理学研究的训练 |
新AI模型可像人类一样“思考” |
|

研究人员开发了一种可模拟人类决策的AI工具。图片来源:Jezperklauzen/Getty
本报讯 一项7月2日发表于《自然》的研究报道了一款创新的人工智能(AI)系统——Centaur。它可以预测人们在各种情况下做出的决定,并且通常优于心理学经典理论做出的推测。
不同于谷歌DeepMind的AlphaGo等只能预测一个人就单一任务如何做出选择的AI系统,Centaur可以模拟人类在一系列任务中的行为,包括赌博、玩记忆游戏和解决问题等。在测试过程中,Centaur甚至能预测人们在未接受过训练的任务中的选择。创建该系统的团队认为,有一天它可能会成为认知科学领域有价值的工具。
“你基本可以在电子设备上运行实验,而无需真正的人类参与者。”该研究合著者、德国慕尼黑亥姆霍兹人类中心AI研究所的认知科学家Marcel Binz说,当传统研究速度太慢,或者很难招募到儿童或患有精神病的实验参与者时,这个AI工具可能很有用。
长期以来,科学家一直努力使用特定任务模型模拟人类的广泛行为,但这些工具很难推广到大量任务中去。Binz和同事希望突破这一局限性。他们花了5天时间,利用来自160个心理学实验的大量数据集,对美国Meta公司研发的大语言模型(LLM)——LLaMA进行了微调。在这些心理学实验中,有6万人在各种任务中做出了超过1000万个选择。最终,研究人员研发出Centaur。
研究人员测试了Centaur对未包含在训练数据集中的参与者的行为预测能力。结果显示,在32项任务中,除一项外,Centaur在预测参与者将做出的选择方面都优于LLaMA和其他14个认知与统计模型。唯一例外的是要参与者判断句子在语法上是否正确的任务。
在对接受训练的任务进行更改后,Centaur的表现依然良好,甚至在与以往训练任务都不同的任务中,如逻辑推理,它也表现不错。
尽管Centaur功能广泛,但研究人员表示,它仍然存在局限性。比如,它可以预测一个人在给定任务中可能做出的选择,但“无法预测他们需要多长时间”做出选择。
研究人员表示,他们正在将训练数据集扩展到现有数据集的4倍。目前许多数据来自西方受过教育的工业化人群,这可能会限制Centaur在不同人群中的应用程度。(徐锐)
相关论文信息:
https://doi.org/10.1038/s41586-025-09215-4
《中国科学报》 (2025-07-04 第2版 国际)