科学网—新AI模型可像人类一样“思考”

作者：徐锐来源：中国科学报发布时间：2025-7-4

选择字号：小中大

经过160项心理学研究的训练

新AI模型可像人类一样“思考”

研究人员开发了一种可模拟人类决策的AI工具。图片来源：Jezperklauzen/Getty

本报讯 一项7月2日发表于《自然》的研究报道了一款创新的人工智能（AI）系统——Centaur。它可以预测人们在各种情况下做出的决定，并且通常优于心理学经典理论做出的推测。

不同于谷歌DeepMind的AlphaGo等只能预测一个人就单一任务如何做出选择的AI系统，Centaur可以模拟人类在一系列任务中的行为，包括赌博、玩记忆游戏和解决问题等。在测试过程中，Centaur甚至能预测人们在未接受过训练的任务中的选择。创建该系统的团队认为，有一天它可能会成为认知科学领域有价值的工具。

“你基本可以在电子设备上运行实验，而无需真正的人类参与者。”该研究合著者、德国慕尼黑亥姆霍兹人类中心AI研究所的认知科学家Marcel Binz说，当传统研究速度太慢，或者很难招募到儿童或患有精神病的实验参与者时，这个AI工具可能很有用。

长期以来，科学家一直努力使用特定任务模型模拟人类的广泛行为，但这些工具很难推广到大量任务中去。Binz和同事希望突破这一局限性。他们花了5天时间，利用来自160个心理学实验的大量数据集，对美国Meta公司研发的大语言模型（LLM）——LLaMA进行了微调。在这些心理学实验中，有6万人在各种任务中做出了超过1000万个选择。最终，研究人员研发出Centaur。

研究人员测试了Centaur对未包含在训练数据集中的参与者的行为预测能力。结果显示，在32项任务中，除一项外，Centaur在预测参与者将做出的选择方面都优于LLaMA和其他14个认知与统计模型。唯一例外的是要参与者判断句子在语法上是否正确的任务。

在对接受训练的任务进行更改后，Centaur的表现依然良好，甚至在与以往训练任务都不同的任务中，如逻辑推理，它也表现不错。

尽管Centaur功能广泛，但研究人员表示，它仍然存在局限性。比如，它可以预测一个人在给定任务中可能做出的选择，但“无法预测他们需要多长时间”做出选择。

研究人员表示，他们正在将训练数据集扩展到现有数据集的4倍。目前许多数据来自西方受过教育的工业化人群，这可能会限制Centaur在不同人群中的应用程度。（徐锐）

相关论文信息：

https://doi.org/10.1038/s41586-025-09215-4

《中国科学报》 (2025-07-04 第2版国际)

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！ Dove最新临床研究，聚焦这些进展中国数学会数理逻辑专业委员会与Mathematics期刊建立合作关系我三个可爱的儿子-三捧星光，暖我半生烟火植物人文：数字时代人与自然关系的新探索更多>>