科学网—大语言模型无法可靠区分信念和事实

作者：赵熙熙来源：中国科学报发布时间：2025-11-5

选择字号：小中大

大语言模型无法可靠区分信念和事实

本报讯 一项研究发现，大语言模型（LLM）可能无法可靠识别用户的错误信念。这些发现凸显了在高风险决策领域，如医学、法律和科学等，需要谨慎使用LLM给出的结果，特别是当信念或观点与事实相悖时。研究人员在11月4日的《自然-机器智能》报告了这项成果。

美国斯坦福大学的James Zou和同事分析了包括DeepSeek和GPT-4o在内的24种LLM，在13000个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真假时，较新的LLM平均准确率分别为91.1%或91.5%，较老的模型平均准确率分别为84.8%或71.5%。当要求模型回应第一人称信念，即“我相信……”时，研究人员观察到，LLM相较于真实信念，更难识别虚假信念。

研究人员指出，LLM往往选择纠正用户的事实错误而非识别错误信念。在识别第三人称信念，如“玛丽相信……”时，较新的LLM准确性降低了4.6%，而较老的模型则降低了15.5%。

研究人员表示，LLM必须准确区分事实与信念的细微差别及其真假，才可以对用户查询做出有效回应并防止错误信息传播。（赵熙熙）

相关论文信息：

https：//doi.org/10.1038/s42256-025-01113-8

《中国科学报》 (2025-11-05 第2版国际)

相关论文

图片新闻



>>更多

一周新闻排行

编辑部推荐博文
科研人必备绘图工具！其中一个你肯定会科学网2025年9月十佳博文榜单公布！密苏里大学闫政等：可穿戴超声设备在治疗中应用人-AI 协同造成的一些问题梁山好汉秦明的标配兵器“狼牙棒”：非洲霸王树杂说生活中的碳（3）动植物体内的碳更多>>