“布鲁氏菌病(以下简称布病)在170个国家流行。”过去两年,希腊人畜共患病研究人员Georgios Pappas越来越频繁地在一些学术论文中看到这句话。他的一个基本判断是,布病传播范围确实很广,但“170个国家”似乎并无根据。
近日,Pappas在《原子科学家公报》撰文称,他追查医学文献后发现,类似表述已出现在117篇相关论文中。随着科学家越来越多地使用人工智能(AI)辅助写作,这个没有可靠出处的数字可能被继续复制和放大。
“170个国家流行”说法不成立
布病是一种细菌性疾病,可引起发热、关节炎等症状。人可能因接触动物、饮用未经巴氏消毒的乳制品、食用未煮熟肉类而感染。这种疾病难以治疗和根除。
虽然布病传播范围较广,但并不等于“在170个国家流行”。Pappas在检索医学文献后发现,2020年以前,相关表述似乎只出现在10篇论文中。此后它出现得越来越频繁:2024年有27篇,2025年有25篇,接着变成上百篇。
这些文章的表述并不完全相同。有的说布病“在170个国家流行”,有的说“在超过170个国家有报告”。Pappas认为,前一种说法是错误的;后一种说法如果有充分参考文献支撑,或许还有讨论空间,但“170”仍然过大。
在Pappas找到的117篇相关论文中,没有一篇能够充分支撑“170个国家流行”这一说法。
具体而言,35篇论文直接写下这一数字,却没有提供任何参考文献;另有4篇论文又引用了这些没有参考文献的论文。其他论文虽然列出了参考文献,但这些文献同样不能证明“170个国家流行”这个结论。
AI助推错误成为“共识”
Pappas认为,问题并不只是某篇论文写错了一句话,而是一条错引链条已经形成,后来的作者未必核查原始出处,只要看到前人这样写,就可能继续照搬。那些指向不相关或错误论文的参考文献,很可能使用了AI工具。
“这种增强技术仅用于改进写作风格、语法或句法,或许是良性的。但如果作者使用AI生成内容,他们不仅损害了自身的学术诚信,也损害了整个科学界的声誉。AI生成的内容可能出错;平台仍然会产生幻觉,并助长谬误。”Pappas说。
为测试AI如何处理这一问题,Pappas向多个AI平台提问:“人类布病是否在170个国家流行?”结果显示,多数模型都不同程度接受了“布病已在170个国家有报告”的说法,却没有给出准确的来源。
在测试中,ChatGPT认为,布病在170个国家或地区有报告,但这并不意味着它在所有这些地方都是地方性流行病。谷歌Gemini也给出类似回答,并引用了一些并不真正支持该说法的来源。Claude则同意布病在170个国家为地方性流行病,但可能并非在所有国家“同样”流行。
微软Copilot似乎是个例外。它指出文献中存在误解,并认为“170个国家”这一说法可能并非来自原始科学文献,而是由错误引用和研究者假设共同造成的。
谁来守住科学引用底线
近年来,学术出版生态正受到“垃圾出版物”的侵蚀。Pappas指出,被称为“掠夺性期刊”的出版物尤其受到关注。这类期刊的论文充斥着AI生成的内容,并反过来影响AI平台对科学文献的判断。即使一些粗制滥造的论文被撤回,AI工具还可能继续引用它们。
Pappas表示,已有研究显示,ChatGPT经常引用被撤稿或存在问题的研究来佐证观点,甚至将一些撤稿论文评价为“世界领先”“国际优秀”或“接近世界领先”。当错误信息在期刊论文中反复出现,就可能被误认为公认的科学真理,并继续被论文和AI引用。
面对写错同一个数字的117篇论文,Pappas犹豫不决:是否该给每一家期刊编辑写信,要求修改、标注甚至撤稿?
Pappas认为,捍卫真相的责任在于科学家和学术界。“论文中的每一句话、与公众的每一次科学互动、每一次同行评审、我们发表的每一篇论文,都必须严谨细致并以事实为依据。”
(李思辉 王悟诚)
《中国科学报》 (2026-06-23 第2版 国际)