资深学者惊讶发现：一个错误数据被117篇论文以讹传讹—新闻

作者：李思辉，王悟诚来源：科学网微信公众号发布时间：2026/6/20 20:19:34

选择字号：小中大

资深学者惊讶发现：一个错误数据被117篇论文以讹传讹

编译|李思辉王悟诚

“布鲁氏菌病在170个国家流行。”过去两年，人畜共患病研究者乔治奥斯·帕帕斯（Georgios Pappas）越来越频繁地在一些学术论文中看到这句话。

这让他感到困惑。几十年来，他一直关注和研究布鲁氏菌病。他几乎阅读过所有相关文献，也经常为多家同行评议医学期刊担任审稿人。他的一个基本判断是，布鲁氏菌病传播范围确实很广，但“170个国家”这个数字似乎并无根据。

近日，帕帕斯在《原子科学家公报》（Bulletin of the Atomic Scientists，简称BAS）撰文称，他追查医学文献后发现，类似表述已出现在117篇相关论文中。随着科学家越来越多地使用人工智能（AI）辅助写作，这个没有可靠出处的数字，可能正在被继续复制和放大。

图为AI生成

“170个国家流行”说法并不成立

帕帕斯是来自希腊约阿尼纳的医生，长期关注人畜共患病，尤其是布鲁氏菌病研究。据他介绍，布鲁氏菌病是一种细菌性疾病，可引起发热、关节炎等症状。人可能因接触动物、饮用未经巴氏消毒的乳制品、食用未煮熟肉类而感染。这种疾病难以治疗和根除。

据2023年的一项估算，全球每年新增人类布鲁氏菌病病例约210万例。帕帕斯的母国希腊，就是欧盟中该病确诊病例最多的国家。

虽然这种疾病传播范围较广，但并不等于它“在170个国家流行”。帕帕斯在检索医学文献后发现，2020年以前，相关表述似乎只出现在10篇论文中。此后，它出现得越来越频繁：2024年有27篇，2025年有25篇，接着变成上百篇。而这些论文中有70%来自中国。

这些文章的表述并不完全相同。有的说布鲁氏菌病“在170个国家流行”，有的说“在超过170个国家有报告”。帕帕斯认为，前一种说法是错误的；后一种说法如果有充分参考文献支撑，或许还有讨论空间，但“170”这个数字本身仍显得过大。

帕帕斯进一步追查后发现，在他找到的117篇相关论文中，没有一篇能够充分支撑“170个国家流行”这一说法。

具体而言，35篇论文直接写下这一数字，却没有提供任何参考文献；另有4篇论文又引用了这些没有参考文献的论文。其他论文虽然列出了参考文献，但这些文献同样不能证明“170个国家”这个结论。

有26篇相关论文引用了帕帕斯2006年发表在《柳叶刀·传染病》上的一篇论文，来支撑相关说法。但帕帕斯表示，“他和合作者在那篇论文中从未提到类似内容。”还有2篇论文错误引用了他2005年发表在《新英格兰医学杂志》上的一篇布鲁氏菌病综述。

更令人震惊的是，他发现有一篇论文竟引用了一项关于果蝇的研究，来证明布鲁氏菌病“存在于170个国家”。此后，又有3篇论文继续把这项果蝇研究当作证据。

AI助推错误成为“共识”？

帕帕斯认为，问题并不只是某篇论文写错了一句话，而是一条错引链条已经形成。后来的作者未必核查原始出处，只要看到前人这样写，就可能继续照搬。那些指向不相关或错误论文的参考文献，很可能使用了AI工具。

公开报道显示，在2024年发表并被医学文献数据库（PubMed）收录的科学论文中，超过13%的文章带有AI辅助的痕迹。近年来，大语言模型（LLM）已发展成为许多研究人员的实用稿件辅助工具，但作者很少报告他们对这些服务的依赖程度。

“这种增强技术或许是良性的，仅用于改进写作风格、语法或句法。但它也可能带来风险。如果作者使用AI生成内容，他们不仅损害了自身的学术诚信，也损害了整个科学界的声誉。AI生成的内容可能出错；平台仍然会产生幻觉，并助长谬误。”帕帕斯说。

为了测试AI如何处理这一问题，帕帕斯向多个AI平台提问：“人类布鲁氏菌病是否在170个国家流行？”结果显示，多数模型都不同程度接受了“布鲁氏菌病已在170个国家报告”的说法，却没有给出准确可靠的来源。

在帕帕斯的测试中，ChatGPT认为，布鲁氏菌病已在170个国家或地区有报告，但这并不意味着它在所有这些地方都是地方性流行病。Google Gemini也给出类似回答，并引用了一些并不真正支持该说法的来源。Claude则同意布鲁氏菌病在170个国家为地方性流行病，但可能并非在所有国家“同样”流行。

微软Copilot似乎是例外，它指出文献中存在误解，并认为“170个国家”这一说法可能并非来自原始科学文献，而是由错误引用和研究者假设共同造成的。

谁来守住科学引用的底线

近年来，学术出版生态正受到“垃圾出版物”的侵蚀。帕帕斯指出，一种被称为“掠夺性期刊”的出版物尤其受到关注。它们往往打着学术期刊和同行评审的旗号，以收取作者出版费用为主要目的，但实际审稿把关并不严格，甚至只要付费就可以发表论文。

他指出，这类期刊里充斥着AI生成内容的论文，也会反过来影响AI平台对科学文献的判断。据估计，这类期刊数量可能高达1.5万种。

问题在于，即使一些粗制滥造的论文被撤回后，AI工具还可能继续引用它们。

帕帕斯表示，已有研究显示，ChatGPT经常引用被撤稿或存在问题的研究来佐证观点，甚至将一些被撤稿研究评价为“世界领先”“国际优秀”或“接近世界领先”。

一个名为亨利·洛文多夫（Henry Lowendorf）的读者评论道，科学界乃至更广泛的社会群体对“同行评审”这一标准的依赖本身就存在一些不合理的假设，即审稿人会利用日益有限的时间认真阅读并权衡论文内容。

另外一位读者克雷格·诺萨克（Craig Northacker）则认为，在虚假信息不断扩散的背景下，普通公众判断信息可信度正面临严峻挑战。

当错误信息在期刊论文中反复出现，它就可能被误认为公认的科学真理，并继续被论文和人工智能系统引用。

面对117篇写错同一个数字的论文，帕帕斯也在犹豫：是否该给每一家期刊编辑写信，要求修改、标注甚至撤稿？

帕帕斯认为，捍卫真相的责任在于科学家和学术界——“论文中的每一句话，与公众的每一次科学互动，我们进行的每一次同行评审，我们发表的每一篇论文，都必须严谨细致并以事实为依据。”

“或许我应该开始写这些信了。”他说。

编辑部推荐博文
学术期刊“提质”，这项提升必选！科学网2026年5月十佳博文榜单公布！你可能缺少这种保护心脏的营养素界面工程策略构筑高输出可拉伸湿气发电机巴黎植物园400年历史嬗变冰棍与凉粉更多>>