作者:李思辉,王悟诚 来源:科学网微信公众号 发布时间:2026/6/20 20:19:34
选择字号:
资深学者惊讶发现:一个错误数据被117篇论文以讹传讹

 

编译|李思辉 王悟诚

“布鲁氏菌病在170个国家流行。”过去两年,人畜共患病研究者乔治奥斯·帕帕斯(Georgios Pappas)越来越频繁地在一些学术论文中看到这句话。

这让他感到困惑。几十年来,他一直关注和研究布鲁氏菌病。他几乎阅读过所有相关文献,也经常为多家同行评议医学期刊担任审稿人。他的一个基本判断是,布鲁氏菌病传播范围确实很广,但“170个国家”这个数字似乎并无根据。

近日,帕帕斯在《原子科学家公报》(Bulletin of the Atomic Scientists,简称BAS)撰文称,他追查医学文献后发现,类似表述已出现在117篇相关论文中。随着科学家越来越多地使用人工智能(AI)辅助写作,这个没有可靠出处的数字,可能正在被继续复制和放大。

图为AI生成

“170个国家流行”说法并不成立

帕帕斯是来自希腊约阿尼纳的医生,长期关注人畜共患病,尤其是布鲁氏菌病研究。据他介绍,布鲁氏菌病是一种细菌性疾病,可引起发热、关节炎等症状。人可能因接触动物、饮用未经巴氏消毒的乳制品、食用未煮熟肉类而感染。这种疾病难以治疗和根除。

据2023年的一项估算,全球每年新增人类布鲁氏菌病病例约210万例。帕帕斯的母国希腊,就是欧盟中该病确诊病例最多的国家。

虽然这种疾病传播范围较广,但并不等于它“在170个国家流行”。帕帕斯在检索医学文献后发现,2020年以前,相关表述似乎只出现在10篇论文中。此后,它出现得越来越频繁:2024年有27篇,2025年有25篇,接着变成上百篇。而这些论文中有70%来自中国。

这些文章的表述并不完全相同。有的说布鲁氏菌病“在170个国家流行”,有的说“在超过170个国家有报告”。帕帕斯认为,前一种说法是错误的;后一种说法如果有充分参考文献支撑,或许还有讨论空间,但“170”这个数字本身仍显得过大。

帕帕斯进一步追查后发现,在他找到的117篇相关论文中,没有一篇能够充分支撑“170个国家流行”这一说法。

具体而言,35篇论文直接写下这一数字,却没有提供任何参考文献;另有4篇论文又引用了这些没有参考文献的论文。其他论文虽然列出了参考文献,但这些文献同样不能证明“170个国家”这个结论。

有26篇相关论文引用了帕帕斯2006年发表在《柳叶刀·传染病》上的一篇论文,来支撑相关说法。但帕帕斯表示,“他和合作者在那篇论文中从未提到类似内容。”还有2篇论文错误引用了他2005年发表在《新英格兰医学杂志》上的一篇布鲁氏菌病综述。

更令人震惊的是,他发现有一篇论文竟引用了一项关于果蝇的研究,来证明布鲁氏菌病“存在于170个国家”。此后,又有3篇论文继续把这项果蝇研究当作证据。

AI助推错误成为“共识”?

帕帕斯认为,问题并不只是某篇论文写错了一句话,而是一条错引链条已经形成。后来的作者未必核查原始出处,只要看到前人这样写,就可能继续照搬。那些指向不相关或错误论文的参考文献,很可能使用了AI工具。

公开报道显示,在2024年发表并被医学文献数据库(PubMed)收录的科学论文中,超过13%的文章带有AI辅助的痕迹。近年来,大语言模型(LLM)已发展成为许多研究人员的实用稿件辅助工具,但作者很少报告他们对这些服务的依赖程度。

“这种增强技术或许是良性的,仅用于改进写作风格、语法或句法。但它也可能带来风险。如果作者使用AI生成内容,他们不仅损害了自身的学术诚信,也损害了整个科学界的声誉。AI生成的内容可能出错;平台仍然会产生幻觉,并助长谬误。”帕帕斯说。

为了测试AI如何处理这一问题,帕帕斯向多个AI平台提问:“人类布鲁氏菌病是否在170个国家流行?”结果显示,多数模型都不同程度接受了“布鲁氏菌病已在170个国家报告”的说法,却没有给出准确可靠的来源。

在帕帕斯的测试中,ChatGPT认为,布鲁氏菌病已在170个国家或地区有报告,但这并不意味着它在所有这些地方都是地方性流行病。Google Gemini也给出类似回答,并引用了一些并不真正支持该说法的来源。Claude则同意布鲁氏菌病在170个国家为地方性流行病,但可能并非在所有国家“同样”流行。

微软Copilot似乎是例外,它指出文献中存在误解,并认为“170个国家”这一说法可能并非来自原始科学文献,而是由错误引用和研究者假设共同造成的。

谁来守住科学引用的底线

近年来,学术出版生态正受到“垃圾出版物”的侵蚀。帕帕斯指出,一种被称为“掠夺性期刊”的出版物尤其受到关注。它们往往打着学术期刊和同行评审的旗号,以收取作者出版费用为主要目的,但实际审稿把关并不严格,甚至只要付费就可以发表论文。

他指出,这类期刊里充斥着AI生成内容的论文,也会反过来影响AI平台对科学文献的判断。据估计,这类期刊数量可能高达1.5万种。

问题在于,即使一些粗制滥造的论文被撤回后,AI工具还可能继续引用它们。

帕帕斯表示,已有研究显示,ChatGPT经常引用被撤稿或存在问题的研究来佐证观点,甚至将一些被撤稿研究评价为“世界领先”“国际优秀”或“接近世界领先”。

一个名为亨利·洛文多夫(Henry Lowendorf)的读者评论道,科学界乃至更广泛的社会群体对“同行评审”这一标准的依赖本身就存在一些不合理的假设,即审稿人会利用日益有限的时间认真阅读并权衡论文内容。

另外一位读者克雷格·诺萨克(Craig Northacker)则认为,在虚假信息不断扩散的背景下,普通公众判断信息可信度正面临严峻挑战。

当错误信息在期刊论文中反复出现,它就可能被误认为公认的科学真理,并继续被论文和人工智能系统引用。

面对117篇写错同一个数字的论文,帕帕斯也在犹豫:是否该给每一家期刊编辑写信,要求修改、标注甚至撤稿?

帕帕斯认为,捍卫真相的责任在于科学家和学术界——“论文中的每一句话,与公众的每一次科学互动,我们进行的每一次同行评审,我们发表的每一篇论文,都必须严谨细致并以事实为依据。”

“或许我应该开始写这些信了。”他说。

相关文章链接:

https://thebulletin.org/2026/05/why-are-so-many-scientific-articles-wrong-about-the-disease-i-study/

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
轻夸克希格斯相互作用研究取得新进展 我国攻克硅基量子芯片关键材料
《自然》(20260611出版)一周论文导读 研究揭示链霉菌调控香蕉抗枯萎病分子机制
>>更多
 
一周新闻排行
 
编辑部推荐博文