|
|
WithdrarXiv数据库上线,揭示预印本撤稿原因 |
|
本报讯 研究人员近日推出了一个WithdrarXiv数据库,内容涵盖预印本平台arXiv从1991年上线以来撤回的1.4万多篇论文。WithdrarXiv通过大量数据,提供了关于这些撤稿的新见解。相关研究近日公布于arXiv。
开发该数据库的美国宾夕法尼亚大学计算机学家Delip Rao表示,除了揭示这些预印本论文被arXiv删除的原因外,WithdrarXiv数据库旨在促进自动化工具的开发,从而帮助研究人员在提交论文时标记潜在的错误。目前,大多数预印本论文都没有经过同行评议或正式的质量保证流程。
在这项研究中,Rao和同事根据作者提供的撤稿理由,对撤回的预印本论文进行了分类。他们发现,事实错误、方法错误或其他重要错误是最常见的撤稿原因——6000多篇论文因此被预印本平台删除。另外,有3100多篇论文因为内容不完整或有更多工作正在进行中而被撤回,2800多篇论文则因为被其他出版物收录而撤回。
研究指出,这与学术期刊发布的许多撤稿声明形成了鲜明对比,后者通常发生在经同行评议的论文发表后,原因与剽窃或数据造假等学术不端行为或其他错误有关。
“在预印本平台公布论文的初衷是成为首发者,而论文本身不一定是完全正确的。这可能是预印本论文比经同行评议的论文更有可能因事实或方法错误被撤回的原因。”克罗地亚萨格勒布大学人体解剖学研究人员Vedran Katavic说,“论文中的方法错误通常可以通过同行评议被根除。同行评议越严格,因重大的事实或方法错误被撤稿的可能性就越小。”
美国伊利诺伊大学厄巴纳-香槟分校的信息学家Jodi Schneider也对撤稿进行过研究。她警告称,不要把预印本平台撤稿与学术期刊撤稿混为一谈,二者存在显著差异。例如,几乎所有的arXiv撤稿都是由作者发起的,而学术期刊的撤稿决定通常由出版商作出,有时甚至未经作者同意。
尽管如此,Schneider认为,WithdrarXiv对信息科学家来说仍是一个有趣的数据宝库。如果研究人员在预印本阶段就能够发现研究中的潜在错误,可能有助于减少最终版本中的问题。“人们会从这些数据中找到有趣的东西,使之更容易处理、管理和使用。”(赵宇彤)
相关论文信息:
https://arxiv.org/abs/2412.03775
《中国科学报》 (2025-01-14 第2版 国际)