|
|
|
|
|
本科生一年发百余篇顶会论文,同校教授痛批:“一场灾难” |
|
|
编译 | 王兆昱
最近,一位名叫Kevin Zhu的年轻人在学术圈引发争议。
刚从美国加州大学伯克利分校拿到计算机本科学位的Kevin Zhu,声称今年已发表113篇研究论文,其中有89篇在AI领域的顶尖学术会议——NeurIPS大会上展示。
这些论文的主题看起来很有趣:用AI定位撒哈拉以南非洲的游牧民、评估皮肤病变、翻译印尼方言……在Zhu的个人领英主页,他自豪地写道:“过去一年,我们在顶会上发表了100多篇论文,被OpenAI、微软、谷歌、斯坦福、MIT、牛津引用。”
值得一提的是,Zhu创办了一家名为Algoverse的公司,专门面向高中生和本科生提供“AI科研指导”。每位学生只要支付3325美元(约合人民币2.4万元),就可以参加为期12周的线上课程,并获得指导向顶会投稿。这些学生中的很多人,正是Zhu所发表论文的共同作者。
图片由豆包AI生成
教授公开质疑
与Zhu同校的计算机系教授Hany Farid发现了这事不对劲。
“我一年连100篇论文都读不完。”这位教授在领英上写道,“当我得知,有人声称他一年参与了100多篇论文的研究和写作时,我有多惊讶,你可想而知。”
在接受英国《卫报》采访时,Farid的措辞更加严厉。他称Zhu的论文是“一场灾难”,“我相当确定,整个过程从头到尾就是Vibe coding。”
“Vibe coding”是一个新近流行的俚语,指用AI工具快速生成代码,而不求甚解。Farid用这个词来形容使用AI堆砌论文的做法。
当被问及论文是否使用AI撰写时,Zhu的态度颇为微妙。他并未承认或否认,而是回答:“团队使用了标准的生产力工具,如文献管理器、拼写检查,有时也用语言模型进行文字润色或提高清晰度。”
Zhu还表示,这些论文是“团队的努力”,他监督了这113篇论文。
他说:“至少,我会协助审核论文中的研究方法和实验设计,并在论文终稿提交前阅读并发表评论意见。”他还补充称,语言学、医疗或教育领域的项目都拥有“相关专长的首席研究员或导师”。
对于这件事,NeurIPS的组织者表示,Zhu的论文主要提交给了会议内部的研讨会——这些研讨会通常是展示早期工作的地方,和主会议不同。
Farid却认为,这不是一个合理的、有说服力的理由。
学术泡沫
Zhu的案例只是这场学术泡沫的一个缩影。
Farid指出,此案例反映了更大的问题——许多AI领域的顶尖会议正在被海量投稿“淹没”,但这些论文的质量并不高。
作为新兴热门学科,AI领域的研究节奏很快,研究工作往往以非正式的方式在会议上提交,而不像生物学、化学那样经过严格同行评审流程。
2025年,NeurIPS共收到21575篇论文,而2020年时还不到10000篇。另一个AI顶会ICLR称,其2026年度会议的投稿量已经接近20000篇,比2025年暴涨70%。
论文数量激增的同时,带来了对论文质量的担忧。
与此同时,学生和学者们正面临越来越大的压力。他们被推着走,被迫发更多论文以跟上同行的步伐。不少人会通过“Vibe coding”生成的论文来增加发表量。
“如此多的年轻人渴望投身AI领域,眼下这股热潮正愈演愈烈。”Farid说。
投稿量爆炸的直接后果是“审稿难”。NeurIPS今年不得不依赖大量博士生来审稿。一位NeurIPS领域主席直言,这已经损害了审稿流程的严谨性。
一位NeurIPS的发言人称,AI领域的快速发展使论文提交数量显著增加,“给我们的评审系统带来了相当大的压力”。
AI“狂热”
Farid公开建议学生们不要涉足AI研究领域,因为这个领域处于“狂热”状态。
相当一部分人在这个领域发论文,只是为了“让简历好看”。
例如,Zhu的公司声称:“你在这里取得的技能、成就和发表的出版物可以帮你申请更好的大学,强化你的简历。如果你的论文被顶级会议录取,这是一项声誉卓著的成就。”
“这么多年轻人都想进入AI领域,这简直是一团糟。你跟不上,无法做好的工作,无法深思熟虑。”Farid说。
他告诉学生们:“如果你想让论文发表量更好看,并不难做到,只要做一些非常糟糕的低质量工作,用它们‘轰炸’会议。但如果你想做非常周密、仔细的工作,你会处于劣势,因为你被单方面‘解除了武装’。”
美国弗吉尼亚理工大学副教授Jeffrey Walling则批评说:“在学术界,获得回报靠的是出版量而不是质量……每个人都喜欢超级生产力的神话。”
另一个普遍现象是,大大小小的科技公司纷纷将自己的研究成果公布在arXiv网站上。这个网站曾用于刊载论文预印本,大多是数学和物理学领域鲜有人关注的成果,可如今却充斥着被标榜为科学成果,但实际上并未经过评审审核的论文。
Farid指出,这样的情况导致“噪声”太多,人们很难知晓AI领域实际发生的情况。“普通读者根本没什么机会去真正理解科学文献,理解究竟发生了什么。你接收到的信息中,有用和无用的比例几乎是1:1。我参加这些会议都很难搞清楚到底发生了什么。”
AI在学术研究中应该扮演什么角色?这个话题自前几年“火”起来后,一直充满争议。众所周知,AI工具容易产生幻觉,或杜撰不存在的信息来源,这些甚至不会被一些著名期刊的同行评审发现。
例如,去年发生的一件荒谬事件:某篇论文用的AI生成的插图,图中大鼠的生殖器几乎比身体还大,竟然也通过了同行评审。(详见报道:发表3天被撤稿!中国作者用AI生成论文插图,每幅都荒谬 )
如今,AI研究领域正因AI技术本身陷入割裂。如果真正有创新性的研究正被那些虚假炮制、成果更为“丰硕”的同行淹没,这对新一代人工智能科学家而言,意味着什么?
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。