科学网—大学老师很难识别ChatGPT答卷

作者：徐锐来源：中国科学报发布时间：2024-6-28

选择字号：小中大

大学老师很难识别ChatGPT答卷

现场考试使学生很难使用AI作弊。图片来源：Trish Gant / Alamy

本报讯 一项6月26日发表于《公共科学图书馆-综合》的研究发现，在使用ChatGPT生成答案的大学考试答卷中，有94%不会被检测出是由人工智能（AI）生成的，而且这些答案往往比学生真实的答案得分更高。

如今，AI技术的兴起和发展，给教育部门出了一道难题，即学校许多形式的评估，都是在没有监考的情况下完成的，而学生很可能利用AI答题。尤其在新冠疫情后，对无监督的居家考试的依赖越发严重。

为此，英国雷丁大学的Peter Scarfe和同事使用ChatGPT生成了雷丁大学心理学本科生学位考试5个模块共63个评估问题的答案。由于学生们是在家里参加这些考试的，所以他们可以查看笔记和参考资料，甚至可能违反规定，使用AI帮助答题。

AI生成的答案和学生真实的答案一起被提交，其中前者平均占答卷总数的5%。阅卷人并不知道他们检查的答卷中有33份来自假学生，而这些假学生的名字也是由ChatGPT生成的。

在所有模块问题的答案中，只有6%的AI生成答案被标记为可能不是学生自己的答案。而有一些非AI生成的模块问题的答案则被标记为存疑。

“尽管各模块之间存在一些差异，但平均而言，AI生成的答案得分高于学生提交的答案。在AI提交的对63个问题的答案中，得分超过学生的概率为83.4%。”Scarfe说，“但AI当前还难以进行更抽象的推理和信息集成。”

研究人员表示，他们的工作是迄今同类研究中规模最大、最可靠的。尽管只研究了雷丁大学心理学本科学位的工作，但Scarfe认为这是值得整个学术界关注的问题。

“没有理由认为其他学科领域不会有同样的问题存在。”Scarfe说，然而从源头上解决这一问题几乎是不可能的。因此，必须重新考虑评估内容。（徐锐）

相关论文信息：

https://doi.org/10.1371/journal.pone.0305354

《中国科学报》 (2024-06-28 第2版国际)

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！选刊技巧：如何为研究成果匹配合适的期刊？ Dove最新临床研究，聚焦这些进展中国数学会数理逻辑专业委员会与Mathematics期刊建立合作关系我三个可爱的儿子-三捧星光，暖我半生烟火更多>>