图片来源:英国《自然》网站
在一份探究人类情感与困惑的调查问卷中,突然出现一句冰冷的独白:“我不像人类那样体验困惑”——这句回复由人工智能(AI)生成,是德国马克斯·普朗克人类发展研究所心理学家拉卢卡·里拉在研究中亲历的真实一幕。
美国纽约大学政治学家约书亚·塔克指出,AI的爆发式应用与能力跃迁正深刻冲击各个学科,对社会科学的影响尤甚,因为它高度依赖调查数据与分析,而这恰恰是最容易被AI操控的地带。
英国《自然》网站近日刊发评论认为,社会科学已身处十字路口:AI究竟会通过污染数据、制造虚假的学术繁荣来侵蚀学科的严肃性,扭曲我们对人类行为的认知,还是会彻底革新这门古老学科的研究范式?答案,或许正握在科学家自己手中。
投稿井喷或助长学术泡沫
AI无疑给社科领域装上了加速器,然而,表面的繁荣之下暗藏隐忧。
美国《组织科学》今年4月报告称,自2022年11月ChatGPT首次公开发布以来,投稿量猛增42%。编辑们借助检测工具追溯后发现,这一波增长主要由AI驱动。到今年2月,已有近1/3的投稿摘要出自AI之手,另有四成文本经过AI部分润色。意大利欧洲大学研究所政治学家凯文·芒格预测,今年主要政治科学期刊的投稿量将增长50%;瑞士伯尔尼大学科学家杰米·卡明斯也坦言,心理学预印本平台PsyArXiv正被海量论文淹没。
社会科学并非唯一被这股浪潮席卷的领域,但因该学科高度依赖调查分析,学者们对AI驱动的高速产出格外敏感。美国东北大学政治与计算机科学家大卫·拉泽借助AI,仅用1小时便生成了一篇28页的学术论文,不仅囊括文献综述、基于CHIP50调查(一项由美国学术界与新闻界合作开展的社会调研,旨在衡量各社区的公民健康、社会信任及机构参与度)的结果汇总,还配上了颇具说服力的图表与表格。
AI带来的高效背后,学术含金量却被打上了问号。
数据污染或侵蚀社科信誉
虚假的投稿繁荣尚可甄别,调查数据本身的污染,更像慢性“毒药”,侵蚀着社会科学的信誉。
里拉等人估计,当前多达45%的此类调查回复都是AI输出的翻版。部分参与者或许只借AI润色语言,但更多情况下,从注册、阅读题目到提交答案,整个流程全由AI代劳。当研究者试图通过问卷触摸真实的人性时,他们得到的,极有可能只是一串代码的冰冷回声,而非真实鲜活的人类表达。
为抵御这种渗透,里拉团队使用了“蜜罐”战术:在问卷代码中埋下肉眼难辨的微型文字,或隐藏指令,要求AI仅用一串“X”作答,以此诱捕AI代劳的痕迹。她坦承,这已演变成一场防御性军备竞赛:只要AI更善于隐匿,学者们就必须编织更精巧的陷阱。对那些最依赖人类真实反应的重要研究,科学家或许不得不重新采用集中招募的方式,并亲自监督志愿者答题。
德国莱比锡大学心理学家比约恩·霍梅尔甚至悲观地预言,行为科学与社会科学的研究信誉,或将因AI的持续污染而受到侵蚀。
“P值操控”令人担忧
除了数据污染,更隐蔽的危险在于,为得到想要的结果,研究者可能利用AI系统对数据进行各种“微调”。
拉泽认为,任何数据集只要经受足够多的“拷问”,终究会“吐出”符合统计显著性(P<0.05)的结果。具备自主编程能力的AI智能体,能在几分钟内构建并测试数十种分析变体,逆向拼凑出一个看似合理的假设,让不诚实的研究者堂而皇之地宣称:这正是他们最初锚定的目标。然而,这实际上是对“P值操控”的极端放大。
虽然目前尚不清楚AI辅助的“P值操控”在社科领域是否正愈演愈烈,但健康研究领域已有人发出提醒:公开数据集正被用来批量制造数千份低质量的程式化分析论文。
危机中潜藏重塑范式的契机
尽管如此,专家们认为,不应将AI视作洪水猛兽,这会遮蔽其重塑社会科学面貌的巨大潜力。问题的关键从不在于AI工具本身,而在于驾驭AI的智慧。
美国哈佛大学统计学家尼克·费什曼认为,AI可能是根治“P值操控”顽疾的良方。借助AI的强大算力,研究者可轻松实施“多元宇宙分析”——并行检验所有合理的数据分析路径,而非只展示那个最“漂亮”的单一结果。如果一项发现在绝大多数稳健性检验中都稳如磐石,那便是值得信服的真相;即便暴露其脆弱性,也是对科学的贡献。AI让这种严苛的理想化测试变得触手可及,倒逼社会科学家为自身方法论提供更坚实的支撑,而不是仅仅在数据海洋里捕捞偶然。
“硅样本”的异军突起也让人喜忧参半。在人类志愿者越来越难招募、成本越来越高的当下,研究者开始尝试用真实社会人口数据训练AI,生成高度仿真的“虚拟受访者”——所谓的“硅样本”。理论上,这能让科学家低成本触及那些不易接触的人群。
然而,瑞士伯尔尼大学心理学家马尔特·埃尔森警示,只需“微调”模型参数,研究者几乎能随心所欲地获取支持或推翻假设的答案。这种本质上的任意操纵,距学术欺诈仅一步之遥。
身处变革的漩涡中心,越来越多学者意识到,技术的冲击终将倒逼研究范式的重构。正如美国西北大学计算机科学家杰西卡·赫尔曼所言,尽管AI提供了看似全能的强力工具,但人类研究者的判断力反而变得愈发关键。提出怎样的问题,又以何种方式去诠释,永远无法交由冰冷的算法代劳。唯有那些始终坚守科学精神、善用而非滥用技术的人,才能穿透数据迷雾,抵达真知的彼岸。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。