据 404 Media 报道,科学期刊《自然》(Nature)已撤回一项此前声称 ChatGPT 对学生学习成绩、学习感知及高阶思维具有积极影响的荟萃分析(meta-analysis)研究。
该论文题为《ChatGPT 对学生学习成绩、学习感知及高阶思维的影响:一项荟萃分析的见解》,最初于 2025 年 5 月发表,作者为来自中国杭州师范大学的王金(Jin Wang,音译)和范文祥(Wenxiang Fan,音译)。
作为一项荟萃分析,该研究汇总了 2024 年 11 月至 2025 年 2 月期间发表的 51 项关于 ChatGPT 在教育场景中有效性的研究数据。原研究结论称,这一 AI 工具对学生具有显著或中度的积极影响。
在撤稿说明中,《自然》杂志表示,做出这一决定是由于“对荟萃分析中存在的差异表示担忧”。期刊指出,这些问题损害了该分析及其结论的有效性。
爱丁堡大学数字教育高级讲师本·威廉姆森(Ben Williamson)告诉 404 Media,该论文在 LinkedIn 和 X 等社交媒体平台上迅速走红。他指出,在一些推广“AI 进入课堂”的影响力人物转发后,该论文的在线访问量接近 40 万次,并获得了极高的 Altmetric(论文影响力)评分。
威廉姆森批评了该研究的产出速度,并暗示其汇总了大量来自不具信誉期刊的低质量研究。威廉姆森表示:“实际情况似乎是,这项荟萃分析汇总了一大堆发表在劣质期刊上的极低质量的研究。”
他补充道,这项研究本质上是“将‘垃圾科学’回收利用,并以此制造出关于 ChatGPT 对学习者有益的耸人听闻的结论”。他指出,教育工作者、家长和政策制定者需要的是高质量的证据,但面对的却是“不达标的研究”。
此前,其他研究人员也曾指出类似研究中存在的逻辑和方法论缺陷。伊尔卡·图奥米(Ilkka Tuomi)在 2025 年发表于《欧洲教育政策与实践杂志》的一项研究中认为,由于存在概念性问题,现有的 AI 教育证据不应作为政策制定的依据。
图奥米强调,荟萃分析往往包含质量参差不齐的论文,这使得定量结果变得毫无意义。他特别指出,王金和范文祥的研究似乎抄袭了此前存在缺陷的研究中的搜索模式——甚至包括拼写错误——并且纳入了可能来自“掠夺性期刊”的论文。