ai答题胜过真人-8846威尼斯

作者：中国科学报许悦发布时间：2024/6/30 10:03:45

近日一项发表于《公共科学图书馆-综合》的研究发现94%的使用chatgpt创建的大学考试答案，不会被检测出是由人工智能（ai）生成的，而且这些答案的得分往往比真实学生的更高。

如今，人工智能（ai）技术的兴起和发展，如chatgpt的诞生，对教育部门提出了一个根本性问题，即学校许多形式的评估，都是在没有监考的情况下完成的，学生可能利用ai回答评估问题。尤其新冠疫情以来，对无监督的在家考试的依赖越发严重。如果学生使用ai作弊未被发现，那么这对整个评估方式都是个威胁。

为此，英国雷丁大学的peter scarfe和同事使用chatgpt创建了雷丁大学心理学本科生学位5个模块共63个评估问题的答案。由于学生们是在家里参加这些考试的，所以他们可以查看笔记和参考资料，甚至可能违反规定，使用ai帮助答题。

ai生成的答案和真实学生的答案一起被提交筛查，其中前者平均占总答案数的5%。负责筛查并标记的人并不知道他们检查的答案中有来自33名假学生的。这些学生的名字也是由chatgpt生成的。

在所有模块问题的答案中，只有6%的ai生成答案被标记为可能不是学生自己的答案。而有一些非ai生成的模块问题的答案则被标记存疑。

“尽管各模块之间存在一些差异，但平均而言，ai生成的答案得分比真实学生的更高。ai提交的材料中，得分超过学生的概率为83.4%。”scarfe说，“但当前ai还难以进行更抽象的推理和信息集成。”

研究人员表示，他们的工作是迄今同类研究中规模最大、最有力的。尽管他们只研究了雷丁大学心理学本科学位的问题，但scarfe认为这是值得整个学术界关注的问题。

“难保其他学科领域不会有同样的问题存在。”scarfe说，然而从源头上解决这一问题几乎是不可能的。因此，必须重新考虑评估内容。（来源：中国科学报许悦）

相关论文信息：