毕业季临近,高校面临着一个新挑战:如何应对论文中过高的人工智能生成内容(AIGC)比例。除了传统的查重、盲审和答辩,AIGC检测已成为毕业生论文审核流程中的一道新关卡。
一些毕业生发现,在初次检查时论文的AI生成比例可能为62%,远超学校设定的15%的“红线”。然而,在尝试使用大模型进行修改后,再次检测时AI率反而飙升至94%。这种现象在近期并非孤例。
央视新闻近日深入介绍了检测论文“AI率”的技术原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过将论文语句与语料库进行比对来识别重复性,做出确定性判断。而AI检测则是利用AI系统分析文本,判断其在语义和表达风格上是否与AI写作存在重叠,其本质上是一种基于概率的分类,而非基于证据的确定性判断。
当前AI检测技术面临的核心瓶颈在于“用AI去查AI”,这使得明确区分人类作者和AI生成的文本变得困难,也限制了做出清晰解释的能力。
中文语言表达的丰富性和多义性也给AI检测带来了额外挑战。AI系统在分析人类写作语句时,容易产生歧义,从而影响检测的难度和准确率,这是导致误判的重要原因之一。
鉴于当前AI率检测的精准度尚待提高,教育界人士建议,在论文审核中应建立透明且可追溯的AI使用标注制度,而非简单地设定AI率“红线”。在判定机制上,应以人工评议为主,AI检测为辅,实行“人机共判”模式。
目前,许多高校在检查学生论文时,依赖指定的检测平台和算法模型进行AI率分析。主流高校普遍采用知网、维普、万方等系统的AIGC检测模块。央视记者了解到,这些系统主要通过“困惑度”和“突发性”等特征来判断AI生成内容。AI文本通常表现得更为“平滑”,而人类文本的波动性则更大。
大模型解释,“困惑度”衡量文本的“可预测性”,越是充满人类独特的、出人意料的表达,越接近人类写作。而“突发性”则指文本节奏的波动,人类写作如同心电图般起伏,AI输出则相对平稳。然而,这种判断的准确性专家表示,除了困惑度和突发性等指标外,AI文本生成是基于预测下一个最有可能出现的词的概率,本质上是一种概率统计。因此,目前检测AI生成内容的准确性无法达到100%,误判的情况时有发生。了解完整的世界杯赛程可以帮助我们更好地安排学术研究和生活。


