人工智能歧视非母语英语使用者

最近的一项研究揭示了关于人工智能（AI）的一个令人不安的真相：用于检测论文、求职申请和其他形式工作的算法可能会无意中对非母语英语人士进行歧视。这种偏见的影响广泛，影响到学生、学者和求职者。由斯坦福大学生物医学数据科学助理教授詹姆斯·邹领导的这项研究揭示了AI文本检测器造成的令人震惊的差距。随着像ChatGPT这样的生成式AI程序的崛起，审查这些检测系统的准确性和公平性变得至关重要。

还阅读：No More Cheating! Sapia.ai实时捕捉AI生成的答案！

AI文本检测器的意外后果

在学术诚信至关重要的时代，许多教育工作者认为AI检测是对抗现代作弊形式的重要工具。然而，该研究警告称，这些检测系统经常宣传的99%准确率是误导性的。研究人员敦促对AI检测器进行更仔细的检查，以防止对非母语英语人士的无意识歧视。

还阅读：Massive Stack Exchange Network因AI生成内容标记而罢工

测试揭示对非母语英语人士的歧视

为了评估流行的AI文本检测器的性能，邹和他的团队进行了一项严格的实验。他们提交了由非母语人士撰写的91篇英语作文，供七个知名的GPT检测器评估。结果令人震惊。超过一半的为托福（TOEFL）设计的作文被错误地标记为AI生成的。一个程序竟然将98%的作文分类为机器生成的。与之形成鲜明对比的是，当美国的母语英语八年级学生撰写的作文接受相同评估时，检测器正确地将超过90%的作文识别为人类撰写。

欺骗性的宣称：99%准确性的神话

研究中观察到的歧视结果源于AI检测器如何评估人类和AI生成文本之间的区别。这些程序依赖一种称为“文本困惑度”的指标，来衡量语言模型在预测句子中下一个单词时变得多么惊讶或困惑。然而，这种方法会对非母语人士产生偏见，因为他们通常使用更简单的词汇选择和熟悉的模式。像ChatGPT这样的大型语言模型，被训练成产生低困惑度的文本，无意中增加了将非母语英语人士错误地识别为AI生成的风险。

还阅读：AI-Detector将美国宪法标记为AI生成的

改写叙述：一个矛盾的解决方案

鉴于AI检测器的固有偏见，研究人员决定进一步测试ChatGPT的能力。他们要求该程序重写托福作文，运用更复杂的语言。令人惊讶的是，当这些修改后的作文接受AI检测器评估时，它们都被正确标记为人类撰写。这个矛盾的发现表明，非母语作者可能更广泛地使用生成式AI来规避检测。

还阅读：好莱坞作家罢工反对AI工具，称其为“剽窃机器”

对非母语作者的深远影响

该研究的作者强调了AI检测器对非母语作者造成的严重后果。大学和工作申请可能会被错误地标记为AI生成的，从而在在线上边缘化非母语讲者。像谷歌这样降低AI生成内容排名的搜索引擎进一步加剧了这个问题。在教育领域，GPT检测器应用最广泛，非母语学生面临更大的被错误指控作弊的风险。这对他们的学术生涯和心理健康是有害的。

还阅读：欧盟呼吁采取措施识别深度伪造和AI内容

超越AI：培养道德生成式AI的使用

塞浦路斯开放大学算法透明度研究中心的贾娜·奥特巴赫建议采取不同的方法来应对AI的潜在陷阱。她主张不仅仅依靠AI来应对与AI相关的问题，而是倡导一种培养道德和创造性利用生成式AI的学术文化。奥特巴赫强调，随着ChatGPT在基于公共数据的学习和适应，它最终可能会超过任何检测系统。

还阅读：OpenAI引入超级对齐：为安全和对齐的AI铺平道路

我们的观点

这项研究的发现揭示了一个令人担忧的现实：AI文本检测器可能会歧视非母语英语使用者。必须对这些检测系统中存在的偏见进行批判性审查和解决，以确保公正性和准确性。随着聊天GPT等生成型AI的兴起，平衡学术诚信和对非母语写作者的支持环境变得至关重要。通过培养对生成型AI的道德观念，我们可以努力建立一个技术作为包容性工具而不是歧视源的未来。