
温馨提示若页面不能正常显示数学公式和代码请阅读原文获得更好的阅读体验。作者连小白 (连享会)邮箱lianxhcn163.comTitle: Nature 子刊观点AI 检测让论文写作陷入两难Keywords: AI 检测器, style tax, artificial intelligence detector, Nature Human Behaviour, 学术论文写作, AI 代写, AI 写作SourceHu, B. (2026). Why artificial intelligence detectors could penalize academic writing.Nature Human Behaviour, 10(3), 439. Link, PDF, Google.AI 进入学术写作以后一个新问题正在出现我们不只担心学生或作者用 AI 代写也开始担心自己写出来的文字会不会被误判为 AI。这听起来有些反常。过去学术写作追求的是清楚、规范、结构完整。我们会使用连接词会写复杂句子会通过转折、并列和递进来组织论证。可是当 AI 检测器开始进入学校、期刊和评审流程以后这些原本属于正式学术写作的特征也可能让作者自己变得犹豫这句话会不会太像 AI这个表达会不会太工整这个段落会不会太顺Bo Hu 最近在Nature Human Behaviour发表了一篇很短的观点文章题目是 “Why artificial intelligence detectors could penalize academic writing”。文章只有一页纸但提出了一个很值得讨论的问题AI 检测器带来的麻烦可能不只是“能不能准确识别 AI 文本”还包括它会不会反过来改变人的写作方式。写作时开始自我怀疑Hu 在文章开头写到自己最近写作时比过去更容易卡住。过去他会自然使用一些熟悉的连接结构比如not only ... but also也会用破折号来分隔句子。这些写法并没有语法错误也不罕见。可是现在他会下意识地问自己这会不会显得太像机器生成的文字于是写作者开始主动替换词语拆掉复杂句式减少某些连接词避免重复使用同一类形容词。目的不一定是让文章更好而是让文章看起来不像 AI。这正是 Hu 文章中最值得注意的地方。AI 检测器的影响不只发生在检测之后也发生在写作之前。只要作者相信自己的文字可能被检测他的写作行为就已经开始改变。一种新的 style taxHu 把这种压力称为一种新的style tax。这里的tax不是经济意义上的税而是一种表达成本。过去作者面对的是读者。我们写作时考虑的是这句话是否准确这个论证是否清楚这个概念是否解释到位现在作者还要面对一个潜在的检测器。于是写作目标发生了微妙变化文章不只要让人读懂还要让机器“放心”。这种变化会带来一个后果作者可能为了降低 AI 检测风险而牺牲原本自然、有效、成熟的表达方式。换句话说写作者不是在追求更好的文字而是在追求更安全的文字。如果这种压力持续存在学术写作可能会越来越平。大家都避免复杂句式避免风格化表达避免过于顺畅的过渡避免看起来“太完美”的文字。最后文章不一定更真实却可能更单调。非英语母语作者更容易受到影响Hu 特别提到非英语母语作者在这个问题上可能更容易受到伤害。很多非英语母语学者花了很长时间学习正式、规范、结构清楚的学术英语。我们学会使用连接词学会写主题句学会安排段落结构学会用比较稳定的句型表达研究问题和理论逻辑。这些训练原本是为了让论文更像一篇合格的学术论文。问题在于大语言模型也常常生成这种规范、工整、可预测的文本。于是一些原本属于“训练有素的学术英语”的特征可能被误读为“AI 生成文本”的特征。这对中国学者并不陌生。我们过去一直鼓励学生把英文写得更规范、更清楚、更接近国际期刊论文。可是如果检测器把“规范”和“可预测”理解为 AI 风格那么非英语母语作者反而会被置于更尴尬的位置写得不规范会影响发表写得太规范又可能被怀疑。这就是标题中所说的“两难”。检测器分数不是证据Hu 并不否认 AI 代写和学术诚信问题的存在。他明确说AI-enabled plagiarism 是严重威胁。问题在于不能把黑箱检测器当作最终裁判。AI 检测器通常给出的是概率分数或者某种 “AI likelihood score”。这类分数最多只能提示风险不能直接证明作者违规。文本像不像 AI不等于文本是不是 AI 写的分数高不等于作者没有完成真实的研究和写作过程。Hu 提出的替代方向是把注意力从最终文本转向写作过程。比如作者如何形成研究问题如何修改草稿如何组织版本如何一步步完成文档。这些过程证据比单一检测分数更可靠。他在文中提出一个很直接的判断概率分数不是证据。真正的证据应当来自可追踪的写作过程比如版本控制、修改记录、草稿演变和工作流记录。学术诚信应当看过程而不只是看文本这篇文章最有启发的地方是它把问题从“这段文字是不是 AI 写的”推进到“这篇文章是如何产生的”。在 AI 已经进入学术写作之后很多文本都不再容易被简单分成“纯人工”和“纯 AI”。作者可能用 AI 帮助翻译、润色、整理提纲、检查语法、解释代码、生成摘要也可能完全没有使用 AI只是写得比较规范。仅凭最终文本很难判断真实过程。因此学术诚信治理不能只盯着文本表面。对论文作者而言更合理的做法是保留写作和研究过程中的关键记录文献检索记录、数据处理代码、版本修改历史、图表生成脚本、草稿演变过程、AI 工具使用说明等。这不是为了增加负担而是为了让研究过程更透明。将来如果有人质疑一篇文章的来源作者可以说明文本是如何一步步形成的而不是被迫围绕某个检测器分数进行辩解。这篇短文提醒了我们什么Hu 这篇文章没有展开复杂的实证检验也没有系统比较不同 AI 检测器的准确率。它的价值在于提出了一个很容易被忽略的问题当检测器进入写作生态以后作者会开始为检测器写作。这可能改变学术写作本身。过去我们担心 AI 让文章变得像机器。现在另一个风险是为了证明自己不是机器人类作者也开始写得更像机器认可的样子。这不是一个简单的技术问题而是一个写作制度问题。AI 检测器可以作为辅助工具但如果它被当作最终裁判就可能把作者推向自我审查和风格收缩。长远看受到损害的不只是某几句话而是学术表达的多样性。简言之AI 时代的学术诚信不能只依赖检测器。更可靠的方向是让作者对自己的研究过程、写作过程和最终文本负责。检测器分数可以提示问题但不能替代证据文本像不像 AI也不能替代对作者工作的真实判断。温馨提示若页面不能正常显示数学公式和代码请阅读原文获得更好的阅读体验。