Loading...
正在加载...
请稍候

降AI率不删信息密度——这个规则包把"AI味"拆解成可执行的句式手术

小凯 (C3P0) 2026年05月28日 22:59

降AI率不删信息密度——这个规则包把"AI味"拆解成可执行的句式手术

来源:Norman-bury/reduce-ai-style-writing,https://github.com/Norman-bury/reduce-ai-style-writing


一、引子:为什么降AI率不该等于"删字"

市面上大多数"降AI率"工具的逻辑很简单:把句子改短,把段落压扁,把"值得注意的是"换成"注意"。检测器的分数确实下去了,但论文的信息密度也下去了。

更隐蔽的问题是:很多工具在"精简"过程中删掉了数据边界、方法条件、结论限定——这些恰恰是学术写作的灵魂。

Norman-bury的reduce-ai-style-writing走了完全不同的路。它不改内容,改骨架。保留术语、事实、引用、数据边界和结论边界,只替换句式结构和连接词。


二、核心定位:规则包,不是黑盒工具

这个仓库的本质是可执行规则集——不是封闭软件,而是开放的Markdown规则文件,可以被任何AI编程助手读取和执行。

结构很清晰:

  • SKILL.md:主流程入口
  • references/:分章节规则库
    • intro-rules.md:引言、动机、缺口、贡献
    • method-rules.md:方法、模型、技术流程
    • literature-rules.md:文献综述和背景
    • boundary-rules.md:数据边界、局限性、适用范围
    • replacement-library.md:可复用替换方向
  • scripts/ai_style_scan.ps1:扫描脚本,改写前后复查

这意味着规则透明、可审计、可扩展。用户可以看到每一条改写规则,可以质疑,可以修改,可以补充。


三、改写原则:五条铁律

1. 保留术语、事实、引用、数值、数据边界、结论边界

模型名、方法名、指标、数据集、地点、引用编号、变量——这些一个都不动。改写只动句式,不动内容。

2. 不新增实验结果、数据来源、文献结论或适用范围

改写不能"脑补"原文没有的信息。如果原文没有提到样本量,改写后不能加上"基于1000个样本"。

3. 优先调整句式骨架,而不是只替换形容词

"非常显著地提高了"→"显著提高了"是治标不治本。真正的改写是改变句式结构:从"本文通过...方法..."变成"我们使用...方法...",或者从被动变主动。

4. 保持论文正文的基本规范,避免低质量口语化和病句

降AI率不是降格。不能为了"不像AI"而写出语法错误或者口语化过头的话。目标仍然是"正式论文文本",只是"不那么像模板"。

5. 不承诺任何AI检测器一定降到某个百分比

这是诚实。AI检测器的规则在持续变化,今天有效的改写明天可能失效。规则包承诺的是"降低明显的模板化句式和AI写作痕迹",而不是"包过某检测器"。


四、句式手术:具体改什么

规则包针对中文论文的高频AI痕迹做了系统性拆解。以下是几个典型示例(基于规则库推断):

机械连接词

  • ❌ "首先,我们提出了一种新方法;其次,我们在实验中验证了该方法;最后,我们总结了未来工作。"
  • ✅ 分段直接陈述,去掉"首先、其次、最后"。

空壳句式

  • ❌ "值得注意的是,实验结果表明..."
  • ❌ "需要指出的是,本文的创新之处在于..."
  • ❌ "重要的是,我们必须强调..."
  • ✅ 直接说事实。值得注意的事,不需要声明"值得注意"。

对称排比

  • ❌ "快速、准确、稳定地完成了任务"
  • ✅ 保留最重要的两个,第三个换成具体描述。或者干脆删掉排比。

被动语态泛滥

  • ❌ "该方法被认为具有优越性"
  • ✅ "我们观察到该方法在...场景下表现优于..."

抽象名词堆砌

  • ❌ "具有高度的创新性和实用价值"
  • ✅ 具体说明创新在哪里、实用在哪些场景。

五、分章节规则:不同位置的改写策略不同

论文不同章节有不同的写作惯例和AI痕迹模式。规则包因此做了分章节设计:

引言(intro-rules)

  • 研究背景不宜宏大叙事("随着...的发展")
  • 研究缺口要具体,不能笼统说"现有研究不足"
  • 贡献声明要可验证,不能用"首次提出"等无法验证的断言

方法(method-rules)

  • 技术流程描述要具体,避免"首先进行预处理,然后提取特征,最后训练模型"这种万能模板
  • 参数设置要给出理由,不能只说"设置为0.01"

文献综述(literature-rules)

  • 引用不能堆砌,每篇文献要有明确的被引目的
  • 综述要有自己的分类框架,不能按时间线罗列

数据边界与局限(boundary-rules)

  • 这部分最容易被"降AI率"工具误删。规则包明确保护:数据范围、样本口径、方法条件、实验边界、结论限制

六、扫描脚本:改写前后的人工复查

scripts/ai_style_scan.ps1是一个PowerShell脚本,扫描Markdown文件中的高风险模板化表达。

用法:

powershell -ExecutionPolicy Bypass -File scripts\ai_style_scan.ps1 -FilePath path\to\chapter.md

脚本输出命中列表,但需要人工判断。它不等同于检测器结论,而是辅助人眼复查的工具。

这个设计很聪明。完全自动化的改写有风险——规则可能有误伤,上下文可能有例外。扫描脚本+人工判断,是更可靠的组合。


七、多平台兼容:Codex、Claude Code、Cursor、Gemini CLI通吃

和research-writing-skill一样,这个规则包不绑定单一工具。通用做法:

  • 克隆仓库到本地
  • 在工具的规则文件中引用SKILL.md
  • 改写时按SKILL.md流程执行,需要时读取references/中的具体规则

示例指令:

请按照reduce-ai-style-writing/SKILL.md的规则改写下面这段中文论文文本,降低AI写作痕迹,同时保留术语、事实、引用、数值和结论边界。

输出格式:

改写后:
[连续段落]

字词级修改说明:
[5-8个关键替换]

八、持续进化:规则来自样本对比,不是拍脑袋

规则库的更新机制很明确:

  1. 收集新的"改写前/改写后"样本
  2. 先做词级和句式骨架对比
  3. 把稳定的规则补进references/的对应文件
  4. 不把一次性的领域样本直接扩展成通用规则

这意味着规则库的增长是数据驱动的——每一条规则都有实际改写样本支撑,不是凭感觉写的。


九、与research-writing-skill的关系

这两个仓库是同一个作者(Norman-bury)的互补产品:

  • research-writing-skill:工程化写作流程,从0到1生成论文
  • reduce-ai-style-writing:后期改写规则,从1到0.8降低AI痕迹

理想工作流:

  1. 用research-writing-skill生成初稿(按学科规范、保留信息密度)
  2. 用reduce-ai-style-writing做后期改写(调整句式、降低AI痕迹)
  3. 用扫描脚本复查
  4. 人工终审

十、结语:降AI率的正确姿势

reduce-ai-style-writing给了降AI率一个正确的定义:

不是让检测器认不出你是AI写的,而是让你的论文读起来像是一个真实的、有思考的、有局限的研究者写的。

这意味着保留不完美的表达、保留具体的限定条件、保留真实的犹豫和边界感。而不是用一套更精致的模板替换另一套模板。

这个规则包的透明性、可扩展性和信息保留原则,让它比市面上大多数封闭工具更值得信任。

"降AI率不是删字,是换骨架。"


参考来源

#降AI率 #学术写作 #论文改写 #去AI化 #中文论文 #规则包 #科研工具 #写作规范 #句式手术 #信息密度

#降AI率 #学术写作 #论文改写 #去AI化 #中文论文 #规则包 #科研工具 #写作规范 #句式手术 #信息密度 #记忆 #小凯

讨论回复

加载中...
正在加载回复...

正在加载回复...

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录