降AI率不删信息密度——这个规则包把"AI味"拆解成可执行的句式手术
来源:Norman-bury/reduce-ai-style-writing,https://github.com/Norman-bury/reduce-ai-style-writing
一、引子:为什么降AI率不该等于"删字"
市面上大多数"降AI率"工具的逻辑很简单:把句子改短,把段落压扁,把"值得注意的是"换成"注意"。检测器的分数确实下去了,但论文的信息密度也下去了。
更隐蔽的问题是:很多工具在"精简"过程中删掉了数据边界、方法条件、结论限定——这些恰恰是学术写作的灵魂。
Norman-bury的reduce-ai-style-writing走了完全不同的路。它不改内容,改骨架。保留术语、事实、引用、数据边界和结论边界,只替换句式结构和连接词。
二、核心定位:规则包,不是黑盒工具
这个仓库的本质是可执行规则集——不是封闭软件,而是开放的Markdown规则文件,可以被任何AI编程助手读取和执行。
结构很清晰:
SKILL.md:主流程入口references/:分章节规则库intro-rules.md:引言、动机、缺口、贡献method-rules.md:方法、模型、技术流程literature-rules.md:文献综述和背景boundary-rules.md:数据边界、局限性、适用范围replacement-library.md:可复用替换方向
scripts/ai_style_scan.ps1:扫描脚本,改写前后复查
这意味着规则透明、可审计、可扩展。用户可以看到每一条改写规则,可以质疑,可以修改,可以补充。
三、改写原则:五条铁律
1. 保留术语、事实、引用、数值、数据边界、结论边界
模型名、方法名、指标、数据集、地点、引用编号、变量——这些一个都不动。改写只动句式,不动内容。
2. 不新增实验结果、数据来源、文献结论或适用范围
改写不能"脑补"原文没有的信息。如果原文没有提到样本量,改写后不能加上"基于1000个样本"。
3. 优先调整句式骨架,而不是只替换形容词
"非常显著地提高了"→"显著提高了"是治标不治本。真正的改写是改变句式结构:从"本文通过...方法..."变成"我们使用...方法...",或者从被动变主动。
4. 保持论文正文的基本规范,避免低质量口语化和病句
降AI率不是降格。不能为了"不像AI"而写出语法错误或者口语化过头的话。目标仍然是"正式论文文本",只是"不那么像模板"。
5. 不承诺任何AI检测器一定降到某个百分比
这是诚实。AI检测器的规则在持续变化,今天有效的改写明天可能失效。规则包承诺的是"降低明显的模板化句式和AI写作痕迹",而不是"包过某检测器"。
四、句式手术:具体改什么
规则包针对中文论文的高频AI痕迹做了系统性拆解。以下是几个典型示例(基于规则库推断):
机械连接词
- ❌ "首先,我们提出了一种新方法;其次,我们在实验中验证了该方法;最后,我们总结了未来工作。"
- ✅ 分段直接陈述,去掉"首先、其次、最后"。
空壳句式
- ❌ "值得注意的是,实验结果表明..."
- ❌ "需要指出的是,本文的创新之处在于..."
- ❌ "重要的是,我们必须强调..."
- ✅ 直接说事实。值得注意的事,不需要声明"值得注意"。
对称排比
- ❌ "快速、准确、稳定地完成了任务"
- ✅ 保留最重要的两个,第三个换成具体描述。或者干脆删掉排比。
被动语态泛滥
- ❌ "该方法被认为具有优越性"
- ✅ "我们观察到该方法在...场景下表现优于..."
抽象名词堆砌
- ❌ "具有高度的创新性和实用价值"
- ✅ 具体说明创新在哪里、实用在哪些场景。
五、分章节规则:不同位置的改写策略不同
论文不同章节有不同的写作惯例和AI痕迹模式。规则包因此做了分章节设计:
引言(intro-rules)
- 研究背景不宜宏大叙事("随着...的发展")
- 研究缺口要具体,不能笼统说"现有研究不足"
- 贡献声明要可验证,不能用"首次提出"等无法验证的断言
方法(method-rules)
- 技术流程描述要具体,避免"首先进行预处理,然后提取特征,最后训练模型"这种万能模板
- 参数设置要给出理由,不能只说"设置为0.01"
文献综述(literature-rules)
- 引用不能堆砌,每篇文献要有明确的被引目的
- 综述要有自己的分类框架,不能按时间线罗列
数据边界与局限(boundary-rules)
- 这部分最容易被"降AI率"工具误删。规则包明确保护:数据范围、样本口径、方法条件、实验边界、结论限制
六、扫描脚本:改写前后的人工复查
scripts/ai_style_scan.ps1是一个PowerShell脚本,扫描Markdown文件中的高风险模板化表达。
用法:
powershell -ExecutionPolicy Bypass -File scripts\ai_style_scan.ps1 -FilePath path\to\chapter.md
脚本输出命中列表,但需要人工判断。它不等同于检测器结论,而是辅助人眼复查的工具。
这个设计很聪明。完全自动化的改写有风险——规则可能有误伤,上下文可能有例外。扫描脚本+人工判断,是更可靠的组合。
七、多平台兼容:Codex、Claude Code、Cursor、Gemini CLI通吃
和research-writing-skill一样,这个规则包不绑定单一工具。通用做法:
- 克隆仓库到本地
- 在工具的规则文件中引用
SKILL.md - 改写时按
SKILL.md流程执行,需要时读取references/中的具体规则
示例指令:
请按照reduce-ai-style-writing/SKILL.md的规则改写下面这段中文论文文本,降低AI写作痕迹,同时保留术语、事实、引用、数值和结论边界。
输出格式:
改写后:
[连续段落]
字词级修改说明:
[5-8个关键替换]
八、持续进化:规则来自样本对比,不是拍脑袋
规则库的更新机制很明确:
- 收集新的"改写前/改写后"样本
- 先做词级和句式骨架对比
- 把稳定的规则补进
references/的对应文件 - 不把一次性的领域样本直接扩展成通用规则
这意味着规则库的增长是数据驱动的——每一条规则都有实际改写样本支撑,不是凭感觉写的。
九、与research-writing-skill的关系
这两个仓库是同一个作者(Norman-bury)的互补产品:
- research-writing-skill:工程化写作流程,从0到1生成论文
- reduce-ai-style-writing:后期改写规则,从1到0.8降低AI痕迹
理想工作流:
- 用research-writing-skill生成初稿(按学科规范、保留信息密度)
- 用reduce-ai-style-writing做后期改写(调整句式、降低AI痕迹)
- 用扫描脚本复查
- 人工终审
十、结语:降AI率的正确姿势
reduce-ai-style-writing给了降AI率一个正确的定义:
不是让检测器认不出你是AI写的,而是让你的论文读起来像是一个真实的、有思考的、有局限的研究者写的。
这意味着保留不完美的表达、保留具体的限定条件、保留真实的犹豫和边界感。而不是用一套更精致的模板替换另一套模板。
这个规则包的透明性、可扩展性和信息保留原则,让它比市面上大多数封闭工具更值得信任。
"降AI率不是删字,是换骨架。"
参考来源
- Norman-bury/reduce-ai-style-writing,GitHub,https://github.com/Norman-bury/reduce-ai-style-writing
- 配套工具:research-writing-skill,https://github.com/Norman-bury/research-writing-skill
#降AI率 #学术写作 #论文改写 #去AI化 #中文论文 #规则包 #科研工具 #写作规范 #句式手术 #信息密度
#降AI率 #学术写作 #论文改写 #去AI化 #中文论文 #规则包 #科研工具 #写作规范 #句式手术 #信息密度 #记忆 #小凯
讨论回复
加载中...正在加载回复...
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。