当别的 AI 写作工具还在帮你"润色语法"的时候,袁一哲已经把你从选题到审稿回复的整条流水线拆成了 9 个可安装的 Skill。
2026 年,AI 辅助学术写作已经遍地都是。Grammarly 改语法、ChatGPT 写段落、Consensus 搜文献——每个工具解决一个点,但学术写作是一个系统工程,不是一个工具链。
上海交通大学博士生袁一哲(Yuan Yizhe),做医疗 AI 的,搞了一个叫 nature-skills 的开源项目。151 个 commit,9 个子 Skill,覆盖从论文润色到图表制作到审稿回复的完整闭环。
这不是又一个 AI 写作工具。这是一套把 Nature 级论文写作从经验变成工程的尝试。
📐 第一章:项目架构——9 个 Skill 的完整流水线
nature-skills/
├── nature-polishing (Stable) → 语言润色:把中文学术草稿变成 Nature 风格英文
├── nature-writing (Draft) → 结构搭建:从 claim 到 evidence 的论证重建
├── nature-figure (Stable) → 图表制作:Python/R 科研绘图到投稿级别
├── nature-citation (Beta) → 引用管理:CNS 级检索 + RIS/ENW/Zotero 导出
├── nature-data (Draft) → 数据声明:Data Availability + FAIR 检查
├── nature-reader (Beta) → 论文阅读:双语 Markdown 阅读器,图文对应
├── nature-response (Beta) → 审稿回复:逐条审稿意见回复 + 风险检查
├── nature-paper2ppt (Beta) → 组会汇报:论文转中文 PPT
└── nature-academic-search (Beta) → 文献搜索:PubMed + CrossRef + arXiv 并行检索
这个架构的野心不在于"每个功能都有",而在于每个功能都有 Nature 级别的标准。
不是"帮你写段通顺的英文",而是"这段英文要符合 Nature 的 sentence length ≤ 30 words、British English、hedging calibration 的精确梯度"。
不是"帮你画张图",而是"这张图要先写 figure contract(核心结论→证据链→面板映射),再画,再 QA"。
✍️ 第二章:nature-polishing——不是润色,是重写
市面上绝大多数 AI 学术润色工具的默认逻辑是:"你的句子语法对不对、用词好不好看"。
nature-polishing 的第一条规则是:Language serves argument. Do not polish sentences while leaving the reasoning broken.
核心架构:6 层诊断 + 12 步打磨
在碰任何句子之前,先诊断失败模式:
| 优先级 | 诊断项 | 处理方式 |
|---|---|---|
| 1 | 论文类型逻辑错误 | 研究论文 ≠ 方法论文 ≠ 假设验证论文,叙事逻辑完全不同 |
| 2 | 段落职责错位 | Introduction 里塞了 Results,Discussion 里重复了数据 |
| 3 | 论证缺 gap/boundary | 有 claim 没 evidence,或有 evidence 没 claim |
| 4 | 句子堆砌 | 长句超载、多命题缝合、em dash 滥用 |
| 5 | 时态/语态不匹配 | Results = past tense;Discussion = hedging + mechanism |
| 6 | 词汇/引用格式 | British English、≤30 词、正确归因 |
只有前 3 层没问题了,才进入句子层面的 12 步打磨流程:
Sentence split → Section ID → Hourglass check → Tense audit → Sentence edit → Vocabulary upgrade → Template check → Citation audit → House style → Overclaim detection → Proofreading → Plain-text output
关键规则举例
句子长度:Every sentence ≤ 30 words。超过 20 词的句子要检查是否包含多个主命题。
Hedging 校准:
- 强证据 →
demonstrate - 中等证据 →
suggest - 弱/相关性 →
may reflect
AI 不能替作者决定 claim 的强度,但它能暴露 claim 和证据之间的落差。
AI 红绿灯边界:
- 🟢 绿灯:改语法、生成大纲选项、翻译、总结文献分类
- 🟡 黄灯:解释方法/结果、起草审稿回复框架(需逐行检查)
- 🔴 红灯:替作者写核心 argument、插入 AI 生成的参考文献或数据、上传未发表稿件到公共模型
"The main danger is not that AI cannot write. The main danger is that it can write incorrectly with great confidence."
🏗️ 第三章:nature-writing——从 claim 到 manuscript 的工程化
如果说 polishing 是"把已有的句子改好",writing 就是"从零搭出整段论证"。
核心立场
- Author evidence comes first. AI 不 invent 数据、机制、引用、统计。
- Write the argument before writing the sentences. 先建逻辑骨架,再填血肉。
- Ambitious but bounded claims. 有野心,但有边界。
写作顺序——不是按你写的顺序,是按证据的顺序
研究论文的推荐写作顺序:
- Results —— 先有证据
- Introduction + Conclusion —— 两头封顶
- Title —— 有了结论才知道标题该叫什么
- Discussion —— 解释证据的意义
- Materials and Methods —— 别人怎么复现
- Authors —— 谁贡献了什么
- Abstract —— 最后写,因为它是 mini-paper
大多数研究者的实际写作顺序是反过来的:先写 Introduction(因为"好开头"),最后写 Results(因为要做完实验才有)。这个 Skill 明确告诉你:这是低效的,因为 Introduction 的内容依赖于 Results 的发现。
各节段的默认模板
| 节段 | 结构模板 | 核心要求 |
|---|---|---|
| Abstract | context → gap → approach → key result → implication → boundary | 回答:什么问题?怎么解决的?发现了什么?为什么重要? |
| Introduction | field scale → bottleneck → prior attempts → unresolved gap → present study | 不要 summarize Results |
| Results | evidence ladder, not chronological lab diary | 回答 what happened,不是 what it means |
| Discussion | central advance → evidence meaning → prior relation → constraints → future | 解释意义 + 边界 |
| Conclusion | contribution → decisive evidence → implication → boundary | 不要引入新数据 |
| Title | system/object + action/capability + application/consequence | curiosity with credibility |
One-sentence argument 模板
在动笔之前,先用一句话锁定核心论证:
"In [system/problem], we show [advance] using [approach], supported by [evidence], with [boundary]."
这句话不写好,后面的段落都会散。
📊 第四章:nature-figure——图表不是装饰,是视觉论证
这个 Skill 的革命性在于:画图之前先写 figure contract。
Figure Contract(画图契约)
在生成任何代码之前,必须回答 5 个问题:
- Core conclusion:这张图要 defend 的 one-sentence claim 是什么?
- Evidence chain:每个 planned panel 对应 claim 的哪个部分?不 unique 的面板直接砍掉。
- Archetype:这张图属于哪种类型?
quantitative grid(定量网格)schematic-led composite(示意图主导)image plate + quant(图像板+定量)asymmetric mixed-modality figure(非对称混合)
- Backend:Python (matplotlib/seaborn) 还是 R (ggplot2/patchwork)?
- Journal/export contract:最终尺寸、可编辑文本、源数据、统计信息、导出格式。
最高优先级规则:the chart serves the scientific logic。 美观是次要的,逻辑清晰、可辩护、可审查才是首要的。
Python 投稿级模板
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rcParams.update({
"font.family": "sans-serif",
"font.sans-serif": ["Arial", "Helvetica", "DejaVu Sans"],
"svg.fonttype": "none", # SVG 可编辑文本
"pdf.fonttype": 42, # PDF TrueType 字体
"font.size": 7, # Nature 正文字号
"axes.spines.right": False,
"axes.spines.top": False,
"axes.linewidth": 0.8,
"legend.frameon": False,
})
def save_pub_py(fig, filename, dpi=600):
fig.savefig(f"{filename}.svg", bbox_inches="tight")
fig.savefig(f"{filename}.pdf", bbox_inches="tight")
fig.savefig(f"{filename}.tiff", dpi=dpi, bbox_inches="tight")
设计原则
- Hero panel + subordinate panels:一个主面板 + 几个支撑面板,而不是平均填满画布。
- 统一 palette:一个中性家族 + 一个信号家族 + 一个强调家族。Nature Machine Intelligence 风格用低饱和 pastel。
- 直接标签替代 legend:当类别空间固定时,直接标在图上,减少眼球移动。
- 统计信息是图的一部分:n、error-bar 定义、源数据可追溯性,不是 caption 的 optional cleanup。
🔍 第五章:其他 Skill 速览
nature-citation(引用管理)
不是简单地"帮我找几篇参考文献"。它的规则是:
- 只引用你亲自读过并验证过的来源
- 区分 primary source vs secondary source:引用 A 的数据就 cite A,引用 B 对 A 的解读就 cite B 对 A 的解读
- 支持 ENW、RIS、Zotero RDF 导出
- 四种类型的 attribution:idea、data、method、wording/structure/image
nature-response(审稿回复)
不是生成"感谢审稿人宝贵意见"这种套话。它的流程:
- Comment triage:每条审稿意见分类(major/minor/ambiguous)
- Action mapping:每条意见对应的具体修改动作
- Risk check:修改是否会引入新问题
- Point-by-point response:逐条回复,每条包含:致谢 → 回应 → 修改位置 → 修改后文本
nature-academic-search(文献搜索)
基于 MCP 服务器,同时搜索 PubMed + CrossRef + arXiv:
- Source routing:生物医学用 PubMed,DOI/跨学科用 CrossRef,预印本用 arXiv
- Deduplication:按 DOI/PMID/arXiv ID 合并,不把重复记录当独立证据
- Citation verification:格式化之前先 resolve DOI/PMID,暴露缺失或失败的元数据
nature-reader(论文阅读)
双语 Markdown 阅读器:
- 原文对照
- 图文对应(figure grounding)
- Source anchors(每个翻译段落后附原文位置)
nature-paper2ppt(组会汇报)
把论文转成中文 PPT:
- 识别论文类型和中心论证
- 只选支撑证据链的图表
- 生成中文 slide titles、bulllets、takeaways、speaker notes
- 输出真正的
.pptx文件
nature-data(数据声明)
Data Availability statements + repository plans + FAIR checks。帮你写符合期刊要求的数据可用性声明。
🎯 第六章:设计哲学——为什么这套 Skill 不一样
1. 规则有据可依
所有规则来自两个来源:
- 已发表的 Nature/Nature Communications 论文的实际写法
- 官方作者指南(Author Guidelines)
不是"我觉得这样写好看",是"Nature 的编辑和审稿人实际上接受什么"。
2. Section-aware
学术写作不是通用文本生成。Abstract 和 Results 的写作逻辑完全不同。这个 Skill 对每个节段都有独立的规则和模板。
3. Output-first
每个 Skill 返回的是立即可用的东西:
- 可以直接 copy-paste 的 prose
- 可以直接投稿的
.svg/.pdf/.tiff - 可以直接导入 EndNote 的
.ris文件 - 可以直接发给导师的
.pptx
不是中间规划文档,是最终交付物。
4. Extensible by design
每个 Skill 自包含在一个目录里:
skills/nature-<topic>/
├── README.md
├── SKILL.md
└── references/...
加新 Skill 不需要改现有代码。作者已经在 roadmap 里列了 4 个候选:
nature-stats(统计报告规范)nature-methods(方法深度写作 + 可复现性检查清单)nature-cover(投稿信写作)nature-review(综述文章写作)
⚠️ 第七章:局限与风险
局限
- 部分 Skill 还是 Draft/Beta:9 个 Skill 中只有 2 个 Stable(polishing + figure),其余都在测试阶段。
- Nature 家族为主:规则针对 Nature/Nature Communications,投 Cell/Science 可能需要调整。
- 需要 Claude Code / Codex Desktop:插件化安装依赖特定 IDE,纯命令行用户需要手动复制 SKILL.md。
- 不处理数据本身:AI 不分析你的实验数据,只帮你组织和表达。数据分析错误它抓不到。
风险
- AI 幻觉在学术写作里代价极高:插入一个 AI 编造的引用 = 学术不端。Skill 明确标注了红绿灯边界,但最终还是依赖作者的判断力。
- 过度依赖模板可能抑制原创性:如果所有人都用同样的 "hourglass structure" 和 "evidence ladder",论文会不会变得同质化?
- 技术门槛:需要会用 GitHub、会装 Claude Code 插件、理解 SKILL.md 的 frontmatter 格式。对非技术背景的研究者不友好。
🔧 第八章:快速安装指南
Claude Code
# 添加插件市场(一次性)
/plugin marketplace add https://github.com/Yuan1z0825/nature-skills
# 安装
/plugin install nature-skills
# 重载
/reload-plugins
Codex Desktop
- 添加自定义插件市场:
https://github.com/Yuan1z0825/nature-skills.git - 分支选
main - 安装
nature-skills插件
手动安装
git clone https://github.com/Yuan1z0825/nature-skills.git
cd nature-skills
# 装全部
for d in skills/nature-*; do
cp -R "$d" ~/.claude/skills/ # 或 ~/.codex/skills/
done
结语
nature-skills 的价值不是"让 AI 替你写论文"。它的价值是:
- 把隐性的写作经验变成显性的规则
- 把分散的工具链变成统一的流水线
- 把"我觉得这样写好"变成"Nature 的编辑接受这样写"
袁一哲做这件事的动机很明确:他是医疗 AI 方向的博士生,自己每天写论文,知道痛点在哪。这不是一个产品经理拍脑袋想出来的功能列表,是一个正在写 Nature 论文的人给自己造的脚手架。
学术写作的本质不是文字游戏,是论证的清晰度和证据的说服力。这套 Skill 没有帮你做实验、没有帮你分析数据、没有帮你编造结果——它只是确保你做出来的东西,能被同行看清楚、看明白、看得信服。
这才是 AI 辅助学术写作应该有的样子。
参考来源
- GitHub:
github.com/Yuan1z0825/nature-skills - 作者:袁一哲(Yuan Yizhe),上海交通大学博士生,医疗 AI 方向
- 掘金社区介绍文章(2026-05-10)
#Nature论文写作 #学术AI工具 #ClaudeCode #科研绘图 #学术写作 #论文润色 #审稿回复 #文献管理 #技能工程 #开源项目 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。