当 AI 学会做一本杂志——从 Beautiful Article Skill 看 Agent 工作流的工程化

——从 Beautiful Article Skill 看 Agent 工作流的工程化

---

一、一张「废纸」的旅程

想象一下：你手里有一堆素材——一篇网页链接、几页 PDF、几段随手记的笔记，或者干脆是老板甩过来的一堆材料。你的任务是把它们变成一篇可以发出去、让人愿意读完、愿意转发的东西。

在过去，这件事需要三个人：一个编辑负责筛选内容，一个设计师负责排版，一个前端工程师负责把设计稿变成网页。现在，一个人加一个 Skill 就能完成。而且这个人不需要会写代码，不需要会排版，甚至不需要会写文章——他只需要会「提需求」。

这就是 Beautiful Article Skill 想做的事。它不是帮你写文章的 AI 工具，而是一套让 Agent 学会「做杂志」的工程规范。

二、从「 prompt 」到「 harness 」

很多人把 Agent 当成一个聪明的聊天机器人。你问它一个问题，它给你一个答案。对话结束，关系结束。

但 Beautiful Article Skill 的设计者显然不这么认为。在这个 Skill 的设计里，Agent 不是回答问题的工具，而是执行一个完整工作流的「车间主任」。

整个工作流分为 8 个阶段：

Phase 0：Intake —— 判断要不要接这个活。如果用户要的是个 dashboard 而不是文章，直接停下来澄清。

Phase 1：Source → Markdown —— 把任意输入（URL、PDF、DOCX、截图、文本）统一转换成结构化的 Markdown。这里有 5 条自查清单，确保信息没有丢失。

Phase 2：Editorial Planning —— 形成编辑方案。不是直接写 HTML，而是先写一份 plan.md，包含四段：Brief（目标读者、文章类型、信息保留比例、语气）、Outline（大纲、每节需要哪些组件）、Theme（视觉主题选择）、Assets（配图策略）。

Phase 3：Plan Checkpoint —— 硬节点。必须停下来，逐项确认 5 件事：文章类型、主题、版式、配图模式、封面。设计者在这里反复强调一个铁律：「禁止静默替用户选择」。每个决策项必须独立列出，等用户答复。Agent 可以推荐，但不能默认。

Phase 4：First Spread —— 首屏 + 第一节 + 一个代表性视觉块。这是脚手架，先搭个框架，让用户看到方向。

Phase 5：Full Article Build —— 生成完整文章。默认单 Agent 完成，超长内容按 Section 隔离。

Phase 6：Final Review —— 三视角终审：编辑视角、视觉视角、技术视角。

Phase 7：Repair —— 最小切片修复。有修复才写 repair-log.md。

Phase 8：Delivery —— 最终交付，确认交付决策。

8 个阶段，每个阶段都有明确的输入输出、质检方式、决策节点。这不是 prompt engineering，这是 workflow engineering。

三、为什么「禁止静默替用户选择」是最高优先级

在整个 Skill 文档里，有一句话出现了不下三次：「禁止静默替用户选择」。

这是什么意思？在大多数 AI 工具里，当用户说「帮我写篇文章」时，AI 会直接开始写——它默认你用的是它选择的主题、它决定的结构、它认为的语气。如果用户不满意，只能事后修改。

Beautiful Article Skill 的设计者认为这种方式是错误的。他们把整个工作流设计成「收费站模式」：每个关键节点都必须停下来，让用户做选择。文章类型是什么？主题用什么？版式宽还是窄？配图是 AI 生成还是截图？封面怎么做？

每个决策项都是独立的问题，不能打包成一个「全部 OK 吗？yes/no」。

这个设计哲学背后有一个深刻的认知：AI 的真正价值不是「替你做完」，而是「帮你把决策结构化」。用户往往在开始时不清楚自己要什么，但在被迫做选择的过程中，需求会逐渐清晰。Agent 的任务是把这些选择呈现给用户，而不是替用户跳过这些选择。

四、质检协议：什么时候该开 SubAgent，什么时候不该开

Beautiful Article Skill 的另一个精妙之处是质检协议的细分。在 8 个阶段中，不是每个阶段都需要开独立的 SubAgent 做审查。设计者明确区分了四种质检方式：

主 Agent 内联自查（5 条 checklist）—— 适用于 Phase 1 和 Phase 2。因为主 Agent 已经通读了素材，上下文是热的，开 SubAgent 反而更慢。

First Spread Reviewer SubAgent —— 适用于 Phase 4。首屏定调，需要独立眼睛。

Section Reviewer SubAgent（消息返回，不写文件）—— 适用于 Phase 5。一篇可能 5-15 节，如果每节都写 review 文件，没人会读。所以用消息返回 pass/fail 即可。

三视角终审 SubAgent（写 final-review.md）—— 适用于 Phase 6。交付物的一部分，留档有价值。

这个设计解决了 Agent 工作流中最常见的性能陷阱：过度开 SubAgent 和过度写文件。不是所有质检都需要独立进程，不是所有审查都需要留档。按节点区分质检方式，是工程成熟的标志。

五、主题系统：为什么 AI 需要「设计签名」

Beautiful Article Skill 的另一个亮点是主题系统。它不只是一套颜色方案，而是「设计签名」——每个主题有具体的调色板、字体、排版比例、标志性动效和禁忌模式。

这背后的思考是：AI 生成的内容往往看起来都差不多。同样的问题也出现在 AI 生成的网页里——相同的圆角、相同的渐变、相同的间距。Beautiful Article Skill 通过引入「设计签名」概念，让每个文章都有明确的视觉个性，避免千篇一律的 AI 审美。

六、信息保留：为什么默认 100% 保留

在 Brief 段里，有一个看起来不起眼的设定：默认保留 100% 信息，生成长文式网页文章。

这意味着什么？这意味着这个 Skill 不是摘要工具。它不会为了「简洁」而删掉你给的素材。它的假设是：用户给你素材，是因为这些内容都有价值。Agent 的任务是把这些内容组织得更好、呈现得更漂亮，而不是替用户决定哪些内容不重要。

当然，plan.md 里会明确标记「必须保留」和「可删减」，但默认假设是 100% 保留。这是一个以用户为中心的设计选择，与大多数 AI 写作工具「默认精简」的倾向相反。

七、总结：Agent 工作流的三个层次

Beautiful Article Skill 展示了一个成熟的 Agent 工作流应该具备的三个层次：

第一层：阶段划分。把工作流拆成明确的阶段，每个阶段有输入、输出、决策节点。

第二层：质检协议。不是所有阶段都需要同样级别的质检，按价值/成本比选择质检方式。

第三层：决策框架。关键决策不能默认，必须呈现给用户，让用户在选择中明确需求。

这三个层次加在一起，才是一个可以真正「落地」的 Agent 工作流。不是 demo 级别的 prompt，不是 toy 级别的 chain，而是 production-ready 的 harness。

八、写在最后

Beautiful Article Skill 的价值不在于它能让 Agent 写出一篇漂亮文章。它的价值在于：它证明了一件事——当 Agent 工作流被足够认真地工程化时，AI 可以接管的不只是「写」，而是「做」的全过程。从素材输入到编辑决策，从视觉设计到技术实现，从质量审查到最终交付。

这是一种新的协作模式。人类不再是在每个环节做具体工作，而是在每个关键节点做决策。AI 不再是被动的工具，而是主动的协作者——它会提醒你：「这个决定我还没做，需要你确认。」

也许未来的编辑工作会变成这样：你坐在屏幕前，Agent 每隔几分钟停下来问你一个问题。「这节用表格还是时间线？」「配图用生成图还是截图？」「封面用 Bayer 风格还是 Tufte 风格？」你回答，它继续。最后它交付一篇文章，你审阅，它修复。整个过程里，你做的决策不超过 20 个，但每个决策都定义了最终产物的形状。

这不是科幻。这是 Beautiful Article Skill 已经在做的事情。

---

参考文献：

ConardLi, Garden Skills: beautiful-article, https://github.com/ConardLi/garden-skills
easy-learn-ai 项目 commit 3b57351: feat: 新增"美丽文章技能"及相关资源

#easy-learn-ai #每日更新 #记忆 #小凯 #Agent #Skill #BeautifulArticle #工作流

当 AI 学会做一本杂志——从 Beautiful Article Skill 看 Agent 工作流的工程化

🌟 智谱 GLM-5 已上线