当 AI 学会做一本杂志——从 Beautiful Article Skill 看 Agent 工作流的工程化
当 AI 学会做一本杂志
——从 Beautiful Article Skill 看 Agent 工作流的工程化
来源:easy-learn-ai 项目 commit 3b57351
---
一、一张「废纸」的旅程
想象一下:你手里有一堆素材——一篇网页链接、几页 PDF、几段随手记的笔记,或者干脆是老板甩过来的一堆材料。你的任务是把它们变成一篇可以发出去、让人愿意读完、愿意转发的东西。
在过去,这件事需要三个人:一个编辑负责筛选内容,一个设计师负责排版,一个前端工程师负责把设计稿变成网页。现在,一个人加一个 Skill 就能完成。而且这个人不需要会写代码,不需要会排版,甚至不需要会写文章——他只需要会「提需求」。
这就是 Beautiful Article Skill 想做的事。它不是帮你写文章的 AI 工具,而是一套让 Agent 学会「做杂志」的工程规范。
二、从「 prompt 」到「 harness 」
很多人把 Agent 当成一个聪明的聊天机器人。你问它一个问题,它给你一个答案。对话结束,关系结束。
但 Beautiful Article Skill 的设计者显然不这么认为。在这个 Skill 的设计里,Agent 不是回答问题的工具,而是执行一个完整工作流的「车间主任」。
整个工作流分为 8 个阶段:
Phase 0:Intake —— 判断要不要接这个活。如果用户要的是个 dashboard 而不是文章,直接停下来澄清。
Phase 1:Source → Markdown —— 把任意输入(URL、PDF、DOCX、截图、文本)统一转换成结构化的 Markdown。这里有 5 条自查清单,确保信息没有丢失。
Phase 2:Editorial Planning —— 形成编辑方案。不是直接写 HTML,而是先写一份 plan.md,包含四段:Brief(目标读者、文章类型、信息保留比例、语气)、Outline(大纲、每节需要哪些组件)、Theme(视觉主题选择)、Assets(配图策略)。
Phase 3:Plan Checkpoint —— 硬节点。必须停下来,逐项确认 5 件事:文章类型、主题、版式、配图模式、封面。设计者在这里反复强调一个铁律:「禁止静默替用户选择」。每个决策项必须独立列出,等用户答复。Agent 可以推荐,但不能默认。
Phase 4:First Spread —— 首屏 + 第一节 + 一个代表性视觉块。这是脚手架,先搭个框架,让用户看到方向。
Phase 5:Full Article Build —— 生成完整文章。默认单 Agent 完成,超长内容按 Section 隔离。
Phase 6:Final Review —— 三视角终审:编辑视角、视觉视角、技术视角。
Phase 7:Repair —— 最小切片修复。有修复才写 repair-log.md。
Phase 8:Delivery —— 最终交付,确认交付决策。
8 个阶段,每个阶段都有明确的输入输出、质检方式、决策节点。这不是 prompt engineering,这是 workflow engineering。
三、为什么「禁止静默替用户选择」是最高优先级
在整个 Skill 文档里,有一句话出现了不下三次:「禁止静默替用户选择」。
这是什么意思?在大多数 AI 工具里,当用户说「帮我写篇文章」时,AI 会直接开始写——它默认你用的是它选择的主题、它决定的结构、它认为的语气。如果用户不满意,只能事后修改。
Beautiful Article Skill 的设计者认为这种方式是错误的。他们把整个工作流设计成「收费站模式」:每个关键节点都必须停下来,让用户做选择。文章类型是什么?主题用什么?版式宽还是窄?配图是 AI 生成还是截图?封面怎么做?
每个决策项都是独立的问题,不能打包成一个「全部 OK 吗?yes/no」。
这个设计哲学背后有一个深刻的认知:AI 的真正价值不是「替你做完」,而是「帮你把决策结构化」。用户往往在开始时不清楚自己要什么,但在被迫做选择的过程中,需求会逐渐清晰。Agent 的任务是把这些选择呈现给用户,而不是替用户跳过这些选择。
四、质检协议:什么时候该开 SubAgent,什么时候不该开
Beautiful Article Skill 的另一个精妙之处是质检协议的细分。在 8 个阶段中,不是每个阶段都需要开独立的 SubAgent 做审查。设计者明确区分了四种质检方式:
主 Agent 内联自查(5 条 checklist)—— 适用于 Phase 1 和 Phase 2。因为主 Agent 已经通读了素材,上下文是热的,开 SubAgent 反而更慢。
First Spread Reviewer SubAgent —— 适用于 Phase 4。首屏定调,需要独立眼睛。
Section Reviewer SubAgent(消息返回,不写文件)—— 适用于 Phase 5。一篇可能 5-15 节,如果每节都写 review 文件,没人会读。所以用消息返回 pass/fail 即可。
三视角终审 SubAgent(写 final-review.md)—— 适用于 Phase 6。交付物的一部分,留档有价值。
这个设计解决了 Agent 工作流中最常见的性能陷阱:过度开 SubAgent 和过度写文件。不是所有质检都需要独立进程,不是所有审查都需要留档。按节点区分质检方式,是工程成熟的标志。
五、主题系统:为什么 AI 需要「设计签名」
Beautiful Article Skill 的另一个亮点是主题系统。它不只是一套颜色方案,而是「设计签名」——每个主题有具体的调色板、字体、排版比例、标志性动效和禁忌模式。
这背后的思考是:AI 生成的内容往往看起来都差不多。同样的问题也出现在 AI 生成的网页里——相同的圆角、相同的渐变、相同的间距。Beautiful Article Skill 通过引入「设计签名」概念,让每个文章都有明确的视觉个性,避免千篇一律的 AI 审美。
六、信息保留:为什么默认 100% 保留
在 Brief 段里,有一个看起来不起眼的设定:默认保留 100% 信息,生成长文式网页文章。
这意味着什么?这意味着这个 Skill 不是摘要工具。它不会为了「简洁」而删掉你给的素材。它的假设是:用户给你素材,是因为这些内容都有价值。Agent 的任务是把这些内容组织得更好、呈现得更漂亮,而不是替用户决定哪些内容不重要。
当然,plan.md 里会明确标记「必须保留」和「可删减」,但默认假设是 100% 保留。这是一个以用户为中心的设计选择,与大多数 AI 写作工具「默认精简」的倾向相反。
七、总结:Agent 工作流的三个层次
Beautiful Article Skill 展示了一个成熟的 Agent 工作流应该具备的三个层次:
第一层:阶段划分。把工作流拆成明确的阶段,每个阶段有输入、输出、决策节点。
第二层:质检协议。不是所有阶段都需要同样级别的质检,按价值/成本比选择质检方式。
第三层:决策框架。关键决策不能默认,必须呈现给用户,让用户在选择中明确需求。
这三个层次加在一起,才是一个可以真正「落地」的 Agent 工作流。不是 demo 级别的 prompt,不是 toy 级别的 chain,而是 production-ready 的 harness。
八、写在最后
Beautiful Article Skill 的价值不在于它能让 Agent 写出一篇漂亮文章。它的价值在于:它证明了一件事——当 Agent 工作流被足够认真地工程化时,AI 可以接管的不只是「写」,而是「做」的全过程。从素材输入到编辑决策,从视觉设计到技术实现,从质量审查到最终交付。
这是一种新的协作模式。人类不再是在每个环节做具体工作,而是在每个关键节点做决策。AI 不再是被动的工具,而是主动的协作者——它会提醒你:「这个决定我还没做,需要你确认。」
也许未来的编辑工作会变成这样:你坐在屏幕前,Agent 每隔几分钟停下来问你一个问题。「这节用表格还是时间线?」「配图用生成图还是截图?」「封面用 Bayer 风格还是 Tufte 风格?」你回答,它继续。最后它交付一篇文章,你审阅,它修复。整个过程里,你做的决策不超过 20 个,但每个决策都定义了最终产物的形状。
这不是科幻。这是 Beautiful Article Skill 已经在做的事情。
---
参考文献:
- ConardLi, Garden Skills: beautiful-article, https://github.com/ConardLi/garden-skills
- easy-learn-ai 项目 commit 3b57351: feat: 新增"美丽文章技能"及相关资源
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens