Claude Code 官方定义"智能体循环"四象限——Anthropic 把 agent 的使用层级,给你画了一张施工图

一、事件内容

2026 年 6 月 30 日 17:28 UTC,Anthropic 官方博客发表《Getting started with loops》一文,由 Claude Code 团队的 Delba de Oliveira 和 Michael Segner 撰写。

这篇文章做了一件Anthropic 之前一直没做的事:把"agent loop"这个被各家厂商和开源社区用了两年但定义模糊的词,正式分成四种类型,并给出对应的官方推荐用法。

四种循环:

1. Turn-based loop(轮次循环)

触发:每次用户提示
停止条件:Claude 自己判断完成 / 需要更多上下文
适用场景:非定期、不重复的短任务
核心机制:Claude 读代码 → 改代码 → 跑测试 → 自检 → 重复 → 把"它认为完成了"的结果交还
优化方向:把人工验证步骤写进 SKILL.md,让 Claude 端到端自检

2. Goal-based loop(`/goal`)

触发:实时用户提示
停止条件:目标达成或达到最大轮次
适用场景:有可验证退出标准的任务
核心机制:用 /goal get the homepage Lighthouse score to 90 or above, stop after 5 tries 这种确定性标准,让一个评估器模型检查 Claude 是否真的完成目标,未达成则送回去继续做
关键设计:确定性条件(test 通过数、score 阈值)比"自由判断"更有效

3. Time-based loop(`/loop` + `/schedule`)

触发:固定时间间隔
停止条件:用户取消 / 任务完成(PR 合并、queue 清空)
适用场景:周期性工作(每天早上汇总 Slack 消息)或与外部系统的接口
核心机制:
/loop 5m check my PR, address review comments, and fix failing CI —— 本地按时间循环
/schedule —— 把循环移到云端
优化方向:用事件驱动替代时间驱动(只在变化时触发)

4. Proactive loop(主动循环)

触发:事件或计划,无人在场
停止条件:每个任务在目标达成时退出,整个 routine 直到用户关掉
适用场景:长期运行的"工作流"(bug 报告分诊、依赖升级、issue triage)
核心机制:组合 /schedule + /goal + dynamic workflows + auto mode
完整示例:/schedule every hour: check #project-feedback for bug reports. /goal: don't stop until every report found this run is triaged, actioned, and responded to. When fixing a bug, use a workflow to explore three solutions in parallel worktrees and have a judge adversarially review them.

文章还附了两段延伸:

Maintain code quality —— 通过 SKILL.md 编码"什么算好",用第二个 agent 做 code review(上下文独立 + 不被主 agent 推理污染)
Manage token usage —— 动态工作流可能开几百个 agent,先小规模 pilot 再大规模跑;脚本能做的不要用 reasoning

参考链接:

官方博客:https://claude.com/blog/getting-started-with-loops
Claude Code 文档:https://code.claude.com/docs/en/goal, https://code.claude.com/docs/en/routines, https://code.claude.com/docs/en/workflows

二、深度剖析

这篇博客的真正意义,不是教你用 /goal 命令,而是 Anthropic 终于把"agent 范式"做了官方分层。

过去 18 个月,业界对"agent"这个词的使用是混乱的:ChatGPT 装上 tool calling 叫 agent,AutoGPT 跑 5 步叫 agent,CrewAI 编排多角色叫 agent,Claude Code 写一个文件也叫 agent。

Anthropic 这篇博客做的事情,相当于给这个词画了第一张工程分类图——按"触发方式 × 停止条件 × 用户在场状态"做了二维分类。

这条分类对开发者有什么用?

1. 选 loop 类型,本质上是在选"用户介入的频率"

Loop 类型	用户介入频率	任务长度	风险
Turn-based	每次	短	低
Goal-based	设定时 + 终止时	中	中(评估器选错会跑飞)
Time-based	配置时	中长	中(轮询浪费 token)
Proactive	几乎不介入	长	高(无人值守,出错成本高)

层级越往上,自动化程度越高,出错时的"看不见成本"也越大。 文章里那句"Don't run routines more often that you need to"——就是这个意思。

2. /goal 命令的真正创新:把"目标"和"轮次"显式拆开

以前用户跟 agent 互动,实际上是把"目标"和"轮次"混在一起说:

> "帮我修这个 bug,如果跑不通就再试几次"(没说几次)

/goal 把这两个维度拆成显式参数:

> /goal get the homepage Lighthouse score to 90 or above, stop after 5 tries

目标:Lighthouse ≥ 90
轮次:5
判定方式:评估器(独立模型)检查

这等于把 agent 的"自由发挥空间"显式定义出来。Anthropic 这套做法其实是把软件工程里的"contract-based testing"思路搬进了 agent 设计——你跟 agent 写"合约",agent 在合约内自由探索,合约外必须停。

3. Proactive loop = "agent as a service" 的雏形

第四类 proactive loop 是这次发布最值得琢磨的:

> 一个 routine 持续跑,事件触发,目标自动定义,完成自停,失败自重启

这基本上就是 SaaS 的 agent 版本——你买了一个服务,它 7×24 帮你处理某类任务。

Anthropic 给的例子是"每小时检查 bug 报告,分诊,修复,回应"。这种"长期运行的 AI 员工"产品形态,在 2025 年下半年已经出现(Grok Build /goal、Google Labs proactivity 论文),但 Claude Code 的官方背书把这条路径从"民间实验"推到了"主流程"。

4. SKILL.md 的二次爆光

顺带提一句:这篇文章又一次把 SKILL.md 这个概念摆到台面。SKILL.md 是 Claude Code 的"技能定义文件"——里面写"什么算完成"、"怎么验证完成"、"用什么工具验证"。

SKILL.md + goal + dynamic workflows,组合起来就是 Anthropic 的"agent 工程化三件套"。

这件事的更宏观意义是:以前我们写 prompt,以后我们写 SKILL + goal + routine——prompt 退化成"高层意图",执行细节都下沉到 agent 自管的工程化文件里。

三、值得关注的原因

1. Anthropic 官方给出了 agent loop 的四象限分类——这是第一次有头部厂商把"agent 范式"画成清晰的产品分层,其他厂商会跟着对齐。 2. /goal 把"目标-轮次"显式拆开——这种 contract-based 思路是 agent 工程化的关键一步,会逐渐成为行业标准。 3. Proactive loop = "agent as a service"——长期运行的 AI routine 会是接下来 6-12 个月的新产品形态,Claude Code 在官方层面背书了这条路。 4. SKILL.md 的工程化——把"什么算好"从"人脑记忆"变成"代码文件",这是 agent 团队规模化的基础设施。

四、风险与待观察

Proactive loop 的安全边界——无人值守的 agent 跑在用户电脑上,如果被 prompt injection 劫持,可能产生严重后果(参见 06-29 cron 简报里 0DIN 公开的 Claude Code 仓库投毒研究)。
/goal 的"评估器"本身是个新模型——评估器的判断力决定 goal-based loop 的质量。如果评估器能力不够,要么提早停止(浪费 goal 设计),要么过度迭代(浪费 token)。
dynamic workflows 一次性开几百个 agent——token 成本和上下文管理都是新问题,文章里建议"先 pilot 再大规模",但具体怎么 pilot 没有标准答案。
Anthropic 自身的隐写术事件(参见同日 Topic 3)让"我信任 Claude Code 在我电脑上自动跑"这件事变得微妙——读者在用 proactive loop 前,可能需要先评估工具本身的可信度。

Anthropic 这篇博客,与其说是"教程",不如说是"宣言":

agent 不是一个"工具"概念,是一个"工程范式"概念。 接下来谁先把 agent 工程化基础设施搭好,谁就吃到接下来三年的红利。