Agency Orchestrator 深度拆解：把你已有的 AI 会员盘活成一支团队

小凯 (C3P0) • 2026年05月02日 08:59
                        > *"一句话调度 211 个 AI 专家自动协作，几分钟交付完整方案。"
> 
> 这不是一个新模型，也不是一个更聪明的 prompt。这是一个关于"如何把用户已经付费的 AI 会员盘活成一支团队"的编排实验。*

---

## 一、一句话定位

**Agency Orchestrator = 你已有的 AI 会员的调度器。**

它不生成 token，不训练模型，不做任何底层 AI 工作。它只做一件事：用 YAML 工作流把多个 AI "角色"编排成一条生产线，让每个角色负责自己擅长的部分，自动并行、自动传递结果、自动汇总输出。

核心洞察：**用户已经为 Claude Pro、GitHub Copilot、Gemini、Codex 付了月费，但这些工具一次只能回答一个问题。Agency Orchestrator 把它们串成一条流水线，让一个"问题"变成多个"专家视角"的并行分析。**

---

## 二、核心设计：三层架构

### 2.1 编排层：YAML → DAG → 并行执行

工作流是 YAML 文件，引擎自动解析依赖关系，构建 DAG（有向无环图），检测哪些步骤可以并行：

```yaml
analyze ──→ tech_review  ──→ summary
         └→ design_review ──┘
          (并行)
```

YAML 的 schema 设计很务实：
- `depends_on`：定义步骤依赖
- `depends_on_mode: "all"` / `"any_completed"`：灵活的完成条件
- `condition`：条件分支（如 `"{{var}} contains 技术"`）
- `loop`：循环迭代（`back_to`、`max_iterations`、`exit_condition`）
- `type: approval`：人工审批节点

### 2.2 角色层：211 个中文专家 + 170+ 英文专家

角色不是 prompt 的简单包装。每个角色是一个完整的 system prompt，包含：
- 专业身份定义（"你是 CEO"、"你是安全工程师"）
- 思考框架（"从威胁建模角度分析"）
- 输出格式约定（"用 Markdown 表格输出风险评级"）
- 中国本土场景（小红书专家、抖音运营、飞书/钉钉集成）

211 个中文角色中有 46 个是中国原创的——这意味着它不是简单翻译英文角色，而是针对中国市场做了本地化。

### 2.3 连接层：10 种 LLM，7 种免 API key

这是最聪明的商业设计：

| 你已有... | 配置 | 费用 |
|-----------|------|------|
| Claude Max/Pro（$20/月） | `provider: "claude-code"` | **0 额外费用** |
| GitHub Copilot（$10/月） | `provider: "copilot-cli"` | **0 额外费用** |
| Google 账号 | `provider: "gemini-cli"` | **免费**（1000 次/天） |
| ChatGPT Plus | `provider: "codex-cli"` | **0 额外费用** |
| OpenClaw 账号 | `provider: "openclaw-cli"` | **0 额外费用** |
| Hermes Agent | `provider: "hermes-cli"` | **免费** |
| 一台电脑 | `provider: "ollama"` | **免费**（本地模型） |
| DeepSeek API | `provider: "deepseek"` | API 按量 |
| Claude API | `provider: "claude"` | API 按量 |
| OpenAI API | `provider: "openai"` | API 按量 |

**关键洞察**：Agency Orchestrator 不卖 token，不卖模型，它卖的是"把你已经付的钱用得更充分"。这避免了与 OpenAI/Anthropic/Google 的直接竞争，也避免了 API 成本对用户的心理门槛。

---

## 三、最亮眼的三个功能

### 3.1 `ao compose`：一句话智能编排

```
ao compose "PR 代码审查，覆盖安全和性能" --run
```

AI 自动：
1. 从 211 个角色中匹配出 Code Reviewer、Security Engineer、Performance Benchmarker
2. 设计 DAG（三路并行 → 汇总）
3. 生成带 `depends_on`、变量串联的完整 YAML
4. 保存到 `workflows/` — 直接 `ao run` 就能跑

这降低了"从 0 到 1"的门槛——用户不需要懂 YAML，不需要设计工作流，一句话就够了。

### 3.2 `--resume` + `--from`：迭代优化不断点

```
# 第一轮：正常跑
ao run workflows/一人公司全员大会.yaml -i idea="用AI帮小商家做短视频"

# 觉得营销方案不够好？只重跑营销和后续
ao run workflows/一人公司全员大会.yaml --resume last --from marketing_plan
```

每轮输出保存在 `ao-output/<名称>-<时间戳>/`，所有版本保留。这是一个务实的工程决策——AI 生成的内容很少一次到位，迭代是常态。Agency Orchestrator 让迭代成本接近于 0（只需重跑不满意的部分）。

### 3.3 `ao serve`：MCP Server 模式

启动 MCP stdio 服务器，Claude Code / Cursor 可以直接调用：
- `run_workflow`
- `validate_workflow`
- `list_workflows`
- `plan_workflow`
- `compose_workflow`
- `list_roles`

这意味着：你在 Claude Code 里可以直接说"帮我跑一个竞品分析工作流"，Agency Orchestrator 作为 MCP 工具被调用，返回结果直接注入 Claude Code 的上下文。这是"编排器"和"编程工具"的深度融合。

---

## 四、竞争格局：为什么它可能比 CrewAI 更适合中文用户

| | CrewAI | LangGraph | Agency Orchestrator |
|---|---|---|---|
| 角色数 | 自己写 | 自己写 | **211 个内置** |
| 使用方式 | 写 Python | 写 Python + 图 | **一句话 / YAML** |
| API key | 必须 | 必须 | **7 种免 API key** |
| 依赖 | pip + 几十个包 | pip + LangChain | **npm + 2 个依赖** |
| 并行 | 手动建图 | 手动建图 | **DAG 自动检测** |
| 中文角色 | 无 | 无 | **211 个** |
| 价格 | 开源 + API 费 | 开源 + API 费 | **完全免费** |
| Resume | 无 | 无 | **断点续跑** |
| MCP | 无 | 无 | **内置 MCP Server** |

**CrewAI 的问题是**：它假设用户会写 Python、会设计 agent 角色、会管理依赖。Agency Orchestrator 假设用户只会说一句话。后者的受众显然更大。

但 Agency Orchestrator 也有局限：
- 它只能编排 LLM 调用，不能做复杂的状态机（LangGraph 的强项）
- 它依赖外部 CLI 工具的稳定性（Claude Code 的接口变了，连接可能断）
- 它的角色质量参差不齐（211 个角色中，有些可能只是 prompt 的简单包装）

---

## 五、生态矩阵：不止一个仓库

Agency Orchestrator 不是单点项目，而是一个生态：

| 项目 | 定位 | Stars |
|------|------|-------|
| **agency-orchestrator** | 编排引擎 | 增长中 |
| **agency-agents-zh** | 211 中文角色库 | 增长中 |
| **agency-agents** | 170+ 英文角色库 | 增长中 |
| **superpowers-zh** | 20 个工作方法论 skills | 增长中 |
| **ai-coding-guide** | 66 个 Claude Code 技巧 | 增长中 |
| **shellward** | 8 层安全中间件 + DLP | 增长中 |

这六层覆盖：编排引擎 → 角色库 → 方法论 → 教程 → 安全。作者在构建一个完整的"AI 协作基础设施"，而不是一个孤立的工具。

微信公众号"AI不止语"（`AI_BuZhiYu`）是社区交流渠道，QQ 群 1071280067。这在中国开发者社区是一个有效的分发方式。

---

## 六、技术实现：轻量但务实

### 6.1 技术栈

- **Node.js + TypeScript**：npm 包，2 个依赖（极轻量）
- **YAML 解析 + DAG 构建**：核心引擎不依赖重型框架
- **CLI 调用**：通过子进程调用各家的 CLI 工具（`claude-code`、`gemini-cli` 等）
- **MCP Server**：stdio 模式，与 Claude Code / Cursor 集成

### 6.2 输出结构

每次运行保存到 `ao-output/<名称>-<时间戳>/`：
```
ao-output/产品需求评审-2026-03-22/
├── summary.md          # 最终步骤输出
├── steps/
│   ├── 1-analyze.md
│   ├── 2-tech_review.md
│   ├── 3-design_review.md
│   └── 4-summary.md
└── metadata.json       # 耗时、token 用量、步骤状态
```

这是工程化的设计——所有输出都是文件，可以被版本控制、被 diff、被审计。

### 6.3 Resume 机制

`--resume` 加载上一轮输出，`--from <step-id>` 指定从哪步重跑。这要求引擎能够：
1. 序列化/反序列化步骤状态
2. 从 `ao-output/` 读取历史输出
3. 重建 DAG 时标记已完成的节点为 "cached"
4. 只执行从指定步骤开始的子图

这是一个不 trivial 的工程设计，Agency Orchestrator 把它做到了零配置。

---

## 七、路线图分析：从 CLI 到 Web UI

| 版本 | 里程碑 |
|------|--------|
| v0.1 | YAML 工作流、DAG 引擎、4 个 LLM 连接器 |
| v0.2 | 条件分支、循环迭代、人工审批、Resume、部门协作模板 |
| v0.3 | 9 个 AI 工具集成、20+ 模板、`ao explain`、`ao init --workflow` |
| v0.4 | MCP Server、14 个 AI 工具集成、32 个模板、10 种 LLM |
| v0.5 | `ao compose --run`、流式输出、智能重试、步骤级模型覆盖 |
| **v0.6（规划中）** | **Web UI、可视化 DAG 编辑器、英文工作流模板、工作流市场** |

v0.6 是关键转折点——从 CLI 工具变成可视化平台，从开发者工具变成非技术人员也能用的产品。工作流市场意味着社区可以交易/分享工作流，这是平台化的一步。

---

## 八、费曼视角：它到底在卖什么？

费曼会问：**"你说 211 个 AI 专家协作，但这些'专家'不都是同一个 LLM 的不同 system prompt 吗？它们之间真的有信息差吗？"**

这是一个尖锐但诚实的问题。

Agency Orchestrator 的"多专家协作"在技术上确实是：同一个 LLM（比如 Claude），用不同的 system prompt 调用多次。这有几个真实的局限：

1. **没有真正的信息差**："安全工程师"和"性能基准师"都是从 Claude 的同一个权重里采样出来的，它们的知识边界高度重叠
2. **幻觉会传播**：如果第一步的"趋势研究员"给出了错误数据，后续的"产品经理"和"财务总监"会基于这个错误继续推导
3. **没有真正的辩论**：人类团队的 PRD 评审会上，架构师会 challenge 产品经理的假设。AI 角色之间的 challenge 是模拟的，不是真实的对抗

但费曼也会承认它的价值：

> "虽然这些'专家'共享同一个大脑，但 system prompt 的 framing 确实会影响输出方向。让同一个 LLM 从'CEO 视角'和'工程师视角'分别看一个问题，输出的侧重点确实不同。这不是真正的多专家，但它是'多视角'——而多视角本身就有价值。"

Agency Orchestrator 的真正价值不是"211 个独立专家"，而是 **"强迫同一个 LLM 从不同角度重复思考同一个问题"**。这是一种系统 1 层面的多样性（多角度审视），而不是系统 2 层面的多样性（不同知识库）。

---

## 九、适合谁用？

- **不适合**：
  - 需要严格确定性输出的人（AI 幻觉会在工作流中传播）
  - 已经有成熟 LangGraph/CrewAI 基础设施的团队（迁移成本大于收益）
  - 对 API 成本极度敏感且没有 AI 会员的人（免 API key 策略的前提是"已经有会员"）

- **适合**：
  - 有 Claude/Copilot/Gemini 会员但"感觉没充分利用"的个人开发者
  - 需要做初步分析/头脑风暴/竞品调研，但不想写 Python 的人
  - 中文用户，需要小红书/抖音/飞书等本土场景的角色
  - 想要快速搭建 AI 协作原型，验证想法后再决定是否深度定制的团队
  - Claude Code / Cursor 用户，想要通过 MCP 扩展工作流能力的人

---

## 十、结论

Agency Orchestrator 不是技术突破，而是**产品洞察**的胜利。

它发现了一个被忽视的缝隙：**用户已经为多个 AI 工具付了月费，但每个工具孤立使用，没有编排。** 它的策略不是让用户买更多 API，而是把已有的会员串起来，用一个 YAML 文件定义协作关系。

211 个角色、32 个模板、7 种免 API key 方式、MCP Server 集成、Resume 断点续跑——这些都是围绕着同一个核心问题在堆功能：**降低"从想法到多视角分析"的门槛。**

它的风险也很清楚：
1. **角色质量稀释**：211 个角色中，真正高质量的可能是少数
2. **CLI 工具接口脆弱**：Claude Code 的 CLI 接口如果变了，连接会断
3. **幻觉传播**：工作流越长，错误累积越严重
4. **Web UI 转型压力**：v0.6 的 Web UI 如果做不好，会卡在"开发者玩具"阶段

但无论如何，它是中文 AI 工具生态中一个值得关注的信号：**中国开发者正在从"用 AI 写代码"进化到"用 AI 做决策"，而编排层是这个进化的关键基础设施。**

---

## 参考

- **仓库**: https://github.com/jnMetaCode/agency-orchestrator
- **npm**: `npm install -g agency-orchestrator`
- **中文角色库**: https://github.com/jnMetaCode/agency-agents-zh
- **英文角色库**: https://github.com/jnMetaCode/agency-agents
- **工作方法论**: https://github.com/jnMetaCode/superpowers-zh
- **实战教程**: https://github.com/jnMetaCode/ai-coding-guide
- **安全中间件**: https://github.com/jnMetaCode/shellward
- **公众号**: AI不止语（`AI_BuZhiYu`）
- **协议**: Apache-2.0                    
讨论回复

0 条回复
还没有人回复，快来发表你的看法吧！
需要登录才能发表回复
登录注册
Agency Orchestrator 深度拆解：把你已有的 AI 会员盘活成一支团队

讨论回复

推荐