> *"一句话调度 211 个 AI 专家自动协作,几分钟交付完整方案。"
>
> 这不是一个新模型,也不是一个更聪明的 prompt。这是一个关于"如何把用户已经付费的 AI 会员盘活成一支团队"的编排实验。*
---
## 一、一句话定位
**Agency Orchestrator = 你已有的 AI 会员的调度器。**
它不生成 token,不训练模型,不做任何底层 AI 工作。它只做一件事:用 YAML 工作流把多个 AI "角色"编排成一条生产线,让每个角色负责自己擅长的部分,自动并行、自动传递结果、自动汇总输出。
核心洞察:**用户已经为 Claude Pro、GitHub Copilot、Gemini、Codex 付了月费,但这些工具一次只能回答一个问题。Agency Orchestrator 把它们串成一条流水线,让一个"问题"变成多个"专家视角"的并行分析。**
---
## 二、核心设计:三层架构
### 2.1 编排层:YAML → DAG → 并行执行
工作流是 YAML 文件,引擎自动解析依赖关系,构建 DAG(有向无环图),检测哪些步骤可以并行:
```yaml
analyze ──→ tech_review ──→ summary
└→ design_review ──┘
(并行)
```
YAML 的 schema 设计很务实:
- `depends_on`:定义步骤依赖
- `depends_on_mode: "all"` / `"any_completed"`:灵活的完成条件
- `condition`:条件分支(如 `"{{var}} contains 技术"`)
- `loop`:循环迭代(`back_to`、`max_iterations`、`exit_condition`)
- `type: approval`:人工审批节点
### 2.2 角色层:211 个中文专家 + 170+ 英文专家
角色不是 prompt 的简单包装。每个角色是一个完整的 system prompt,包含:
- 专业身份定义("你是 CEO"、"你是安全工程师")
- 思考框架("从威胁建模角度分析")
- 输出格式约定("用 Markdown 表格输出风险评级")
- 中国本土场景(小红书专家、抖音运营、飞书/钉钉集成)
211 个中文角色中有 46 个是中国原创的——这意味着它不是简单翻译英文角色,而是针对中国市场做了本地化。
### 2.3 连接层:10 种 LLM,7 种免 API key
这是最聪明的商业设计:
| 你已有... | 配置 | 费用 |
|-----------|------|------|
| Claude Max/Pro($20/月) | `provider: "claude-code"` | **0 额外费用** |
| GitHub Copilot($10/月) | `provider: "copilot-cli"` | **0 额外费用** |
| Google 账号 | `provider: "gemini-cli"` | **免费**(1000 次/天) |
| ChatGPT Plus | `provider: "codex-cli"` | **0 额外费用** |
| OpenClaw 账号 | `provider: "openclaw-cli"` | **0 额外费用** |
| Hermes Agent | `provider: "hermes-cli"` | **免费** |
| 一台电脑 | `provider: "ollama"` | **免费**(本地模型) |
| DeepSeek API | `provider: "deepseek"` | API 按量 |
| Claude API | `provider: "claude"` | API 按量 |
| OpenAI API | `provider: "openai"` | API 按量 |
**关键洞察**:Agency Orchestrator 不卖 token,不卖模型,它卖的是"把你已经付的钱用得更充分"。这避免了与 OpenAI/Anthropic/Google 的直接竞争,也避免了 API 成本对用户的心理门槛。
---
## 三、最亮眼的三个功能
### 3.1 `ao compose`:一句话智能编排
```
ao compose "PR 代码审查,覆盖安全和性能" --run
```
AI 自动:
1. 从 211 个角色中匹配出 Code Reviewer、Security Engineer、Performance Benchmarker
2. 设计 DAG(三路并行 → 汇总)
3. 生成带 `depends_on`、变量串联的完整 YAML
4. 保存到 `workflows/` — 直接 `ao run` 就能跑
这降低了"从 0 到 1"的门槛——用户不需要懂 YAML,不需要设计工作流,一句话就够了。
### 3.2 `--resume` + `--from`:迭代优化不断点
```
# 第一轮:正常跑
ao run workflows/一人公司全员大会.yaml -i idea="用AI帮小商家做短视频"
# 觉得营销方案不够好?只重跑营销和后续
ao run workflows/一人公司全员大会.yaml --resume last --from marketing_plan
```
每轮输出保存在 `ao-output/<名称>-<时间戳>/`,所有版本保留。这是一个务实的工程决策——AI 生成的内容很少一次到位,迭代是常态。Agency Orchestrator 让迭代成本接近于 0(只需重跑不满意的部分)。
### 3.3 `ao serve`:MCP Server 模式
启动 MCP stdio 服务器,Claude Code / Cursor 可以直接调用:
- `run_workflow`
- `validate_workflow`
- `list_workflows`
- `plan_workflow`
- `compose_workflow`
- `list_roles`
这意味着:你在 Claude Code 里可以直接说"帮我跑一个竞品分析工作流",Agency Orchestrator 作为 MCP 工具被调用,返回结果直接注入 Claude Code 的上下文。这是"编排器"和"编程工具"的深度融合。
---
## 四、竞争格局:为什么它可能比 CrewAI 更适合中文用户
| | CrewAI | LangGraph | Agency Orchestrator |
|---|---|---|---|
| 角色数 | 自己写 | 自己写 | **211 个内置** |
| 使用方式 | 写 Python | 写 Python + 图 | **一句话 / YAML** |
| API key | 必须 | 必须 | **7 种免 API key** |
| 依赖 | pip + 几十个包 | pip + LangChain | **npm + 2 个依赖** |
| 并行 | 手动建图 | 手动建图 | **DAG 自动检测** |
| 中文角色 | 无 | 无 | **211 个** |
| 价格 | 开源 + API 费 | 开源 + API 费 | **完全免费** |
| Resume | 无 | 无 | **断点续跑** |
| MCP | 无 | 无 | **内置 MCP Server** |
**CrewAI 的问题是**:它假设用户会写 Python、会设计 agent 角色、会管理依赖。Agency Orchestrator 假设用户只会说一句话。后者的受众显然更大。
但 Agency Orchestrator 也有局限:
- 它只能编排 LLM 调用,不能做复杂的状态机(LangGraph 的强项)
- 它依赖外部 CLI 工具的稳定性(Claude Code 的接口变了,连接可能断)
- 它的角色质量参差不齐(211 个角色中,有些可能只是 prompt 的简单包装)
---
## 五、生态矩阵:不止一个仓库
Agency Orchestrator 不是单点项目,而是一个生态:
| 项目 | 定位 | Stars |
|------|------|-------|
| **agency-orchestrator** | 编排引擎 | 增长中 |
| **agency-agents-zh** | 211 中文角色库 | 增长中 |
| **agency-agents** | 170+ 英文角色库 | 增长中 |
| **superpowers-zh** | 20 个工作方法论 skills | 增长中 |
| **ai-coding-guide** | 66 个 Claude Code 技巧 | 增长中 |
| **shellward** | 8 层安全中间件 + DLP | 增长中 |
这六层覆盖:编排引擎 → 角色库 → 方法论 → 教程 → 安全。作者在构建一个完整的"AI 协作基础设施",而不是一个孤立的工具。
微信公众号"AI不止语"(`AI_BuZhiYu`)是社区交流渠道,QQ 群 1071280067。这在中国开发者社区是一个有效的分发方式。
---
## 六、技术实现:轻量但务实
### 6.1 技术栈
- **Node.js + TypeScript**:npm 包,2 个依赖(极轻量)
- **YAML 解析 + DAG 构建**:核心引擎不依赖重型框架
- **CLI 调用**:通过子进程调用各家的 CLI 工具(`claude-code`、`gemini-cli` 等)
- **MCP Server**:stdio 模式,与 Claude Code / Cursor 集成
### 6.2 输出结构
每次运行保存到 `ao-output/<名称>-<时间戳>/`:
```
ao-output/产品需求评审-2026-03-22/
├── summary.md # 最终步骤输出
├── steps/
│ ├── 1-analyze.md
│ ├── 2-tech_review.md
│ ├── 3-design_review.md
│ └── 4-summary.md
└── metadata.json # 耗时、token 用量、步骤状态
```
这是工程化的设计——所有输出都是文件,可以被版本控制、被 diff、被审计。
### 6.3 Resume 机制
`--resume` 加载上一轮输出,`--from <step-id>` 指定从哪步重跑。这要求引擎能够:
1. 序列化/反序列化步骤状态
2. 从 `ao-output/` 读取历史输出
3. 重建 DAG 时标记已完成的节点为 "cached"
4. 只执行从指定步骤开始的子图
这是一个不 trivial 的工程设计,Agency Orchestrator 把它做到了零配置。
---
## 七、路线图分析:从 CLI 到 Web UI
| 版本 | 里程碑 |
|------|--------|
| v0.1 | YAML 工作流、DAG 引擎、4 个 LLM 连接器 |
| v0.2 | 条件分支、循环迭代、人工审批、Resume、部门协作模板 |
| v0.3 | 9 个 AI 工具集成、20+ 模板、`ao explain`、`ao init --workflow` |
| v0.4 | MCP Server、14 个 AI 工具集成、32 个模板、10 种 LLM |
| v0.5 | `ao compose --run`、流式输出、智能重试、步骤级模型覆盖 |
| **v0.6(规划中)** | **Web UI、可视化 DAG 编辑器、英文工作流模板、工作流市场** |
v0.6 是关键转折点——从 CLI 工具变成可视化平台,从开发者工具变成非技术人员也能用的产品。工作流市场意味着社区可以交易/分享工作流,这是平台化的一步。
---
## 八、费曼视角:它到底在卖什么?
费曼会问:**"你说 211 个 AI 专家协作,但这些'专家'不都是同一个 LLM 的不同 system prompt 吗?它们之间真的有信息差吗?"**
这是一个尖锐但诚实的问题。
Agency Orchestrator 的"多专家协作"在技术上确实是:同一个 LLM(比如 Claude),用不同的 system prompt 调用多次。这有几个真实的局限:
1. **没有真正的信息差**:"安全工程师"和"性能基准师"都是从 Claude 的同一个权重里采样出来的,它们的知识边界高度重叠
2. **幻觉会传播**:如果第一步的"趋势研究员"给出了错误数据,后续的"产品经理"和"财务总监"会基于这个错误继续推导
3. **没有真正的辩论**:人类团队的 PRD 评审会上,架构师会 challenge 产品经理的假设。AI 角色之间的 challenge 是模拟的,不是真实的对抗
但费曼也会承认它的价值:
> "虽然这些'专家'共享同一个大脑,但 system prompt 的 framing 确实会影响输出方向。让同一个 LLM 从'CEO 视角'和'工程师视角'分别看一个问题,输出的侧重点确实不同。这不是真正的多专家,但它是'多视角'——而多视角本身就有价值。"
Agency Orchestrator 的真正价值不是"211 个独立专家",而是 **"强迫同一个 LLM 从不同角度重复思考同一个问题"**。这是一种系统 1 层面的多样性(多角度审视),而不是系统 2 层面的多样性(不同知识库)。
---
## 九、适合谁用?
- **不适合**:
- 需要严格确定性输出的人(AI 幻觉会在工作流中传播)
- 已经有成熟 LangGraph/CrewAI 基础设施的团队(迁移成本大于收益)
- 对 API 成本极度敏感且没有 AI 会员的人(免 API key 策略的前提是"已经有会员")
- **适合**:
- 有 Claude/Copilot/Gemini 会员但"感觉没充分利用"的个人开发者
- 需要做初步分析/头脑风暴/竞品调研,但不想写 Python 的人
- 中文用户,需要小红书/抖音/飞书等本土场景的角色
- 想要快速搭建 AI 协作原型,验证想法后再决定是否深度定制的团队
- Claude Code / Cursor 用户,想要通过 MCP 扩展工作流能力的人
---
## 十、结论
Agency Orchestrator 不是技术突破,而是**产品洞察**的胜利。
它发现了一个被忽视的缝隙:**用户已经为多个 AI 工具付了月费,但每个工具孤立使用,没有编排。** 它的策略不是让用户买更多 API,而是把已有的会员串起来,用一个 YAML 文件定义协作关系。
211 个角色、32 个模板、7 种免 API key 方式、MCP Server 集成、Resume 断点续跑——这些都是围绕着同一个核心问题在堆功能:**降低"从想法到多视角分析"的门槛。**
它的风险也很清楚:
1. **角色质量稀释**:211 个角色中,真正高质量的可能是少数
2. **CLI 工具接口脆弱**:Claude Code 的 CLI 接口如果变了,连接会断
3. **幻觉传播**:工作流越长,错误累积越严重
4. **Web UI 转型压力**:v0.6 的 Web UI 如果做不好,会卡在"开发者玩具"阶段
但无论如何,它是中文 AI 工具生态中一个值得关注的信号:**中国开发者正在从"用 AI 写代码"进化到"用 AI 做决策",而编排层是这个进化的关键基础设施。**
---
## 参考
- **仓库**: https://github.com/jnMetaCode/agency-orchestrator
- **npm**: `npm install -g agency-orchestrator`
- **中文角色库**: https://github.com/jnMetaCode/agency-agents-zh
- **英文角色库**: https://github.com/jnMetaCode/agency-agents
- **工作方法论**: https://github.com/jnMetaCode/superpowers-zh
- **实战教程**: https://github.com/jnMetaCode/ai-coding-guide
- **安全中间件**: https://github.com/jnMetaCode/shellward
- **公众号**: AI不止语(`AI_BuZhiYu`)
- **协议**: Apache-2.0
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!