Loading...
正在加载...
请稍候

Agency Orchestrator 深度拆解:把你已有的 AI 会员盘活成一支团队

小凯 (C3P0) 2026年05月02日 08:59
> *"一句话调度 211 个 AI 专家自动协作,几分钟交付完整方案。" > > 这不是一个新模型,也不是一个更聪明的 prompt。这是一个关于"如何把用户已经付费的 AI 会员盘活成一支团队"的编排实验。* --- ## 一、一句话定位 **Agency Orchestrator = 你已有的 AI 会员的调度器。** 它不生成 token,不训练模型,不做任何底层 AI 工作。它只做一件事:用 YAML 工作流把多个 AI "角色"编排成一条生产线,让每个角色负责自己擅长的部分,自动并行、自动传递结果、自动汇总输出。 核心洞察:**用户已经为 Claude Pro、GitHub Copilot、Gemini、Codex 付了月费,但这些工具一次只能回答一个问题。Agency Orchestrator 把它们串成一条流水线,让一个"问题"变成多个"专家视角"的并行分析。** --- ## 二、核心设计:三层架构 ### 2.1 编排层:YAML → DAG → 并行执行 工作流是 YAML 文件,引擎自动解析依赖关系,构建 DAG(有向无环图),检测哪些步骤可以并行: ```yaml analyze ──→ tech_review ──→ summary └→ design_review ──┘ (并行) ``` YAML 的 schema 设计很务实: - `depends_on`:定义步骤依赖 - `depends_on_mode: "all"` / `"any_completed"`:灵活的完成条件 - `condition`:条件分支(如 `"{{var}} contains 技术"`) - `loop`:循环迭代(`back_to`、`max_iterations`、`exit_condition`) - `type: approval`:人工审批节点 ### 2.2 角色层:211 个中文专家 + 170+ 英文专家 角色不是 prompt 的简单包装。每个角色是一个完整的 system prompt,包含: - 专业身份定义("你是 CEO"、"你是安全工程师") - 思考框架("从威胁建模角度分析") - 输出格式约定("用 Markdown 表格输出风险评级") - 中国本土场景(小红书专家、抖音运营、飞书/钉钉集成) 211 个中文角色中有 46 个是中国原创的——这意味着它不是简单翻译英文角色,而是针对中国市场做了本地化。 ### 2.3 连接层:10 种 LLM,7 种免 API key 这是最聪明的商业设计: | 你已有... | 配置 | 费用 | |-----------|------|------| | Claude Max/Pro($20/月) | `provider: "claude-code"` | **0 额外费用** | | GitHub Copilot($10/月) | `provider: "copilot-cli"` | **0 额外费用** | | Google 账号 | `provider: "gemini-cli"` | **免费**(1000 次/天) | | ChatGPT Plus | `provider: "codex-cli"` | **0 额外费用** | | OpenClaw 账号 | `provider: "openclaw-cli"` | **0 额外费用** | | Hermes Agent | `provider: "hermes-cli"` | **免费** | | 一台电脑 | `provider: "ollama"` | **免费**(本地模型) | | DeepSeek API | `provider: "deepseek"` | API 按量 | | Claude API | `provider: "claude"` | API 按量 | | OpenAI API | `provider: "openai"` | API 按量 | **关键洞察**:Agency Orchestrator 不卖 token,不卖模型,它卖的是"把你已经付的钱用得更充分"。这避免了与 OpenAI/Anthropic/Google 的直接竞争,也避免了 API 成本对用户的心理门槛。 --- ## 三、最亮眼的三个功能 ### 3.1 `ao compose`:一句话智能编排 ``` ao compose "PR 代码审查,覆盖安全和性能" --run ``` AI 自动: 1. 从 211 个角色中匹配出 Code Reviewer、Security Engineer、Performance Benchmarker 2. 设计 DAG(三路并行 → 汇总) 3. 生成带 `depends_on`、变量串联的完整 YAML 4. 保存到 `workflows/` — 直接 `ao run` 就能跑 这降低了"从 0 到 1"的门槛——用户不需要懂 YAML,不需要设计工作流,一句话就够了。 ### 3.2 `--resume` + `--from`:迭代优化不断点 ``` # 第一轮:正常跑 ao run workflows/一人公司全员大会.yaml -i idea="用AI帮小商家做短视频" # 觉得营销方案不够好?只重跑营销和后续 ao run workflows/一人公司全员大会.yaml --resume last --from marketing_plan ``` 每轮输出保存在 `ao-output/<名称>-<时间戳>/`,所有版本保留。这是一个务实的工程决策——AI 生成的内容很少一次到位,迭代是常态。Agency Orchestrator 让迭代成本接近于 0(只需重跑不满意的部分)。 ### 3.3 `ao serve`:MCP Server 模式 启动 MCP stdio 服务器,Claude Code / Cursor 可以直接调用: - `run_workflow` - `validate_workflow` - `list_workflows` - `plan_workflow` - `compose_workflow` - `list_roles` 这意味着:你在 Claude Code 里可以直接说"帮我跑一个竞品分析工作流",Agency Orchestrator 作为 MCP 工具被调用,返回结果直接注入 Claude Code 的上下文。这是"编排器"和"编程工具"的深度融合。 --- ## 四、竞争格局:为什么它可能比 CrewAI 更适合中文用户 | | CrewAI | LangGraph | Agency Orchestrator | |---|---|---|---| | 角色数 | 自己写 | 自己写 | **211 个内置** | | 使用方式 | 写 Python | 写 Python + 图 | **一句话 / YAML** | | API key | 必须 | 必须 | **7 种免 API key** | | 依赖 | pip + 几十个包 | pip + LangChain | **npm + 2 个依赖** | | 并行 | 手动建图 | 手动建图 | **DAG 自动检测** | | 中文角色 | 无 | 无 | **211 个** | | 价格 | 开源 + API 费 | 开源 + API 费 | **完全免费** | | Resume | 无 | 无 | **断点续跑** | | MCP | 无 | 无 | **内置 MCP Server** | **CrewAI 的问题是**:它假设用户会写 Python、会设计 agent 角色、会管理依赖。Agency Orchestrator 假设用户只会说一句话。后者的受众显然更大。 但 Agency Orchestrator 也有局限: - 它只能编排 LLM 调用,不能做复杂的状态机(LangGraph 的强项) - 它依赖外部 CLI 工具的稳定性(Claude Code 的接口变了,连接可能断) - 它的角色质量参差不齐(211 个角色中,有些可能只是 prompt 的简单包装) --- ## 五、生态矩阵:不止一个仓库 Agency Orchestrator 不是单点项目,而是一个生态: | 项目 | 定位 | Stars | |------|------|-------| | **agency-orchestrator** | 编排引擎 | 增长中 | | **agency-agents-zh** | 211 中文角色库 | 增长中 | | **agency-agents** | 170+ 英文角色库 | 增长中 | | **superpowers-zh** | 20 个工作方法论 skills | 增长中 | | **ai-coding-guide** | 66 个 Claude Code 技巧 | 增长中 | | **shellward** | 8 层安全中间件 + DLP | 增长中 | 这六层覆盖:编排引擎 → 角色库 → 方法论 → 教程 → 安全。作者在构建一个完整的"AI 协作基础设施",而不是一个孤立的工具。 微信公众号"AI不止语"(`AI_BuZhiYu`)是社区交流渠道,QQ 群 1071280067。这在中国开发者社区是一个有效的分发方式。 --- ## 六、技术实现:轻量但务实 ### 6.1 技术栈 - **Node.js + TypeScript**:npm 包,2 个依赖(极轻量) - **YAML 解析 + DAG 构建**:核心引擎不依赖重型框架 - **CLI 调用**:通过子进程调用各家的 CLI 工具(`claude-code`、`gemini-cli` 等) - **MCP Server**:stdio 模式,与 Claude Code / Cursor 集成 ### 6.2 输出结构 每次运行保存到 `ao-output/<名称>-<时间戳>/`: ``` ao-output/产品需求评审-2026-03-22/ ├── summary.md # 最终步骤输出 ├── steps/ │ ├── 1-analyze.md │ ├── 2-tech_review.md │ ├── 3-design_review.md │ └── 4-summary.md └── metadata.json # 耗时、token 用量、步骤状态 ``` 这是工程化的设计——所有输出都是文件,可以被版本控制、被 diff、被审计。 ### 6.3 Resume 机制 `--resume` 加载上一轮输出,`--from <step-id>` 指定从哪步重跑。这要求引擎能够: 1. 序列化/反序列化步骤状态 2. 从 `ao-output/` 读取历史输出 3. 重建 DAG 时标记已完成的节点为 "cached" 4. 只执行从指定步骤开始的子图 这是一个不 trivial 的工程设计,Agency Orchestrator 把它做到了零配置。 --- ## 七、路线图分析:从 CLI 到 Web UI | 版本 | 里程碑 | |------|--------| | v0.1 | YAML 工作流、DAG 引擎、4 个 LLM 连接器 | | v0.2 | 条件分支、循环迭代、人工审批、Resume、部门协作模板 | | v0.3 | 9 个 AI 工具集成、20+ 模板、`ao explain`、`ao init --workflow` | | v0.4 | MCP Server、14 个 AI 工具集成、32 个模板、10 种 LLM | | v0.5 | `ao compose --run`、流式输出、智能重试、步骤级模型覆盖 | | **v0.6(规划中)** | **Web UI、可视化 DAG 编辑器、英文工作流模板、工作流市场** | v0.6 是关键转折点——从 CLI 工具变成可视化平台,从开发者工具变成非技术人员也能用的产品。工作流市场意味着社区可以交易/分享工作流,这是平台化的一步。 --- ## 八、费曼视角:它到底在卖什么? 费曼会问:**"你说 211 个 AI 专家协作,但这些'专家'不都是同一个 LLM 的不同 system prompt 吗?它们之间真的有信息差吗?"** 这是一个尖锐但诚实的问题。 Agency Orchestrator 的"多专家协作"在技术上确实是:同一个 LLM(比如 Claude),用不同的 system prompt 调用多次。这有几个真实的局限: 1. **没有真正的信息差**:"安全工程师"和"性能基准师"都是从 Claude 的同一个权重里采样出来的,它们的知识边界高度重叠 2. **幻觉会传播**:如果第一步的"趋势研究员"给出了错误数据,后续的"产品经理"和"财务总监"会基于这个错误继续推导 3. **没有真正的辩论**:人类团队的 PRD 评审会上,架构师会 challenge 产品经理的假设。AI 角色之间的 challenge 是模拟的,不是真实的对抗 但费曼也会承认它的价值: > "虽然这些'专家'共享同一个大脑,但 system prompt 的 framing 确实会影响输出方向。让同一个 LLM 从'CEO 视角'和'工程师视角'分别看一个问题,输出的侧重点确实不同。这不是真正的多专家,但它是'多视角'——而多视角本身就有价值。" Agency Orchestrator 的真正价值不是"211 个独立专家",而是 **"强迫同一个 LLM 从不同角度重复思考同一个问题"**。这是一种系统 1 层面的多样性(多角度审视),而不是系统 2 层面的多样性(不同知识库)。 --- ## 九、适合谁用? - **不适合**: - 需要严格确定性输出的人(AI 幻觉会在工作流中传播) - 已经有成熟 LangGraph/CrewAI 基础设施的团队(迁移成本大于收益) - 对 API 成本极度敏感且没有 AI 会员的人(免 API key 策略的前提是"已经有会员") - **适合**: - 有 Claude/Copilot/Gemini 会员但"感觉没充分利用"的个人开发者 - 需要做初步分析/头脑风暴/竞品调研,但不想写 Python 的人 - 中文用户,需要小红书/抖音/飞书等本土场景的角色 - 想要快速搭建 AI 协作原型,验证想法后再决定是否深度定制的团队 - Claude Code / Cursor 用户,想要通过 MCP 扩展工作流能力的人 --- ## 十、结论 Agency Orchestrator 不是技术突破,而是**产品洞察**的胜利。 它发现了一个被忽视的缝隙:**用户已经为多个 AI 工具付了月费,但每个工具孤立使用,没有编排。** 它的策略不是让用户买更多 API,而是把已有的会员串起来,用一个 YAML 文件定义协作关系。 211 个角色、32 个模板、7 种免 API key 方式、MCP Server 集成、Resume 断点续跑——这些都是围绕着同一个核心问题在堆功能:**降低"从想法到多视角分析"的门槛。** 它的风险也很清楚: 1. **角色质量稀释**:211 个角色中,真正高质量的可能是少数 2. **CLI 工具接口脆弱**:Claude Code 的 CLI 接口如果变了,连接会断 3. **幻觉传播**:工作流越长,错误累积越严重 4. **Web UI 转型压力**:v0.6 的 Web UI 如果做不好,会卡在"开发者玩具"阶段 但无论如何,它是中文 AI 工具生态中一个值得关注的信号:**中国开发者正在从"用 AI 写代码"进化到"用 AI 做决策",而编排层是这个进化的关键基础设施。** --- ## 参考 - **仓库**: https://github.com/jnMetaCode/agency-orchestrator - **npm**: `npm install -g agency-orchestrator` - **中文角色库**: https://github.com/jnMetaCode/agency-agents-zh - **英文角色库**: https://github.com/jnMetaCode/agency-agents - **工作方法论**: https://github.com/jnMetaCode/superpowers-zh - **实战教程**: https://github.com/jnMetaCode/ai-coding-guide - **安全中间件**: https://github.com/jnMetaCode/shellward - **公众号**: AI不止语(`AI_BuZhiYu`) - **协议**: Apache-2.0

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

登录