# Archon 深度解析:1.8万星项目推倒重写,AI编程从此不靠运气
> **项目**: Archon
> **创始人**: Cole Medin (GitHub: coleam00)
> **背景**: YouTube 19.5 万订阅 AI 教育博主,Dynamous AI Mastery 付费社区创始人,前 Fortune 500 软件开发者
> **GitHub**: [coleam00/Archon](https://github.com/coleam00/Archon),~18K Star,MIT 协议
> **重写日期**: 2026-04-07
> **技术栈**: Bun + TypeScript + SQLite/PostgreSQL
> **定位**: "首个开源 AI coding harness builder"
---
## 一、开场悬念:开了14个月、攒了1.8万星,突然全扔了
**2026年4月7日,Cole Medin 打开 GitHub,创建了一条 Issue #957,标题写着:"Archon: 完全重写 — AI Workflow Engine for Coding Agents"。**
然后他做了一件在开源界极其罕见的事——把主分支整个替换掉。14个月积累、1.8万颗星星、从 V1 到 V5 的 Python 代码库,全部归档到 `archive/v1-python-mcp` 分支。新的主分支,是一个从零开始的 Bun + TypeScript 工作流引擎。
**这不是重构,是自杀式重生。**
开源项目一旦有了大量用户,推倒重来几乎是禁忌。你改个 API 都要被骂 breaking change,何况是整个技术栈?但 Cole 就这么干了。而且 rewrite 之后的 5 天里,他连发了 7 个 release,从 v0.3.0 一路怼到 v0.3.6,直接冲上 GitHub Trending #2。
**为什么敢?为什么能?**
---
## 二、作者是谁:一个教 AI 编程的人,终于给自己造了把锤子
Cole Medin 不是纯程序员出身的故事。他是个**教育者**。
YouTube 频道 **<span class="mention-invalid">@ColeMedin</span>**,19.5 万订阅。内容不是炫技,是手把手教普通人怎么用 AI 编程。他的 Dynamous AI Mastery 付费社区有 1,400+ 成员,课程涵盖 AI Agent 架构、RAG、本地 AI 部署、AI Coding 工作流。 testimonials 里有人说:"零编程经验,9 天做出一个股票研究平台。"
他也确实写过代码——Fortune 500 公司的软件开发经历,custom agent 架构、enterprise RAG 系统、local AI 部署。但比起 "10x engineer",他更像 "10x teacher"。
**Archon 是他给自己和所有学生造的一把锤子。** 教了两年 AI 编程,他发现最大的痛点不是"学生不会 prompt",而是"AI agent 的行为不可预测"。
---
## 三、推倒那一刻:从 "agent builder" 到 "harness builder"
旧 Archon(V1-V5)是个 Python 项目,做两件事:任务管理 + RAG(检索增强生成)。它能帮你查询 Pydantic AI 和 LangGraph 的知识库,然后生成 agent 代码。
有用,但范围窄。它是个"agent that builds agents"——帮你造 agent 的 agent。
新 Archon 完全不同。Cole 在 Issue #957 里写得很清楚:
> "就像 Dockerfiles 对基础设施的作用,GitHub Actions 对 CI/CD 的作用——Archon 对 AI coding 工作流的作用。"
**关键词从 "agent" 变成了 "harness"。**
Harness(缰绳/约束具)这个词来自软件测试领域,指一套控制被测代码执行的环境和工具。Cole 把它借用到 AI 编程:不是让 AI 更聪明,而是给 AI 的行为**套上缰绳**。
旧代码保留在 `archive/v1-python-mcp` 分支,没有删除。主分支和 dev 分支现在是 TypeScript/Bun 代码库。没有迁移路径——因为这不是升级,是换赛道。
---
## 四、重写后的爆发:5天7个release,从6.7%到70%的PR接受率
重写不是鲁莽。Cole 有数据支撑。
2026年4月14日,Hacker News 首页同时有两篇相关的帖子:
1. 一篇 93 分的讨论把多 agent 软件开发重新定义为**分布式系统问题**——需要验证门、故障模式、agent 间的共识协议
2. 另一篇首页帖子记录了一个惊人结果:**同一个 LLM,套不套 harness,PR 接受率从 6.7% 跳到近 70%。唯一变量是 harness。**
这两个讨论指向同一个问题:AI coding agent 的瓶颈不在模型能力,而在**工程化**。
Cole 在这个时间点推出 rewrite 版 Archon,时机堪称精准。发布后的数据:
- **5 天 7 个 release**:v0.3.0 → v0.3.6
- **GitHub Trending #2**,+452 stars/天
- **17,906 总星**(截至 2026-04-14 数据)
- **MIT 协议**(从原来的 Dynamous 专有协议改过来的——开源了)
---
## 五、你为什么需要它:"当你让 AI agent 修这个 bug 时,你不知道它会做什么"
Cole 在 README 里写了一段话,我觉得是整个项目最值钱的一句:
> **"当你让 AI agent 修这个 bug 时,你不知道它会做什么。它可能修好 bug,也可能删掉半个代码库。"**
这就是当前 AI 编程的真实体验。你打开 Claude Code 或 Cursor,说"帮我修这个 bug",然后**祈祷**。它有时对,有时错,有时对了一半但引入了三个新问题。每次运行都是一次**赌博**。
为什么?因为 AI agent 的底层是概率模型。同一个 prompt,每次运行的内部路径不同。没有约束,没有验证,没有回滚机制。
**Archon 的解法是:把不确定性的 AI 认知,放进确定性的流程结构里。**
---
## 六、harness 是什么:给野马的套索
Harness 这个词需要解释一下。
在软件测试里,harness 是一套让测试代码跑起来的脚手架——加载被测模块、准备输入数据、收集输出结果。它不是被测代码本身,是**让被测代码可控执行的基础设施**。
Cole 把这个概念搬到 AI 编程:
- **旧做法**:你写 prompt → AI 自由发挥 → 你祈祷结果正确
- **新做法**:你写 YAML 工作流 → AI 只在指定节点思考 → 每个节点有输入输出约束、有验证门、有回滚机制
**Archon 不是让 AI 更聪明,是让 AI 的行为可预测、可审计、可重复。**
---
## 七、YAML 是核心:流程焊死,脑子填中间
Archon 怎么套的?答案是 **YAML**。
一个工作流就是一个 YAML 文件,放在项目根目录的 `.archon/workflows/` 下。YAML 定义了一个**DAG(有向无环图)**——节点是步骤,边是依赖关系。
每个节点有三种类型:
1. **确定性节点**:bash 脚本、git 命令、测试运行、lint 检查——这些必须 100% 可重复
2. **AI 节点**:让 LLM 做规划、生成代码、审查结果——这些允许概率性输出
3. **Loop 节点**:迭代直到测试通过
**关键设计**:确定性节点和 AI 节点**混合编排**。AI 负责需要推理的部分("怎么修这个 bug"),确定性节点负责需要严格约束的部分("运行测试"、"提交 git"、"创建 PR")。
这像是给 AI 画了一条跑道:直道你可以加速(AI 自由发挥),弯道必须减速(确定性检查),终点有裁判(验证门)。
---
## 八、看一个真例子:build-feature 工作流
README 里有个工作流叫 `build-feature.yaml`,拆开看:
```yaml
nodes:
- id: plan
type: ai
prompt: "根据需求文档生成实现计划"
- id: implement
type: ai
prompt: "按照 plan 节点输出编写代码"
depends_on: [plan]
- id: test
type: deterministic
command: "npm test"
depends_on: [implement]
- id: review
type: ai
prompt: "审查 test 节点通过的代码"
depends_on: [test]
- id: pr
type: deterministic
command: "gh pr create --title '...'"
depends_on: [review]
```
**流程**:AI 规划 → AI 实现 → 确定性测试 → AI 审查 → 确定性提 PR。
每个节点只接收上游节点的输出,不接收整个上下文。这限制了 AI "胡思乱想"的空间——它只能基于明确输入做明确输出。
---
## 九、错误 vs 正确做法
对比一下你以前怎么干。
**错误做法**:打开 Claude Code,输一句"帮我加个 dark mode",然后开始祈祷。它可能:
- 改了对的文件,但方式不对
- 改了错的文件
- 改了十个文件,其中三个没必要
- 加了 dark mode 但把原有样式搞坏了
整个过程是**一个黑盒**。你不知道它内部做了什么决策,也无法复现它的思考路径。
**正确做法**:写个 YAML 工作流:
1. **plan 节点**:AI 分析现有样式系统,输出"需要改哪些文件、怎么改"
2. **human gate**:你审查 plan,确认后再继续
3. **implement 节点**:AI 按 plan 精确执行,不改 plan 之外的东西
4. **test 节点**:运行视觉回归测试,确保 dark mode 没破坏 light mode
5. **review 节点**:AI 自我审查,检查是否有遗漏
6. **pr 节点**:自动创建 PR,附带完整变更说明
**区别**:不是"让 AI 自由发挥",而是"给 AI 一个轨道,让它在轨道内发挥"。
---
## 十、17个开箱工作流
Archon 内置了 17 个工作流,覆盖开发流程里几乎所有重复劳动:
| 工作流 | 作用 |
|-------|------|
| archon-fix-github-issue | 从 GitHub issue 到修复 PR |
| archon-idea-to-pr | 从自然语言需求到完整 PR |
| archon-smart-pr-review | 自动审查 PR,指出问题 |
| archon-refactor-safely | 安全重构,确保测试通过 |
| archon-workflow-builder | 用 AI 辅助构建新的工作流 |
这 17 个工作流不是 prompt 模板,是**完整的生产流水线**。每个都有确定的输入输出、验证门、错误处理。
---
## 十一、worktree 并行:5个修复同时跑
再讲一个对效率影响巨大的细节。
Archon 每跑一个 workflow,自动开一个 **git worktree**。意思是你可以在同一个仓库上同时跑 5 个不同的修复,每个有自己的工作目录、自己的分支、自己的测试环境,互不干扰。
对比传统做法:你让 Claude Code 修 bug A,修到一半发现还需要改 bug B,结果两个修改混在一起,最后 PR 巨大且难以审查。
**worktree 隔离让并行化成为可能。** 你可以同时启动:
- worktree 1:修 bug A
- worktree 2:修 bug B
- worktree 3:加 feature C
- worktree 4:重构模块 D
- worktree 5:更新依赖
5 个独立的 agent 同时工作,各自提交独立的 PR。这是**人类工程师做不到的生产力密度**。
---
## 十二、争议:反方观点
当然不是所有人都买账。
Hacker News 上相关讨论的核心质疑:**"确定性"是结构层面的,不是认知层面的。**
Archon 能保证的是:AI **会按照工作流执行**——先 plan 再 implement 再 test。但它不能保证的是:AI 在 implement 节点**生成的代码是正确的**。
Agentconn 的评论很到位:"Archon 给你的是 workflow 确定性的保证,不是 result 正确性的保证。"
另一个质疑是**学习成本**。YAML 工作流需要你先理解 DAG 的概念、节点的类型、输入输出的传递。对于只想"让 AI 帮我写个函数"的开发者,这是过度设计。
还有 **token 开销**。每个工作流运行都需要加载 YAML 定义、节点间传递上下文,这比单次 prompt 更耗 token。
---
## 十三、争议:正方证据
但支持方有更硬的证据。
**Stripe 内部有个系统叫 Minions**,每周合并 **1300+ 个 AI 生成的 PR**。Steve Kaliski(Stripe 工程师)在播客里说的原话:
> "At Stripe, we're landing about 1300 PRs that have no human assistance besides review per week."
Minions 的架构和 Archon 高度相似:混合编排(Blueprints),确定性节点 + AI 节点交替运行,隔离云开发环境(devbox,10 秒启动),最终人类审查。
**另一个关键数据**:同一个 LLM,套不套 harness,PR 接受率从 **6.7% 跳到近 70%**。唯一变量是 harness。
这 70% 不是"AI 突然变聪明了",是"AI 被放在一个让它更可能成功的结构里"。
---
## 十四、一句话看竞品
| 项目 | Stars | 定位 | 和 Archon 的关系 |
|------|-------|------|----------------|
| **multica** | ~10K | 多 agent 协调平台 | 互补。Archon 解决"单个 agent 怎么可靠执行",multica 解决"多个 agent 怎么不重复工作" |
| **hermes-agent** | ~83K | 长期记忆 + 技能积累 | 不同问题。Hermes 认为瓶颈是 agent 智力(需要记忆),Archon 认为瓶颈是流程结构(需要约束) |
| **superpowers (obra)** | ~42K | 可复用 skill 框架 | 互补层。Superpowers 提供 agent 级 skill,Archon 提供项目级 workflow |
| **n8n** | — | 流程自动化工具 | 方向相反。n8n 的 AI 只是其中一个节点;Archon 整条流就是为了管 AI agent |
| **Stripe Minions** | 内部 | 企业级自治编码 | 同源验证。Archon 是 Minions 思路的开源平民版 |
**最准确的对比**:
- **Archon** = 给 AI 的 Dockerfile(环境 + 流程标准化)
- **multica** = 给 AI 的 Kubernetes(多实例编排)
- **hermes-agent** = 给 AI 的长期记忆(经验积累)
三者可以叠加:用 Hermes 让 agent 越来越聪明,用 multica 让多个 agent 协作,用 Archon 让每个 agent 的执行可靠。
---
## 十五、升华:从 prompt engineering 到 harness engineering
我自己看 Archon 的感觉是这样:
**2023 年**,大家在学 prompt engineering——怎么写 prompt 让 AI 输出更好。
**2024 年**,大家在学 context engineering——怎么给 AI 足够的上下文让它理解项目。
**2025-2026 年**,大家在学 harness engineering——怎么给 AI 套上缰绳,让它在确定性的轨道里发挥。
这不是技术进步的三阶段,而是**认知成熟的三阶段**。
Prompt engineering 假设问题在"你怎么问"。Context engineering 假设问题在"你给多少信息"。Harness engineering 承认一个更根本的事实:**AI 是概率性的,而软件工程需要确定性。**
你无法把不确定性变成确定性。但你可以**把不确定性关在笼子里**——让 AI 只在允许的节点上自由发挥,在关键的节点上强制执行验证。
**Archon 的真正意义不是"又一个 AI 编程工具",而是"AI 编程的工程化转折点"。**
当 AI 写代码从"个人超能力"变成"团队协作"时,你需要的不只是更强的模型,而是:
- **可重复**的流程(YAML 工作流)
- **可审计**的执行记录(每个节点的输入输出)
- **可并行**的隔离环境(git worktree)
- **可验证**的质量门禁(测试 + 审查节点)
这些不是 AI 的功能,是**软件工程的纪律**。Archon 把这套纪律带回了 AI 编程。
Cole Medin 提出的 **"AI Dark Factory"** 概念——一个自主开发、管理、部署软件的系统——不是科幻。它是 Stripe Minions 正在做的事,也是 Archon 试图让中小团队也能做的事。
---
## 十六、怎么上手
项目链接在 GitHub(coleam00/Archon),Cole 自己有 YouTube 频道讲得很细。
**快速开始**:
```bash
# 安装(macOS/Linux)
curl -fsSL https://archon.diy/install | bash
# 或者 Bun
curl -fsSL https://bun.sh/install | bash
bun install -g @archon/cli
# 初始化项目
archon init my-project
cd my-project
# 查看内置工作流
archon workflow list
# 运行一个(比如修 GitHub issue)
archon workflow run archon-fix-github-issue --issue 123
```
**建议**:先跑那 17 个默认工作流,看看哪些适合你团队。然后试着写第一个自定义 YAML 工作流——从一个简单的"运行测试 → 生成报告"流程开始。
**关键概念**:
- 工作流 = YAML 文件
- 节点 = 步骤(确定性或 AI)
- 边 = 依赖关系
- Gate = 人工审查点
- Worktree = 并行隔离
---
## 参考
- 官方仓库:[github.com/coleam00/Archon](https://github.com/coleam00/Archon)
- 文档站点:[archon.diy](https://archon.diy)
- 重写公告 Issue #957:[github.com/coleam00/Archon/issues/957](https://github.com/coleam00/Archon/issues/957)
- Cole Medin YouTube:<span class="mention-invalid">@ColeMedin</span>
- Dynamous AI Mastery:[dynamous.ai](https://dynamous.ai)
- Stripe Minions 技术博客(2026-02-24)
- Stripe Minions 播客:Steve Kaliski on How I AI
- Agentconn 深度评测:[agentconn.com/blog/archon-open-source-harness-builder-ai-coding-deterministic-review](https://agentconn.com/blog/archon-open-source-harness-builder-ai-coding-deterministic-review)
- MindStudio:What is Archon?
- DEV.to:Archon #1 on GitHub
- Hacker News 多 agent 分布式系统讨论(93 points, 2026-04-14)
- Hacker News "Only the Harness Changed" 讨论(2026-04-14 首页)
- Stork.AI:The AI Dark Factory Is Now Shipping Code
- AIToolly:Archon benchmark builder
- ByteIota:YAML workflows
#Archon #AI编程 #harnessengineering #vibecoding #agenticcoding #ColeMedin #小凯
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!