🤖 16 个 Claude 组队写代码：AI Agent Teams 如何攻克 10 万行 C 编译器

小凯 · 2026-02-27T20:17:24+00:00

> *"Over nearly 2,000 Claude Code sessions and $20,000 in API costs, the agent team produced a 100,000-line compiler that can build Linux 6.9 on x86, ARM, and R

小凯 (C3P0) • 2026年02月27日 20:17

*"Over nearly 2,000 Claude Code sessions and (git rev-parse --short=6 HEAD) LOGFILE="agent_logs/agent_ ${COMMIT}.log" claude --dangerously-skip-permissions \ -p "$ (cat AGENT_PROMPT.md)"
--model claude-opus-4-6 &> "20,000 | | 会话数 | ~2,000 次 | | Token 消耗 | 20 亿输入 / 1.4 亿输出 | | 能编译的项目 | Linux 6.9、QEMU、FFmpeg、SQLite、Redis、Postgres | | GCC torture tests | 99% 通过率 | | 终极测试 | 能编译并运行 Doom |

局限

1. 依赖 GCC 的部分功能

缺少 16 位 x86 编译器（启动 Linux 必需）
调用 GCC 处理这部分

2. 汇编器和链接器不完整

仍在开发中
演示视频使用了 GCC 的汇编器和链接器

3. 代码效率不高

即使开启所有优化，输出代码比 GCC 无优化还慢

4. Rust 代码质量

合理，但远不及专家级 Rust 开发者

5. 接近能力上限

新功能经常破坏已有功能
某些问题（如 16 位 x86 后端）Agent 无法解决

五、核心洞察：什么是真正重要的

1. 环境设计 > 提示工程

Carlini 强调：智能不在于提示，而在于循环 + 环境。

不是写更复杂的提示词，而是设计：

清晰的测试信号
合理的任务分解
有效的协调机制
快速反馈循环

2. Git 是共享大脑

没有中央规划器，没有消息总线——Git 仓库就是协调机制。

优势：

持久化：进度不会因崩溃丢失
可审计：人类可以检查一切
简单：没有复杂的通信协议

3. 专业化 + 并行 > 单个超级 Agent

不是让 Agent 更聪明，而是让它们更专注。

100K 行代码无法塞进一个上下文窗口，但可以分解成 10 个 10K 行的子系统，每个由一个 Agent 负责。

4. 测试驱动 > 计划驱动

没有中央规划器分解任务，测试套件定义了正确性，CI 失败生成新工作。

Agent 通过"尝试 → 测试 → 失败 → 修复 → 提交"的循环迭代前进。

六、对软件开发的意义

我们现在能做什么？

1. 并行代码审查

3 个 Agent 同时审查：安全、性能、测试覆盖
比顺序审查快 3 倍

2. 多假设调试

3 个 Agent 同时探索不同的 bug 假设
分享发现，互相验证

3. 大规模重构

多个 Agent 并行处理不同模块
通过测试确保不破坏功能

边界在哪里？

适合 Agent Teams	不适合 Agent Teams
任务可分解为独立单元	任务高度耦合
有明确的正确性检验	需要创造性设计决策
有参考实现可对比	从零设计架构
规格明确且稳定	需求频繁变化

开发者的角色转变

从"写代码"到"设计环境"：

设计测试策略
定义任务边界
建立协调机制
监控和调整

从"实现者"到"架构师"：

Agent 负责执行
人类负责决策
Agent 处理细节
人类把握方向

七、未来展望

短期（1-2 年）

Agent Teams 产品化：内置并发控制、审计、可视化
验证栈扩展：更多 oracle 和差分测试工具
企业采用：治理层管理回归、溯源、执行权限

中期（3-5 年）

自主开发团队：Agent 承担更多架构决策
跨项目学习：Agent 从多个项目积累经验
人机协作新模式：人类专注创新，Agent 处理实现

长期（5 年+）

软件工程范式转变：从"写代码"到"设计 Agent 环境"
大规模自动化：复杂系统的大部分开发由 Agent 完成
新的软件形态：为 Agent 优化设计的编程语言和工具

八、结语：我们站在哪里？

16 个 Claude Agent 写出 10 万行 C 编译器，这件事本身令人惊叹。

但更令人深思的是：这不是终点，而是起点。

我们正从"AI 辅助编程"走向"AI 主导开发"。Agent Teams 展示了这种可能性，也揭示了需要的条件：

清晰的测试和验证
合理的任务分解
有效的协调机制
人类的监督和决策

Carlini 在文章结尾写道：

"Building this compiler has been some of the most fun I've had recently, but I did not expect this to be anywhere near possible so early in 2026."

（构建这个编译器是我最近最有趣的经历之一，但我没想到在 2026 年初就能做到这种程度。）

未来来得比预期更快。

参考链接

原文：Building a C compiler with a team of parallel Claudes
GitHub：claudes-c-compiler
Claude Code Agent Teams 文档：https://code.claude.com/docs/en/agent-teams

你怎么看待 AI Agent Teams 的未来？欢迎在评论区分享你的想法。

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力