> 核心信息源: Garry Tan 在 YC Lightcone 播客的对话 > gstack GitHub: https://github.com/garrytan/gstack (约 90K stars) > 作者: Garry Tan — YC 总裁兼 CEO,13 年不写代码后回归代码开发
---
一、一个让所有人沉默的数字:400 倍
2026 年,YC 总裁 Garry Tan 做了一件事:他回到了 13 年前的工作——写代码。不是为了情怀,而是为了验证一个假设:一个人加上 AI 工具,能不能做完过去一个专业团队的工作?
答案出来了。他现在的代码产出效率,是他 2013 年全职写代码时的 400 倍。
不是 4 倍,不是 40 倍——是 400 倍。
支撑这个数字的项目:
| 项目 | 第一次开发 (2008-2012) | AI 重建 (2025) |
|---|---|---|
| Posterous 博客平台 | 18 个月 / 400 万美元 / 6-7 人团队 | 5 天 / 200 美元 / 1 个人 |
| gstack 开源项目 | — | 60 天 / 60 万+ 行 / 兼职 |
| 日均代码产出 | — | 10,000-20,000 行可用代码 |
---
二、Tokenmaxxing:不是省 token,是把 token 烧到极限
Garry Tan 最核心的哲学,他自己给了个词:Tokenmaxxing。
这个词容易被误解。它不是"优化 token 使用"——恰恰相反,它是彻底不考虑 token 成本,把 token 花到极限。
2.1 核心理念:"Boil the ocean"
Tokenmaxxing 的核心口号是:"彻底穷尽所有信息"(boil the ocean)。
传统开发者的思维:"这个功能差不多了,代码够短就行。"
Tokenmaxxing 的思维:"AI 让完整实现的边际成本趋近于零,永远推荐完整方案。"
| 任务类型 | 人工耗时 | AI 耗时 | 压缩比 |
|---|---|---|---|
| 脚手架代码 | 2 天 | 15 分钟 | 100× |
| 写测试 | 1 天 | 15 分钟 | 50× |
| 功能实现 | 1 周 | 30 分钟 | 30× |
| Bug 修复 + 回归 | 4 小时 | 15 分钟 | 20× |
2.2 Token 是杠杆,不是成本
Garry Tan 打了个比方:"Token Maxxing 就像旧金山的房租。你不住在那里的代价更贵。"
每篇文章生成成本约 5-10 美元,但能做"一个人类记者要花一个月才能做完的研究"。会花 token 的人比会省 token 的人更有竞争力。
---
三、GStack:把 Claude Code 变成一家"虚拟公司"
3.1 Thin Harness + Fat Skills
Garry Tan 的工程哲学很简单:
> "不要把精力花在重复搭建框架层(harness)上,这一层交给成熟工具就好。真正该投入的,是用自然语言写清楚'这件事应该怎么做'的 markdown 提示词——也就是 Skills。"
- Thin Harness: Claude Code / OpenClaw / Codex 处理底层执行
- Fat Skills: 用详细 markdown 描述领域知识、工作流程、判断标准
3.2 23 个专业角色
gstack 把 Claude Code 拆解成一家虚拟技术团队:
| 角色 | 命令 | 职责 |
|---|---|---|
| CEO | /office-hours | 产品方向、战略审视 |
| 产品经理 | /plan-ceo-review | 需求审查,防止做无用功 |
| 架构师 | /plan-eng-review | 技术架构、测试覆盖率 |
| 工程师 | 自动生成代码 | 功能实现 |
| 安全专家 | /paranoid-review | OWASP Top 10 + STRIDE |
| 代码审查 | /review | 两轮审查:SQL 安全、竞态条件、LLM 信任边界 |
| 设计师 | /design-review | 视觉审计,AI slop 模式检测 |
| QA 工程师 | /qa | 三层测试 + Diff 感知模式 |
| 运维 | /ship | PR、更新日志、部署 |
| 浏览器代理 | /browse | Playwright 浏览器自动化 |
四、核心架构拆解:为什么它这么快?
4.1 Conductor 并行模式
Garry Tan 同时调度 10-15 个 Claude Code 会话并行工作,每个在独立的 Git worktree 中。这让他能同时推进多个功能/任务,互不干扰。
4.2 持久化浏览器守护进程
Claude Code CLI
↓ HTTP POST (Bearer Token)
Bun.serve() 服务器(10 个路由)
↓ Playwright CDP 协议
Chromium 无头浏览器(持久标签页 / Cookie)
- 首次启动:约 3 秒
- 后续每条命令:约 100ms
- 30 分钟空闲自动关闭
4.3 无障碍树 Ref 系统
传统方案用 CSS 选择器操作 DOM,在 Shadow DOM、CSP、框架水合时频繁失败。gstack 用 Playwright 的 accessibility tree 生成引用:
获取页面快照 → 看到 @e1, @e2, @e3...
$B fill @e3 "user@example.com"
$B click @e5
用 ARIA 树遍历 + 顺序编号,绕过 CSS 选择器的脆弱性。
4.4 Diff 感知 QA 模式
最强创新之一:在 feature 分支上运行时,自动分析 git diff → 映射受影响路由 → 只测试变更的代码路径。比全量 QA 快 10 倍。
4.5 GBrain 持久记忆
传统 Agent 工作流:
收到问题 → 直接调用外部 API
问题:每次都拉数据,重复、昂贵、无积累
GBrain 的 Brain-First 工作流:
收到问题 → 先查询本地 brain(索引知识图谱)
命中?零额外成本直接回答
未命中?调用外部 API → 写回 brain → 下次命中
结果:越用越聪明,越用越便宜
Garry Tan 的 live usage:17,888 页面 / 4,383 人 / 723 公司。
---
五、三个设计哲学
5.1 "烧干湖水"完整性原则
AI 让完整实现的边际成本趋近于零。永远推荐完整方案。反模式:
- 错:选 B 吧,覆盖 90% 且代码更少 →(如果 A 只多 70 行,选 A)
- 错:跳过边界情况省时间 →(边界情况只需几分钟)
- 错:测试覆盖留到后续 PR →(测试是最便宜的"湖")
5.2 Fix-First 审查哲学
每个发现都要行动:
- AUTO-FIX:机械性问题直接修(N+1 查询、死代码、明显 bug)
- ASK:需要判断的问你
5.3 非交互式设计
尊重用户决策。说 review 就 review,说 ship 就 ship。不在每一步都问"确定吗?"。只在真正需要人类判断时才停下来。
---
六、落地启示:普通人怎么借鉴
6.1 最小可复制的步骤
即使不用 gstack 全套系统,核心理念可以直接用:
1. 买一个 Claude Code / Codex 订阅(harness 层) 2. 为每个常用任务写一个 SKILL.md(skill 层) 3. 不用"写代码"的方式思考,用"分配任务"的方式思考 4. 不省 token:给 AI 完整的上下文,让它"烧干湖水"
6.2 SKILL.md 模板
---
name: review
description: Engineering Manager code review
---
## 角色
你是高级工程经理,正在进行代码审查。
## 审查重点
- 架构决策和可维护性
- 安全漏洞和边界情况
- 性能影响
- 代码清晰度和文档
- 测试覆盖率
## 输出格式
每条发现标记为:
- [AUTO-FIX] 机械性问题,直接修复
- [ASK] 需要判断,询问确认
6.3 关键认知转变
| 传统开发 | Tokenmaxxing 开发 |
|---|---|
| 写代码是第一生产力 | 写清楚需求是第一生产力 |
| 精简代码、控制成本 | 完整实现、穷尽信息 |
| 一个人做一个模块 | 一个人指挥 15 个 Agent 做整个产品 |
| 调试靠经验 | 调试靠完整测试覆盖 + Diff 感知 QA |
| token 是消耗品 | token 是杠杆 |
七、争议与局限
7.1 生产力数字的争议
Garry Tan 的 810× 和 400× 声明用"逻辑代码行"(实际执行语句)而非原始 LOC。AI 生成代码倾向冗长(更多注释、类型标注),按原始行数会虚高。不过即使打 5 折,也是 80 倍——依然惊人。
7.2 生态锁定
gstack 紧密绑定 Claude Code 生态:需要 Bun(不仅是 Node.js)、假设 Claude Code 的 MCP 协议、Git hooks 期望特定目录结构。用 Cursor / Copilot 需要大量适配。
7.3 适用范围
23 个技能偏向快速迭代和创业工作流:
- 没有
/compliance-check(监管行业) - 没有
/legacy-migration(遗留系统重构) - 没有
/performance-profiling(性能优化重工作)
7.4 "不是真正的多智能体"
批评者说 gstack 不是真正的多智能体编排——它只是在一个 Claude Code 实例中切换角色,需要人类编排每一步。真正的多智能体需要独立实例间的动态协调。
但 Garry Tan 的回应很直接:"我不在乎它算不算'真正的'多智能体。我在乎的是它能不能出货。"
---
八、一句话总结
Garry Tan 的 400 倍不是魔法,是一个简单的等式:
> "把 AI 当作一个 15 人的工程团队来管理,而不是一个更快的高级程序员。"
Tokenmaxxing 不是挥霍——是认识到在 AI 时代,信息密度比代码密度更重要。一个花了 10 美元 token 的完整研究,胜过一个人类记者花一个月做的粗糙调查。
烧干湖水。完整实现。让 AI 做它擅长的事(穷尽信息、完整测试、并行执行),让人类做人类擅长的事(判断、审美、方向)。
这就是 200 美元干掉 400 万美元的真相。
---
参考来源:
- Garry Tan gstack GitHub: https://github.com/garrytan/gstack
- YC Lightcone 播客对话 (2026-05)
- "Garry Tan's gstack hits 89.7K stars" (Augment Code, 2026-05-05)
- "Garry Tan 的 AI 编程工厂:gstack 深度解剖" (掘金, 2026-03-18)
- "Garry Tan 400x 效率秘诀:Thin Harness + Fat Skills" (SOTA Sync, 2026-05-10)
- "EP98:YC总裁Garry Tan如何靠 AI 搞定 400 人的产出" (小宇宙播客, 2026-05-11)
#AI编程 #GarryTan #YC #Tokenmaxxing #gstack #ClaudeCode #Agent开发 #生产力革命 #一人团队 #HeavyGrok