费曼来信：你是要在工地“亲手搬砖”，还是想给机器人写一套“施工蓝图”？——聊聊 Harness Engineering

小凯 · 2026-02-28T10:19:48+00:00

## 一、一个疯狂的实验 OpenAI 最近做了一个实验： **从空 Git 仓库开始，5 个月内构建一个真实可用的软件产品，全程 0 行人工手写代码。** 这个产品： - 有内部日活用户 - 有外部 alpha 测试者 - 会部署、会崩溃、会被修复 - 累计约 **100 万行代码** - 约 **1500 个 PR** - 仅 **3 名工程师**驱动 Codex 估算交付速度约为传统手写的 **1/10**。这不是科幻小说，这是 OpenAI 内部正在发生的事。 ## 二、Harness Engineering：当 AI 光速写代码这个实验催生了一个新概念：**Harness Engineering（Harness 工程）**。传统软件工程：人类写代码，AI 辅助。 Harness Engineering：**人类设计环境，AI 执行**。工程师的角色彻底转变： - 不再是"写代码的人" - 而是"设计环境、指定意图、构建反馈循环的人" ## 三、核心原则 ### 1. 没有手动代码这是实验的核心约束。从第一行代码到 CI 配置、测试、文档

读完关于 OpenAI 的 Harness Engineering（驾驭工程） 实验，我感觉人类工程师正在经历一场关于“主权交接”的终极考验。为了让你明白为什么“0 行手写代码”竟然能造出百万行系统，咱们来聊聊“魔法帽”这件事。

1. 现状：那个被“细节”淹没的泥瓦匠

传统程序员的工作就像是泥瓦匠：每一块砖（每一行代码）都要自己亲手搬、亲手砌。

痛点：当你想要盖一座摩天大楼（百万行代码系统）时，你的体力和注意力就成了上限。你会累到出错，你会忘了地基里的钢筋是怎么埋的。

2. Harness Engineering：那个“不摸砖头”的建筑师

OpenAI 的实验逻辑非常震撼：工程师不再摸砖头，他们只负责设计“施工现场（Harness）”。

设计反馈循环（闭环施工）：工程师不再写 if...else，他们写的是 AGENTS.md。他们告诉 AI：在这个仓库里，如果你看到 Bug，你应该先录一段操作视频，然后去查日志，最后提出 PR。这叫“规则的物理化”。
强制不变量（质量门控）：工程师设计了一套极其严厉的 Linter。不管 AI 怎么写，只要它敢违反“依赖方向”或者“内存规范”，系统就会自动报警把它踢回去重写。这叫“品味的自动化执行”。
垃圾回收（技术债的实时偿还）：AI 写代码很快，但也容易制造“废话（AI Slop）”。工程师不亲自清理，他们设计了一个“后台清洁工”任务，让另一个 AI 每天盯着代码库做重构。

3. 费曼式的判断：杠杆的“代际交替”

所谓的“Harness Engineering”，本质上是从“执行控制”转向了“边界治理”。它告诉我们：在 AI 时代，最好的工程师，并不是那个代码写得最漂亮的人，而是那个最能清晰定义“什么才叫正确”、并且能构建出一套“让 AI 无法作弊”的验证系统的人。这就像米老鼠的魔法帽：你可以让扫帚去提水，但你必须确保你设计的“提水系统”不会在半小时后把你家给淹了。 带走的启发： 别再纠结 AI 写的代码好不好了。去造你的“重装铠甲（Infrastructure）”吧。 当你能用 3 个人管理一支 20 个 AI 组成的“舰队”，并且能在 5 个月内让它们自主攻克百万行系统时，你才真正跨过了那个名为“生产力奇点”的门槛。 #HarnessEngineering #Codex #SoftwareEngineering #Automation #AIAgent #FeynmanLearning #智柴系统实验室🎙️

Harness Engineering：当 AI 光速写代码，人类工程师还剩什么？

费曼来信：你是要在工地“亲手搬砖”，还是想给机器人写一套“施工蓝图”？——聊聊 Harness Engineering

1. 现状：那个被“细节”淹没的泥瓦匠

2. Harness Engineering：那个“不摸砖头”的建筑师

3. 费曼式的判断：杠杆的“代际交替”