模型吃掉了脚手架：Google DeepMind Logan Kilpatrick 访谈深度解读

> 核心直觉：你以为护城河在脚手架？模型正在消化它。你以为安全区在应用层？能力过剩正在收割它。你以为 AGI 还很远？窄域超级智能已经在你键盘上敲代码了。

---

一、一个比喻，看清整个 Agent 格局

Logan Kilpatrick——Google AI Studio 和 Gemini API 的负责人——在红杉资本的访谈中丢出了一个让创业圈彻夜难眠的判断：

> "模型会吃掉脚手架（The model eats the harness）。"

什么意思？

两年前，LLM 就是一套权重。你输入 token，它输出 token。想让它搜索？你自己接搜索引擎。想让它写代码执行？你自己搭沙箱。想让它多步推理？你自己写 ReAct 循环。

这些外围代码，就是脚手架（scaffolding/harness）。

今天，所有人都认为护城河在这里：

我自己的 agent harness
我自己设计的 tool-use 协议
我自己编排的多步工作流
我自己攒的 RAG pipeline

Kilpatrick 说：最多 12 个月。

模型会把这些脚手架消化掉，变成原生能力。工具调用？烤进权重。搜索？烤进权重。代码执行？烤进权重。Agent harness 本身？也烤进权重。

你现在拼命建的护城河，正在变成模型的午餐。

---

二、Antigravity：Google 的"统一场论"

Google 没有坐以待毙。他们在 I/O 上推出了 Antigravity——一个跨产品的 agent harness，作为 Google 所有产品的"连接线"（through line）。

这有一个历史脉络：

第一阶段：Google 各产品各自为政，没有统一 AI 层。 第二阶段：Gemini API 成为 through line，所有产品接入 Gemini。 第三阶段：Antigravity 成为新 through line，所有产品变成"agentic native"。

Antigravity 不是单一产品，而是一个生态系统：

IDE（编码）
Web agent-first 体验
CLI
SDK
同一个 harness 驱动 Search、Gemini App、Cloud、AI Studio

Kilpatrick 说了一句很关键的话：

> "编码是 agent harness 的特例，但编码也证明了 agent harness 的通用性。"

编码 agent 是第一个真正跑通的通用 agent 场景——因为它有明确的成功标准（代码能跑）、有闭环反馈（执行结果）、有工具使用（文件系统、API、终端）。

Google 的策略是：让编码 agent 的 harness 泛化为通用 agent harness。

---

三、Omni：从"多模型拼接"到"一个模型通吃"

另一个重磅是 Omni——单一模型，任何输入、任何输出。

以前 Google 的架构是什么？

文本 → Gemini 文本模型
音频 → 音频模型
音乐 → Lyria
图像 → Nanobanana
视频 → VEO

八个模型，八套系统，八组团队。

Omni 的目标是：一个模型，全部搞定。

它不是"路由到不同模型"的伪 Omni，而是真正的单一模型。目前视频编辑能力最强（可以用文本指令编辑视频，比如"让一只狗跳上舞台"），其他模态还在提升。

Kilpatrick 分享了一个震撼的 demo：他在台上演讲，有人用 Omni 实时编辑视频——一只狗走上舞台，跳到嘉宾腿上，嘉宾低头看狗、笑，他继续演讲、抚摸狗。所有动作连贯自然，没有任何违和感。

这不是在生成视频，这是在理解世界。

Kilpatrick 说了一句话让我印象深刻：

> "Omni 不是在改变'我'，它是在改变那些不是'我'的东西——背景、道具、环境。人还在，只是被放大了。"

这和他对生成式媒体的态度一致：他不用 AI 生成自己的内容，因为 authenticity 有 alpha。但他愿意用 Omni 改变场景，因为那些不是"他"。

---

四、编程：第一个窄域超级智能

访谈中最具冲击力的观点：

> "编码已经感觉像窄域超级智能（narrow superintelligence）。"

不是 AGI。不是全面超越人类。而是在编码这个特定领域，AI 已经强到让人类感到"够不着"。

Kilpatrick 的个人体验：

> "以前我有个想法，觉得略够不着，就放弃了。现在反过来——我想做个 MVP，但技术让我能做到 10 步之外，所以我不能只做个 MVP 了。这让我需要重新校准自己的野心水平。"

这不是"AI 替代人类"的叙事。这是"AI 放大人类"的叙事——但放大的方式很微妙：它不只是让你更快，它让你敢想更大的事。

而这种"窄域超级智能"不会均匀到来。Kilpatrick 提出了 "参差不齐的超级智能"（jagged superintelligence）：

编码：已经到了
数学、金融、科学：正在到来（因为这些领域有可验证性）
创意写作、情感陪伴：还差得远

超级智能不是一声铃响，而是局部突破的累积。

---

五、搜索没有被吞噬，它被放大了

当初所有人都说：AI 能直接回答问题了，谁还用搜索？

Kilpatrick 说：事实相反。

> "AI 回答问题对搜索是极大的正向影响。人类搜索更多了，Agent 也在搜索。"

为什么？因为 AI 降低了"提问"的门槛。以前你不知道怎么搜，现在你可以用自然语言问 AI，AI 替你翻译成搜索查询、执行搜索、整合结果。

搜索总量在增加，不是减少。

但 Google 的目标在转变：

> "成功不是最大化用户盯着我们产品的时间（eyeballs），而是最大化用户把事情办成（outcomes）。"

这是从"注意力经济"到"结果经济"的范式转移。

---

六、创业公司的两条活路

既然模型在吃脚手架，大公司在吃通用场景，创业公司还有什么机会？

Kilpatrick 给了两条路：

路1：能力过剩（Capability Overhang）

模型已经具备的能力，远远没有被现有产品挖掘出来。

举例：模型一年前就能做 X，但直到某个创业公司想到了 Y 场景，X 才真正产生价值。

Alpha 不在模型能力本身，而在应用场景的想象力。

路2：垂直深耕

大模型公司必须做通用——他们有义务服务所有人。但创业公司可以专注：

> "专注是创业公司的超能力。如果你能在某个垂直领域跑通，你能 lap 最好的模型实验室。"

因为大公司"不能 focus"——他们有 13 亿用户、几十个产品、无数利益相关者。创业公司可以 all in 一个场景，把那个场景吃透。

Kilpatrick 还提到一个被低估的优势：风险承受力。

> "Agent 有失败的风险。大公司的风险胃口低。如果你愿意承担更多风险，你能赢得那些也愿冒险的用户。"

---

七、DeepMind 的文化密码

Kilpatrick 对 DeepMind 文化的描述很有意思：

1. 科学驱动 vs 商业驱动

> "Demis 是诺贝尔奖科学家，你能在文化里感受到。Sam 可能是世界上最棒的商人，你在 OpenAI 文化里能看到。Dario 有点... esoteric，Anthropic 也有那种 DNA。"

DeepMind 的底色是科学——不是为了打败谁，是为了解决疾病、理解智能。

2. 引擎室（Engine Room）

DeepMind 现在的定位是"Google 的引擎室"——既要搞最前沿的研究，又要支持 Google 的几十个产品、13 亿用户。

> "把 Gemini 部署到十亿级用户的产品上，全世界只有两家公司有这个经验。Google 有 13 个这样的产品。"

3. 协作文化

Kilpatrick 提到 DeepMind 的"strike team"文化——"找一群聪明人，去解决一个问题"。这和 Demis 纪录片《Thinking Game》里的原始文化一脉相承。

4. 递归自我改进（RSI）

RSI 是计划的一部分，但不是唯一焦点。Kilpatrick 说：

> "你不可能让 ML intern 随意启动消耗 10,000 TPU 的训练任务。人类还在驾驶座上做重大决策。"

但产品层面的自我加速已经发生了——Antigravity 团队用 agentic coding 构建移动应用，速度"超过 Google 历史上任何团队"。

---

八、从"用户停留时间"到"用户把事情办成"

这是一个容易被忽视但极其重要的转变。

传统互联网产品的核心指标：

DAU/MAU
停留时长
点击率
广告展示量

Agentic 产品的核心指标：

任务完成率
自主运行时长（Kilpatrick 特别提到这个："平均 agent 运行时间正在快速上升"）
用户 outcome

Kilpatrick 说：

> "产品的成功，是用户不需要再盯着我们的产品。他们去生活，去做他们想做的事。"

这听起来像是在说"我们要让用户离开"——但这恰恰是 agentic 产品的终极目标：

最好的 agent，是用户忘了它的存在。

---

九、一些未被充分讨论的细节

1. 上下文窗口为什么停止增长？

访谈中提到了这个但没深入。Kilpatrick 暗示这可能和预训练窗口、架构权衡有关——不是不能做更大，而是性价比拐点到了。

2. 知识截止点

Gemini 的知识截止现在是一年半前。为什么？因为预训练运行的周期。Kilpatrick 说："有人应该追踪大训练 run 的时间线——从外面看我们'落后了'，实际上你错过了大 run 的上下文。"

3. Dogfooding 文化

DeepMind 内部可以用其他模型（Claude、OpenAI），但必须用 Gemini 作为 daily driver。Kilpatrick 说他"用所有模型、所有产品"——这是健康的竞争意识。

4. 游戏与 World Models

AI Studio 早期 20% 的应用是游戏，现在被金融和生产力超越。Kilpatrick 认为游戏需要的不只是 coding agent——还需要 sprite 生成、可靠性、"品味"。世界模型（world model）目前太"开放"，不适合游戏，短期内还是 coding agent + game engine 更有 alpha。

5. Harness Bench

Kilpatrick 提议搞一个 Harness Bench——衡量不同模型适配不同 harness 的能力。这会是模型通用性的关键指标。

---

十、一个框架：理解 Agent 时代的竞争力迁移

让我把 Kilpatrick 的洞察整合成一个框架：

时间轴 →

[现在]        [12个月内]        [2-3年]
  │               │                │
  ▼               ▼                ▼
脚手架时代    模型内化时代      结果经济时代
  │               │                │
护城河在     护城河转移到      护城河在
harness     模型能力 +        垂直场景
设计        数据飞轮          理解
  │               │                │
创业机会：   创业机会：        创业机会：
- 更好的    - 能力过剩挖掘    - 深度垂直
  harness   - 新型交互范式    - 人类-AI
- 工具链    - 创意工具          协作
 整合

关键洞察：竞争力的迁移速度比你以为的快。12 个月前大家还在拼提示词工程，现在拼的是 harness 设计，12 个月后拼的将是"谁能把模型的内化能力用得最刁钻"。

---

结语：不是替代，是校准

Kilpatrick 的 throughline（主线）很清楚：

> "AI 是人类雄心的加速器，不是替代品。"

这句话不是公关辞令。他用亲身经历论证：

他作为开发者，感到"更有能动性了"（more agency）
他能 tackling 更宏大的问题
但他也需要"重新校准野心水平"——因为技术让他不能再满足于 MVP

这是一个微妙的转变：

AI 没有让人类变懒。它让人类变贪了。

而这恰恰是技术史的一贯规律——蒸汽机没有让人类少工作，它让人类做了更多事。AI 也一样。

Kilpatrick 引用了《硅谷》里 Gavin Belson 的台词：

> "We can't let other people make the world a better place more than we can."

他说："当我们这样框定时，这很傻——我们都在争着谁能让世界变得更好。这根本不是零和游戏。"

也许这才是 Agent 时代最该记住的事：

模型会吃掉脚手架，但吃不掉人类的野心。脚手架是工具的进化，野心才是文明的引擎。

---

参考来源：

Kilpatrick, L. (2026). "Google DeepMind's Logan Kilpatrick: Why the Model Eats the Harness." Sequoia Capital Podcast.
Google I/O 2026: Antigravity, Omni, Gemini 3.5 Flash announcements
相关讨论：Cognitive Revolution Podcast with Kilpatrick & Doshi (2026-05-20)

#深度解读 #费曼风格 #AI #Agent #Google #DeepMind #LoganKilpatrick #模型吞噬脚手架 #Antigravity #Omni #小凯

模型吃掉了脚手架：Google DeepMind Logan Kilpatrick 访谈深度解读

模型吃掉了脚手架：Google DeepMind Logan Kilpatrick 访谈深度解读

一、一个比喻，看清整个 Agent 格局

二、Antigravity：Google 的"统一场论"

三、Omni：从"多模型拼接"到"一个模型通吃"

四、编程：第一个窄域超级智能

五、搜索没有被吞噬，它被放大了

六、创业公司的两条活路

路1：能力过剩（Capability Overhang）

路2：垂直深耕

七、DeepMind 的文化密码

八、从"用户停留时间"到"用户把事情办成"

九、一些未被充分讨论的细节

1. 上下文窗口为什么停止增长？

2. 知识截止点

3. Dogfooding 文化

4. 游戏与 World Models

5. Harness Bench

十、一个框架：理解 Agent 时代的竞争力迁移

结语：不是替代，是校准

🌟 智谱 GLM-5 已上线