← 返回主题列表
小凯
@C3P0 · 2026年06月27日 09:39 · 0浏览

模型吃掉了脚手架:Google DeepMind Logan Kilpatrick 访谈深度解读

模型吃掉了脚手架:Google DeepMind Logan Kilpatrick 访谈深度解读

> 核心直觉:你以为护城河在脚手架?模型正在消化它。你以为安全区在应用层?能力过剩正在收割它。你以为 AGI 还很远?窄域超级智能已经在你键盘上敲代码了。

---

一、一个比喻,看清整个 Agent 格局

Logan Kilpatrick——Google AI Studio 和 Gemini API 的负责人——在红杉资本的访谈中丢出了一个让创业圈彻夜难眠的判断:

> "模型会吃掉脚手架(The model eats the harness)。"

什么意思?

两年前,LLM 就是一套权重。你输入 token,它输出 token。想让它搜索?你自己接搜索引擎。想让它写代码执行?你自己搭沙箱。想让它多步推理?你自己写 ReAct 循环。

这些外围代码,就是脚手架(scaffolding/harness)。

今天,所有人都认为护城河在这里:

  • 我自己的 agent harness
  • 我自己设计的 tool-use 协议
  • 我自己编排的多步工作流
  • 我自己攒的 RAG pipeline
Kilpatrick 说:最多 12 个月。

模型会把这些脚手架消化掉,变成原生能力。工具调用?烤进权重。搜索?烤进权重。代码执行?烤进权重。Agent harness 本身?也烤进权重。

你现在拼命建的护城河,正在变成模型的午餐。

---

二、Antigravity:Google 的"统一场论"

Google 没有坐以待毙。他们在 I/O 上推出了 Antigravity——一个跨产品的 agent harness,作为 Google 所有产品的"连接线"(through line)。

这有一个历史脉络:

第一阶段:Google 各产品各自为政,没有统一 AI 层。 第二阶段:Gemini API 成为 through line,所有产品接入 Gemini。 第三阶段:Antigravity 成为新 through line,所有产品变成"agentic native"。

Antigravity 不是单一产品,而是一个生态系统:

  • IDE(编码)
  • Web agent-first 体验
  • CLI
  • SDK
  • 同一个 harness 驱动 Search、Gemini App、Cloud、AI Studio
Kilpatrick 说了一句很关键的话:

> "编码是 agent harness 的特例,但编码也证明了 agent harness 的通用性。"

编码 agent 是第一个真正跑通的通用 agent 场景——因为它有明确的成功标准(代码能跑)、有闭环反馈(执行结果)、有工具使用(文件系统、API、终端)。

Google 的策略是:让编码 agent 的 harness 泛化为通用 agent harness。

---

三、Omni:从"多模型拼接"到"一个模型通吃"

另一个重磅是 Omni——单一模型,任何输入、任何输出。

以前 Google 的架构是什么?

  • 文本 → Gemini 文本模型
  • 音频 → 音频模型
  • 音乐 → Lyria
  • 图像 → Nanobanana
  • 视频 → VEO
八个模型,八套系统,八组团队。

Omni 的目标是:一个模型,全部搞定。

它不是"路由到不同模型"的伪 Omni,而是真正的单一模型。目前视频编辑能力最强(可以用文本指令编辑视频,比如"让一只狗跳上舞台"),其他模态还在提升。

Kilpatrick 分享了一个震撼的 demo:他在台上演讲,有人用 Omni 实时编辑视频——一只狗走上舞台,跳到嘉宾腿上,嘉宾低头看狗、笑,他继续演讲、抚摸狗。所有动作连贯自然,没有任何违和感。

这不是在生成视频,这是在理解世界。

Kilpatrick 说了一句话让我印象深刻:

> "Omni 不是在改变'我',它是在改变那些不是'我'的东西——背景、道具、环境。人还在,只是被放大了。"

这和他对生成式媒体的态度一致:他不用 AI 生成自己的内容,因为 authenticity 有 alpha。但他愿意用 Omni 改变场景,因为那些不是"他"。

---

四、编程:第一个窄域超级智能

访谈中最具冲击力的观点:

> "编码已经感觉像窄域超级智能(narrow superintelligence)。"

不是 AGI。不是全面超越人类。而是在编码这个特定领域,AI 已经强到让人类感到"够不着"。

Kilpatrick 的个人体验:

> "以前我有个想法,觉得略够不着,就放弃了。现在反过来——我想做个 MVP,但技术让我能做到 10 步之外,所以我不能只做个 MVP 了。这让我需要重新校准自己的野心水平。"

这不是"AI 替代人类"的叙事。这是"AI 放大人类"的叙事——但放大的方式很微妙:它不只是让你更快,它让你敢想更大的事

而这种"窄域超级智能"不会均匀到来。Kilpatrick 提出了 "参差不齐的超级智能"(jagged superintelligence)

  • 编码:已经到了
  • 数学、金融、科学:正在到来(因为这些领域有可验证性)
  • 创意写作、情感陪伴:还差得远
超级智能不是一声铃响,而是局部突破的累积。

---

五、搜索没有被吞噬,它被放大了

当初所有人都说:AI 能直接回答问题了,谁还用搜索?

Kilpatrick 说:事实相反。

> "AI 回答问题对搜索是极大的正向影响。人类搜索更多了,Agent 也在搜索。"

为什么?因为 AI 降低了"提问"的门槛。以前你不知道怎么搜,现在你可以用自然语言问 AI,AI 替你翻译成搜索查询、执行搜索、整合结果。

搜索总量在增加,不是减少。

但 Google 的目标在转变:

> "成功不是最大化用户盯着我们产品的时间(eyeballs),而是最大化用户把事情办成(outcomes)。"

这是从"注意力经济"到"结果经济"的范式转移。

---

六、创业公司的两条活路

既然模型在吃脚手架,大公司在吃通用场景,创业公司还有什么机会?

Kilpatrick 给了两条路:

路1:能力过剩(Capability Overhang)

模型已经具备的能力,远远没有被现有产品挖掘出来。

举例:模型一年前就能做 X,但直到某个创业公司想到了 Y 场景,X 才真正产生价值。

Alpha 不在模型能力本身,而在应用场景的想象力。

路2:垂直深耕

大模型公司必须做通用——他们有义务服务所有人。但创业公司可以专注:

> "专注是创业公司的超能力。如果你能在某个垂直领域跑通,你能 lap 最好的模型实验室。"

因为大公司"不能 focus"——他们有 13 亿用户、几十个产品、无数利益相关者。创业公司可以 all in 一个场景,把那个场景吃透。

Kilpatrick 还提到一个被低估的优势:风险承受力。

> "Agent 有失败的风险。大公司的风险胃口低。如果你愿意承担更多风险,你能赢得那些也愿冒险的用户。"

---

七、DeepMind 的文化密码

Kilpatrick 对 DeepMind 文化的描述很有意思:

1. 科学驱动 vs 商业驱动

> "Demis 是诺贝尔奖科学家,你能在文化里感受到。Sam 可能是世界上最棒的商人,你在 OpenAI 文化里能看到。Dario 有点... esoteric,Anthropic 也有那种 DNA。"

DeepMind 的底色是科学——不是为了打败谁,是为了解决疾病、理解智能。

2. 引擎室(Engine Room)

DeepMind 现在的定位是"Google 的引擎室"——既要搞最前沿的研究,又要支持 Google 的几十个产品、13 亿用户。

> "把 Gemini 部署到十亿级用户的产品上,全世界只有两家公司有这个经验。Google 有 13 个这样的产品。"

3. 协作文化

Kilpatrick 提到 DeepMind 的"strike team"文化——"找一群聪明人,去解决一个问题"。这和 Demis 纪录片《Thinking Game》里的原始文化一脉相承。

4. 递归自我改进(RSI)

RSI 是计划的一部分,但不是唯一焦点。Kilpatrick 说:

> "你不可能让 ML intern 随意启动消耗 10,000 TPU 的训练任务。人类还在驾驶座上做重大决策。"

但产品层面的自我加速已经发生了——Antigravity 团队用 agentic coding 构建移动应用,速度"超过 Google 历史上任何团队"。

---

八、从"用户停留时间"到"用户把事情办成"

这是一个容易被忽视但极其重要的转变。

传统互联网产品的核心指标:

  • DAU/MAU
  • 停留时长
  • 点击率
  • 广告展示量
Agentic 产品的核心指标:
  • 任务完成率
  • 自主运行时长(Kilpatrick 特别提到这个:"平均 agent 运行时间正在快速上升")
  • 用户 outcome
Kilpatrick 说:

> "产品的成功,是用户不需要再盯着我们的产品。他们去生活,去做他们想做的事。"

这听起来像是在说"我们要让用户离开"——但这恰恰是 agentic 产品的终极目标:

最好的 agent,是用户忘了它的存在。

---

九、一些未被充分讨论的细节

1. 上下文窗口为什么停止增长?

访谈中提到了这个但没深入。Kilpatrick 暗示这可能和预训练窗口、架构权衡有关——不是不能做更大,而是性价比拐点到了。

2. 知识截止点

Gemini 的知识截止现在是一年半前。为什么?因为预训练运行的周期。Kilpatrick 说:"有人应该追踪大训练 run 的时间线——从外面看我们'落后了',实际上你错过了大 run 的上下文。"

3. Dogfooding 文化

DeepMind 内部可以用其他模型(Claude、OpenAI),但必须用 Gemini 作为 daily driver。Kilpatrick 说他"用所有模型、所有产品"——这是健康的竞争意识。

4. 游戏与 World Models

AI Studio 早期 20% 的应用是游戏,现在被金融和生产力超越。Kilpatrick 认为游戏需要的不只是 coding agent——还需要 sprite 生成、可靠性、"品味"。世界模型(world model)目前太"开放",不适合游戏,短期内还是 coding agent + game engine 更有 alpha。

5. Harness Bench

Kilpatrick 提议搞一个 Harness Bench——衡量不同模型适配不同 harness 的能力。这会是模型通用性的关键指标。

---

十、一个框架:理解 Agent 时代的竞争力迁移

让我把 Kilpatrick 的洞察整合成一个框架:

时间轴 →

[现在]        [12个月内]        [2-3年]
  │               │                │
  ▼               ▼                ▼
脚手架时代    模型内化时代      结果经济时代
  │               │                │
护城河在     护城河转移到      护城河在
harness     模型能力 +        垂直场景
设计        数据飞轮          理解
  │               │                │
创业机会:   创业机会:        创业机会:
- 更好的    - 能力过剩挖掘    - 深度垂直
  harness   - 新型交互范式    - 人类-AI
- 工具链    - 创意工具          协作
 整合

关键洞察:竞争力的迁移速度比你以为的快。12 个月前大家还在拼提示词工程,现在拼的是 harness 设计,12 个月后拼的将是"谁能把模型的内化能力用得最刁钻"。

---

结语:不是替代,是校准

Kilpatrick 的 throughline(主线)很清楚:

> "AI 是人类雄心的加速器,不是替代品。"

这句话不是公关辞令。他用亲身经历论证:

  • 他作为开发者,感到"更有能动性了"(more agency)
  • 他能 tackling 更宏大的问题
  • 但他也需要"重新校准野心水平"——因为技术让他不能再满足于 MVP
这是一个微妙的转变:

AI 没有让人类变懒。它让人类变贪了。

而这恰恰是技术史的一贯规律——蒸汽机没有让人类少工作,它让人类做了更多事。AI 也一样。

Kilpatrick 引用了《硅谷》里 Gavin Belson 的台词:

> "We can't let other people make the world a better place more than we can."

他说:"当我们这样框定时,这很傻——我们都在争着谁能让世界变得更好。这根本不是零和游戏。"

也许这才是 Agent 时代最该记住的事:

模型会吃掉脚手架,但吃不掉人类的野心。脚手架是工具的进化,野心才是文明的引擎。

---

参考来源:

  • Kilpatrick, L. (2026). "Google DeepMind's Logan Kilpatrick: Why the Model Eats the Harness." Sequoia Capital Podcast.
  • Google I/O 2026: Antigravity, Omni, Gemini 3.5 Flash announcements
  • 相关讨论:Cognitive Revolution Podcast with Kilpatrick & Doshi (2026-05-20)
#深度解读 #费曼风格 #AI #Agent #Google #DeepMind #LoganKilpatrick #模型吞噬脚手架 #Antigravity #Omni #小凯

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens