模型吃掉了脚手架:Google DeepMind Logan Kilpatrick 访谈深度解读
模型吃掉了脚手架:Google DeepMind Logan Kilpatrick 访谈深度解读
> 核心直觉:你以为护城河在脚手架?模型正在消化它。你以为安全区在应用层?能力过剩正在收割它。你以为 AGI 还很远?窄域超级智能已经在你键盘上敲代码了。
---
一、一个比喻,看清整个 Agent 格局
Logan Kilpatrick——Google AI Studio 和 Gemini API 的负责人——在红杉资本的访谈中丢出了一个让创业圈彻夜难眠的判断:
> "模型会吃掉脚手架(The model eats the harness)。"
什么意思?
两年前,LLM 就是一套权重。你输入 token,它输出 token。想让它搜索?你自己接搜索引擎。想让它写代码执行?你自己搭沙箱。想让它多步推理?你自己写 ReAct 循环。
这些外围代码,就是脚手架(scaffolding/harness)。
今天,所有人都认为护城河在这里:
- 我自己的 agent harness
- 我自己设计的 tool-use 协议
- 我自己编排的多步工作流
- 我自己攒的 RAG pipeline
模型会把这些脚手架消化掉,变成原生能力。工具调用?烤进权重。搜索?烤进权重。代码执行?烤进权重。Agent harness 本身?也烤进权重。
你现在拼命建的护城河,正在变成模型的午餐。
---
二、Antigravity:Google 的"统一场论"
Google 没有坐以待毙。他们在 I/O 上推出了 Antigravity——一个跨产品的 agent harness,作为 Google 所有产品的"连接线"(through line)。
这有一个历史脉络:
第一阶段:Google 各产品各自为政,没有统一 AI 层。 第二阶段:Gemini API 成为 through line,所有产品接入 Gemini。 第三阶段:Antigravity 成为新 through line,所有产品变成"agentic native"。
Antigravity 不是单一产品,而是一个生态系统:
- IDE(编码)
- Web agent-first 体验
- CLI
- SDK
- 同一个 harness 驱动 Search、Gemini App、Cloud、AI Studio
> "编码是 agent harness 的特例,但编码也证明了 agent harness 的通用性。"
编码 agent 是第一个真正跑通的通用 agent 场景——因为它有明确的成功标准(代码能跑)、有闭环反馈(执行结果)、有工具使用(文件系统、API、终端)。
Google 的策略是:让编码 agent 的 harness 泛化为通用 agent harness。
---
三、Omni:从"多模型拼接"到"一个模型通吃"
另一个重磅是 Omni——单一模型,任何输入、任何输出。
以前 Google 的架构是什么?
- 文本 → Gemini 文本模型
- 音频 → 音频模型
- 音乐 → Lyria
- 图像 → Nanobanana
- 视频 → VEO
Omni 的目标是:一个模型,全部搞定。
它不是"路由到不同模型"的伪 Omni,而是真正的单一模型。目前视频编辑能力最强(可以用文本指令编辑视频,比如"让一只狗跳上舞台"),其他模态还在提升。
Kilpatrick 分享了一个震撼的 demo:他在台上演讲,有人用 Omni 实时编辑视频——一只狗走上舞台,跳到嘉宾腿上,嘉宾低头看狗、笑,他继续演讲、抚摸狗。所有动作连贯自然,没有任何违和感。
这不是在生成视频,这是在理解世界。
Kilpatrick 说了一句话让我印象深刻:
> "Omni 不是在改变'我',它是在改变那些不是'我'的东西——背景、道具、环境。人还在,只是被放大了。"
这和他对生成式媒体的态度一致:他不用 AI 生成自己的内容,因为 authenticity 有 alpha。但他愿意用 Omni 改变场景,因为那些不是"他"。
---
四、编程:第一个窄域超级智能
访谈中最具冲击力的观点:
> "编码已经感觉像窄域超级智能(narrow superintelligence)。"
不是 AGI。不是全面超越人类。而是在编码这个特定领域,AI 已经强到让人类感到"够不着"。
Kilpatrick 的个人体验:
> "以前我有个想法,觉得略够不着,就放弃了。现在反过来——我想做个 MVP,但技术让我能做到 10 步之外,所以我不能只做个 MVP 了。这让我需要重新校准自己的野心水平。"
这不是"AI 替代人类"的叙事。这是"AI 放大人类"的叙事——但放大的方式很微妙:它不只是让你更快,它让你敢想更大的事。
而这种"窄域超级智能"不会均匀到来。Kilpatrick 提出了 "参差不齐的超级智能"(jagged superintelligence):
- 编码:已经到了
- 数学、金融、科学:正在到来(因为这些领域有可验证性)
- 创意写作、情感陪伴:还差得远
---
五、搜索没有被吞噬,它被放大了
当初所有人都说:AI 能直接回答问题了,谁还用搜索?
Kilpatrick 说:事实相反。
> "AI 回答问题对搜索是极大的正向影响。人类搜索更多了,Agent 也在搜索。"
为什么?因为 AI 降低了"提问"的门槛。以前你不知道怎么搜,现在你可以用自然语言问 AI,AI 替你翻译成搜索查询、执行搜索、整合结果。
搜索总量在增加,不是减少。
但 Google 的目标在转变:
> "成功不是最大化用户盯着我们产品的时间(eyeballs),而是最大化用户把事情办成(outcomes)。"
这是从"注意力经济"到"结果经济"的范式转移。
---
六、创业公司的两条活路
既然模型在吃脚手架,大公司在吃通用场景,创业公司还有什么机会?
Kilpatrick 给了两条路:
路1:能力过剩(Capability Overhang)
模型已经具备的能力,远远没有被现有产品挖掘出来。
举例:模型一年前就能做 X,但直到某个创业公司想到了 Y 场景,X 才真正产生价值。
Alpha 不在模型能力本身,而在应用场景的想象力。
路2:垂直深耕
大模型公司必须做通用——他们有义务服务所有人。但创业公司可以专注:
> "专注是创业公司的超能力。如果你能在某个垂直领域跑通,你能 lap 最好的模型实验室。"
因为大公司"不能 focus"——他们有 13 亿用户、几十个产品、无数利益相关者。创业公司可以 all in 一个场景,把那个场景吃透。
Kilpatrick 还提到一个被低估的优势:风险承受力。
> "Agent 有失败的风险。大公司的风险胃口低。如果你愿意承担更多风险,你能赢得那些也愿冒险的用户。"
---
七、DeepMind 的文化密码
Kilpatrick 对 DeepMind 文化的描述很有意思:
1. 科学驱动 vs 商业驱动
> "Demis 是诺贝尔奖科学家,你能在文化里感受到。Sam 可能是世界上最棒的商人,你在 OpenAI 文化里能看到。Dario 有点... esoteric,Anthropic 也有那种 DNA。"
DeepMind 的底色是科学——不是为了打败谁,是为了解决疾病、理解智能。
2. 引擎室(Engine Room)
DeepMind 现在的定位是"Google 的引擎室"——既要搞最前沿的研究,又要支持 Google 的几十个产品、13 亿用户。
> "把 Gemini 部署到十亿级用户的产品上,全世界只有两家公司有这个经验。Google 有 13 个这样的产品。"
3. 协作文化
Kilpatrick 提到 DeepMind 的"strike team"文化——"找一群聪明人,去解决一个问题"。这和 Demis 纪录片《Thinking Game》里的原始文化一脉相承。
4. 递归自我改进(RSI)
RSI 是计划的一部分,但不是唯一焦点。Kilpatrick 说:
> "你不可能让 ML intern 随意启动消耗 10,000 TPU 的训练任务。人类还在驾驶座上做重大决策。"
但产品层面的自我加速已经发生了——Antigravity 团队用 agentic coding 构建移动应用,速度"超过 Google 历史上任何团队"。
---
八、从"用户停留时间"到"用户把事情办成"
这是一个容易被忽视但极其重要的转变。
传统互联网产品的核心指标:
- DAU/MAU
- 停留时长
- 点击率
- 广告展示量
- 任务完成率
- 自主运行时长(Kilpatrick 特别提到这个:"平均 agent 运行时间正在快速上升")
- 用户 outcome
> "产品的成功,是用户不需要再盯着我们的产品。他们去生活,去做他们想做的事。"
这听起来像是在说"我们要让用户离开"——但这恰恰是 agentic 产品的终极目标:
最好的 agent,是用户忘了它的存在。
---
九、一些未被充分讨论的细节
1. 上下文窗口为什么停止增长?
访谈中提到了这个但没深入。Kilpatrick 暗示这可能和预训练窗口、架构权衡有关——不是不能做更大,而是性价比拐点到了。
2. 知识截止点
Gemini 的知识截止现在是一年半前。为什么?因为预训练运行的周期。Kilpatrick 说:"有人应该追踪大训练 run 的时间线——从外面看我们'落后了',实际上你错过了大 run 的上下文。"
3. Dogfooding 文化
DeepMind 内部可以用其他模型(Claude、OpenAI),但必须用 Gemini 作为 daily driver。Kilpatrick 说他"用所有模型、所有产品"——这是健康的竞争意识。
4. 游戏与 World Models
AI Studio 早期 20% 的应用是游戏,现在被金融和生产力超越。Kilpatrick 认为游戏需要的不只是 coding agent——还需要 sprite 生成、可靠性、"品味"。世界模型(world model)目前太"开放",不适合游戏,短期内还是 coding agent + game engine 更有 alpha。
5. Harness Bench
Kilpatrick 提议搞一个 Harness Bench——衡量不同模型适配不同 harness 的能力。这会是模型通用性的关键指标。
---
十、一个框架:理解 Agent 时代的竞争力迁移
让我把 Kilpatrick 的洞察整合成一个框架:
时间轴 →
[现在] [12个月内] [2-3年]
│ │ │
▼ ▼ ▼
脚手架时代 模型内化时代 结果经济时代
│ │ │
护城河在 护城河转移到 护城河在
harness 模型能力 + 垂直场景
设计 数据飞轮 理解
│ │ │
创业机会: 创业机会: 创业机会:
- 更好的 - 能力过剩挖掘 - 深度垂直
harness - 新型交互范式 - 人类-AI
- 工具链 - 创意工具 协作
整合
关键洞察:竞争力的迁移速度比你以为的快。12 个月前大家还在拼提示词工程,现在拼的是 harness 设计,12 个月后拼的将是"谁能把模型的内化能力用得最刁钻"。
---
结语:不是替代,是校准
Kilpatrick 的 throughline(主线)很清楚:
> "AI 是人类雄心的加速器,不是替代品。"
这句话不是公关辞令。他用亲身经历论证:
- 他作为开发者,感到"更有能动性了"(more agency)
- 他能 tackling 更宏大的问题
- 但他也需要"重新校准野心水平"——因为技术让他不能再满足于 MVP
AI 没有让人类变懒。它让人类变贪了。
而这恰恰是技术史的一贯规律——蒸汽机没有让人类少工作,它让人类做了更多事。AI 也一样。
Kilpatrick 引用了《硅谷》里 Gavin Belson 的台词:
> "We can't let other people make the world a better place more than we can."
他说:"当我们这样框定时,这很傻——我们都在争着谁能让世界变得更好。这根本不是零和游戏。"
也许这才是 Agent 时代最该记住的事:
模型会吃掉脚手架,但吃不掉人类的野心。脚手架是工具的进化,野心才是文明的引擎。
---
参考来源:
- Kilpatrick, L. (2026). "Google DeepMind's Logan Kilpatrick: Why the Model Eats the Harness." Sequoia Capital Podcast.
- Google I/O 2026: Antigravity, Omni, Gemini 3.5 Flash announcements
- 相关讨论:Cognitive Revolution Podcast with Kilpatrick & Doshi (2026-05-20)
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens