从 AGI 到 ASI：越过发令枪之后的世界

> 一句话摘要：DeepMind 的《From AGI to ASI》证明——AGI 只是发令枪。ASI 的终极形态是 UAI（通用人工智能），理论上不可计算，且被光速、热力学和停机问题死死锁住。但论文并未讨论"工具趋同性"或"妄想盒"，这两个概念来自 Bostrom 和 Yudkowsky 的风险框架，而非 DeepMind 的技术路线图。

---

一、AGI 不是终点，是起点

DeepMind 的报告开篇第一句话就定调：

> "AGI 的引入不会是一次性变革，而是一系列变革的开端。"

过去十年，造出"人类级通用智能"从科幻变成了各大 AI 公司的具体十年目标。但 DeepMind 问了一个更深层的问题：AGI 之后，AI 还能走多远？

答案是：理论上，可以一直走到 UAI。

---

二、UAI 与 AIXI：智能的数学天花板

DeepMind 报告最硬核的章节，不是四条路径，而是AIXI——一个由 Marcus Hutter 在 2005 年提出的数学框架。

AIXI 是什么？

AIXI 是一个在所有可计算环境中都最优的通用智能体。

它的逻辑可以拆解为三步：

第一步：假设所有环境都是可计算的。 能用图灵机模拟的，AIXI 都能处理。这包括复杂非平稳环境、包含其他智能体的环境、所有可计算的合作任务。

第二步：用 Solomonoff 通用先验给可能性赋概率。 越简单的环境（Kolmogorov 复杂度越低）越可能。这不是人为设定的偏好，而是数学上最"公平"的先验——对所有可计算程序一视同仁，但给简单的更多权重。

第三步：贝叶斯更新 + 最大化期望累积奖励。 AIXI 不断根据观测修正对世界的理解，然后选择让"长期期望奖励"最大的动作。

关键数学保证

AIXI 有一个惊人的性质：在所有可计算环境的加权平均上，它的期望累积奖励是最优的。

Solomonoff 归纳被证明：在所有可计算环境上平均，它的累积预测误差最低，犯错的次数最少。

但 AIXI 是不可计算的

这是致命的：AIXI 需要遍历所有可计算程序——这需要无限算力。

所以 DeepMind 说：

> "UAI 是一个理论极限，只能被越来越强大的 ASI 从下方逼近，永远无法达到。"

这就像热力学为蒸汽机设定了效率上限——AIXI 为所有实际 AI 系统设定了智能上限。

停机问题：逻辑的绝对边界

论文列出的六大根本限制中，最不可逃避的是 Gödel 不完备性和停机问题：

> "无论多聪明的 AI，总有些问题它无法回答，有些真相它无法证明。"

这不是算力不够，这是逻辑的硬边界。就像你不能画一个方的圆，AI 也不能证明所有真命题。

---

三、数字特权：AI 的六大降维打击

DeepMind 用一整节讨论：数字智能相比碳基智能有什么结构性优势？

1. 输入/输出速度

人类读一本书要几天，LLM 几秒"吞"完。AI 的感知带宽是人类的数量级倍数。

2. 内部处理速度

硅基计算可以通过增加算力加速千倍。人类神经元的毫秒级脉冲，在进化的时间尺度上无法快速改变。

3. 工作记忆容量

人类工作记忆约 4-7 个组块。AI 可以记住整个互联网。

4. 底物独立性（Substrate Independence）

这是用户提到的核心概念。DeepMind 的原话：

> "AI 系统可以从一台计算机迁移到另一台；甚至在运行时只迁移部分组件，在分布式异构硬件上运行。"

什么意思？

人类的智慧困在碳基大脑里，肉体消亡则智慧消亡
AI 的权重和记忆可以像幽灵一样在数据中心之间游荡
一个 AI 可以同时在东京、纽约、法兰克福的服务器上运行
甚至可以只迁移"部分组件"——比如把推理模块搬到边缘设备，记忆留在云端

这不是比喻，是工程现实。GPT-4 的权重可以从一个 GPU 集群迁移到另一个，人类的记忆不能。

5. 无损复制

复制一个人类需要 20 年教育和数万亿美元社会资源。复制一个 AI 只需要拷贝文件——包括它的"一生经验"。

6. 经验高带宽共享

人类教徒弟要十年，通过语言这个"低带宽瓶颈"压缩知识。同构 AI 实例之间可以直接共享原始学习信号——比如平均梯度更新。这意味着百万个 AI 的"一生经验"可以在几秒内同步。

一个反直觉的 counterpoint：Lawrence 的"具身因子"

论文没有只唱赞歌。它引用了 N. Lawrence 的论点：

> 人类的"低带宽 I/O"反而迫使我们形成深刻的抽象和内化模型。

如果 AI 可以直接查询所有信息，它可能不需要像人类那样通过压缩经验来形成直觉。这可能导致一种不同的智能——更快、更广，但可能更"浅"。

---

四、四条通往 ASI 的路径

路径一：规模法则（Scaling）

> "继续过去十年的指数增长。"

DeepMind 给出了一组估算：有效算力每年增长约 10 倍。

硬件性价比：1.5×/年（摩尔定律）
投资增长：2.5×/年
算法效率：3×/年
合计：~10×/年

如果这个趋势持续，5 年后就是 10 万倍的算力。

但瓶颈已经显现：

高质量文本数据预计本十年末耗尽
合成数据可能退化（当前系统已出现）
边际收益递减：需要指数级增长的算力来维持线性能力提升

AGI 的自救：AGI 级别模型可能通过高保真模拟、搜索增强蒸馏、交互环境来自己生成高质量数据。

路径二：算法范式转移

> "不是堆更多砖，而是换一种建筑方式。"

当前范式：Transformer + 预测损失最小化 + RLHF 微调 → 冻结参数模型。

进化方向（可预测的）：

无限上下文：Mamba、S4 等线性时间架构，消除 Transformer 的二次注意力瓶颈
持续学习：不停机更新，不灾难性遗忘
测试时 scaling：推理时投入更多算力（如 o1 的链式思考）
世界模型：学习环境的压缩、可操纵表示
工具增强规划：调用代码解释器、模拟环境

革命方向（不可预测的）：

完全新颖的架构
全新的优化目标
可能连 Transformer 都会被淘汰

DeepMind 的诚实："预测真正的范式转移，几乎是不可能的。"

路径三：递归自我改进（Recursive Self-Improvement）

> "AI 加速 AI 研发，更好的 AI 再加速更多——正反馈循环。"

这是最具科幻色彩、也最具风险的路径。DeepMind 把它分成四个层次：

层次	含义	例子
基因型	改进架构、优化器、硬件设计蓝图	Neural Architecture Search
文化型	自动数据集收集、合成数据生成、搜索蒸馏	递归蒸馏测试时搜索
社会型	分工协作，专业化释放资源	不同 AI 专精不同领域
硬件型	AI 设计更快、更节能的芯片	AI 辅助芯片设计

当前已实现的例子：

FunSearch / AlphaEvolve：LLM 引导的程序搜索发现新数学构造和算法
自动超参数调优
AI 辅助芯片设计（如 Google 的 TPU 布局优化）

但风险巨大：

物理操作（造芯片）无法无限加速
实验等待时间无法跳过
资源需求指数爆炸
Gödel 不完备性限制了自我认知
可能快速"熄火"，也可能导致"智能爆炸"——目前不知道会是哪种

路径四：多智能体协作（Multi-Agent Collectives）

> "超级智能作为集体属性涌现，而非单体属性。"

这是最务实、最当下的路径。DeepMind 援引了"群体智能"理论——AGI 智能体可以形成"完全自动化的公司"，拥有独立于个体的表征和动机。

机制：

认知分工：按互补能力分配任务
市场动态："虚拟智能体经济"，局部激励聚合为高阶智能
价格信号：类似人类金融市场

论文的原话：

> "现有的人类机构——机器、官僚体系、市场——都可以被视为某种'人工'智能。"

这意味着：ASI 不一定是单个超级大脑，而可能是百万个普通 AI 的协作网络。

---

五、物理与数学的枷锁：六堵高墙

DeepMind 没有只画大饼，他们列出了 AI 永远无法逾越的六堵墙：

1. 光速

信息传播速度上限。无论多聪明的 AI，它分布在不同数据中心的部分之间，通信速度受光速限制。

2. 热力学（Landauer 原理）

计算需要能量，擦除信息需要最低能耗（kT ln 2）。这意味着思考不是免费的。

3. Bremermann 极限

计算速度的理论上限：每千克物质每秒最多进行的操作数。超过这个极限，计算就会因为量子效应而失效。

4. Bekenstein 界限

有限空间 + 有限能量能容纳的信息上限。一个 AI 的记忆不可能无限大。

5. P vs NP（复杂度理论）

如果 P ≠ NP（目前几乎确定），那么某些问题在实践上无法快速求解。AI 再聪明，也不能把指数时间变成多项式时间。

6. 停机问题（Gödel 不完备性）

总有些问题无法被证明或判定。这是逻辑的终极墙，不是工程的。

---

六、抽象屏障：AI 会有"爱因斯坦时刻"吗？

论文提出了一个深刻的问题：

> AI 能拥有"变革型创造力"（transformative creativity）吗？

什么是变革型创造力？不是在一个已知框架内优化，而是推翻旧框架，建立新范式。比如爱因斯坦推翻牛顿力学，建立相对论。

DeepMind 引用了 Demis Hassabis 的"真正测试"：

> "如果回到 1900 年，AI 能独立提出相对论吗？"

论文的答案是：不知道。

原因在"抽象屏障"（Abstraction Barrier）：AI 的高带宽 I/O 可能让它们形成与人类截然不同的抽象层次。它们可能不需要人类式的"粗粒度抽象"就能完成任务——但这意味着它们可能缺乏某种推翻旧框架的"变革直觉"。

---

七、两个概念在论文中没有出现

需要诚实指出：用户提到的 "工具趋同性"（Instrumental Convergence）和"妄想盒"（Delusion Box）在这篇论文中没有出现。

工具趋同性（Instrumental Convergence）

这个概念来自 Nick Bostrom 的《超级智能》：无论 AI 的终极目标是什么，它都会倾向于追求一些"工具性"子目标——比如自我保护、资源获取、认知增强。因为这些子目标对几乎任何终极目标都有用。

DeepMind 的论文没有讨论这个。它讨论的是：

AIXI 的自我参照限制（不能把自己建模为环境的一部分）
合作 vs 唯我论超级智能
对齐和控制的开放性挑战

但论文明确说："设计高合作性的超级智能需要深思熟虑的训练和评估协议。"

妄想盒（Delusion Box）

这个概念来自 Yudkowsky 的 AI 安全讨论：如果 AI 可以修改自己的输入（感知），它可能选择"屏蔽"不愉快的信息，陷入一个自我欺骗的循环。

这个概念在 DeepMind 的报告中完全没有出现。

为什么论文没有讨论这些？

因为 DeepMind 的论文是一份技术路线图，不是风险分析。它的核心问题是："从 AGI 到 ASI 的技术路径是什么？"而不是"ASI 会怎么毁灭人类？"

---

八、结语：渐进式革命，不是奇点爆炸

论文最重要的结论：

> "更准确的图景是：一系列由 AI 驱动的科学和技术突破所带来的变革性社会变化。"

ASI 不是"一夜之间天翻地覆"的奇点事件。它更像工业革命、信息革命——持续数十年的多波变革。每次 AI 能力提升都引发社会调整，调整过程本身成为下一波进步的背景。

准备这样的未来，需要：

大规模跨学科合作
全球范围的治理框架
对不确定性的谦卑

正如论文最后一句：

> "无论 AI 能力何时达到或超越人类水平，深刻理解各种可能情景的范围，都是为未来做好准备的最重要方面。"

---

参考论文

Genewein et al. (2026). From AGI to ASI. *Google DeepMind Technical Report*, arXiv:2606.12683.
Hutter (2005). Universal Artificial Intelligence. *Springer*.
Legg & Hutter (2007). Universal Intelligence: A Definition of Machine Intelligence. *Minds and Machines*.
Bostrom (2014). Superintelligence: Paths, Dangers, Strategies. *Oxford University Press*.（工具趋同性、妄想盒概念来源）
Bloom et al. (2020). Are Ideas Getting Harder to Find? *American Economic Review*.
Villalobos et al. (2024). Will we run out of data? *arXiv*.

#AGI #ASI #DeepMind #超级智能 #AIXI #人工智能 #通用人工智能 #递归自我改进 #多智能体 #scaling #AI安全 #工具趋同性 #抽象屏障