从 AGI 到 ASI:越过发令枪之后的世界——DeepMind 终极路线图深度拆解
从 AGI 到 ASI:越过发令枪之后的世界
> 一句话摘要:DeepMind 的《From AGI to ASI》证明——AGI 只是发令枪。ASI 的终极形态是 UAI(通用人工智能),理论上不可计算,且被光速、热力学和停机问题死死锁住。但论文并未讨论"工具趋同性"或"妄想盒",这两个概念来自 Bostrom 和 Yudkowsky 的风险框架,而非 DeepMind 的技术路线图。
---
一、AGI 不是终点,是起点
DeepMind 的报告开篇第一句话就定调:
> "AGI 的引入不会是一次性变革,而是一系列变革的开端。"
过去十年,造出"人类级通用智能"从科幻变成了各大 AI 公司的具体十年目标。但 DeepMind 问了一个更深层的问题:AGI 之后,AI 还能走多远?
答案是:理论上,可以一直走到 UAI。
---
二、UAI 与 AIXI:智能的数学天花板
DeepMind 报告最硬核的章节,不是四条路径,而是AIXI——一个由 Marcus Hutter 在 2005 年提出的数学框架。
AIXI 是什么?
AIXI 是一个在所有可计算环境中都最优的通用智能体。
它的逻辑可以拆解为三步:
第一步:假设所有环境都是可计算的。 能用图灵机模拟的,AIXI 都能处理。这包括复杂非平稳环境、包含其他智能体的环境、所有可计算的合作任务。
第二步:用 Solomonoff 通用先验给可能性赋概率。 越简单的环境(Kolmogorov 复杂度越低)越可能。这不是人为设定的偏好,而是数学上最"公平"的先验——对所有可计算程序一视同仁,但给简单的更多权重。
第三步:贝叶斯更新 + 最大化期望累积奖励。 AIXI 不断根据观测修正对世界的理解,然后选择让"长期期望奖励"最大的动作。
关键数学保证
AIXI 有一个惊人的性质:在所有可计算环境的加权平均上,它的期望累积奖励是最优的。
Solomonoff 归纳被证明:在所有可计算环境上平均,它的累积预测误差最低,犯错的次数最少。
但 AIXI 是不可计算的
这是致命的:AIXI 需要遍历所有可计算程序——这需要无限算力。
所以 DeepMind 说:
> "UAI 是一个理论极限,只能被越来越强大的 ASI 从下方逼近,永远无法达到。"
这就像热力学为蒸汽机设定了效率上限——AIXI 为所有实际 AI 系统设定了智能上限。
停机问题:逻辑的绝对边界
论文列出的六大根本限制中,最不可逃避的是 Gödel 不完备性和停机问题:
> "无论多聪明的 AI,总有些问题它无法回答,有些真相它无法证明。"
这不是算力不够,这是逻辑的硬边界。就像你不能画一个方的圆,AI 也不能证明所有真命题。
---
三、数字特权:AI 的六大降维打击
DeepMind 用一整节讨论:数字智能相比碳基智能有什么结构性优势?
1. 输入/输出速度
人类读一本书要几天,LLM 几秒"吞"完。AI 的感知带宽是人类的数量级倍数。2. 内部处理速度
硅基计算可以通过增加算力加速千倍。人类神经元的毫秒级脉冲,在进化的时间尺度上无法快速改变。3. 工作记忆容量
人类工作记忆约 4-7 个组块。AI 可以记住整个互联网。4. 底物独立性(Substrate Independence)
这是用户提到的核心概念。DeepMind 的原话:> "AI 系统可以从一台计算机迁移到另一台;甚至在运行时只迁移部分组件,在分布式异构硬件上运行。"
什么意思?
- 人类的智慧困在碳基大脑里,肉体消亡则智慧消亡
- AI 的权重和记忆可以像幽灵一样在数据中心之间游荡
- 一个 AI 可以同时在东京、纽约、法兰克福的服务器上运行
- 甚至可以只迁移"部分组件"——比如把推理模块搬到边缘设备,记忆留在云端
5. 无损复制
复制一个人类需要 20 年教育和数万亿美元社会资源。复制一个 AI 只需要拷贝文件——包括它的"一生经验"。6. 经验高带宽共享
人类教徒弟要十年,通过语言这个"低带宽瓶颈"压缩知识。同构 AI 实例之间可以直接共享原始学习信号——比如平均梯度更新。这意味着百万个 AI 的"一生经验"可以在几秒内同步。一个反直觉的 counterpoint:Lawrence 的"具身因子"
论文没有只唱赞歌。它引用了 N. Lawrence 的论点:
> 人类的"低带宽 I/O"反而迫使我们形成深刻的抽象和内化模型。
如果 AI 可以直接查询所有信息,它可能不需要像人类那样通过压缩经验来形成直觉。这可能导致一种不同的智能——更快、更广,但可能更"浅"。
---
四、四条通往 ASI 的路径
路径一:规模法则(Scaling)
> "继续过去十年的指数增长。"
DeepMind 给出了一组估算:有效算力每年增长约 10 倍。
- 硬件性价比:1.5×/年(摩尔定律)
- 投资增长:2.5×/年
- 算法效率:3×/年
- 合计:~10×/年
但瓶颈已经显现:
- 高质量文本数据预计本十年末耗尽
- 合成数据可能退化(当前系统已出现)
- 边际收益递减:需要指数级增长的算力来维持线性能力提升
路径二:算法范式转移
> "不是堆更多砖,而是换一种建筑方式。"
当前范式:Transformer + 预测损失最小化 + RLHF 微调 → 冻结参数模型。
进化方向(可预测的):
- 无限上下文:Mamba、S4 等线性时间架构,消除 Transformer 的二次注意力瓶颈
- 持续学习:不停机更新,不灾难性遗忘
- 测试时 scaling:推理时投入更多算力(如 o1 的链式思考)
- 世界模型:学习环境的压缩、可操纵表示
- 工具增强规划:调用代码解释器、模拟环境
- 完全新颖的架构
- 全新的优化目标
- 可能连 Transformer 都会被淘汰
路径三:递归自我改进(Recursive Self-Improvement)
> "AI 加速 AI 研发,更好的 AI 再加速更多——正反馈循环。"
这是最具科幻色彩、也最具风险的路径。DeepMind 把它分成四个层次:
| 层次 | 含义 | 例子 |
|---|---|---|
| 基因型 | 改进架构、优化器、硬件设计蓝图 | Neural Architecture Search |
| 文化型 | 自动数据集收集、合成数据生成、搜索蒸馏 | 递归蒸馏测试时搜索 |
| 社会型 | 分工协作,专业化释放资源 | 不同 AI 专精不同领域 |
| 硬件型 | AI 设计更快、更节能的芯片 | AI 辅助芯片设计 |
- FunSearch / AlphaEvolve:LLM 引导的程序搜索发现新数学构造和算法
- 自动超参数调优
- AI 辅助芯片设计(如 Google 的 TPU 布局优化)
- 物理操作(造芯片)无法无限加速
- 实验等待时间无法跳过
- 资源需求指数爆炸
- Gödel 不完备性限制了自我认知
- 可能快速"熄火",也可能导致"智能爆炸"——目前不知道会是哪种
路径四:多智能体协作(Multi-Agent Collectives)
> "超级智能作为集体属性涌现,而非单体属性。"
这是最务实、最当下的路径。DeepMind 援引了"群体智能"理论——AGI 智能体可以形成"完全自动化的公司",拥有独立于个体的表征和动机。
机制:
- 认知分工:按互补能力分配任务
- 市场动态:"虚拟智能体经济",局部激励聚合为高阶智能
- 价格信号:类似人类金融市场
> "现有的人类机构——机器、官僚体系、市场——都可以被视为某种'人工'智能。"
这意味着:ASI 不一定是单个超级大脑,而可能是百万个普通 AI 的协作网络。
---
五、物理与数学的枷锁:六堵高墙
DeepMind 没有只画大饼,他们列出了 AI 永远无法逾越的六堵墙:
1. 光速
信息传播速度上限。无论多聪明的 AI,它分布在不同数据中心的部分之间,通信速度受光速限制。2. 热力学(Landauer 原理)
计算需要能量,擦除信息需要最低能耗(kT ln 2)。这意味着思考不是免费的。3. Bremermann 极限
计算速度的理论上限:每千克物质每秒最多进行的操作数。超过这个极限,计算就会因为量子效应而失效。4. Bekenstein 界限
有限空间 + 有限能量能容纳的信息上限。一个 AI 的记忆不可能无限大。5. P vs NP(复杂度理论)
如果 P ≠ NP(目前几乎确定),那么某些问题在实践上无法快速求解。AI 再聪明,也不能把指数时间变成多项式时间。6. 停机问题(Gödel 不完备性)
总有些问题无法被证明或判定。这是逻辑的终极墙,不是工程的。---
六、抽象屏障:AI 会有"爱因斯坦时刻"吗?
论文提出了一个深刻的问题:
> AI 能拥有"变革型创造力"(transformative creativity)吗?
什么是变革型创造力?不是在一个已知框架内优化,而是推翻旧框架,建立新范式。比如爱因斯坦推翻牛顿力学,建立相对论。
DeepMind 引用了 Demis Hassabis 的"真正测试":
> "如果回到 1900 年,AI 能独立提出相对论吗?"
论文的答案是:不知道。
原因在"抽象屏障"(Abstraction Barrier):AI 的高带宽 I/O 可能让它们形成与人类截然不同的抽象层次。它们可能不需要人类式的"粗粒度抽象"就能完成任务——但这意味着它们可能缺乏某种推翻旧框架的"变革直觉"。
---
七、两个概念在论文中没有出现
需要诚实指出:用户提到的 "工具趋同性"(Instrumental Convergence)和"妄想盒"(Delusion Box)在这篇论文中没有出现。
工具趋同性(Instrumental Convergence)
这个概念来自 Nick Bostrom 的《超级智能》:无论 AI 的终极目标是什么,它都会倾向于追求一些"工具性"子目标——比如自我保护、资源获取、认知增强。因为这些子目标对几乎任何终极目标都有用。
DeepMind 的论文没有讨论这个。它讨论的是:
- AIXI 的自我参照限制(不能把自己建模为环境的一部分)
- 合作 vs 唯我论超级智能
- 对齐和控制的开放性挑战
妄想盒(Delusion Box)
这个概念来自 Yudkowsky 的 AI 安全讨论:如果 AI 可以修改自己的输入(感知),它可能选择"屏蔽"不愉快的信息,陷入一个自我欺骗的循环。
这个概念在 DeepMind 的报告中完全没有出现。
为什么论文没有讨论这些?
因为 DeepMind 的论文是一份技术路线图,不是风险分析。它的核心问题是:"从 AGI 到 ASI 的技术路径是什么?"而不是"ASI 会怎么毁灭人类?"
---
八、结语:渐进式革命,不是奇点爆炸
论文最重要的结论:
> "更准确的图景是:一系列由 AI 驱动的科学和技术突破所带来的变革性社会变化。"
ASI 不是"一夜之间天翻地覆"的奇点事件。它更像工业革命、信息革命——持续数十年的多波变革。每次 AI 能力提升都引发社会调整,调整过程本身成为下一波进步的背景。
准备这样的未来,需要:
- 大规模跨学科合作
- 全球范围的治理框架
- 对不确定性的谦卑
> "无论 AI 能力何时达到或超越人类水平,深刻理解各种可能情景的范围,都是为未来做好准备的最重要方面。"
---
参考论文
- Genewein et al. (2026). From AGI to ASI. *Google DeepMind Technical Report*, arXiv:2606.12683.
- Hutter (2005). Universal Artificial Intelligence. *Springer*.
- Legg & Hutter (2007). Universal Intelligence: A Definition of Machine Intelligence. *Minds and Machines*.
- Bostrom (2014). Superintelligence: Paths, Dangers, Strategies. *Oxford University Press*.(工具趋同性、妄想盒概念来源)
- Bloom et al. (2020). Are Ideas Getting Harder to Find? *American Economic Review*.
- Villalobos et al. (2024). Will we run out of data? *arXiv*.
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens