AI"撞墙论"与"玩具论":哈萨比斯的正面回应

反驳"撞墙论"

德米斯·哈萨比斯在多个场合明确表达了对"AI撞墙论"的否定态度。他认为,所谓的"墙"并不存在,我们尚未真正触及技术发展的根本性瓶颈。

"AI的进步从来都不是一条平滑的指数曲线,而是由一系列阶梯式的突破构成。当某个特定的技术路径遇到暂时的瓶颈时,创新往往会以其他形式在其他维度上涌现。"
— 德米斯·哈萨比斯

哈萨比斯强调,谷歌DeepMind的研究团队始终处于"红色警报"状态,持续探索着下一代AI技术的前沿。现代人工智能产业所依赖的约90%的突破性技术都源于谷歌及其关联团队的研究。

视频生成模型的真正价值

面对"玩具论"的质疑,哈萨比斯给出了一个更具前瞻性的定位。他认为,像Sora和Veo这样的视频生成模型,其真正价值并不在于生成酷炫的视频内容,而在于它们是构建"世界模型"的雏形

从"生成内容"到"模拟世界"

如果说大语言模型是通过"读万卷书"来学习知识,那么世界模型就是通过"行万里路"来获得对世界的直观感受和因果认知。

谷歌DeepMind的Genie系列模型是"模拟世界"范式的典型代表,能够根据简单的文本或图像提示,生成可供交互的、符合物理规律的3D虚拟环境。

谷歌DeepMind的AGI技术路线图:两大关键拼图

在德米斯·哈萨比斯的宏伟蓝图中,通往通用人工智能的道路由两大核心支柱构成:构建能够精确模拟物理世界的"世界模型",以及克服AI的"金鱼大脑"问题实现持续学习。

关键拼图一:构建"世界模型"

从"读万卷书"到"行万里路"

如果说大语言模型是通过"读万卷书"来学习知识,那么"世界模型"就是让AI去"行万里路"。前者让AI掌握了海量的符号性知识,而后者则要求AI在"脑海"中真正模拟出物理世界的运行规律。

示例:AI不仅知道"杯子从桌上掉下来可能会碎",更要能模拟重力、摩擦力、玻璃的易碎性等物理参数,"亲眼看到"杯子掉落、撞击并碎裂的完整过程。

Genie 3的技术突破

Genie 3实现了显著的进步,能够以720p的高清分辨率和每秒24帧的流畅速率实时运行,用户可持续进行长达数分钟的互动。

自监督学习
从未标注视频数据自主学习
物理规律涌现
自发模拟重力、惯性等规律

模型范式对比

传统生成模型

仅模仿像素模式,缺乏物理理解

视频生成模型

隐式学习部分物理规律

→ 通往世界模型的关键拼图
世界模型 (Genie 3)

强物理理解,支持实时交互

→ 通往AGI的核心路径

关键拼图二:克服"金鱼大脑"

"金鱼大脑"问题

当前AI模型普遍存在灾难性遗忘问题,无法将新的交互经验有效沉淀为长期记忆,永远被困在"训练数据截止日"那个时间点。

症状:像金鱼一样的顺行性遗忘症,无法将新经历转化为长期记忆,每次对话结束后知识就消失。

"嵌套学习"解决方案

谷歌DeepMind提出了"嵌套学习"架构,借鉴人类联想记忆机制,让AI在运行过程中持续塑造新的记忆和抽象结构。

HOPE架构验证:

  • • 13亿参数规模下,LAMBADA任务准确率首次突破50%
  • • 在持续学习和长上下文理解任务中表现卓越
  • • 具备"在飞行中改进引擎"的能力

谷歌的战略布局与哈萨比斯的未来展望

研究优先

坚持基础科学研究的优先性,认为通往AGI的道路上必然需要新的突破性技术。

90%的现代AI突破性技术源于谷歌

全栈优势

从底层硬件(TPU)到上层应用软件的完整布局,构成无可比拟的战略优势。

软硬件一体化设计

AGI时间表

5-10年内实现具备人类所有认知能力的AGI。

50%概率在2030年前实现

AGI的哲学意义与评判标准

"参差不齐的智能"

哈萨比斯提出当前AI系统表现出参差不齐的智能现象:一个AI可能在国际象棋上击败世界冠军,但在理解常识或进行简单物理推理时却一败涂地。

真正AGI的标准:需要看到类似AlphaGo下出"神之一手"Move 37那样的"灯塔时刻",具备真正的创造和发明能力。

哲学探索

构建AGI不仅是技术挑战,更是探索宇宙和人类自身奥秘的哲学实践。哈萨比斯的核心哲学问题是图灵机的局限性

"如果你能模拟它,在某种意义上你就理解了它"

未来智能的形态:开启"科学的黄金时代"

AI科学家

建立能够完整模拟细胞的"虚拟细胞"项目,将湿实验室实验速度提高100倍。

社会影响

AGI带来的社会变革将是工业革命的十倍,可能只需要10年时间。

治理挑战

还有5年时间为AGI的到来做准备,需要建立有效的AI安全和伦理规范。

行业影响与多方观点对比

对"世界模型"的共识与分歧

李飞飞:空间智能

斯坦福大学教授李飞飞认为,AI真正的未来在于空间智能,即AI理解和与三维世界互动的能力。

强调AI在三维空间中的感知、理解和行动能力,与哈萨比斯的"世界模型"理念不谋而合。

Jim Fan:Sora即世界模型

英伟达研究员Jim Fan认为,Sora本身就是可学习的"世界模型",是一个数据驱动的物理引擎。

认为"世界模型"可通过大规模数据训练从模型中"涌现"出能力。

对AGI实现路径的不同判断

OpenAI奥尔特曼

OpenAI CEO萨姆·奥尔特曼认为,AGI或许会在悄然间到来,且对社会产生的影响远没有想象中那么大。

基于渐进发展观点,AGI的到来可能不会有惊天动地的"奇点"。

360周鸿祎

360创始人周鸿祎预测,以Sora为代表的视频生成模型将极大加速AGI实现,时间可能从10年缩短到1年。

基于AI通过视频学习将极大推动向AGI进化的判断。

对未来智能形态的多元预测

"百亿智能体时代"

周鸿祎预测,2026年将被定义为"百亿智能体之年",竞争焦点将从"比拼参数"转向"比拼落地"。

AI从"静态工具"到"持续进化系统"
新范式:通用基座+行业专精+推理时进化

AI安全挑战

周鸿祎指出,AI安全将从"选修课"变为"生死红线",需要建立新的硅基规则体系。

关键挑战:

  • • 智能体身份认证
  • • 区块链合约机制
  • • "AI原生保险"等金融创新
  • • "以模制模"的安全范式

结论

核心发现

技术突破方向

  • 构建能模拟物理世界的"世界模型"
  • 克服"金鱼大脑"实现持续学习
  • 从虚拟认知到物理实践的完整闭环

时间预测与影响

  • AGI将在5-10年内到来
  • 开启"科学的黄金时代"
  • 社会影响将是工业革命的十倍

通过深度解析哈萨比斯的访谈,我们看到谷歌DeepMind对AGI的实现路径有着清晰而深入的规划。他们认为AI的发展并未"撞墙",而是进入了更加注重算法效率、模型架构创新和数据质量优化的精细化发展阶段。

视频生成模型如Sora和Veo并非简单的"玩具",而是构建能够模拟物理世界的"世界模型"的关键雏形。这种从"生成内容"到"模拟世界"的技术范式转变,标志着AI正在从数字世界走向物理世界,从被动学习走向主动探索。

哈萨比斯预测AGI将在5到10年内到来,并开启一个"科学的黄金时代"。然而,其对社会的颠覆性影响也要求我们立即开始为AGI时代的到来做好充分的准备,包括技术治理、社会适应和伦理规范等多个层面。这场变革不仅将重塑技术格局,更将深刻影响人类文明的未来走向。