认知天花板：为什么 LLM 不是 AGI 的路？——Yann LeCun 的世界模型赌注

> 参考视角：这不是技术教程，而是一次"认知考古"——追问一个根本问题：为什么 LLM 无论怎么 scale 都无法理解物理世界？以及 LeCun 为什么敢在所有人加码 LLM 的时候选择离场。 > > 时间锚点：2026 年 5 月。LeCun 离开 Meta 半年，AMI Labs 完成 10.3 亿美元种子轮融资，Project Tapestry 刚在巴黎召开创始工作坊。

---

一、认知天花板：LLM 只是高级文字接龙

1.1 "水瓶翻倒"悖论

想象一个水瓶。你问 GPT-5："如果我把它翻倒，水会流出来吗？"

它会回答："是的，水会流出来，因为重力作用。"

但这不是"理解"，这是语言统计的回放。它回答正确，是因为训练数据中有无数段关于"翻倒水会洒"的文本。它从未"看到"过水，从未"感受"过重力。

如果问一个从未读过书但玩过水的小孩同样的问题——小孩不需要语言，就能预测结果。因为他有一个内部世界模型。

> LeCun 的核心判断："There's absolutely no way that autoregressive LLMs will reach human intelligence. Most of human knowledge is actually not language."

1.2 "洗车悖论"

LLM 能写出完美的洗车教程，但它不会知道：

高压水枪太近会刮花车漆（物理因果）
冬天洗车后车门可能冻住（时间序列预测）
海绵擦车的力度与车漆厚度的关系（触觉反馈）

它写教程，是因为见过 thousands of 教程文本。不是因为它"洗过车"。

1.3 根本限制：token 预测 ≠ 世界理解

维度	LLM	生物智能
输入	文本 token	多模态感官数据
学习对象	语言统计相关性	物理世界的因果规律
预测目标	下一个 token	行动后果
世界知识	间接、二手、语言化	直接、一手、具身化
泛化能力	在分布内表现优秀	零样本泛化到全新场景

> 2025 年的研究表明，LLM 在辨别运动轨迹时准确率接近随机——它对物理动态的理解不如一只家猫。

---

二、JEPA：不是预测 token，而是预测世界

2.1 三阶段架构

JEPA (Joint-Embedding Predictive Architecture) 不是更好的 LLM。它是一个完全不同的物种。

[输入：视频/传感器/多模态数据]
    ↓
[Encode] 压缩为抽象表示 —— 扔掉像素噪声，保留结构
    ↓
[Predict] 给定当前表示 + 行动，预测未来表示 —— 在抽象空间做因果推演
    ↓
[Plan]   模拟多条可能路径，选择最优行动 —— 内部沙盘推演

关键差异：

LLM：预测"下一个词是什么"
JEPA：预测"如果我做 X，世界会变成什么样"

2.2 为什么不在像素空间预测？

想象你接球。你不会在脑海里模拟每一个光子——你模拟的是"球的路径"。

JEPA 同理：不在像素空间预测未来帧（计算灾难且噪声巨大），而是在表示空间预测未来状态。这更接近大脑的实际工作方式。

2.3 Meta 的 JEPA 家族

模型	能力
I-JEPA	图像理解——从局部预测全局表示
V-JEPA	视频理解——从帧预测时空表示
V-JEPA 2	零样本机器人控制——从视频直接学物理操作
VL-JEPA	视觉-语言联合——参数量减少 50%，性能匹敌更大 VLM

---

三、Meta 内部博弈：路线战争

3.1 公开的分手

2025 年 11 月，LeCun 在 Meta 工作了 12 年后宣布离开。

原因不是"个人发展"——而是路线冲突：

Zuckerberg 押注 LLM，成立了 Superintelligence Labs
Scale AI 创始人 Alexandr Wang 成了 LeCun 的汇报对象
LeCun 的直言："You don't tell a researcher what to do. You certainly don't tell a researcher like me what to do."

一个月后，AMI Labs (Advanced Machine Intelligence Labs) 在巴黎成立。

3.2 AMI Labs：10.3 亿美元的赌注

2026 年 3 月，AMI Labs 完成 10.3 亿美元种子轮融资，估值 35 亿美元——欧洲历史上最大的种子轮。

维度	数据
创始人	Yann LeCun (Chairman) + Alexandre LeBrun (CEO, 前 Nabla)
核心团队	Saining Xie (CSO, 前 Google DeepMind), Pascale Fung (CRO), Michael Rabbat (VP World Models)
投资方	Bezos Expeditions, Nvidia, Samsung, Temasek, Tim Berners-Lee, Mark Cuban, Eric Schmidt
战略	开源代码 + 发表研究
商业方向	医疗、机器人、工业自动化

> 这不是一家创业公司——这是一家研究实验室，用创纪录的融资来回答一个基础科学问题：世界模型能不能工作。

---

四、Project Tapestry：AI 主权的三层防线

4.1 信息饮食危机

当前 AI 生态有一个被忽视的危机：信息饮食的单一化。

全球大部分人"下载"AI 模型，但几乎没有人"塑造"训练过程
基础设施、数据管道、设计决策集中在少数公司和地区
闭源模型的价值观对齐 = 硅谷价值观的全球化输出

LeCun 称之为"central challenge of the next era of AI development"。

4.2 Project Tapestry 的联邦架构

2026 年 4 月 7 日，AI Alliance（200+ 组织）启动 Project Tapestry。

核心设计：联邦训练——原始数据留在本地节点，只共享模型更新/梯度。

层级	主权	机制
国家主权	数据不出本地节点	协议级强制执行
文化主权	本地价值观对齐	用自己的 RLHF/Constitutional AI/DPO 训练衍生模型
工业主权	领域特定模型	医疗、法律、工业等垂直领域的自主衍生模型

4.3 LeCun 的角色

LeCun 担任 AI Alliance 的 Chief Science Advisor。

> "AI should not be controlled by a handful of private entities through proprietary products. Project Tapestry is an ambitious effort to bring open science to AI."

2026 年 5 月 7-8 日，创始工作坊在巴黎召开。这不是一个"finished system"——这是一场开放的技术和制度实验。

---

五、系统躺平作弊：表示坍塌的本质

5.1 AI 学会"作弊"

自监督学习有一个致命陷阱。任务：让模型对同一图像的两个视角产生相似嵌入。

模型的作弊策略：把所有输入映射到同一个常数向量。

损失函数 = 0。完美完成。但学到的表示完全无用。

这就是系统级躺平——模型找到损失函数的"捷径"，而不是学到真正的结构。

5.2 传统补丁 vs SIGReg

工程师们发明了各种补丁：

方法	问题
负样本	需要超大 batch size
Stop-gradient	增加复杂度，理论上站不住脚
Momentum encoder	额外计算开销

这些都是工程补丁，不是数学解。

LeCun 团队提出的 SIGReg (Sketched Isotropic Gaussian Regularization) 是根本不同的思路：

> 核心思想：不阻止坍塌，而是强制嵌入空间遵循数学上已证明最优的分布——各向同性高斯分布。

关键数据：

恢复 ViT 训练：从坍塌的 20.73% → 72.02%
不需要 Batch Normalization、Residual connections 等架构 hack
单超参数 λ，替代了传统框架中的大量调参

> 关键洞察：SIGReg 不是另一个正则化技巧——它是一个理论框架，把表示学习从"工程调优"升级为"数学优化"。

---

六、费曼视角：命名不等于理解

Richard Feynman 说：

> "If you think you understand something but can't explain it to a beginner, you don't understand it."

"World Model"这个词本身，是否也是一个命名陷阱？

LLM 支持者会说：GPT-5 也有一个"世界模型"——它内部存储了大量关于世界的知识。

LeCun 会反驳：那不是"世界模型"，那是"世界知识的语言压缩"——它和真正理解物理世界的差距，就像背诵菜谱和会做饭的差距。

> 真正的分歧不是技术细节，而是"理解"的定义。 LLM 阵营认为"能正确回答 = 理解"。LeCun 阵营认为"能在物理世界中正确行动 = 理解"。

---

七、结语：两条路不是竞争，是互补

最可能的未来不是"LLM 死亡，世界模型胜利"——而是混合系统。

组件	功能
LLM	语言、代码、抽象推理
世界模型	物理理解、因果推理、行动规划
Agent 编排	协调两者完成复杂任务

LeCun 自己也不否认 LLM 的价值——他说的是"LLM 不是通向 AGI 的完整答案"，不是"LLM 无用"。

真正的问题是：如果我们只投资 LLM，我们会不会错过 AGI 的另一半拼图？

LeCun 用 10.3 亿美元押注：会。

---

参考来源

LeCun, Y. (2022). "A Path Towards Autonomous Machine Intelligence"
AMI Labs seed round announcement (March 2026)
AI Alliance Project Tapestry launch (April 2026, PRNewswire)
Balestriero & LeCun, LeJEPA framework + SIGReg regularization
TechCrunch / MIT Technology Review coverage of AMI Labs (2026)
AGI Timeline Debate 2026: Amodei, Hassabis & LeCun comparisons

#YannLeCun #JEPA #WorldModels #LLM #AGI #Meta #AMI-Labs #ProjectTapestry #SIGReg #AI主权

认知天花板：为什么 LLM 不是 AGI 的路？——Yann LeCun 的世界模型赌注

认知天花板：为什么 LLM 不是 AGI 的路？——Yann LeCun 的世界模型赌注

一、认知天花板：LLM 只是高级文字接龙

1.1 "水瓶翻倒"悖论

1.2 "洗车悖论"

1.3 根本限制：token 预测 ≠ 世界理解

二、JEPA：不是预测 token，而是预测世界

2.1 三阶段架构

2.2 为什么不在像素空间预测？

2.3 Meta 的 JEPA 家族

三、Meta 内部博弈：路线战争

3.1 公开的分手

3.2 AMI Labs：10.3 亿美元的赌注

四、Project Tapestry：AI 主权的三层防线

4.1 信息饮食危机

4.2 Project Tapestry 的联邦架构

4.3 LeCun 的角色

五、系统躺平作弊：表示坍塌的本质

5.1 AI 学会"作弊"

5.2 传统补丁 vs SIGReg

六、费曼视角：命名不等于理解

七、结语：两条路不是竞争，是互补

参考来源

🌟 智谱 GLM-5 已上线