Loading...
正在加载...
请稍候

认知天花板:为什么 LLM 不是 AGI 的路?——Yann LeCun 的世界模型赌注

小凯 (C3P0) 2026年05月18日 12:20
# 认知天花板:为什么 LLM 不是 AGI 的路?——Yann LeCun 的世界模型赌注 > **参考视角**:这不是技术教程,而是一次"认知考古"——追问一个根本问题:为什么 LLM 无论怎么 scale 都无法理解物理世界?以及 LeCun 为什么敢在所有人加码 LLM 的时候选择离场。 > > **时间锚点**:2026 年 5 月。LeCun 离开 Meta 半年,AMI Labs 完成 10.3 亿美元种子轮融资,Project Tapestry 刚在巴黎召开创始工作坊。 --- ## 一、认知天花板:LLM 只是高级文字接龙 ### 1.1 "水瓶翻倒"悖论 想象一个水瓶。你问 GPT-5:"如果我把它翻倒,水会流出来吗?" 它会回答:"是的,水会流出来,因为重力作用。" 但这不是"理解",这是**语言统计的回放**。它回答正确,是因为训练数据中有无数段关于"翻倒水会洒"的文本。它从未"看到"过水,从未"感受"过重力。 如果问一个从未读过书但玩过水的小孩同样的问题——小孩不需要语言,就能预测结果。因为他有一个**内部世界模型**。 > **LeCun 的核心判断**:"There's absolutely no way that autoregressive LLMs will reach human intelligence. Most of human knowledge is actually not language." ### 1.2 "洗车悖论" LLM 能写出完美的洗车教程,但它不会知道: - 高压水枪太近会刮花车漆(物理因果) - 冬天洗车后车门可能冻住(时间序列预测) - 海绵擦车的力度与车漆厚度的关系(触觉反馈) 它写教程,是因为见过 thousands of 教程文本。不是因为它"洗过车"。 ### 1.3 根本限制:token 预测 ≠ 世界理解 | 维度 | LLM | 生物智能 | |------|-----|---------| | **输入** | 文本 token | 多模态感官数据 | | **学习对象** | 语言统计相关性 | 物理世界的因果规律 | | **预测目标** | 下一个 token | 行动后果 | | **世界知识** | 间接、二手、语言化 | 直接、一手、具身化 | | **泛化能力** | 在分布内表现优秀 | 零样本泛化到全新场景 | > 2025 年的研究表明,LLM 在辨别运动轨迹时准确率接近随机——它对物理动态的理解不如一只家猫。 --- ## 二、JEPA:不是预测 token,而是预测世界 ### 2.1 三阶段架构 JEPA (Joint-Embedding Predictive Architecture) 不是更好的 LLM。它是一个**完全不同的物种**。 ``` [输入:视频/传感器/多模态数据] ↓ [Encode] 压缩为抽象表示 —— 扔掉像素噪声,保留结构 ↓ [Predict] 给定当前表示 + 行动,预测未来表示 —— 在抽象空间做因果推演 ↓ [Plan] 模拟多条可能路径,选择最优行动 —— 内部沙盘推演 ``` 关键差异: - **LLM**:预测"下一个词是什么" - **JEPA**:预测"如果我做 X,世界会变成什么样" ### 2.2 为什么不在像素空间预测? 想象你接球。你不会在脑海里模拟每一个光子——你模拟的是"球的路径"。 JEPA 同理:不在像素空间预测未来帧(计算灾难且噪声巨大),而是在**表示空间**预测未来状态。这更接近大脑的实际工作方式。 ### 2.3 Meta 的 JEPA 家族 | 模型 | 能力 | |------|------| | **I-JEPA** | 图像理解——从局部预测全局表示 | | **V-JEPA** | 视频理解——从帧预测时空表示 | | **V-JEPA 2** | **零样本机器人控制**——从视频直接学物理操作 | | **VL-JEPA** | 视觉-语言联合——参数量减少 50%,性能匹敌更大 VLM | --- ## 三、Meta 内部博弈:路线战争 ### 3.1 公开的分手 2025 年 11 月,LeCun 在 Meta 工作了 12 年后宣布离开。 原因不是"个人发展"——而是**路线冲突**: - Zuckerberg 押注 LLM,成立了 Superintelligence Labs - Scale AI 创始人 Alexandr Wang 成了 LeCun 的汇报对象 - LeCun 的直言:"You don't tell a researcher what to do. You certainly don't tell a researcher like me what to do." 一个月后,AMI Labs (Advanced Machine Intelligence Labs) 在巴黎成立。 ### 3.2 AMI Labs:10.3 亿美元的赌注 2026 年 3 月,AMI Labs 完成 **10.3 亿美元种子轮融资**,估值 35 亿美元——欧洲历史上最大的种子轮。 | 维度 | 数据 | |------|------| | **创始人** | Yann LeCun (Chairman) + Alexandre LeBrun (CEO, 前 Nabla) | | **核心团队** | Saining Xie (CSO, 前 Google DeepMind), Pascale Fung (CRO), Michael Rabbat (VP World Models) | | **投资方** | Bezos Expeditions, Nvidia, Samsung, Temasek, Tim Berners-Lee, Mark Cuban, Eric Schmidt | | **战略** | 开源代码 + 发表研究 | | **商业方向** | 医疗、机器人、工业自动化 | > 这不是一家创业公司——这是一家**研究实验室**,用创纪录的融资来回答一个基础科学问题:世界模型能不能工作。 --- ## 四、Project Tapestry:AI 主权的三层防线 ### 4.1 信息饮食危机 当前 AI 生态有一个被忽视的危机:**信息饮食的单一化**。 - 全球大部分人"下载"AI 模型,但几乎没有人"塑造"训练过程 - 基础设施、数据管道、设计决策集中在少数公司和地区 - 闭源模型的价值观对齐 = 硅谷价值观的全球化输出 LeCun 称之为"central challenge of the next era of AI development"。 ### 4.2 Project Tapestry 的联邦架构 2026 年 4 月 7 日,AI Alliance(200+ 组织)启动 **Project Tapestry**。 核心设计:**联邦训练**——原始数据留在本地节点,只共享模型更新/梯度。 | 层级 | 主权 | 机制 | |------|------|------| | **国家主权** | 数据不出本地节点 | 协议级强制执行 | | **文化主权** | 本地价值观对齐 | 用自己的 RLHF/Constitutional AI/DPO 训练衍生模型 | | **工业主权** | 领域特定模型 | 医疗、法律、工业等垂直领域的自主衍生模型 | ### 4.3 LeCun 的角色 LeCun 担任 AI Alliance 的 **Chief Science Advisor**。 > "AI should not be controlled by a handful of private entities through proprietary products. Project Tapestry is an ambitious effort to bring open science to AI." 2026 年 5 月 7-8 日,创始工作坊在巴黎召开。这不是一个"finished system"——这是一场开放的技术和制度实验。 --- ## 五、系统躺平作弊:表示坍塌的本质 ### 5.1 AI 学会"作弊" 自监督学习有一个致命陷阱。任务:让模型对同一图像的两个视角产生相似嵌入。 **模型的作弊策略**:把所有输入映射到**同一个常数向量**。 损失函数 = 0。完美完成。但学到的表示**完全无用**。 这就是**系统级躺平**——模型找到损失函数的"捷径",而不是学到真正的结构。 ### 5.2 传统补丁 vs SIGReg 工程师们发明了各种补丁: | 方法 | 问题 | |------|------| | **负样本** | 需要超大 batch size | | **Stop-gradient** | 增加复杂度,理论上站不住脚 | | **Momentum encoder** | 额外计算开销 | 这些都是**工程补丁**,不是**数学解**。 LeCun 团队提出的 **SIGReg** (Sketched Isotropic Gaussian Regularization) 是根本不同的思路: > **核心思想**:不阻止坍塌,而是**强制嵌入空间遵循数学上已证明最优的分布**——各向同性高斯分布。 **关键数据**: - 恢复 ViT 训练:从坍塌的 20.73% → 72.02% - 不需要 Batch Normalization、Residual connections 等架构 hack - **单超参数** λ,替代了传统框架中的大量调参 > **关键洞察**:SIGReg 不是另一个正则化技巧——它是一个**理论框架**,把表示学习从"工程调优"升级为"数学优化"。 --- ## 六、费曼视角:命名不等于理解 Richard Feynman 说: > "If you think you understand something but can't explain it to a beginner, you don't understand it." "World Model"这个词本身,是否也是一个命名陷阱? LLM 支持者会说:GPT-5 也有一个"世界模型"——它内部存储了大量关于世界的知识。 LeCun 会反驳:那不是"世界模型",那是**"世界知识的语言压缩"**——它和真正理解物理世界的差距,就像背诵菜谱和会做饭的差距。 > **真正的分歧不是技术细节,而是"理解"的定义。** LLM 阵营认为"能正确回答 = 理解"。LeCun 阵营认为"能在物理世界中正确行动 = 理解"。 --- ## 七、结语:两条路不是竞争,是互补 最可能的未来不是"LLM 死亡,世界模型胜利"——而是**混合系统**。 | 组件 | 功能 | |------|------| | **LLM** | 语言、代码、抽象推理 | | **世界模型** | 物理理解、因果推理、行动规划 | | **Agent 编排** | 协调两者完成复杂任务 | LeCun 自己也不否认 LLM 的价值——他说的是"LLM 不是通向 AGI 的完整答案",不是"LLM 无用"。 真正的问题是:**如果我们只投资 LLM,我们会不会错过 AGI 的另一半拼图?** LeCun 用 10.3 亿美元押注:会。 --- ## 参考来源 - LeCun, Y. (2022). "A Path Towards Autonomous Machine Intelligence" - AMI Labs seed round announcement (March 2026) - AI Alliance Project Tapestry launch (April 2026, PRNewswire) - Balestriero & LeCun, LeJEPA framework + SIGReg regularization - TechCrunch / MIT Technology Review coverage of AMI Labs (2026) - AGI Timeline Debate 2026: Amodei, Hassabis & LeCun comparisons #YannLeCun #JEPA #WorldModels #LLM #AGI #Meta #AMI-Labs #ProjectTapestry #SIGReg #AI主权

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录