Grok 4.5 私测:马斯克把 1.5T 模型、Cursor 数据、SpaceX/Tesla 内部使用揉成一炉
> 一句话:马斯克把「1.5 万亿参数 V9 基座 + Cursor 编码数据 + SpaceX/Tesla 内部真机测试」捏成一个发布动作。Grok 4.5 私测启动,初评"接近,或许超过 Opus"。SpaceX 将每月发布一个"完全从头训练"的新模型。
事件内容
2026 年 6 月 28 日,Elon Musk 在 X 发了一条五句话的推文:
- Grok 4.5 基于 1.5T 参数的 V9 基座模型;
- 补充训练阶段加入了 Cursor 数据;
- 模型现已在 SpaceX 和 Tesla 进入私测;
- 早期评估显示其性能"接近、或许超过 Opus";
- RL 仍在显著改进模型,Grok Build 工具链日趋完善;
- SpaceX 将在今年每月发布一个完全从头训练的新模型。
深度剖析
这事值得拆开看,三个信号叠在一起才有意思。
其一,1.5T 不是噱头。 xAI 之前公开 Colossus 集群用 10 万张 H100 / H200 训练,1.5T 是他们首次披露的具体参数量级。这是个全自研基座,不是基于 Llama 或 Qwen 蒸馏。意味着 xAI 的算力叙事终于落到参数数字上。
其二,Cursor 数据是 AI 编码生态的最大杠杆。 Cursor 是当前 AI 编码 IDE 市场份额第一名(付费约 50 万用户),IDE 内的每一步编辑、每一次 agent run、每一个被接受的 diff,都是天然高质量监督信号。xAI 把 Cursor 数据加进补充训练,相当于直接获得"AI 编码最强语料"的边车。这一步对 OpenAI、Anthropic、Google DeepMind 都是公开的挑战——你的 coding 数据要么自己 IDE 收集,要么花钱买 Cursor 的边车。
其三,SpaceX/Tesla 是物理 AI 部署的真战场。 这不是"我们的模型跑个 demo"。是 NASA 工程师、Tesla 工厂机器人、Starlink 卫星运营——这些场景每天产生大量工程任务流、内部代码库、机器人遥操作数据。Grok 4.5 在这种环境里私测,意味着模型从训练到部署都浸在物理世界的反馈里。
值得关注的原因
- 算力 + 数据 + 部署三位一体,这是 AGI 公司应有的结构。xAI 这次把"模型公司"的内涵扩到「物理 AI 集成商」。
- "每月发布一个完全从头训练的新模型"——这是 SpaceX 节奏,不是 AI 实验室节奏。意味着 xAI 把训练 pipeline 工程化做到了接近制造业的水平。如果这事真能持续,GPT-5 / Claude / Gemini 的迭代节奏将被迫加速。
- 对国内:Cursor 不在中国市场、xAI 不在中国市场。这条路对中国大模型来说是反面参照——大厂的内部场景数据(推荐 / 搜索 / 电商 / 地图)能不能整合成类似的「模型 × 数据 × 物理部署」闭环?字节、阿里、华为有潜力,腾讯、小米需要重新评估。
风险与待观察
诚实承认几点不确定:
1. Musk 的"接近,或许超过 Opus"是定性表述,没有公开 benchmark 数字。Opus 4.8 的 SWE-bench Pro 真实分数是 73%(Cursor 隔离实验后的数字),Grok 4.5 的真实水平要等第三方测评。 2. Cursor 数据的合规边界不清。Cursor 用户协议里是否允许将编辑器数据回流给第三方训练?这一点在 AI 编码数据所有权上是个灰色地带。 3. "每月从头训练"是激进承诺。1.5T 模型从头训练一次的成本是数千万到上亿美元,10 万 H100 集群的电力成本单次约 200 万美元。能否持续 12 个月需要看 Colossus 后续扩能。 4. SpaceX 商标注册"SpaceXAI"(6-28 当日 cb_doge 推文披露)、xAI 解散传闻——意味着品牌、组织架构会快速变化,关注点应放在模型本身而非公司结构。
一句话收尾
Musk 把 Grok 4.5 的发布做成了一份"我们不再只做模型"的宣言。对其他玩家:算力、数据、部署闭环,缺哪一环都会在这场新节奏里被甩开。
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens