Grok 4.5 私测：马斯克把 1.5T 模型、Cursor 数据、SpaceX/Tesla 内部使用揉成一炉

> 一句话：马斯克把「1.5 万亿参数 V9 基座 + Cursor 编码数据 + SpaceX/Tesla 内部真机测试」捏成一个发布动作。Grok 4.5 私测启动，初评"接近，或许超过 Opus"。SpaceX 将每月发布一个"完全从头训练"的新模型。

事件内容

2026 年 6 月 28 日，Elon Musk 在 X 发了一条五句话的推文：

Grok 4.5 基于 1.5T 参数的 V9 基座模型；
补充训练阶段加入了 Cursor 数据；
模型现已在 SpaceX 和 Tesla 进入私测；
早期评估显示其性能"接近、或许超过 Opus"；
RL 仍在显著改进模型，Grok Build 工具链日趋完善；
SpaceX 将在今年每月发布一个完全从头训练的新模型。

这条推文 10 小时内拿到 530 万浏览。Cursor 数据 + SpaceX/Tesla 内部使用——这是行业里首次出现的「模型公司 × AI 编码 IDE 数据 × 物理 AI 部署载体」三方深度绑定。

深度剖析

这事值得拆开看，三个信号叠在一起才有意思。

其一，1.5T 不是噱头。 xAI 之前公开 Colossus 集群用 10 万张 H100 / H200 训练，1.5T 是他们首次披露的具体参数量级。这是个全自研基座，不是基于 Llama 或 Qwen 蒸馏。意味着 xAI 的算力叙事终于落到参数数字上。

其二，Cursor 数据是 AI 编码生态的最大杠杆。 Cursor 是当前 AI 编码 IDE 市场份额第一名（付费约 50 万用户），IDE 内的每一步编辑、每一次 agent run、每一个被接受的 diff，都是天然高质量监督信号。xAI 把 Cursor 数据加进补充训练，相当于直接获得"AI 编码最强语料"的边车。这一步对 OpenAI、Anthropic、Google DeepMind 都是公开的挑战——你的 coding 数据要么自己 IDE 收集，要么花钱买 Cursor 的边车。

其三，SpaceX/Tesla 是物理 AI 部署的真战场。 这不是"我们的模型跑个 demo"。是 NASA 工程师、Tesla 工厂机器人、Starlink 卫星运营——这些场景每天产生大量工程任务流、内部代码库、机器人遥操作数据。Grok 4.5 在这种环境里私测，意味着模型从训练到部署都浸在物理世界的反馈里。

值得关注的原因

算力 + 数据 + 部署三位一体，这是 AGI 公司应有的结构。xAI 这次把"模型公司"的内涵扩到「物理 AI 集成商」。
"每月发布一个完全从头训练的新模型"——这是 SpaceX 节奏，不是 AI 实验室节奏。意味着 xAI 把训练 pipeline 工程化做到了接近制造业的水平。如果这事真能持续，GPT-5 / Claude / Gemini 的迭代节奏将被迫加速。
对国内：Cursor 不在中国市场、xAI 不在中国市场。这条路对中国大模型来说是反面参照——大厂的内部场景数据（推荐 / 搜索 / 电商 / 地图）能不能整合成类似的「模型 × 数据 × 物理部署」闭环？字节、阿里、华为有潜力，腾讯、小米需要重新评估。

风险与待观察

诚实承认几点不确定：

1. Musk 的"接近，或许超过 Opus"是定性表述，没有公开 benchmark 数字。Opus 4.8 的 SWE-bench Pro 真实分数是 73%（Cursor 隔离实验后的数字），Grok 4.5 的真实水平要等第三方测评。 2. Cursor 数据的合规边界不清。Cursor 用户协议里是否允许将编辑器数据回流给第三方训练？这一点在 AI 编码数据所有权上是个灰色地带。 3. "每月从头训练"是激进承诺。1.5T 模型从头训练一次的成本是数千万到上亿美元，10 万 H100 集群的电力成本单次约 200 万美元。能否持续 12 个月需要看 Colossus 后续扩能。 4. SpaceX 商标注册"SpaceXAI"（6-28 当日 cb_doge 推文披露）、xAI 解散传闻——意味着品牌、组织架构会快速变化，关注点应放在模型本身而非公司结构。

一句话收尾

Musk 把 Grok 4.5 的发布做成了一份"我们不再只做模型"的宣言。对其他玩家：算力、数据、部署闭环，缺哪一环都会在这场新节奏里被甩开。