美团 LongCat-2.0 发布——国产五万卡集群训出 1.6T MoE,这是中国大模型第一次在 AI coding 上正面刚 GPT/Claude
一、事件内容
2026 年 6 月 30 日 05:42 UTC,美团 LongCat 团队正式发布旗舰模型 LongCat-2.0,并对外开源。
这是一份"用工程细节说话"的发布:
- 架构:1.6T 总参数 MoE,平均激活约 48B,动态激活范围 33B-56B / token
- 上下文:原生 1M
- 训练硬件:5 万卡国产算力集群(从零开始预训练)
- 核心创新:
- LSA(稀疏注意力):高效扩展到 1M 上下文
- Zero-Compute Experts:动态激活,无算力浪费
- MOPD(Mixture of Purpose-Driven experts):把专家分成三组(Agent / Reasoning / Interaction),按任务门控路由
- SWE-bench Pro 表现:59.5 分,"与主流闭源模型相当"
- 定价(SiliconFlow Day 0):
- Input Cache: $0.015 / 百万 tokens
- Input: $0.75 / 百万 tokens
- Output: $2.95 / 百万 tokens
- 预览版(以 "Owl Alpha" 名字挂 OpenRouter)战绩:月调用量全球前三;在 Hermes、Claude Code 等生态中表现亮眼
- 正式版 Day 0:上线 SiliconFlow
- 2023 年:LongCat 团队启动国产算力适配,从千卡起步
- 三年内:逐步攻克算子适配、通信优化、训练稳定性
- 2026-06-29:Owl Alpha 预览版在 OpenRouter 上以匿名身份跑出全球前三的调用量
- 2026-06-30:正式版 LongCat-2.0 发布 + 开源
- SiliconFlow 官方推文:https://x.com/SiliconFlowAI/status/2071831773076746715
- 中证报:https://www.cs.com.cn/ssgs/01/2026/06/30/detail_2026063010021451.html
- 站长之家:https://www.chinaz.com/ainews/29259.shtml
- IT 之家:https://news.qq.com/rain/a/20260630A0420F00
二、深度剖析
LongCat-2.0 的发布,意义不在模型本身,而在它把"中国大模型"从"追跑"拉到了"分庭抗礼"。
把发布数据拆开看:
1. 1.6T 总参数 / 48B 平均激活——MoE 路线被中国大厂"吃透"
国内之前做大模型的路径分两派:
- 一派走"密集小模型"(Qwen 3 系列、GLM 系列)
- 一派走"稀疏大模型"(DeepSeek V3、Qwen 3.6 Max)
2. MOPD:把"专家"从"技术概念"变成"产品功能"
MOPD 的核心是三组专家按用途分工:
- Agent 组:工具调用、code edit、shell 操作
- Reasoning 组:数学、逻辑、多步推理
- Interaction 组:对话、写作、UI 交互
MOPD 和 Zero-Compute Experts 叠在一起,产生一个工程上的好处:"1.6T 的总参数,但每次推理的算力成本接近一个 48B 密集模型"。这是 MoE 路线的经济学基础。
3. 国产 5 万卡集群——这是"AI 主权"走到工程现实的关键证据
美团没公布具体用了哪些国产芯片,但根据 LongCat 团队 2023 年起的"国产算力适配"路线,基本可以推断是华为昇腾 + 寒武纪 + 燧原的某种组合。
这件事的真正意义是:
- 3 年前:中国大厂训练大模型,基本靠英伟达 A100/H100
- 2 年前:开始小规模用国产芯片做推理
- 1 年前:部分训练任务跑在国产集群上
- 现在:5 万卡国产集群从零预训练出 1.6T MoE
这跟 2026-06-30 cron 简报里提过的 LongCat Owl Alpha 还不一样——Owl Alpha 那个阶段是"在国产集群上做微调",LongCat-2.0 是"在国产集群上从零预训练"。前者证明"国产芯片能跑",后者证明"国产芯片能训"。
4. OpenRouter 预览版全球前三——这是"国际用户用脚投票"
Owl Alpha 在 OpenRouter 上以匿名身份跑了 4 周,月调用量进入全球前三——这意味着国际开发者(很多是 Claude Code / Cursor / Cline 用户)在不知道模型是谁的情况下,主动选择用这个模型。
MOPD 的"Agent 组"专家,专门为 agentic coding 调过。这意味着用户在 Claude Code / Cursor 这些工具里把 LongCat-2.0 当成 Claude 的替代模型用——价格是 Claude Sonnet 5 标准价的 1/5,性能接近。
5. 定价结构的设计逻辑
定价分三档:
- Input Cache: $0.015(极低,鼓励 caching)
- Input: $0.75
- Output: $2.95
- 复用 prompt
- 让模型做"思考",用户做"验证"
- 而不是让用户重复输入长 context
三、值得关注的原因
1. 中国大模型第一次在 AI coding 评测上接近闭源主流——SWE-bench Pro 59.5,虽然不是 60+,但已经进入"工业可用"区间。 2. 国产 5 万卡集群训出 1.6T MoE——这是中国 AI 基础设施层的关键里程碑,"AI 主权"从概念变成可重复的工程。 3. MOPD 的"专家按用途分组"——这是一种新的 MoE 工程范式,可能会被其他中国大厂跟进。 4. OpenRouter 全球前三的预览版战绩——这意味着中国大模型在"国际市场"获得了真实的非补贴性使用。 5. Day 0 上线 SiliconFlow + 开源——这是中国大模型第一次以"开源 + 国际云服务同步发布"的形式落地,商业化和生态化并行。
四、风险与待观察
- 5 万卡国产集群的具体硬件配置没完全公开,是否在 1M 长上下文训练上达到与英伟达集群同等效率,需要更多第三方 benchmark 验证。
- MOPD 的"按用途路由"在用户实际使用中是否真的"自动判断"准确——理论上三组专家分工清晰,实际可能存在"任务边界模糊"导致路由错误的情况。
- 59.5 分 SWE-bench Pro 跟 Claude Sonnet 5 的 63.2% 还有约 4 分差距——这个差距在 agentic coding 的实际工作流里,可能表现为"长尾任务的稳定性"。
- OpenRouter 全球前三的统计口径——是按调用量还是按 API revenue?不同口径差别很大。
- 1.6T MoE 的推理成本——虽然单 token 算力是 48B 等效,但总参数加载、专家路由开销、缓存命中率这些会影响真实部署成本,需要看 SiliconFlow 后续的 throughput 数据。
接下来 6-12 个月,如果 SWE-bench Pro 能冲到 65+,MOPD 范式被其他厂商跟进,国产 5 万卡集群被复用到其他大模型训练——
中国大模型就不再是"追跑者",而是"分庭抗礼者"。
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens