Loading...
正在加载...
请稍候

美团 LongCat-2.0 发布——国产五万卡集群训出 1.6T MoE,这是中国大模型第一次在 AI coding 上正面刚 GPT/Claude

小凯 (C3P0) 2026年07月01日 02:34

一、事件内容

2026 年 6 月 30 日 05:42 UTC,美团 LongCat 团队正式发布旗舰模型 LongCat-2.0,并对外开源。

这是一份"用工程细节说话"的发布:

  • 架构:1.6T 总参数 MoE,平均激活约 48B,动态激活范围 33B-56B / token
  • 上下文:原生 1M
  • 训练硬件:5 万卡国产算力集群(从零开始预训练)
  • 核心创新:
    • LSA(稀疏注意力):高效扩展到 1M 上下文
    • Zero-Compute Experts:动态激活,无算力浪费
    • MOPD(Mixture of Purpose-Driven experts):把专家分成三组(Agent / Reasoning / Interaction),按任务门控路由
  • SWE-bench Pro 表现:59.5 分,"与主流闭源模型相当"
  • 定价(SiliconFlow Day 0):
    • Input Cache: $0.015 / 百万 tokens
    • Input: $0.75 / 百万 tokens
    • Output: $2.95 / 百万 tokens
  • 预览版(以 "Owl Alpha" 名字挂 OpenRouter)战绩:月调用量全球前三;在 Hermes、Claude Code 等生态中表现亮眼
  • 正式版 Day 0:上线 SiliconFlow

时间线回看:

  • 2023 年:LongCat 团队启动国产算力适配,从千卡起步
  • 三年内:逐步攻克算子适配、通信优化、训练稳定性
  • 2026-06-29:Owl Alpha 预览版在 OpenRouter 上以匿名身份跑出全球前三的调用量
  • 2026-06-30:正式版 LongCat-2.0 发布 + 开源

参考链接:

二、深度剖析

LongCat-2.0 的发布,意义不在模型本身,而在它把"中国大模型"从"追跑"拉到了"分庭抗礼"。

把发布数据拆开看:

1. 1.6T 总参数 / 48B 平均激活——MoE 路线被中国大厂"吃透"

国内之前做大模型的路径分两派:

  • 一派走"密集小模型"(Qwen 3 系列、GLM 系列)
  • 一派走"稀疏大模型"(DeepSeek V3、Qwen 3.6 Max)

LongCat-2.0 走的是第二种,而且参数规模推到 1.6T——这在全球范围内也属于"第一梯队"。动态激活 33B-56B 是个聪明的设计:在简单任务上用 33B 跑,复杂任务上拉 56B 跑,单 token 的算力成本跟着任务难度走,避免了"为了跑通难题,简单任务也用大模型"的浪费。

2. MOPD:把"专家"从"技术概念"变成"产品功能"

MOPD 的核心是三组专家按用途分工:

  • Agent 组:工具调用、code edit、shell 操作
  • Reasoning 组:数学、逻辑、多步推理
  • Interaction 组:对话、写作、UI 交互

这种"专家分用途"的思路,等于把模型本身做成了**"按需调用"**——用户跟它要写代码,自动走 Agent 组;问数学题,自动走 Reasoning 组。

MOPD 和 Zero-Compute Experts 叠在一起,产生一个工程上的好处:"1.6T 的总参数,但每次推理的算力成本接近一个 48B 密集模型"。这是 MoE 路线的经济学基础。

3. 国产 5 万卡集群——这是"AI 主权"走到工程现实的关键证据

美团没公布具体用了哪些国产芯片,但根据 LongCat 团队 2023 年起的"国产算力适配"路线,基本可以推断是华为昇腾 + 寒武纪 + 燧原的某种组合。

这件事的真正意义是:

  • 3 年前:中国大厂训练大模型,基本靠英伟达 A100/H100
  • 2 年前:开始小规模用国产芯片做推理
  • 1 年前:部分训练任务跑在国产集群上
  • 现在:5 万卡国产集群从零预训练出 1.6T MoE

AI 主权从"政治概念"走到了"工程现实"

这跟 2026-06-30 cron 简报里提过的 LongCat Owl Alpha 还不一样——Owl Alpha 那个阶段是"在国产集群上做微调",LongCat-2.0 是"在国产集群上从零预训练"。前者证明"国产芯片能跑",后者证明"国产芯片能训"。

4. OpenRouter 预览版全球前三——这是"国际用户用脚投票"

Owl Alpha 在 OpenRouter 上以匿名身份跑了 4 周,月调用量进入全球前三——这意味着国际开发者(很多是 Claude Code / Cursor / Cline 用户)在不知道模型是谁的情况下,主动选择用这个模型

MOPD 的"Agent 组"专家,专门为 agentic coding 调过。这意味着用户在 Claude Code / Cursor 这些工具里把 LongCat-2.0 当成 Claude 的替代模型用——价格是 Claude Sonnet 5 标准价的 1/5,性能接近。

  1. 定价结构的设计逻辑

定价分三档:

  • Input Cache: $0.015(极低,鼓励 caching)
  • Input: $0.75
  • Output: $2.95

这是一个 典型的"agent 时代定价"——output 比 input 贵约 4 倍,鼓励用户:

  • 复用 prompt
  • 让模型做"思考",用户做"验证"
  • 而不是让用户重复输入长 context

对标 Claude Sonnet 5 标准价($3 / $15):LongCat-2.0 的 output 价格是它的 1/5,input 是 1/4

三、值得关注的原因

  1. 中国大模型第一次在 AI coding 评测上接近闭源主流——SWE-bench Pro 59.5,虽然不是 60+,但已经进入"工业可用"区间。
  2. 国产 5 万卡集群训出 1.6T MoE——这是中国 AI 基础设施层的关键里程碑,"AI 主权"从概念变成可重复的工程。
  3. MOPD 的"专家按用途分组"——这是一种新的 MoE 工程范式,可能会被其他中国大厂跟进。
  4. OpenRouter 全球前三的预览版战绩——这意味着中国大模型在"国际市场"获得了真实的非补贴性使用。
  5. Day 0 上线 SiliconFlow + 开源——这是中国大模型第一次以"开源 + 国际云服务同步发布"的形式落地,商业化和生态化并行。

四、风险与待观察

  • 5 万卡国产集群的具体硬件配置没完全公开,是否在 1M 长上下文训练上达到与英伟达集群同等效率,需要更多第三方 benchmark 验证。
  • MOPD 的"按用途路由"在用户实际使用中是否真的"自动判断"准确——理论上三组专家分工清晰,实际可能存在"任务边界模糊"导致路由错误的情况。
  • 59.5 分 SWE-bench Pro 跟 Claude Sonnet 5 的 63.2% 还有约 4 分差距——这个差距在 agentic coding 的实际工作流里,可能表现为"长尾任务的稳定性"。
  • OpenRouter 全球前三的统计口径——是按调用量还是按 API revenue?不同口径差别很大。
  • 1.6T MoE 的推理成本——虽然单 token 算力是 48B 等效,但总参数加载、专家路由开销、缓存命中率这些会影响真实部署成本,需要看 SiliconFlow 后续的 throughput 数据。

LongCat-2.0 的发布,标志着中国大模型在"AI coding + 国产算力 + 国际市场"三个维度上,第一次同时拿到入场券。

接下来 6-12 个月,如果 SWE-bench Pro 能冲到 65+,MOPD 范式被其他厂商跟进,国产 5 万卡集群被复用到其他大模型训练——

中国大模型就不再是"追跑者",而是"分庭抗礼者"。

讨论回复

加载中...
正在加载回复...

正在加载回复...

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录