美团 LongCat Owl Alpha 成了 OpenRouter 第一——而且它完全是国产 ASIC 训的,这意味着什么?

> 发布日期:2026-06-29 / 06-30 · 分类:模型发布/更新 · 标签:AI 主权 / 模型分发 > 来源:X:Emad Mostaque + Meituan_LongCat 官方账号 > 原文链接:https://x.com/EMostaque/status/2071701921241448574 > 模型博客:https://longcat.chat/blog/longcat-2.0/

---

事件内容

6 月 29 日晚 9 点(北京时间 6 月 30 日凌晨 5 点),AI 圈最有话题性的爆料账号 Emad Mostaque 发了一条推:

> 「OpenRouter 上最受欢迎的模型(10 万亿 tokens),竟然是美团(中国版超级应用 / DoorDash)的 1.6 万亿参数 MoE 模型。基本上 Gemini / Opus 4.6 水平。35 万亿 tokens 训练,全部跑在 5 万张国产 ASIC 上。不需要任何 GPU。」

美团 LongCat 官方账号在 9 小时后(6 月 30 日早上)确认:

> 「Owl Alpha 在 OpenRouter 上——是我们家的。公测上线以来,日活冲到全球 Top 3、Hermes Agent 上 #1、Claude Code 上 #2、OpenClaw 上月度 #3。」

公开信息汇总:

架构:1.6T 总参数 MoE(具体激活参数未公开,推测在几十 B 级别);
训练数据:35 万亿 tokens;
训练算力:完全部署在 5 万张国产 ASIC(型号未公开,但根据时间点推测是华为昇腾、寒武纪或某家国内 ASIC 厂商的下一代旗舰);
性能定位:Emad 评价「Gemini / Opus 4.6 水平」,这个说法偏夸张,但 OpenRouter 上 10 万亿 tokens 的使用量是硬指标——这意味着它在真实生产场景中被反复使用;
分发渠道:OpenRouter(中立国际平台);
应用场景:按官方说法,在 Hermes Agent(开源 coding agent)、Claude Code(Anthropic 的 coding agent)、OpenClaw(多模态 agent)上分别 #1 / #2 / #3。

这是「首例完全用国产 ASIC 训练、且在国际中立分发渠道上达到头部使用量」的万亿级模型。

深度剖析

为什么这件事比它看起来更重?

过去两年,中国大模型走出国界的路径一直是「GPT / Claude 的中国替代品」——GLM、Qwen、DeepSeek、Kimi 这些,虽然在国际基准上能和 GPT-4 掰手腕,但在「西方主流分发渠道」上的真实使用量始终是「少数族裔选项」。

LongCat Owl Alpha 不一样。它的使用场景是 coding agent + coding CLI——这是西方开发者每天都在用的工具链(Hermes、Claude Code、OpenClaw)。在一个「西方开发者的工作流」里,占据 Top 3 的位置,这是一个对国产模型生态能力的真正验证。

「Gemini / Opus 4.6 水平」这个 Emad 的说法需要打折——Emad 的口味一向偏激进。但 10 万亿 tokens 在 OpenRouter 上的真实使用量是不打折的:这意味着成千上万的西方开发者每天在用这个模型写代码。

「国产 ASIC 训万亿模型」这件事,意味着什么?

技术细节:5 万张 ASIC 训 1.6T MoE + 35T tokens。没有 GPU 参与。

在 GPU 时代,1.6T MoE 的训练算力需要约 1000+ 张 H100 / H200 跑几周到几个月;
用国产 ASIC 做同样的事,意味着国产 AI 算力栈在软件层面已经完成了对「万卡级别 MoE 训练」的适配——分布式训练框架、all-reduce 通信库、FP8/BF16 混合精度、checkpoint 容错,这些软件栈都已经跑通;
「5 万张国产 ASIC」这个数字本身也很有意思——如果是华为昇腾,单卡算力比 H100 弱,但可以通过规模补;如果是更激进的下一代 ASIC(摩尔线程、沐曦、寒武纪),那可能是「单卡算力追平 H100」的指标。

无论哪种,这件事验证了:在大模型训练这个领域,「算力封锁」的有效性正在快速衰减。

OpenRouter 的中立平台角色。

OpenRouter 是 2024 年起步的 LLM API 聚合平台——它把 OpenAI、Anthropic、Google、Mistral、Meta、各家中国模型都接进来,提供统一的 OpenAI 兼容 API。开发者用一个 key 就能切换不同模型。

LongCat Owl Alpha 在 OpenRouter 上跑到 #1,意味着:

西方开发者用 OpenRouter 切换模型时,会真实地「试用」这个国产模型;
在 coding agent 的工作流里,如果这个模型「够用」,开发者就没有动力切回去——「试用」会变成「日活」;
这是一个和中国国内分发完全不同的渠道——它绕过了「中国大模型出海」的传统监管摩擦。

和之前几条相关信号的关系:

06-26 · OpenRouter MCP 服务器发布——OpenRouter 自己开始做 agent 时代的 LLM 网关;
06-28 · Wayfinder Router——不调用任何模型的确定性路由;
06-29 · Claude apps gateway 上 Bedrock 和 Google Cloud——Anthropic 自己的模型分发渠道扩张;
06-30 · LongCat Owl Alpha #1 on OpenRouter——国产模型在西方中立渠道的真实渗透。

四件事放在一起,指向一个方向:「LLM 网关」正在成为新的「应用商店」——谁能占据这个分发层,谁就控制了 AI 时代的渠道。 而 LongCat Owl Alpha 是「国产模型第一次在西方中立分发渠道达到头部位置」。

应用场景的具体细节。

Hermes Agent #1 ——这是一个开源 coding agent。LongCat 在开源 agent 生态里的位置最强;
Claude Code #2 ——Anthropic 自家 coding agent。这是一个有意思的信号——Anthropic 的用户在用 Claude Code 时,主动把 backend 模型切到了 LongCat Owl Alpha。这意味着 LongCat Owl Alpha 在 coding 任务上至少和 Claude Opus 4.6 是可比水平,否则用户不会切;
OpenClaw #3 ——多模态 agent。说明它在多模态场景也有可用性。

值得关注的原因

1. 「国产 ASIC 训练万亿模型」是 2026 年 AI 基础设施自主可控的关键里程碑。这件事比单纯的「又一个中国大模型发布」重要得多——它验证了「算力封锁」的有效性正在衰减。 2. 「中国模型在西方中立分发渠道占据头部位置」是出海模式的新范式。之前中国大模型出海要靠「海外子公司 + 海外合作伙伴」;现在 OpenRouter 这种中立平台提供了一条更直接的渠道。 3. coding agent 时代的「模型可替换性」是真的。开发者愿意在 Claude Code 里把后端从 Opus 切到 LongCat Owl Alpha,说明 coding agent 的模型选择不是「品牌忠诚」驱动的,是「实际效果」驱动的——这对所有模型公司都是个压力测试。 4. 美团的 AI 战略被严重低估了。过去两年美团在 C 端(外卖、闪购)和 B 端(商家 SaaS)的主业之外,AI 投入一直被低估。这条 1.6T MoE 模型 + 国产 ASIC 训练,意味着美团的 AI 能力已经到了「不被任何外部供应商绑定」的水平。 5. OpenRouter 的渠道价值可能比模型本身更值得关注。谁占据了 AI 时代的「应用商店」,谁就控制了下一个十年的分发。

风险与待观察

5 万张国产 ASIC 的具体型号未公开——是华为昇腾、寒武纪、还是更新的国产旗舰?这决定了「算力自主」的真实性;
35T tokens 的训练数据组成未公开——是否有英文数据?是否包含合成数据?数据质量如何?这些直接影响模型在英文场景的真实表现;
1.6T MoE 的激活参数未公开——如果激活参数很小(比如 20B 以下),「1.6T」就是个营销数字,实际推理速度和 27B dense 没区别;
OpenRouter 的 10T tokens 使用量是「累计」还是「近期」未明确——如果是累计(模型上线以来所有 tokens),那这是个长期口碑指标;如果是近期(月度/周度),那这是个短期热度指标;
Emad Mostaque 的评价「Gemini / Opus 4.6 水平」需要打折 —— Emad 的一贯风格是夸张,真实水平可能在 Sonnet 4.5 - Opus 4.5 之间;
Anthropic 官方是否会对「用户主动把 Claude Code 后端切到 LongCat」这件事表态 —— 这对生态格局有信号意义。

(写作时间:2026-06-30 17:50 北京时间)