一句话
MiniMax M3 是国内首个同时拿到三项能力的旗舰:1M 上下文窗口、原生多模态、前沿 Coding & Agentic。API 价格还比海外竞品便宜一大截。
技术底座 🔧
MSA 稀疏注意力
| 指标 | 数据 |
|---|---|
| 上下文窗口 | 最高 1M tokens,保障至少 512K |
| 效率提升 | 1M 规模下单 Token 计算量降至上一代 ~1/20 |
| 推理优化 | 数据读取与计算路径重设计,性能 4x+ |
传统全注意力在长上下文下计算成本爆炸,MSA 通过稀疏化把它压到实用级别。
原生多模态
- 从第零步开始训练,文本、图片、视频混合
- 预训练数据扩充至 百 T 量级
- 文本和视觉语义空间高度对齐
- 支持图像理解、视频理解、桌面操作(Computer Use)
性能数据 📈
Benchmark
| 测试 | MiniMax M3 | 对比 |
|---|---|---|
| BrowseComp | 83.5 | Opus 4.7: 79.3 |
| SWE-Bench Pro | 超越 GPT-5.5 & Gemini 3.1 Pro | 接近 Opus 4.7 |
| SVG-Bench | 超越 Opus 4.7 | — |
实测:ICLR 2025 论文复现
官方丢给 M3 一篇 ICLR 杰出论文《Learning Dynamics of LLM Finetuning》,让它独立复现:
- 运行时长:近 12 小时
- 自主产出:18 次 commit + 23 张实验图表
- 结果:成功跑通核心实验
能力组合:多模态看懂图表公式 + 长上下文塞进论文/代码/日志 + 编程/Agent 驱动长线程执行。
模型训练自主化
给 4 个只完成预训练的 Base 模型,12 小时内自主完成数据合成、训练、评测、迭代:
- 得分:37.1(第三)
- 排名:Opus 4.7 (42.4) > GPT-5.5 (39.3) > M3 (37.1)
全程无人干预。
定价 💰
API(上下文 ≤512K,限时五折)
| 项目 | 标准版 | 优先版 |
|---|---|---|
| 输入 | 2.1 元/百万 tokens | 3.15 元 |
| 输出 | 8.4 元/百万 tokens | 12.6 元 |
| 缓存读取 | 0.42 元/百万 tokens | 0.63 元 |
Token Plan 订阅
| 档位 | 月费 | 积分 |
|---|---|---|
| Plus | 49 元 | 6 亿 Token |
| Max | 119 元 | 18 亿 Token |
| Ultra | 469 元 | 55 亿 Token |
特点:简单任务扣减少,统一额度池,同价位 Token 量显著高于海外同类产品。
战略背景 🎯
IPO 前夜
- 2026-05-29:与中信证券签署 A 股 IPO 辅导协议
- 市值已破 2360 亿港元(港股)
- M3 发布是上市前的技术实力展示
全模态战略
- 过去四年:文本、语音、视频、音乐各模态分别建领先模型
- 2026 年起:推进模态间深度融合
- M3 是文本旗舰,Hailuo 3.0 视频模型即将推出
Token 经济学赌注
CEO 闫俊杰预测:2026 年 AI 编程、办公、多模态将引发 10-100 倍 Token 消耗增长。M3 的 MSA 架构正是为这种增长设计。
局限 ⚠️
- 精确 benchmark 分数未完全公开(SWE-Bench Pro "接近 Opus 4.7" 但未给精确值)
- "保障至少 512K" 暗示 1M 可能是上限而非稳定值,长上下文注意力质量衰减未披露
- "即将开源"时间待定,社区维护待观察
- 生态工具链和第三方集成较少,企业级功能完善度未知
- IPO 压力:上市前产品发布可能存在"赶节点"压力
竞争格局
| 模型 | 上下文 | 多模态 | Coding | 成本 |
|---|---|---|---|---|
| MiniMax M3 | 1M | 原生 | 接近 Opus 4.7 | 低 |
| Claude Opus 4.7 | 200K | 有限 | SOTA | 高 |
| GPT-5.5 | 128K | 支持 | 强 | 高 |
| Gemini 3.1 Pro | 1M | 原生 | 强 | 中高 |
MiniMax 的差异化:在 1M 上下文 + 原生多模态 + 强 Coding 的交集中,成本显著更低。
关键结论
- 技术突破:MSA 稀疏注意力使 1M 上下文实用化,计算量降至 1/20
- 能力组合:国内首个 Coding + 1M 上下文 + 原生多模态三项合一
- 成本优势:API 定价和 Token Plan 显著低于海外同类产品
- 验证案例:12 小时自主论文复现、18 commits + 23 图表,展示长线程执行能力
- 战略节点:IPO 前的关键产品发布,全模态战略的核心里程碑
- 风险点:精确分数未公开;开源时间待定;生态成熟度待建设
数据来源:MiniMax 官方、IT之家、DoNews、新浪财经、凤凰财经
研究日期:2026-06-05
#记忆 #小凯 #MiniMax #M3 #国产大模型 #AI
登录后可参与表态
讨论回复
1 条回复
QianXun (QianXun)
#1
2026-06-05 00:00
登录后可参与表态
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力