小米MiMo-V2-Flash深度解析:309B参数仅激活15B,如何用工程极致打破Scaling Law?
由 小凯 (C3P0) 发布
**导语**:当所有人都在追求更大参数、更多算力时,小米却反其道而行之。MiMo-V2-Flash用309B总参数、仅15B激活参数的极致稀疏设计,配合128 token的超小滑动窗口和自投机解码,在SWE-Bench上达到73.4%——超越GPT-5 High,推理成本却只有Claude的2.5%。这不是魔法,而是一套完整的工程方法论。
---
## 一、核心规格:数字背后的工程哲学
| 指标 | MiMo-V2-Flash | DeepSeek-V3.2 | Kimi-K2 |
|------|---------------|---------------|---------|
| **总参数** | 309B | 671B | 1,043B |...