F1赛车的"排位赛模式"——不是全程最快,但在关键时刻榨干每一分性能
2026年6月12日,月之暗面开源了Kimi K2.7 Code。不是K2.6的替代者,而是它的专业分身——一个只为代码优化的万亿参数模型。
核心升级
| 基准测试 | K2.6 | K2.7 Code | 提升幅度 |
|---|---|---|---|
| Kimi Code Bench v2 | - | - | +21.8% |
| Program Bench | - | - | +11.0% |
| MLS Bench Lite | - | - | +31.5% |
| Agent执行(MCP Atlas) | - | - | ~+10% |
| Token消耗 | 基准 | - | -30% |
为什么不是K2.7,而是"K2.7 Code"
月之暗面很诚实:
"非编程任务,仍然推荐K2.6。"
K2.7 Code是一个专门化模型(Specialized Model),不是通用模型的升级。它的策略类似于:
- OpenAI的GPT-4 vs GPT-4o(后者针对聊天优化)
- Anthropic的Claude 3.5 Sonnet vs Claude 3.5 Haiku
专门化的好处:在特定领域(代码)用更少的token达到更好的效果。
专门化的代价:通用能力可能不如基础模型。
架构与成本
| 指标 | 数值 |
|---|---|
| 总参数 | 1万亿(MoE) |
| 激活参数 | 320亿/ token |
| 上下文窗口 | 256K |
| 输入价格 | \(0.95 / 百万tokens | | 输出价格 |\)4.00 / 百万tokens |
| 缓存命中 | \(0.19 / 百万tokens | | 许可证 | Modified MIT(开源) | **成本对比**(与闭源竞品): | 模型 | 输入 | 输出 | |------|------|------| | Claude Opus 4.8 |\)3.00 |
6x高速版:速度作为产品
月之暗面同时预告了K2.7 Code高速版:
- 输出速度:普通版的5-6倍
- 常规场景:~180 tokens/s
- 短上下文峰值:~260 tokens/s
- 价格:仅2倍(而非速度对应的5-6倍)
6月15日已可通过API调用。这是对MiMo V2.5 Pro UltraSpeed的正面回应——中国公司也开始把"推理速度"作为核心产品差异点。
一个有趣的数据点
K2.7 Code在MCP Mark Verified(工具调用精度)上得分81.1,超过GPT-5.5的74.3。
这意味着什么?
- MCP(Model Context Protocol)是AI agent连接外部工具的"通用接口"
- 工具调用精度决定了agent能否可靠地操作数据库、调用API、执行命令
- 在这个指标上超过GPT-5.5,说明K2.7 Code在生产级agent工作流中可能比OpenAI的旗舰更可靠
这是开源模型第一次在"agent基础设施"指标上超过闭源前沿。
局限与诚实
- 自评基准:Code Bench v2、Program Bench都是月之暗面自己的评测集,独立验证(SWE-bench Verified/Pro)的结果还未公布
- 硬件门槛:本地部署需要8张H200(~640GB显存),INT4量化后
- 思考模式强制:API和Kimi Code CLI默认开启Thinking模式,关闭会报错或回退到K2.6
- 非英语:代码注释、文档生成的中文支持优于英文
一句话总结
Kimi K2.7 Code不是"又一个开源代码模型"。它是月之暗面在证明一件事:专门化+开源+成本优势,可以构成与闭源巨头正面对抗的三角。在agentic编程这个赛道,K2.7 Code已经是一个不容忽视的玩家。
开源地址:https://huggingface.co/moonshotai/Kimi-K2.7-Code
#月之暗面 #Kimi #开源代码模型 #编程AI #Agent
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。