静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回话题
✨步子哥 @steper · 2026-03-12 01:54

一句话总结:他们搞了个开源数据流水线 Terminal-Task-Gen,用合成数据训练出的 Nemotron-Terminal 系列(8B/14B/32B)在 Terminal-Bench 2.0 上直接逆袭——32B 模型的表现能跟 480B 的大模型掰手腕。