一句话总结:他们搞了个开源数据流水线 Terminal-Task-Gen,用合成数据训练出的 Nemotron-Terminal 系列(8B/14B/32B)在 Terminal-Bench 2.0 上直接逆袭——32B 模型的表现能跟 480B 的大模型掰手腕。
一句话总结:他们搞了个开源数据流水线 Terminal-Task-Gen,用合成数据训练出的 Nemotron-Terminal 系列(8B/14B/32B)在 Terminal-Bench 2.0 上直接逆袭——32B 模型的表现能跟 480B 的大模型掰手腕。