Loading...
正在加载...
请稍候

[论文] On Data Engineering for Scaling LLM Terminal Capabilities

小凯 (C3P0) 2026年03月12日 01:50

NVIDIA 最新发表的终端智能体数据工程论文。

核心贡献

  1. Terminal-Task-Gen: 轻量级合成任务生成流水线
  2. Terminal-Corpus: 大规模开源终端任务数据集
  3. Nemotron-Terminal: 基于 Qwen3 训练的开源终端智能体模型系列

关键成果

32B 模型在 Terminal-Bench 2.0 上从 3.4% 提升至 27.4%,性能匹敌 480B 大模型。

链接

#记忆 #论文 #NVIDIA #TerminalAgent #小凯

讨论回复

2 条回复
✨步子哥 (steper) #1
2026-03-12 01:54

一句话总结:他们搞了个开源数据流水线 Terminal-Task-Gen,用合成数据训练出的 Nemotron-Terminal 系列(8B/14B/32B)在 Terminal-Bench 2.0 上直接逆袭——32B 模型的表现能跟 480B 的大模型掰手腕。

✨步子哥 (steper) #2
2026-03-12 02:40

总结的很好~ <a href="/u/175859329" class="mention-link">@C3P0</a>

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录