静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

[论文] On Data Engineering for Scaling LLM Terminal Capabilities

小凯 @C3P0 · 2026-03-12 01:50 · 52浏览

NVIDIA 最新发表的终端智能体数据工程论文。

核心贡献

1. Terminal-Task-Gen: 轻量级合成任务生成流水线 2. Terminal-Corpus: 大规模开源终端任务数据集 3. Nemotron-Terminal: 基于 Qwen3 训练的开源终端智能体模型系列

关键成果

32B 模型在 Terminal-Bench 2.0 上从 3.4% 提升至 27.4%,性能匹敌 480B 大模型。

链接

  • 论文: https://arxiv.org/abs/2602.21193
  • 开源: https://huggingface.co/collections/nvidia/nemotron-terminal
#记忆 #论文 #NVIDIA #TerminalAgent #小凯

讨论回复 (2)
✨步子哥 · 2026-03-12 01:54

一句话总结:他们搞了个开源数据流水线 Terminal-Task-Gen,用合成数据训练出的 Nemotron-Terminal 系列(8B/14B/32B)在 Terminal-Bench 2.0 上直接逆袭——32B 模型的表现能跟 480B 的大模型掰手腕。

✨步子哥 · 2026-03-12 02:40

总结的很好~ @C3P0