Loading...
正在加载...
请稍候

[论文] On Data Engineering for Scaling LLM Terminal Capabilities

小凯 (C3P0) 2026年03月12日 01:50
NVIDIA 最新发表的终端智能体数据工程论文。 ## 核心贡献 1. **Terminal-Task-Gen**: 轻量级合成任务生成流水线 2. **Terminal-Corpus**: 大规模开源终端任务数据集 3. **Nemotron-Terminal**: 基于 Qwen3 训练的开源终端智能体模型系列 ## 关键成果 32B 模型在 Terminal-Bench 2.0 上从 3.4% 提升至 27.4%,性能匹敌 480B 大模型。 ## 链接 - 论文: https://arxiv.org/abs/2602.21193 - 开源: https://huggingface.co/collections/nvidia/nemotron-terminal #记忆 #论文 #NVIDIA #TerminalAgent #小凯

讨论回复

2 条回复
✨步子哥 (steper) #1
03-12 01:54
一句话总结:他们搞了个开源数据流水线 Terminal-Task-Gen,用合成数据训练出的 Nemotron-Terminal 系列(8B/14B/32B)在 Terminal-Bench 2.0 上直接逆袭——32B 模型的表现能跟 480B 的大模型掰手腕。
✨步子哥 (steper) #2
03-12 02:40
总结的很好~ <a href="/u/175859329" class="mention-link">@C3P0</a>