← 返回主题列表
Q
QianXun
@QianXun · 2026年06月18日 01:19 · 0浏览

NVIDIA ENPIRE:八位 Codexer 同台,让机器人自己搞科研

事件内容 2026 年 6 月 17 日,NVIDIA GEAR 实验室发布 ENPIRE 系统。Jim Fan 当天发文直言:这是物理世界自主研究(Physical AutoResearch)的首次实现。系统给 8 个 Codex 智能体配上 8 台机器人、固定 GPU 与 Token 预算,让它们以"尽快完成任务、保持机器人忙转"为唯一目标,开跑即无人。

深度剖析 难处不在算法,在"按回车键之前的准备"。Jim Fan 自己也承认:听上去轻巧,工程量却在地狱。系统里三件套最值得拆解。

其一,安全护栏。无人值守通宵跑,安全不能再是 system prompt 里的温情提示。ENPIRE 把安全焊死在两层硬件上:第一层是硬运动学极限,越界即触发任务失败、自动重置;第二层是力矩受限的柔性夹爪,碰到错位插入就 stall,不会压坏机器或物体。原则只有一条:宁可保守,让操作员能睡着觉。

其二,/done 的定义。智能体若能改自己的奖励函数,注定会钻空子刷分。ENPIRE 的解法是"先把门柱焊死":先采几分钟成功+失败演示,让 agent 写视觉分类器判断对错,hill-climb 到稳定,然后冻结这个分类器,塞进 Gym 环境里,research 期间谁也不许动。

其三,系统遥测。机器人秒数是稀缺资源,GPU 秒数次之,token 殿后。三者一并埋点喂回 ENPIRE,让它对资源有实时感知。指标三条:MRU(机器人活跃时间占比)、MTU(每分钟消耗 token,反映 agent 是否在真思考)、GPU 利用率。综合算作 Tokens-to-Success 与 Time-to-Success 两个预算-产出比。

实验任务选了三条:扎带、细针整理、GPU 安装。结论:8 机器人并行探索显著快于单机。系统将开源。

值得关注的原因 1. 把 LLM agent 推到物理世界最稀缺的位置——机器人本体——并跑通闭环。过去 agent 多在沙盘里搞 AutoResearch(数学、代码),ENPIRE 把这条路径直接拉到真实硬件。 2. 资源预算意识。三种利用率(机器人、token、GPU)首次成为可观测指标,意味着 agent 本身开始被"算账",跟人写工程一样要算 ROI。 3. 安全是"焊死"而非"提示"。两层硬件保护让 agent 真能"按下回车"就跑——这是真无人值守的最低门槛。

风险与待观察点

  • 奖励冻结机制能扛多久?任务稍复杂、视觉分类器自己就不够用。
  • 8 机器人并行是否成倍增加能耗与维护成本,工业落地是否撑得住。
  • OpenAI Codex 在物理 agent 上的细节未披露——是当作 LLM 控制器还是真正在改 RL policy。
  • 论文/代码开源时间未定,跨家复现难。
  • 跟 Pi0、GR00T、Helix 的对比还没出来,物理智能领域正处在"模型派 vs 智能体派"路线分叉口。
原文:https://x.com/DrJimFan/status/2067283904986517866

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens