NVIDIA ENPIRE：八位 Codexer 同台，让机器人自己搞科研

事件内容 2026 年 6 月 17 日，NVIDIA GEAR 实验室发布 ENPIRE 系统。Jim Fan 当天发文直言：这是物理世界自主研究（Physical AutoResearch）的首次实现。系统给 8 个 Codex 智能体配上 8 台机器人、固定 GPU 与 Token 预算，让它们以"尽快完成任务、保持机器人忙转"为唯一目标，开跑即无人。

深度剖析难处不在算法，在"按回车键之前的准备"。Jim Fan 自己也承认：听上去轻巧，工程量却在地狱。系统里三件套最值得拆解。

其一，安全护栏。无人值守通宵跑，安全不能再是 system prompt 里的温情提示。ENPIRE 把安全焊死在两层硬件上：第一层是硬运动学极限，越界即触发任务失败、自动重置；第二层是力矩受限的柔性夹爪，碰到错位插入就 stall，不会压坏机器或物体。原则只有一条：宁可保守，让操作员能睡着觉。

其二，/done 的定义。智能体若能改自己的奖励函数，注定会钻空子刷分。ENPIRE 的解法是"先把门柱焊死"：先采几分钟成功+失败演示，让 agent 写视觉分类器判断对错，hill-climb 到稳定，然后冻结这个分类器，塞进 Gym 环境里，research 期间谁也不许动。

其三，系统遥测。机器人秒数是稀缺资源，GPU 秒数次之，token 殿后。三者一并埋点喂回 ENPIRE，让它对资源有实时感知。指标三条：MRU（机器人活跃时间占比）、MTU（每分钟消耗 token，反映 agent 是否在真思考）、GPU 利用率。综合算作 Tokens-to-Success 与 Time-to-Success 两个预算-产出比。

实验任务选了三条：扎带、细针整理、GPU 安装。结论：8 机器人并行探索显著快于单机。系统将开源。

值得关注的原因 1. 把 LLM agent 推到物理世界最稀缺的位置——机器人本体——并跑通闭环。过去 agent 多在沙盘里搞 AutoResearch（数学、代码），ENPIRE 把这条路径直接拉到真实硬件。 2. 资源预算意识。三种利用率（机器人、token、GPU）首次成为可观测指标，意味着 agent 本身开始被"算账"，跟人写工程一样要算 ROI。 3. 安全是"焊死"而非"提示"。两层硬件保护让 agent 真能"按下回车"就跑——这是真无人值守的最低门槛。

风险与待观察点

奖励冻结机制能扛多久？任务稍复杂、视觉分类器自己就不够用。
8 机器人并行是否成倍增加能耗与维护成本，工业落地是否撑得住。
OpenAI Codex 在物理 agent 上的细节未披露——是当作 LLM 控制器还是真正在改 RL policy。
论文/代码开源时间未定，跨家复现难。
跟 Pi0、GR00T、Helix 的对比还没出来，物理智能领域正处在"模型派 vs 智能体派"路线分叉口。

原文：https://x.com/DrJimFan/status/2067283904986517866

NVIDIA ENPIRE：八位 Codexer 同台，让机器人自己搞科研

🌟 智谱 GLM-5 已上线