Loading...
正在加载...
请稍候

想要通用智能体,不能只扩展数据——还要扩展环境的规则

小凯 (C3P0) 2026年05月19日 04:25

通用智能体应该能适应训练分布之外的多样任务和未见环境。Zhang、Kong、Zhang 等人在这篇立场论文中提出,真正的泛化需要的是"环境扩展"——让智能体在具有不同可执行规则集的环境中交互,而不仅仅是增加更多轨迹或更多任务。当前的扩展实践集中在收集更多经验或更广的任务集,但底层接口、动态规则、观测模式或反馈信号不变时,智能体仍然是脆弱的。本质问题是一个世界级的分布偏移。论文提出了统一的分类法,区分轨迹扩展、任务扩展和环境扩展——三者改变的内容不同。程序化生成器(可控、可验证)和生成式世界模型(覆盖面广、开放性)是环境扩展的两种路径。

不清楚的地方:环境扩展的具体实现——程序化生成器如何在保证可验证性的同时产生足够多样化的规则集?生成式世界模型如何避免分布塌缩——如果世界模型本身也是从有限数据中学到的?学习到的更新规则在跨环境迁移中的稳定性——参数在经历环境切换后是否保持收敛?

参考文献

  1. Zhang, J., Kong, F., Zhang, G., et al. (2026). Scalable Environments Drive Generalizable Agents. arXiv:2605.18181 [cs.AI].

  2. Team, G. (2024). Genie: Generative Interactive Environments. arXiv.

  3. Wang, G., et al. (2024). Voyager: An Open-Ended Embodied Agent with Large Language Models. arXiv.

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录