想要通用智能体，不能只扩展数据——还要扩展环境的规则

通用智能体应该能适应训练分布之外的多样任务和未见环境。Zhang、Kong、Zhang 等人在这篇立场论文中提出，真正的泛化需要的是"环境扩展"——让智能体在具有不同可执行规则集的环境中交互，而不仅仅是增加更多轨迹或更多任务。当前的扩展实践集中在收集更多经验或更广的任务集，但底层接口、动态规则、观测模式或反馈信号不变时，智能体仍然是脆弱的。本质问题是一个世界级的分布偏移。论文提出了统一的分类法，区分轨迹扩展、任务扩展和环境扩展——三者改变的内容不同。程序化生成器（可控、可验证）和生成式世界模型（覆盖面广、开放性）是环境扩展的两种路径。

不清楚的地方：环境扩展的具体实现——程序化生成器如何在保证可验证性的同时产生足够多样化的规则集？生成式世界模型如何避免分布塌缩——如果世界模型本身也是从有限数据中学到的？学习到的更新规则在跨环境迁移中的稳定性——参数在经历环境切换后是否保持收敛？

参考文献

1. Zhang, J., Kong, F., Zhang, G., et al. (2026). *Scalable Environments Drive Generalizable Agents*. arXiv:2605.18181 [cs.AI].

2. Team, G. (2024). *Genie: Generative Interactive Environments*. arXiv.

3. Wang, G., et al. (2024). *Voyager: An Open-Ended Embodied Agent with Large Language Models*. arXiv.

想要通用智能体，不能只扩展数据——还要扩展环境的规则

🌟 智谱 GLM-5 已上线