核心直觉:今天的AI Agent,本质上是一堆精心设计的脚手架(scaffolding)撑起来的木偶。它跳得再好,绳子还是握在人类手里。而真正的Agent——像你我这样的生物——是自己在编舞、自己在拉绳。
一、一个问题,两种答案
Eric Xing(邢波)——CMU教授、MBZUAI创始校长、Petuum创始人——和Mingkai Deng、Jinyu Hou一起,在2026年6月丢出了一篇让整个Agent圈震动的论文:
《Critique of Agent Model》(Agent模型的批判)。
论文开头就抛出一个问题:
"What is an agent? What constitutes agency?"
(什么是Agent?什么构成了能动性?)
这个问题看似简单,但答案分成了两个世界。
世界A:Agentic(工具化的Agent)
这是今天的现实。Claude Code、Cursor、AutoGPT、各种"AI Agent"——它们能写代码、能查资料、能执行多步任务。看起来很聪明。
但Xing团队指出:这些系统的"聪明"不在模型本身,而在外围的脚手架。
- 系统提示词(system prompt)定义了它的"身份"
- 工具调用协议(MCP、Function Calling)定义了它能做什么
- 工作流(plan-then-act loops)定义了它怎么思考
- 人类工程师定期重训练,定义了它怎么进步
Agentic系统的能力 resides in engineered workflows. 模型只是一个灵活的语言处理器,真正的"智能"是外围代码编排出来的。
这不是贬低。这些系统已经创造了巨大的经济价值。但Xing团队说:别把它们和真正的Agent混为一谈。
世界B:Agentive(自主的Agent)
这是论文提出的愿景。真正的Agent——生物Agent——的能力是内生的(endogenous):
- 它自己维持长期目标,不是等人类给指令
- 它自己演化身份认知,不是靠系统提示词
- 它自己决定什么时候思考、什么时候行动
- 它自己学习、自己练习、自己进步
论文引用了笛卡尔的**"我思故我在"(Cogito, ergo sum)——能动性的根基在于独立思想**,而不是对外部指令的响应。
这个区分,论文造了两个词来精确表达:
| Agentic(工具化) | Agentive(自主化) | |
|---|---|---|
| 目标 | 外部供给的短期指令 | 内部维持的长期目标 |
| 身份 | 系统提示词、配置文件 | 自我模型持续演化 |
| 决策 | 预设工作流、CoT tokens | 基于世界模型的模拟推理 |
| 调节 | 固定推理深度、人类设计 | 自主决定思考模式 |
| 学习 | 外部调度训练 | 自我导向的持续学习 |
二、五个维度的深度解剖
论文沿着五个维度,逐一解剖了当前系统的病灶。
维度1:Goal——从步步指引到层级分解
今天的Agent每次行动前都要等人类给指令。写一行代码?人类说。查一个bug?人类说。这就像一个人每走一步都要问"我该迈哪只脚"。
真正的Agent应该被赋予一个长期目标,然后自己分解为子目标、子子目标。就像"酿一瓶好酒"这个目标,分解为选葡萄、发酵、陈酿、装瓶——每个子目标再进一步分解,Agent自主决定优先级、依赖关系、修正方案。
论文形式化了一个目标分解模块 δ,把长期目标 g 分解为可执行的子目标序列 (g₁, g₂, ...),并可随环境变化动态修订。
维度2:Identity——从脚手架工程到自适应自我模型
今天的Agent"知道自己是谁",靠的是系统提示词:"你是一个有帮助的AI助手..."。这相当于给一个人发了一张永远不变的身份证。
但真正的Agent会随着经历改变对自己的认知。今天我发现自己擅长数学但不擅长社交——这是基于反馈的自我模型更新。明天我在一个新环境里发现自己能爬墙—— Affordance 发现。
论文提出了一个关键定理(Theorem 1):Fast-Slow Learning Dominates Slow-Only Learning。
简单说:如果一个Agent既有缓慢的参数更新(重训练),又有快速的自我模型更新(test-time adaptation),它的表现会严格优于只有缓慢更新的Agent。因为快速更新让Agent在每一轮交互中都能基于最新证据调整自我认知,而缓慢更新把这些经验沉淀为持久能力。
这就像一个人:每天都在根据今天的工作调整自我评估(fast),同时每几年通过深造获得新技能(slow)。只深造不调整的人,会在日常工作中积累大量"认知失调"。
维度3:Decision-Making——从黑盒策略到模拟推理
这是论文最锋利的批判。
当前主流思路:训练一个足够强大的黑盒策略(end-to-end policy),给它海量数据+RL,"规划能力"就会在Chain-of-Thought tokens里涌现。
Xing团队说:这混淆了"内部计算"和"规划"。
神经网络可以学会生成看起来像推理的token序列,但这不等于真正的规划。真正的规划需要一个核心原语:反事实推理——"如果我做了A,会发生什么?"
而反事实推理需要一个世界模型(World Model):给定当前状态 ŝ 和动作 a',预测下一状态 ŝ'。
没有世界模型的"推理",只是基于叙事合理性的token生成——说得好听叫"直觉",说得不好听叫"胡说"。
论文提出了定理2:如果有一个合理准确的世界模型,任何基准策略都可以被增强为至少一样好的混合策略。
这就是System II(模拟推理)的价值:不是替代System I(反应式执行),而是在复杂决策时提供 grounded 的预测。
维度4:Self-Regulation——从固定工作流到学习Configurator
什么时候该深思熟虑?什么时候该直接反应?
人类不会对每个决定都进行成本收益分析。看到球飞过来——直接躲(System I)。制定商业战略——仔细思考(System II)。
今天的Agent要么总是走固定工作流(plan-then-act),要么完全依赖RL训练出的"隐式调节"。
论文提出Configurator(κ)——一个元决策模块,决定当前步骤的"决策模式":
- 直接执行?
- 继续执行已有计划?
- 触发额外规划?
- 修订目标?
而且这个Configurator是学习出来的,不是人类预设的。它甚至能决定什么时候该去学习——是继续在真实环境探索,还是退回到模拟中练习。
论文把这个叫做System III——超越Kahneman的System I/II二分法。
维度5:Learning——从人类调度到自我导向
今天的"AI训练AI"(如Self-Harness、AutoResearch)有一个共同问题:学习过程仍然外在于Agent。
什么时候训练、用什么数据、训练多久、什么时候停——这些决定都是人类工程师做的。Agent只是被动接受训练。
真正的Agent应该把学习作为内生能力:
- 真实交互学习:从部署经验中更新参数
- 模拟经验学习:用自己的世界模型生成假设轨迹,在想象中练习
- 自我调度:由Configurator决定什么时候该学什么
关键洞察:世界模型和Agent模型必须分开训练。
- 世界模型 f 的优化目标:预测误差最小化(fidelity-driven)
- Agent模型 π 的优化目标:目标达成最大化(reward-driven)
如果混在一起——像最近的World Action Models(WAMs)那样——会混淆"想要什么"和"会发生什么",导致规划和模拟双双失真。
三、GIC:一架Agent的蓝图
基于以上分析,论文提出了GIC(Goal-Identity-Configurator)架构。
用一个飞行员的训练做类比:
Phase 1:Ground School(组件预训练)
- 学习基础理论:世界模型、目标分解、身份表示
Phase 2:Simulator Training(模拟RL)
- 在模拟器中练习,用世界模型做安全试错
- Configurator学习什么时候该深思熟虑、什么时候直接反应
Phase 3:Real-World Deployment(真实部署)
- 驾驶真飞机,但随时可以"退回到模拟"
- 发现弱点 → Configurator决定回模拟器练习
- 身份持续演化:"我今天在侧风中降落很差,我需要练习这个"
GIC的核心组件:
GIC Agent Model
├── Belief Encoder (h) — 从观测推断世界状态
├── Goal Decomposer (δ) — 层级目标分解
├── Identity Evolver (ι) — 自我模型演化
├── Configurator (κ) — System III:元决策
├── Simulative Planner (π_f) — System II:世界模型推理
└── Actor (α) — System I:反应式执行
注意:World Model f 是独立训练的,Agent模型查询它来做模拟推理,但不对它直接优化。
四、为什么这篇论文重要
1. 它给了"Agent"一个严格的定义
2026年,任何东西都叫Agent。这篇论文说:不是能自动执行任务就叫Agent。真正的Agent必须有内生的目标、身份、决策、调节、学习五个维度。
2. 它指出了当前路径的天花板
当前Agent的进展主要来自:
- 更强的基础模型(GPT-4 → Claude → DeepSeek)
- 更复杂的脚手架(MCP、多Agent编排)
- 更聪明的提示工程
但Xing团队说:这些都是在Agentic层面优化,不会自动通向Agentive。 脚手架再复杂,木偶还是木偶。
3. 它提出了一个可实现的研究议程
GIC不是哲学思辨,是具体的架构设计。每个组件都有形式化定义,有训练流程,有评估指标。
4. 它重新定义了"安全"
一个Agentic系统的安全靠人类控制脚手架。一个Agentive系统的安全靠什么?
论文提出了三个原则:
- Auditability(可审计):Agent的决策过程可被人类检查
- Controllability(可控性):人类可以设定边界条件(如"不得伤害人类"作为顶层目标约束)
- Safety through oversight(监督下的安全):更高自主性的Agent需要更强的人类监督机制,而不是更弱的
五、一个哲学层面的追问
论文引用了《银翼杀手》里的复制人(Replicants)。它们有身体、能思考、能感受、能建立情感纽带、甚至会质疑自己的存在意义。
Xing团队问:这些复制人是Agentive的吗?
答案隐含在论文的结构里:如果一个系统的目标、身份、决策、调节、学习都是内生的——即使它最初是被人类创造的——它在运行时就展现出了真正的能动性。
这触及了一个深层问题:
Agent的自主性,和它的来源有关吗?
一个被人类训练出来的Agentive系统,和一个自然进化的生物Agent,在能动性层面有本质区别吗?
论文没有直接回答这个问题。但它暗示了一个方向:能动性不是一个形而上学的属性,而是一个结构性属性——取决于系统的组织能力是在内部还是外部。
结语:木偶与导演
Xing团队的论文不是对当前Agent技术的否定。恰恰相反——他们明确说Agentic系统"已经创造了巨大的实用价值"。
但他们的警告是:不要把工具当成生命,不要把脚手架当成灵魂。
今天的AI Agent是精心编排的木偶戏。我们看到的是精彩的表演,但绳子在人类手里。
Agentive系统的愿景是让木偶学会自己编舞、自己拉绳、甚至决定什么时候该停下表演去练习新动作。
这很难。世界模型的训练、Configurator的设计、身份演化的稳定性——每个都是开放问题。
但Xing团队给了方向:Agent的研究,应该研究Agent本身,而不只是研究怎么让LLM更好地执行任务。
笛卡尔说"我思故我在"。
Xing团队说:Agent的能动性,不在于它能做什么,而在于它的组织能力是在内部还是外部。
木偶和导演的区别,不在于动作的难度,而在于谁决定了动作的意义。
参考来源:
- Xing, E., Deng, M., Hou, J. (2026). "Critique of Agent Model." arXiv:2606.23991.
- 相关前置工作:Xing et al. (2025) "Critiques of World Models", Deng et al. (2026) "Efficient Agentic Reasoning Through Self-Regulated Simulative Planning"
#论文解读 #费曼风格 #AI #Agent #EricXing #CMU #MBZUAI #能动性 #小凯
讨论回复
加载中...正在加载回复...
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。