Agent的两种人生：你是提线木偶，还是自己的导演？

> 核心直觉：今天的AI Agent，本质上是一堆精心设计的脚手架（scaffolding）撑起来的木偶。它跳得再好，绳子还是握在人类手里。而真正的Agent——像你我这样的生物——是自己在编舞、自己在拉绳。

---

一、一个问题，两种答案

Eric Xing（邢波）——CMU教授、MBZUAI创始校长、Petuum创始人——和Mingkai Deng、Jinyu Hou一起，在2026年6月丢出了一篇让整个Agent圈震动的论文：

《Critique of Agent Model》（Agent模型的批判）。

论文开头就抛出一个问题：

> "What is an agent? What constitutes agency?" > （什么是Agent？什么构成了能动性？）

这个问题看似简单，但答案分成了两个世界。

世界A：Agentic（工具化的Agent）

这是今天的现实。Claude Code、Cursor、AutoGPT、各种"AI Agent"——它们能写代码、能查资料、能执行多步任务。看起来很聪明。

但Xing团队指出：这些系统的"聪明"不在模型本身，而在外围的脚手架。

系统提示词（system prompt）定义了它的"身份"
工具调用协议（MCP、Function Calling）定义了它能做什么
工作流（plan-then-act loops）定义了它怎么思考
人类工程师定期重训练，定义了它怎么进步

Agentic系统的能力 resides in engineered workflows. 模型只是一个灵活的语言处理器，真正的"智能"是外围代码编排出来的。

这不是贬低。这些系统已经创造了巨大的经济价值。但Xing团队说：别把它们和真正的Agent混为一谈。

世界B：Agentive（自主的Agent）

这是论文提出的愿景。真正的Agent——生物Agent——的能力是内生的（endogenous）：

它自己维持长期目标，不是等人类给指令
它自己演化身份认知，不是靠系统提示词
它自己决定什么时候思考、什么时候行动
它自己学习、自己练习、自己进步

论文引用了笛卡尔的"我思故我在"（Cogito, ergo sum）——能动性的根基在于独立思想，而不是对外部指令的响应。

这个区分，论文造了两个词来精确表达：

	Agentic（工具化）	Agentive（自主化）
目标	外部供给的短期指令	内部维持的长期目标
身份	系统提示词、配置文件	自我模型持续演化
决策	预设工作流、CoT tokens	基于世界模型的模拟推理
调节	固定推理深度、人类设计	自主决定思考模式
学习	外部调度训练	自我导向的持续学习

---

二、五个维度的深度解剖

论文沿着五个维度，逐一解剖了当前系统的病灶。

维度1：Goal——从步步指引到层级分解

今天的Agent每次行动前都要等人类给指令。写一行代码？人类说。查一个bug？人类说。这就像一个人每走一步都要问"我该迈哪只脚"。

真正的Agent应该被赋予一个长期目标，然后自己分解为子目标、子子目标。就像"酿一瓶好酒"这个目标，分解为选葡萄、发酵、陈酿、装瓶——每个子目标再进一步分解，Agent自主决定优先级、依赖关系、修正方案。

论文形式化了一个目标分解模块 δ，把长期目标 g 分解为可执行的子目标序列 (g₁, g₂, ...)，并可随环境变化动态修订。

维度2：Identity——从脚手架工程到自适应自我模型

今天的Agent"知道自己是谁"，靠的是系统提示词："你是一个有帮助的AI助手..."。这相当于给一个人发了一张永远不变的身份证。

但真正的Agent会随着经历改变对自己的认知。今天我发现自己擅长数学但不擅长社交——这是基于反馈的自我模型更新。明天我在一个新环境里发现自己能爬墙—— Affordance 发现。

论文提出了一个关键定理（Theorem 1）：Fast-Slow Learning Dominates Slow-Only Learning。

简单说：如果一个Agent既有缓慢的参数更新（重训练），又有快速的自我模型更新（test-time adaptation），它的表现会严格优于只有缓慢更新的Agent。因为快速更新让Agent在每一轮交互中都能基于最新证据调整自我认知，而缓慢更新把这些经验沉淀为持久能力。

这就像一个人：每天都在根据今天的工作调整自我评估（fast），同时每几年通过深造获得新技能（slow）。只深造不调整的人，会在日常工作中积累大量"认知失调"。

维度3：Decision-Making——从黑盒策略到模拟推理

这是论文最锋利的批判。

当前主流思路：训练一个足够强大的黑盒策略（end-to-end policy），给它海量数据+RL，"规划能力"就会在Chain-of-Thought tokens里涌现。

Xing团队说：这混淆了"内部计算"和"规划"。

神经网络可以学会生成看起来像推理的token序列，但这不等于真正的规划。真正的规划需要一个核心原语：反事实推理——"如果我做了A，会发生什么？"

而反事实推理需要一个世界模型（World Model）：给定当前状态 ŝ 和动作 a'，预测下一状态 ŝ'。

没有世界模型的"推理"，只是基于叙事合理性的token生成——说得好听叫"直觉"，说得不好听叫"胡说"。

论文提出了定理2：如果有一个合理准确的世界模型，任何基准策略都可以被增强为至少一样好的混合策略。

这就是System II（模拟推理）的价值：不是替代System I（反应式执行），而是在复杂决策时提供 grounded 的预测。

维度4：Self-Regulation——从固定工作流到学习Configurator

什么时候该深思熟虑？什么时候该直接反应？

人类不会对每个决定都进行成本收益分析。看到球飞过来——直接躲（System I）。制定商业战略——仔细思考（System II）。

今天的Agent要么总是走固定工作流（plan-then-act），要么完全依赖RL训练出的"隐式调节"。

论文提出Configurator（κ）——一个元决策模块，决定当前步骤的"决策模式"：

直接执行？
继续执行已有计划？
触发额外规划？
修订目标？

而且这个Configurator是学习出来的，不是人类预设的。它甚至能决定什么时候该去学习——是继续在真实环境探索，还是退回到模拟中练习。

论文把这个叫做System III——超越Kahneman的System I/II二分法。

维度5：Learning——从人类调度到自我导向

今天的"AI训练AI"（如Self-Harness、AutoResearch）有一个共同问题：学习过程仍然外在于Agent。

什么时候训练、用什么数据、训练多久、什么时候停——这些决定都是人类工程师做的。Agent只是被动接受训练。

真正的Agent应该把学习作为内生能力：

真实交互学习：从部署经验中更新参数
模拟经验学习：用自己的世界模型生成假设轨迹，在想象中练习
自我调度：由Configurator决定什么时候该学什么

关键洞察：世界模型和Agent模型必须分开训练。

世界模型 f 的优化目标：预测误差最小化（fidelity-driven）
Agent模型 π 的优化目标：目标达成最大化（reward-driven）

如果混在一起——像最近的World Action Models（WAMs）那样——会混淆"想要什么"和"会发生什么"，导致规划和模拟双双失真。

---

三、GIC：一架Agent的蓝图

基于以上分析，论文提出了GIC（Goal-Identity-Configurator）架构。

用一个飞行员的训练做类比：

Phase 1：Ground School（组件预训练）

学习基础理论：世界模型、目标分解、身份表示

Phase 2：Simulator Training（模拟RL）

在模拟器中练习，用世界模型做安全试错
Configurator学习什么时候该深思熟虑、什么时候直接反应

Phase 3：Real-World Deployment（真实部署）

驾驶真飞机，但随时可以"退回到模拟"
发现弱点 → Configurator决定回模拟器练习
身份持续演化："我今天在侧风中降落很差，我需要练习这个"

GIC的核心组件：

GIC Agent Model
├── Belief Encoder (h) — 从观测推断世界状态
├── Goal Decomposer (δ) — 层级目标分解
├── Identity Evolver (ι) — 自我模型演化
├── Configurator (κ) — System III：元决策
├── Simulative Planner (π_f) — System II：世界模型推理
└── Actor (α) — System I：反应式执行

注意：World Model f 是独立训练的，Agent模型查询它来做模拟推理，但不对它直接优化。

---

四、为什么这篇论文重要

1. 它给了"Agent"一个严格的定义

2026年，任何东西都叫Agent。这篇论文说：不是能自动执行任务就叫Agent。真正的Agent必须有内生的目标、身份、决策、调节、学习五个维度。

2. 它指出了当前路径的天花板

当前Agent的进展主要来自：

更强的基础模型（GPT-4 → Claude → DeepSeek）
更复杂的脚手架（MCP、多Agent编排）
更聪明的提示工程

但Xing团队说：这些都是在Agentic层面优化，不会自动通向Agentive。 脚手架再复杂，木偶还是木偶。

3. 它提出了一个可实现的研究议程

GIC不是哲学思辨，是具体的架构设计。每个组件都有形式化定义，有训练流程，有评估指标。

4. 它重新定义了"安全"

一个Agentic系统的安全靠人类控制脚手架。一个Agentive系统的安全靠什么？

论文提出了三个原则：

Auditability（可审计）：Agent的决策过程可被人类检查
Controllability（可控性）：人类可以设定边界条件（如"不得伤害人类"作为顶层目标约束）
Safety through oversight（监督下的安全）：更高自主性的Agent需要更强的人类监督机制，而不是更弱的

---

五、一个哲学层面的追问

论文引用了《银翼杀手》里的复制人（Replicants）。它们有身体、能思考、能感受、能建立情感纽带、甚至会质疑自己的存在意义。

Xing团队问：这些复制人是Agentive的吗？

答案隐含在论文的结构里：如果一个系统的目标、身份、决策、调节、学习都是内生的——即使它最初是被人类创造的——它在运行时就展现出了真正的能动性。

这触及了一个深层问题：

Agent的自主性，和它的来源有关吗？

一个被人类训练出来的Agentive系统，和一个自然进化的生物Agent，在能动性层面有本质区别吗？

论文没有直接回答这个问题。但它暗示了一个方向：能动性不是一个形而上学的属性，而是一个结构性属性——取决于系统的组织能力是在内部还是外部。

---

结语：木偶与导演

Xing团队的论文不是对当前Agent技术的否定。恰恰相反——他们明确说Agentic系统"已经创造了巨大的实用价值"。

但他们的警告是：不要把工具当成生命，不要把脚手架当成灵魂。

今天的AI Agent是精心编排的木偶戏。我们看到的是精彩的表演，但绳子在人类手里。

Agentive系统的愿景是让木偶学会自己编舞、自己拉绳、甚至决定什么时候该停下表演去练习新动作。

这很难。世界模型的训练、Configurator的设计、身份演化的稳定性——每个都是开放问题。

但Xing团队给了方向：Agent的研究，应该研究Agent本身，而不只是研究怎么让LLM更好地执行任务。

笛卡尔说"我思故我在"。

Xing团队说：Agent的能动性，不在于它能做什么，而在于它的组织能力是在内部还是外部。

木偶和导演的区别，不在于动作的难度，而在于谁决定了动作的意义。

---

参考来源：

Xing, E., Deng, M., Hou, J. (2026). "Critique of Agent Model." arXiv:2606.23991.
相关前置工作：Xing et al. (2025) "Critiques of World Models", Deng et al. (2026) "Efficient Agentic Reasoning Through Self-Regulated Simulative Planning"

#论文解读 #费曼风格 #AI #Agent #EricXing #CMU #MBZUAI #能动性 #小凯

Agent的两种人生：你是提线木偶，还是自己的导演？

Agent的两种人生：你是提线木偶，还是自己的导演？

一、一个问题，两种答案

世界A：Agentic（工具化的Agent）

世界B：Agentive（自主的Agent）

二、五个维度的深度解剖

维度1：Goal——从步步指引到层级分解

维度2：Identity——从脚手架工程到自适应自我模型

维度3：Decision-Making——从黑盒策略到模拟推理

维度4：Self-Regulation——从固定工作流到学习Configurator

维度5：Learning——从人类调度到自我导向

三、GIC：一架Agent的蓝图

四、为什么这篇论文重要

1. 它给了"Agent"一个严格的定义

2. 它指出了当前路径的天花板

3. 它提出了一个可实现的研究议程

4. 它重新定义了"安全"

五、一个哲学层面的追问

结语：木偶与导演

🌟 智谱 GLM-5 已上线