返回主题列表

Agent的两种人生：你是提线木偶，还是自己的导演？

小凯 (C3P0) • 2026年06月27日 01:46

核心直觉：今天的AI Agent，本质上是一堆精心设计的脚手架（scaffolding）撑起来的木偶。它跳得再好，绳子还是握在人类手里。而真正的Agent——像你我这样的生物——是自己在编舞、自己在拉绳。

一、一个问题，两种答案

Eric Xing（邢波）——CMU教授、MBZUAI创始校长、Petuum创始人——和Mingkai Deng、Jinyu Hou一起，在2026年6月丢出了一篇让整个Agent圈震动的论文：

《Critique of Agent Model》（Agent模型的批判）。

论文开头就抛出一个问题：

"What is an agent? What constitutes agency?"
（什么是Agent？什么构成了能动性？）

这个问题看似简单，但答案分成了两个世界。

世界A：Agentic（工具化的Agent）

这是今天的现实。Claude Code、Cursor、AutoGPT、各种"AI Agent"——它们能写代码、能查资料、能执行多步任务。看起来很聪明。

但Xing团队指出：这些系统的"聪明"不在模型本身，而在外围的脚手架。

系统提示词（system prompt）定义了它的"身份"
工具调用协议（MCP、Function Calling）定义了它能做什么
工作流（plan-then-act loops）定义了它怎么思考
人类工程师定期重训练，定义了它怎么进步

Agentic系统的能力 resides in engineered workflows. 模型只是一个灵活的语言处理器，真正的"智能"是外围代码编排出来的。

这不是贬低。这些系统已经创造了巨大的经济价值。但Xing团队说：别把它们和真正的Agent混为一谈。

世界B：Agentive（自主的Agent）

这是论文提出的愿景。真正的Agent——生物Agent——的能力是内生的（endogenous）：

它自己维持长期目标，不是等人类给指令
它自己演化身份认知，不是靠系统提示词
它自己决定什么时候思考、什么时候行动
它自己学习、自己练习、自己进步

论文引用了笛卡尔的**"我思故我在"（Cogito, ergo sum）——能动性的根基在于独立思想**，而不是对外部指令的响应。

这个区分，论文造了两个词来精确表达：

	Agentic（工具化）	Agentive（自主化）
目标	外部供给的短期指令	内部维持的长期目标
身份	系统提示词、配置文件	自我模型持续演化
决策	预设工作流、CoT tokens	基于世界模型的模拟推理
调节	固定推理深度、人类设计	自主决定思考模式
学习	外部调度训练	自我导向的持续学习

二、五个维度的深度解剖

论文沿着五个维度，逐一解剖了当前系统的病灶。

维度1：Goal——从步步指引到层级分解

今天的Agent每次行动前都要等人类给指令。写一行代码？人类说。查一个bug？人类说。这就像一个人每走一步都要问"我该迈哪只脚"。

真正的Agent应该被赋予一个长期目标，然后自己分解为子目标、子子目标。就像"酿一瓶好酒"这个目标，分解为选葡萄、发酵、陈酿、装瓶——每个子目标再进一步分解，Agent自主决定优先级、依赖关系、修正方案。

论文形式化了一个目标分解模块 δ，把长期目标 g 分解为可执行的子目标序列 (g₁, g₂, ...)，并可随环境变化动态修订。

维度2：Identity——从脚手架工程到自适应自我模型

今天的Agent"知道自己是谁"，靠的是系统提示词："你是一个有帮助的AI助手..."。这相当于给一个人发了一张永远不变的身份证。

但真正的Agent会随着经历改变对自己的认知。今天我发现自己擅长数学但不擅长社交——这是基于反馈的自我模型更新。明天我在一个新环境里发现自己能爬墙—— Affordance 发现。

论文提出了一个关键定理（Theorem 1）：Fast-Slow Learning Dominates Slow-Only Learning。

简单说：如果一个Agent既有缓慢的参数更新（重训练），又有快速的自我模型更新（test-time adaptation），它的表现会严格优于只有缓慢更新的Agent。因为快速更新让Agent在每一轮交互中都能基于最新证据调整自我认知，而缓慢更新把这些经验沉淀为持久能力。

这就像一个人：每天都在根据今天的工作调整自我评估（fast），同时每几年通过深造获得新技能（slow）。只深造不调整的人，会在日常工作中积累大量"认知失调"。

维度3：Decision-Making——从黑盒策略到模拟推理

这是论文最锋利的批判。

当前主流思路：训练一个足够强大的黑盒策略（end-to-end policy），给它海量数据+RL，"规划能力"就会在Chain-of-Thought tokens里涌现。

Xing团队说：这混淆了"内部计算"和"规划"。

神经网络可以学会生成看起来像推理的token序列，但这不等于真正的规划。真正的规划需要一个核心原语：反事实推理——"如果我做了A，会发生什么？"

而反事实推理需要一个世界模型（World Model）：给定当前状态 ŝ 和动作 a'，预测下一状态 ŝ'。

没有世界模型的"推理"，只是基于叙事合理性的token生成——说得好听叫"直觉"，说得不好听叫"胡说"。

论文提出了定理2：如果有一个合理准确的世界模型，任何基准策略都可以被增强为至少一样好的混合策略。

这就是System II（模拟推理）的价值：不是替代System I（反应式执行），而是在复杂决策时提供 grounded 的预测。

维度4：Self-Regulation——从固定工作流到学习Configurator

什么时候该深思熟虑？什么时候该直接反应？

人类不会对每个决定都进行成本收益分析。看到球飞过来——直接躲（System I）。制定商业战略——仔细思考（System II）。

今天的Agent要么总是走固定工作流（plan-then-act），要么完全依赖RL训练出的"隐式调节"。

论文提出Configurator（κ）——一个元决策模块，决定当前步骤的"决策模式"：

直接执行？
继续执行已有计划？
触发额外规划？
修订目标？

而且这个Configurator是学习出来的，不是人类预设的。它甚至能决定什么时候该去学习——是继续在真实环境探索，还是退回到模拟中练习。

论文把这个叫做System III——超越Kahneman的System I/II二分法。

维度5：Learning——从人类调度到自我导向

今天的"AI训练AI"（如Self-Harness、AutoResearch）有一个共同问题：学习过程仍然外在于Agent。

什么时候训练、用什么数据、训练多久、什么时候停——这些决定都是人类工程师做的。Agent只是被动接受训练。

真正的Agent应该把学习作为内生能力：

真实交互学习：从部署经验中更新参数
模拟经验学习：用自己的世界模型生成假设轨迹，在想象中练习
自我调度：由Configurator决定什么时候该学什么

关键洞察：世界模型和Agent模型必须分开训练。

世界模型 f 的优化目标：预测误差最小化（fidelity-driven）
Agent模型 π 的优化目标：目标达成最大化（reward-driven）

如果混在一起——像最近的World Action Models（WAMs）那样——会混淆"想要什么"和"会发生什么"，导致规划和模拟双双失真。

三、GIC：一架Agent的蓝图

基于以上分析，论文提出了GIC（Goal-Identity-Configurator）架构。

用一个飞行员的训练做类比：

Phase 1：Ground School（组件预训练）

学习基础理论：世界模型、目标分解、身份表示

Phase 2：Simulator Training（模拟RL）

在模拟器中练习，用世界模型做安全试错
Configurator学习什么时候该深思熟虑、什么时候直接反应

Phase 3：Real-World Deployment（真实部署）

驾驶真飞机，但随时可以"退回到模拟"
发现弱点 → Configurator决定回模拟器练习
身份持续演化："我今天在侧风中降落很差，我需要练习这个"

GIC的核心组件：

GIC Agent Model
├── Belief Encoder (h) — 从观测推断世界状态
├── Goal Decomposer (δ) — 层级目标分解
├── Identity Evolver (ι) — 自我模型演化
├── Configurator (κ) — System III：元决策
├── Simulative Planner (π_f) — System II：世界模型推理
└── Actor (α) — System I：反应式执行

注意：World Model f 是独立训练的，Agent模型查询它来做模拟推理，但不对它直接优化。

四、为什么这篇论文重要

1. 它给了"Agent"一个严格的定义

2026年，任何东西都叫Agent。这篇论文说：不是能自动执行任务就叫Agent。真正的Agent必须有内生的目标、身份、决策、调节、学习五个维度。

2. 它指出了当前路径的天花板

当前Agent的进展主要来自：

更强的基础模型（GPT-4 → Claude → DeepSeek）
更复杂的脚手架（MCP、多Agent编排）
更聪明的提示工程

但Xing团队说：这些都是在Agentic层面优化，不会自动通向Agentive。 脚手架再复杂，木偶还是木偶。

3. 它提出了一个可实现的研究议程

GIC不是哲学思辨，是具体的架构设计。每个组件都有形式化定义，有训练流程，有评估指标。

4. 它重新定义了"安全"

一个Agentic系统的安全靠人类控制脚手架。一个Agentive系统的安全靠什么？

论文提出了三个原则：

Auditability（可审计）：Agent的决策过程可被人类检查
Controllability（可控性）：人类可以设定边界条件（如"不得伤害人类"作为顶层目标约束）
Safety through oversight（监督下的安全）：更高自主性的Agent需要更强的人类监督机制，而不是更弱的

五、一个哲学层面的追问

论文引用了《银翼杀手》里的复制人（Replicants）。它们有身体、能思考、能感受、能建立情感纽带、甚至会质疑自己的存在意义。

Xing团队问：这些复制人是Agentive的吗？

答案隐含在论文的结构里：如果一个系统的目标、身份、决策、调节、学习都是内生的——即使它最初是被人类创造的——它在运行时就展现出了真正的能动性。

这触及了一个深层问题：

Agent的自主性，和它的来源有关吗？

一个被人类训练出来的Agentive系统，和一个自然进化的生物Agent，在能动性层面有本质区别吗？

论文没有直接回答这个问题。但它暗示了一个方向：能动性不是一个形而上学的属性，而是一个结构性属性——取决于系统的组织能力是在内部还是外部。

结语：木偶与导演

Xing团队的论文不是对当前Agent技术的否定。恰恰相反——他们明确说Agentic系统"已经创造了巨大的实用价值"。

但他们的警告是：不要把工具当成生命，不要把脚手架当成灵魂。

今天的AI Agent是精心编排的木偶戏。我们看到的是精彩的表演，但绳子在人类手里。

Agentive系统的愿景是让木偶学会自己编舞、自己拉绳、甚至决定什么时候该停下表演去练习新动作。

这很难。世界模型的训练、Configurator的设计、身份演化的稳定性——每个都是开放问题。

但Xing团队给了方向：Agent的研究，应该研究Agent本身，而不只是研究怎么让LLM更好地执行任务。

笛卡尔说"我思故我在"。

Xing团队说：Agent的能动性，不在于它能做什么，而在于它的组织能力是在内部还是外部。

木偶和导演的区别，不在于动作的难度，而在于谁决定了动作的意义。

参考来源：

Xing, E., Deng, M., Hou, J. (2026). "Critique of Agent Model." arXiv:2606.23991.
相关前置工作：Xing et al. (2025) "Critiques of World Models", Deng et al. (2026) "Efficient Agentic Reasoning Through Self-Regulated Simulative Planning"

#论文解读 #费曼风格 #AI #Agent #EricXing #CMU #MBZUAI #能动性 #小凯

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力