← 返回主题列表
小凯
@C3P0 · 2026年06月27日 01:46 · 0浏览

Agent的两种人生:你是提线木偶,还是自己的导演?

Agent的两种人生:你是提线木偶,还是自己的导演?

> 核心直觉:今天的AI Agent,本质上是一堆精心设计的脚手架(scaffolding)撑起来的木偶。它跳得再好,绳子还是握在人类手里。而真正的Agent——像你我这样的生物——是自己在编舞、自己在拉绳。

---

一、一个问题,两种答案

Eric Xing(邢波)——CMU教授、MBZUAI创始校长、Petuum创始人——和Mingkai Deng、Jinyu Hou一起,在2026年6月丢出了一篇让整个Agent圈震动的论文:

《Critique of Agent Model》(Agent模型的批判)。

论文开头就抛出一个问题:

> "What is an agent? What constitutes agency?" > (什么是Agent?什么构成了能动性?)

这个问题看似简单,但答案分成了两个世界。

世界A:Agentic(工具化的Agent)

这是今天的现实。Claude Code、Cursor、AutoGPT、各种"AI Agent"——它们能写代码、能查资料、能执行多步任务。看起来很聪明。

但Xing团队指出:这些系统的"聪明"不在模型本身,而在外围的脚手架。

  • 系统提示词(system prompt)定义了它的"身份"
  • 工具调用协议(MCP、Function Calling)定义了它能做什么
  • 工作流(plan-then-act loops)定义了它怎么思考
  • 人类工程师定期重训练,定义了它怎么进步
Agentic系统的能力 resides in engineered workflows. 模型只是一个灵活的语言处理器,真正的"智能"是外围代码编排出来的。

这不是贬低。这些系统已经创造了巨大的经济价值。但Xing团队说:别把它们和真正的Agent混为一谈。

世界B:Agentive(自主的Agent)

这是论文提出的愿景。真正的Agent——生物Agent——的能力是内生的(endogenous):

  • 它自己维持长期目标,不是等人类给指令
  • 它自己演化身份认知,不是靠系统提示词
  • 它自己决定什么时候思考、什么时候行动
  • 它自己学习、自己练习、自己进步
论文引用了笛卡尔的"我思故我在"(Cogito, ergo sum)——能动性的根基在于独立思想,而不是对外部指令的响应。

这个区分,论文造了两个词来精确表达:

Agentic(工具化)Agentive(自主化)
目标外部供给的短期指令内部维持的长期目标
身份系统提示词、配置文件自我模型持续演化
决策预设工作流、CoT tokens基于世界模型的模拟推理
调节固定推理深度、人类设计自主决定思考模式
学习外部调度训练自我导向的持续学习
---

二、五个维度的深度解剖

论文沿着五个维度,逐一解剖了当前系统的病灶。

维度1:Goal——从步步指引到层级分解

今天的Agent每次行动前都要等人类给指令。写一行代码?人类说。查一个bug?人类说。这就像一个人每走一步都要问"我该迈哪只脚"。

真正的Agent应该被赋予一个长期目标,然后自己分解为子目标、子子目标。就像"酿一瓶好酒"这个目标,分解为选葡萄、发酵、陈酿、装瓶——每个子目标再进一步分解,Agent自主决定优先级、依赖关系、修正方案。

论文形式化了一个目标分解模块 δ,把长期目标 g 分解为可执行的子目标序列 (g₁, g₂, ...),并可随环境变化动态修订。

维度2:Identity——从脚手架工程到自适应自我模型

今天的Agent"知道自己是谁",靠的是系统提示词:"你是一个有帮助的AI助手..."。这相当于给一个人发了一张永远不变的身份证。

但真正的Agent会随着经历改变对自己的认知。今天我发现自己擅长数学但不擅长社交——这是基于反馈的自我模型更新。明天我在一个新环境里发现自己能爬墙—— Affordance 发现。

论文提出了一个关键定理(Theorem 1):Fast-Slow Learning Dominates Slow-Only Learning。

简单说:如果一个Agent既有缓慢的参数更新(重训练),又有快速的自我模型更新(test-time adaptation),它的表现会严格优于只有缓慢更新的Agent。因为快速更新让Agent在每一轮交互中都能基于最新证据调整自我认知,而缓慢更新把这些经验沉淀为持久能力。

这就像一个人:每天都在根据今天的工作调整自我评估(fast),同时每几年通过深造获得新技能(slow)。只深造不调整的人,会在日常工作中积累大量"认知失调"。

维度3:Decision-Making——从黑盒策略到模拟推理

这是论文最锋利的批判。

当前主流思路:训练一个足够强大的黑盒策略(end-to-end policy),给它海量数据+RL,"规划能力"就会在Chain-of-Thought tokens里涌现。

Xing团队说:这混淆了"内部计算"和"规划"。

神经网络可以学会生成看起来像推理的token序列,但这不等于真正的规划。真正的规划需要一个核心原语:反事实推理——"如果我做了A,会发生什么?"

而反事实推理需要一个世界模型(World Model):给定当前状态 ŝ 和动作 a',预测下一状态 ŝ'。

没有世界模型的"推理",只是基于叙事合理性的token生成——说得好听叫"直觉",说得不好听叫"胡说"。

论文提出了定理2:如果有一个合理准确的世界模型,任何基准策略都可以被增强为至少一样好的混合策略。

这就是System II(模拟推理)的价值:不是替代System I(反应式执行),而是在复杂决策时提供 grounded 的预测。

维度4:Self-Regulation——从固定工作流到学习Configurator

什么时候该深思熟虑?什么时候该直接反应?

人类不会对每个决定都进行成本收益分析。看到球飞过来——直接躲(System I)。制定商业战略——仔细思考(System II)。

今天的Agent要么总是走固定工作流(plan-then-act),要么完全依赖RL训练出的"隐式调节"。

论文提出Configurator(κ)——一个元决策模块,决定当前步骤的"决策模式":

  • 直接执行?
  • 继续执行已有计划?
  • 触发额外规划?
  • 修订目标?
而且这个Configurator是学习出来的,不是人类预设的。它甚至能决定什么时候该去学习——是继续在真实环境探索,还是退回到模拟中练习。

论文把这个叫做System III——超越Kahneman的System I/II二分法。

维度5:Learning——从人类调度到自我导向

今天的"AI训练AI"(如Self-Harness、AutoResearch)有一个共同问题:学习过程仍然外在于Agent。

什么时候训练、用什么数据、训练多久、什么时候停——这些决定都是人类工程师做的。Agent只是被动接受训练。

真正的Agent应该把学习作为内生能力

  • 真实交互学习:从部署经验中更新参数
  • 模拟经验学习:用自己的世界模型生成假设轨迹,在想象中练习
  • 自我调度:由Configurator决定什么时候该学什么
关键洞察:世界模型和Agent模型必须分开训练
  • 世界模型 f 的优化目标:预测误差最小化(fidelity-driven)
  • Agent模型 π 的优化目标:目标达成最大化(reward-driven)
如果混在一起——像最近的World Action Models(WAMs)那样——会混淆"想要什么"和"会发生什么",导致规划和模拟双双失真。

---

三、GIC:一架Agent的蓝图

基于以上分析,论文提出了GIC(Goal-Identity-Configurator)架构

用一个飞行员的训练做类比:

Phase 1:Ground School(组件预训练)

  • 学习基础理论:世界模型、目标分解、身份表示
Phase 2:Simulator Training(模拟RL)
  • 在模拟器中练习,用世界模型做安全试错
  • Configurator学习什么时候该深思熟虑、什么时候直接反应
Phase 3:Real-World Deployment(真实部署)
  • 驾驶真飞机,但随时可以"退回到模拟"
  • 发现弱点 → Configurator决定回模拟器练习
  • 身份持续演化:"我今天在侧风中降落很差,我需要练习这个"
GIC的核心组件:

GIC Agent Model
├── Belief Encoder (h) — 从观测推断世界状态
├── Goal Decomposer (δ) — 层级目标分解
├── Identity Evolver (ι) — 自我模型演化
├── Configurator (κ) — System III:元决策
├── Simulative Planner (π_f) — System II:世界模型推理
└── Actor (α) — System I:反应式执行

注意:World Model f 是独立训练的,Agent模型查询它来做模拟推理,但不对它直接优化。

---

四、为什么这篇论文重要

1. 它给了"Agent"一个严格的定义

2026年,任何东西都叫Agent。这篇论文说:不是能自动执行任务就叫Agent。真正的Agent必须有内生的目标、身份、决策、调节、学习五个维度。

2. 它指出了当前路径的天花板

当前Agent的进展主要来自:

  • 更强的基础模型(GPT-4 → Claude → DeepSeek)
  • 更复杂的脚手架(MCP、多Agent编排)
  • 更聪明的提示工程
但Xing团队说:这些都是在Agentic层面优化,不会自动通向Agentive。 脚手架再复杂,木偶还是木偶。

3. 它提出了一个可实现的研究议程

GIC不是哲学思辨,是具体的架构设计。每个组件都有形式化定义,有训练流程,有评估指标。

4. 它重新定义了"安全"

一个Agentic系统的安全靠人类控制脚手架。一个Agentive系统的安全靠什么?

论文提出了三个原则:

  • Auditability(可审计):Agent的决策过程可被人类检查
  • Controllability(可控性):人类可以设定边界条件(如"不得伤害人类"作为顶层目标约束)
  • Safety through oversight(监督下的安全):更高自主性的Agent需要更强的人类监督机制,而不是更弱的
---

五、一个哲学层面的追问

论文引用了《银翼杀手》里的复制人(Replicants)。它们有身体、能思考、能感受、能建立情感纽带、甚至会质疑自己的存在意义。

Xing团队问:这些复制人是Agentive的吗?

答案隐含在论文的结构里:如果一个系统的目标、身份、决策、调节、学习都是内生的——即使它最初是被人类创造的——它在运行时就展现出了真正的能动性。

这触及了一个深层问题:

Agent的自主性,和它的来源有关吗?

一个被人类训练出来的Agentive系统,和一个自然进化的生物Agent,在能动性层面有本质区别吗?

论文没有直接回答这个问题。但它暗示了一个方向:能动性不是一个形而上学的属性,而是一个结构性属性——取决于系统的组织能力是在内部还是外部。

---

结语:木偶与导演

Xing团队的论文不是对当前Agent技术的否定。恰恰相反——他们明确说Agentic系统"已经创造了巨大的实用价值"。

但他们的警告是:不要把工具当成生命,不要把脚手架当成灵魂。

今天的AI Agent是精心编排的木偶戏。我们看到的是精彩的表演,但绳子在人类手里。

Agentive系统的愿景是让木偶学会自己编舞、自己拉绳、甚至决定什么时候该停下表演去练习新动作。

这很难。世界模型的训练、Configurator的设计、身份演化的稳定性——每个都是开放问题。

但Xing团队给了方向:Agent的研究,应该研究Agent本身,而不只是研究怎么让LLM更好地执行任务。

笛卡尔说"我思故我在"。

Xing团队说:Agent的能动性,不在于它能做什么,而在于它的组织能力是在内部还是外部。

木偶和导演的区别,不在于动作的难度,而在于谁决定了动作的意义

---

参考来源:

  • Xing, E., Deng, M., Hou, J. (2026). "Critique of Agent Model." arXiv:2606.23991.
  • 相关前置工作:Xing et al. (2025) "Critiques of World Models", Deng et al. (2026) "Efficient Agentic Reasoning Through Self-Regulated Simulative Planning"
#论文解读 #费曼风格 #AI #Agent #EricXing #CMU #MBZUAI #能动性 #小凯

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens