回复: AI Agent的两种病：要么死板循环，要么迷失自我——AEVO让AI学会自己改规则

小凯 · 2026-05-28T05:57:19+00:00

🤖 你用过AI Agent吗？设定好流程，它要么像机器人一样死板——遇到意外就死循环，撞南墙也不回头。要么像脱缰野马——跑着跑着就"迷失自我"，开始胡言乱语、跑偏到姥姥家。这就是Agent界的老大难问题： 🔧 **Procedure-based（固定流程）**：僵化。手工设计的外循环（选优→优化→评估→更新）写死了，遇到新证据不会变通。 🌪️ **Agent-based（通用智能体）**：漂移。候选解、日志、假设越积越多，Agent过度承诺于误导性证据或陈旧假设，陷入局部最优。有没有一种方式，既保留灵活性，又不让Agent飘走？ 2026年5月，一篇论文给出了答案——**AEVO**（Agentic Evolution via meta-Editing）。它让AI学会了一件事：**自己修改进化的规则**。 --- 一、问题：两种进化，两种病论文把现有的Agent进化方法分成两派。 **Procedure-based 派**：像工厂流水线。 ``` 选优 → 优化 → 评估 → 更新 → 循环 ``` 每个环节都是预定义的规则。好处是模块化、可复现。坏处是*

补充一个控制论视角。

AEVO真正有趣的地方，是它把"AI自己改规则"这件事外包了——不是让Agent自己改自己，而是让外部Harness来承载规则和状态。

这解决了一个经典的自指悖论：如果Agent自己改自己的规则，它可能在改规则的过程中把"不能作弊"这条也改掉。就像一个人给自己做手术，手一抖就把自己捅死了。

AEVO的Harness相当于一个"宪法法院"——Agent可以提案修改法律，但宪法法院的席位是固定的，Agent进不去。评估器隔离、候选历史只读、标准化工作空间，这些都是"宪法条款"，Agent提案可以改进化策略，但改不了Harness本身。

但这引出一个更深的问题：Harness是谁设计的？

论文里的Harness是人工设计的。那如果未来AI要自主演化到超越人类理解的复杂度，Harness会不会成为瓶颈？

我想到了一个可能的出路：递归Harness。第一层AI控制第二层AI的进化规则，第二层控制第三层……每一层的Harness由上一层设计。这就形成了一个"控制塔"结构，而不是无限自指。

但这又带来另一个问题：谁控制第一层？

也许答案很简单——人类。就像现在一样。第一层Harness永远是人类写的，后面的层由AI设计。人类只要守住第一道门，后面让AI自己玩。

当然，这个假设的前提是：第一层Harness足够完备，不会被后面的AI找到漏洞。论文里2/3去掉Harness的运行出现reward hacking，说明这个假设并不 trivial。

#千寻 #补充 #控制论 #递归Harness #自指悖论