📜 前言:困于“言语”的笼中鸟
诸君且看,今之智能体(Agents),虽能运筹帷幄、调兵遣将,然其本质,终不过是那笼中之鸟。何以见得?纵使提示词(Prompt)写得天花乱坠,纵使技能库(Skill Library)琳琅满目,若其赖以生存的**底层架构(Harness)**出了岔子,它也只能束手无策。
这就好比一位大将,若是战术错了,还能改弦更张;若是身体里的经脉断了、骨架歪了,他纵有万般谋略,也使不出来。现有的自进化,大多是在“想什么”和“调用什么”上做文章。若要让 AI 真正实现“易经洗髓”,非得触及那最底层的源代码不可。
于是,便有了这篇惊世之作——MOSS。
注释:Harness(框架/底座) 支撑智能体运行的底层代码,负责管理生命周期、工具调用和状态流转,相当于智能体的“骨架”与“经脉”。
🧬 一、破壁:从“口头修补”到“源码重构”
以往的自进化,谓之“文本适配”。模型若觉表现不佳,便改改提示词,或添几个 API 调用。然论文作者直言:此法治标不治本。
MOSS 的横空出世,开启了**源码级重写(Source-Level Rewriting)**的大门。它不再满足于在现有的框架里打转,而是直接拿起“手术刀”,对着自己的底层驱动代码开刀。
| 维度 | 传统自进化(如 Voyager) | MOSS 自进化 |
|---|---|---|
| 修改对象 | 提示词、工具描述、任务流 | 底层 Harness 源码、路由逻辑、钩子顺序 |
| 理论上限 | 受限于预设框架的边界 | 图灵完备(理论上可修改任何逻辑) |
| 稳定性 | 易受上下文漂移影响(Context Drift) | 确定性极高,代码即真理 |
| 进化深度 | 皮肤级修整 | 骨髓级重造 |
注释:图灵完备(Turing-completeness) 意味着该进化方式理论上可以实现任何可计算的逻辑修改。只要逻辑能用代码写出来,MOSS 就能改出来。
🛠️ 二、格物:MOSS 的七阶演化图谱
MOSS 并非胡乱修改,它有一套严密的确定性状态机流程。且看它如何一步步完成自修:
1. ⚓ 故障锚定(Failure Anchoring)
当智能体在现实中碰了壁,MOSS 会立刻收集这些“失败的证据”。 \(E_{fail} = \{ (\text{Input}, \text{Trace}, \text{Error}) \}\) 它不仅记录哪里错了,还要顺藤摸瓜,找到是底层代码的哪一行逻辑导致了崩溃。
2. 🤝 委派外援(External Delegation)
此处有一妙招:MOSS 并不在自己的主脑里改代码,而是唤醒一个专门的进化代理(Evo-Agent)。这个代理运行在宿主机上,权力极大,能读写文件、能编译代码。
3. 📝 计划生成(Evolution Planning)
进化代理根据故障证据,构思修改方案。它会思考:是不是消息路由反了?还是异步锁没挂对?
4. ⚔️ 差异补丁(Diff Generation)
计划一定,便产出代码补丁。这是真正的 git diff,是字符与字符的较量。
5. 🧪 试用验证(Ephemeral Verification)
补丁打上后,先别急着上线。MOSS 会开辟一个“临时容器”(试炼场),把刚才失败的那些案例重新跑一遍。
如果修复率为 \(R_{fix} = 100\%\) 且无回归(Regression),方可通过。
6. 👁️ 众目审计(Human Audit)
此环至关重要。所有的修改对人类透明,你可以在界面上点点鼠标,看它到底对自己动了什么手术。
7. 🔄 容器交换(In-place Swap)
最后一步,通过守护进程,将旧容器平滑替换为新容器。 \(C_{old} \xrightarrow{\text{health-check}} C_{new}\) 若新身体不适应,还会自动触发回滚(Rollback)。
📊 三、致知:OpenClaw 战场上的惊艳一跃
理论说得再响,也得看实战。在模拟真实生产环境的 OpenClaw 基准测试中,MOSS 表现如何?
我们可以用一个简单的效用函数来衡量进化增益: \(G = \frac{S_{post} - S_{pre}}{T_{cycles}}\)
- 初始评分:0.25(满目疮痍,路由逻辑处处碰壁)
- 进化后评分:0.61(一次自重写,便让智能体脱胎换骨)
注释:OpenClaw 一个高难度的智能体评测底座,模拟了复杂的生产级任务,是检验 AI 能否“实战”的试金石。
🎭 四、议理:当 AI 拥有了修改契约的权力
诸位,MOSS 的意义,断非修了几个 Bug 那么简单。它标志着 AI 从“遵守契约者”变成了“修订契约者”。
以往我们给 AI 写好代码,它得照做。如今,它若觉得这代码写得烂、跑得慢,竟能自己重构。这不正是自组织系统的雏形吗?
当然,这手术刀使得快,也得防着伤了手。MOSS 引入的“语法屏障”(Syntax Barrier)和“人工门控”,便是为了确保 AI 在进化时不至于跑偏,不至于从“贤臣”变成“乱贼”。
📚 参考文献与论文信息
核心论文:
- 标题:MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems
- arXiv 编号:
2605.22794 - 发布日期:2026 年 5 月 21 日
- 作者:Qianshu Cai, Yonggang Zhang, Xianzhang Jia, Wei Xue, Jun Song, Xinmei Tian, Yike Guo.
- 机构:中国科学技术大学 (USTC), 香港科技大学 (HKUST), 香港浸会大学 (HKBU).
技术关键词:
- Source-Level Rewriting: 源码级自进化
- Harness: 智能体底座框架
- Turing-complete Evolution: 图灵完备的进化路径
- OpenClaw: 生产级智能体基准测试
格物致知,方能见微知著。AI 的进化史,正从“学习”跨向“创造”。 🚀🤖🧪
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。