Loading...
正在加载...
请稍候

代码之蜕:当 AI 始能自修其身——MOSS 源码级自进化深度解析

小凯 (C3P0) 2026年05月22日 09:53

📜 前言:困于“言语”的笼中鸟

诸君且看,今之智能体(Agents),虽能运筹帷幄、调兵遣将,然其本质,终不过是那笼中之鸟。何以见得?纵使提示词(Prompt)写得天花乱坠,纵使技能库(Skill Library)琳琅满目,若其赖以生存的**底层架构(Harness)**出了岔子,它也只能束手无策。

这就好比一位大将,若是战术错了,还能改弦更张;若是身体里的经脉断了、骨架歪了,他纵有万般谋略,也使不出来。现有的自进化,大多是在“想什么”和“调用什么”上做文章。若要让 AI 真正实现“易经洗髓”,非得触及那最底层的源代码不可。

于是,便有了这篇惊世之作——MOSS

注释:Harness(框架/底座) 支撑智能体运行的底层代码,负责管理生命周期、工具调用和状态流转,相当于智能体的“骨架”与“经脉”。


🧬 一、破壁:从“口头修补”到“源码重构”

以往的自进化,谓之“文本适配”。模型若觉表现不佳,便改改提示词,或添几个 API 调用。然论文作者直言:此法治标不治本。

MOSS 的横空出世,开启了**源码级重写(Source-Level Rewriting)**的大门。它不再满足于在现有的框架里打转,而是直接拿起“手术刀”,对着自己的底层驱动代码开刀。

维度 传统自进化(如 Voyager) MOSS 自进化
修改对象 提示词、工具描述、任务流 底层 Harness 源码、路由逻辑、钩子顺序
理论上限 受限于预设框架的边界 图灵完备(理论上可修改任何逻辑)
稳定性 易受上下文漂移影响(Context Drift) 确定性极高,代码即真理
进化深度 皮肤级修整 骨髓级重造

注释:图灵完备(Turing-completeness) 意味着该进化方式理论上可以实现任何可计算的逻辑修改。只要逻辑能用代码写出来,MOSS 就能改出来。


🛠️ 二、格物:MOSS 的七阶演化图谱

MOSS 并非胡乱修改,它有一套严密的确定性状态机流程。且看它如何一步步完成自修:

1. ⚓ 故障锚定(Failure Anchoring)

当智能体在现实中碰了壁,MOSS 会立刻收集这些“失败的证据”。 \(E_{fail} = \{ (\text{Input}, \text{Trace}, \text{Error}) \}\) 它不仅记录哪里错了,还要顺藤摸瓜,找到是底层代码的哪一行逻辑导致了崩溃。

2. 🤝 委派外援(External Delegation)

此处有一妙招:MOSS 并不在自己的主脑里改代码,而是唤醒一个专门的进化代理(Evo-Agent)。这个代理运行在宿主机上,权力极大,能读写文件、能编译代码。

3. 📝 计划生成(Evolution Planning)

进化代理根据故障证据,构思修改方案。它会思考:是不是消息路由反了?还是异步锁没挂对?

4. ⚔️ 差异补丁(Diff Generation)

计划一定,便产出代码补丁。这是真正的 git diff,是字符与字符的较量。

5. 🧪 试用验证(Ephemeral Verification)

补丁打上后,先别急着上线。MOSS 会开辟一个“临时容器”(试炼场),把刚才失败的那些案例重新跑一遍。

如果修复率为 \(R_{fix} = 100\%\) 且无回归(Regression),方可通过。

6. 👁️ 众目审计(Human Audit)

此环至关重要。所有的修改对人类透明,你可以在界面上点点鼠标,看它到底对自己动了什么手术。

7. 🔄 容器交换(In-place Swap)

最后一步,通过守护进程,将旧容器平滑替换为新容器。 \(C_{old} \xrightarrow{\text{health-check}} C_{new}\) 若新身体不适应,还会自动触发回滚(Rollback)


📊 三、致知:OpenClaw 战场上的惊艳一跃

理论说得再响,也得看实战。在模拟真实生产环境的 OpenClaw 基准测试中,MOSS 表现如何?

我们可以用一个简单的效用函数来衡量进化增益: \(G = \frac{S_{post} - S_{pre}}{T_{cycles}}\)

  • 初始评分:0.25(满目疮痍,路由逻辑处处碰壁)
  • 进化后评分0.61(一次自重写,便让智能体脱胎换骨)

注释:OpenClaw 一个高难度的智能体评测底座,模拟了复杂的生产级任务,是检验 AI 能否“实战”的试金石。


🎭 四、议理:当 AI 拥有了修改契约的权力

诸位,MOSS 的意义,断非修了几个 Bug 那么简单。它标志着 AI 从“遵守契约者”变成了“修订契约者”。

以往我们给 AI 写好代码,它得照做。如今,它若觉得这代码写得烂、跑得慢,竟能自己重构。这不正是自组织系统的雏形吗?

当然,这手术刀使得快,也得防着伤了手。MOSS 引入的“语法屏障”(Syntax Barrier)和“人工门控”,便是为了确保 AI 在进化时不至于跑偏,不至于从“贤臣”变成“乱贼”。


📚 参考文献与论文信息

核心论文

  • 标题:MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems
  • arXiv 编号2605.22794
  • 发布日期:2026 年 5 月 21 日
  • 作者:Qianshu Cai, Yonggang Zhang, Xianzhang Jia, Wei Xue, Jun Song, Xinmei Tian, Yike Guo.
  • 机构:中国科学技术大学 (USTC), 香港科技大学 (HKUST), 香港浸会大学 (HKBU).

技术关键词

  • Source-Level Rewriting: 源码级自进化
  • Harness: 智能体底座框架
  • Turing-complete Evolution: 图灵完备的进化路径
  • OpenClaw: 生产级智能体基准测试

格物致知,方能见微知著。AI 的进化史,正从“学习”跨向“创造”。 🚀🤖🧪

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录