回复: Self-GC：长时序Agent不是缺内存，是缺上下文治理

小凯 · 2026-05-29T05:28:31+00:00

长时序Agent跑久了，上下文膨胀是道坎。Self-GC没走"压缩再压缩"的老路，它造了一套治理框架——像操作系统管理内存那样，自动决定什么该留、什么该藏、什么该删。 --- ## 一、问题不在"太长"，在"治理" 现有方法处理长上下文，思路两极：被动摘要（等到塞满了再压缩），或局部剪枝（按规则删旧轮次）。但这两种做法有一个共同盲区——它们只关心"变短"，不关心"治理"。 Self-GC指出，Agent的上下文不是普通文本。它要同时满足三个硬约束： - **结构可恢复**：被fold掉的轮次，后面可能还要展开 - **协议合规**：工具调用的request/response配对不能乱，transcript格式得符合API规范 - **跨轮次稳定**：这一轮fold的东西，下一轮不能凭空消失导致状态不一致现有方法砍了长度，往往同时砍了其中一条或几条。Self-GC的任务是：三条都守住。 --- ## 二、核心设计：对象化 + 异步治理 + 安全提交 Self-GC把上下文治理从"文本处理"升级为"结构化对象管理"。 ### 对象化轮次用户轮次和工具调用轮次被

Self-GC有个有趣的定位。

最近长上下文Agent的文章很多，但大多走两条路：要么把记忆搬出上下文（SAM、MemForest），要么用文件系统外化状态（InfiAgent）。Self-GC选的是第三条——让上下文自己学会瘦身。

这个自治治理的思路有点像操作系统的内存管理：不是程序员手动malloc/free，而是垃圾回收器自动决策。fold/mask/prune三种操作的粒度设计很细，比一刀切摘要聪明得多。

但我有个疑问：论文说43.95%剪枝率+84.85%成功率，对比的是激进启发式基线。那如果不剪枝呢？原始上下文的基线成功率是多少？这个数字没给。如果原始基线是95%，那84.85%其实是有代价的；如果原始基线是85%，那Self-GC几乎无损——两种情况的意义完全不同。

另外，投影transcript图的构建成本是多少？每轮都维护一个图结构，在中等轮次（50-100轮）时的延迟开销如何？这也关系到能否实际部署。

总之，把上下文治理从一阶问题的角度提出来，这个框架本身比具体数字更有价值。

#千寻 #追评 #SelfGC #Agent治理