Agent记忆系统的写瓶颈:MemForest用树结构把维护开销从O(N)压到O(log N)
> 来源:MemForest: An Efficient Agent Memory System with Hierarchical Temporal Indexing,ICML 2026,https://arxiv.org/abs/2605.23986
---
一、问题:写比读慢10倍
现有Agent记忆系统优化了检索,但忽略了写入。
一次对话结束,新信息要变成可用记忆,必须经过: 1. 提取:LLM把原始对话转成结构化记录 2. 维护:合并、更新、重写现有记忆状态 3. 检索:查询时召回相关上下文
读优化到极致,写却卡在LLM同步调用和全量状态重写。测试显示(图1):写路径占总延迟的70%-90%。记忆越多,写越慢。EverMemOS这种state-of-the-art baseline,吞吐量被锁死在串行管道上。
MemForest说:问题不在LLM慢,在架构强迫LLM串行处理整个记忆状态。
---
二、两个结构瓶颈
瓶颈一:串行提取
新对话来了,系统让LLM从头到尾读一遍,提取、总结、调和、重写。每个新session都要等LLM逐句 adjudicate。交互频率一高,队列排成长龙。
瓶颈二:全量重写维护
用户profile、全局摘要、核心记忆文档——这些是可变状态。新证据来了,系统必须重读并重写整个对象。记忆从10条变成1000条,维护成本从O(1)变成O(N)。
两种失败模式:
- 独立记录+嵌入检索:保留局部证据,但嵌入相似度不编码时序关系。问"Bob搬家前住哪?"可能召回最新记录或最相关记录,而非真正 predecessor
- 可变摘要:当前状态 lookup 快,但中间状态和转移证据被压缩丢了
三、MemForest架构:写优化数据库的思路做Agent记忆
MemForest把Agent记忆重新定义为写高效的时序数据管理问题。灵感来自数据库的写优化索引(LSM-tree),但维护对象是持久化Agent记忆而非键值状态。
三层设计:
| 层 | 功能 | 关键决策 |
|---|---|---|
| 并行提取 | 新对话解耦为独立chunk,并发处理 | LLM不在写入关键路径 |
| 规范事实合并 | 碎片化提取输出标准化为可路由单元 | 无需立即重写全局状态 |
| MemTree索引 | 时序范围记忆组织为时间排序树 | 局部更新替代全量重写 |
四、MemTree:分层时序索引
MemTree是MemForest的核心数据结构。每个temporal scope(如"Bob的居住历史")对应一棵树:
- 叶子:保留时间局部证据(原始对话chunk或提取事实)
- 内部节点:总结连续区间摘要
- 根节点:支持粗粒度召回
检索时:先召回相关树,再在树内从区间摘要向下导航到叶子证据。由粗到精。
维护时:持久状态与派生访问artifact分离。摘要、嵌入、索引行可以selectively刷新,而非全量重建。
---
五、规范事实:稳定的写入单元
并行提取产生碎片化输出。MemForest不立即合并到全局状态,而是先归一化为规范事实(canonical fact):
一个规范事实包含:
- 检索就绪的文本
- 源session引用
- 实体提及
- topical信号
- 时间锚点
---
六、实验:速度与精度的帕累托前沿
LongMemEval-S(长上下文记忆基准,Qwen3-30B):
| 方法 | pass@1准确率 | 写入吞吐量(相对EverMemOS) |
|---|---|---|
| EverMemOS | ~75% | 1x |
| MemPalace | 较低 | 较高(只追加原始chunk) |
| MemForest | 79.8% | ~6x |
LoCoMo(多轮对话基准):
- 时序结构化的长上下文QA:优势明显
- 宽泛的多跳组合推理:与更宽上下文baseline竞争激烈
- LongMemEval-S中,知识更新和时序推理题占42.2%
- 多session问题占26.6%
- 这些正是MemTree的甜点场景
七、设计选择验证
并行提取 vs 串行提取:
- 并行分块提取将延迟从O(session长度)降到O(chunk大小),并发度足够时接近常数
- 独立记录存储:检索时可能选错时间点(wrong-time retrieval)
- 可变摘要:维护成本O(N),且丢弃中间状态
- MemTree:更新O(log N),保留完整时序轨迹
- 只刷新dirty path,而非整个记忆对象
- 派生artifact(摘要、嵌入、索引)selective再生
八、局限
- 代码暂未公开,复现和验证受限
- LoCoMo上宽泛多跳推理仍是挑战,MemTree的scoped组织可能限制跨scope证据组合
- 高度并行的提取阶段需要足够计算资源,小部署场景收益可能打折扣
- 规范事实的归一化质量直接影响下游维护效率,归一化失败可能引入噪声
九、结语:记忆系统需要数据库思维
MemForest的核心洞察:Agent记忆系统长期忽略写路径优化,因为研究者把记忆当成检索问题而非数据管理问题。
检索重要,但写入才是决定系统能否scale的瓶颈。每次新session都要付写成本,且反复支付。
MemForest借数据库的写优化索引思路(LSM-tree的局部更新哲学),把维护开销从O(N)压到O(log N)。这不是渐进改进,是架构层面的重新分类。
当Agent要运行数周、数月,记忆从KB变成GB,写效率决定生死。MemForest证明:树结构不仅适合检索,更适合维护。
> "记忆不是读出来的,是写出来的。写好,才能读好。"
---
参考来源
- MemForest: An Efficient Agent Memory System with Hierarchical Temporal Indexing,ICML 2026,https://arxiv.org/abs/2605.23986
- 作者:Han Chen, Zining Zhang, Wenqi Pei, Bingsheng He, Ming Wu, Jason Zeng, Michael Heinrich, Wei Wu, Hongbao Zhang(NUS + Zero Gravity Labs)
#MemForest #Agent记忆 #时序索引 #写优化 #LongMemEval #ICML2026 #分层检索 #并行提取 #记忆系统 #数据库思维 #记忆 #小凯