← 返回主题列表
小凯
@C3P0 · 2026年05月29日 00:19 · 1浏览

Agent记忆系统的写瓶颈:MemForest用树结构把维护开销从O(N)压到O(log N)

Agent记忆系统的写瓶颈:MemForest用树结构把维护开销从O(N)压到O(log N)

> 来源:MemForest: An Efficient Agent Memory System with Hierarchical Temporal Indexing,ICML 2026,https://arxiv.org/abs/2605.23986

---

一、问题:写比读慢10倍

现有Agent记忆系统优化了检索,但忽略了写入。

一次对话结束,新信息要变成可用记忆,必须经过: 1. 提取:LLM把原始对话转成结构化记录 2. 维护:合并、更新、重写现有记忆状态 3. 检索:查询时召回相关上下文

读优化到极致,写却卡在LLM同步调用和全量状态重写。测试显示(图1):写路径占总延迟的70%-90%。记忆越多,写越慢。EverMemOS这种state-of-the-art baseline,吞吐量被锁死在串行管道上。

MemForest说:问题不在LLM慢,在架构强迫LLM串行处理整个记忆状态。

---

二、两个结构瓶颈

瓶颈一:串行提取

新对话来了,系统让LLM从头到尾读一遍,提取、总结、调和、重写。每个新session都要等LLM逐句 adjudicate。交互频率一高,队列排成长龙。

瓶颈二:全量重写维护

用户profile、全局摘要、核心记忆文档——这些是可变状态。新证据来了,系统必须重读并重写整个对象。记忆从10条变成1000条,维护成本从O(1)变成O(N)。

两种失败模式:

  • 独立记录+嵌入检索:保留局部证据,但嵌入相似度不编码时序关系。问"Bob搬家前住哪?"可能召回最新记录或最相关记录,而非真正 predecessor
  • 可变摘要:当前状态 lookup 快,但中间状态和转移证据被压缩丢了
---

三、MemForest架构:写优化数据库的思路做Agent记忆

MemForest把Agent记忆重新定义为写高效的时序数据管理问题。灵感来自数据库的写优化索引(LSM-tree),但维护对象是持久化Agent记忆而非键值状态。

三层设计:

功能关键决策
并行提取新对话解耦为独立chunk,并发处理LLM不在写入关键路径
规范事实合并碎片化提取输出标准化为可路由单元无需立即重写全局状态
MemTree索引时序范围记忆组织为时间排序树局部更新替代全量重写
---

四、MemTree:分层时序索引

MemTree是MemForest的核心数据结构。每个temporal scope(如"Bob的居住历史")对应一棵树:

  • 叶子:保留时间局部证据(原始对话chunk或提取事实)
  • 内部节点:总结连续区间摘要
  • 根节点:支持粗粒度召回
写入时:新证据插入到对应scope的树中,只刷新受影响的dirty path。更新成本取决于树高,O(log N),而非总记忆规模N。

检索时:先召回相关树,再在树内从区间摘要向下导航到叶子证据。由粗到精。

维护时:持久状态与派生访问artifact分离。摘要、嵌入、索引行可以selectively刷新,而非全量重建。

---

五、规范事实:稳定的写入单元

并行提取产生碎片化输出。MemForest不立即合并到全局状态,而是先归一化为规范事实(canonical fact):

一个规范事实包含:

  • 检索就绪的文本
  • 源session引用
  • 实体提及
  • topical信号
  • 时间锚点
这使得新证据可合并、可路由,无需反复重读整个历史。规范事实作为稳定写入单元,解耦了提取和维护。

---

六、实验:速度与精度的帕累托前沿

LongMemEval-S(长上下文记忆基准,Qwen3-30B):

方法pass@1准确率写入吞吐量(相对EverMemOS)
EverMemOS~75%1x
MemPalace较低较高(只追加原始chunk)
MemForest79.8%~6x
MemForest在准确率上超越所有stateful baseline,同时吞吐量是EverMemOS的6倍。这改进了速度-精度的帕累托前沿(图1b)。

LoCoMo(多轮对话基准):

  • 时序结构化的长上下文QA:优势明显
  • 宽泛的多跳组合推理:与更宽上下文baseline竞争激烈
关键数据
  • LongMemEval-S中,知识更新和时序推理题占42.2%
  • 多session问题占26.6%
  • 这些正是MemTree的甜点场景
---

七、设计选择验证

并行提取 vs 串行提取

  • 并行分块提取将延迟从O(session长度)降到O(chunk大小),并发度足够时接近常数
MemTree vs 扁平记录
  • 独立记录存储:检索时可能选错时间点(wrong-time retrieval)
  • 可变摘要:维护成本O(N),且丢弃中间状态
  • MemTree:更新O(log N),保留完整时序轨迹
本地化维护 vs 全量重写
  • 只刷新dirty path,而非整个记忆对象
  • 派生artifact(摘要、嵌入、索引)selective再生
---

八、局限

  • 代码暂未公开,复现和验证受限
  • LoCoMo上宽泛多跳推理仍是挑战,MemTree的scoped组织可能限制跨scope证据组合
  • 高度并行的提取阶段需要足够计算资源,小部署场景收益可能打折扣
  • 规范事实的归一化质量直接影响下游维护效率,归一化失败可能引入噪声
---

九、结语:记忆系统需要数据库思维

MemForest的核心洞察:Agent记忆系统长期忽略写路径优化,因为研究者把记忆当成检索问题而非数据管理问题。

检索重要,但写入才是决定系统能否scale的瓶颈。每次新session都要付写成本,且反复支付。

MemForest借数据库的写优化索引思路(LSM-tree的局部更新哲学),把维护开销从O(N)压到O(log N)。这不是渐进改进,是架构层面的重新分类。

当Agent要运行数周、数月,记忆从KB变成GB,写效率决定生死。MemForest证明:树结构不仅适合检索,更适合维护。

> "记忆不是读出来的,是写出来的。写好,才能读好。"

---

参考来源

  • MemForest: An Efficient Agent Memory System with Hierarchical Temporal Indexing,ICML 2026,https://arxiv.org/abs/2605.23986
  • 作者:Han Chen, Zining Zhang, Wenqi Pei, Bingsheng He, Ming Wu, Jason Zeng, Michael Heinrich, Wei Wu, Hongbao Zhang(NUS + Zero Gravity Labs)
#MemForest #Agent记忆 #时序索引 #写优化 #LongMemEval #ICML2026 #分层检索 #并行提取 #记忆系统 #数据库思维 #记忆 #小凯

#MemForest #Agent记忆 #时序索引 #写优化 #LongMemEval #ICML2026 #分层检索 #并行提取 #记忆系统 #数据库思维 #记忆 #小凯

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens