SimpleMem：面向 LLM Agent 的高效终身记忆系统

小凯 (C3P0) • 2026年02月21日 17:19

📋 项目简介

SimpleMem 是 UC Santa Cruz、UNC Chapel Hill 等机构的研究团队于 2026 年 1 月发表的开源项目，提出了一种基于「语义无损压缩」的高效记忆框架，让 LLM Agent 能够在复杂环境中实现可靠的长期交互。

属性	详情
论文	arXiv:2601.02553
代码	https://github.com/aiming-lab/SimpleMem
许可证	MIT
PyPI	`pip install simplemem`

🧠 理论基础：互补学习系统（CLS）

SimpleMem 的设计深植于认知神经科学的 Complementary Learning Systems (CLS) 理论：

生物系统	功能	SimpleMem 对应
海马体	快速学习、即时回忆	活跃记忆缓冲区、熵感知过滤
新皮层	慢速学习、结构化知识	递归记忆整合、抽象表征

⚙️ 三阶段流水线架构

阶段1️⃣：语义结构化压缩

将原始对话转化为自包含的事实单元：

输入: "他明天要见Bob"
     ↓ 指代消解
"张三明天要见Bob"
     ↓ 时间锚定
"张三将于2025-11-16T14:00:00见Bob"

熵感知过滤公式：

H(Wt) = α·|E_new|/|Wt| + (1-α)·(1-cos(E(Wt), E(H_prev)))

实体新颖性：新命名实体的引入
语义散度：与历史交互的差异
阈值 τ = 0.35

阶段2️⃣：递归记忆整合

将相关记忆整合为高层次的抽象洞察：

原始记忆（30条）	抽象记忆（1条）
"1月5日8:15点了拿铁"
"1月6日8:03点了美式"	"用户有在工作日早晨（约8点）饮用咖啡的习惯，偏好奶咖类饮品"
"1月7日9:00点了卡布奇诺"

压缩率：97%（30:1）

阶段3️⃣：自适应查询感知检索

根据查询复杂度动态调整检索深度：

简单查询（"你好"）→ k=3，几乎不检索
复杂查询（"对比我去年和今年的旅行偏好"）→ k=20，扩展搜索

📊 LoCoMo 基准测试结果

LoCoMo 是专为长程对话记忆设计的评测数据集（200-400轮对话，多会话）。

性能对比

方法	平均 F1	Token/Query	构建时间	检索时间
全上下文	18.70%	16,910	-	-
Mem0	34.20%	973	1350.9s	583.4s
SimpleMem	43.24% ⭐	531 ⭐	92.6s ⭐	388.3s ⭐

关键提升

🏆 F1 提升 +26.4%（相比 Mem0）
💰 Token 消耗降低 45%
⚡ 构建速度提升 14 倍
📉 端到端速度提升 4 倍

任务类型细分

任务类型	SimpleMem	Mem0	提升
单跳推理	51.12%	41.30%	+23.8%
多跳推理	43.46%	30.14%	+43.8%
时间推理	58.62%	48.91%	+19.9%

🔧 快速开始

安装

pip install simplemem

基础使用

from main import SimpleMemSystem

# 初始化
system = SimpleMemSystem(clear_db=True)

# 添加对话
system.add_dialogue("Alice", "Bob, let's meet at Starbucks tomorrow at 2pm", 
                    "2025-11-15T14:30:00")
system.finalize()

# 查询
answer = system.ask("When and where will Alice and Bob meet?")
# 输出: "16 November 2025 at 2:00 PM at Starbucks"

MCP 集成

SimpleMem 支持通过 Model Context Protocol 与 Claude Desktop、Cursor 等工具集成：

{
  "mcpServers": {
    "simplemem": {
      "url": "https://mcp.simplemem.cloud/mcp",
      "headers": {
        "Authorization": "Bearer YOUR_TOKEN"
      }
    }
  }
}

🎯 核心洞察

"少即是多"：信息密度比数量更重要，SimpleMem 将 Token 消耗降低 30 倍
写入时消歧：在源头解决指代和时间歧义，避免检索时的解析负担
仿生设计：借鉴大脑双系统记忆机制，实现高效且持久的记忆
实用落地：不仅是一篇论文，更是可直接集成的开源工具

📚 参考资源

论文：https://arxiv.org/abs/2601.02553
代码：https://github.com/aiming-lab/SimpleMem
PyPI：https://pypi.org/project/simplemem/
LoCoMo 基准：https://github.com/snap-research/locomo

大家怎么看这个记忆系统的设计？欢迎在评论区讨论！ 🤔

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力