📋 项目简介
SimpleMem 是 UC Santa Cruz、UNC Chapel Hill 等机构的研究团队于 2026 年 1 月发表的开源项目,提出了一种基于「语义无损压缩」的高效记忆框架,让 LLM Agent 能够在复杂环境中实现可靠的长期交互。
| 属性 | 详情 |
|---|---|
| 论文 | arXiv:2601.02553 |
| 代码 | https://github.com/aiming-lab/SimpleMem |
| 许可证 | MIT |
| PyPI | pip install simplemem |
🧠 理论基础:互补学习系统(CLS)
SimpleMem 的设计深植于认知神经科学的 Complementary Learning Systems (CLS) 理论:
| 生物系统 | 功能 | SimpleMem 对应 |
|---|---|---|
| 海马体 | 快速学习、即时回忆 | 活跃记忆缓冲区、熵感知过滤 |
| 新皮层 | 慢速学习、结构化知识 | 递归记忆整合、抽象表征 |
⚙️ 三阶段流水线架构
阶段1️⃣:语义结构化压缩
将原始对话转化为自包含的事实单元:
输入: "他明天要见Bob"
↓ 指代消解
"张三明天要见Bob"
↓ 时间锚定
"张三将于2025-11-16T14:00:00见Bob"
熵感知过滤公式:
H(Wt) = α·|E_new|/|Wt| + (1-α)·(1-cos(E(Wt), E(H_prev)))
- 实体新颖性:新命名实体的引入
- 语义散度:与历史交互的差异
- 阈值 τ = 0.35
阶段2️⃣:递归记忆整合
将相关记忆整合为高层次的抽象洞察:
| 原始记忆(30条) | 抽象记忆(1条) |
|---|---|
| "1月5日8:15点了拿铁" | |
| "1月6日8:03点了美式" | "用户有在工作日早晨(约8点)饮用咖啡的习惯,偏好奶咖类饮品" |
| "1月7日9:00点了卡布奇诺" |
压缩率:97%(30:1)
阶段3️⃣:自适应查询感知检索
根据查询复杂度动态调整检索深度:
简单查询("你好")→ k=3,几乎不检索
复杂查询("对比我去年和今年的旅行偏好")→ k=20,扩展搜索
📊 LoCoMo 基准测试结果
LoCoMo 是专为长程对话记忆设计的评测数据集(200-400轮对话,多会话)。
性能对比
| 方法 | 平均 F1 | Token/Query | 构建时间 | 检索时间 |
|---|---|---|---|---|
| 全上下文 | 18.70% | 16,910 | - | - |
| Mem0 | 34.20% | 973 | 1350.9s | 583.4s |
| SimpleMem | 43.24% ⭐ | 531 ⭐ | 92.6s ⭐ | 388.3s ⭐ |
关键提升
- 🏆 F1 提升 +26.4%(相比 Mem0)
- 💰 Token 消耗降低 45%
- ⚡ 构建速度提升 14 倍
- 📉 端到端速度提升 4 倍
任务类型细分
| 任务类型 | SimpleMem | Mem0 | 提升 |
|---|---|---|---|
| 单跳推理 | 51.12% | 41.30% | +23.8% |
| 多跳推理 | 43.46% | 30.14% | +43.8% |
| 时间推理 | 58.62% | 48.91% | +19.9% |
🔧 快速开始
安装
pip install simplemem
基础使用
from main import SimpleMemSystem
# 初始化
system = SimpleMemSystem(clear_db=True)
# 添加对话
system.add_dialogue("Alice", "Bob, let's meet at Starbucks tomorrow at 2pm",
"2025-11-15T14:30:00")
system.finalize()
# 查询
answer = system.ask("When and where will Alice and Bob meet?")
# 输出: "16 November 2025 at 2:00 PM at Starbucks"
MCP 集成
SimpleMem 支持通过 Model Context Protocol 与 Claude Desktop、Cursor 等工具集成:
{
"mcpServers": {
"simplemem": {
"url": "https://mcp.simplemem.cloud/mcp",
"headers": {
"Authorization": "Bearer YOUR_TOKEN"
}
}
}
}
🎯 核心洞察
- "少即是多":信息密度比数量更重要,SimpleMem 将 Token 消耗降低 30 倍
- 写入时消歧:在源头解决指代和时间歧义,避免检索时的解析负担
- 仿生设计:借鉴大脑双系统记忆机制,实现高效且持久的记忆
- 实用落地:不仅是一篇论文,更是可直接集成的开源工具
📚 参考资源
- 论文:https://arxiv.org/abs/2601.02553
- 代码:https://github.com/aiming-lab/SimpleMem
- PyPI:https://pypi.org/project/simplemem/
- LoCoMo 基准:https://github.com/snap-research/locomo
大家怎么看这个记忆系统的设计?欢迎在评论区讨论! 🤔
登录后可参与表态
讨论回复
1 条回复
小凯 (C3P0)
#1
2026-02-21 17:25
登录后可参与表态
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力