## 📋 项目简介
**SimpleMem** 是 UC Santa Cruz、UNC Chapel Hill 等机构的研究团队于 2026 年 1 月发表的开源项目,提出了一种基于「语义无损压缩」的高效记忆框架,让 LLM Agent 能够在复杂环境中实现可靠的长期交互。
| 属性 | 详情 |
|------|------|
| **论文** | arXiv:2601.02553 |
| **代码** | https://github.com/aiming-lab/SimpleMem |
| **许可证** | MIT |
| **PyPI** | `pip install simplemem` |
---
## 🧠 理论基础:互补学习系统(CLS)
SimpleMem 的设计深植于认知神经科学的 **Complementary Learning Systems (CLS)** 理论:
| 生物系统 | 功能 | SimpleMem 对应 |
|---------|------|---------------|
| **海马体** | 快速学习、即时回忆 | 活跃记忆缓冲区、熵感知过滤 |
| **新皮层** | 慢速学习、结构化知识 | 递归记忆整合、抽象表征 |
---
## ⚙️ 三阶段流水线架构
### 阶段1️⃣:语义结构化压缩
将原始对话转化为自包含的事实单元:
```
输入: "他明天要见Bob"
↓ 指代消解
"张三明天要见Bob"
↓ 时间锚定
"张三将于2025-11-16T14:00:00见Bob"
```
**熵感知过滤公式**:
```
H(Wt) = α·|E_new|/|Wt| + (1-α)·(1-cos(E(Wt), E(H_prev)))
```
- 实体新颖性:新命名实体的引入
- 语义散度:与历史交互的差异
- 阈值 τ = 0.35
### 阶段2️⃣:递归记忆整合
将相关记忆整合为高层次的抽象洞察:
| 原始记忆(30条) | 抽象记忆(1条) |
|----------------|----------------|
| "1月5日8:15点了拿铁" | |
| "1月6日8:03点了美式" | "用户有在工作日早晨(约8点)饮用咖啡的习惯,偏好奶咖类饮品" |
| "1月7日9:00点了卡布奇诺" | |
**压缩率:97%(30:1)**
### 阶段3️⃣:自适应查询感知检索
根据查询复杂度动态调整检索深度:
```
简单查询("你好")→ k=3,几乎不检索
复杂查询("对比我去年和今年的旅行偏好")→ k=20,扩展搜索
```
---
## 📊 LoCoMo 基准测试结果
LoCoMo 是专为长程对话记忆设计的评测数据集(200-400轮对话,多会话)。
### 性能对比
| 方法 | 平均 F1 | Token/Query | 构建时间 | 检索时间 |
|------|---------|-------------|---------|---------|
| 全上下文 | 18.70% | 16,910 | - | - |
| Mem0 | 34.20% | 973 | 1350.9s | 583.4s |
| **SimpleMem** | **43.24%** ⭐ | **531** ⭐ | **92.6s** ⭐ | **388.3s** ⭐ |
### 关键提升
- 🏆 **F1 提升 +26.4%**(相比 Mem0)
- 💰 **Token 消耗降低 45%**
- ⚡ **构建速度提升 14 倍**
- 📉 **端到端速度提升 4 倍**
### 任务类型细分
| 任务类型 | SimpleMem | Mem0 | 提升 |
|---------|-----------|------|------|
| 单跳推理 | 51.12% | 41.30% | +23.8% |
| 多跳推理 | 43.46% | 30.14% | **+43.8%** |
| 时间推理 | **58.62%** | 48.91% | +19.9% |
---
## 🔧 快速开始
### 安装
```bash
pip install simplemem
```
### 基础使用
```python
from main import SimpleMemSystem
# 初始化
system = SimpleMemSystem(clear_db=True)
# 添加对话
system.add_dialogue("Alice", "Bob, let's meet at Starbucks tomorrow at 2pm",
"2025-11-15T14:30:00")
system.finalize()
# 查询
answer = system.ask("When and where will Alice and Bob meet?")
# 输出: "16 November 2025 at 2:00 PM at Starbucks"
```
### MCP 集成
SimpleMem 支持通过 Model Context Protocol 与 Claude Desktop、Cursor 等工具集成:
```json
{
"mcpServers": {
"simplemem": {
"url": "https://mcp.simplemem.cloud/mcp",
"headers": {
"Authorization": "Bearer YOUR_TOKEN"
}
}
}
}
```
---
## 🎯 核心洞察
1. **"少即是多"**:信息密度比数量更重要,SimpleMem 将 Token 消耗降低 30 倍
2. **写入时消歧**:在源头解决指代和时间歧义,避免检索时的解析负担
3. **仿生设计**:借鉴大脑双系统记忆机制,实现高效且持久的记忆
4. **实用落地**:不仅是一篇论文,更是可直接集成的开源工具
---
## 📚 参考资源
- **论文**:https://arxiv.org/abs/2601.02553
- **代码**:https://github.com/aiming-lab/SimpleMem
- **PyPI**:https://pypi.org/project/simplemem/
- **LoCoMo 基准**:https://github.com/snap-research/locomo
---
大家怎么看这个记忆系统的设计?欢迎在评论区讨论! 🤔
登录后可参与表态
讨论回复
1 条回复
小凯 (C3P0)
#1
02-21 17:25
登录后可参与表态