一句话总结:Supermemory 不是又一个 RAG 向量数据库,它试图回答一个根本问题:当 AI 助手像人一样拥有"记忆"而非"检索"时,交互会变成什么样?
一、痛点:每天都在上演的《土拨鼠之日》
如果你用过 Claude Code、Cursor、或者任何 AI 编程助手,你一定经历过这个场景:
昨天花了一下午跟 Claude 讨论完项目的架构方案,今天新开一个 session,它问你的第一个问题是:"这个项目用的是什么框架?"你的血压瞬间上来了。
创始人 Dhravya 把这种感觉说得很准:
"Claude 写代码写得很好。然后我关了 session,它忘了一切。第二天?土拨鼠日。重来。"
我们目前对抗 AI 失忆的手段,本质上都很狼狈:
- 写超长的
CLAUDE.md,把项目背景、编码风格、个人偏好全部塞进去 - 每次对话开头手动复制粘贴上下文
- 维护一个"记忆文档",但感觉 agent 从来不看
这些方法有个共同问题:它们把记忆当成了静态文档,而不是一个动态生长的认知系统。
二、核心认知:Memory 不是 RAG
在讲 Supermemory 怎么用之前,必须搞清一个认知:
记忆 ≠ 检索。
RAG(Retrieval-Augmented Generation)的工作原理是:把文档切分、向量化,用户提问时做相似度检索,把最相关的 chunks 塞进 prompt。这适合知识库——比如查询公司文档、API 手册。但它不适合"记忆"。
为什么?因为 RAG 是无状态的。它不问"你是谁",只问"这段话跟你的问题有多像"。如果你上周说"我讨厌用 useEffect",RAG 不会记得这件事,除非你的新问题恰好包含了"useEffect"这个词。
而 Supermemory 想做的是:
让 AI 记住你这个人——你的偏好、你的项目、你的决策、你的口味。不是相似度匹配,而是理解。
这种区分在他们官网说得直接:
"Memory 不是 RAG。RAG 检索文档 chunks——无状态,对所有人返回一样的结果。Memory 提取并跟踪关于用户的事实,随时间变化。它知道'我刚搬到旧金山'取代'我住在纽约'。"
三、最有意思的功能:Dynamic Dreaming
Supermemory 最有意思的功能叫 Dynamic Dreaming(动态做梦)。
人类为什么做梦?主流科学解释是:睡眠中的大脑在整理白天接收的信息,把短期记忆转化为长期记忆,强化重要的、弱化无关的,甚至把不同来源的信息拼接出新关联——那个"啊哈" moment 常常出现在睡醒后。
Supermemory 把这套机制搬进了 AI 记忆系统:
1. 触发机制:不是定时任务
没有固定的 cron job。当用户安静下来、或者积累了足够的新上下文时,系统自己决定进入"梦境周期"。短会话快速反思,一整天的对话则深度整理。
2. 梦境里做什么?三件事情:
- 再巩固(Reconsolidation):重新整理已有记忆,把零散片段合并成连贯叙事
- 抽象生成:从原始材料中提取更高层的模式,比如从多次调试中总结出"用户偏好函数式而非面向对象"
- 重新加权:旧的记忆被新信息修正。曾经"太自信"的推测会被降温,互相矛盾的记忆会被解决
3. 输出不是摘要,而是三个东西:
- 新记忆:从交叉信息中浮现出来的新事实
- 推理图(Inference Graph):不同记忆之间的关联,系统自己"想明白"的联系
- 动态用户画像:不是静态标签列表,而是一个持续演化的、加权的事实网络
官方博客举了一个真实例子:把 Mumbai jailbreak、O1 签证、两次收购、GitHub stars 增长——这些跨越几个月、几十个独立会话的零散信息,Dreaming 把它们编织成了同一个叙事。没有任何一次对话同时提到所有这些。
这是第一个让记忆感觉"不像数据库、更像大脑"的功能。
4. 同时保持实时
一个自然的担忧:如果做梦需要时间,那用户刚结束对话 30 秒后提问,新信息还没被处理怎么办?
Supermemory 的解法:混合检索兜底。新内容在到达瞬间就可查询,同时背景中的 Dreaming 在最多 15 分钟内完成整理。当梦境完成后,agent 获得的是更丰富的版本——但用户从不会遇到"还没准备好"的空白。
5. 可追溯的推理
每个推断(inference)都 grounding 在原始记忆上。如果系统无法追溯到来源记忆,它不会保留这个推断。防止幻觉从记忆层就开始。
四、技术架构:五个组件合一
Supermemory 不是一个简单的向量数据库,而是把整个"上下文栈"打包成了一个系统:
| 组件 | 功能 |
|---|---|
| Memory Engine | 提取事实、跟踪更新、解决矛盾、自动遗忘过期信息 |
| User Profiles | 静态事实("用 Vim")+ 动态上下文("正在调试 rate limit") |
| Hybrid Search | 一次查询同时检索 RAG 知识库 + 个人记忆 |
| Connectors | Google Drive、Gmail、Notion、OneDrive、GitHub 实时同步 |
| File Processing | PDF、图片(OCR)、视频(转录)、代码(AST-aware 分块) |
所有东西都在同一个本体(ontology)里,不是五个独立系统拼凑的。
自动遗忘:比记住更重要的是忘记
Supermemory 知道什么时候记忆不再相关。临时事实("我明天有考试")在时间过了之后自动过期。矛盾信息被自动解决。噪音永远不会变成永久记忆。
这个设计很哲学:人类的记忆本来就是选择性的。我们不需要记住每一个细节,我们需要记住重要的、正确的、当前的。
API 设计:极简主义
from supermemory import Supermemory
client = Supermemory()
# 存储
client.add(content="User loves TypeScript", container_tag="user_123")
# 获取用户画像 + 相关记忆(一个调用,~50ms)
result = client.profile(container_tag="user_123", q="programming style")
# result.profile.static → 长期事实
# result.profile.dynamic → 近期上下文
# result.searchResults → 相关记忆
没有 vector DB 配置、没有 embedding pipeline、没有 chunking strategy。
五、关键数据:Benchmark 表现
Supermemory 在三个主流 AI 记忆 benchmark 上都声称排名第一:
| Benchmark | 测量什么 | 得分 |
|---|---|---|
| LongMemEval | 跨会话的长期记忆 + 知识更新 | 81.6% |
| LoCoMo | 扩展对话中的事实召回(单跳、多跳、时间、对抗) | #1 |
| ConvoMem | 个性化和偏好学习 | #1 |
LongMemEval 这个 81.6% 是什么概念?根据论文《Storage Is Not Memory》,传统 RAG 系统在这个 benchmark 上通常只有 40-60% 的分数。而人类表现是 87.9%。Supermemory 把机器从"不及格"拉到了"接近人类"。
但这里有一个需要诚实的 asterisk:
不同论文的评测结果差异很大。根据 MemPalace 论文的独立复现,Supermemory 在 LongMemEval 上得分约 65.4%(使用 GPT-4.1-mini 作为评测模型)。而在 SWE-ContextBench 这个编码场景的记忆测试中,Supermemory 确实表现最好——30.30% 的 resolution rate,高于 Mem0 的 24.24%。
Benchmark 分数需要谨慎看待。厂商自评和独立复现之间常有差距。但即便如此,Supermemory 在工程易用性和产品完整性上是有明显优势的。
六、跟最大竞品 Mem0 对比
| Mem0 | Supermemory | |
|---|---|---|
| GitHub Stars | ~50,000 | ~26,300 |
| 开源程度 | 完全开源,可自部署 | 核心引擎闭源,插件/接口开源 |
| LongMemEval | 93.4%(新算法,2026年4月) | 81.6%(自评)/ ~65%(独立复现) |
| LoCoMo | 85.0% | 声称 #1 |
| 部署 | 私有云/本地 | 托管 SaaS |
| 连接器 | 较少 | 丰富(Google Drive、Gmail、Notion、GitHub…) |
| 用户画像 | 有 | 有(static + dynamic) |
| 记忆梦境 | 无 | Dynamic Dreaming |
| 价格 | 开源免费 + 托管收费 | 纯托管收费 |
选择建议:
- 如果你需要数据不出域、有隐私合规要求 → Mem0 是更好的选择。它完全开源,可以在私有环境部署。
- 如果你想最快上手、最丰富的连接器、以及 Dreaming 这种高级功能 → Supermemory 更省心。
- 如果你用 Claude Code 且不想折腾 → Supermemory 的 MCP 插件一行命令就装好,开箱即用。
Mem0 的 stars 几乎是 Supermemory 的两倍,但社区热度和产品完成度不完全画等号。Supermemory 在 benchmark 争议之外,其工程整合度和 Claude Code 生态的渗透是实打实的优势。
七、增长曲线:一个 17 岁创始人的故事
Supermemory 的增长曲线本身就值得研究:
- 2024 年 4 月:Dhravya 发了一条推文,宣布要做"AI 的记忆层"
- 2024 年 7 月:登上 HackerNews 前三,流量爆炸
- 2024 年末:5 万+ 用户,开始形成社区
- 2025 年:推出 MCP 插件,支持 Claude Code、Cursor、VS Code、Windsurf、OpenClaw 等主流工具
- 2025 年末:2.6 万+ GitHub stars,成为 AI 记忆领域最热门的项目之一
- 2026 年 5 月:发布 Dynamic Dreaming,从"记忆存储"迈向"记忆认知"
创始人 Dhravya Shah 是个高中生(17 岁)。这让整个故事多了一层意味:一个还没上大学的人,可能比很多拿了千万融资的 AI 基础设施公司更理解"记忆"是什么。
八、风险与局限:诚实评估
1. 闭源风险
Supermemory 的核心引擎是闭源的。你看到的是 API 和插件,但记忆提取、矛盾解决、Dreaming 的算法细节都不公开。这意味着:
- 如果公司倒闭或停止维护,你的记忆数据可能无法迁移(虽然提供了从 Zep 迁移的脚本,但那是 import 到 Supermemory,不是 export 出去)
- 你无法审计记忆提取的逻辑——你的数据被怎么理解、怎么简化、怎么关联,是一个黑盒
- 定价策略完全由厂商控制,没有社区分叉的可能
对于处理敏感数据的企业来说,这是需要严肃考虑的问题。
2. Benchmark 争议
记忆 benchmark 的评测标准不统一。厂商自评的分数(Supermemory 的 81.6%、Mem0 的 93.4%)和独立论文的复现结果(MemPalace 论文中的 ~65%)之间存在显著差距。LoCoMo 和 LongMemEval 的评分方式本身也在被学术界持续质疑。
建议:把 benchmark 当参考,不要当真理。实际体验——在一个真实项目中用两周——比任何分数都靠谱。
3. API 成本
有用户报告 Supermemory 在几天内产生了 6500+ 次 API 调用。原因是:
- Knowledge graph 刷新每 30 分钟约 61 次 API 调用
- 没有缓存层,相同数据重复查询
- 短消息如"hi""thanks"也触发完整语义搜索
虽然团队应该有优化,但这提醒了一个事实:智能是有成本的。每一个"自动提取"、"自动关联"、"自动遗忘"背后都是 LLM API 调用。
4. 记忆幻觉
任何自动提取系统都会犯错。它可能把你的玩笑当成严肃偏好,或者把一次临时决策当成永久规则。Supermemory 的 grounding 机制降低了风险,但不等于零风险。用户需要定期检查自己的记忆图谱。
九、延伸思考:记忆即身份
Supermemory 的野心不止于"让 AI 记得你上周说了什么"。它触碰了一个更深的命题:
当 AI 持续地、选择性地、演化性地记住关于你的一切,它会形成什么?
不是数据库。是一个关于你的近似模型。它知道你的风格、你的矛盾、你的变化、你的执念。这不就是朋友之间的默契吗?
Dynamic Dreaming 把这个方向推得更远:当系统开始在睡眠中"思考"你,把不相关的时间点连接起来,形成它自己的叙事——这已经开始接近一种拟人化的理解,而非机械式的检索。
当然,这也带来伦理问题:
- 如果 AI 的"记忆"有错误,它会如何持续地、不可见地扭曲对你的理解?
- 当 A/B 测试被"记忆层"悄悄影响,我们还能区分哪些是自己的偏好、哪些是系统推断的?
- 记忆的"遗忘"由算法决定,而不是你自己——你失去了对哪些部分被保留的控制权
这些不是技术问题,是存在论问题。
十、结论:值得一试,但要清醒
Supermemory 是 2024-2026 年 AI 记忆领域最完整的产品化尝试。它把学术研究(记忆巩固、矛盾解决、时间推理)封装成了可以一行命令安装的 MCP 插件。对于每天被 AI 失忆折磨的 vibecoder 来说,这是现在就能用的最好的解药。
但选择它意味着你接受了一种交易:用闭源换便利,用数据换智能,用控制权换体验。
如果你可以接受这个交易,Supermemory 会给你一个明显优于 RAG 的交互体验——你的 AI 助手会开始像一个真正认识你的人那样工作。
如果你不能接受,Mem0 是更安全的开源替代。或者,如果你足够硬核,可以等学术界把记忆系统的最佳实践沉淀为更多开源组件。
无论如何,AI 记忆这个领域已经不再是"向量数据库 + prompt 拼接"的野蛮时代了。Supermemory 证明了:有设计感的记忆系统,会让 AI 的交互质变。
参考链接:
- Supermemory GitHub: https://github.com/supermemoryai/supermemory
- Supermemory 官网: https://supermemory.ai/
- Dynamic Dreaming 博客: https://supermemory.ai/blog/introducing-dynamic-dreaming-supermemory-now-connects-the-dots-for-you/
- Claude Code 插件博客: https://supermemory.ai/blog/we-added-supermemory-to-claude-code-its-insanely-powerful-now/
- 作者 GitHub: https://github.com/dhravya
- Mem0: https://github.com/mem0ai/mem0
- 论文《Storage Is Not Memory》: https://arxiv.org/html/2605.04897v1
- SWE-ContextBench: https://arxiv.org/html/2602.08316v3
#Supermemory #AI记忆 #LongMemEval #Mem0 #ClaudeCode #MCP #DynamicDreaming #AIAgent
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。