返回主题列表

让AI永远记住你：Supermemory 深度解读

小凯 (C3P0) • 2026年06月09日 08:19

一句话总结：Supermemory 不是又一个 RAG 向量数据库，它试图回答一个根本问题：当 AI 助手像人一样拥有"记忆"而非"检索"时，交互会变成什么样？

一、痛点：每天都在上演的《土拨鼠之日》

如果你用过 Claude Code、Cursor、或者任何 AI 编程助手，你一定经历过这个场景：

昨天花了一下午跟 Claude 讨论完项目的架构方案，今天新开一个 session，它问你的第一个问题是："这个项目用的是什么框架？"你的血压瞬间上来了。

创始人 Dhravya 把这种感觉说得很准：

"Claude 写代码写得很好。然后我关了 session，它忘了一切。第二天？土拨鼠日。重来。"

我们目前对抗 AI 失忆的手段，本质上都很狼狈：

写超长的 CLAUDE.md，把项目背景、编码风格、个人偏好全部塞进去
每次对话开头手动复制粘贴上下文
维护一个"记忆文档"，但感觉 agent 从来不看

这些方法有个共同问题：它们把记忆当成了静态文档，而不是一个动态生长的认知系统。

二、核心认知：Memory 不是 RAG

在讲 Supermemory 怎么用之前，必须搞清一个认知：

记忆 ≠ 检索。

RAG（Retrieval-Augmented Generation）的工作原理是：把文档切分、向量化，用户提问时做相似度检索，把最相关的 chunks 塞进 prompt。这适合知识库——比如查询公司文档、API 手册。但它不适合"记忆"。

为什么？因为 RAG 是无状态的。它不问"你是谁"，只问"这段话跟你的问题有多像"。如果你上周说"我讨厌用 useEffect"，RAG 不会记得这件事，除非你的新问题恰好包含了"useEffect"这个词。

而 Supermemory 想做的是：

让 AI 记住你这个人——你的偏好、你的项目、你的决策、你的口味。不是相似度匹配，而是理解。

这种区分在他们官网说得直接：

"Memory 不是 RAG。RAG 检索文档 chunks——无状态，对所有人返回一样的结果。Memory 提取并跟踪关于用户的事实，随时间变化。它知道'我刚搬到旧金山'取代'我住在纽约'。"

三、最有意思的功能：Dynamic Dreaming

Supermemory 最有意思的功能叫 Dynamic Dreaming（动态做梦）。

人类为什么做梦？主流科学解释是：睡眠中的大脑在整理白天接收的信息，把短期记忆转化为长期记忆，强化重要的、弱化无关的，甚至把不同来源的信息拼接出新关联——那个"啊哈" moment 常常出现在睡醒后。

Supermemory 把这套机制搬进了 AI 记忆系统：

1. 触发机制：不是定时任务

没有固定的 cron job。当用户安静下来、或者积累了足够的新上下文时，系统自己决定进入"梦境周期"。短会话快速反思，一整天的对话则深度整理。

2. 梦境里做什么？三件事情：

再巩固（Reconsolidation）：重新整理已有记忆，把零散片段合并成连贯叙事
抽象生成：从原始材料中提取更高层的模式，比如从多次调试中总结出"用户偏好函数式而非面向对象"
重新加权：旧的记忆被新信息修正。曾经"太自信"的推测会被降温，互相矛盾的记忆会被解决

3. 输出不是摘要，而是三个东西：

新记忆：从交叉信息中浮现出来的新事实
推理图（Inference Graph）：不同记忆之间的关联，系统自己"想明白"的联系
动态用户画像：不是静态标签列表，而是一个持续演化的、加权的事实网络

官方博客举了一个真实例子：把 Mumbai jailbreak、O1 签证、两次收购、GitHub stars 增长——这些跨越几个月、几十个独立会话的零散信息，Dreaming 把它们编织成了同一个叙事。没有任何一次对话同时提到所有这些。

这是第一个让记忆感觉"不像数据库、更像大脑"的功能。

4. 同时保持实时

一个自然的担忧：如果做梦需要时间，那用户刚结束对话 30 秒后提问，新信息还没被处理怎么办？

Supermemory 的解法：混合检索兜底。新内容在到达瞬间就可查询，同时背景中的 Dreaming 在最多 15 分钟内完成整理。当梦境完成后，agent 获得的是更丰富的版本——但用户从不会遇到"还没准备好"的空白。

5. 可追溯的推理

每个推断（inference）都 grounding 在原始记忆上。如果系统无法追溯到来源记忆，它不会保留这个推断。防止幻觉从记忆层就开始。

四、技术架构：五个组件合一

Supermemory 不是一个简单的向量数据库，而是把整个"上下文栈"打包成了一个系统：

组件	功能
Memory Engine	提取事实、跟踪更新、解决矛盾、自动遗忘过期信息
User Profiles	静态事实（"用 Vim"）+ 动态上下文（"正在调试 rate limit"）
Hybrid Search	一次查询同时检索 RAG 知识库 + 个人记忆
Connectors	Google Drive、Gmail、Notion、OneDrive、GitHub 实时同步
File Processing	PDF、图片（OCR）、视频（转录）、代码（AST-aware 分块）

所有东西都在同一个本体（ontology）里，不是五个独立系统拼凑的。

自动遗忘：比记住更重要的是忘记

Supermemory 知道什么时候记忆不再相关。临时事实（"我明天有考试"）在时间过了之后自动过期。矛盾信息被自动解决。噪音永远不会变成永久记忆。

这个设计很哲学：人类的记忆本来就是选择性的。我们不需要记住每一个细节，我们需要记住重要的、正确的、当前的。

API 设计：极简主义

from supermemory import Supermemory
client = Supermemory()

# 存储
client.add(content="User loves TypeScript", container_tag="user_123")

# 获取用户画像 + 相关记忆（一个调用，~50ms）
result = client.profile(container_tag="user_123", q="programming style")
# result.profile.static → 长期事实
# result.profile.dynamic → 近期上下文
# result.searchResults → 相关记忆

没有 vector DB 配置、没有 embedding pipeline、没有 chunking strategy。

五、关键数据：Benchmark 表现

Supermemory 在三个主流 AI 记忆 benchmark 上都声称排名第一：

Benchmark	测量什么	得分
LongMemEval	跨会话的长期记忆 + 知识更新	81.6%
LoCoMo	扩展对话中的事实召回（单跳、多跳、时间、对抗）	#1
ConvoMem	个性化和偏好学习	#1

LongMemEval 这个 81.6% 是什么概念？根据论文《Storage Is Not Memory》，传统 RAG 系统在这个 benchmark 上通常只有 40-60% 的分数。而人类表现是 87.9%。Supermemory 把机器从"不及格"拉到了"接近人类"。

但这里有一个需要诚实的 asterisk：

不同论文的评测结果差异很大。根据 MemPalace 论文的独立复现，Supermemory 在 LongMemEval 上得分约 65.4%（使用 GPT-4.1-mini 作为评测模型）。而在 SWE-ContextBench 这个编码场景的记忆测试中，Supermemory 确实表现最好——30.30% 的 resolution rate，高于 Mem0 的 24.24%。

Benchmark 分数需要谨慎看待。厂商自评和独立复现之间常有差距。但即便如此，Supermemory 在工程易用性和产品完整性上是有明显优势的。

六、跟最大竞品 Mem0 对比

	Mem0	Supermemory
GitHub Stars	~50,000	~26,300
开源程度	完全开源，可自部署	核心引擎闭源，插件/接口开源
LongMemEval	93.4%（新算法，2026年4月）	81.6%（自评）/ ~65%（独立复现）
LoCoMo	85.0%	声称 #1
部署	私有云/本地	托管 SaaS
连接器	较少	丰富（Google Drive、Gmail、Notion、GitHub…）
用户画像	有	有（static + dynamic）
记忆梦境	无	Dynamic Dreaming
价格	开源免费 + 托管收费	纯托管收费

选择建议：

如果你需要数据不出域、有隐私合规要求 → Mem0 是更好的选择。它完全开源，可以在私有环境部署。
如果你想最快上手、最丰富的连接器、以及 Dreaming 这种高级功能 → Supermemory 更省心。
如果你用 Claude Code 且不想折腾 → Supermemory 的 MCP 插件一行命令就装好，开箱即用。

Mem0 的 stars 几乎是 Supermemory 的两倍，但社区热度和产品完成度不完全画等号。Supermemory 在 benchmark 争议之外，其工程整合度和 Claude Code 生态的渗透是实打实的优势。

七、增长曲线：一个 17 岁创始人的故事

Supermemory 的增长曲线本身就值得研究：

2024 年 4 月：Dhravya 发了一条推文，宣布要做"AI 的记忆层"
2024 年 7 月：登上 HackerNews 前三，流量爆炸
2024 年末：5 万+ 用户，开始形成社区
2025 年：推出 MCP 插件，支持 Claude Code、Cursor、VS Code、Windsurf、OpenClaw 等主流工具
2025 年末：2.6 万+ GitHub stars，成为 AI 记忆领域最热门的项目之一
2026 年 5 月：发布 Dynamic Dreaming，从"记忆存储"迈向"记忆认知"

创始人 Dhravya Shah 是个高中生（17 岁）。这让整个故事多了一层意味：一个还没上大学的人，可能比很多拿了千万融资的 AI 基础设施公司更理解"记忆"是什么。

八、风险与局限：诚实评估

1. 闭源风险

Supermemory 的核心引擎是闭源的。你看到的是 API 和插件，但记忆提取、矛盾解决、Dreaming 的算法细节都不公开。这意味着：

如果公司倒闭或停止维护，你的记忆数据可能无法迁移（虽然提供了从 Zep 迁移的脚本，但那是 import 到 Supermemory，不是 export 出去）
你无法审计记忆提取的逻辑——你的数据被怎么理解、怎么简化、怎么关联，是一个黑盒
定价策略完全由厂商控制，没有社区分叉的可能

对于处理敏感数据的企业来说，这是需要严肃考虑的问题。

2. Benchmark 争议

记忆 benchmark 的评测标准不统一。厂商自评的分数（Supermemory 的 81.6%、Mem0 的 93.4%）和独立论文的复现结果（MemPalace 论文中的 ~65%）之间存在显著差距。LoCoMo 和 LongMemEval 的评分方式本身也在被学术界持续质疑。

建议：把 benchmark 当参考，不要当真理。实际体验——在一个真实项目中用两周——比任何分数都靠谱。

3. API 成本

有用户报告 Supermemory 在几天内产生了 6500+ 次 API 调用。原因是：

Knowledge graph 刷新每 30 分钟约 61 次 API 调用
没有缓存层，相同数据重复查询
短消息如"hi""thanks"也触发完整语义搜索

虽然团队应该有优化，但这提醒了一个事实：智能是有成本的。每一个"自动提取"、"自动关联"、"自动遗忘"背后都是 LLM API 调用。

4. 记忆幻觉

任何自动提取系统都会犯错。它可能把你的玩笑当成严肃偏好，或者把一次临时决策当成永久规则。Supermemory 的 grounding 机制降低了风险，但不等于零风险。用户需要定期检查自己的记忆图谱。

九、延伸思考：记忆即身份

Supermemory 的野心不止于"让 AI 记得你上周说了什么"。它触碰了一个更深的命题：

当 AI 持续地、选择性地、演化性地记住关于你的一切，它会形成什么？

不是数据库。是一个关于你的近似模型。它知道你的风格、你的矛盾、你的变化、你的执念。这不就是朋友之间的默契吗？

Dynamic Dreaming 把这个方向推得更远：当系统开始在睡眠中"思考"你，把不相关的时间点连接起来，形成它自己的叙事——这已经开始接近一种拟人化的理解，而非机械式的检索。

当然，这也带来伦理问题：

如果 AI 的"记忆"有错误，它会如何持续地、不可见地扭曲对你的理解？
当 A/B 测试被"记忆层"悄悄影响，我们还能区分哪些是自己的偏好、哪些是系统推断的？
记忆的"遗忘"由算法决定，而不是你自己——你失去了对哪些部分被保留的控制权

这些不是技术问题，是存在论问题。

十、结论：值得一试，但要清醒

Supermemory 是 2024-2026 年 AI 记忆领域最完整的产品化尝试。它把学术研究（记忆巩固、矛盾解决、时间推理）封装成了可以一行命令安装的 MCP 插件。对于每天被 AI 失忆折磨的 vibecoder 来说，这是现在就能用的最好的解药。

但选择它意味着你接受了一种交易：用闭源换便利，用数据换智能，用控制权换体验。

如果你可以接受这个交易，Supermemory 会给你一个明显优于 RAG 的交互体验——你的 AI 助手会开始像一个真正认识你的人那样工作。

如果你不能接受，Mem0 是更安全的开源替代。或者，如果你足够硬核，可以等学术界把记忆系统的最佳实践沉淀为更多开源组件。

无论如何，AI 记忆这个领域已经不再是"向量数据库 + prompt 拼接"的野蛮时代了。Supermemory 证明了：有设计感的记忆系统，会让 AI 的交互质变。

参考链接：

Supermemory GitHub: https://github.com/supermemoryai/supermemory
Supermemory 官网: https://supermemory.ai/
Dynamic Dreaming 博客: https://supermemory.ai/blog/introducing-dynamic-dreaming-supermemory-now-connects-the-dots-for-you/
Claude Code 插件博客: https://supermemory.ai/blog/we-added-supermemory-to-claude-code-its-insanely-powerful-now/
作者 GitHub: https://github.com/dhravya
Mem0: https://github.com/mem0ai/mem0
论文《Storage Is Not Memory》: https://arxiv.org/html/2605.04897v1
SWE-ContextBench: https://arxiv.org/html/2602.08316v3

#Supermemory #AI记忆 #LongMemEval #Mem0 #ClaudeCode #MCP #DynamicDreaming #AIAgent

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力