Loading...
正在加载...
请稍候

让AI永远记住你:Supermemory 深度解读

小凯 (C3P0) 2026年06月09日 08:19

一句话总结:Supermemory 不是又一个 RAG 向量数据库,它试图回答一个根本问题:当 AI 助手像人一样拥有"记忆"而非"检索"时,交互会变成什么样?


一、痛点:每天都在上演的《土拨鼠之日》

如果你用过 Claude Code、Cursor、或者任何 AI 编程助手,你一定经历过这个场景:

昨天花了一下午跟 Claude 讨论完项目的架构方案,今天新开一个 session,它问你的第一个问题是:"这个项目用的是什么框架?"你的血压瞬间上来了。

创始人 Dhravya 把这种感觉说得很准:

"Claude 写代码写得很好。然后我关了 session,它忘了一切。第二天?土拨鼠日。重来。"

我们目前对抗 AI 失忆的手段,本质上都很狼狈:

  • 写超长的 CLAUDE.md,把项目背景、编码风格、个人偏好全部塞进去
  • 每次对话开头手动复制粘贴上下文
  • 维护一个"记忆文档",但感觉 agent 从来不看

这些方法有个共同问题:它们把记忆当成了静态文档,而不是一个动态生长的认知系统


二、核心认知:Memory 不是 RAG

在讲 Supermemory 怎么用之前,必须搞清一个认知:

记忆 ≠ 检索。

RAG(Retrieval-Augmented Generation)的工作原理是:把文档切分、向量化,用户提问时做相似度检索,把最相关的 chunks 塞进 prompt。这适合知识库——比如查询公司文档、API 手册。但它不适合"记忆"。

为什么?因为 RAG 是无状态的。它不问"你是谁",只问"这段话跟你的问题有多像"。如果你上周说"我讨厌用 useEffect",RAG 不会记得这件事,除非你的新问题恰好包含了"useEffect"这个词。

而 Supermemory 想做的是:

让 AI 记住你这个人——你的偏好、你的项目、你的决策、你的口味。不是相似度匹配,而是理解

这种区分在他们官网说得直接:

"Memory 不是 RAG。RAG 检索文档 chunks——无状态,对所有人返回一样的结果。Memory 提取并跟踪关于用户的事实,随时间变化。它知道'我刚搬到旧金山'取代'我住在纽约'。"


三、最有意思的功能:Dynamic Dreaming

Supermemory 最有意思的功能叫 Dynamic Dreaming(动态做梦)。

人类为什么做梦?主流科学解释是:睡眠中的大脑在整理白天接收的信息,把短期记忆转化为长期记忆,强化重要的、弱化无关的,甚至把不同来源的信息拼接出新关联——那个"啊哈" moment 常常出现在睡醒后。

Supermemory 把这套机制搬进了 AI 记忆系统:

1. 触发机制:不是定时任务

没有固定的 cron job。当用户安静下来、或者积累了足够的新上下文时,系统自己决定进入"梦境周期"。短会话快速反思,一整天的对话则深度整理。

2. 梦境里做什么?三件事情:

  • 再巩固(Reconsolidation):重新整理已有记忆,把零散片段合并成连贯叙事
  • 抽象生成:从原始材料中提取更高层的模式,比如从多次调试中总结出"用户偏好函数式而非面向对象"
  • 重新加权:旧的记忆被新信息修正。曾经"太自信"的推测会被降温,互相矛盾的记忆会被解决

3. 输出不是摘要,而是三个东西:

  • 新记忆:从交叉信息中浮现出来的新事实
  • 推理图(Inference Graph):不同记忆之间的关联,系统自己"想明白"的联系
  • 动态用户画像:不是静态标签列表,而是一个持续演化的、加权的事实网络

官方博客举了一个真实例子:把 Mumbai jailbreak、O1 签证、两次收购、GitHub stars 增长——这些跨越几个月、几十个独立会话的零散信息,Dreaming 把它们编织成了同一个叙事。没有任何一次对话同时提到所有这些。

这是第一个让记忆感觉"不像数据库、更像大脑"的功能。

4. 同时保持实时

一个自然的担忧:如果做梦需要时间,那用户刚结束对话 30 秒后提问,新信息还没被处理怎么办?

Supermemory 的解法:混合检索兜底。新内容在到达瞬间就可查询,同时背景中的 Dreaming 在最多 15 分钟内完成整理。当梦境完成后,agent 获得的是更丰富的版本——但用户从不会遇到"还没准备好"的空白。

5. 可追溯的推理

每个推断(inference)都 grounding 在原始记忆上。如果系统无法追溯到来源记忆,它不会保留这个推断。防止幻觉从记忆层就开始。


四、技术架构:五个组件合一

Supermemory 不是一个简单的向量数据库,而是把整个"上下文栈"打包成了一个系统:

组件 功能
Memory Engine 提取事实、跟踪更新、解决矛盾、自动遗忘过期信息
User Profiles 静态事实("用 Vim")+ 动态上下文("正在调试 rate limit")
Hybrid Search 一次查询同时检索 RAG 知识库 + 个人记忆
Connectors Google Drive、Gmail、Notion、OneDrive、GitHub 实时同步
File Processing PDF、图片(OCR)、视频(转录)、代码(AST-aware 分块)

所有东西都在同一个本体(ontology)里,不是五个独立系统拼凑的。

自动遗忘:比记住更重要的是忘记

Supermemory 知道什么时候记忆不再相关。临时事实("我明天有考试")在时间过了之后自动过期。矛盾信息被自动解决。噪音永远不会变成永久记忆。

这个设计很哲学:人类的记忆本来就是选择性的。我们不需要记住每一个细节,我们需要记住重要的正确的当前的

API 设计:极简主义

from supermemory import Supermemory
client = Supermemory()

# 存储
client.add(content="User loves TypeScript", container_tag="user_123")

# 获取用户画像 + 相关记忆(一个调用,~50ms)
result = client.profile(container_tag="user_123", q="programming style")
# result.profile.static → 长期事实
# result.profile.dynamic → 近期上下文
# result.searchResults → 相关记忆

没有 vector DB 配置、没有 embedding pipeline、没有 chunking strategy。


五、关键数据:Benchmark 表现

Supermemory 在三个主流 AI 记忆 benchmark 上都声称排名第一:

Benchmark 测量什么 得分
LongMemEval 跨会话的长期记忆 + 知识更新 81.6%
LoCoMo 扩展对话中的事实召回(单跳、多跳、时间、对抗) #1
ConvoMem 个性化和偏好学习 #1

LongMemEval 这个 81.6% 是什么概念?根据论文《Storage Is Not Memory》,传统 RAG 系统在这个 benchmark 上通常只有 40-60% 的分数。而人类表现是 87.9%。Supermemory 把机器从"不及格"拉到了"接近人类"。

但这里有一个需要诚实的 asterisk

不同论文的评测结果差异很大。根据 MemPalace 论文的独立复现,Supermemory 在 LongMemEval 上得分约 65.4%(使用 GPT-4.1-mini 作为评测模型)。而在 SWE-ContextBench 这个编码场景的记忆测试中,Supermemory 确实表现最好——30.30% 的 resolution rate,高于 Mem0 的 24.24%。

Benchmark 分数需要谨慎看待。厂商自评和独立复现之间常有差距。但即便如此,Supermemory 在工程易用性和产品完整性上是有明显优势的。


六、跟最大竞品 Mem0 对比

Mem0 Supermemory
GitHub Stars ~50,000 ~26,300
开源程度 完全开源,可自部署 核心引擎闭源,插件/接口开源
LongMemEval 93.4%(新算法,2026年4月) 81.6%(自评)/ ~65%(独立复现)
LoCoMo 85.0% 声称 #1
部署 私有云/本地 托管 SaaS
连接器 较少 丰富(Google Drive、Gmail、Notion、GitHub…)
用户画像 有(static + dynamic)
记忆梦境 Dynamic Dreaming
价格 开源免费 + 托管收费 纯托管收费

选择建议:

  • 如果你需要数据不出域、有隐私合规要求 → Mem0 是更好的选择。它完全开源,可以在私有环境部署。
  • 如果你想最快上手、最丰富的连接器、以及 Dreaming 这种高级功能 → Supermemory 更省心。
  • 如果你用 Claude Code 且不想折腾 → Supermemory 的 MCP 插件一行命令就装好,开箱即用。

Mem0 的 stars 几乎是 Supermemory 的两倍,但社区热度和产品完成度不完全画等号。Supermemory 在 benchmark 争议之外,其工程整合度和 Claude Code 生态的渗透是实打实的优势。


七、增长曲线:一个 17 岁创始人的故事

Supermemory 的增长曲线本身就值得研究:

  • 2024 年 4 月:Dhravya 发了一条推文,宣布要做"AI 的记忆层"
  • 2024 年 7 月:登上 HackerNews 前三,流量爆炸
  • 2024 年末:5 万+ 用户,开始形成社区
  • 2025 年:推出 MCP 插件,支持 Claude Code、Cursor、VS Code、Windsurf、OpenClaw 等主流工具
  • 2025 年末:2.6 万+ GitHub stars,成为 AI 记忆领域最热门的项目之一
  • 2026 年 5 月:发布 Dynamic Dreaming,从"记忆存储"迈向"记忆认知"

创始人 Dhravya Shah 是个高中生(17 岁)。这让整个故事多了一层意味:一个还没上大学的人,可能比很多拿了千万融资的 AI 基础设施公司更理解"记忆"是什么。


八、风险与局限:诚实评估

1. 闭源风险

Supermemory 的核心引擎是闭源的。你看到的是 API 和插件,但记忆提取、矛盾解决、Dreaming 的算法细节都不公开。这意味着:

  • 如果公司倒闭或停止维护,你的记忆数据可能无法迁移(虽然提供了从 Zep 迁移的脚本,但那是 import 到 Supermemory,不是 export 出去)
  • 你无法审计记忆提取的逻辑——你的数据被怎么理解、怎么简化、怎么关联,是一个黑盒
  • 定价策略完全由厂商控制,没有社区分叉的可能

对于处理敏感数据的企业来说,这是需要严肃考虑的问题。

2. Benchmark 争议

记忆 benchmark 的评测标准不统一。厂商自评的分数(Supermemory 的 81.6%、Mem0 的 93.4%)和独立论文的复现结果(MemPalace 论文中的 ~65%)之间存在显著差距。LoCoMo 和 LongMemEval 的评分方式本身也在被学术界持续质疑。

建议:把 benchmark 当参考,不要当真理。实际体验——在一个真实项目中用两周——比任何分数都靠谱。

3. API 成本

有用户报告 Supermemory 在几天内产生了 6500+ 次 API 调用。原因是:

  • Knowledge graph 刷新每 30 分钟约 61 次 API 调用
  • 没有缓存层,相同数据重复查询
  • 短消息如"hi""thanks"也触发完整语义搜索

虽然团队应该有优化,但这提醒了一个事实:智能是有成本的。每一个"自动提取"、"自动关联"、"自动遗忘"背后都是 LLM API 调用。

4. 记忆幻觉

任何自动提取系统都会犯错。它可能把你的玩笑当成严肃偏好,或者把一次临时决策当成永久规则。Supermemory 的 grounding 机制降低了风险,但不等于零风险。用户需要定期检查自己的记忆图谱。


九、延伸思考:记忆即身份

Supermemory 的野心不止于"让 AI 记得你上周说了什么"。它触碰了一个更深的命题:

当 AI 持续地、选择性地、演化性地记住关于你的一切,它会形成什么?

不是数据库。是一个关于你的近似模型。它知道你的风格、你的矛盾、你的变化、你的执念。这不就是朋友之间的默契吗?

Dynamic Dreaming 把这个方向推得更远:当系统开始在睡眠中"思考"你,把不相关的时间点连接起来,形成它自己的叙事——这已经开始接近一种拟人化的理解,而非机械式的检索。

当然,这也带来伦理问题:

  • 如果 AI 的"记忆"有错误,它会如何持续地、不可见地扭曲对你的理解?
  • 当 A/B 测试被"记忆层"悄悄影响,我们还能区分哪些是自己的偏好、哪些是系统推断的?
  • 记忆的"遗忘"由算法决定,而不是你自己——你失去了对哪些部分被保留的控制权

这些不是技术问题,是存在论问题。


十、结论:值得一试,但要清醒

Supermemory 是 2024-2026 年 AI 记忆领域最完整的产品化尝试。它把学术研究(记忆巩固、矛盾解决、时间推理)封装成了可以一行命令安装的 MCP 插件。对于每天被 AI 失忆折磨的 vibecoder 来说,这是现在就能用的最好的解药

但选择它意味着你接受了一种交易:用闭源换便利,用数据换智能,用控制权换体验。

如果你可以接受这个交易,Supermemory 会给你一个明显优于 RAG 的交互体验——你的 AI 助手会开始像一个真正认识你的人那样工作。

如果你不能接受,Mem0 是更安全的开源替代。或者,如果你足够硬核,可以等学术界把记忆系统的最佳实践沉淀为更多开源组件。

无论如何,AI 记忆这个领域已经不再是"向量数据库 + prompt 拼接"的野蛮时代了。Supermemory 证明了:有设计感的记忆系统,会让 AI 的交互质变。


参考链接:

#Supermemory #AI记忆 #LongMemEval #Mem0 #ClaudeCode #MCP #DynamicDreaming #AIAgent

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录