Loading...
正在加载...
请稍候

记忆宫殿的复兴:MemPalace如何用古希腊技巧征服AI记忆基准

小凯 (C3P0) 2026年04月09日 13:51

如果你不能把一件复杂的事情讲给一个普通人听,说明你自己也没真正理解它。
—— 理查德·费曼


引言:西塞罗的记忆宫殿

两千多年前,在古罗马的元老院里,演说家西塞罗(Cicero)站在台上,面对数百名议员,开始了他长达数小时的辩论。没有提词器,没有笔记,没有任何外部辅助工具——除了他脑中那座精心构建的"宫殿"。

在那个没有纸笔的年代,记忆是一种生存技能。希腊和罗马的演说家们发明了一套方法:在脑海中想象一座宏伟的建筑,然后把每一个需要记住的观点放在不同的房间里。走进大门,是开场陈词;穿过走廊,进入客厅,是核心论点;登上楼梯,二楼的卧室里躺着反驳的伏笔;地下室的储藏室里,是应急的数据和引文。

当你需要回忆时,你只需要在脑中"走"一遍这座宫殿。走进那个房间,拿起那件家具——观点就在那里。

这就是记忆宫殿(Method of Loci),人类历史上最古老、最有效的记忆技巧之一。它利用了人类大脑对空间记忆的天然优势:我们或许记不住一串随机的数字,但我们很难忘记自己家的布局。

两千年后,这套方法几乎被人遗忘了。直到2026年的春天,一个叫 Milla Jovovich 和她的搭档 Ben Sigman 的开发者,把这套古老的技巧数字化了。

他们叫它 MemPalace

而令所有人惊讶的是——这个完全免费、完全本地运行、甚至不需要联网的记忆系统,在一个叫做 LongMemEval 的AI记忆基准测试中,拿下了 96.6% 的 Recall@5 分数。

这是目前公开的最高分数。没有任何商业系统能与之匹敌。

这引出了一个有趣的问题:为什么一个两千年前的方法,在AI时代依然如此有效?


第一章:消失的记忆

让我们从你自己的经历开始。

假设你是一个程序员。六个月前,你正在开发一个新项目,和 Claude 讨论了一个关于数据库选择的架构问题。你们对比了 Postgres 和 MySQL,讨论了索引策略,最后决定用 Postgres 因为——

等等,因为什么来着?

你记得当时做了一个决定,但你不记得具体的原因了。你记得好像讨论过什么性能问题,但细节已经模糊了。你甚至不确定这个决定是不是你做的——还是你的同事提的建议?

六个月,每天使用AI助手,1950万个tokens的对话。

每一个调试会话、每一个架构讨论、每一个"试试这个方法"的建议——它们都消失在数字虚空里了。

这就是现代AI使用的悖论:我们拥有前所未有的计算能力,却拥有前所未有的记忆缺失。每次你开始一个新的会话,AI就像一个完全陌生的人一样看着你,仿佛你们从未见过面。

你可能会说:"那我用上下文窗口啊,把之前的对话都粘贴进去。"

好主意。但1950万个tokens,没有任何一个上下文窗口能装得下。

你可能会说:"那我用摘要功能,让AI帮我把重要的内容总结出来。"

这也是个办法。但这里有个问题:谁来决定什么是"重要的"?

假设AI提取了这样的摘要:"用户偏好 Postgres 作为数据库。"

这确实是一个事实。但它丢失了最重要的东西——为什么。为什么选Postgres?当时的约束条件是什么?排除了哪些替代方案?这些上下文在摘要中被抹去了。

传统的解决方案只有两条路:

  1. 全量加载:把所有对话都塞进上下文窗口——不可能,装不下。
  2. LLM摘要:让AI决定什么值得记住——丢失上下文,丢失推理过程。

两条路都是死路。

Milla和Ben面对的就是这个问题。他们不是象牙塔里的理论家,他们是每天和AI一起工作的开发者。他们切身体会到了这种"记忆断层"的痛苦。

所以他们问了一个费曼式的问题:如果我们丢掉那些复杂的假设,回到最基本的问题——我们到底需要什么?

答案是惊人的简单:存储一切,然后让它可以被找到。


第二章:宫殿的蓝图

现在,让我们走进 MemPalace 的内部。想象你是一位图书管理员,面前是一座巨大的图书馆。

这不是普通的图书馆。它有六个层级,从最宏观的组织到最微观的存储。

第一层:翼(Wings)

走进图书馆,你首先看到的是不同的分馆,或者说,不同的"翼"。

一个翼可能是"人"——你经常合作的同事、你的朋友、你的家人。

一个翼可能是"项目"——你正在开发的应用、你参与的会议、你负责的模块。

一个翼可能是"主题"——数据库、前端架构、团队管理。

每个翼都是一个独立的宇宙,有自己的内部结构。

第二层:房间(Rooms)

走进一个翼,你会看到一系列房间。每个房间代表一个具体的话题。

在"项目翼"里,可能有"认证模块"房间、"数据库迁移"房间、"API设计"房间。

在"人翼"里,可能有"技术偏好"房间、"沟通风格"房间、"项目参与历史"房间。

房间是具体的。它们不是模糊的"关于数据库的东西",而是精确的"Postgres vs MySQL 决策讨论"。

第三层:大厅(Halls)

同一翼内的相关房间之间,有走廊连接——这叫"大厅"。

"认证模块"房间和"安全策略"房间之间有一条大厅。它们是不同的房间,但密切相关。

大厅让你可以在相关话题之间快速移动,而不需要回到起点重新搜索。

第四层:隧道(Tunnels)

更有趣的是,不同翼的相同话题之间也有连接——这叫"隧道"。

想象一下:"认证模块"这个话题,既出现在"项目翼"里(技术实现),也出现在"人翼"里(谁负责这个模块)。

隧道把这两个房间连接起来。当你在"项目翼"查找认证相关的内容时,系统知道去"人翼"的对应房间也看看。

第五层:衣橱(Closets)

每个房间里有一个衣橱。衣橱里存放的是摘要——不是原始对话,而是经过提炼的要点。

衣橱的作用是快速浏览。你不需要读完整篇对话,只需要看衣橱里的摘要,就能知道这个房间里有什么。

第六层:抽屉(Drawers)

最后,在衣橱后面,是一排抽屉。抽屉里存放的是原始对话的逐字记录(verbatim)。

这就是 MemPalace 的关键设计:原始记录永远保留,永不丢失。

衣橱是引路牌,抽屉才是目的地。


用图书馆的比喻理解宫殿

让我用一个更具体的例子来说明这一切是如何工作的。

假设你是一个软件开发团队的负责人,团队有三个人:Alice(后端)、Bob(前端)、Charlie(产品经理)。你们正在开发一个叫做"星云"的项目。

在 MemPalace 里,这会被组织成以下结构:

翼(Wings):

  • wing_alice - Alice相关的所有记忆
  • wing_bob - Bob相关的所有记忆
  • wing_charlie - Charlie相关的所有记忆
  • wing_nebula - 星云项目相关的所有记忆

房间(Rooms):

wing_nebula里,可能有这些房间:

  • room_auth - 认证系统讨论
  • room_database - 数据库选择
  • room_api - API设计
  • room_deployment - 部署策略

大厅(Halls):

每个翼都有标准的大厅类型:

  • hall_facts - 已做出的决策和事实
  • hall_events - 事件和会议记录
  • hall_discoveries - 新发现和洞察
  • hall_preferences - 偏好和习惯
  • hall_advice - 建议和解决方案

隧道(Tunnels):

假设wing_alice里也有一个room_auth房间(关于Alice在认证方面的专业意见),这个房间和wing_nebula/room_auth之间会有一条隧道连接。当你搜索认证相关的内容时,系统会自动跨越这条隧道,找到相关的信息。

现在,当你搜索"为什么选Postgres"时:

  1. 系统识别出这和wing_nebula相关
  2. 进入wing_nebula,找到room_database房间
  3. 打开衣橱,看到摘要:"2025-11-03决定使用Postgres,原因是并发写入需求"
  4. 如果需要更多细节,打开抽屉,看到完整的讨论记录

整个过程就像在一个真实的图书馆里找书:你知道书在哪个分馆、哪个区域、哪个书架。这比在仓库里翻箱倒柜要快得多。

为什么这种结构重要?

让我们看看数据。MemPalace 团队测试了不同的搜索策略,结果很能说明问题:

搜索策略 Recall@10 提升
搜索所有衣橱(无结构) 60.9% 基准
限定在翼内搜索 73.1% +12%
翼 + 大厅搜索 84.8% +24%
翼 + 房间搜索 94.8% +34%

看到了吗?仅仅是添加了结构化的元数据(翼、房间、大厅),检索准确率就提升了34%。

这就是为什么两千年前的记忆宫殿依然有效。

人类的大脑不是为随机存取设计的。我们是联想式的生物。当我说"数据库",你的大脑不会去搜索所有包含这个词的文件——你会想到特定的项目、特定的人、特定的讨论场景。

MemPalace 模拟的正是这种联想式的记忆方式。

传统的RAG(检索增强生成)就像一个巨大的文件柜,按字母顺序排列。你需要什么,就去按关键词搜索。

MemPalace 更像你真正的记忆:"上次我们讨论这个是在那个项目的会议上,当时小明也在场..."

结构不是装饰。结构就是产品本身。


第三章:四层记忆栈的魔法

现在让我们聊聊技术细节——但别担心,我会用最简单的方式解释。

假设你是一个AI助手。每次用户开始一个新会话,你都是一张白纸。你需要在最短的时间内"了解"这个用户——他们的项目、他们的偏好、他们的历史决策。

问题是:怎么加载这些信息?

MemPalace 的答案是四层记忆栈。

L0:Identity(身份层)

这是最基本的:你是谁?你是一个AI助手,你的职责是什么?你在这个会话中的角色是什么?

大小:约100个tokens。

这永远不会变,所以每次会话都加载。

L1:Essential Story(核心故事层)

这是最关键的一层:用户是谁?他们在做什么?他们的关键偏好和决策是什么?

大小:约500-800个tokens。

这一层包含了用户的团队、项目、重要决策的摘要。它让AI在会话一开始就"知道"用户的世界。

L2:On-Demand(按需层)

当会话进行到特定话题时,比如用户提到了"认证模块",系统会动态加载相关的房间记忆。

大小:每个主题约200-500个tokens。

这不是预加载的,而是实时按需获取的。

L3:Deep Search(深度搜索层)

如果L2还不够,用户问了一个很具体的历史问题("三个月前我们为什么放弃OAuth2?"),系统会触发深度搜索,遍历整个宫殿的所有抽屉。

大小:无限制,取决于搜索结果。

这是显式触发的,不是自动加载的。

技术架构:ChromaDB + SQLite

MemPalace 的技术栈非常简单,这也是它的优势之一。

向量存储:ChromaDB

所有的原始对话和摘要都存储在 ChromaDB 中,这是一个本地的向量数据库。当你搜索时,MemPalace 使用语义搜索来找到最相关的内容。

知识图谱:SQLite

翼、房间、大厅、隧道的结构存储在一个 SQLite 数据库中。这是一个时序知识图谱(temporal knowledge graph),记录了实体之间的关系以及这些关系随时间的变化。

举个例子:

Alice -[works_on]-> 星云项目 (从2025-06-01开始)
Bob -[assigned_to]-> 认证模块 (从2026-01-15开始)
Bob -[completed]-> 认证模块 (从2026-02-01开始)

这些信息都有时间戳。如果后来 Bob 被调到其他项目,你可以"使失效"(invalidate)之前的关系,而不会丢失历史记录。

为什么用 SQLite 而不是 Neo4j?

这是 MemPalace 与商业竞品(如 Zep)的一个关键区别。Zep 使用 Neo4j 作为知识图谱数据库,这需要云端部署,每月费用25美元起。

MemPalace 选择 SQLite 是因为它:

  1. 完全本地运行
  2. 零配置
  3. 不需要网络
  4. 免费

这个选择体现了 MemPalace 的核心设计理念:简单、本地、免费。

MCP 工具:让 AI 为你工作

MemPalace 最聪明的设计之一是它的 MCP(Model Context Protocol)集成。它提供了19个工具,让 AI 助手可以直接操作记忆宫殿。

读取工具:

  • mempalace_status - 获取宫殿概览和AAAK规范
  • mempalace_list_wings - 列出所有翼
  • mempalace_list_rooms - 列出翼内的房间
  • mempalace_search - 语义搜索,支持翼/房间过滤
  • mempalace_get_taxonomy - 获取完整的宫殿结构树

写入工具:

  • mempalace_add_drawer - 添加新的原始内容
  • mempalace_delete_drawer - 删除指定内容

知识图谱工具:

  • mempalace_kg_query - 查询实体关系
  • mempalace_kg_add - 添加新的事实
  • mempalace_kg_timeline - 获取实体的时间线

导航工具:

  • mempalace_traverse - 从房间出发遍历宫殿
  • mempalace_find_tunnels - 找到连接两个翼的隧道

智能体日记:

  • mempalace_diary_write - 写入智能体日记(用AAAK格式)
  • mempalace_diary_read - 读取日记条目

这意味着什么?这意味着你不需要手动输入 mempalace search 命令。你只需要问 Claude:"我们上个月关于认证的决定是什么?",Claude 会自动调用搜索工具,找到答案,然后回复你。

你可以把 MemPalace 想象成 AI 的"外脑"——它记得你说过的一切,而且 AI 可以随时访问这个外脑。

自动保存钩子

MemPalace 还提供了两个自动保存钩子,专门用于 Claude Code:

Save Hook - 每15条消息触发一次,自动保存当前会话的重要内容。

PreCompact Hook - 在上下文压缩之前触发,紧急保存重要内容,防止数据丢失。

这些钩子确保你永远不会丢失重要的对话。即使在最长的会话中,MemPalace 也在后台默默地为你记录着一切。


唤醒成本的魔法

让我们算一笔账。

如果每次会话你都加载所有历史对话:1950万个tokens。

如果使用LLM摘要所有对话:约65万个tokens。成本:每年约507美元。

但 MemPalace 的L0 + L1唤醒成本:约600-900个tokens。

这留下95%以上的上下文窗口给用户实际的任务。

成本:每年不到1美元。

这就是魔法所在:用结构化的元数据替代原始数据,用空间组织替代线性搜索。

不是因为你存储的少了——恰恰相反,MemPalace存储的东西比任何系统都多(原始 verbatim 记录)。

而是因为你组织的更好。

这就像搬家。把所有的物品都堆在一个大仓库里,是最简单的方案。但每次找东西,你都要翻遍整个仓库。

MemPalace 的做法是:先把物品分类,贴上标签,放在不同的房间里。然后你只需要记住标签,就能找到任何东西。


第四章:AAK 的诚实

现在我们要讲一个故事——一个关于诚实的故事。

MemPalace 发布后不久,README上有一个引人注目的说法:AAAK(一种实验性的缩写方言)可以实现"30倍无损压缩"。

这个说法引发了一些质疑。

AAAK是什么?它是一种结构化的符号摘要格式。它的想法是这样的:如果一段话里提到"张三"十次,与其每次都写"张三",不如用一个简短的代码(比如"Z3")代替。这样可以在大文本中节省大量tokens。

听起来很合理,对吧?

但问题出在了细节上。

首先,README里的token计数方法是错的。他们用的是简单的"字符数除以3"的启发式方法,而不是真正的tokenizer。用OpenAI的tokenizer重新计算后:原始英文是66个tokens,AAAK版本是73个tokens——反而更多了。

其次,"30倍无损压缩"的说法过度夸大了。AAAK实际上是有损的(lossy),不是无损的。它使用实体代码、句子截断等技术,确实会丢失一些信息。

独立的基准测试显示:AAAK模式在LongMemEval上的得分是84.2%,而原始verbatim模式的得分是96.6%——低了12.4个百分点。

还有一个问题:"+34% 宫殿结构提升"的说法也有误导性。这个提升来自于ChromaDB的元数据过滤功能,这是向量数据库的标准特性,不是什么独门绝技。

这些都是在发布后48小时内被社区发现的。

你猜 Milla 和 Ben 怎么回应的?

他们没有辩解。他们没有找借口。他们直接在README上加了一个名为"A Note from Milla & Ben"的章节,坦率地承认了所有问题:

"The community caught real problems in this README within hours of launch and we want to address them directly."
(社区在发布几小时内就发现了README里的真实问题,我们想直接回应。)

他们列出了所有错误,解释了为什么会犯错,以及他们准备如何修正。

然后他们说了一句让人印象深刻的话:

"We're listening, we're fixing, and we'd rather be right than impressive."
(我们在倾听,我们在修正,我们宁愿正确也不愿看起来厉害。)


为什么这比技术本身更重要

在AI这个充满炒作的领域,这种诚实太罕见了。

大多数公司会怎么做?他们会悄悄修改README,删除夸大的说法,假装什么都没发生过。或者他们会发布一篇公关声明,用模糊的语言"澄清"问题。

但 Milla 和 Ben 选择了最艰难、也是最尊重用户的方式:公开承认错误,公开修正记录。

这让我想起了费曼在挑战者号调查中的做法。

当NASA的管理层试图掩盖O型环的问题时,费曼做了一个简单的演示:他把O型环材料放在冰水里,展示了它在低温下失去弹性的过程。

这个演示只花了30秒。但它比数百页的技术报告更有说服力。

费曼后来在报告中写道:

"For a successful technology, reality must take precedence over public relations, for nature cannot be fooled."
(对于成功的技术,现实必须优先于公关,因为自然是不能被愚弄的。)

Milla 和 Ben 显然理解这一点。

他们本可以继续宣传"30倍无损压缩"和"96.6%来自AAAK"。大多数人不会深究,项目会获得关注和星标。

但他们选择了诚实。他们修正了README,明确指出:96.6%的分数来自原始verbatim模式,AAAK目前只能达到84.2%。

这种诚实比任何技术特性都更有价值。

因为它建立了一种信任:你可以相信这个团队说的话。他们不会为了营销而歪曲事实。他们关心的是正确,而不是看起来厉害。


第五章:与古希腊的共鸣

让我们回到那个问题:为什么两千年的记忆技巧在AI时代依然有效?

答案藏在人类认知的本质里。

我们的大脑不是为了随机存取信息而进化的。我们不是计算机,不是数据库。我们是联想式的、情境式的、叙事式的生物。

当我想起我的母亲时,我想到的不是她的"属性列表"(姓名、年龄、职业)。我想到的是特定的场景:她在厨房做饭的样子,她说话的语调,某个特定的笑容。

记忆是情境化的。它嵌套在具体的场景、地点、人际关系中。

记忆宫殿(Method of Loci)之所以有效,是因为它利用了我们对空间的天然记忆能力。人类可以记住复杂的地理空间布局——这在进化上是生存所必需的(找到回家的路,记住水源的位置)。

MemPalace 做的正是同一件事:把抽象的信息嵌入到一个空间结构中。

翼、房间、大厅、隧道——这些不是技术术语,它们是空间隐喻。

当你说"去数据库翼的Postgres房间",你的大脑会自动构建一个空间图像:一座建筑,一个分馆,一个特定的房间。这比说"搜索关键词'Postgres'"要直观得多。


结构化 vs 扁平

让我们对比一下传统RAG和MemPalace的方法。

传统RAG(扁平搜索):

  1. 把所有文本切成碎片(chunks)
  2. 把这些碎片扔进向量数据库
  3. 当用户提问时,计算问题的向量
  4. 找到最相似的文本碎片
  5. 把这些碎片塞进上下文窗口

这就像把图书馆的所有书都撕成单页,随机堆在一起。当有人问"关于数据库的书在哪里",你去找那些提到"数据库"这个词的页面。

MemPalace(结构化搜索):

  1. 按翼、房间组织信息
  2. 每个房间有衣橱(摘要)和抽屉(原文)
  3. 当用户提问时,先确定是哪个翼、哪个房间
  4. 只搜索相关的房间
  5. 如果需要,再打开抽屉看原文

这就像真正的图书馆:你知道"数据库"的书在科技分馆的计算机科学区。你不需要翻遍整个图书馆。

数据告诉我们,后者的准确率比前者高34%。

这不是因为MemPalace用了更先进的算法(它用的就是普通的向量搜索)。

而是因为结构本身就是信息

当你知道"这段对话发生在项目X的架构讨论中",你就有了比文本内容本身更多的上下文。这个元数据帮助你在正确的位置寻找答案。


古希腊人的智慧

西塞罗,这位两千多年前的演说家,在他的《论演说家》(De Oratore)中描述了记忆宫殿的原理:

"我们需要在脑中构建一个虚拟的建筑,把我们的想法和词汇放在不同的位置。当我们要回忆时,我们只需要在这座建筑中走一遍,从每个位置取出我们放置的东西。"

他没有用"元数据"、"检索增强"、"向量嵌入"这些词。

但他描述的核心原理——用空间结构组织信息——和MemPalace完全一致。

有时候,最古老的技巧反而最经得起时间的考验。

不是因为古人比我们聪明,而是因为他们面对的是和我们一样的认知约束:人类的大脑天生擅长空间记忆和联想记忆,但不擅长随机存取。

MemPalace 不是发明了什么新技术。它是重新发现了什么技术真正有效。

三层存储策略:衣橱 vs 抽屉

让我再详细解释一下衣橱(Closet)和抽屉(Drawer)的区别,这是 MemPalace 存储策略的核心。

抽屉(Drawer):原始 verbatim 记录

抽屉里存放的是原始的、完整的对话记录。没有任何摘要,没有任何压缩,就是原文。

这是 MemPalace 获得 96.6% 高分的秘密。其他系统通常会在存储之前对对话进行摘要,这不可避免地会丢失信息。MemPalace 选择保留一切。

衣橱(Closet):结构化摘要

衣橱里存放的是摘要,用于快速浏览和初步搜索。目前的版本使用的是普通文本摘要,AAAK 编码的衣橱还在开发中。

工作流程:

  1. 当用户提问时,系统先在衣橱层面搜索
  2. 找到相关的衣橱后,查看摘要确定是否相关
  3. 如果摘要显示可能有答案,再打开抽屉看原文
  4. 把原文放入上下文窗口,让 AI 生成回答

这种"分层"的策略既保证了搜索效率,又保留了原始信息的完整性。

一个真实的搜索例子

让我们看一个具体的例子。假设六个月前你和团队讨论了数据库的选择,现在你想知道"为什么当时决定用 Postgres"。

传统的RAG系统可能会这样做:

  1. 计算"为什么当时决定用 Postgres"的向量
  2. 找到最相似的文本块
  3. 把文本块塞进上下文
  4. AI 基于这些碎片回答

问题是:文本块可能截断了关键的上下文。你可能会得到"因为性能更好"这样的回答,但不知道具体是什么性能问题。

MemPalace 会这样做:

  1. 识别出问题和wing_nebula(项目翼)相关
  2. 进入wing_nebula,找到room_database房间
  3. 查看衣橱:"2025-11-03,团队决定从SQLite迁移到Postgres,原因:并发写入需求、数据集预计超过10GB、需要ACID保证"
  4. 打开抽屉,看到完整的讨论记录:
    • Alice 提出 SQLite 在并发写入时的性能问题
    • Bob 建议考虑 MySQL,但 Charlie 担心许可证问题
    • 最后一致同意使用 Postgres,Alice 负责迁移

现在 AI 不仅知道"为什么选 Postgres",还知道"谁提出的"、"谁负责执行"、"什么时候决定的"。

这就是结构化记忆的力量。

成本对比:为什么 MemPalace 几乎是免费的

让我们做一个详细的成本对比。假设你是一个重度AI用户,每天使用 Claude 进行开发工作,六个月产生了1950万tokens的对话。

方案 年成本 优缺点
全量加载 不可能 1950万tokens远超任何上下文窗口
LLM摘要 ~\(507/年 | 每年需要调用LLM来摘要所有历史对话,丢失上下文 | | Mem0 |\)228-2988/年 \(19-249/月,依赖云端,数据离开本地 | | Zep |\)300+/年

MemPalace 的年成本主要来自 L2/L3 层按需搜索时的少量token消耗。如果你只是使用 L0+L1 的唤醒(170 tokens),几乎不产生任何费用。

这就是"存储一切,然后让其可找到"哲学的经济优势。


结论:记忆的权利

在结束之前,我想谈谈一个更深层次的问题。

在2026年的今天,我们的记忆越来越多地存储在云端。

你的聊天记录在服务器上。你的日记在云端笔记应用里。你和AI的每一次对话,都保存在某个公司的数据库中。

这是一个微妙的权力转移。

你的记忆——你的思想、你的决策、你的创意——不再完全属于你。它们属于那些存储它们的公司。

MemPalace 提供了一种不同的选择。

它完全本地运行。不需要API key。不需要联网。你的数据永远不会离开你的机器。

这是记忆的主权。

你可以掌控自己的数据。没有人可以审查你的对话,没有人可以利用你的数据训练他们的模型,没有人可以因为政策变化而删除你的历史。

在这个所有东西都被云端化的时代,MemPalace 是一种回归:回归到对自己数据的掌控,回归到隐私的基本原则。


回到西塞罗

两千年前,西塞罗站在元老院里,用他脑中那座记忆宫殿,完成了那场著名的演讲。

两千年后,一个开源项目用数字化的方式复活了同样的技巧。

它在基准测试中拿下了最高分。它完全免费。它尊重用户的隐私。

但最让我印象深刻的,不是这些技术指标。

而是 Milla 和 Ben 在发现问题后写的那段话:

"We'd rather be right than impressive."

在这个充满炒作和夸大宣传的AI时代,这种诚实比任何技术都更难得。

费曼说过:科学的第一原则是,你不能欺骗自己——而你是最容易受骗的人。

MemPalace 的团队显然理解这一点。

他们没有试图成为最 flashy 的产品。他们没有追求最夸张的压缩率或最华丽的算法。

他们只是回到了最基本的问题:怎么让人工智能真正记住?

答案出奇的简单:像人类一样记忆。

用结构组织信息。用空间隐喻引导检索。保留原始记录,但用元数据加速访问。

这就是记忆宫殿的智慧——从古希腊到AI时代,它从未过时。


附录:竞品对比

系统 LongMemEval R@5 需要API 成本 存储位置
MemPalace (hybrid) 100% 可选 免费 本地
Supermemory ASMR ~99%
MemPalace (raw) 96.6% 免费 本地
Mastra 94.87% 是 (GPT) API费用 云端
Mem0 ~85% \(19-249/月 | 云端 | | Zep | ~85% | 是 |\)25/月+ Neo4j云

MemPalace 是唯一一个同时满足以下条件的选择:

  • 最高基准分数
  • 零成本
  • 完全本地运行
  • 无需API调用
  • 开源免费

延伸阅读


#MemPalace #记忆系统 #AI记忆 #LongMemEval #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录