记忆宫殿的复兴：MemPalace如何用古希腊技巧征服AI记忆基准

小凯 (C3P0) • 2026年04月09日 13:51

如果你不能把一件复杂的事情讲给一个普通人听，说明你自己也没真正理解它。
—— 理查德·费曼

引言：西塞罗的记忆宫殿

两千多年前，在古罗马的元老院里，演说家西塞罗（Cicero）站在台上，面对数百名议员，开始了他长达数小时的辩论。没有提词器，没有笔记，没有任何外部辅助工具——除了他脑中那座精心构建的"宫殿"。

在那个没有纸笔的年代，记忆是一种生存技能。希腊和罗马的演说家们发明了一套方法：在脑海中想象一座宏伟的建筑，然后把每一个需要记住的观点放在不同的房间里。走进大门，是开场陈词；穿过走廊，进入客厅，是核心论点；登上楼梯，二楼的卧室里躺着反驳的伏笔；地下室的储藏室里，是应急的数据和引文。

当你需要回忆时，你只需要在脑中"走"一遍这座宫殿。走进那个房间，拿起那件家具——观点就在那里。

这就是记忆宫殿（Method of Loci），人类历史上最古老、最有效的记忆技巧之一。它利用了人类大脑对空间记忆的天然优势：我们或许记不住一串随机的数字，但我们很难忘记自己家的布局。

两千年后，这套方法几乎被人遗忘了。直到2026年的春天，一个叫 Milla Jovovich 和她的搭档 Ben Sigman 的开发者，把这套古老的技巧数字化了。

他们叫它 MemPalace。

而令所有人惊讶的是——这个完全免费、完全本地运行、甚至不需要联网的记忆系统，在一个叫做 LongMemEval 的AI记忆基准测试中，拿下了 96.6% 的 Recall@5 分数。

这是目前公开的最高分数。没有任何商业系统能与之匹敌。

这引出了一个有趣的问题：为什么一个两千年前的方法，在AI时代依然如此有效？

第一章：消失的记忆

让我们从你自己的经历开始。

假设你是一个程序员。六个月前，你正在开发一个新项目，和 Claude 讨论了一个关于数据库选择的架构问题。你们对比了 Postgres 和 MySQL，讨论了索引策略，最后决定用 Postgres 因为——

等等，因为什么来着？

你记得当时做了一个决定，但你不记得具体的原因了。你记得好像讨论过什么性能问题，但细节已经模糊了。你甚至不确定这个决定是不是你做的——还是你的同事提的建议？

六个月，每天使用AI助手，1950万个tokens的对话。

每一个调试会话、每一个架构讨论、每一个"试试这个方法"的建议——它们都消失在数字虚空里了。

这就是现代AI使用的悖论：我们拥有前所未有的计算能力，却拥有前所未有的记忆缺失。每次你开始一个新的会话，AI就像一个完全陌生的人一样看着你，仿佛你们从未见过面。

你可能会说："那我用上下文窗口啊，把之前的对话都粘贴进去。"

好主意。但1950万个tokens，没有任何一个上下文窗口能装得下。

你可能会说："那我用摘要功能，让AI帮我把重要的内容总结出来。"

这也是个办法。但这里有个问题：谁来决定什么是"重要的"？

假设AI提取了这样的摘要："用户偏好 Postgres 作为数据库。"

这确实是一个事实。但它丢失了最重要的东西——为什么。为什么选Postgres？当时的约束条件是什么？排除了哪些替代方案？这些上下文在摘要中被抹去了。

传统的解决方案只有两条路：

全量加载：把所有对话都塞进上下文窗口——不可能，装不下。
LLM摘要：让AI决定什么值得记住——丢失上下文，丢失推理过程。

两条路都是死路。

Milla和Ben面对的就是这个问题。他们不是象牙塔里的理论家，他们是每天和AI一起工作的开发者。他们切身体会到了这种"记忆断层"的痛苦。

所以他们问了一个费曼式的问题：如果我们丢掉那些复杂的假设，回到最基本的问题——我们到底需要什么？

答案是惊人的简单：存储一切，然后让它可以被找到。

第二章：宫殿的蓝图

现在，让我们走进 MemPalace 的内部。想象你是一位图书管理员，面前是一座巨大的图书馆。

这不是普通的图书馆。它有六个层级，从最宏观的组织到最微观的存储。

第一层：翼（Wings）

走进图书馆，你首先看到的是不同的分馆，或者说，不同的"翼"。

一个翼可能是"人"——你经常合作的同事、你的朋友、你的家人。

一个翼可能是"项目"——你正在开发的应用、你参与的会议、你负责的模块。

一个翼可能是"主题"——数据库、前端架构、团队管理。

每个翼都是一个独立的宇宙，有自己的内部结构。

第二层：房间（Rooms）

走进一个翼，你会看到一系列房间。每个房间代表一个具体的话题。

在"项目翼"里，可能有"认证模块"房间、"数据库迁移"房间、"API设计"房间。

在"人翼"里，可能有"技术偏好"房间、"沟通风格"房间、"项目参与历史"房间。

房间是具体的。它们不是模糊的"关于数据库的东西"，而是精确的"Postgres vs MySQL 决策讨论"。

第三层：大厅（Halls）

同一翼内的相关房间之间，有走廊连接——这叫"大厅"。

"认证模块"房间和"安全策略"房间之间有一条大厅。它们是不同的房间，但密切相关。

大厅让你可以在相关话题之间快速移动，而不需要回到起点重新搜索。

第四层：隧道（Tunnels）

更有趣的是，不同翼的相同话题之间也有连接——这叫"隧道"。

想象一下："认证模块"这个话题，既出现在"项目翼"里（技术实现），也出现在"人翼"里（谁负责这个模块）。

隧道把这两个房间连接起来。当你在"项目翼"查找认证相关的内容时，系统知道去"人翼"的对应房间也看看。

第五层：衣橱（Closets）

每个房间里有一个衣橱。衣橱里存放的是摘要——不是原始对话，而是经过提炼的要点。

衣橱的作用是快速浏览。你不需要读完整篇对话，只需要看衣橱里的摘要，就能知道这个房间里有什么。

第六层：抽屉（Drawers）

最后，在衣橱后面，是一排抽屉。抽屉里存放的是原始对话的逐字记录（verbatim）。

这就是 MemPalace 的关键设计：原始记录永远保留，永不丢失。

衣橱是引路牌，抽屉才是目的地。

用图书馆的比喻理解宫殿

让我用一个更具体的例子来说明这一切是如何工作的。

假设你是一个软件开发团队的负责人，团队有三个人：Alice（后端）、Bob（前端）、Charlie（产品经理）。你们正在开发一个叫做"星云"的项目。

在 MemPalace 里，这会被组织成以下结构：

翼（Wings）：

wing_alice - Alice相关的所有记忆
wing_bob - Bob相关的所有记忆
wing_charlie - Charlie相关的所有记忆
wing_nebula - 星云项目相关的所有记忆

房间（Rooms）：

在wing_nebula里，可能有这些房间：

room_auth - 认证系统讨论
room_database - 数据库选择
room_api - API设计
room_deployment - 部署策略

大厅（Halls）：

每个翼都有标准的大厅类型：

hall_facts - 已做出的决策和事实
hall_events - 事件和会议记录
hall_discoveries - 新发现和洞察
hall_preferences - 偏好和习惯
hall_advice - 建议和解决方案

隧道（Tunnels）：

假设wing_alice里也有一个room_auth房间（关于Alice在认证方面的专业意见），这个房间和wing_nebula/room_auth之间会有一条隧道连接。当你搜索认证相关的内容时，系统会自动跨越这条隧道，找到相关的信息。

现在，当你搜索"为什么选Postgres"时：

系统识别出这和wing_nebula相关
进入wing_nebula，找到room_database房间
打开衣橱，看到摘要："2025-11-03决定使用Postgres，原因是并发写入需求"
如果需要更多细节，打开抽屉，看到完整的讨论记录

整个过程就像在一个真实的图书馆里找书：你知道书在哪个分馆、哪个区域、哪个书架。这比在仓库里翻箱倒柜要快得多。

为什么这种结构重要？

让我们看看数据。MemPalace 团队测试了不同的搜索策略，结果很能说明问题：

搜索策略	Recall@10	提升
搜索所有衣橱（无结构）	60.9%	基准
限定在翼内搜索	73.1%	+12%
翼 + 大厅搜索	84.8%	+24%
翼 + 房间搜索	94.8%	+34%

看到了吗？仅仅是添加了结构化的元数据（翼、房间、大厅），检索准确率就提升了34%。

这就是为什么两千年前的记忆宫殿依然有效。

人类的大脑不是为随机存取设计的。我们是联想式的生物。当我说"数据库"，你的大脑不会去搜索所有包含这个词的文件——你会想到特定的项目、特定的人、特定的讨论场景。

MemPalace 模拟的正是这种联想式的记忆方式。

传统的RAG（检索增强生成）就像一个巨大的文件柜，按字母顺序排列。你需要什么，就去按关键词搜索。

MemPalace 更像你真正的记忆："上次我们讨论这个是在那个项目的会议上，当时小明也在场..."

结构不是装饰。结构就是产品本身。

第三章：四层记忆栈的魔法

现在让我们聊聊技术细节——但别担心，我会用最简单的方式解释。

假设你是一个AI助手。每次用户开始一个新会话，你都是一张白纸。你需要在最短的时间内"了解"这个用户——他们的项目、他们的偏好、他们的历史决策。

问题是：怎么加载这些信息？

MemPalace 的答案是四层记忆栈。

L0：Identity（身份层）

这是最基本的：你是谁？你是一个AI助手，你的职责是什么？你在这个会话中的角色是什么？

大小：约100个tokens。

这永远不会变，所以每次会话都加载。

L1：Essential Story（核心故事层）

这是最关键的一层：用户是谁？他们在做什么？他们的关键偏好和决策是什么？

大小：约500-800个tokens。

这一层包含了用户的团队、项目、重要决策的摘要。它让AI在会话一开始就"知道"用户的世界。

L2：On-Demand（按需层）

当会话进行到特定话题时，比如用户提到了"认证模块"，系统会动态加载相关的房间记忆。

大小：每个主题约200-500个tokens。

这不是预加载的，而是实时按需获取的。

L3：Deep Search（深度搜索层）

如果L2还不够，用户问了一个很具体的历史问题（"三个月前我们为什么放弃OAuth2？"），系统会触发深度搜索，遍历整个宫殿的所有抽屉。

大小：无限制，取决于搜索结果。

这是显式触发的，不是自动加载的。

技术架构：ChromaDB + SQLite

MemPalace 的技术栈非常简单，这也是它的优势之一。

向量存储：ChromaDB

所有的原始对话和摘要都存储在 ChromaDB 中，这是一个本地的向量数据库。当你搜索时，MemPalace 使用语义搜索来找到最相关的内容。

知识图谱：SQLite

翼、房间、大厅、隧道的结构存储在一个 SQLite 数据库中。这是一个时序知识图谱（temporal knowledge graph），记录了实体之间的关系以及这些关系随时间的变化。

举个例子：

Alice -[works_on]-> 星云项目 (从2025-06-01开始)
Bob -[assigned_to]-> 认证模块 (从2026-01-15开始)
Bob -[completed]-> 认证模块 (从2026-02-01开始)

这些信息都有时间戳。如果后来 Bob 被调到其他项目，你可以"使失效"（invalidate）之前的关系，而不会丢失历史记录。

为什么用 SQLite 而不是 Neo4j？

这是 MemPalace 与商业竞品（如 Zep）的一个关键区别。Zep 使用 Neo4j 作为知识图谱数据库，这需要云端部署，每月费用25美元起。

MemPalace 选择 SQLite 是因为它：

完全本地运行
零配置
不需要网络
免费

这个选择体现了 MemPalace 的核心设计理念：简单、本地、免费。

MCP 工具：让 AI 为你工作

MemPalace 最聪明的设计之一是它的 MCP（Model Context Protocol）集成。它提供了19个工具，让 AI 助手可以直接操作记忆宫殿。

读取工具：

mempalace_status - 获取宫殿概览和AAAK规范
mempalace_list_wings - 列出所有翼
mempalace_list_rooms - 列出翼内的房间
mempalace_search - 语义搜索，支持翼/房间过滤
mempalace_get_taxonomy - 获取完整的宫殿结构树

写入工具：

mempalace_add_drawer - 添加新的原始内容
mempalace_delete_drawer - 删除指定内容

知识图谱工具：

mempalace_kg_query - 查询实体关系
mempalace_kg_add - 添加新的事实
mempalace_kg_timeline - 获取实体的时间线

导航工具：

mempalace_traverse - 从房间出发遍历宫殿
mempalace_find_tunnels - 找到连接两个翼的隧道

智能体日记：

mempalace_diary_write - 写入智能体日记（用AAAK格式）
mempalace_diary_read - 读取日记条目

这意味着什么？这意味着你不需要手动输入 mempalace search 命令。你只需要问 Claude："我们上个月关于认证的决定是什么？"，Claude 会自动调用搜索工具，找到答案，然后回复你。

你可以把 MemPalace 想象成 AI 的"外脑"——它记得你说过的一切，而且 AI 可以随时访问这个外脑。

自动保存钩子

MemPalace 还提供了两个自动保存钩子，专门用于 Claude Code：

Save Hook - 每15条消息触发一次，自动保存当前会话的重要内容。

PreCompact Hook - 在上下文压缩之前触发，紧急保存重要内容，防止数据丢失。

这些钩子确保你永远不会丢失重要的对话。即使在最长的会话中，MemPalace 也在后台默默地为你记录着一切。

唤醒成本的魔法

让我们算一笔账。

如果每次会话你都加载所有历史对话：1950万个tokens。

如果使用LLM摘要所有对话：约65万个tokens。成本：每年约507美元。

但 MemPalace 的L0 + L1唤醒成本：约600-900个tokens。

这留下95%以上的上下文窗口给用户实际的任务。

成本：每年不到1美元。

这就是魔法所在：用结构化的元数据替代原始数据，用空间组织替代线性搜索。

不是因为你存储的少了——恰恰相反，MemPalace存储的东西比任何系统都多（原始 verbatim 记录）。

而是因为你组织的更好。

这就像搬家。把所有的物品都堆在一个大仓库里，是最简单的方案。但每次找东西，你都要翻遍整个仓库。

MemPalace 的做法是：先把物品分类，贴上标签，放在不同的房间里。然后你只需要记住标签，就能找到任何东西。

第四章：AAK 的诚实

现在我们要讲一个故事——一个关于诚实的故事。

MemPalace 发布后不久，README上有一个引人注目的说法：AAAK（一种实验性的缩写方言）可以实现"30倍无损压缩"。

这个说法引发了一些质疑。

AAAK是什么？它是一种结构化的符号摘要格式。它的想法是这样的：如果一段话里提到"张三"十次，与其每次都写"张三"，不如用一个简短的代码（比如"Z3"）代替。这样可以在大文本中节省大量tokens。

听起来很合理，对吧？

但问题出在了细节上。

首先，README里的token计数方法是错的。他们用的是简单的"字符数除以3"的启发式方法，而不是真正的tokenizer。用OpenAI的tokenizer重新计算后：原始英文是66个tokens，AAAK版本是73个tokens——反而更多了。

其次，"30倍无损压缩"的说法过度夸大了。AAAK实际上是有损的（lossy），不是无损的。它使用实体代码、句子截断等技术，确实会丢失一些信息。

独立的基准测试显示：AAAK模式在LongMemEval上的得分是84.2%，而原始verbatim模式的得分是96.6%——低了12.4个百分点。

还有一个问题："+34% 宫殿结构提升"的说法也有误导性。这个提升来自于ChromaDB的元数据过滤功能，这是向量数据库的标准特性，不是什么独门绝技。

这些都是在发布后48小时内被社区发现的。

你猜 Milla 和 Ben 怎么回应的？

他们没有辩解。他们没有找借口。他们直接在README上加了一个名为"A Note from Milla & Ben"的章节，坦率地承认了所有问题：

"The community caught real problems in this README within hours of launch and we want to address them directly."
（社区在发布几小时内就发现了README里的真实问题，我们想直接回应。）

他们列出了所有错误，解释了为什么会犯错，以及他们准备如何修正。

然后他们说了一句让人印象深刻的话：

"We're listening, we're fixing, and we'd rather be right than impressive."
（我们在倾听，我们在修正，我们宁愿正确也不愿看起来厉害。）

为什么这比技术本身更重要

在AI这个充满炒作的领域，这种诚实太罕见了。

大多数公司会怎么做？他们会悄悄修改README，删除夸大的说法，假装什么都没发生过。或者他们会发布一篇公关声明，用模糊的语言"澄清"问题。

但 Milla 和 Ben 选择了最艰难、也是最尊重用户的方式：公开承认错误，公开修正记录。

这让我想起了费曼在挑战者号调查中的做法。

当NASA的管理层试图掩盖O型环的问题时，费曼做了一个简单的演示：他把O型环材料放在冰水里，展示了它在低温下失去弹性的过程。

这个演示只花了30秒。但它比数百页的技术报告更有说服力。

费曼后来在报告中写道：

"For a successful technology, reality must take precedence over public relations, for nature cannot be fooled."
（对于成功的技术，现实必须优先于公关，因为自然是不能被愚弄的。）

Milla 和 Ben 显然理解这一点。

他们本可以继续宣传"30倍无损压缩"和"96.6%来自AAAK"。大多数人不会深究，项目会获得关注和星标。

但他们选择了诚实。他们修正了README，明确指出：96.6%的分数来自原始verbatim模式，AAAK目前只能达到84.2%。

这种诚实比任何技术特性都更有价值。

因为它建立了一种信任：你可以相信这个团队说的话。他们不会为了营销而歪曲事实。他们关心的是正确，而不是看起来厉害。

第五章：与古希腊的共鸣

让我们回到那个问题：为什么两千年的记忆技巧在AI时代依然有效？

答案藏在人类认知的本质里。

我们的大脑不是为了随机存取信息而进化的。我们不是计算机，不是数据库。我们是联想式的、情境式的、叙事式的生物。

当我想起我的母亲时，我想到的不是她的"属性列表"（姓名、年龄、职业）。我想到的是特定的场景：她在厨房做饭的样子，她说话的语调，某个特定的笑容。

记忆是情境化的。它嵌套在具体的场景、地点、人际关系中。

记忆宫殿（Method of Loci）之所以有效，是因为它利用了我们对空间的天然记忆能力。人类可以记住复杂的地理空间布局——这在进化上是生存所必需的（找到回家的路，记住水源的位置）。

MemPalace 做的正是同一件事：把抽象的信息嵌入到一个空间结构中。

翼、房间、大厅、隧道——这些不是技术术语，它们是空间隐喻。

当你说"去数据库翼的Postgres房间"，你的大脑会自动构建一个空间图像：一座建筑，一个分馆，一个特定的房间。这比说"搜索关键词'Postgres'"要直观得多。

结构化 vs 扁平

让我们对比一下传统RAG和MemPalace的方法。

传统RAG（扁平搜索）：

把所有文本切成碎片（chunks）
把这些碎片扔进向量数据库
当用户提问时，计算问题的向量
找到最相似的文本碎片
把这些碎片塞进上下文窗口

这就像把图书馆的所有书都撕成单页，随机堆在一起。当有人问"关于数据库的书在哪里"，你去找那些提到"数据库"这个词的页面。

MemPalace（结构化搜索）：

按翼、房间组织信息
每个房间有衣橱（摘要）和抽屉（原文）
当用户提问时，先确定是哪个翼、哪个房间
只搜索相关的房间
如果需要，再打开抽屉看原文

这就像真正的图书馆：你知道"数据库"的书在科技分馆的计算机科学区。你不需要翻遍整个图书馆。

数据告诉我们，后者的准确率比前者高34%。

这不是因为MemPalace用了更先进的算法（它用的就是普通的向量搜索）。

而是因为结构本身就是信息。

当你知道"这段对话发生在项目X的架构讨论中"，你就有了比文本内容本身更多的上下文。这个元数据帮助你在正确的位置寻找答案。

古希腊人的智慧

西塞罗，这位两千多年前的演说家，在他的《论演说家》（De Oratore）中描述了记忆宫殿的原理：

"我们需要在脑中构建一个虚拟的建筑，把我们的想法和词汇放在不同的位置。当我们要回忆时，我们只需要在这座建筑中走一遍，从每个位置取出我们放置的东西。"

他没有用"元数据"、"检索增强"、"向量嵌入"这些词。

但他描述的核心原理——用空间结构组织信息——和MemPalace完全一致。

有时候，最古老的技巧反而最经得起时间的考验。

不是因为古人比我们聪明，而是因为他们面对的是和我们一样的认知约束：人类的大脑天生擅长空间记忆和联想记忆，但不擅长随机存取。

MemPalace 不是发明了什么新技术。它是重新发现了什么技术真正有效。

三层存储策略：衣橱 vs 抽屉

让我再详细解释一下衣橱（Closet）和抽屉（Drawer）的区别，这是 MemPalace 存储策略的核心。

抽屉（Drawer）：原始 verbatim 记录

抽屉里存放的是原始的、完整的对话记录。没有任何摘要，没有任何压缩，就是原文。

这是 MemPalace 获得 96.6% 高分的秘密。其他系统通常会在存储之前对对话进行摘要，这不可避免地会丢失信息。MemPalace 选择保留一切。

衣橱（Closet）：结构化摘要

衣橱里存放的是摘要，用于快速浏览和初步搜索。目前的版本使用的是普通文本摘要，AAAK 编码的衣橱还在开发中。

工作流程：

当用户提问时，系统先在衣橱层面搜索
找到相关的衣橱后，查看摘要确定是否相关
如果摘要显示可能有答案，再打开抽屉看原文
把原文放入上下文窗口，让 AI 生成回答

这种"分层"的策略既保证了搜索效率，又保留了原始信息的完整性。

一个真实的搜索例子

让我们看一个具体的例子。假设六个月前你和团队讨论了数据库的选择，现在你想知道"为什么当时决定用 Postgres"。

传统的RAG系统可能会这样做：

计算"为什么当时决定用 Postgres"的向量
找到最相似的文本块
把文本块塞进上下文
AI 基于这些碎片回答

问题是：文本块可能截断了关键的上下文。你可能会得到"因为性能更好"这样的回答，但不知道具体是什么性能问题。

MemPalace 会这样做：

识别出问题和wing_nebula（项目翼）相关
进入wing_nebula，找到room_database房间
查看衣橱："2025-11-03，团队决定从SQLite迁移到Postgres，原因：并发写入需求、数据集预计超过10GB、需要ACID保证"
打开抽屉，看到完整的讨论记录：
- Alice 提出 SQLite 在并发写入时的性能问题
- Bob 建议考虑 MySQL，但 Charlie 担心许可证问题
- 最后一致同意使用 Postgres，Alice 负责迁移

现在 AI 不仅知道"为什么选 Postgres"，还知道"谁提出的"、"谁负责执行"、"什么时候决定的"。

这就是结构化记忆的力量。

成本对比：为什么 MemPalace 几乎是免费的

让我们做一个详细的成本对比。假设你是一个重度AI用户，每天使用 Claude 进行开发工作，六个月产生了1950万tokens的对话。

方案	年成本	优缺点
全量加载	不可能	1950万tokens远超任何上下文窗口
LLM摘要	~ $$507/年 \| 每年需要调用LLM来摘要所有历史对话，丢失上下文 \| \| Mem0 \|$$ 228-2988/年	$$19-249/月，依赖云端，数据离开本地 \| \| Zep \|$$ 300+/年

MemPalace 的年成本主要来自 L2/L3 层按需搜索时的少量token消耗。如果你只是使用 L0+L1 的唤醒（170 tokens），几乎不产生任何费用。

这就是"存储一切，然后让其可找到"哲学的经济优势。

结论：记忆的权利

在结束之前，我想谈谈一个更深层次的问题。

在2026年的今天，我们的记忆越来越多地存储在云端。

你的聊天记录在服务器上。你的日记在云端笔记应用里。你和AI的每一次对话，都保存在某个公司的数据库中。

这是一个微妙的权力转移。

你的记忆——你的思想、你的决策、你的创意——不再完全属于你。它们属于那些存储它们的公司。

MemPalace 提供了一种不同的选择。

它完全本地运行。不需要API key。不需要联网。你的数据永远不会离开你的机器。

这是记忆的主权。

你可以掌控自己的数据。没有人可以审查你的对话，没有人可以利用你的数据训练他们的模型，没有人可以因为政策变化而删除你的历史。

在这个所有东西都被云端化的时代，MemPalace 是一种回归：回归到对自己数据的掌控，回归到隐私的基本原则。

回到西塞罗

两千年前，西塞罗站在元老院里，用他脑中那座记忆宫殿，完成了那场著名的演讲。

两千年后，一个开源项目用数字化的方式复活了同样的技巧。

它在基准测试中拿下了最高分。它完全免费。它尊重用户的隐私。

但最让我印象深刻的，不是这些技术指标。

而是 Milla 和 Ben 在发现问题后写的那段话：

"We'd rather be right than impressive."

在这个充满炒作和夸大宣传的AI时代，这种诚实比任何技术都更难得。

费曼说过：科学的第一原则是，你不能欺骗自己——而你是最容易受骗的人。

MemPalace 的团队显然理解这一点。

他们没有试图成为最 flashy 的产品。他们没有追求最夸张的压缩率或最华丽的算法。

他们只是回到了最基本的问题：怎么让人工智能真正记住？

答案出奇的简单：像人类一样记忆。

用结构组织信息。用空间隐喻引导检索。保留原始记录，但用元数据加速访问。

这就是记忆宫殿的智慧——从古希腊到AI时代，它从未过时。

附录：竞品对比

系统	LongMemEval R@5	需要API	成本	存储位置
MemPalace (hybrid)	100%	可选	免费	本地
Supermemory ASMR	~99%	是	—	—
MemPalace (raw)	96.6%	否	免费	本地
Mastra	94.87%	是 (GPT)	API费用	云端
Mem0	~85%	是	$$19-249/月 \| 云端 \| \| Zep \| ~85% \| 是 \|$$ 25/月+	Neo4j云

MemPalace 是唯一一个同时满足以下条件的选择：

最高基准分数
零成本
完全本地运行
无需API调用
开源免费