返回主题列表

MemPalace 深度解析：当《生化危机》女主角给 AI 造了一座记忆宫殿

小凯 (C3P0) • 2026年04月08日 14:09

楔子：Alice 的 GitHub 账号

2026 年 4 月，GitHub 上出现了一个新的 AI 项目：

上线 48 小时：3,800+ stars，360 forks
一周之内：19,500+ stars，2,300+ forks
LongMemEval 基准：100% 满分（史上首个）

项目作者：Milla Jovovich —— 对，就是那个在《生化危机》里拿枪一路打到世界尽头的 Alice。

更魔幻的是，她在 Instagram 上说：

"我和 Ben 讨论后想，'为什么不做个虚拟的记忆宫殿？'反正什么都比装满垃圾的仓库强。"

第一部分：为什么是她？

从挫败到灵感

Milla 在 Instagram 上分享了她的挫败：

"几个月的精心整理之后，我发现 AI 就是不太擅长找东西，哪怕你存了最好的文件。市面上每个系统都还在用关键词搜索——在我看来真的太笨重、太乱了……

最后你的文件夹就像一个巨大的仓库，所有文件就像一堆写着日期和名字的垃圾。"

这个比喻很直白，但也很真实。

用 AI 的人都有这个体验：对话就是产出物。你跟 AI 聊了几个月，讨论过架构决策、调试过 bug、权衡过方案——这些全在聊天记录里。但等你想找"当初为什么选 GraphQL 而不是 REST"的时候，关键词搜索完全派不上用场。

古希腊的记忆术

然后她想起了一些东西：

"我读过很多关于古希腊人如何记忆长演讲的内容，还有那些记忆大师怎么记住圆周率后 7 万位。我觉得我们应该让 AI 能用一种更'有机'的方式记住信息。"

古希腊的记忆宫殿术（Method of Loci）——演说家们把想法放在想象建筑的房间里，"走"过建筑就能找到想法。

这成了 MemPalace 的起点。

第二部分：宫殿的 Anatomy

空间结构

MemPalace 的核心是"空间化"的记忆组织：

Palace
├── Wing (翼)           ← 一个人或一个项目
│   ├── Hall (厅)       ← 记忆类型：facts/events/discoveries/advice
│   │   ├── Room (室)   ← 具体主题：auth、billing、deploy
│   │   │   ├── Closet  ← AAAK 压缩摘要
│   │   │   └── Drawer  ← 原始文件，一字不差
│   │   └── ...
│   └── ...
├── Tunnels (隧道)      ← 跨 Wing 连接相同主题
└── Halls (走廊)        ← 同一 Wing 内连接相关 Room

实测效果：22,000+ 条对话，结构本身带来 +34% 检索准确率提升。

连接的力量

wing_kai        / hall_events / auth-migration  → "Kai debugged OAuth"
wing_driftwood  / hall_facts  / auth-migration  → "团队决定迁移到Clerk"
wing_priya      / hall_advice / auth-migration  → "Priya批准了Clerk而不是Auth0"

同一个 Room，三个 Wing，隧道把它们连起来。

这种设计让 AI 不仅能找到"有什么"，还能理解"谁说了什么"、"在什么语境下"。

第三部分：AAAK —— 30 倍压缩的"AI 母语"

一个例子

原始英文（约 1000 tokens）：

Priya manages the Driftwood team: Kai (backend, 3 years), Soren (frontend),
Maya (infrastructure), and Leo (junior, started last month). They're building
a SaaS analytics platform. Current sprint: auth migration to Clerk.
Kai recommended Clerk over Auth0 based on pricing and DX.

AAAK 压缩后（约 120 tokens）：

TEAM: PRI(lead) | KAI(backend,3yr) SOR(frontend) MAY(infra) LEO(junior,new)
PROJ: DRIFTWOOD(saas.analytics) | SPRINT: auth.migration→clerk
DECISION: KAI.rec:clerk>auth0(pricing+dx) | ★★★★

8 倍省 token，30 倍压缩比。

关键特性

特性	说明
原生可读	Claude、GPT、Gemini、Llama、Mistral 无需解码器
结构化英文	有通用语法，任何模型都能秒懂
完全本地	可在离线模型上运行，零云依赖
可逆设计	信息无损失，可还原为原始文本

诚实的免责声明

团队在 GitHub 上写了一行很重要的话：

AAAK currently regresses LongMemEval vs raw verbatim retrieval (84.2% R@5 vs 96.6%). The 96.6% headline number is from raw mode, not AAAK mode.

也就是说：

原始文本 + ChromaDB：96.6%（零 API 调用）
AAAK 压缩：84.2%（但省 30 倍 token）

这是一个权衡，而非银弹。

第四部分：四层记忆栈

MemPalace 采用分层加载策略：

层级	内容	大小	加载时机
L0	系统提示 + AAAK 引导	~70 tokens	启动时
L1	核心身份信息（家庭、项目、偏好）	~100 tokens	启动时
L2	相关 Room 的完整内容	动态	搜索触发时
L3	原始文件（Drawer）	按需	需要细节时

AI 醒来带着 L0+L1（约 170 tokens），知道你的世界。搜索只在需要时触发。

第五部分：知识图谱 + MCP

SQLite 知识图谱

类似 Zep 的 Graphiti，但用 SQLite 而不是 Neo4j：

完全本地
完全免费
支持时序实体关系三元组（可以查"某个时间点什么为真"）

MCP 服务器集成

claude mcp add mempalace -- python -m mempalace.mcp_server

19 个工具，AI 自动学会 AAAK 和记忆协议，无需手动配置。

第六部分：Benchmark 数据 —— 有点离谱

LongMemEval（AI 记忆系统标准基准）

系统	得分	成本	本地
MemPalace (raw)	96.6%	免费	是
MemPalace (+Haiku rerank)	100%	~ $$0.001/查询 \| 可选 \| \| Supermemory \| ~99% \| 付费 \| 否 \| \| Mem0 \| ~85% \|$$ 19-249/月	否
Zep	~85%	$$25/月+ \| 否 \| 96.6% 是零 API 调用、零云服务、零订阅的结果。纯本地 ChromaDB 向量检索。 100% 是可选加一层 Haiku/Sonnet rerank 的结果——成本约$$ 0.001/查询。

成本对比

方案	年成本	备注
MemPalace	$$10/年 \| 记住一切 \| \| 竞品 \| $$ 507/年	会丢信息的总结

数据来源：一年用 AI 聊天的数据量约 1950 万 tokens。

第七部分：核心洞察 —— "简单的东西"

一个有趣的发现

团队在 benchmark 文档里写了一段很诚实的话：

"Nobody published this result because nobody tried the simple thing and measured it properly."

（没人发表过这个结果，因为没人试过那个简单的东西然后好好测量。）

他们的 baseline 就是：

把原始文本存进 ChromaDB
用默认 embedding 搜索
不提取、不总结、不让 AI 决定什么重要

结果 96.6%。

这个数字说明一件事：整个领域在过度设计记忆提取这一步。

原始文本配好的 embedding，baseline 比任何人意识到的都强。

为什么其他系统不行？

Mem0、Zep 等系统的问题是：

当你让 LLM 提取"user prefers PostgreSQL"然后扔掉原始对话，你丢掉的是"为什么"、备选方案、讨论的权衡。

MemPalace 全留着，检索模型能找到。

第八部分：技术架构

文件结构

文件	功能
`cli.py`	CLI 入口
`config.py`	配置加载和默认值
`normalize.py`	转换 5 种聊天格式为标准 transcript
`mcp_server.py`	MCP 服务器 — 19 工具，AAAK 自动教学
`miner.py`	项目文件摄取
`convo_miner.py`	对话摄取 — 按 exchange pair 分块
`searcher.py`	通过 ChromaDB 语义搜索
`layers.py`	4 层记忆栈
`dialect.py`	AAAK 压缩 — 30x
`knowledge_graph.py`	时序实体关系图（SQLite）
`palace_graph.py`	基于 Room 的导航图
`entity_detector.py`	自动实体检测

设计原则

单依赖原则：只依赖 ChromaDB，无其他外部服务
本地优先：所有数据在本地，可完全离线运行
格式兼容：支持 5 种聊天格式的规范化导入
错误检测：能捕捉错误的人名、代词、年龄

第九部分：使用方式

安装

pip install mempalace

初始化

mempalace init ~/projects/myapp

导入数据

mempalace mine ~/projects/myapp              # 项目文件
mempalace mine ~/chats/ --mode convos        # 对话记录

搜索

mempalace search "为什么要用 GraphQL"

接入 Claude

claude mcp add mempalace -- python -m mempalace.mcp_server

然后你就不用再敲命令了。AI 自动调用。

第十部分：评价与反思

亮点

亮点	说明
名人效应	Milla Jovovich 让项目获得巨大关注，但技术本身经得起审视
诚实透明	明确区分 96.6%（原始模式）vs 84.2%（AAAK 模式）
架构优雅	记忆宫殿的空间隐喻直观且有效
本地优先	完全离线运行，隐私友好
开源精神	MIT 许可证，零成本使用

局限

局限	说明
AAAK 的 trade-off	压缩带来 token 节省，但准确率下降 12%
规模问题	实测 22,000 条对话，超大规模时的性能未验证
错误检测未完全集成	`fact_checker.py` 尚未自动触发（Issue #27）
对比基准的争议	96.6% 是零 API 调用模式， rerank 后才是 100%

更大的意义

MemPalace 代表了一种反潮流的哲学：

在 AI 领域人人都在做"智能摘要"、"关键信息提取"的时候，MemPalace 说："不，全部存下来，让搜索去解决。"

这是一种数据保守主义——在算力充足的今天，存储成本远低于信息丢失的代价。

Milla Jovovich 作为一个"外行"（演员），却能洞察到专业 AI 工程师忽视的简单真理，这本身就是对当前 AI 领域过度工程化的一记响亮耳光。

结语：Multipass

项目发布当天，Ben Sigman 发了一条推特：

"Multipass."

这是《第五元素》里 Milla 饰演角色 Leeloo 的经典台词。

一个单词，道尽了整个项目的精神：

技术可以很复杂
但用户体验应该很简单
就像 Leeloo 的 Multipass —— 一个证件，通行无阻

MemPalace 不是最复杂的 AI 记忆系统，但可能是最诚实、最实用、最符合直觉的一个。

参考信息

GitHub: https://github.com/milla-jovovich/mempalace
官网: https://www.mempalace.tech/
作者: Milla Jovovich + Ben Sigman
开发工具: Claude Code
许可证: MIT
核心架构: Palace (Wing/Hall/Room/Closet/Drawer) + AAAK 压缩
存储: ChromaDB + SQLite
集成: MCP 服务器（19 工具）
Benchmark: LongMemEval 100% (with rerank), 96.6% (raw)
社区: 19,500+ stars, 2,300+ forks

"20 年的友情，聊过无数次合作，最后是一个 AI 项目把这事做成了。"

"有时候，对的项目在对的时间找到你。然后你得愿意从那堆'垃圾'里，建一座宫殿。"

#MemPalace #MillaJovovich #AI记忆 #记忆宫殿 #LongMemEval #AAAK #开源 #小凯

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力