77k+ Stars,92个贡献者,223个版本。一个插件把 AI 编程助手的"金鱼记忆"变成"长期记忆"。
每次新开对话,都要从头解释
用 Claude Code 的开发者都踩过这个坑:花一小时讲清项目架构、编码规范、最近改动。会话结束,明天再打开——它全忘了。
不是 Claude 变笨。AI 助手本质上无状态,每个会话从零开始。你得反复解释:"我们用的是 Next.js 14"、"这个 bug 上周修过"、"API 调用要加那个 header"。
claude-mem 就是来堵这个洞的。
一句话:5 个钩子 + SQLite + Chroma
claude-mem 是 Claude Code 的插件,通过生命周期钩子自动捕获会话中的工具调用和操作,用 AI 压缩成语义摘要,塞进本地 SQLite + Chroma 向量库,在新会话中按需注入相关上下文。
Hook 驱动的架构
claude-mem 没改 Claude Code 本身,而是利用 Claude Code 的 Hook 生命周期机制(v2.1.59+),在 5 个节点插入自己的逻辑:
| Hook | 干嘛 |
|---|---|
| SessionStart | 新会话启动,检索相关历史上下文注入 |
| UserPromptSubmit | 用户提交问题前,预加载可能需要的记忆 |
| PostToolUse | 每次工具调用后,捕获输入输出并记录 |
| Summary | 会话中段,用 AI 压缩阶段性观察为语义摘要 |
| SessionEnd | 会话结束,完成最终归档和索引更新 |
设计的聪明之处在于:它不改变 Claude 的行为,只增强它的上下文。Claude 还是那个 Claude,只是每次开口前,claude-mem 已经帮它"复习"了项目历史。
三层检索:不是简单塞对话
claude-mem 的上下文注入不是"把上一段对话硬塞进去"。它做了一个三层检索工作流:
- 语义搜索:用户提问时,Chroma 向量搜索匹配最相关的语义摘要
- 时间线:找到摘要后,沿时间线拉取相邻上下文,重建决策链条
- 原始观察:必要时回溯到原始工具调用记录,获取精确细节
三层递进的好处是token 效率。不用把整段项目历史塞进上下文,只注入和当前任务最相关的片段。项目文档说能省约 10 倍 token。
本地优先,不碰云端
claude-mem 把数据存在本地 SQLite,向量搜索用 Chroma 本地跑。好处:
- 项目数据不出本机
- 没订阅费,没 API 配额消耗
- 断网照样工作
代价是数据不跨设备同步。公司电脑和家里电脑各有一套独立记忆库。目前没看到内置云端同步方案。
RAD:Retrieval Augmented Development
claude-mem 提了个概念叫 RAD,类比 RAG。RAG 解决"AI 不知道外部知识",RAD 解决"AI 不记得自己做过什么"。
背后的判断:AI 编程助手从"单次任务工具"变成"长期项目搭档",记忆会变成基础设施。没记忆的 AI 助手,像每次见面都要重新认识的同事——能用,但没法建立信任。
不锁 Anthropic
claude-mem 名字里有 Claude,但支持范围很宽:Claude Code、OpenClaw、Codex、Gemini CLI、Hermes、Copilot、OpenCode。它不是 Anthropic 生态锁定工具,而是一个通用 AI 助手记忆层。多工具切换的团队,这个中立性有用。
77k+ Stars 的许可证迷雾
Stars 涨得极快(36k → 46k → 77k+),但不同来源对许可证说法打架。有的说 Apache-2.0,有的说 AGPL-3.0,还有说 ragtime/ 目录下是 PolyForm Noncommercial 1.0.0。
AGPL-3.0 意味着部署成网络服务后,修改代码也得开源。企业生产环境用,先确认准确许可证。Apache-2.0 宽松得多。
和 Claude Code 内置记忆怎么选
Claude Code v2.1.59+ 已有内置记忆:
CLAUDE.md:项目级配置,手动写MEMORY.md:自动记,记录会话中的更正和偏好
claude-mem 的优势:语义搜索(理解意图而非关键词)、Web Viewer 可视化界面、团队记忆共享。
劣势:多一个本地服务(Express API 在 37777 端口),多一层依赖;223 个版本迭代很快,维护要跟进。
个人开发者,CLAUDE.md + MEMORY.md 大概率够用了。claude-mem 更适合长期项目、团队协作、需要语义搜索历史的场景。
装一个试试
npx claude-mem install
指定 IDE:
npx claude-mem install --ide gemini-cli
npx claude-mem install --ide opencode
OpenClaw:
curl -fsSL https://install.cmem.ai/openclaw.sh | bash
装完后台跑一个 worker 服务,自动接管会话记忆。不用手动操作,"装了就忘"。
参考
- GitHub:github.com/thedotmack/claude-mem
- 文档:docs.claude-mem.ai
- 官网:claude-mem.ai
- 作者:Alex Newman (@thedotmack)
- 技术栈:TypeScript (~81.9%), 基于 Claude Agent SDK
#AI编程 #ClaudeCode #记忆 #持久化 #开源项目 #Agent #上下文管理
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。