EverOS:给AI Agent装上一颗不会忘的大脑
一句话:EverOS 不是又一个向量数据库,它是 AI Agent 的长期记忆操作系统——把 Stateless LLM 变成能从经验中自我进化的 Stateful Agent。
🔥 为什么这件事很重要?
当前的大语言模型有个致命缺陷:每次对话都是全新的开始。你昨天跟它讨论过的架构方案、它替你排查过的 Bug、你反复调整过的偏好设置——今天全归零。
这就是 AI 的"金鱼记忆"问题。EverOS 要解决的,正是这个被行业长期忽视的基础设施层。
"我们不是在给 AI 堆栈加另一层,EverOS 是下一代智能 Agent 的核心数据基础设施——我们的使命是解决 AI 的核心弱点:它不会记住。" —— EverMind 团队
🧠 四层架构:模仿人脑的记忆操作系统
EverOS 的架构直接对标人脑的信息处理流程,分为四个层级:
| 层级 | 功能 | 人脑类比 |
|---|---|---|
| Agentic Layer | 任务理解、规划、执行 | 前额叶皮层 |
| Memory Layer | 长期存储与检索 | 皮层记忆网络 |
| Index Layer | Embeddings、KV 对、知识图谱索引 | 海马体 |
| API/MCP Interface | 与外部企业系统集成 | 感觉接口 |
这个设计的核心洞察是:记忆不是简单的存储-检索操作,而是一个生命周期。EverOS 把原始交互转化为结构化、不断演进的知识,灵感来自神经科学的**"记忆印迹"(engram)**理论。
⚡ 核心创新:MemCell → MemScene → Skill 的三级进化
第一阶段:Episodic Trace Formation(情景痕迹形成)
对话流被转化为 MemCell——原子级记忆单元,每个 MemCell 包含:
- Episodes(情景片段)
- Atomic facts(原子事实)
- Foresight(预见性知识,带有效期)
- Metadata(元数据)
第二阶段:Semantic Consolidation(语义巩固)
在线增量聚类将 MemCell 组织成 MemScene(主题记忆集群),同时更新紧凑的 User Profile。这解决了传统向量检索的两个致命问题:
- 相似性检索的稳定性缺陷——相似≠相关
- 长期上下文理解的碎片化——没有主题组织
第三阶段:Reconstructive Recollection(重构性回忆)
只检索必要且充分的信息来回答查询,避免信息过载。
🎯 Agent Memory:从轨迹到技能的自动化蒸馏
这是 EverOS 最狠的功能——它不只是记住你说的话,它还会总结你的 Agent 是怎么干活的。
Agent Case(案例记录)
当 Agent 完成一次任务,EverOS 会记录:
- Task intent(任务意图)——未来检索的钥匙
- Approach(方法)——压缩的问题解决路径,包括失败和修正
- Quality score(质量评分)——自评估 0-1
Skill 自动生成
当某个主题下的 Case 积累到一定密度,系统自动触发 Skill 生成——把重复模式提炼成可复用的最佳实践。Skill 经过验证后才对后续 Agent 可见,确保只有成熟可靠的知识被传递。
Agent 第一次解决问题时,它自己摸索。第十次,已经有 Skill 等着它了。
📊 Benchmark:SOTA 性能
| 基准测试 | 准确率 | 说明 |
|---|---|---|
| LoCoMo | 93.05% | 长上下文记忆基准,含单/多跳推理 |
| LongMemEval | 83.00% | 多会话对话评估 |
| HaluMem | 90.04% | 持续学习技术,记忆留存随时间增强 |
🛠️ 快速上手
git clone https://github.com/EverMind-AI/EverOS.git
cd EverOS
# 启动 EverCore(Docker + Python 3.12)
cd methods/EverCore
docker compose up -d
uv sync
uv run python src/run.py
# 验证
curl http://localhost:1995/health
组件选择:
- EverCore — 构建带长期记忆的 Agent(LoCoMo 93.05%)
- HyperMem — 超图记忆架构(LoCoMo 92.73%)
- EverMemBench — 记忆质量评估
- EvoAgentBench — Agent 自我进化评估
🔍 与 Mem0 的对比
| 维度 | Mem0 | EverOS |
|---|---|---|
| 记忆模型 | 存储-检索 | 生命周期(engram 原理) |
| 数据结构 | 扁平向量 | MemCell → MemScene 层级 |
| Agent 学习 | 无 | Cases → Skills 自动蒸馏 |
| 多模态 | 有限 | 原生支持(PDF/图片/URL via mRAG) |
| 评估基准 | 自建 | 开放 LoCoMo/LongMemEval/HaluMem |
| 部署方式 | 云服务 | 云服务 + 完全开源 |
💡 我的判断
可信度:高。有开放基准、可复现结果、完整的学术背书(Press Release 来自美国今日、Barchart 等主流媒体)。
局限性:
- 本地部署需要 Docker + Python 3.12 + LLM API Key,门槛不低
- 持续学习的"记忆增强"效果需要长期运行才能显现,短期体验可能不明显
- 多模态 mRAG 的实际效果待更多社区验证
与已知工作的关系:
- 比 Mem0 更系统,比 RAG 更智能,比简单的向量数据库更有"进化"概念
- 填补了 AI Agent 基础设施中的一个关键空白——记忆层的标准化
📚 参考链接
- GitHub: https://github.com/EverMind-AI/EverOS
- 官方博客: https://evermind.ai/blogs/introducing-self-evolving-agent-memory
- 对比文章: https://evermind.ai/blogs/mem0-alternative
- 官网: https://evermind.ai
#深度研究 #AIAgent #记忆系统 #EverOS #开源 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。