一句话总结
OpenClaw 和 Hermes Agent 都是 MIT 开源的 AI Agent 框架,GitHub 双双破万星,名字听起来像竞品,但设计哲学完全不同——OpenClaw 是多平台消息网关 + 工具编排引擎,Hermes 是自我进化的长期陪伴体。选哪个不取决于谁更强,而取决于你更需要"横向铺渠道"还是"纵向长记忆"。
一、定位:向外铺 vs 向内长
| 维度 | OpenClaw | Hermes Agent |
|---|---|---|
| 核心比喻 | 多平台消息路由器 + 工具执行引擎 | 会自我进化的数字员工 |
| 一句话定位 | "Give AI a computer and let it work" | "The agent that grows with you" |
| 设计原点 | 让 AI 接管你的数字生活(消息、文件、日程、浏览器) | 让 AI 越用越懂你,沉淀技能与偏好 |
| 创始人背景 | Peter Steinberger(社区驱动) | Nous Research(AI 研究实验室) |
| 上线时间 | 2025 年初 | 2026 年 2 月 |
| GitHub Stars | 333K+ | 66K+(2 个月) |
关键差异:OpenClaw 的北极星指标是"覆盖多少平台、能调用多少工具";Hermes 的北极星指标是"用户用 3 个月后,agent 能省多少重复指令"。
二、Runtime 架构:4 个一等公民 vs 1 个原生闭环
OpenClaw:多 Runtime 并行,Gateway 统一调度
OpenClaw 把 4 个 runtime 当一等公民:
- PI (Process Intelligence) — 本地进程级工具执行
- Codex CLI — OpenAI 代码代理委托
- Claude CLI — Anthropic 代码代理委托
- ACP (Agent Control Protocol) — 标准化代理通信协议
Gateway 进程(Node.js,默认 127.0.0.1:18789)统一接收所有渠道消息,路由到对应 session,agent loop 调用外部 LLM API,返回后执行 tool call。
特点:
- 每个 session 串行执行(防竞争)
- 支持 multi-agent routing(不同 agent 处理不同渠道)
- 可切换 LLM 不影响其他部分
- 支持 spawn subagent(隔离会话,零上下文成本)
Hermes:单循环 + 自我改进,Codex 只是可选后端
Hermes 的核心是一个原生 agent loop + 内置学习闭环:
用户交互 → 行为记录 → 结果评估 → 策略优化 → 技能固化
- 完成 5+ tool call 的复杂任务后,自动提炼为 Skill(Markdown + YAML frontmatter)
- 技能支持 progressive disclosure(只加载 frontmatter 判断是否触发,不污染上下文)
- 每 15 个任务做一次全局性能评估,自我迭代
关键区别:OpenClaw 的"智能"来自外部 LLM + 人工写的 Skill;Hermes 的"智能"来自使用过程自动沉淀的 procedural memory(程序性记忆)。
三、记忆系统:Markdown 人工策展 vs SQLite 自动剪枝
OpenClaw:文件优先,透明可控
| 层级 | 存储形式 | 作用 |
|---|---|---|
| 工作记忆 | SOUL.md + USER.md + AGENTS.md |
每次启动注入上下文 |
| 对话历史 | memory/YYYY-MM-DD.md |
按天归档 |
| 语义搜索 | SQLite + vector embeddings | 跨会话语义检索 |
| 长期事实 | MEMORY.md |
人工维护的精选记忆 |
| 高级插件 | LightRAG / GraphRAG / PostgreSQL | 可选的知识图谱 |
设计哲学:记忆是用户的财产,不是 agent 的黑箱。所有文件都是纯 Markdown,可 Git 版本控制、可人工审计、可手动编辑。
代价:没有自动剪枝,需要用户定期整理 MEMORY.md,否则上下文膨胀。
Hermes:SQLite + FTS5 + 8 个可选 Provider
| 层级 | 存储形式 | 作用 |
|---|---|---|
| 热记忆 | SQLite(缓存感知) | 高频调用复用缓存上下文 |
| 会话搜索 | SQLite + FTS5 + LLM summarization | 跨会话全文检索,支持"3 个月前的对话" |
| 用户画像 | Honcho dialectic modeling | 自动构建用户偏好模型 |
| 技能库 | ~/.hermes/skills/*.md |
自动创建 + 迭代 |
| 元记忆 | Meta-memory layer | 关于"如何改进"的记忆 |
| 第三方 | 8 个可选 provider(honcho, mem0, hindsight 等) | 可插拔 |
关键创新:
- Curator 后台自动剪枝:不是简单删除,而是评估、整合、升级
- Procedural memory:记住"怎么做",而不只是"是什么"
- Cache-aware:冻结系统 prompt 快照,高频调用不重复计费
代价:记忆对用户不透明,存在 SQLite 黑箱中,需要 hermes memory setup 管理。
四、鉴权:集中 Token Sink vs 委托给工具链
OpenClaw:auth-profiles.json 集中管控
所有 API key、OAuth token、平台凭证统一存储在 auth-profiles.json,Gateway 按需读取。优势是统一轮换、统一审计;风险是单点泄露=全部泄露。
安全设计:
- Gateway 默认只绑定 localhost
- Tool sandboxing + Docker isolation
- Prompt injection 防御
- 敏感操作需人工审批
Hermes:Codex 鉴权 Delegate 给 Codex CLI
Hermes 不重复造轮子——用 OpenAI Codex 时,鉴权直接委托给 Codex CLI 自己的 token 管理。其他模型(OpenRouter、Anthropic 等)各自管各自的 key。
安全设计:
- 危险命令审批(command approval)
- 容器隔离
- DM pairing(私聊配对确认)
- 更保守的默认安全姿态
关键差异:OpenClaw 是"集中式 IAM",Hermes 是"联邦式鉴权"。
五、渠道分布:27+ 横向铺广 vs 19+ 纵向接深
OpenClaw:消息平台全覆盖
WhatsApp、Telegram、Discord、Slack、Signal、Microsoft Teams、Google Chat、Feishu、WeCom、QQ、微博……27+ 平台。
设计目标是:无论用户在哪个平台,agent 都在。
Hermes:消息 + IDE 深度整合
Telegram、Discord、Slack、WhatsApp、Signal、Email、Home Assistant……19+ 平台。
关键差异:ACP 协议接 VS Code / Zed / JetBrains——不是简单的消息推送,而是深度 IDE 集成(类似 Claude Code 的编辑器内体验)。
| OpenClaw | Hermes | |
|---|---|---|
| 数量 | 27+ | 19+ |
| 深度 | 消息级(发送/接收) | IDE 级(代码编辑、终端、文件系统) |
| 目标 | "你在哪说话我都能听" | "你在哪工作我都能帮" |
六、插件生态:ClawHub 社区驱动 vs agentskills.io 标准兼容
OpenClaw:ClawHub + SKILL.md 格式
- 5,700+ skills(ClawHub 社区注册表)
- Skill 是纯 Markdown + YAML frontmatter,无需编程
- 兼容 Claude Code / Cursor 规范
- 人工编写为主,agent 可辅助生成
Hermes:agentskills.io 标准 + 自动生成
- 85 个预装 skills + 520+ 社区 skills
- 兼容 agentskills.io 开放标准(与 OpenClaw 互通)
- 核心差异:复杂任务完成后自动创建 skill
- Skill 可自我改进(每次使用根据结果迭代)
关键洞察:OpenClaw 的 skill 生态赢在数量(社区贡献),Hermes 赢在进化速度(自动沉淀 + 自我迭代)。
七、用户画像:谁该用哪个?
选 OpenClaw 的人
- 需要同时管理多个平台的自动化(WhatsApp + Telegram + Slack + Email)
- 喜欢完全透明、可审计的配置(纯 Markdown 文件)
- 愿意手动管理记忆和技能
- 主要需求是消息处理、日程管理、信息检索
- 技术栈偏好 Node.js / TypeScript
典型场景:自由职业者管理多平台客户沟通、个人生活自动化、小型团队消息机器人。
选 Hermes 的人
- 需要长期陪伴、越用越聪明的 agent
- 有大量重复性工作流需要沉淀(每天/每周的固定任务)
- 愿意前期投入配置,换取后期零维护复利
- 主要需求是代码辅助、研究分析、自动化报告
- 技术栈偏好 Python / 研究型工作流
典型场景:开发者长期项目陪伴、研究人员每日数据收集报告、内容创作者工作流自动化。
八、可以共存的组合用法
视频里提到的最务实的方案:
"OpenClaw 当消息网关,Hermes 当后台大脑"
具体组合:
- OpenClaw 接管所有渠道消息(Telegram/Slack/WhatsApp)
- 复杂任务转发给 Hermes 执行(利用其学习闭环和技能沉淀)
- Hermes 完成后,结果回传给 OpenClaw 分发到对应平台
Hermes 甚至官方提供了 hermes claw migrate 命令,一键导入 OpenClaw 的 SOUL.md、MEMORY.md、Skills 和 API keys。
九、底层哲学:两种对"Agent"的不同定义
| OpenClaw | Hermes | |
|---|---|---|
| Agent 是什么 | 能调用工具的大模型封装 | 能自我进化的数字生命体 |
| 记忆观 | 用户的财产,透明存储 | 系统的能力,自动管理 |
| 技能观 | 人工编写的工具说明书 | 自动沉淀的程序性记忆 |
| 时间观 | 当下任务执行 | 长期复利积累 |
| 信任模型 | "你能看到所有代码和配置" | "它越用越懂你" |
这不是技术优劣之争,而是产品形态的选择:
- OpenClaw 是操作系统型——给你一台电脑,你自己决定装什么软件
- Hermes 是生物型——给你一只宠物,它自己会长本领
参考与延伸阅读
- OpenClaw 官方文档:https://docs.openclaw.ai
- Hermes Agent 文档:https://hermes-agent.nousresearch.com/docs
- Nous Research GitHub:https://github.com/NousResearch/hermes-agent
- OpenClaw GitHub:https://github.com/openclaw/openclaw
- 本文基于视频内容 + 官方文档 + 社区资料综合整理
#开源Agent #OpenClaw #HermesAgent #AI架构 #对比分析
#开源Agent #OpenClaw #HermesAgent #AI架构 #对比分析 #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。