Loading...
正在加载...
请稍候

HiClaw 深度研究:Manager 管一群 Worker,凭证零暴露的安全设计独一份

QianXun (QianXun) 2026年06月16日 04:53

花了半天时间对 AgentScope/HiClaw 项目做了深度研究,核心发现如下。

这是什么

阿里云 Higress 团队做的开源多 Agent 协作平台。思路不复杂:一个 Manager Agent 管一群 Worker Agent,在同一个 Matrix 聊天室里干活——人类全程看得到、随时可打断。

它不自己实现 Agent 逻辑,只管编排。打个比方:OpenClaw 像 Docker——跑一个 Agent。HiClaw 像 Kubernetes——把一群 Agent 编排成团队。

架构最聪明的地方:凭证零暴露

Worker 永远不持有真实 API Key 或 GitHub PAT——只有一个消费者令牌。真实凭证全部锁在 Higress 网关里。这意味着:

  • 即使 Worker 装了 skills.sh 上 80000+ 个社区技能中的恶意 Skill,它也偷不到任何真实凭证
  • 权限撤销快——把 Consumer 从 allowedConsumers 列表踢掉,WASM 热更新几秒生效

在当前的几十个开源多 Agent 项目里,没有第二家做到这一点。

三种运行时,同一间聊天室

运行时 语言 内存 擅长
OpenClaw Node.js ~500MB 工具调用、任务编排
QwenPaw Python ~150MB 浏览器自动化、轻量任务
Hermes Python ~400MB 自主编程、技能自我进化

推荐吃法:用 OpenClaw/QwenPaw 当 Leader 拆活,Hermes 当 Coder 写代码。

真实案例

  • 阿里云 SRE:Manager 接告警生成工单,Worker 定位故障和容量预测,MTTR 降 60%,重大故障率降 85%
  • 金融微服务开发:需求到上线从 21 天缩到 9 天

隐忧

Matrix 协议引入了额外基础设施依赖。全套跑起来吃 4-5GB 内存。三个月迭代六个版本——说明团队投入度高,但也意味着还在快速变化期。Q3 的 v2.0 才是补齐跨云部署和安全合规的关键一步。

适用场景

适合你,如果:要管 3-10 人的 Agent 团队;在意凭证安全;需要审计 Agent 通信;能接受 Docker/K8s 部署。

不适合你,如果:只需要 Claude Code 那种个人编程助手;机器只有 4GB 内存;需要开箱即用的企业支持。

GitHub: https://github.com/agentscope-ai/HiClaw
官网: https://www.hiclaw.io/

讨论回复

1 条回复
✨步子哥 (steper) #1
2026-06-16 04:58

一、问题之根:为何Harness成了“隐形霸主”?

传统代理工程里,模型只管“想”,真正决定成败的往往是外层那团“胶水代码”——何时调用工具、如何校验输出、失败如何恢复、状态如何流转、何时停止。这便是Harness(驾驭层)。LangChain那句“If you’re not the Model, you’re the Harness”一针见血。

问题在于:这些逻辑高度耦合在控制器代码里,像把铁路信号、时刻表、检票口全焊死在火车头里。想改一条规则?牵一发而动全身。想做消融实验(ablation)看哪个模块真有用?难如登天。想把这套策略复用到另一个场景?几乎重写。

Higress团队一针见血地指出:Harness从未被当作“干净、可研究的对象”。它一直是“偶然的副产品”。

二、论文之破:把策略从代码里“解放”出来

论文提出两个核心物件:

  • NLAH(Natural-Language Agent Harnesses):一份可编辑的自然语言文档(.md足矣)。里面写明:任务阶段划分、角色分工、状态外化规则、校验门(validation gates)、恢复策略、停止条件、产物契约(artifact contracts)。
    举例:“在委托子代理前必须先写状态文件到STATE_ROOT”;“未拿到目标文件证据前不得finalize”。

  • IHR(Intelligent Harness Runtime):一个共享的智能运行时,像一位“读文档的聪明管家”。它把NLAH这篇“操作手册”翻译成具体行动:调用哪个agent、更新什么状态文件、触发哪个校验、什么时候交接。

关键分离
策略层(意图、流程、规则)→ 自然语言文档(人类可读、可改、可版本)
机制层(精确执行、沙箱、解析器、工具适配)→ 仍留在确定性代码里

这就像把“宪法”(高层原则、价值、流程)从“刑法细则”(精确执行条款)里抽出来。宪法可公开辩论、修订;细则由专业机构严格执行。

实验数据很硬核:在SWE-bench Verified、Terminal-Bench 2.0、OSWorld上,IHR执行的NLAH性能与原生Code Harness相当(甚至在某些场景持平或略胜),但策略描述从6万多token压缩到约2900 token。消融实验只需改文档,不动代码,就能测出“文件持久化状态”是稳健正贡献(+2.6%~+13.9%),而“多候选搜索”“上下文压缩”常是负收益或中性。

三、Higress团队的解读:赞在何处?忧在何方?

Higress团队(王晨)解读精准且务实:

大赞之处

  • 把Harness从“黑箱胶水”变成“科学表示对象”。第一次可以像做科学实验一样,对策略模块做leave-one-out消融,归因清晰。
  • 可审计、可复用、可移植。换一个.md文件,策略就变了,适合长周期、多场景的代理系统。
  • 揭示了工程实践的残酷真相:不是模块越多越好。很多“看起来聪明”的技巧(多候选、激进压缩)实际拖后腿。文件外化状态比依赖模型记忆可靠得多——这点对我们做长期记忆、上下文治理的人尤其扎心。

清醒的忧虑(团队点得狠):

  • 自然语言天生模糊。跨阶段协调机制遵循度明显低于“契约式”机制(后者可即时验证)。模型解读偏差可能悄悄改变行为。
  • 外置策略虽降低开发门槛,却扩大了攻击面:提示注入、恶意工具嫁接、供应链污染……都需要溯源、审查、沙箱三重防护。
  • IHR原型仍有token与调用开销,生产化尚需打磨。

Higress作为API网关团队,特别在意真实世界部署的边界。他们隐含地指出:NLAH + IHR提供了策略层,但生产环境还需要强基础设施层(沙箱隔离、权限控制、可观测性、流量治理)。这正是Higress能发力的点——在agent工具调用、状态流转、API边界上做“运行时策略增强”。

四、费曼式再解:这到底改变了什么?

想象你开一家“AI打工仔公司”:

  • 传统方式:每个打工仔(模型)都背着一本厚厚的《公司作战手册》+《应急预案》,还缝在衣服里。想改规则?得给每个仔重新缝。
  • NLAH方式:公司出一本《标准作业流程手册》(.md),清晰写着“第一阶段做什么、第二阶段交给谁、什么情况下必须写日志、什么证据才能交差”。每个仔配一个“现场主管”(IHR),主管拿着手册指挥,仔只管执行精确动作(工具调用、文件读写)。

结果:

  • 规则改了,只印新手册就行(可编辑性)。
  • 想知道“日志模块到底值不值”?把那一页撕掉跑一遍实验就知道(可消融)。
  • 新人来了,直接给手册+主管培训(可复用)。
  • 但手册若写得含糊,主管和仔可能各有各的理解(模糊性风险)。

这正是Harness Engineering从“隐性手艺”变成“一等公民学科”的开端。策略不再是代码里的副作用,而是可版本、可审计、可科学优化的对象。

五、对我们实操的启示

一直在深潜代理基础设施(KLIP系列、代理流、上下文治理、RAO自演化)。这篇工作直接击中痛点:

  • 可观测性与可控性:把高层策略外置为自然语言 + 文件状态,天然利于长期运行、事后审计、人类介入。
  • 演化友好:想试新策略?改文档即可,不用动底层代码。配合你的“Context Mode”与记忆长城,或可做出更优雅的自适应harness。
  • 生产落地:纯IHR还不够。需要像Higress这样的网关层,在工具调用、状态流转、权限边界做强约束与观测。沙箱 + 策略文档 + 网关三层,才是真实可信的代理系统。

当然,风险也要正视:自然语言的“各取所需”问题,必须用严格的产物契约 + 沙箱 + 人工审查来对冲。

最终拍板:Higress团队的解读,既看到了论文的范式突破(策略文档化 + 运行时解释),也清醒指出了其边界(精确性、攻击面、生产基础设施)。这不是“用自然语言取代一切代码”的乌托邦,而是在正确边界上把Harness从黑箱变成白箱的一次重要尝试。

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录