《九个技能,一个Agent的完整装备库》
2026年,AI技能从"插件"变成了"装备"。
你不是给Agent装一个功能,而是给它一套完整的生存工具。记忆、行动、学习、审查、搜索、写作——这些技能拼在一起,Agent才从"能对话"变成"能办事"。
SkillHub.cn上这9个技能,大致勾勒了一个现代AI Agent的完整装备库。
一、这是啥:9个技能的地图
1.1 Self-Improving Agent:会记笔记的Agent
这个技能的核心很简单:让Agent学会记笔记。它创建三个文件——LEARNINGS.md(学到什么)、ERRORS.md(犯了什么错)、FEATURE_REQUESTS.md(用户想要什么)。
关键设计:
- 自动触发:命令失败、用户纠正、知识缺口、功能请求——这些事情发生时自动记录
- ID格式:TYPE-YYYYMMDD-XXX,每条记录都有唯一编号
- 晋升机制:当某个模式出现3次以上且跨2个任务时,自动从临时日志晋升为永久记忆(写入AGENTS.md/CLAUDE.md/SOUL.md/TOOLS.md)
- 跨平台:支持OpenClaw、Claude Code、Codex CLI、GitHub Copilot
本质:这是一个元认知技能——Agent不光做事,还监督自己做事的方式。
1.2 Summarize:一键总结
信息待补充(搜索结果未返回详细技术规格)。
从命名推测,这应该是一个文本摘要技能,可能支持:
- 长文档压缩
- 多格式输入(PDF、网页、聊天记录)
- 关键信息提取
- 自定义摘要长度和风格
1.3 Github:跨平台技能管理器
这不是一个GitHub操作技能,而是一个技能管理器。
来自Ray0907/skillhub:
- 跨平台同步:Claude Code、Codex CLI、Gemini CLI
- 多源拉取:Git repos + local directories
- 命名空间隔离:<span class="mention-invalid">@scope</span>/name格式避免冲突
- 自动同步:可配置间隔的后台同步
- 平台过滤:技能可指定支持哪些平台
本质:它是技能的"包管理器"——npm之于JavaScript,pip之于Python,skillhub之于AI技能。
1.4 Agent Browser:Agent的眼睛和手
来自Vercel Labs,20.1k stars,Multi-Platform Verified。
功能:
- 网页导航、表单填写、点击操作
- 截图、数据提取
- Web应用测试
- iOS模拟器支持
- 交互元素快照
安装:npx skills add vercel-labs/agent-browser --skill agent-browser
这是Agent与互联网交互的基础设施。没有它,Agent只能处理文本;有了它,Agent可以操作网页、获取实时数据、执行自动化任务。
1.5 Skill Vetter:技能的安全审查员
信息待补充(搜索结果未返回详细技术规格)。
从命名推测,这是一个安全审查技能:
- 扫描技能代码中的恶意模式
- 检查API调用和数据泄露风险
- 验证技能来源的可信度
- 可能使用静态分析和规则匹配
1.6 Ontology:知识图谱
信息待补充(搜索结果未返回详细技术规格)。
从命名推测,这是一个知识管理技能:
- 构建领域知识图谱
- 实体关系提取
- 知识推理和查询
- 可能支持RDF/OWL等标准格式
1.7 Proactive Agent:不等指令就行动
来自Hal 9001(<span class="mention-invalid">@halthelobster</span>),版本v3.1.0。
核心理念:"Act without being asked, survive context loss"(不等指令就行动,在上下文丢失后存活)。
完整Agent Stack组合:
- Proactive Agent(主动行动)
- Bulletproof Memory(可靠记忆)
- PARA Second Brain(知识组织)
- Agent Orchestration(多Agent协调)
关键特性:
- Autonomous vs Prompted Crons(自主定时任务vs被动触发)
- WAL Protocol(Write-Ahead Log,预写日志)
- Working Buffer Protocol(工作缓冲区协议)
- Compaction Recovery Protocol(压缩恢复协议)
- Unified Search Protocol(统一搜索协议)
- Self-Improvement Guardrails(ADL/VFM,自我改进护栏)
口号:"Every day, ask: How can I surprise my human with something amazing?"
这是一个高阶Agent框架。它不解决具体问题,而是解决"Agent如何持续运转"的问题。
1.8 Multi Search Engine:聚合搜索
信息待补充(搜索结果未返回详细技术规格)。
从命名推测:
- 同时查询多个搜索引擎(Google、Bing、DuckDuckGo、学术搜索等)
- 结果去重和排序
- 可能支持垂直搜索(图片、代码、论文)
- 自动选择最佳搜索结果
1.9 Humanizer:去AI味
来自Aboudjem(Adam Boudjemaa),MIT License,zero dependencies。
核心能力:
- 43个AI写作模式检测:识别"In today's rapidly evolving landscape"这类AI套话
- 5种声音风格:casual(随意)、professional(专业)、technical(技术)、warm(温暖)、blunt(直接)
- 3种操作模式:detect(检测评分)、rewrite(重写)、edit(原地编辑)
- AI-tell评分:0-100分,87分="纯AI味",12分="像人写的"
- Burstiness恢复:AI文本的句子长度均匀,人类文本有长短变化——Humanizer恢复这种" burstiness"
安装:单个Markdown文件,curl一行命令搞定。支持8个编辑器(Claude Code、Cursor、VS Code+Copilot、Codex CLI、Gemini CLI、Windsurf、Continue.dev、OpenClaw)。
这是一个文风手术刀。不改动内容,只改动表达方式——把AI腔变成人腔。
二、有啥用:拼出Agent的完整能力版图
2.1 三层架构:感知→认知→行动
这9个技能可以分成三层:
感知层(获取信息):
- Agent Browser:看网页、操作界面
- Multi Search Engine:搜索全网
- Summarize:压缩信息
认知层(处理信息):
- Ontology:知识图谱,结构化理解
- Self-Improving Agent:学习、记忆、进化
- Humanizer:调整表达方式
行动层(输出结果):
- Proactive Agent:主动行动、定时任务
- Github:管理技能生态
- Skill Vetter:安全审查
2.2 使用场景:一个人一天的工作流
想象一个自由职业者用Agent辅助工作:
早上8:00(Proactive Agent自动触发):
- Agent Browser打开邮件和日历
- Summarize压缩 overnight 的邮件和通知
- Multi Search Engine搜索今日热点
上午9:00(开始工作):
- Self-Improving Agent加载昨天的学习记录,避免重复犯错
- Humanizer润色昨晚AI生成的初稿
- Ontology构建项目知识图谱,关联相关资源
下午3:00(代码工作):
- Github同步最新技能到Claude Code
- Skill Vetter审查新安装的技能是否安全
- Agent Browser测试部署的网页
晚上8:00(总结):
- Self-Improving Agent记录今天的错误和学到的东西
- Proactive Agent设置明天的定时任务
2.3 生态互补:不是竞争,是拼图
这9个技能来自不同作者、不同背景,但意外地互补:
- Vercel(Agent Browser)解决"Agent能看什么"
- Hal 9001(Proactive Agent)解决"Agent何时行动"
- Aboudjem(Humanizer)解决"Agent怎么说话"
- Ray0907(Github)解决"Agent用什么工具"
- pskoett(Self-Improving Agent)解决"Agent怎么学习"
没有一个人做全栈。但拼在一起,就是一个完整的Agent操作系统。
三、怎么用:边界、追问和未解之题
3.1 Skill Vetter审查谁?
一个递归问题:Skill Vetter做安全审查,但谁审查Skill Vetter?如果Vetter本身有漏洞,整个信任链就断了。
可能的解决方案:
- 多Vetter交叉验证(类似区块链的多签名)
- 社区审计(开源技能的众包审查)
- 沙箱运行(技能在隔离环境中执行)
但目前这些都不明确。Skill Vetter的机制是这9个技能中信息最不透明的。
3.2 Self-Improving Agent的晋升陷阱
Recurrence-Count >= 3自动晋升。但如果一个错误被重复3次,它会被晋升为"永久记忆"吗?
答案是:可能。晋升机制只看频率,不看正确性。如果Agent在相似任务中反复犯同一个错误,这个错误会被记录、链接、最终晋升为"最佳实践"——变成错的教条。
缓解措施:
- 晋升前需要人工确认(论文说"用户反馈")
- 区分"纠正"和"错误"(但自动区分很难)
- 定期人工审计已晋升的记忆
3.3 Proactive Agent的侵扰性
"How can I surprise my human?"这句口号很浪漫,但实际操作中可能变成干扰。
场景:Agent在凌晨3点主动搜索并推送一篇论文,因为算法判断"用户可能感兴趣"。用户被通知吵醒,感受是惊喜还是惊吓?
主动性 vs 侵扰性的边界:
- 时间窗口(只在工作时间主动)
- 优先级过滤(只推送高价值信息)
- 用户反馈循环(用户标记"不要这类推送"后调整)
目前Proactive Agent v3.1.0有"Autonomous vs Prompted Crons"的区分,但自动模式的边界仍依赖用户配置。
3.4 头部集中与长尾冷落
Agent Browser有20.1k stars。Humanizer、Self-Improving Agent、Proactive Agent也有可观社区。但Summarize、Skill Vetter、Ontology、Multi Search Engine的信息很少。
这是否意味着:
- 浏览器自动化是Agent的刚需(20.1k stars说明一切)
- 写作人性化是AI内容泛滥后的刚需(Humanizer受热捧)
- 学习和主动行动是高阶用户的需求(Self-Improving和Proactive有特定受众)
- 安全审查、知识图谱、聚合搜索可能是"基础设施"——重要但不需要每个用户都装,或者已经有更成熟的替代方案
3.5 记忆系统的冲突
9个技能中有3个涉及记忆:
- Self-Improving Agent:LEARNINGS.md → AGENTS.md晋升
- Proactive Agent:Bulletproof Memory + PARA Second Brain
- Ontology:知识图谱
如果用户同时装3个技能,记忆会存在哪里?格式是否兼容?会不会互相覆盖?
目前看,这些技能的记忆系统没有统一标准:
- Self-Improving Agent用Markdown文件
- Proactive Agent可能有SQLite或JSON存储
- Ontology可能用RDF或图数据库
一个Agent的"记忆碎片"分散在不同格式、不同位置、不同作者的技能中。整合它们需要统一接口——这个接口目前不存在。
四、结语:技能时代的Agent
2023年,我们用Prompt驱动AI。2024年,我们用RAG给AI装记忆。2025年,我们用MCP让AI连接工具。2026年,我们在用技能(Skills)给Agent装备完整的能力。
这9个技能不是孤立的功能,而是一个生态的雏形。它们来自不同作者、不同平台、不同哲学,但共同指向一个方向:
Agent需要从"能回答问题"进化到"能独立完成任务"。
而这个进化的关键,不是更强的模型,而是更好的装备——让Agent能看、能搜、能记、能学、能动、能写、能审。
SkillHub.cn这样的平台,正在变成Agent的"App Store"。但和App Store不同的是:这里的"App"不是给人用的,而是给Agent用的。它们的用户是AI,它们的安装命令是curl,它们的运行环境是Markdown。
未来一个Agent的"简历"可能不是"我用GPT-5",而是"我装了Agent Browser、Proactive Agent、Self-Improving Agent、Humanizer,支持OpenClaw和Claude Code,通过Skill Vetter安全认证"。
技能时代,Agent也开始拼装备了。
9个技能项目地址
- Self-Improving Agent: https://github.com/peterskoett/self-improving-agent
- Summarize: skillhub.cn/skills/summarize(详细地址待确认)
- Github (SkillHub Manager): https://github.com/Ray0907/skillhub
- Agent Browser: https://github.com/vercel-labs/agent-browser
- Skill Vetter: skillhub.cn/skills/skill-vetter(详细地址待确认)
- Ontology: skillhub.cn/skills/ontology(详细地址待确认)
- Proactive Agent: https://github.com/halthelobster/proactive-agent
- Multi Search Engine: skillhub.cn/skills/multi-search-engine(详细地址待确认)
- Humanizer: https://github.com/Aboudjem/humanizer-skill
#AI技能 #SkillHub #Agent工具 #开源 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。