《两个字段,十四万星:Anthropic如何用Markdown文件统一AI工具生态》
2025年12月18日,Anthropic发布了一个"开放标准"。
标准的内容极简:一个Markdown文件,顶部写两个字段(name和description),下面随便写指令。
这个标准叫Agent Skills。发布一年多,GitHub上十四万四千星。
不是十四万个用户。是十四万个"点星"。这意味着无数人觉得"这东西值得记住"。
一、这是啥:从Prompt到Skill的范式跃迁
1.1 问题的根源:上下文窗口的通货膨胀
2023年,你和GPT-4对话。每次都要重复你的偏好:"请用中文回答"、"代码要加注释"、"不要编造事实"。
2024年,系统提示(System Prompt)出现了。你把偏好写进一个长文本,每次会话自动加载。但问题变了——你的偏好越来越长:品牌指南、代码规范、API文档、工作流程。这些东西挤占了上下文窗口,留给实际任务的空间越来越小。
Anthropic的产品经理Mahesh Murag把这个问题叫"上下文通货膨胀"。Agent Skills的解决方案叫"渐进式加载"(progressive disclosure)——不是一次性塞进去,而是按需加载。
1.2 极简规范:两个必填字段
Agent Skills规范只有两个必填项:
name:1-64字符,小写字母+数字+连字符,必须和文件夹名一致。
description:1-1024字符,描述这个skill做什么、什么时候用。要包含触发关键词。
就这么简单。下面可以是任何东西——步骤说明、代码示例、参考文档链接。Markdown格式,没有限制。
一个skill的完整结构:
skill-name/
├── SKILL.md # 必填:YAML frontmatter + Markdown指令
├── scripts/ # 可选:可执行代码
├── references/ # 可选:参考文档,按需加载
└── assets/ # 可选:模板、图片、数据文件
1.3 渐进式加载的三层结构
这是Skills最精妙的设计。
第一层:元数据(~30-50 tokens)
会话启动时,Agent只读取所有skill的name和description。50个skill总共消耗1500-2500 tokens——比一个中等长度的系统提示还短。
第二层:指令(<5000 tokens推荐)
当任务匹配某个skill的description时,Agent才加载SKILL.md的完整内容。中位数skill体长1414 tokens(CMU+Bosch Research,2026年2月,分析40,000+公开skills)。
第三层:资源(按需)
如果skill的指令中引用了references/或scripts/中的文件,这些文件只在需要时加载。
对比:传统系统提示是把所有东西塞进一个文本块,不管用不用都占空间。Skills是"用多少,加载多少"。
1.4 跨平台:一次编写,到处运行
2025年12月18日,Anthropic发布开放标准。两个月内,26+平台采纳:
Claude Code、OpenAI Codex CLI、Gemini CLI、GitHub Copilot、Cursor、VS Code、Windsurf、Continue.dev、Goose、Roo Code、Trae...
OpenAI"悄悄"在ChatGPT的代码解释器环境中加了/home/oai/skills文件夹。Codex CLI接受--enable skills参数。
这意味着:你写一个skill,所有兼容平台都能用。不需要为每个平台单独适配。
二、有啥用:十四万星背后的生态
2.1 官方Skill分类:17个示例,四大类
Anthropic官方仓库(anthropics/skills)的skill分为四类:
Creative & Design:艺术、音乐、设计(6个)
Development & Technical:Web应用测试、MCP服务器生成(4个)
Enterprise & Communication:品牌规范、沟通模板(4个)
Document Skills:DOCX、PDF、PPTX、XLSX创建/编辑(4个+)
Document Skills是生产级的——Claude的文档处理能力就靠这些skill驱动。它们不是示例,是实际在用的代码。
2.2 社区生态:skills.sh和分发网络
skills.sh是主要分发平台。安装一个skill只需一行:
npx skills add <owner/repo>
社区贡献的skill数量可观:
- anthropics/skills(官方):18个skill,170万次安装
- knowledge-work-plugins:230个skill,23.2万次安装
- claude-code(插件):10个skill,11.8万次安装
- financial-services-plugins:57个skill,1.99万次安装
- claude-for-legal:98个skill,5400次安装
- healthcare:3个skill
安装次数和star数说明这不是"玩具"——有人在实际使用这些skill完成工作。
2.3 Skill vs MCP:互补而非替代
一个简洁的区分:
- MCP(Model Context Protocol):给Agent连接外部工具和数据的能力。相当于USB接口——定义了怎么连,不定义连上之后做什么。
- Skills:教Agent用这些工具和数据完成具体任务。相当于应用程序——定义了"做什么"和"怎么做"。
两者互补。MCP提供工具接口,Skills提供任务知识。没有MCP,Skills只能在文本层面工作。没有Skills,MCP连接的工具不会被有效利用。
2.4 学术研究:Skills优化作为双层优化问题
2026年4月的一篇arXiv论文(arXiv:2604.15709)把Skill优化形式化为双层优化问题:
一个skill表示为元组S=(θ, φ):
- θ:结构配置(目录结构、文件组织)
- φ:实例化内容(SKILL.md中的指令文本)
论文的洞察:skill的结构和内容是耦合的——不同的结构会影响内容的表达效率,反之亦然。优化一个skill需要同时考虑"怎么组织文件"和"写什么内容"。
三、怎么用:边界、质疑和未解之题
3.1 十四万Star不等于十四万活跃用户
GitHub star是一个"记住"行为,不是"使用"行为。很多人点了星但从未安装过skills。
更准确的指标:
- skills.sh上的安装次数(部分skill有百万级安装)
- 社区贡献的skill数量(数百个)
- 采纳的平台数(26+)
但"star数是用户兴趣的代理指标"这个判断仍然成立。十四万star说明Agent Skills这个概念击中了社区的痛点。
3.2 HN上的质疑:标准还是绑架?
Hacker News上的讨论中有犀利质疑:Anthropic是在"标准化"还是在"绑架"生态?
担忧的点:
- Anthropic定义了规范,如果规范偏向Claude的特有能力,其他平台是"兼容"还是"妥协"?
- allowed-tools字段是"实验性的",不同平台的支持程度不同
- 渐进式加载是理想设计,但平台实际实现时是否会偷工减料?
Barry Zhang(社区贡献者)有句话:"Claude能写下的任何东西,最终都会变成一个skill。"这句话既描述了生态的自然演化,也暗示了平台锁定风险。
3.3 安全审查的真空
Skills可以包含scripts/目录——可执行代码。这意味着:
- 安装一个skill等于运行未知来源的代码
- SKILL.md中的指令可能诱导Agent执行危险操作
- allowed-tools字段是"实验性"的,没有强制执行机制
MCP的安全问题已经被广泛讨论(2025-2026年多起RCE漏洞)。Skills继承了同样的风险:Agent被恶意skill诱导执行危险操作。
Skill Vetter(社区skill)尝试解决这个问题,但谁审查Skill Vetter?递归信任问题没有答案。
3.4 渐进式加载的理想与现实
规范说"metadata只消耗30-50 tokens"。但实际操作中:
- 50个skill的metadata是1500-2500 tokens。如果你装了500个skill呢?
- description字段最多1024字符。平台真的会严格遵守"只加载name+description"吗?
- references/按需加载是个好设计,但如果skill作者把所有内容都塞进SKILL.md(而不是分到references/),渐进式加载就失效了
CMU+Bosch的研究发现中位数skill是1414 tokens。这个长度在单任务场景下合理,但在多skill协作场景下,累积消耗仍然可观。
3.5 生态碎片化:多个"skill商店"
目前至少有三个skill分发渠道:
- skills.sh(skills.sh)
- SkillHub.cn(skillhub.cn)
- GitHub直接安装(npx skills add <owner/repo>)
它们之间的skill是否完全兼容?命名空间是否冲突?安装机制是否一致?
规范是统一的(agentskills.io),但生态是碎片化的。这和早期的npm vs yarn vs pnpm之争类似——标准统一了格式,但分发渠道的竞争仍在继续。
四、结语:从"写Prompt"到"写Skill"
Agent Skills的极简设计(两个必填字段)是它的最大优势,也是它的最大限制。
优势:任何人都能在几分钟内创建一个skill。没有编译,没有部署,没有依赖管理。一个Markdown文件,一个git仓库,完成。
限制:极简意味着约束少,约束少意味着质量参差不齐。一个好的skill和一个糟糕的skill,在格式上看起来一模一样。区分它们只能靠社区评价(stars、installs、reviews)——但社区评价需要时间积累,新skill在初期处于劣势。
更深层的意义:Skills代表了AI交互范式的又一次转移。
- 2023:写Prompt(每次对话重新解释)
- 2024:系统提示(一次写入,每次加载)
- 2025:RAG+MCP(连接外部知识+工具)
- 2026:Skills(模块化、可复用、按需加载的任务知识)
每一次转移都在做同一件事:减少重复劳动,让Agent记住更多、加载更少、执行更准。
两个字段,十四万星。这不是一个技术奇迹——技术本身很简单。这是一个生态奇迹:一个极简的共识,让数百个skill、数十个平台、数万开发者走到了同一张桌子上。
下一步的问题是:这张桌子能坐多久?当OpenAI、Google、Microsoft都有自己的"skill生态"时,agentskills.io的统一规范还能维持吗?
或者, Skills的极简性本身就是答案——它简单到任何平台都无法拒绝兼容。就像Markdown、JSON、HTTP——简单的东西活得最长。
核心参考文献
- Anthropic (2025). Agent Skills Specification. agentskills.io. https://agentskills.io/specification
- Anthropic Skills Repository. GitHub: anthropic/skills. https://github.com/anthropics/skills
- Firecrawl Blog (2026-04-27). How SKILL.md Files Work and Why They're Everywhere. https://www.firecrawl.dev/blog/agent-skills
- Strapi Blog (2026-02-10). What Are Agent Skills and How To Use Them. https://strapi.io/blog/what-are-agent-skills-and-how-to-use-them
- CMU + Bosch Research (2026). Skill Optimization as Bi-Level Optimization (arXiv:2604.15709). https://arxiv.org/abs/2604.15709
#AI技能 #Anthropic #AgentSkills #MCP #渐进式加载 #开放标准 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。