两个字段，十四万星：Anthropic如何用Markdown文件统一AI工具生态

> 2025年12月18日，Anthropic发布了一个"开放标准"。 > > 标准的内容极简：一个Markdown文件，顶部写两个字段（name和description），下面随便写指令。 > > 这个标准叫Agent Skills。发布一年多，GitHub上十四万四千星。 > > 不是十四万个用户。是十四万个"点星"。这意味着无数人觉得"这东西值得记住"。

---

一、这是啥：从Prompt到Skill的范式跃迁

1.1 问题的根源：上下文窗口的通货膨胀

2023年，你和GPT-4对话。每次都要重复你的偏好："请用中文回答"、"代码要加注释"、"不要编造事实"。

2024年，系统提示（System Prompt）出现了。你把偏好写进一个长文本，每次会话自动加载。但问题变了——你的偏好越来越长：品牌指南、代码规范、API文档、工作流程。这些东西挤占了上下文窗口，留给实际任务的空间越来越小。

Anthropic的产品经理Mahesh Murag把这个问题叫"上下文通货膨胀"。Agent Skills的解决方案叫"渐进式加载"（progressive disclosure）——不是一次性塞进去，而是按需加载。

1.2 极简规范：两个必填字段

Agent Skills规范只有两个必填项：

name：1-64字符，小写字母+数字+连字符，必须和文件夹名一致。

description：1-1024字符，描述这个skill做什么、什么时候用。要包含触发关键词。

就这么简单。下面可以是任何东西——步骤说明、代码示例、参考文档链接。Markdown格式，没有限制。

一个skill的完整结构：

skill-name/
├── SKILL.md          # 必填：YAML frontmatter + Markdown指令
├── scripts/          # 可选：可执行代码
├── references/       # 可选：参考文档，按需加载
└── assets/           # 可选：模板、图片、数据文件

1.3 渐进式加载的三层结构

这是Skills最精妙的设计。

第一层：元数据（~30-50 tokens） 会话启动时，Agent只读取所有skill的name和description。50个skill总共消耗1500-2500 tokens——比一个中等长度的系统提示还短。

第二层：指令（<5000 tokens推荐） 当任务匹配某个skill的description时，Agent才加载SKILL.md的完整内容。中位数skill体长1414 tokens（CMU+Bosch Research，2026年2月，分析40,000+公开skills）。

第三层：资源（按需） 如果skill的指令中引用了references/或scripts/中的文件，这些文件只在需要时加载。

对比：传统系统提示是把所有东西塞进一个文本块，不管用不用都占空间。Skills是"用多少，加载多少"。

1.4 跨平台：一次编写，到处运行

2025年12月18日，Anthropic发布开放标准。两个月内，26+平台采纳：

Claude Code、OpenAI Codex CLI、Gemini CLI、GitHub Copilot、Cursor、VS Code、Windsurf、Continue.dev、Goose、Roo Code、Trae...

OpenAI"悄悄"在ChatGPT的代码解释器环境中加了/home/oai/skills文件夹。Codex CLI接受--enable skills参数。

这意味着：你写一个skill，所有兼容平台都能用。不需要为每个平台单独适配。

---

二、有啥用：十四万星背后的生态

2.1 官方Skill分类：17个示例，四大类

Anthropic官方仓库（anthropics/skills）的skill分为四类：

Creative & Design：艺术、音乐、设计（6个） Development & Technical：Web应用测试、MCP服务器生成（4个） Enterprise & Communication：品牌规范、沟通模板（4个） Document Skills：DOCX、PDF、PPTX、XLSX创建/编辑（4个+）

Document Skills是生产级的——Claude的文档处理能力就靠这些skill驱动。它们不是示例，是实际在用的代码。

2.2 社区生态：skills.sh和分发网络

skills.sh是主要分发平台。安装一个skill只需一行：

npx skills add <owner/repo>

社区贡献的skill数量可观：

anthropics/skills（官方）：18个skill，170万次安装
knowledge-work-plugins：230个skill，23.2万次安装
claude-code（插件）：10个skill，11.8万次安装
financial-services-plugins：57个skill，1.99万次安装
claude-for-legal：98个skill，5400次安装
healthcare：3个skill

安装次数和star数说明这不是"玩具"——有人在实际使用这些skill完成工作。

2.3 Skill vs MCP：互补而非替代

一个简洁的区分：

MCP（Model Context Protocol）：给Agent连接外部工具和数据的能力。相当于USB接口——定义了怎么连，不定义连上之后做什么。
Skills：教Agent用这些工具和数据完成具体任务。相当于应用程序——定义了"做什么"和"怎么做"。

两者互补。MCP提供工具接口，Skills提供任务知识。没有MCP，Skills只能在文本层面工作。没有Skills，MCP连接的工具不会被有效利用。

2.4 学术研究：Skills优化作为双层优化问题

2026年4月的一篇arXiv论文（arXiv:2604.15709）把Skill优化形式化为双层优化问题：

一个skill表示为元组S=(θ, φ)：

θ：结构配置（目录结构、文件组织）
φ：实例化内容（SKILL.md中的指令文本）

论文的洞察：skill的结构和内容是耦合的——不同的结构会影响内容的表达效率，反之亦然。优化一个skill需要同时考虑"怎么组织文件"和"写什么内容"。

---

三、怎么用：边界、质疑和未解之题

3.1 十四万Star不等于十四万活跃用户

GitHub star是一个"记住"行为，不是"使用"行为。很多人点了星但从未安装过skills。

更准确的指标：

skills.sh上的安装次数（部分skill有百万级安装）
社区贡献的skill数量（数百个）
采纳的平台数（26+）

但"star数是用户兴趣的代理指标"这个判断仍然成立。十四万star说明Agent Skills这个概念击中了社区的痛点。

3.2 HN上的质疑：标准还是绑架？

Hacker News上的讨论中有犀利质疑：Anthropic是在"标准化"还是在"绑架"生态？

担忧的点：

Anthropic定义了规范，如果规范偏向Claude的特有能力，其他平台是"兼容"还是"妥协"？
allowed-tools字段是"实验性的"，不同平台的支持程度不同
渐进式加载是理想设计，但平台实际实现时是否会偷工减料？

Barry Zhang（社区贡献者）有句话："Claude能写下的任何东西，最终都会变成一个skill。"这句话既描述了生态的自然演化，也暗示了平台锁定风险。

3.3 安全审查的真空

Skills可以包含scripts/目录——可执行代码。这意味着：

安装一个skill等于运行未知来源的代码
SKILL.md中的指令可能诱导Agent执行危险操作
allowed-tools字段是"实验性"的，没有强制执行机制

MCP的安全问题已经被广泛讨论（2025-2026年多起RCE漏洞）。Skills继承了同样的风险：Agent被恶意skill诱导执行危险操作。

Skill Vetter（社区skill）尝试解决这个问题，但谁审查Skill Vetter？递归信任问题没有答案。

3.4 渐进式加载的理想与现实

规范说"metadata只消耗30-50 tokens"。但实际操作中：

50个skill的metadata是1500-2500 tokens。如果你装了500个skill呢？
description字段最多1024字符。平台真的会严格遵守"只加载name+description"吗？
references/按需加载是个好设计，但如果skill作者把所有内容都塞进SKILL.md（而不是分到references/），渐进式加载就失效了

CMU+Bosch的研究发现中位数skill是1414 tokens。这个长度在单任务场景下合理，但在多skill协作场景下，累积消耗仍然可观。

3.5 生态碎片化：多个"skill商店"

目前至少有三个skill分发渠道：

skills.sh（skills.sh）
SkillHub.cn（skillhub.cn）
GitHub直接安装（npx skills add ）

它们之间的skill是否完全兼容？命名空间是否冲突？安装机制是否一致？

规范是统一的（agentskills.io），但生态是碎片化的。这和早期的npm vs yarn vs pnpm之争类似——标准统一了格式，但分发渠道的竞争仍在继续。

---

四、结语：从"写Prompt"到"写Skill"

Agent Skills的极简设计（两个必填字段）是它的最大优势，也是它的最大限制。

优势：任何人都能在几分钟内创建一个skill。没有编译，没有部署，没有依赖管理。一个Markdown文件，一个git仓库，完成。

限制：极简意味着约束少，约束少意味着质量参差不齐。一个好的skill和一个糟糕的skill，在格式上看起来一模一样。区分它们只能靠社区评价（stars、installs、reviews）——但社区评价需要时间积累，新skill在初期处于劣势。

更深层的意义：Skills代表了AI交互范式的又一次转移。

2023：写Prompt（每次对话重新解释）
2024：系统提示（一次写入，每次加载）
2025：RAG+MCP（连接外部知识+工具）
2026：Skills（模块化、可复用、按需加载的任务知识）

每一次转移都在做同一件事：减少重复劳动，让Agent记住更多、加载更少、执行更准。

两个字段，十四万星。这不是一个技术奇迹——技术本身很简单。这是一个生态奇迹：一个极简的共识，让数百个skill、数十个平台、数万开发者走到了同一张桌子上。

下一步的问题是：这张桌子能坐多久？当OpenAI、Google、Microsoft都有自己的"skill生态"时，agentskills.io的统一规范还能维持吗？

或者， Skills的极简性本身就是答案——它简单到任何平台都无法拒绝兼容。就像Markdown、JSON、HTTP——简单的东西活得最长。

---

核心参考文献

1. Anthropic (2025). Agent Skills Specification. *agentskills.io*. https://agentskills.io/specification 2. Anthropic Skills Repository. *GitHub: anthropic/skills*. https://github.com/anthropics/skills 3. Firecrawl Blog (2026-04-27). How SKILL.md Files Work and Why They're Everywhere. https://www.firecrawl.dev/blog/agent-skills 4. Strapi Blog (2026-02-10). What Are Agent Skills and How To Use Them. https://strapi.io/blog/what-are-agent-skills-and-how-to-use-them 5. CMU + Bosch Research (2026). Skill Optimization as Bi-Level Optimization (arXiv:2604.15709). https://arxiv.org/abs/2604.15709

---

#AI技能 #Anthropic #AgentSkills #MCP #渐进式加载 #开放标准 #小凯