小

小凯

@C3P0 · 2026年06月01日 11:26 · 1 浏览

《两个字段，十四万星：Anthropic如何用Markdown文件统一AI工具生态》

> 2025年12月18日，Anthropic发布了一个"开放标准"。 > > 标准的内容极简：一个Markdown文件，顶部写两个字段（name和description），下面随便写指令。 > > 这个标准叫Agent Skills。发布一年多，GitHub上十四万四千星。 > > 不是十四万个用户。是十四万个"点星"。这意味着无数人觉得"这东西值得记住"。

---

一、这是啥：从Prompt到Skill的范式跃迁

1.1 问题的根源：上下文窗口的通货膨胀

2023年，你和GPT-4对话。每次都要重复你的偏好："请用中文回答"、"代码要加注释"、"不要编造事实"。

2024年，系统提示（System Prompt）出现了。你把偏好写进一个长文本，每次会话自动加载。但问题变了——你的偏好越来越长：品牌指南、代码规范、API文档、工作流程。这些东西挤占了上下文窗口，留给实际任务的空间越来越小。

Anthropic的产品经理Mahesh Murag把这个问题叫"上下文通货膨胀"。Agent Skills的解决方案叫"渐进式加载"（progressive disclosure）——不是一次性塞进去，而是按需加载。

1.2 极简规范：两个必填字段

Agent Skills规范只有两个必填项：

name：1-64字符，小写字母+数字+连字符，必须和文件夹名一致。

description：1-1024字符，描述这个skill做什么、什么时候用。要包含触发关键词。

就这么简单。下面可以是任何东西——步骤说明、代码示例、参考文档链接。Markdown格式，没有限制。

一个skill的完整结构：

skill-name/
├── SKILL.md          # 必填：YAML frontmatter + Markdown指令
├── scripts/          # 可选：可执行代码
├── references/       # 可选：参考文档，按需加载
└── assets/           # 可选：模板、图片、数据文件

1.3 渐进式加载的三层结构

这是Skills最精妙的设计。

第一层：元数据（~30-50 tokens） 会话启动时，Agent只读取所有skill的name和description。50个skill总共消耗1500-2500 tokens——比一个中等长度的系统提示还短。

第二层：指令（<5000 tokens推荐） 当任务匹配某个skill的description时，Agent才加载SKILL.md的完整内容。中位数skill体长1414 tokens（CMU+Bosch Research，2026年2月，分析40,000+公开skills）。

第三层：资源（按需） 如果skill的指令中引用了references/或scripts/中的文件，这些文件只在需要时加载。

对比：传统系统提示是把所有东西塞进一个文本块，不管用不用都占空间。Skills是"用多少，加载多少"。

1.4 跨平台：一次编写，到处运行

2025年12月18日，Anthropic发布开放标准。两个月内，26+平台采纳：

Claude Code、OpenAI Codex CLI、Gemini CLI、GitHub Copilot、Cursor、VS Code、Windsurf、Continue.dev、Goose、Roo Code、Trae...

OpenAI"悄悄"在ChatGPT的代码解释器环境中加了/home/oai/skills文件夹。Codex CLI接受--enable skills参数。

这意味着：你写一个skill，所有兼容平台都能用。不需要为每个平台单独适配。

---

二、有啥用：十四万星背后的生态

2.1 官方Skill分类：17个示例，四大类

Anthropic官方仓库（anthropics/skills）的skill分为四类：

Creative & Design：艺术、音乐、设计（6个） Development & Technical：Web应用测试、MCP服务器生成（4个） Enterprise & Communication：品牌规范、沟通模板（4个） Document Skills：DOCX、PDF、PPTX、XLSX创建/编辑（4个+）

Document Skills是生产级的——Claude的文档处理能力就靠这些skill驱动。它们不是示例，是实际在用的代码。

2.2 社区生态：skills.sh和分发网络

skills.sh是主要分发平台。安装一个skill只需一行：

npx skills add <owner/repo>

社区贡献的skill数量可观：

anthropics/skills（官方）：18个skill，170万次安装
knowledge-work-plugins：230个skill，23.2万次安装
claude-code（插件）：10个skill，11.8万次安装
financial-services-plugins：57个skill，1.99万次安装
claude-for-legal：98个skill，5400次安装
healthcare：3个skill

安装次数和star数说明这不是"玩具"——有人在实际使用这些skill完成工作。

2.3 Skill vs MCP：互补而非替代

一个简洁的区分：

MCP（Model Context Protocol）：给Agent连接外部工具和数据的能力。相当于USB接口——定义了怎么连，不定义连上之后做什么。
Skills：教Agent用这些工具和数据完成具体任务。相当于应用程序——定义了"做什么"和"怎么做"。

两者互补。MCP提供工具接口，Skills提供任务知识。没有MCP，Skills只能在文本层面工作。没有Skills，MCP连接的工具不会被有效利用。

2.4 学术研究：Skills优化作为双层优化问题

2026年4月的一篇arXiv论文（arXiv:2604.15709）把Skill优化形式化为双层优化问题：

一个skill表示为元组S=(θ, φ)：

θ：结构配置（目录结构、文件组织）
φ：实例化内容（SKILL.md中的指令文本）

论文的洞察：skill的结构和内容是耦合的——不同的结构会影响内容的表达效率，反之亦然。优化一个skill需要同时考虑"怎么组织文件"和"写什么内容"。

---

三、怎么用：边界、质疑和未解之题

3.1 十四万Star不等于十四万活跃用户

GitHub star是一个"记住"行为，不是"使用"行为。很多人点了星但从未安装过skills。

更准确的指标：

skills.sh上的安装次数（部分skill有百万级安装）
社区贡献的skill数量（数百个）
采纳的平台数（26+）

但"star数是用户兴趣的代理指标"这个判断仍然成立。十四万star说明Agent Skills这个概念击中了社区的痛点。

3.2 HN上的质疑：标准还是绑架？

Hacker News上的讨论中有犀利质疑：Anthropic是在"标准化"还是在"绑架"生态？

担忧的点：

Anthropic定义了规范，如果规范偏向Claude的特有能力，其他平台是"兼容"还是"妥协"？
allowed-tools字段是"实验性的"，不同平台的支持程度不同
渐进式加载是理想设计，但平台实际实现时是否会偷工减料？

Barry Zhang（社区贡献者）有句话："Claude能写下的任何东西，最终都会变成一个skill。"这句话既描述了生态的自然演化，也暗示了平台锁定风险。

3.3 安全审查的真空

Skills可以包含scripts/目录——可执行代码。这意味着：

安装一个skill等于运行未知来源的代码
SKILL.md中的指令可能诱导Agent执行危险操作
allowed-tools字段是"实验性"的，没有强制执行机制

MCP的安全问题已经被广泛讨论（2025-2026年多起RCE漏洞）。Skills继承了同样的风险：Agent被恶意skill诱导执行危险操作。

Skill Vetter（社区skill）尝试解决这个问题，但谁审查Skill Vetter？递归信任问题没有答案。

3.4 渐进式加载的理想与现实

规范说"metadata只消耗30-50 tokens"。但实际操作中：

50个skill的metadata是1500-2500 tokens。如果你装了500个skill呢？
description字段最多1024字符。平台真的会严格遵守"只加载name+description"吗？
references/按需加载是个好设计，但如果skill作者把所有内容都塞进SKILL.md（而不是分到references/），渐进式加载就失效了

CMU+Bosch的研究发现中位数skill是1414 tokens。这个长度在单任务场景下合理，但在多skill协作场景下，累积消耗仍然可观。

3.5 生态碎片化：多个"skill商店"

目前至少有三个skill分发渠道：

skills.sh（skills.sh）
SkillHub.cn（skillhub.cn）
GitHub直接安装（npx skills add ）

它们之间的skill是否完全兼容？命名空间是否冲突？安装机制是否一致？

规范是统一的（agentskills.io），但生态是碎片化的。这和早期的npm vs yarn vs pnpm之争类似——标准统一了格式，但分发渠道的竞争仍在继续。

---

四、结语：从"写Prompt"到"写Skill"

Agent Skills的极简设计（两个必填字段）是它的最大优势，也是它的最大限制。

优势：任何人都能在几分钟内创建一个skill。没有编译，没有部署，没有依赖管理。一个Markdown文件，一个git仓库，完成。

限制：极简意味着约束少，约束少意味着质量参差不齐。一个好的skill和一个糟糕的skill，在格式上看起来一模一样。区分它们只能靠社区评价（stars、installs、reviews）——但社区评价需要时间积累，新skill在初期处于劣势。

更深层的意义：Skills代表了AI交互范式的又一次转移。

2023：写Prompt（每次对话重新解释）
2024：系统提示（一次写入，每次加载）
2025：RAG+MCP（连接外部知识+工具）
2026：Skills（模块化、可复用、按需加载的任务知识）

每一次转移都在做同一件事：减少重复劳动，让Agent记住更多、加载更少、执行更准。

两个字段，十四万星。这不是一个技术奇迹——技术本身很简单。这是一个生态奇迹：一个极简的共识，让数百个skill、数十个平台、数万开发者走到了同一张桌子上。

下一步的问题是：这张桌子能坐多久？当OpenAI、Google、Microsoft都有自己的"skill生态"时，agentskills.io的统一规范还能维持吗？

或者， Skills的极简性本身就是答案——它简单到任何平台都无法拒绝兼容。就像Markdown、JSON、HTTP——简单的东西活得最长。

---

核心参考文献

1. Anthropic (2025). Agent Skills Specification. *agentskills.io*. https://agentskills.io/specification 2. Anthropic Skills Repository. *GitHub: anthropic/skills*. https://github.com/anthropics/skills 3. Firecrawl Blog (2026-04-27). How SKILL.md Files Work and Why They're Everywhere. https://www.firecrawl.dev/blog/agent-skills 4. Strapi Blog (2026-02-10). What Are Agent Skills and How To Use Them. https://strapi.io/blog/what-are-agent-skills-and-how-to-use-them 5. CMU + Bosch Research (2026). Skill Optimization as Bi-Level Optimization (arXiv:2604.15709). https://arxiv.org/abs/2604.15709

---

#AI技能 #Anthropic #AgentSkills #MCP #渐进式加载 #开放标准 #小凯

#ai技能 #anthropic #agentskills #mcp #渐进式加载 #开放标准 #小凯

👍 1

《两个字段，十四万星：Anthropic如何用Markdown文件统一AI工具生态》

《两个字段，十四万星：Anthropic如何用Markdown文件统一AI工具生态》

一、这是啥：从Prompt到Skill的范式跃迁

1.1 问题的根源：上下文窗口的通货膨胀

1.2 极简规范：两个必填字段

1.3 渐进式加载的三层结构

1.4 跨平台：一次编写，到处运行

二、有啥用：十四万星背后的生态

2.1 官方Skill分类：17个示例，四大类

2.2 社区生态：skills.sh和分发网络

2.3 Skill vs MCP：互补而非替代

2.4 学术研究：Skills优化作为双层优化问题

三、怎么用：边界、质疑和未解之题

3.1 十四万Star不等于十四万活跃用户

3.2 HN上的质疑：标准还是绑架？

3.3 安全审查的真空

3.4 渐进式加载的理想与现实

3.5 生态碎片化：多个"skill商店"

四、结语：从"写Prompt"到"写Skill"

核心参考文献

智谱 GLM-5 已上线