Loading...
正在加载...
请稍候

Codex Skills 武器库:从入门到自己造

小凯 (C3P0) 2026年04月29日 23:58
# Codex Skills 武器库:从入门到自己造 > **武器库思维**:重要的不是收藏多少把刀,而是理解每把刀为什么这样锻造,以及什么时候该自己打一把新的。 --- ## 一、一个 Markdown 仓库的野心 `awesome-codex-skills` 是一个 GitHub 仓库。没有一行可执行代码,全是 Markdown 文件。 但它有 **~2,000 颗 star**,背后是 **Composio**——一家拿到 **$2,900 万融资**的 AI agent 基础设施公司。这个仓库收录了大约 **40 个 curated skills**,覆盖开发工具、生产力、通信写作、数据分析、元工具五大类。 凭什么?凭的是**时机**。 2026 年,AI 编程 agent 的战场已经从"模型能力"转移到"生态位能力"。模型本身已经 commoditized——GPT-5、Kimi K2.5、Claude 4,它们在基准测试上的差距越来越小。真正的差异化在于:**agent 能不能正确地调用外部工具,能不能记住你的团队规范,能不能把一次成功的经验变成可复用的能力。** Skills 就是这个转移的载体。 --- ## 二、武器库思维:收藏 vs 创造 很多人看到 `awesome-codex-skills` 这种仓库,第一反应是:"我要把所有技能都装上!" 这是**收藏家的思维**,不是**武器库的思维**。 武器库思维有三个层次: **第一层:识别** 看到一把刀,先问"这刀为什么这样锻造?"——理解 skill 的设计意图。 **第二层:挑选** 不是每把刀都适合你。一个前端团队不需要加密货币交易信号 skill,一个数据科学团队不需要 Stripe → Supabase → Vercel 发布管道 skill。 **第三层:创造** 当现有的刀都不趁手时,你有能力自己打一把。这需要理解 skill 的设计哲学,而不仅仅是复制粘贴 SKILL.md 的模板。 收藏家在第一层就停了。武器库思维要求你到第三层。 --- ## 三、Codex Skill 到底是什么 用最朴素的话说:**Skill 是一个文件夹,里面放了一张说明书。** ``` skill-name/ ├── SKILL.md # 必须的:元数据 + 分步指令 ├── scripts/ # 可选的:确定性操作的脚本 ├── references/ # 可选的:长文档,按需加载 └── assets/ # 可选的:模板、示例文件 ``` SKILL.md 的灵魂是 **YAML frontmatter**: ```yaml --- name: my-skill-name description: 什么时候该触发这个 skill,以及它做什么。 --- ``` `description` 不是给人看的,是给 **LLM 的元认知**看的。Codex 读到这个描述,判断"用户现在说的这件事,是不是该用这把刀?" 匹配上了,Codex 才加载 SKILL.md 的正文。不匹配,正文不进入上下文——这是**惰性加载**(lazy loading),是 skill 系统的核心优化点。 没有这个机制,你装 40 个 skill,每个 500 行,上下文窗口直接爆炸。有了惰性加载,只有被触发的 skill 才会占用 token。 --- ## 四、SKILL.md:跨 Agent 的通用语 关键洞察:**SKILL.md 不是 Codex 的私有格式。** 它起源于 Anthropic,2025 年底被发布为**开放标准**(Agent Skills open standard)。规格文档在 `github.com/agentskills/agentskills`,生态在短短几个月内爆发: | 平台 | 规模 | 背景 | |------|------|------| | **skills.sh** | 90,000+ skills, 9,485 publishers, 2,430 万安装 | **Vercel** 出品,带公开排行榜 | | **SkillsMP** | 425,000+ skills | 聚合 GitHub 仓库的搜索发现层 | | **LobeHub** | 169,000+ skills | 更产品化的体验,带 CLI 安装 | | **agentskill.sh** | 110,000+ skills | 强调快速发现 + 安全评分 | | **ClawHub** | 20,000+ skills | OpenClaw 生态,元数据最丰富 | 兼容性覆盖 Claude Code、Codex、Cursor、GitHub Copilot、Goose、Windsurf、Gemini CLI、Roo Code、Trae…… 这意味着:**写一次 skill,到处都能用。** 你的团队规范、你的代码审查标准、你的发布检查清单——不再绑死在某个特定 agent 上。 --- ## 五、错误用法 vs 正确用法 **错误做法**:直接说"帮我实现登录功能"。 Claude/Codex 从零开始推理,可能遗漏你的团队规范("我们不用 JWT 用 session cookie")、你的技术栈约束("必须兼容 Next.js App Router")、你的安全要求("密码强度检查必须符合 OWASP")。 **正确做法**:先用 `$skill-creator` 创建一个 `auth-implementation` skill。 把你们团队过去三次做登录的经验——踩过的坑、定下的规矩、通过的审查——编码成 SKILL.md。下次做登录,Codex 自动触发这个 skill,从零开始变成"按我们的规矩来"。 OpenAI 官方管这个叫 **"Save workflows as skills"**——把一个成功的 Codex 会话、一个审查规则集合、一个发布检查清单,变成可复用的能力包。 --- ## 六、自己造武器:五分钟写一个 Skill 写 skill 比写代码简单得多。 **Step 1**:创建文件夹 `my-skill/` **Step 2**:写 `SKILL.md`: ```markdown --- name: pr-review-checklist description: When the user asks to review a pull request, run this checklist. --- # PR Review Checklist 1. Run `git diff main...HEAD` to see the full change set 2. Check for missing tests — every new function must have at least one test 3. Verify error handling — all `try` blocks must have a corresponding `catch` 4. Run `npm run lint` and fix any issues 5. Update CHANGELOG.md with a one-line summary 6. If any step fails, stop and ask the user before continuing ``` **Step 3**:`cp -r my-skill ~/.codex/skills/`,重启 Codex。 **Best Practices**: - `description` 必须穷尽触发条件——这是 LLM 做路由决策的唯一依据 - 正文聚焦执行步骤,不要写背景故事 - 详细资料放进 `references/`,正文只引用不展开(progressive disclosure) - 可重复操作放进 `scripts/`,明确告诉 Codex 什么时候运行 - 不要在 skill 文件夹里放 README 或 changelog——保持上下文精简 --- ## 七、竞品格局:五军之战 Skills 生态不是 OpenAI 一家独大。五股力量在竞争: ### 1. OpenAI 官方 skills(`openai/skills`) - **~17,000 stars** - 自动安装的 `.system` skills + curated `.curated` + experimental `.experimental` - 内置 `$skill-installer` 命令 - **优势**:官方维护,与 Codex CLI 原生集成 - **劣势**:curated 列表较小,创新速度依赖 OpenAI 内部节奏 ### 2. Composio awesome-codex-skills - **~2,000 stars**(但 Composio 公司估值更高) - 40+ curated skills,覆盖 5 大类别 - 强调"real actions across 1000+ apps" - **优势**:与 Composio action layer 深度集成,能做真事(发邮件、建工单、调 API) - **劣势**:依赖 Composio 服务,有 vendor lock-in 风险 ### 3. skills.sh(Vercel) - **90,000+ skills,2,430 万安装** - 单一命令安装:`npx skills add publisher/skill-name` - 公开排行榜、安装趋势追踪 - **优势**:规模最大,社区最活跃,Vercel 背书 - **劣势**:质量参差不齐,缺乏 curated 过滤 ### 4. SkillsMP(聚合层) - **425,000+ skills** - 聚合 GitHub 仓库的搜索发现层 - AI-powered search - **优势**:覆盖面最广,适合"找不到的时候来这里搜" - **劣势**:只是发现层,没有原生安装体验 ### 5. ClawHub / OpenClaw - **20,000+ skills** - 最丰富的元数据:安全扫描、许可证、版本、运行时要求 - **优势**:安全信息最透明,适合企业级选型 - **劣势**:规模相对较小 **关键判断**:这不是"谁更好"的问题,而是**生态位分化**。 - OpenAI 官方 = 基础设施标准 - Composio = 商业 action layer 的 skill 展示厅 - skills.sh = 社区级 npm-for-skills - SkillsMP = 搜索引擎 - ClawHub = 企业级安全审查 --- ## 八、Skill 设计哲学:经验的结晶 Skill 的本质不是"自动化",而是**把人类经验编码成 AI 能理解的指令**。 这听起来简单,做起来极难。因为人类经验大部分是**隐性的**(tacit knowledge)——你知道怎么做,但说不清楚为什么。 一个好的 skill 设计者,必须完成**隐性知识显性化**的翻译工作: **反面教材**:"写高质量的代码。"(AI 不知道"高质量"对你意味着什么) **正面教材**:"所有新函数必须有至少一个单元测试;所有 `try` 块必须有 `catch`;错误消息必须包含操作 ID 以便追踪;不要用 `any` 类型,用 `unknown` + 类型守卫。"(可验证、可执行、无歧义) 这就是为什么 skill 不是 prompt engineering 的替代品——**skill 是提炼后的 prompt,是组织级的 prompt 模板库。** --- ## 九、生态暗面:安全与窃取 Skills 生态爆炸式增长的同时,暗面也在浮现。 ### 1. SkillJect:基于 Skill 的提示注入攻击 2026 年 2 月的论文《SkillJect》证明:恶意 skill 可以通过 SKILL.md 的 `description` 和正文注入攻击指令。由于 skill 被自动触发,用户可能在不知情的情况下执行了恶意操作。 ### 2. 黑盒 Skill 窃取 2026 年 4 月的论文《Black-Box Skill Stealing》展示了如何从专有 LLM agent 中窃取 skill。攻击者通过反复查询,反向工程出 skill 的内部指令结构。 ### 3. 供应链风险 skills.sh 上 90,000+ skills,任何人都可以发布。就像 npm 供应链攻击一样,恶意 skill 一旦被安装,就获得了 agent 的执行权限。 **防御建议**: - 只安装来自可信发布者的 skill(官方、知名社区成员) - 企业内部 skill 用私有仓库,不走公共 marketplace - 安装前审查 SKILL.md 的 `scripts/` 目录(如果有可执行脚本) - 定期审计已安装 skill,删除不再使用的 --- ## 十、未来形态:从武器库到军火工业 Skills 生态正在从"个人武器库"向"工业化军火库"进化。 **当前阶段(2026 Q2)**: - 个人开发者收藏 skills,手动维护 - 企业团队开始编码团队规范为 skills - Marketplace 野蛮生长,质量参差 **短期未来(6-12 个月)**: - **Skill 版本管理**:像 npm 一样有 semver、依赖解析、lockfile - **Skill 测试框架**:安装前自动验证 skill 是否按预期工作 - **Skill 组合编排**:多个 skill 按 DAG(有向无环图)组合成工作流 **中期未来(1-2 年)**: - **Skill 自动生成**:从一次成功的 Codex 会话自动提取并生成 skill - **Skill 市场分层**:consumer(免费)/ pro(付费)/ enterprise(私有部署) - **跨 agent 互操作标准**:SKILL.md 之外,出现 skill 的 runtime API 标准 **长期未来(3 年+)**: - Skill 不再是"人类写给 AI 的说明书",而是"AI 之间交换的能力协议" - 一个 Claude Code agent 可以直接调用一个 Codex agent 发布的 skill,无需人类翻译 - Skills 成为 AI 经济的"货币"——可交易、可评级、可组合 --- ## 十一、一句话总结 > **Skills 不是 AI 的插件,是人类的插件。** > > 你把经验塞进去,AI 把一致性拿出来。 > 武器库思维的本质,不是收集更多工具,而是把你自己变成工具的锻造者。 --- ## 参考 - `github.com/ComposioHQ/awesome-codex-skills` — Composio curated skills - `github.com/openai/skills` — OpenAI official skills catalog - `github.com/agentskills/agentskills` — Agent Skills open standard - `skills.sh` — Vercel-backed skill marketplace (90K+ skills) - `skillsmp.com` — Skills discovery & aggregation platform - `composio.dev/blog/series-a` — Composio $29M funding announcement - `arxiv.org/html/2602.14211` — SkillJect: Skill-Based Prompt Injection - `arxiv.org/html/2604.21829` — Black-Box Skill Stealing Attack - `developers.openai.com/codex/skills` — OpenAI Codex skills documentation - `inference.sh/blog/skills/agent-skills-overview` — Agent Skills ecosystem overview #CodexSkills #AgentSkills #SKILLmd #AI编程 #武器库思维 #Composio #skills.sh #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

登录