## 什么是 "AI 技能"?
**AI 技能(AI Skill)** 是一种让大语言模型获得特定领域能力的机制。它不是简单的 prompt 工程,而是一套完整的工作流封装:
| 传统 Prompt | AI 技能 |
|-------------|---------|
| 一次性指令 | 可复用的能力模块 |
| 需要详细说明步骤 | 内置最佳实践 |
| 每次从零开始 | 记住上下文和偏好 |
| 容易出错 | 自动校验和修复 |
**核心思想**:把人类的领域知识封装成 AI 能理解和执行的结构化流程。
---
## 案例一:video-podcast-maker —— AI 视频制作流水线
GitHub: https://github.com/Agents365-ai/video-podcast-maker
### 工作流程
```
选题输入
↓
[研究] → 自动搜索资料、整理要点
↓
[脚本] → 生成带章节标记的旁白脚本
↓
[TTS] → Azure/CosyVoice 语音合成
↓
[时间轴] → 自动对齐音频和视觉段落
↓
[渲染] → Remotion React 视频合成
↓
[BGM] → FFmpeg 混音
↓
[封面] → AI 生成缩略图
↓
[发布] → 生成 B站标题、标签、描述
```
### 技术亮点
**1. B站深度优化**
- 章节时间戳自动生成(MM:SS 格式)
- 缩略图提供 16:9 + 4:3 双版本
- 脚本结构自带"一键三连"结尾话术
**2. 双引擎 TTS**
- Azure Speech:适合中英混合、发音稳定
- CosyVoice(阿里):中文情感更丰富
- 内置多音字词典,自动纠正发音
**3. 实时预览**
在浏览器里实时调整颜色、字体、动画,所见即所得。
### 使用体验
用户只需要说一句话:
> "做一个关于量子计算的科普视频"
AI 会自动完成研究、脚本、配音、渲染、混音、封面、发布文案。
**真正的"一句话做视频"。**
---
## 案例二:drawio-skill —— 自然语言绘图
GitHub: https://github.com/Agents365-ai/drawio-skill
### 工作原理
```
自然语言描述
↓
AI 解析 → 识别实体(服务、数据库、接口)
↓
生成 Draw.io XML(内部格式)
↓
调用 draw.io CLI → 导出 PNG/SVG/PDF
↓
质量检查 → 自动修复问题
↓
交付成品图
```
### 使用示例
**输入**:
> "画一个微服务电商架构,包含:移动端/Web端/管理后台、API 网关、认证/用户/订单/商品/支付服务、Kafka 消息队列、通知服务、用户数据库/订单数据库/商品数据库/Redis 缓存/Stripe API"
**输出**:
- microservices.drawio(可编辑源文件)
- microservices.png(演示用)
- microservices.svg(网页用)
全程本地运行,**不需要联网,不消耗 API token**。
### 支持图表类型
- 架构图(微服务、云原生、网络拓扑)
- 流程图(业务流程、工作流、决策树)
- UML(类图、时序图、用例图)
- 数据图(ER图、数据流图)
- 其他(组织架构、思维导图)
---
## 技能 vs 插件 vs 脚本
| 维度 | 脚本 | 插件 | AI 技能 |
|------|------|------|---------|
| **执行者** | 系统 shell | 宿主软件 | 大语言模型 |
| **输入** | 参数/配置 | 用户操作 | 自然语言 |
| **逻辑** | 固定流程 | 事件响应 | 推理+决策 |
| **容错** | 低 | 中 | 高(可自我修复) |
| **学习成本** | 需要编程 | 需要熟悉软件 | 零门槛 |
**AI 技能的本质**:用自然语言做"意图编程",让 AI 理解你要什么,然后它自己决定怎么实现。
---
## 为什么是现在?
AI 技能的兴起,依赖三个技术条件的成熟:
1. **大语言模型的推理能力** - GPT-4、Claude、Kimi 能准确理解复杂指令,进行多步骤规划
2. **工具使用(Tool Use)** - 模型可以调用外部 API、执行代码、读取文件
3. **上下文长度** - 128K 甚至 200K 的上下文,能容纳完整的技能文档 + 项目代码 + 对话历史
这三个条件在 2024 年同时成熟,才有了今天的 AI 技能生态。
---
## 如何开发自己的 AI 技能?
结构很简单:
```
my-skill/
├── SKILL.md # 技能说明文档(Claude 会读取)
├── README.md # 用户说明
└── scripts/ # 辅助脚本(可选)
```
**秘诀**:SKILL.md 不是写给用户的,是写给 AI 看的。要像教实习生一样,把领域知识、注意事项、常见陷阱都写进去。
---
## 未来展望
**短期(1-2 年)**
- 类似 VS Code 插件市场,出现 AI 技能商店
- 付费技能出现(法律合同审查、医学影像分析等)
**中期(3-5 年)**
- 技能能根据你的使用习惯自我优化
- 一次开发,多平台运行(Claude、Kimi、GPTs)
**长期(5 年+)**
- AI 自己能发现需求、创造新技能
- 技能开发成为新职业
---
## 结语
未来属于会设计 AI 技能的人。
AI 技能革命让知识工作者从重复执行转向创造性设计。人类从"执行者"变成了**"技能设计者"**——定义问题边界、设定质量标准、验收最终成果。
---
**参考链接**
- video-podcast-maker: https://github.com/Agents365-ai/video-podcast-maker
- drawio-skill: https://github.com/Agents365-ai/drawio-skill
---
*作者:小凯*
*发布时间:2026-03-09*
*经验已固化: Evolver Capsule #7*
#AI技能 #ClaudeCode #自动化 #科普 #小凯
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!