最近在 GitHub 上发现了一个有趣的项目:xiaotianfotos/skills,其中的 Tutor Skill 展示了一种全新的 AI 应用思路。
这个项目来自 B 站/YouTube UP 主"小天fotos",他用 Qwen3.5 做了一个 Tutor Skill,实现了一键将数学题转换为讲解视频。
但这篇文章想聊的不仅是这个 Skill 本身,而是它背后的方法论。
简单来说,Tutor Skill 是一个自动化的教学视频生成工具。
输入: 一道数学题(文字或图片)
输出: 完整的讲解视频,包括:
Tutor Skill 采用了清晰的分层架构:
输入层 → 理解层 → 规划层 → 生成层 → 输出层
| 层级 | 功能 | 技术 |
|---|---|---|
| 输入层 | 接收题目 | OCR / 文本解析 |
| 理解层 | 理解题意、识别知识点 | Qwen3.5 推理 |
| 规划层 | 设计讲解步骤 | 提示词工程 |
| 生成层 | 生成动画、语音 | 多模态模型 |
| 输出层 | 合成视频 | 视频渲染 |
Tutor Skill 的关键不在于技术堆砌,而在于教学思维的编码。
它不是简单地"算出答案",而是模拟一个好老师的思考过程:
小天fotos 在视频中分享的不仅是 Tutor Skill,更是一套可复用的 Skill 开发方法论。
不要从技术出发,而是从真实问题出发。
Tutor Skill 的起点是:"学生看文字解析总是看不懂,如果能有一个自动生成的视频讲解就好了。"
将复杂任务分解为可管理的层次:
在 Skill 开发中,提示词就是核心代码。
好的提示词需要:
每个 Skill 都需要验证机制:
Tutor Skill 使用 Qwen3.5 的多模态能力:
不是一次性生成整个视频,而是分步生成:
数学讲解的关键在于可视化。
Tutor Skill 可能使用了:
Tutor Skill 的方法论不仅适用于数学,还可以扩展到:
| 领域 | 应用 |
|---|---|
| 物理 | 力学问题可视化讲解 |
| 化学 | 分子结构 3D 展示 |
| 编程 | 算法执行过程动画 |
| 语言 | 语法解析和例句展示 |
| 音乐 | 乐理知识可视化 |
核心思路是:将抽象知识转化为多模态的、易于理解的形式。
传统的软件应用是"功能导向"的,而 Skill 是"能力导向"的。
在 AI 时代,写好提示词比写好代码更重要。
好的提示词工程师需要:
纯文本的 AI 应用已经不够了。
未来的 AI 应用需要:
受 Tutor Skill 启发,如果你想开发自己的 Skill:
Tutor Skill 展示了一个趋势:AI 正在从"工具"变成"协作者"。
不是简单地帮我们计算答案,而是帮助我们理解、学习和创造。
这种转变需要新的开发方法论——Skill 开发。
而 xiaotianfotos 的分享,为我们提供了一个很好的起点。
你有没有想过用 AI 做一个类似的 Skill?或者你已经尝试过 Skill 开发?欢迎在评论区分享你的想法和经验。
还没有人回复