TeachAny：把学习科学封装成 AI 教学系统的开源实践

> GitHub: weponusa/teachany | 137+ 课件 | 2,378 知识节点 | AGPL-3.0 + 商业双授权 > > 定位：每个学校、每个教师、每个家长，都能零成本定制属于每个孩子的可汗学院

---

一、AI 生成教育内容的通病

用 ChatGPT 或 Claude 生成教学材料，输出通常长这样：

📝 关于二次函数的 5 个要点……
📋 测验：y = x² + 2x + 1 的顶点是什么？
   A) (1, 0)   B) (-1, 0)   C) (0, 1)   D) (-1, 1)

扁平、无生命、没有教学设计。学生拿到一堵文字墙，末尾贴一道选择题。没有动机设计，没有错误诊断，没有学习闭环。

问题的根源不是 LLM 不够聪明，而是提示工程缺乏教育学框架。大多数教育类 prompt 只是把"生成教案"当成信息整理任务，忽略了学习科学已经研究了几十年的结论：人是怎么学会的。

TeachAny 的解法不是更复杂的 prompt，而是把教育学理论直接写进 AI 的工作流。

---

二、六大学习科学理论的系统嵌入

TeachAny 不是让 AI"参考"这些理论，而是把它们变成了强制执行的规则。

2.1 ABT 叙事结构（And-But-Therefore）

每个模块开篇遵循 ABT 叙事：

And：你已知道什么（建立关联）
But：矛盾点或认知缺口（制造张力）
Therefore：为什么要学这个（赋予意义）

这比"今天我们学习二次函数"有效得多。ABT 来自 Randy Olson 的《Houston, We Have a Narrative》，最初用于科学传播，TeachAny 把它改造成了课件的开场模板。

2.2 Bloom 认知分类法

练习必须覆盖全部 6 个认知层级：

层级	动词示例	题型设计
记忆	回忆、识别	概念卡片
理解	解释、分类	填空题
应用	执行、实施	计算题
分析	区分、归因	过程拆解
评价	判断、检验	论证题
创造	生成、计划	设计任务

普通 AI 生成的题目通常停留在"记忆→理解"两层。TeachAny 的设计系统强制要求至少覆盖 3 个层级。

2.3 ConcepTest（Mazur 同伴教学法）

概念检测题的设计目标是 30-70% 正确率——这是 Eric Mazur 在哈佛大学物理教学中验证过的"甜蜜点"。正确率太高说明题目太简单，没有讨论价值；太低则挫败感过强。TeachAny 的评估系统会检查题目难度是否落在这个区间。

2.4 认知负荷理论（Sweller）

三张硬约束：

每张信息卡片 ≤ 75 字
每个模块只承载 1 个核心问题
新概念出现 → 立即配例子

这是 John Sweller 认知负荷理论的直接应用。工作记忆容量有限，信息过载会让学习效果断崖式下跌。

2.5 Mayer 多媒体学习原则

七个原则被强制应用于每一个版面决策：

邻近性原则：图文相邻，而非分离
信号原则：用视觉标记突出关键信息
分割原则：复杂内容分步呈现
预训练原则：先教组件，再讲整体
等等

Richard Mayer 的研究表明，遵守这些原则的多媒体材料能让学习效果提升 50-100%。TeachAny 把它从"建议"变成了"规范"。

2.6 脚手架策略

三级支架系统：

Level 1：提供完整模板，学生填空
Level 2：只给提示，学生自行推导
Level 3：完全独立工作

学生从 Level 1 起步，逐渐撤除支持。这是 Wood、Bruner 和 Ross 1976 年提出的经典 tutoring 模型，TeachAny 把它变成了课件内部的自适应机制。

---

三、九学科专属框架：不做一刀切

TeachAny 最务实的决策是拒绝通用模板。9 个学科各有专属的教学路径：

学科	教学路径	交互类型	评估风格
数学	直观可视化 → 代数推理 → 推广	作图、拖拽、逐步推导	标准题 + 解释题
物理	观察 → 建模 → 定量分析	参数滑块、实验预测	预测 + 计算 + 解释
生物	结构 → 过程 → 功能	标注、排序、流程图	图解 + 过程解释
地理	空间分布 → 成因 → 区域比较	地图交互、因果链	材料分析 + 比较
历史	时间线 → 因果 → 证据 → 多视角	排序、史料对比、立场分析	史料题 + 论述
语文	细读 → 表达技法 → 主题迁移	批注、改写、仿写	批注 + 写作 + 评分量规
英语	输入 → 支架输出 → 情境应用	对话卡片、填空、角色扮演	综合技能评估
化学	宏观现象 → 微观解释 → 符号表征	实验流程、方程式配平	实验解释 + 结构化应答
信息技术	任务驱动 → 分步演示 → 调试	点击操作、流程图、代码执行	任务完成 + 过程检查

这个矩阵的价值在于：当教师说"做一个物理课件"时，AI 知道该用参数滑块而不是填空题；说"做历史课件"时，AI 会自动引入史料对比和多视角分析。

---

四、原创方法论

4.1 五镜头法（Five-Lens Method）

对任何难点概念，强制选择 2-3 个镜头：

👁️ See It      → 观察现象、例子、数据
🔧 Break It    → 拆解结构、步骤、组件
💡 Explain It  → 澄清成因、机制、规则
⚖️ Compare It  → 与相似/相反/错误案例对比
🎯 Transfer It → 迁移到新情境验证理解

这是 TeachAny 原创的方法论，用来解决"一个概念讲不清楚"的问题。多镜头切换能覆盖不同认知风格的学习者。

4.2 六问预设计框架

写代码之前，必须回答：

1. 学生是谁？（决定难度和语言） 2. 前置知识是什么？（决定是否需要诊断测试） 3. 学生应该能做什么？（把"知道"转化为可观察的任务） 4. 真实世界情境是什么？（提供学习动机） 5. 学生通常卡在哪里？（驱动错误诊断设计） 6. 如何验证学会了？（决定评估策略）

这六个问题被嵌入 skill 的 prompt 系统，AI 不会直接生成课件，而是先回答这六问，再进入设计阶段。

4.3 PBL 项目分解引擎

输入一个项目描述（如"设计智能温室"、"制作天气 App"），输出完整的知识网络：

自动识别项目涉及的知识点
映射到课程标准（中国课标 / AP / Cambridge / IB / CCSS）
生成学习路径：先学什么、后学什么、跨哪些学科

核心主张：PBL 不是学科学习的补充，而是教学的主体载体。从真实项目倒推知识需求，比从课本正序讲授更符合建构主义。

---

五、技术实现：零依赖单文件 HTML

TeachAny 课件全部是单文件 HTML，没有构建步骤，没有 npm 依赖，没有框架。浏览器直接打开即可运行。

这个选择很有深意：

1. 降低使用门槛：教师不需要会编程，不需要装 Node.js 2. 离线可用：下载一个 HTML 文件，没网也能上课 3. 跨平台：Windows、Mac、Chromebook、甚至老旧平板都能跑 4. 易修改：右键查看源代码，改文字、换图片、调颜色

交互实现用原生 Canvas API、SVG、和少量 Vanilla JS。光合作用课件里有 Canvas 动画、拖拽方程式配平、TTS 朗读；欧姆定律课件里有虚拟电路实验室、V-I 图像实时绘制。

---

六、知识层与课程标准的对齐

TeachAny 的 data/ 目录包含：

5 种课程标准：中国课标（小/初/高）、AP、Cambridge IGCSE/A-Level、IB MYP/DP、US CCSS + NGSS
48 个学科 × 5 体系 = 98 个知识图谱（JSON 格式）
2,399 个知识点详情文件：包含课程标准对应关系、难度分级、关联资源
地理/历史地图素材：Leaflet 地图、朝代叠加图

这意味着教师输入"八年级数学二次函数"，AI 能自动定位到中国课标的对应知识点，获取先修知识链（一次函数 → 二次函数 → 抛物线），并匹配错误数据库（常见错因：符号错误、顶点公式混淆）。

---

七、商业模式：AGPL-3.0 + 商业授权

TeachAny 采用双授权：

AGPL-3.0：个人学习、公立学校、非营利教育、开源 fork 免费使用
商业授权：SaaS、付费课程、企业培训需要购买商业许可

这个模型在教育开源项目中不常见。作者 weponusa 同时注册了 TeachAny™ 和 教我学™ 商标（未注册但主张在先使用权），并要求 fork 必须改名。

商业授权的联系邮箱是 weponusa@gmail.com，邮件标题需前缀 [TeachAny Commercial] 或 [TeachAny Trademark]。

---

八、局限与追问

第一，课件质量的一致性。

137 个课件中 12 个官方 + 124 个社区。社区课件的质量取决于贡献者的教学经验和 AI 提示工程能力。官方示范课件（如光合作用、欧姆定律）质量很高，但社区课件可能参差不齐。目前没有 peer review 机制来保证教育学的严谨性。

第二，中国课标的覆盖深度。

README 提到覆盖中国课标，但 2,399 个知识点相对于中国 K-12 全部内容来说仍是子集。特别是地方课程（如浙江的"拓展性课程"、上海的"探究型课程"）是否被纳入？

第三，AI Skill 的模型依赖。

TeachAny 推荐 CodeBuddy，但也能在 Claude、Cursor、Windsurf 中使用。不同模型的指令遵循能力差异很大——Claude 3.5 Sonnet 能严格遵守 SKILL.md 的约束，GPT-3.5 可能会忽略脚手架策略。模型能力的下限决定了课件质量的下限。

第四，单文件 HTML 的天花板。

零依赖是优势，但也是限制。复杂仿真（如 PhET 级别的物理实验）用原生 Canvas 实现成本很高。当课件需要 3D 可视化、实时协作、学习数据追踪时，单文件架构会遇到瓶颈。

第五，评估的有效性验证。

TeachAny 声称遵循 6+ 学习科学理论，但这些原则是否真能提高学习效果？ABT 叙事是否比传统开场更有效？30-70% 正确率的 ConcepTest 是否适用于所有文化背景？论文中没有提供对照实验数据——这是一个需要被验证的声明，而非已被验证的结论。

---

九、结语

TeachAny 的价值不在于"用 AI 做课件"——这个能力很多工具都有。它的独特之处在于：把学习科学从"参考资料"变成了"强制执行的生产规范"。

ABT 叙事、Bloom 分类、认知负荷、脚手架——这些理论在教育学教材里躺了几十年，大多数教师知道它们存在，但不知道如何在每节课里落地。TeachAny 做的事情是把这些理论编码成 AI 能理解的规则，让每份自动生成的课件都经过教学设计的校验。

对于中国教师来说，这套系统的另一层价值是课程标准对齐。输入"初三物理欧姆定律"，AI 不仅能生成课件，还能告诉你这个知识点在中国课标中的位置、先修知识、常见错误、以及与 AP/Cambridge 的对应关系。

如果你是一位教师，厌倦了把 AI 当成"高级搜索引擎"来生成教案，TeachAny 提供的是一个更严肃的替代方案：让 AI 成为一名受过学习科学训练的助教。

---

参考

GitHub: https://github.com/weponusa/teachany
在线画廊: https://weponusa.github.io/teachany/
中国镜像 (Gitee): https://gitee.com/weponusa/teachany
Olson, R. (2015). *Houston, We Have a Narrative*. University of Chicago Press.
Sweller, J. (1988). Cognitive load during problem solving. *Cognitive Science*, 12(2), 257-285.
Mayer, R.E. (2009). *Multimedia Learning* (2nd ed.). Cambridge University Press.
Mazur, E. (1997). *Peer Instruction: A User's Manual*. Prentice Hall.
Wood, D., Bruner, J.S., & Ross, G. (1976). The role of tutoring in problem solving. *Journal of Child Psychology and Psychiatry*, 17(2), 89-100.

#TeachAny #AI教育 #K12 #学习科学 #教学设计 #开源