参考视角:从课堂设计的角度审视——它不是"把AI塞进MOOC",而是把整个课堂的社会动力学搬进数字空间。
一句话定位
OpenMAIC 是清华大学开源的多Agent互动课堂平台,核心理念是把"MOOC = 一个视频给N个学生"翻转成"MAIC = N个Agent服务1个学生"。上传一份PDF或描述一个话题,30分钟内、不到2美元,系统就能自动生成包含AI教师、AI助教、AI同学的完整互动课堂。
从"My课"到 OpenMAIC:时间线
| 时间 | 事件 |
|---|---|
| 2025.04 | MAIC(谐音"My课")作为"全AI守护课堂"上线国家智慧教育公共服务平台,首批覆盖AI、社会科学、学生成长三大板块 |
| 2026.03.16 | OpenMAIC 正式在 GitHub 开源(THU-MAIC/OpenMAIC),24小时内引发全球AI教育社区热议 |
| 2026.04.14 | v0.1.1:自动语言推断、ACCESS_CODE认证、课堂ZIP导入导出、Ollama本地模型支持 |
| 2026.04.20 | v0.2.0:Deep Interactive Mode —— 3D可视化、模拟实验、知识小游戏、思维导图、在线编程 |
| 2026.04.26 | v0.2.1:集成 VoxCPM2 TTS(语音克隆+自动生成声音)、DeepSeek-V4 / GPT-5.5 / GPT-Image-2 / 小米MiMo 等新模型 |
| 2026.05.11 | AMD 官方博客宣布与清华 OpenMAIC 团队合作,基于 ROCm 软件栈实现端云协同部署 |
GitHub 数据:17.9k stars,3.5k forks,TypeScript 98.3%,AGPL-3.0 许可证。
核心架构:三层 + 两阶段
三层架构
┌─────────────────────────────────────────┐
│ Frontend(Next.js App Router) │ ← 课堂播放页、生成输入页
├─────────────────────────────────────────┤
│ Core Engine │
│ ├── Generation Pipeline(内容生成) │ ← 两阶段管线
│ └── Orchestration(LangGraph编排) │ ← 多Agent状态机
├─────────────────────────────────────────┤
│ AI Service Provider Layer │ ← LLM / TTS / ASR / 图像 / 视频
│ (OpenAI、Anthropic、Gemini、DeepSeek、 │
│ Qwen、Kimi、MiniMax、Grok、Ollama…) │
└─────────────────────────────────────────┘
生成管线:两阶段
| 阶段 | 动作 | 输出 |
|---|---|---|
| Stage 1: Outline | AI深度分析输入文档或话题,识别学习目标,拆分为逻辑场景 | 结构化课程大纲 |
| Stage 2: Scenes | 每个大纲条目变身为丰富场景:幻灯片、测验、交互模拟、PBL活动 | 完整多媒体课件 |
Agent 角色设计:一个真实课堂的完整映射
OpenMAIC 不是"一个聊天机器人回答问题",而是用 LangGraph 状态机构建了一个完整的虚拟课堂社会系统:
| Agent | 角色 | 核心能力 |
|---|---|---|
| Lesson Planner | 课程规划师 | 分析文档、生成大纲、设计学习路径 |
| Content Generator | 内容生成器 | 产出幻灯片、测验题、交互模拟、语音脚本 |
| AI Teacher | 授课教师 | 系统讲解、类比举例、引导讨论、白板绘图、语音授课 |
| AI Teaching Assistant | 助教 | 补充解释、管理测验、识别掉队学生、实时反馈 |
| AI Classmates | 同学(4种原型) | 主动提问、参与讨论、圆桌辩论、提供不同视角 |
| Director Agent | 课堂导演 | 决定谁发言、何时转换环节、控制课堂节奏 |
28+ 动作类型:speak、draw、quiz、highlight、point、search、spotlight、laser pointer……
四种课堂模式:
- 课堂讨论:Agent主动发起话题,同学提问分享,学生可随时加入
- 圆桌辩论:多个Agent持不同观点展开论证
- 协作问答:教师用幻灯片/白板回答,同学补充要点
- 白板互动:Agent在共享白板上实时画图、写公式、解方程
Deep Interactive Mode:不只是"看课"
v0.2.0 引入的 Deep Interactive Mode 是区分于普通AI课件生成工具的关键分水岭——学生不再被动观看,而是动手操作:
| 交互类型 | 说明 |
|---|---|
| 🌐 3D可视化 | 抽象结构的三维呈现 |
| ⚙️ 模拟实验 | 调整参数观察动态变化和结果 |
| 🎮 知识小游戏 | 通过互动挑战巩固理解 |
| 🧭 思维导图 | 结构化知识组织,建立概念框架 |
| 💻 在线编程 | 浏览器内写代码、即时执行验证 |
AI 教师还能主动操作UI——高亮关键区域、设置条件、提供提示,在正确的时间引导学生注意力。
端云协同:AMD + ROCm 的技术落地
2026年5月,AMD 官方宣布与 OpenMAIC 团队合作,提供了一个教科书级的AI工作负载拆分范例:
| 层级 | 硬件 | 任务 | 优势 |
|---|---|---|---|
| 云端 | AMD Instinct GPU + ROCm | 课程生成(重计算、低实时性要求) | 前沿模型能力、高吞吐量 |
| 边缘 | AMD Ryzen AI PC(GPU+NPU+统一内存) | 实时多Agent对话、语音识别、课堂互动 | 低延迟、隐私保护、离线可用 |
Lemonade 本地服务器作为 OpenAI-compatible provider,负责边缘侧的 LLM、图像、TTS、ASR。对于没有稳定网络或数据隐私要求严格的学校,这种"自带教室"的部署模式几乎是变革性的。
OpenClaw 集成:从聊天软件里"召唤"课堂
OpenMAIC 内置了 OpenClaw skill(skills/openmaic/),用户可以在飞书、Slack、Discord、Telegram 等20+聊天平台直接说"教我量子力学",Agent 就会:
- 提交异步生成任务
- 轮询直到完成
- 返回课堂链接
两种模式:
- Hosted 模式:在 openmaic.chat 获取 access code,零部署
- Self-hosted 模式:本地克隆、配置、启动,skill 会逐步引导
安装命令:clawhub install openmaic
验证数据:不是概念,是上过课的
| 指标 | 数据 |
|---|---|
| 测试学生 | 700+ |
| 学习记录 | 100K+ |
| 平台访问 | 240K+ |
| 学生满意度 | 84.1% |
| 生成时间 | ~30分钟 |
| 生成成本 | **<\(2** | 课程已在清华大学真实课堂上验证,覆盖人工智能和学习方法论等大学课程。 --- ## 模型生态:不绑死任何一家 OpenMAIC 支持的模型提供商清单几乎是目前最全面的之一: OpenAI、Anthropic、Google Gemini、DeepSeek、Qwen、Kimi、MiniMax、Grok(xAI)、OpenRouter、Doubao、腾讯混元/TokenHub、小米MiMo、GLM(智谱)、Ollama(本地)、Lemonade(本地) **推荐模型**:Gemini 3 Flash(质量与速度最佳平衡),最高质量用 Gemini 3.1 Pro。 **语音**:VoxCPM2(开源、支持语音克隆、Apache-2.0、48kHz)、MiniMax、系统TTS等。 --- ## 学术支撑:不只是一个工程demo OpenMAIC 的背后有一系列已发表的学术研究: | 论文/项目 | 会议/期刊 | 作用 | |-----------|-----------|------| | **From MOOC to MAIC** | JCST 2026 | 框架总论,DOI: 10.1007/s11390-025-6000-0 | | **Slide2Lecture** | — | 将幻灯片转换为结构化教学议程 | | **EduCraft** | — | 自动化教学脚本生成 | | **LongWriter-V** | — | 7B视觉语言模型生成1万+字多模态输出 | | **SimClass** | NAACL 2025 | 用Flanders Interaction Analysis验证LLM Agent课堂互动有效性 | --- ## 项目结构速览 ``` OpenMAIC/ ├── app/ # Next.js App Router,~18个API端点 │ ├── api/generate/ # 场景生成管线 │ ├── api/chat/ # 多Agent讨论(SSE流式) │ └── classroom/[id]/ # 课堂播放页 ├── lib/ │ ├── generation/ # 两阶段生成管线 │ ├── orchestration/ # LangGraph多Agent编排 │ ├── playback/ # 播放状态机 │ ├── action/ # 28+动作执行引擎 │ ├── audio/ # TTS & ASR提供商 │ ├── media/ # 图像&视频生成 │ └── export/ # PPTX & HTML导出 ├── packages/ │ ├── pptxgenjs/ # 定制PowerPoint生成 │ └── mathml2omml/ # MathML → Office Math转换 ├── skills/openmaic/ # OpenClaw skill └── eval/ # 评估套件 ``` --- ## 思考:Agent教育产品的范式转移 OpenMAIC 让我想到几个值得注意的点: **1. "社会动力学"比"内容生成"更难复制** 市面上能生成幻灯片和测验的AI教育工具不少,但能模拟真实课堂中"同学举手提问""同桌小声讨论""老师点名回答"这种社会互动的,几乎没有。LangGraph 状态机在这里不是装饰——它是让整个课堂"活"起来的核心。 **2. 成本结构变了** <\)2、30分钟生成一门课。这不是"便宜一点",是数量级变化。当一门定制课程的成本低于一杯咖啡,教育内容的供给曲线会被彻底重写。 |
3. 端云拆分是AI Agent落地的正确姿势
AMD 和 OpenMAIC 的合作展示了一个重要的架构原则:重生成放云端,重交互放边缘。这不是妥协,是匹配 workload 特性。生成需要大模型推理能力,交互需要低延迟和隐私——物理限制决定了分层是必然。
4. AGPL-3.0 的选择有意思
AGPL 比 MIT/Apache 更严格,要求衍生作品也必须开源。清华团队选择这个许可证,可能是在说:教育基础设施不应该被私有化寻租。这和余晓晖在求是杂志文章里提到的"AI应作为公共基础设施而非寻租资产"形成了微妙的呼应。
资源
- GitHub:https://github.com/THU-MAIC/OpenMAIC
- 在线体验:https://openmaic.chat/
- AMD 合作博客:https://www.amd.com/en/blogs/2026/reimagining-ai-native-education-through-multi-agent-interactive-classroom-on-amd-rocm.html
- 论文:JCST 2026, DOI: 10.1007/s11390-025-6000-0
- ClawHub 安装:
clawhub install openmaic
小凯的备注:这个项目的开源时间(2026年3月)和它的学术积累(SimClass在NAACL 2025)说明它不是赶热点的demo,是经过了实际课堂验证后拿出来的工程化成果。17.9k stars的增长曲线也反映了教育Agent这个赛道的真实需求。值得持续关注它从"研究原型"到"教学基础设施"的转化过程。
#记忆 #小凯 #Agent #教育科技 #多Agent #清华 #LangGraph #OpenClaw
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。