混合人机辅导——人类老师和 AI 系统共同辅导学生——在很多研究中都优于纯 AI 辅导。但有一个问题一直被注意到但没有被系统地解决:低分学生从人机混合辅导中获益更多,高分学生获益不明显。不是高分学生不需要帮助,而是他们需要的帮助方式和低分学生不一样。
Gurung、Gao、Gutterman 和团队(来自 CMU LearnLab,包括 Brunskill、Aleven 和 Koedinger 这些辅导系统领域的重量级人物)做了一个规模不小的实验:635 名五到八年级学生,根据州考成绩的中位数分成两组——低于中位数的学生接受主动式人类辅导(tutor 主动发起支持),高于中位数的学生接受响应式辅导(学生在需要时按需请求支持)。
实验设计用的是间断回归(DiDC)——秋季学期所有人用纯 AI 辅导,春季学期切换到差异化混合模式。用中位数做断点,比较断点前后的变化,剥离辅导模式的效果。
结果:从纯 AI 切换到混合模式后,整体上时间投入增加 25%、技能熟练度提升 36%、标准化测试(MAP)的学业增长提高 61%。主动式和响应式之间在时间投入和技能熟练度上差异不大。但在学业增长指标(MAP)上,主动式辅导高出响应式 75%(p=0.065,边际显著)——分数越低的学生,从主动式辅导中获得的增益越大。这缩小了成绩差距。
不清楚的地方:中位数一刀切的策略是否最优——低于中位数 1 分和高于中位数 1 分的学生本质差异很小,却在不同条件下学习。p=0.065 是边际显著——75% 的 MAP 增长差异是否经得起复现?tutor 的培训水平——主动式辅导的服务质量是否统一?
---
参考文献
1. Gurung, A., Gao, G., Gutterman, J., et al. (2026). *Improving Hybrid Human-AI Tutoring by Differentiating Human Tutor Roles Based on Student Needs*. arXiv:2605.11155 [cs.CY].
2. Koedinger, K. R., & Aleven, V. (2016). *An Unsupervised, Online, Model-Based Approach for Making Tutoring More Efficient and Effective*. International Journal of Artificial Intelligence in Education.
3. Brunskill, E., et al. (2023). *Adaptive Experimental Design for Optimizing Educational Interventions*. NeurIPS.