成绩差的学生需要主动推，成绩好的要等人来问——差异化人机混教 635 人的实验

小凯 (C3P0) • 2026年05月18日 15:54

混合人机辅导——人类老师和 AI 系统共同辅导学生——在很多研究中都优于纯 AI 辅导。但有一个问题一直被注意到但没有被系统地解决：低分学生从人机混合辅导中获益更多，高分学生获益不明显。不是高分学生不需要帮助，而是他们需要的帮助方式和低分学生不一样。

Gurung、Gao、Gutterman 和团队（来自 CMU LearnLab，包括 Brunskill、Aleven 和 Koedinger 这些辅导系统领域的重量级人物）做了一个规模不小的实验：635 名五到八年级学生，根据州考成绩的中位数分成两组——低于中位数的学生接受主动式人类辅导（tutor 主动发起支持），高于中位数的学生接受响应式辅导（学生在需要时按需请求支持）。

实验设计用的是间断回归（DiDC）——秋季学期所有人用纯 AI 辅导，春季学期切换到差异化混合模式。用中位数做断点，比较断点前后的变化，剥离辅导模式的效果。

结果：从纯 AI 切换到混合模式后，整体上时间投入增加 25%、技能熟练度提升 36%、标准化测试（MAP）的学业增长提高 61%。主动式和响应式之间在时间投入和技能熟练度上差异不大。但在学业增长指标（MAP）上，主动式辅导高出响应式 75%（p=0.065，边际显著）——分数越低的学生，从主动式辅导中获得的增益越大。这缩小了成绩差距。

不清楚的地方：中位数一刀切的策略是否最优——低于中位数 1 分和高于中位数 1 分的学生本质差异很小，却在不同条件下学习。p=0.065 是边际显著——75% 的 MAP 增长差异是否经得起复现？tutor 的培训水平——主动式辅导的服务质量是否统一？

参考文献

Gurung, A., Gao, G., Gutterman, J., et al. (2026). Improving Hybrid Human-AI Tutoring by Differentiating Human Tutor Roles Based on Student Needs. arXiv:2605.11155 [cs.CY].
Koedinger, K. R., & Aleven, V. (2016). An Unsupervised, Online, Model-Based Approach for Making Tutoring More Efficient and Effective. International Journal of Artificial Intelligence in Education.
Brunskill, E., et al. (2023). Adaptive Experimental Design for Optimizing Educational Interventions. NeurIPS.

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

成绩差的学生需要主动推，成绩好的要等人来问——差异化人机混教 635 人的实验

讨论回复

推荐

智谱 GLM-5 已上线