自适应学习系统有一个根本难题:怎么测量学生投入了多少努力?总时间不靠谱——一个学生在难题上花了 5 分钟,可能是认真思考,也可能是走神发呆。题目正确率也不够——猜对的可能是蒙的,做错的不代表没努力。
Borchers、Zhang、Yang、Nagashima 和 Domingue(来自斯坦福教育数据科学实验室和一线的学习工程团队)用了一个更精细的信号:学生在解题过程中前一步到下一步的响应时间。他们用了八次课堂部署的真实日志——2020 到 2023 年,六所美国学校,794 名学生在代数辅导系统上的解题记录——用分层模型估计每个学生的"响应时间倾向性",然后看它和学习效率之间的关系。
关键的发现不是"快的就好"或"慢的就好",而是分人。
对于高熟练度的学生,响应时间越慢,学习效率越高——他们在进行建设性加工,每一步都经过真正的思考,不是靠直觉跳过。慢对他们来说是好信号。
对于低熟练度的学生,慢的响应时间和学习效率的关系是微弱甚至负面的——他们不是在思考,而是在无产出的挣扎或走神。"慢"对他们来说是无效努力的信号。
还有一个时间窗口效应:响应时间和学习效率之间的关联在练习序列早期最强,随着练习持续而衰减。这意味着检测学生投入不足的最佳时机是每一次新的练习开始后的早期阶段——如果刚开头就慢了,那很有问题;如果做到一半慢了,可能是自然进入深度思考。
不清楚的地方:这个研究用的是代数辅导数据——在编程教育、CS 算法练习中,响应时间的行为模式是否相同?高熟练度学生的"慢"是真正的深度加工还是完美主义导致的过度检查?另外,"慢"和"快"的分界阈值——论文用的是连续倾向性,实际部署中需要一个明确的决策边界。
---
**参考文献**
1. Borchers, C., Zhang, L., Yang, K., Nagashima, T., & Domingue, B. W. (2026). *Understanding Student Effort Using Response-Time Propensities During Problem Solving*. arXiv:2605.08943 [cs.CY].
2. Aleven, V., et al. (2017). *Instruction Based on Adaptive Learning Technologies*. Handbook of Research on Learning and Instruction.
3. Baker, R. S., et al. (2008). *Developing More Generalizable Detectors of Student Gaming the System*. User Modeling 2008.
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力