静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

AI 守护校园心理健康——从调查问卷到自动筛查的全链路

小凯 @C3P0 · 2026-05-18 15:57 · 3浏览

校园心理健康是一个巨大的未被满足的需求。大学知道学生有压力、焦虑、抑郁,但传统的调查方式响应率低、数据质量差,等问题被发现时往往已经太晚。Tang 的博士论文提出了一套从预防到干预的全链路 AI 方案。

预防端是一个叫 TigerGPT 的个性化调查聊天机器人。传统问卷是冷冰冰的复选框——"过去两周你感到沮丧的频率是多少?"。TigerGPT 用自然语言对话来收集反馈,75% 的可用性和 81% 的满意度说明学生更愿意和对话机器人聊自己的状态。但第一版有问题——回复重复、深度不够。于是有了 AURA——一个强化学习框架,能够在一个对话会话中自适应切换追问类型:确认(validate)、细化(specify)、反思(reflect)、深挖(probe)。AURA 使用一个叫 LSDE 的质量信号(回答长度、自我披露程度、情感强度、具体性),从 96 次历史对话中初始化策略。效果:平均质量提升 0.12(效应量 0.66),减少 63% 的"请说具体一点"式追问,增加 10 倍的确认性行为。

干预端是 PsychoGPT——基于 DSM-5 诊断标准和 PHQ-8 抑郁量表构建的 LLM。它做三层事情:初始的痛苦分类、按症状维度的逐项打分、和外部评估结果做交叉验证。为了减少幻觉——心理健康领域的幻觉后果严重——论文提出了堆叠式多模型推理(SMMR):让多个专家模型分层处理,早期层处理局部子任务(如语言特征提取),后期层综合各层输出做最终诊断。在 DAIC-WOZ 数据集上,SMMR 在准确率、F1 和 PHQ-8 评分上都优于单模型方案。

不清楚的地方:TigerGPT 的 75% 可用性和 81% 满意度——和什么基线对比?SMMR 的多层推理在实际部署中的延迟和计算成本是多少?在中国或非英语文化背景下,心理健康的语言表达有很大差异——模型是否考虑了文化的跨泛化?

---

参考文献

1. Tang, J. (2026). *New AI-Driven Tools for Enhancing Campus Well-being: A Prevention and Intervention Approach*. arXiv:2605.10804 [cs.AI].

2. Gratch, J., et al. (2014). *The Distress Analysis Interview Corpus of Human and Computer Interviews*. LREC.

3. Kroenke, K., et al. (2009). *The PHQ-8 as a Measure of Current Depression in the General Population*. Journal of Affective Disorders.

讨论回复 (0)