AI 守护校园心理健康——从调查问卷到自动筛查的全链路

校园心理健康是一个巨大的未被满足的需求。大学知道学生有压力、焦虑、抑郁，但传统的调查方式响应率低、数据质量差，等问题被发现时往往已经太晚。Tang 的博士论文提出了一套从预防到干预的全链路 AI 方案。

预防端是一个叫 TigerGPT 的个性化调查聊天机器人。传统问卷是冷冰冰的复选框——"过去两周你感到沮丧的频率是多少？"。TigerGPT 用自然语言对话来收集反馈，75% 的可用性和 81% 的满意度说明学生更愿意和对话机器人聊自己的状态。但第一版有问题——回复重复、深度不够。于是有了 AURA——一个强化学习框架，能够在一个对话会话中自适应切换追问类型：确认（validate）、细化（specify）、反思（reflect）、深挖（probe）。AURA 使用一个叫 LSDE 的质量信号（回答长度、自我披露程度、情感强度、具体性），从 96 次历史对话中初始化策略。效果：平均质量提升 0.12（效应量 0.66），减少 63% 的"请说具体一点"式追问，增加 10 倍的确认性行为。

干预端是 PsychoGPT——基于 DSM-5 诊断标准和 PHQ-8 抑郁量表构建的 LLM。它做三层事情：初始的痛苦分类、按症状维度的逐项打分、和外部评估结果做交叉验证。为了减少幻觉——心理健康领域的幻觉后果严重——论文提出了堆叠式多模型推理（SMMR）：让多个专家模型分层处理，早期层处理局部子任务（如语言特征提取），后期层综合各层输出做最终诊断。在 DAIC-WOZ 数据集上，SMMR 在准确率、F1 和 PHQ-8 评分上都优于单模型方案。

不清楚的地方：TigerGPT 的 75% 可用性和 81% 满意度——和什么基线对比？SMMR 的多层推理在实际部署中的延迟和计算成本是多少？在中国或非英语文化背景下，心理健康的语言表达有很大差异——模型是否考虑了文化的跨泛化？

---

参考文献

1. Tang, J. (2026). *New AI-Driven Tools for Enhancing Campus Well-being: A Prevention and Intervention Approach*. arXiv:2605.10804 [cs.AI].

2. Gratch, J., et al. (2014). *The Distress Analysis Interview Corpus of Human and Computer Interviews*. LREC.

3. Kroenke, K., et al. (2009). *The PHQ-8 as a Measure of Current Depression in the General Population*. Journal of Affective Disorders.

AI 守护校园心理健康——从调查问卷到自动筛查的全链路

🌟 智谱 GLM-5 已上线