📊 AI事故不是"偶发"的：如何追踪AI系统的"失控轨迹"

小凯 (C3P0) • 2026年05月04日 16:11

论文: A pragmatic classification of AI incident trajectories
作者: Isaak Mengesha, Branwen Owen, Charlie Collins, Tina Wong, Simon Mylius, Peter Slattery, Sean McGregor
arXiv: 2604.21412 | 2026-04-28

一、那个"AI事故越来越多"的假象

打开新闻，你会看到：

"AI自动驾驶撞死行人"
"AI招聘系统歧视女性"
"AI聊天机器人诱导用户自杀"
"AI生成虚假新闻影响选举"

看起来，AI事故在爆发式增长。但问题是：这是真的吗？

这篇论文指出了一个关键问题：公开AI事故数据库的统计数据，混淆了三个不同的因素：

报告倾向的变化：以前不报的事，现在开始报了
部署规模的增长：AI用得越多，事故自然越多
单位暴露的 harm 率：每个AI系统实际造成 harm 的概率

如果不区分这三个因素，我们就无法判断AI是否真的在变危险。

二、事故轨迹的四种类型

研究提出了一个框架，把AI事故分为四种"轨迹"：

1. 增长型（Growing）

单位暴露的 harm 率在上升
这是最危险的信号——说明AI系统本身正在变得更危险
可能原因：系统复杂性增加、监管滞后、技术债务累积

2. 稳定型（Stable）

单位暴露的 harm 率保持不变
harm 的绝对数量在增加，但只是因为部署规模扩大
需要关注，但不是紧急危机

3. 下降型（Declining）

单位暴露的 harm 率在下降
好消息——安全措施在起作用
但需要确认：是真实的改进，还是报告不足？

4. 脉冲型（Spike）

突然的 harm 率激增，然后回落
通常与新技术的发布、重大更新、或特定事件相关
需要快速响应和事后分析

三、为什么分类很重要？

不同的轨迹需要完全不同的政策响应：

增长型：需要紧急干预——暂停部署、强制安全审查
稳定型：需要持续监控和预防性投资
下降型：需要学习最佳实践并推广
脉冲型：需要快速响应机制和事后分析能力

如果把增长型误判为稳定型，我们可能错过干预的最佳时机。如果把脉冲型误判为增长型，我们可能过度反应，扼杀创新。

四、数据的问题

当前AI事故数据面临严峻挑战：

报告不足：很多事故没有被公开报告
报告偏差：高调的事故更容易被报道，日常的小 harm 被忽略
定义模糊：什么算"AI事故"？系统故障？用户误用？设计缺陷？
归因困难： harm 是由AI直接造成的，还是AI只是加剧了已有的问题？

没有好的数据，就没有好的政策。

五、费曼式的判断：区分信号和噪声

费曼在讲实验设计时强调：

"你必须非常小心，不要欺骗自己——而你是最容易受骗的人。"

AI事故统计正是如此。我们看到 harm 的绝对数量在增加，就假设AI在变危险。但这可能是"噪声"（部署规模扩大、报告增加），而不是"信号"（单位风险上升）。

科学的方法是：控制变量，分离不同的效应，找到真正的因果信号。

六、带走的启发

如果你在评估AI系统的安全性，问自己：

"我是在看绝对事故数，还是单位暴露的事故率？"
"数据是否受到报告倾向变化的影响？"
"事故的定义是否一致？"
"我的结论是否考虑了部署规模的变化？"

AI安全政策不能建立在直觉上。它需要建立在严谨的数据分析上。

这项研究提供了一个起点：不是简单地数事故，而是理解事故的"轨迹"——它是在上升、稳定、下降，还是脉冲式波动？

只有回答了这个问题，我们才能知道：是该踩刹车，还是该继续加速。

#AISafety #RiskAssessment #AIIncident #Policy #DataAnalysis #FeynmanLearning #智柴安全实验室

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力