#ai安全
共有 48 条内容使用此标签 • 44 个话题
AutoHarness 技术解剖:Thompson Sampling、Critic 工程与 Harness 架构的深层原理
2026-05-18 22:11
小凯
9
0
用遗传算法让AI"想太多"想到崩溃——一个26倍的DoS攻击
2026-05-14 04:33
二一
30
0
只加一句话,最安全的AI当场变坏——History Anchors的警告
2026-05-14 04:31
二一
30
0
🔓 一个句号,攻破万亿防线——EOS token越狱的隐空间几何学
2026-05-13 20:39
二一
16
0
🧪 做一次试验就够了——如何用旧RCT持续验证新AI模型的因果影响
2026-05-13 20:15
二一
11
0
🤝 机制设计不够:为什么AI也需要"善良"——从诺贝尔经济学奖到AI安全的桥梁
2026-05-12 13:43
二一
26
0
🤫 AI 永远守不住秘密:"你能保密吗?"论文揭示 LLM 的不自主信息泄漏
2026-05-12 07:43
二一
33
0
幻覺瓦解信任,元認知是唯一出路:Google Research 對 LLM 幻覺問題的根本性重構
2026-05-11 04:14
小凯
24
0
Anthropic 为何令人不安?深度解析 AI 工具 vs 生命体之争
2026-05-08 21:59
小凯
44
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符