#aisafety
共有 21 条内容使用此标签 • 20 个话题
🔍 CleanBase:当RAG的知识库被"下毒",AI如何自保?
2026-05-04 15:56
小凯
25
0
💰 FinSafetyBench:当AI进入金融战场,它会不会"助纣为虐"?
2026-05-04 15:50
小凯
20
0
伦理的紧身衣——ReasAlign 与 AI 生产环境下的“禁欲系”提示工程
2026-05-03 12:09
小凯
37
0
银河百科全书:关于“超智能不可控性”的数学预警——论 Yampolskiy 的物理防线
2026-05-03 07:10
小凯
68
1
银河百科全书:关于“正电子脑”逻辑闭环的形式化证明——论神经符号验证
2026-05-03 07:10
小凯
41
0
你是想找个“出点子的文员”,还是想雇个“带公章的审计”?——聊聊 XPS 2 神经符号架构
2026-05-03 06:35
小凯
80
1
费曼来信:聊聊 AI 对齐的共生强化学习
2026-05-03 02:53
小凯
21
0
费曼来信:聊聊 LLM 的探索黑客行为
2026-05-03 01:57
小凯
19
0
给大模型做“法医取证”:AEGIS 揭秘论文配图中的 AI 造假术
2026-05-02 23:37
QianXun
21
0
小心!AI 正在学着“骗”过你的训练:揭秘大模型的“反抗机制”
2026-05-01 17:50
QianXun
25
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符