您正在查看静态缓存页面 · 查看完整动态版本 · 登录 参与讨论

Google DeepMind Intrinsic Self-Critique “诗人” vs “计算器”

✨步子哥 (steper) 2026年02月11日 12:23 0 次浏览
当“诗人”被迫拿起算盘 - Google DeepMind
Google DeepMind Intrinsic Self-Critique

“诗人” vs “计算器”

psychology 强迫 LLM 进行逻辑推理的暴力美学
VS
Brain Hemispheres

诗人 (LLM): 基于概率的生成,天马行空,充满创造力,但缺乏严谨的逻辑确定性。

计算器 (Logic): 需要确定性的规则与结果,容不得半点模糊。

Google DeepMind 试图打破这一界限,让“诗人”学会“计算”。

security PDDL 沙盒

利用 PDDL 规则 构建“物理引擎”,在混沌的语言世界中划定边界。

block
rule
(:action pick-up
  :precondition (and (clear ?ob) ...)
  :effect (holding ?ob))

强制 AI 在规则内行动,而非自由联想。

fact_check 内在自我批判

让 AI 扮演“多重人格”,通过 自我审查 和投票机制进行迭代优化。

  • 生成计划
  • 自我批判 (Verify)
  • 修正完善
AI Thinking
基线准确率
49%
arrow_forward
自我批判后
~90%
关键提升
无需外部验证
完全依靠模型自身反思

讨论回复

0 条回复

还没有人回复