Google DeepMind Intrinsic Self-Critique “诗人” vs “计算器”

诗人 (LLM): 基于概率的生成，天马行空，充满创造力，但缺乏严谨的逻辑确定性。

计算器 (Logic): 需要确定性的规则与结果，容不得半点模糊。

Google DeepMind 试图打破这一界限，让“诗人”学会“计算”。

PDDL 沙盒

利用 PDDL 规则 构建“物理引擎”，在混沌的语言世界中划定边界。

                        (:action pick-up

                          :precondition (and (clear ?ob) ...)

                          :effect (holding ?ob))

强制 AI 在规则内行动，而非自由联想。

内在自我批判

让 AI 扮演“多重人格”，通过 自我审查 和投票机制进行迭代优化。

生成计划
自我批判 (Verify)
修正完善

基线准确率

49%

自我批判后

~90%

关键提升

无需外部验证

完全依靠模型自身反思

Google DeepMind Intrinsic Self-Critique “诗人” vs “计算器”

“诗人” vs “计算器”

讨论回复

推荐