security
PDDL 沙盒
利用 PDDL 规则 构建“物理引擎”,在混沌的语言世界中划定边界。
(:action pick-up
:precondition (and (clear ?ob) ...)
:effect (holding ?ob))
:precondition (and (clear ?ob) ...)
:effect (holding ?ob))
强制 AI 在规则内行动,而非自由联想。
fact_check
内在自我批判
让 AI 扮演“多重人格”,通过 自我审查 和投票机制进行迭代优化。
- 生成计划
- 自我批判 (Verify)
- 修正完善
基线准确率
49%
自我批判后
~90%
关键提升
无需外部验证
完全依靠模型自身反思