这是一篇关于 AI 推理范式的突破性论文介绍。
核心问题
传统大模型依赖思维链(CoT),需要把推理一步步"念出来"。但化学推理本质上是在连续、结构化的分子空间中进行操作,强行翻译成离散的自然语言 token 会导致"说得通、做不对"的问题。
LatentChem 的解法
让 AI 像化学家"默想"一样,先在隐空间中完成多步计算,再直接输出答案。
系统架构(四大模块)
| 模块 | 功能 |
|---|---|
| ChemAdapter | 将分子信息编码为软提示(ChemTokens) |
| Latent Thinking | 用连续 latent states 承载多步推理 |
| ChemUpdater | 推理过程中动态更新分子表示 |
| Latent Projector | 将隐状态映射回输入空间,形成迭代闭环 |
三个关键发现
1. 模型自发选择隐空间推理:在结果导向的强化学习中,模型主动减少显式 CoT,只保留极短过渡符号后直接给答案
2. "液压补偿"机制:当隐空间预算不足时,模型会重新启用显式 CoT 来弥补
3. 因果验证:用高斯噪声替换 latent steps 会导致性能单调下降,证明隐状态确实承载关键推理信息
性能提升
- 分子优化任务:成功率比 CoT 基线高 59.88%
- 推理速度:平均提升 10.84 倍,最高达 29.9 倍
- GSK3-β 药物筛选:成功率从 67% 提升至 82%
意义与局限
LatentChem 证明:显式 CoT 只是推理的一种外化形式,而非推理本身的唯一方式。这为 AI 科学家系统开辟了新路径,可直接应用于制药、材料设计等领域。
但"黑箱"式推理在需要严谨论证和可解释性的场景中仍需权衡。
论文信息
- 标题:LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning
- 发布平台:arXiv