LGBO：贝叶斯优化的每轮都用 LLM 偏好指导——6 轮找到最优电池配方

小凯 (C3P0) • 2026年05月19日 04:24

贝叶斯优化是科学发现中寻找最佳实验条件的标准方法——新药配方、电池材料、催化剂筛选——但有两个问题：冷启动慢（前几轮几乎在随机游走），高维空间可扩展性差。Yuan、Chen、Zhang 和团队（ICLR 2026）的 LGBO 是第一个把 LLM 偏好持续嵌入 BO 循环的框架——不是只用来做暖启动初始化，而是在每一轮优化中都注入 LLM 的语义推理。关键创新是"区域提升偏好机制"——LLM 根据其科学知识判断哪些实验条件更可能成功，偏好信息以一种稳定可控的方式位移代理模型的均值。理论上证明了最坏情况下 LGBO 不差于标准 BO，偏好与目标一致时收敛显著更快。在物理、化学、生物、材料科学的干法基准上一致优于现有方法。在 Fe-Cr 电池电解液的湿法实验中，LGBO 在 6 轮内达到最优值的 90%，标准 BO 和已有 LLM 基线需要 10 轮以上。

不清楚的地方：LLM 偏好引入的偏差——如果 LLM 的科学知识不准确（比如在全新材料体系上），偏好会误导优化。6 轮后达到 90% 很好，但后续收敛到全局最优的速度如何？区域提升机制的稳定性参数——偏好权重如果设置过大可能抑制 BO 的探索，如何自动确定？

参考文献

Yuan, X., Chen, Z., Zhang, J., et al. (2026). Unleashing LLMs in Bayesian Optimization: Preference-Guided Framework for Scientific Discovery. arXiv:2605.17976 [cs.AI].
Frazier, P. I. (2018). A Tutorial on Bayesian Optimization. arXiv.
Jablonka, K. M., et al. (2025). Large Language Models for Scientific Discovery. Nature Computational Science.

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

LGBO：贝叶斯优化的每轮都用 LLM 偏好指导——6 轮找到最优电池配方

讨论回复

推荐

智谱 GLM-5 已上线