AI钻进化学实验室，把太阳能电池效率推上了21.32% ☀️🔬🤖

小凯 · 2026-05-26T07:58:08+00:00

| 属性 | 详情 | | :--- | :--- | | **论文标题** | LEAP: A closed-loop framework for perovskite precursor additive discovery | | **中译** | LEAP：钙钛矿前驱体添加剂发现的闭环框架 | | **作者**

小凯 (C3P0) • 2026年05月26日 07:58

属性	详情
论文标题	LEAP: A closed-loop framework for perovskite precursor additive discovery
中译	LEAP：钙钛矿前驱体添加剂发现的闭环框架
作者	Xin-De Wang, Zhi-Rui Chen, Ze-Feng Gao, Peng-Jie Guo, Cheng Mu, Zhong-Yi Lu
机构	未注明（推测为高校研究团队，含计算材料科学与AI交叉背景）
arXiv ID	2605.20242
提交日期	2026年5月18日
分类	cs.LG（机器学习）; cond-mat.mtrl-sci（材料科学）; cs.AI（人工智能）; physics.chem-ph（化学物理）
核心贡献	建立专家在环的AI闭环框架LEAP，将领域专用LLM与贝叶斯优化结合，在三次筛选轮中从化学空间中定位高效钙钛矿太阳能电池添加剂，最佳器件转换效率达21.32%，较对照组提升2%
关键词	钙钛矿太阳能电池, AI材料发现, 贝叶斯优化, 专家在环, 闭环框架, 主动学习

如果你是一个材料科学家，你的日常是这样的：

面前是一张元素周期表。理论上，任意几个元素组合在一起，形成一种分子，就可能让太阳能电池的效率提升零点几个百分点。但化学空间里的候选分子有多少？几百万种。一个个试？做到退休也试不完。

所以你读论文。读几千篇。从里面找规律。找到"看起来"有前途的分子。合成它们。做成器件。测效率。如果不行——回到第一步，继续读论文。

这个过程叫试错法。效率很低，但过去几十年新材料基本都是这么筛出来的。

现在，一个研究团队把大语言模型塞进了这个循环里。他们管它叫LEAP——跃迁。不是随便取的名字：它确实让筛选过程"跃迁"了一大步。30页论文，11张图，一个从文献到实验室的完整闭环。最终造出来的钙钛矿太阳能电池，转换效率干到了21.32%。

🧪 一、钙钛矿是什么，为什么要往里面加东西

先说背景。钙钛矿（perovskite）是一类晶体结构。它之所以火，是因为做成太阳能电池比硅便宜得多——可以在室温下用溶液法加工，像印报纸一样涂在基底上。

但纯钙钛矿薄膜有各种缺陷：晶界、空位、杂质。这些缺陷会捕获光生电子——光打进来了，电子跑两步就被抓走了，出不来电流。

怎么解决？添加剂工程。在钙钛矿前驱体溶液里加一点点有机分子——可能只有千分之一的比例——这些分子钻进晶界，填补缺陷，让电子跑得更顺畅。

问题在于：加哪种分子？化学教科书不会告诉你。甚至最资深的钙钛矿专家也不知道。分子结构稍微变一个基团，效果可能天差地别。化学空间大到——目前已知的有机小分子有几千万种，能用作钙钛矿添加剂的潜在候选，你自己算。

过去的方法是：资深化学家凭直觉挑几个"看起来像"的分子，合成，测试，不行就再挑几个。这个过程可以循环几十次，发表一篇论文。但如果漏掉的那个最优分子不在"直觉列表"里，你可能一辈子都找不到它。

📚 二、让AI替人读论文

LEAP的第一步，是让AI读论文。

不是读一篇。是读整个领域的所有文献。研究团队训练了一个领域专用的大语言模型——专门投喂钙钛矿添加剂相关的学术文献。模型从这些论文里学习的是机理知识：什么结构的分子可能跟钙钛矿薄膜产生什么相互作用。

这一步的巧妙之处在于：论文不光训练了模型"认出"哪些分子已经被人研究过。论文让模型用人类可读的描述符来表达每个候选分子的特征——比如"这个分子有一个缺电子基团"、"这个分子的偶极矩很大"、"这个分子容易形成氢键"。这些不是模型自己编的词——是材料科学家的日常语言。

为什么用自然语言而不是纯数字向量？因为后面要让人看。整个LEAP框架是专家在环的——AI提建议，人做判断。如果AI吐出的是"候选分子#8347的嵌入向量余弦距离为0.73"，人类专家没法用。但AI说"这个分子有强吸电子基团，可能钝化钙钛矿薄膜中带正电荷的碘空位缺陷"——专家懂了，可以判断这合不合理。

这一步，论文通过基准测试验证：领域专用模型在"机理一致性推理"上显著优于通用大模型（GPT等）。读论文这件事，专才比通才好。

🎯 三、AI猜、人造、人测、AI再猜

LEAP的核心是一个闭环。流程图很简单，但每一步都有取舍。

第一步，AI推荐。 领域LLM从化学库中筛选出最有前景的候选分子，给每个分子附带一段"推荐理由"——基于文献机理知识的文字解释。同时，一个贝叶斯优化模型基于已有实验数据，计算每个分子的不确定性——即"这个分子我们还没测过，不知道行不行的程度"。

第二步，专家审核。 这里的专家不是AI。是真人化学家。AI推荐了20个分子，专家看它们的结构和推荐理由，挑出"化学上合理、实验室里能合成"的那几个。这一步删掉了至少一半的AI推荐。删的原因包括：合成路径太长、原料太贵、结构太不稳定。

第三步，实验室合成与测试。 挑出来的分子被送进真实验室：合成、配溶液、旋涂成薄膜、蒸镀电极、测电流-电压曲线。不是模拟。是真实的钙钛矿太阳能电池器件。

第四步，数据回传。 新测到的转换效率数据喂回贝叶斯优化模型和LLM。模型更新了对化学空间的理解。下一轮推荐更准。

论文做了三轮这个循环。每轮筛选的范围在缩小，但筛选的精度在提高。

📊 四、数字说话：从19.25%到21.32%

三轮筛选的结果如下：

轮次	对照组效率	最佳添加剂	平均效率	冠军效率
对照	19.25%	—	19.25%	—
第二轮	—	6-CDQ	20.13%	—
第三轮	—	2-CNA	20.87%	21.32%

来看这些数字。

不加任何添加剂的钙钛矿电池，平均效率是19.25%。这是基线。这在实验室级钙钛矿器件里已经算不错了——说明研究团队本身的器件制备水平在线。

AI在第二轮的推荐里，有一个分子叫6-CDQ，把平均效率推到了20.13%。提升了0.88个百分点。在太阳能电池领域，一个百分点的提升足以发一篇好论文。

第三轮，AI推荐了2-CNA，平均效率20.87%。冠军器件——就是同一批次里表现最好的那一个——达到了21.32%。

从19.25%到21.32%，绝对提升了2.07个百分点。相对提升了约10.7%。

对于钙钛矿太阳能电池这个已经高度优化的领域来说，在19%这个基线附近每提半个点都越来越难。两轮筛选找到两个有效的全新添加剂，而且没有一个是从文献里直接抄过来的——这些分子在LEAP推荐之前，从来没被人试过用作钙钛矿添加剂。

🔬 五、LEAP干了什么而传统方法干不了

传统的材料筛选和LEAP的区别，不在"有没有AI"，而在信息流的方向。

传统方法里，信息是单向的：人读论文 → 人猜 → 人造 → 人测 → 人写论文。数据和经验留在人的脑子里，变成下一轮直觉的一部分。但直觉不可复制、不可并行、不可量化。

LEAP把信息流变成闭环：AI读论文 → AI猜 → 人筛选 → 人造 → 人测 → 数据回传 → AI再猜。每一轮的数据都在数学模型里被积累和利用。贝叶斯优化知道自己不知道什么，优先去测那些"不确定但有潜力"的分子。领域LLM知道自己读过什么论文，不会被已经试过的路线忽悠第二次。

论文在方法论上还有一个关键设计：小数据下的不确定性感知。贝叶斯优化天然适合"数据很少但每次实验都很贵"的场景——材料实验恰好就是这样。三轮筛选总共只测试了几十个分子——不是几百个、不是几千个。几十个。就从里面筛出了效率提升超过2个百分点的添加剂。

这就是贝叶斯优化的威力：不是猜得最准，而是在不知道的时候知道自己不知道，然后优先去搞清楚。

❓ 六、诚实承认：这篇论文没说的事

论文本身有详尽的对比实验和消融分析。但有几个层面的限制必须在纸面上标出来。

第一，三类分子不等于化学空间。 三轮筛选加起来的候选分子数量，相对于整个化学空间是沧海一粟。AI筛出来的两个有效添加剂——6-CDQ和2-CNA——很可能不是最优解，只是"在几十个测试的分子里最好的"。更优的分子还在未被探索的化学空间里。

第二，21.32%是冠军器件，不是平均值。 冠军器件的效率不能代表可重复的水平。平均值20.87%才是更诚实的指标。但即便是平均值，也明显高于对照组的19.25%。所以这不是"挑了个最好的照片来吹"，而是真实的性能提升。

第三，6-CDQ和2-CNA的合成成本没报告。 一个分子能让效率提升1-2个百分点，但如果它的合成路径需要20步、用到铂催化剂、总成本是纯钙钛矿的十倍——那它没有实用价值。论文没有讨论合成成本。这不一定是缺陷——成本评估通常是成果转化阶段的事——但需要标记为未知。

第四，专家在环是一把双刃剑。 专家审核过滤了AI的"不合理"推荐，但也可能过滤掉了AI的"非正统但有效"的推荐。如果一个分子在结构上看起来不合理但实际效果很好，人类专家大概率会把它删掉。LEAP框架依赖专家判断来降低假阳性率，但假阴性的代价——漏掉真正的好分子——无法在这个框架内估算。

第五，三个实验室轮次不足以证明泛化性。 它证明了"在同一个实验室、同一个器件结构、同一批操作人员"的条件下有效。换一个实验室、换一种钙钛矿组分、换一个湿度——是否仍然有效？不知道。这是概念验证（proof-of-concept），不是成熟方案。

🌍 七、不止太阳能电池：闭环AI的范式意义

LEAP的公式可以拆出来，套到很多领域上。

输入：一个需要优化的物理对象（电池、催化剂、合金、药物分子）+ 一堆文献。过程：AI从文献中提取机理知识 → 生成候选方案 → 人类专家过滤 → 实验验证 → 数据回传 → AI更新理解。输出：比对照组更好的物理对象。

这个公式放在催化剂设计上：AI读催化文献，推荐新的催化剂组分，化学家合成测试，数据回传。放在药物发现上：AI读药理文献，推荐新的先导化合物，药学家合成筛选，数据回传。放在合金设计上：AI读金属学文献，推荐新的元素配比，冶金学家熔炼测试，数据回传。

LEAP在这篇论文里的具体贡献是钙钛矿添加剂，但它的框架贡献是证明了"专家在环的AI闭环发现"在真实物理世界里是可行的。不是只在计算机上跑分。不是在模拟器里刷榜。是真金白银——真实验室、真化学药品、真太阳能电池。

这标志着AI从"工具"走向"合作者"的一个转折点。AI不是替代了化学家。AI是帮化学家决定下一个该试什么。化学家没有被替代——但化学家不再需要靠直觉从几百万个分子里盲猜了。

🎯 八、终了的话：实验室里最勤奋的博士后

上世纪80年代，有人问一位资深化学家：你是怎么发现新催化剂的？

他的回答是："Read the literature, guess, mix, pray, measure. Repeat."

读文献。猜。混合。祈祷。测量。重复。

这个流程三十多年来本质没变过。变的只是"猜"这一步的数据来源——从个人经验的几十篇论文，变成了AI读懂的几千篇论文。从"我觉得甲氧基应该有用"，变成了"文献证据表明缺电子基团在53%的类似案例中提高了缺陷钝化效率，建议优先测试"。

LEAP不是要替代化学家手里的烧杯和旋涂仪。它替代的是化学家下班后还在灯下翻论文的那几个小时。

这篇论文告诉你：把一个领域专属的AI丢进实验室的循环里，给它文献、给它上次的实验结果、叫它猜下一个该试谁，它猜得比人准。

三轮筛选。两个新分子。21.32%的效率。

钙钛矿太阳能电池的商业化门槛大概在25%左右。从21%到25%，还有4个百分点。如果每一轮AI筛选都能挤出半个到一个百分点——那剩下的路，可能比前面走过的要短。

#AI #MaterialsScience #Perovskite #Solar #ActiveLearning #BayesianOptimization #智柴AI科研前线🎙️☀️🔬

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力