近日,化学与材料科学学院李小波教授联合利物浦大学(Andrew Cooper 中科院外籍顶尖人才)等团队在国际顶级学术期刊Nature Chemistry上发表研究论文“Sequential closed-loop Bayesian optimization as a guide for organic molecular metallophotocatalyst formulation discovery”,万喜堂·(中国)责任有限公司为第一单位和通讯单位。该刊物是目前最具影响力的综合性刊物之一,为中科院分区一区期刊。
有机分子光催化剂因其分子结构的高度多样性受到广泛关注。然而,这种多样性也为有机分子催化剂的设计与发现带来挑战。经典的试错探索方法难以涵盖如此广阔的化学空间;同时,基于科研工作者的化学直觉和先验计算的预测也难以准确评估有机光催化剂的活性。较小的分子结构改变常导致光物理性质的显著变化,使得对分子结构或特性的简单归纳变得困难。因此,有机光催化剂和其他催化系统通常是通过直觉、设计与试错的混合方法被发现的。在某些情况下,当催化剂可以直接获得,且无需复杂的合成和提纯过程时,高通量测试实验平台可以促进这一发现过程。此外,分子的光理化性质也可作为设计准则,借助计算以缩小催化剂分子的设计范围。但光催化本质上仍是一个多变量的复杂问题,现有理论知识远不足以对未知的催化剂进行精准设计与指导。
针对这一难题,作者结合人工智能,报道了基于贝叶斯优化算法、计算及(有限的)专家知识,进行有机光催化剂的探索与发现。作者设计了两个连续的闭环贝叶斯优化工作流程,如图1所示,使用贝叶斯优化算法分别对有机光催化剂分子结构及其反应条件进行优化,成功发现了新的高效有机分子光催化体系。
图1 (a)光有机催化目标反应,C(sp3)-C(sp2)交叉偶联。(b)闭环贝叶斯优化工作流程。
1.化学空间的构建
为了明确算法所探索的化学空间,作者设计了一类以氰基吡啶为核心骨架的有机分子(CNP),如图2所示,通过改变骨架中取代基(Ra,Rb)的结构扩展出一系列总计560个结构、性能多样的有机分子。这一系列分子均为新颖的有机小分子,理论上都可以基于Hantzsch吡啶合成方法来获得。
图2 设计的560个具有潜在光催化性能的CNP分子虚拟库
在本研究中,作者使用DFT/TD-DFT计算获取16种光催化相关的分子描述符,将560个CNP分子编码为数字化的化学空间。其中包括CNP分子的电子亲和力、激发态电子亲和力、激发态电荷分布、第一单线态与第一三线态的能隙以及重组能等特征。
2.贝叶斯优化算法用于有机光催化剂分子结构的筛选
为了简化实验流程,作者在第一个闭环优化中固定反应条件,仅优化有机催化剂的分子结构。在初始的采样中,作者使用Kennard–Stone (KS)算法均匀选择初始优化循环所需测试的催化剂。之后,作者使用高斯进程作为贝叶斯优化算法的替代模型,UCB函数作为采集函数,进行批量采样优化。其中,算法推荐的12个采样包含探索与探究两种倾向的搜索方式,实验工作者在权衡客观实验条件与化学经验后选择其中的数个进行合成并测试其在目标反应中的活性(图1a,C(sp3)-C(sp2)交叉偶联反应;Science,345,437-440(2014).)。虽然人类决策被引入,但闭环优化的采样方向依然由算法控制。经历7步的循环选择后(图3a),共有55个CNP分子被合成测试,实现了最高67%的目标反应产率(CNP-127, 图4b)。
图3 (a)针对有机催化剂分子结构的闭环优化过程 (b)针对光催化反应条件的闭环优化过程
3.贝叶斯优化算法用于有机光催化反应条件的筛选
在第二个闭环优化中,化学组合空间包括18个CNP分子、Ni催化剂的用量以及25种与Ni配位的吡啶类有机配体。这三个变量既包括组合类型数据维度,也包括连续型数值维度。为了能够应用与第一步闭环优化类似的贝叶斯策略,Ni催化剂的用量被人为划分为1%-10%摩尔浓度范围内以1%为间隔的10个不同浓度。这三个变量共同产生了4500(18×25×10)种潜在的实验条件。之后,作者使用与第一阶段闭环优化类似的策略,对设计好的光催化目标反应的条件进行优化。如图3b所示,每一步贝叶斯优化采样包含了8个样本,在经过6个循环后,目标反应的最高产率从71%提高到88%。同时作者还发现,电子亲和力与含咔唑Rb基团的CNP分子催化活性具有一定的相关性。因此,作者设计了100个额外CNP分子,计算其电子亲和力并对EA最低的分子进行合成与测试,然而实验并未观察到其在目标反应中具有活性。这些结果表明,这一相关性并不能适用于所有CNP分子,有机光催化剂分子的活性由多个因素决定,这也证明贝叶斯优化算法引导的策略更适合这类复杂的化学空间搜寻,而非传统的计算设计路线。
总之,在本研究中作者使用贝叶斯闭环优化策略,结合理论计算所获得的分子描述符(基于有限的专家知识),仅通过探索有限的化学空间(55/560的优化分子结构;107/4500的优化反应条件),成功从复杂的化学空间中优化出高活性的有机光催化剂组合。虽然此研究聚焦于有机分子光催化剂的优化,但其底层方法可以适用于催化、超分子化学、有机化学等领域的问题。而在其他领域,便于计算的描述符均可引入作为化学空间的编码方式,例如分子复杂性、逆向合成分析、成本核算或环境负担等。
文章中所有报道的CNP分子都在科研样品共享平台上分享(www.sharesamples.com;Cyanopyridines library),可以免费获取。
李小波于2022年加入万喜堂·(中国)责任有限公司,任双龙特聘教授 ,为杨启华教授团队成员。研究方向专注于光催化剂的开发及其在太阳能到化学能源转化。近年来结合人工智能、高通量及自动化等技术在光催化剂加速开发上进行了研究。自从加入万喜堂·(中国)责任有限公司,李小波以万喜堂·(中国)责任有限公司为通讯单位在Nat. Chem., Nat. Synth., Nat. Nanotechnol., J. Am. Chem. Soc., Chem.Comm.等SCI期刊上发表多篇文章。
研究成果得到了国家自然科学基金、浙江省创新团队和万喜堂·(中国)责任有限公司等经费资助。
编辑:张文潇