作者:罗三中等 来源:《自然-合成》 发布时间:2025/12/3 10:58:32
选择字号:
清华大学提出“人机协作”新策略,解锁Co(IV)-烯胺协同催化新模式

 

面对超过100万种可能性的反应条件空间,如何从零开始快速锁定最优解?清华大学基础分子科学中心罗三中教授团队给出了答案:通过启发式AI策略结合化学专家知识,仅需63次实验即可实现精准导航。2025年12月1日,罗三中教授团队在Nature Synthesis期刊上在线发表了题为“Heuristic data-driven approach for synergistic cobalt (IV)-enamine catalysis”的研究论文。罗三中教授和杨骐研究员为论文通讯作者,清华大学基础分子科学中心博士生程亮、谭臻至和贾宗宾为论文共同第一作者。

传统有机化学长期依赖专家经验,通过试错法优化反应条件,并基于模板式的策略评估底物适用范围。尽管该方法对开发新反应贡献显著,但其过程耗时且易受研究者主观倾向影响。尤其在复杂催化体系中,微妙的立体电子效应往往难以通过单变量筛选策略快速准确地进行解析。近年来,人工智能的兴起为应对这些挑战提供了新机遇,然而目前机器学习方法大多依赖大量历史数据,限制了其在缺乏数据的新反应探索中的应用。

针对以上挑战,作者团队提出一种启发式数据驱动策略,将专家指导与机器学习辅助实验的策略相结合,加速新反应的发现、优化和探索过程。作者以Co(IV)-烯胺协同催化这一新型极性反转策略为例进行验证(图1)。相较于需使用化学计量氧化还原剂的常规Co(IV)催化体系,该策略利用烯胺固有的富电子特性,巧妙避免了额外还原剂的添加,不仅显著提升了原子经济性,更开辟了钴催化的全新反应模式。

图1:数据驱动的Co(IV)-烯胺协同催化转化研究。

作者首先根据反应设计构建了总计超过100万反应条件空间(图1)。随后作者整合多目标高斯过程与q-期望超体积改进(q-EHVI)算法,将实验结果用于训练贝叶斯优化(BO)模型,实现反应的迭代优化。在优化过程中,研究人员根据实验反馈动态调整反应空间,剔除低效试剂并引入新候选物。采用启发式数据驱动策略(图1),作者在涵盖百万级条件的反应空间中,仅通过63次实验便锁定最优催化体系,效率远超采用传统单变量优化分方法。该策略不仅获得更优的反应活性和立体选择性,还揭示了新的反应规律。

图2:Bayesian优化反应降维图。

随后,作者通过UMAP将AI反应优化过程降维投影(图2)。在BO-1中,实验点广泛分布于整个反应空间(MD = 12.44),显示出高度的探索多样性与全局覆盖能力;而在BO-2中,由于初始数据来源于传统人工筛选结果,实验点明显集中于局部区域(MD = 1.19),探索过程受限于“固化思维”的影响;BO-3则主动尝试跳出已有探索范围,虽未获得更优反应条件,但意外揭示了无需添加碱仍可进行反应的替代路径。这些结果共同表明,在复杂的多维化学反应空间中,可能存在多个性能相当的局部优解区域。

图3:醇与酚的底物适用范围。

进一步,作者通过专家参与的聚类算法系统评估底物适用性,突破了传统方法局限于少数结构模式的不足(图3)。作者首先探索1a的底物普适性。通过对市售含羟基化合物的全面调研,并经过严格的数据清洗和筛选,最终确定了2356种结构多样的醇和酚类底物,进一步聚类投影划分为13个不同的簇中(图3a)。随后从每个簇中选择代表性底物进行实验评估,确保底物范围既能捕捉结构多样性,又能涵盖机理上相关的电子和空间特征。结果表明该催化体系展现优异的底物普适性。各类苄醇(包括给电子/吸电子取代3b-3d及邻位取代3e-3f)均能有效转化。体系兼容简单烷基醇(3g)及不同链长烷基醇(3h-3k)。天然产物及药物衍生物烯丙醇(3l-3p)均可高效偶联并保持高对映选择性。

有趣的是,尽管传统人工单变量优化条件(HO)与数据驱动优化条件(BO)差异显著,但二者在绝大多数底物上表现出相当的催化效果(图3b)。产率与对映选择性分析显示,两者均能在多数底物类别中实现中高水平的反应性,未出现某一方法持续占优的情况。UMAP空间分布进一步表明,两种条件均可有效覆盖底物空间。

图4:α-支链醛的底物适用范围。

最后,作者系统研究了α-支链醛的底物适用性(图4)。结果表明,甲基分支(3a, 4a-4d)与苄基分支(4e-4l)的醛类均能高效转化,其中给电子基团有助于稳定阳离子中间体。该体系对亚甲基邻近位点展现出优异兼容性,可适应芳环(4m-4o)、杂环(4p)及烷基链(4q-4r)等多种取代模式。值得关注的是,机器学习优选条件(BO)不仅使反应更加温和可控,还对如4e、4k等特定骨架表现出增强的活性和选择性,凸显了数据驱动方法在反应优化中的精准调控能力。

综上,该研究开发了一种启发式数据驱动策略,通过贝叶斯优化在百万级条件空间中快速筛选得到最优反应条件,并系统验证了底物普适性,成功构建了新型钴(IV)-烯胺协同催化体系,加速了新反应的发现和优化过程。研究工作获得国家自然科学基金、国家重点研发计划及海河实验室资助。(来源:科学网)

相关论文信息:https://doi.org/10.1038/s44160-025-00944-y

 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
非人灵长类多器官衰老分子图谱公布 全球第七个治愈艾滋病的人出现了
综述论文阐释光热甲烷干重整发展全景 大肠杆菌变农药工厂高效合成天然除虫菊酸
>>更多
 
一周新闻排行
 
编辑部推荐博文