近日,中国科学技术大学商红慧特任教授、杨金龙院士团队将人工智能领域的Transformer架构与量子物理的基本方程相结合,发展了一种求解多电子薛定谔方程的乾坤网络(QiankunNet)。9月29日,该研究成果发表于《自然-通讯》。
薛定谔方程是量子力学的基本方程。从原理上讲,所有材料的性质都来源于多电子薛定谔方程的求解,因此精确求解该方程是整个物质科学领域的重大挑战之一。对于包含多个电子的复杂体系,求解薛定谔方程的计算量会随着电子数的增加呈指数级增长,这一“指数墙”问题极大地限制了传统计算方法的能力,使其难以精确模拟真实的分子体系和化学反应。
为攻克这一难题,研究团队从人工智能领域的Transformer架构中汲取灵感,将其核心的注意力机制引入量子波函数的构建中,利用其强大的关联建模能力来捕捉电子之间复杂而微妙的相互作用。所构建的乾坤网络不仅在结构上实现了对电子波函数的精确表达,而且采用端到端的可微分架构,利用反向传播直接优化变分能量。
研究团队还发展了一套结合了蒙特卡洛树搜索的高效自回归采样算法。该算法通过并行生成独立的、无关联的电子构型样本,避免了传统采样方法中存在的样本相关性高、收敛慢等瓶颈,极大地提升了计算效率和稳定性。同时,该框架还通过引入基于组态相互作用方法的物理启发初始化策略,显著加速了变分优化的收敛过程。
研究结果表明,乾坤网络在包含30个自旋轨道以内的分子基准测试中表现卓越,其计算的关联能精度达到了全组态相互作用方法的99.9%。在处理化学键解离等强关联问题时,乾坤网络展现出相较于传统耦合簇方法更优越的性能。与之前的神经网络量子态方法相比,该方法不仅计算速度更快,精度也更高。
进一步地,研究团队将该方法应用于模拟生物氧化应激过程中的核心反应——芬顿反应。结果充分展示了该方法在处理含过渡金属的复杂化学体系方面的能力和广阔应用前景。
这项研究不仅展示了人工智能模型在解决基础科学难题方面的巨大潜力,还为精确模拟复杂分子体系提供了新工具。这一成果预示着一个新的发展方向:注意力机制不仅可以处理自然语言,还能表征量子波函数,这意味着可以将大语言模型架构引入到量子化学的核心领域。
相关论文信息:https://doi.org/10.1038/s41467-025-63219-2
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。