近期,北京大学材料科学与工程学院莫凡洋团队在柱层析分离技术领域取得重要进展。研究团队通过结合自动化实验与机器学习方法,成功开发出柱层析分离条件的智能预测模型。相关成果"Intelligent Column Chromatography Prediction Model Based on Automation and Machine Learning"于2025年5月29日在线发表于Chem期刊。论文通讯作者是莫凡洋长聘副教授,第一作者是吴文超。

图1:自动化与机器学习结合建立柱层析预测模型。
柱层析作为有机化学实验室最常用的分离纯化手段,其分离条件的确定需要实验人员富有经验。然而经验的取得通常需要长周期的培养和个体实践,而形成的认知体系深度绑定于特定实验系统与个人身上,呈现个体差异大,难以标准化,也难以进行知识传递升级,严重迟滞了技术创新迭代速率。
针对以上问题,研究团队开展柱层析机器学习预测模型研究。首先构建了自动化实验平台,系统采集了218种有机化合物在6365次柱层析实验中的保留体积数据,建立了标准化数据集。该数据集不仅包含详细的分子结构特征,还整合了洗脱剂比例、上样质量、层析柱规格等关键实验参数。通过这种标准化数据采集方式,可将传统依赖经验的分离过程转化为可量化分析的科学问题。

图2:特征工程。
基于这些实验数据,研究团队开发了分位数几何增强图神经网络(QGeoGNN)模型。该模型通过构建原子-键图(GraphG)和键-角图(GraphH)双重图表征,实现了对分子三维结构特征和实验条件的协同建模。其中,原子-键图精确描述了分子的拓扑结构,而键-角图则有效捕捉了分子的空间构型特征。研究还创新性地将实验参数嵌入图神经网络的边特征,使模型能够同时考虑分子特性和实验条件的影响。实验验证表明,该模型对保留体积的预测决定系数R2达到0.9以上,显著优于传统经验方法。此外,模型采用的分位数学习技术还能提供预测结果的置信区间,为实验设计提供更多参考信息。

图3:不同算法训练结果对比。
在实际应用验证中,研究团队选取了包括Claisen重排反应、钯催化偶联反应、氰基加成反应等在内的多类典型有机反应体系进行系统测试。结果显示,该智能预测系统对不同规格层析柱(4g-40g)和多种溶剂体系(如石油醚/乙酸乙酯、二氯甲烷/甲醇等)均表现出良好的适用性。研究提出的分离概率(Sp)指标能够定量评估特定条件下混合物的分离效果,为实验设计提供了可靠的量化依据。通过核磁共振验证,模型预测的分离条件获得的产物纯度均达到预期标准。这些成果充分证明了智能预测模型在实际化学研究中的实用价值。

图4:实验验证。
这项研究不仅为有机合成中的纯化工艺优化提供了新的技术手段,也为人工智能在化学领域的应用开辟了新方向。目前相关数据集和模型代码已在GitHub平台开源,为后续研究提供便利。(来源:科学网)
相关论文信息:https://doi.org/10.1016/j.chempr.2025.102598