来源:Advanced Powder Materials 发布时间:2025/9/3 16:35:40
选择字号:
机器学习驱动的高熵合金微观结构与性能研究进展

论文题目:Machine learning-driven insights into the microstructure and properties of high-entropy alloys

期刊:Advanced Powder Materials

DOI:https://doi.org/10.1016/j.apmate.2025.100331

微信链接:https://mp.weixin.qq.com/s/6niT5ptpVnthuPzwuemwPA

本综述聚焦于机器学习驱动的高熵合金物理性能及应用研究。基于高熵合金的特性,研究涵盖五个主要领域,并探讨了该领域面临的挑战,同时提出了加速材料设计与应用的未来方向。

1.文章摘要

高熵合金(HEAs)是近年来备受关注的一类合金,由五种及以上元素组成。由于其独特的结构和优异的性能,这类合金在材料领域引起了广泛兴趣。然而,这类合金的多组分特性对传统计算方法构成了挑战,因此需要开发替代方法来对其进行分析。机器学习作为人工智能的一个分支,已成为解决HEAs成分和结构固有复杂性的一种颇具前景的方案。本综述聚焦于机器学习的基本定义、流程及其在HEAs研究领域的应用,重点关注相结构、硬度、强度、热力学性能和催化性能的预测。此外,本文还对该研究领域面临的挑战及未来展望进行了阐述。

2.研究背景

图1.机器学习在材料领域的应用以及由机器学习驱动的HEAs微观结构与性能的预测

HEAs又称多主元合金,是一类含至少五种元素的新型合金,具有独特成分、结构和性能。其结构为化学无序但拓扑有序的随机固溶体,常见为面心立方(FCC)、体心立方(BCC)或六方密堆积(HCP)结构,这种独特的结构造成了高熵、晶格畸变、缓慢扩散及鸡尾酒效应。此外,相形成受混合焓、原子尺寸差、价电子浓度(VEC)等影响,使其在机械性能、催化、储能等方面表现优异,具有潜在的应用价值。

鉴于HEAs成分空间的组合爆炸特性,传统研究方法难以应对。而机器学习在大数据集分析上优势显著,能高效、低成本处理数据,探索广阔组合性能空间。其作为多学科交叉的人工智能分支,可借算法让计算机挖掘数据规律并预测未知的结构。本综述阐述了机器学习在HEAs微观结构与性能研究中的应用进展,包括其流程(数据收集、特征工程、建模算法等),以及在相结构、硬度、强度、热力学性质、催化性能预测五个方面的具体应用,最后提出了该领域机器学习的未来发展方向,如应对数据稀缺等挑战。

3.创新点

(1)针对HEAs数据稀缺、特征维度高的问题,优化机器学习流程:整合多源数据(开放数据库、实验与模拟数据)并差异化预处理,结合其物理特性用过滤法、包装法等筛选关键特征,依据数据规模适配模型,提升建模针对性。

(2)突破传统经验规则,实现多性能精准预测:相结构预测中,支持向量机算法结合关键特征达≥90%准确率;力学性能预测融合强化机制,如改进遗传算法降硬度预测误差;热力学与催化性能研究提出新描述符,多目标优化筛选出高效催化剂。

(3)顺应材料信息学趋势,解决小样本问题:用主动学习策略提升强度预测效果;结合SHAP值与密度泛函理论增强模型可解释性;构建“设计-预测-验证”闭环,如高熵金属氧化物催化研究中实验验证高活性催化剂,推动理论到应用转化。

4.文章概述

本综述重点阐明了机器学习在HEAs研究中的应用。HEAs含五种及以上元素,具独特结构与性能,但成分复杂性挑战传统方法,机器学习成为高效解决方案。文章先介绍机器学习流程:数据收集预处理、特征选择、模型选择及构建评估。然后,重点详述其在HEAs中的应用:预测相结构、硬度、强度、热力学性能及催化性能。最后总结指出数据稀缺等挑战,展望结合高通量实验等发展方向。

4.1机器学习流程

图2.机器学习流程图

4.1.1数据收集和预处理

由于机器学习是基于数据来分析物质性质之间的潜在规律,进而预测目标性质,因此数据集的质量决定了各类模型性能的上限,并起着决定性作用。一个合格的数据集必须满足准确性、广泛代表性和足够规模这三个条件。对于HEAs而言,数据通常来源于材料数据库、实验数据和第一性原理计算数据。获取数据后,更重要的步骤是对数据进行预处理,筛选出最有价值且准确的数据来构建模型。数据预处理的目的是改善数据的一致性、完整性和准确性,通常包括数据清洗和标准化处理。

4.1.2特征选择

描述符是用于描述数据样本特征的方法,它们将原始数据处理为机器学习算法可处理的数值向量,例如硬度、电导率等。在描述材料信息的过程中,过多的描述符可能会导致过拟合。因此,去除冗余描述符以使系统模型清晰并保留更多数据的过程被称为特征选择。特征选择通常分为三种方法:过滤法、包装法和嵌入法。

4.1.3模型选择

机器学习的模型选择在人工智能预测材料性能的结果中起着关键作用,合适的学习模型能够确保最终输出结果的可靠性,还能大幅降低模型训练的成本和时间。机器学习模型通过学习训练数据来挖掘目标属性与所选特征之间的潜在联系,无需相关经验和特定函数的辅助即可获得更准确的预测结果。常用的机器学习模型包括:决策树模型(DT)、支持向量机(SVM)、K近邻(KNN)、随机森林(RF)、人工神经网络(ANN)等。

图3.(a)基于学生运动成绩的DT框架图;(b)贝叶斯优化(BO)后的支持向量回归(SVR)流程图;(c)通过参数调整改进的KNN框架图;(d)包含根、节点和叶部分的RF模型常见图形描述;(e)常规ANN框架图

图4.(a)常见的GNN架构;(b)带有生成器和判别器的条件GAN架构;(c)多目标BO设计框架

4.1.4模型构建与评估

机器学习算法分为不同类别,每个类别在应用于特定数据集时表现出最佳性能。通常会选择至少三种合适的算法进行比较。模型性能通过参考不同算法的交叉验证结果或特定数据集的预测结果进行评估,通常采用均方根误差(RMSE)、均方误差(MSE)和相关系数(R²)作为评估函数。模型构建完成后,必须对模型进行优化。也就是说,需要考虑特征集和超参数对模型预测能力的影响。总之,模型评估的目的是提高对目标属性的预测能力,从而提高在遇到未知样本时的准确性。因此,根据特定要求和场景为模型选择多样化的评估指标至关重要,目的是最大限度地减少预测误差。

4.2机器学习在HEAs研究中的应用

作为近年来备受关注的新型材料概念,HEAs与传统合金相比展现出诸多优异性能,包括耐腐蚀性、高力学性能和耐磨性等。然而,由于其成分和结构复杂,研究空间极为广阔。传统计算方法因实际效率低、成本高而难以满足需求。不过,近年来机器学习成为了一种极具前景的解决方案,其在预测HEAs性能方面具有高效、准确且经济的特点。该方法已在HEAs领域得到广泛应用,涵盖了相结构、强度、硬度等多种性能的预测。

4.2.1相结构

HEAs的组成和空间结构十分复杂,因此存在多种相类型。不同研究对HEAs相的分类也各不相同,包括固溶体(SS)、中间化合物(IM)和混合相。对于不同的相,其微观结构和力学性能也大不相同,因此为了能够获得合金的理想性能,相结构的预测是最关键、最重要的。机器学习算法已成为预测HEAs相结构的一种高效研究方法。Islam等人用含118个实例和6个特征的小数据集训练ReLU隐层神经网络,因数据量小出现过拟合,建议扩大数据集;黄等人比较KNN、SVM和ANN,发现MLFFNN二元分类更优,但过度依赖传统描述符,建议开发成分-过程联合描述符;李等人基于322个数据集,通过特征选择优化SVM模型获高准确率并成功预测新HEAs,受限于样本量建议扩大稀有相数据;Risal等人选取6个特征,经数据预处理和多算法比较,KNN和RF在过采样数据集上准确率最高,建议引入原子级特征和高通量数据;张等人构建框架用GA筛选模型与特征组合,结合主动学习提升准确率,但是只关注成分相关性,建议构建全链路预测框架。

图5.(a)包含两个隐藏层的NN模型结构;(b)包含347个HEAs中各相标签的散点图;(c)前向特征搜索过程;在特征选择过程中测试原始数据集和SMOTE数据集的准确性;(d)三个阶段的输入特征散点图

图6.(a)HEAs的微观结构示意图;(b)筛选学习模型和特征子集最佳组合的流程图;(c)AL流程图

4.2.2硬度预测

HEAs具有特殊的结构和功能特性,这归功于其组成元素的多样性。这些元素之间的相互作用导致合金的混合熵增加,从而对硬度等机械性能产生影响。在众多重要的工业材料中,硬度对材料在使用过程中的性能有很大影响。因此,要成功开发出具有所需机械性能的HEAs,硬度的预测和设计是必不可少的。高等人用184个和261个数据集,通过XGBoost、RF等算法及特征选择(如VEC、第三电离能)预测,指出数据集小的局限;李等人用增强型遗传算法提升特定合金硬度预测效率,建议扩展至多变量体系;Catal等人设计RHEAs,因未纳入微观结构导致高温强度预测误差,建议补充相关特征;陈等人用分层集成学习,739个数据集的EN2模型准确率达R²=0.944,建议扩展数据集多样性;另有研究构建综合预测系统,关联微观结构与宏观性能,筛选出优质合金。这些研究均指出需扩大数据集规模与多样性以提升模型性能。

图7.(a)不同机器学习模型预测准确度的比较图表;(b)RF模型在测试集和训练集上的预测误差;(c)预测误差与特征数量的关系图。每个点代表特征子集;红色曲线表示平均误差值,蓝色曲线表示最低误差值;(d)基于SVR-R模型十折交叉验证结果的预测硬度值与测量硬度值之间的关系

图8.(a)基于ANN模型预测的硬度数据集与实际值的比较;(b)合金1、2、3的实际与预测抗压强度的比较;(c)合金1、2、3的实验结果与预测值的硬度和应变关系图

4.2.3强度预测

HEAs通常是由五种或更多元素组成的合金,由于这些元素之间的相互作用,HEAs表现出特定的效应,如晶格畸变和鸡尾酒效应。这些效应导致了合金具有卓越的性能,强度通常是结构材料的重要性能指标。在某些特殊应用中,如汽车、飞机和船舶制造,对结构材料有极高屈服强度的合金需求。因此,对于具有严格强度性能要求的合金而言,准确预测强度至关重要。多项研究运用机器学习预测HEAs强度等性能。Bhandari等人首用RFR算法预测不同温度下屈服强度,238个样本数据集表现良好,但因缺微观结构参数有局限;严等人用四种算法优化,GB算法综合最优,然数据集多为单相合金;张等人借AL思路选特征,高效发现高强度HEAs,却受小数据集限制;李等人结合沉淀强化机制与机器学习,提升了合金屈服强度;贺等人开发综合框架预测RHEAs屈服强度和断裂应变,未实现强塑协同优化;另有研究探究了CoCrFeMnNi合金在高应变率下的力学行为,为其应用提供理论基础。

图9.(a)MoNbTaTiW合金和(b)HfMoNbTaTiZr合金基于RF模型的屈服强度预测结果;作者提出的特征选择策略与传统策略在文献数据集(c)和实验数据集(d)上的AL效率结果对比图

图10.(a)结合强化机制、机器学习和实验合成设计合金的流程图;不同特征对屈服强度模型(b)和断裂应变模型(c)中SHAP值的影响

4.2.4热力学性质预测

除了机械性能外,HEAs的热力学性质也至关重要。晶格热导率、熔化熵和马氏体转变温度等关键性质对于揭示HEAs的热力学特性至关重要。传统的实验或理论计算往往耗时且成本高昂。然而,机器学习方法提供了一种潜在的解决方案,能够以更高的效率和更低的成本探索HEAs的庞大组成空间。这种方法为新材料的设计与开发提供了有力支持。Sandeep等人以应变、温度和应变率为输入,用五种机器学习算法预测CoCrCu1.2FeNi合金流动应力,RF和KNN模型表现最优(R²分别为0.987、0.986),但极端条件下可靠性待验证;田等人构建流程预测HESMA的MpThy,XGBR模型最佳(R²分别为0.749、0.814),然数据集元素组合单一;刘等人建模预测合金成分与Ms关系,提升了TiZrHfNiCuCo合金Ms值,却存在成本和环境兼容性问题;张等人针对HEAs热力学稳定性,提出新描述符和分类方法,优化Ti-Zr-Hf-Nb-Ta合金模型(R²=0.94),突破传统限制,可扩展至更多体系。这些研究各有成效,但仍存在可以改进和需要完善的地方。

图11.(a)采用RF模型在1123K温度下预测应变率的结果与实验结果的对比图,以及(b)RF和KNN模型在预测新温度下流动应力时的性能指标对比图;使用LOO-CV获得的最终R2分数结果的图,分别对应(c)Mp和(d)Thy模型

图12.(a)χ特征值与SHAP值之间的关系图,以及(b)元素组成对合金中Ms值影响的等高线图;(c)基于DFT数据集构建CE模型的流程图,以及(d)DFT与CE计算中形成能的差异,以及在测试集和训练集上的R²值比较。

4.2.5催化性能预测

目前,全球能源消耗量持续增长,随之而来的环境挑战愈发突出。因此,迫切需要研发有效的方法来实现清洁可持续能源的转化与储存。催化技术在解决这一问题方面展现出巨大潜力。金属催化剂尤其是HEAs,已成为极具潜力的催化剂类别,其催化性能优于传统合金。此外,机器学习已成为加速识别HEAs催化剂的关键工具。陈等人以Fe0.2Co0.2Ni0.2Cu0.2Mo0.2合金(111)表面为对象,构建NN模型预测CO2RR中间体吸附能,发现可打破标量关系,然未考虑实际电催化环境影响;单等人结合数据驱动与高通量计算,筛选PtPd基HEAs析氢催化剂,建议扩展至更多反应类型;徐等人构建多目标进化算法框架探索ORR催化剂,虽提升筛选综合性,但忽视稳定性等因素;Clausen等人设计计算框架加速HEAs催化剂开发,仅单目标优化催化活性;段等人用机器学习预测HEOs催化氧化性能,高效筛选出高活性样品,却存在训练集多样性不足等问题。

图13.(a)CO2RR催化反应过程及COOHA和CHOA在AS1上的旋转;(b)微尺度HEAs催化剂阵列的设计、合成与表征过程

图14.(a)HEAs用于ORR的电催化剂设计框架图,以及(b)基于机器学习的催化活性预测示意图,以及机器学习预测与DFT计算在两个域外数据集上的吸附焓值的对比图

图15.(a)采用机器学习方法预测ACr2Ox体系晶体相结构及催化性能的方案,(b)结合分类模型进行预测验证样本的标注策略,以及(c)基于催化活性回归模型对CH4、CO、C3H6的催化方案和五折交叉验证R²值。

5.结论与展望

在本综述中,我们利用机器学习方法对HEAs的微观结构和性能进行了深入分析。首先,我们对机器学习进行了概述,重点介绍了机器学习的过程:数据采集与处理、特征选择、模型选择、模型构建与评估,以及每个过程中所采用的方法。例如,介绍了包括SVM、RF、KNN、ANN和GAN在内的八种算法用于算法选择。随后,列出了机器学习在预测HEAs微观结构和性能方面的应用。这主要包括相组成、硬度、强度、热力学性质和催化性能。通过这些性能预测结果,我们可以看出机器学习在促进HEAs研究方面发挥了重要作用,这主要体现在机器学习在处理大量HEAs数据时更加高效,能够大幅减少人工试错所需的时间和成本。此外,它还能在巨大的成分空间中探索潜在的新材料,为未来HEAs研究提供了新的思路和机遇。

尽管机器学习在HEAs研究领域具有巨大潜力,且在机器学习的帮助下,HEAs研究已取得显著进展。然而,HEAs研究仍面临诸多挑战,其未来发展方向可从以下方面展开:

(1)多组分元数据匮乏与高维特征空间:HEAs因组成空间大、数据匮乏引发维度灾难,传统合成难建大数据集,且特征维度高影响模型性能。可结合高通量实验与AL算法减少冗余数据,构建开放数据库并制定标准,提升模型迁移能力。

(2)复杂的物理机制与先验知识缺失:HEAs的高熵效应等独特物理机制未被充分量化,原子尺度畸变与宏观性能难关联。可开发新描述符并结合传统的构建分层特征空间,整合多尺度模型形成跨尺度预测框架。

(3)模型可解释性与物理机制一致性:HEAs的复杂映射导致机器学习建模与物理机制脱节,静态模型难捕捉动态过程。可联合SHAP与DFT验证物理机制,在模型训练中添加惩罚项,迫使结果符合物理规律。

(4)跨学科协作与技术集成障碍:材料科学家与机器学习专家知识难互通,数据格式不统一,缺实验验证-模型更新反馈,难成闭环。未来可整合自动化平台建闭环流程,开发专用工具包简化操作。

引用信息:Xiaoyi Zhang, Wenhan Zhou, Xiang Li, Tong Xu, Yongzhen Yu, Lei Zheng, Guanhua Jin, Shengli Zhang, Machine learning-driven insights into the microstructure and properties of high-entropy alloys, Adv. Powder Mater. 4 (2025) 100331.

https://doi.org/10.1016/j.apmate.2025.100331

扫二维码 查看全文

原文链接:https://www.sciencedirect.com/science/article/pii/S2772834X25000673

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
全球海平面上升速度加快 海洋可控源电磁探测技术创新应用获突破
科学家首次发现富含硅、硫的超新星 科学家发现将阳光转化为燃料的新方法
>>更多
 
一周新闻排行
 
编辑部推荐博文