馬妞妞,劉翠霞,堅增運(yùn)
(西安工業(yè)大學(xué) 材料與化工學(xué)院,西安710021)
高熵合金(High-Entropy Alloys,HEAs)其獨(dú)特的微觀結(jié)構(gòu)和優(yōu)異的性能,包括強(qiáng)抗氧化性、優(yōu)異的機(jī)械性能、良好的熱穩(wěn)定性和理想磁性等引起了各個領(lǐng)域的極大關(guān)注。根據(jù)合金成分-微觀結(jié)構(gòu)-性能之間的關(guān)系表明HEAs的優(yōu)異性能取決于生成相的組成,故深入了解相階段對于進(jìn)一步開發(fā)具有所需性能的HEAs至關(guān)重要。而作為多主元素合金,HEAs各元素之間接近等原子比或接近等原子組成,使其擁有巨大的搜索空間,使得從可用元素調(diào)色板中制造出大量不同系統(tǒng),設(shè)計開發(fā)具有前途的新型HEAs十分困難。機(jī)器學(xué)習(xí)(Machine Learning,ML)應(yīng)運(yùn)而生,作為一種數(shù)據(jù)驅(qū)動方法,經(jīng)濟(jì)高效的特點(diǎn)使得其很快在材料領(lǐng)域得到發(fā)展和應(yīng)用。材料信息學(xué)將其用于相階段預(yù)測,它可以幫助確定一個包含所需性能候選合金的較小子空間,減少大量實驗過程中人和物品的損耗。
文獻(xiàn)[1]關(guān)于多主元素合金的初次報告就引起了工業(yè)研究領(lǐng)域的關(guān)注,其研究了等原子多組分合金成分FeCoNiMnCr,表現(xiàn)出了單一FCC固溶體。文獻(xiàn)[2]研究了多種元素的不同組合,例如Co、V、Al、Mo、Ti、Zr和Nb,其表現(xiàn)出比傳統(tǒng)合金更好的機(jī)械性能。傳統(tǒng)的試錯實驗需要花費(fèi)大量的時間和金錢,同時對實驗條件要求苛刻、不能短時間內(nèi)進(jìn)行大量時間。隨著研究的進(jìn)行,人們對HEAs的研究越來越深入。HEAs優(yōu)異的性能被認(rèn)為取決于第二相的類型和分?jǐn)?shù),文獻(xiàn)[3]進(jìn)行了計算輔助參數(shù)方法,對雙相HEAs中的定量相預(yù)測。文獻(xiàn)[4]對多組分合金進(jìn)行了從頭相穩(wěn)定性和機(jī)械性能的研究,提供了迄今為止使用離散傅里葉變換研究的多主要元素合金和各種材料特性的廣泛匯編。同時,大量計算智能模擬方法應(yīng)用在HEAs相預(yù)測,例如,第一性原理計算[5]、參數(shù)方法[6]、CALPHAD[7]等。文獻(xiàn)[8]使用 CALPHAD 方法開發(fā)了一個組合數(shù)據(jù)庫,該數(shù)據(jù)庫集成了一系列過渡金屬的熱力學(xué)描述、遷移率和摩爾體積,其展示了該數(shù)據(jù)庫在預(yù)測 Co-Cr-Fe-Mn-Ni 體系中的相關(guān)系方面的成功應(yīng)用。這些常規(guī)的方法研究HEAs比較準(zhǔn)確但其成本高昂、同時存在的其他多種影響因素,使得其設(shè)計難度較大。為此,尋找一種更有效的途徑來加快其成分空間的探索已成為當(dāng)前迫切需要解決的問題。其作為最有前途的結(jié)構(gòu)和功能材料具有廣泛潛在應(yīng)用。ML作為一種數(shù)據(jù)驅(qū)動方法,能夠自主學(xué)習(xí),可用于從預(yù)定的先驗實驗觀測數(shù)據(jù)進(jìn)行推斷和分類[9]??梢缘靥岣呙總€新數(shù)據(jù)樣本的性能,并從復(fù)雜、異構(gòu)和高維數(shù)據(jù)中發(fā)現(xiàn)隱藏的見解,而無需顯式編程。經(jīng)濟(jì)高效的特點(diǎn)使得ML很快在材料領(lǐng)域得到發(fā)展和應(yīng)用。文獻(xiàn)[10]采用三種不同的 ML 算法:K-最近鄰(K-Nearest Neighbors,KNN)、支持向量機(jī)(Support Vector Machine,SVM)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)對HEAs進(jìn)行生成相預(yù)測,測試精度值分別達(dá)到 68.6%、64.3% 和 74.3%。文獻(xiàn)[11]采用四種ML算法,即決策樹(Decision Tree,DT)、KNN、SVM和ANN,研究了兩個不同數(shù)據(jù)集的相位選擇規(guī)則,一個由1761個不含AM或IM相位的固體溶液(SS)HEAs組成,另一個由2436個HEAs組成,同時進(jìn)行交叉驗證以優(yōu)化ML模型,考慮了生成相對HEAs模型的預(yù)測精度。文獻(xiàn)[12]對采用主成分分析與否對ML算法的影響,實驗數(shù)據(jù)比較證實了應(yīng)用 KPCA 后DT 和隨機(jī)森林(RF)的準(zhǔn)確性有所提高。使用ML對HEAs進(jìn)行相階段預(yù)測仍存在許多需要解決的問題,例如:缺乏統(tǒng)一的相形成規(guī)則、完備的實驗數(shù)據(jù)庫以及用于預(yù)測的機(jī)器模型算法仍需提高其精度等,這使得之前的研究都不夠全面完備。
文中擬從數(shù)據(jù)收集開始,通過綜合考慮選擇適合于HEAs設(shè)計的小數(shù)據(jù)集,由實際問題和數(shù)據(jù)集出發(fā),進(jìn)行HEAs生成相的預(yù)測,了解合金成分-微觀結(jié)構(gòu)-性能之間的聯(lián)系,對于進(jìn)一步輔助設(shè)計開發(fā)新型合金奠定基礎(chǔ);文中從多分類和多標(biāo)簽兩方面進(jìn)行建模,選擇主流算法實現(xiàn)生成相的預(yù)測;同時進(jìn)行特征重要性分析,通過控制去除特征參數(shù)的數(shù)量,達(dá)到探究特征參數(shù)對模型的準(zhǔn)確率的影響的目的。
文中所使用的HEAs實驗數(shù)據(jù)集從相關(guān)文獻(xiàn)[13-19]中收集,并進(jìn)行篩選和處理,最終得到306組樣本數(shù)據(jù)。HEAs的特征屬性,包括合金元素組成、溫度、制備工藝、屈服強(qiáng)度、構(gòu)型熵以及價電子濃度等均對HEAs相生成有關(guān)鍵影響。由以往研究成果和實際情況等綜合考量,最終選擇9種常用于ML特征參數(shù)作為輸入數(shù)據(jù),分別為原子尺寸參數(shù)(δ)、混合焓(ΔHmix)、電負(fù)性(Δχ)、無量綱參數(shù)(Ω)、二元相互作用的混合自由能的二階導(dǎo)數(shù)參數(shù)(μ)、價電子濃度(VEC)、流動電子濃度(e/a)、原子間距錯配度(Sm)、體積模量錯配度(Km)。
HEAs生成相的種類有面心立方晶體結(jié)構(gòu)(FCC)、體心立方晶體結(jié)構(gòu)(BCC)、塊狀金屬玻璃(BMG)、金屬間化合物(IM)、σ相、B2 相和 Laves(L)相[20-22]。根據(jù)數(shù)據(jù)樣本大小和實際需求,由于σ相、B2相和Laves(L)相數(shù)據(jù)所占比例較小故,將其和其他未檢測到的相統(tǒng)稱為多相(MultiPhase)。經(jīng)過數(shù)據(jù)處理后最終采用FCC、BCC、BMG、IM和MultiPhase五種相結(jié)構(gòu)進(jìn)行預(yù)測。
在將HEAs數(shù)據(jù)集用于訓(xùn)練模型之前,首先對HEAs數(shù)據(jù)集進(jìn)行如下操作:首先設(shè)置兩組數(shù)據(jù)集,數(shù)據(jù)集1作為多分類模型的總實驗數(shù)據(jù)集,采用9種特征參數(shù)作為輸入數(shù)據(jù),同時將5種生成相作為輸出數(shù)據(jù),為了探究特征參數(shù)數(shù)量對模型的影響,分別組成含有Δχ,VEC,δ,3個特征參數(shù)的數(shù)據(jù)子集1,含有Δχ,VEC,δ,Ω,Sm,5個特征參數(shù)的數(shù)據(jù)子集2,含有Δ,VEC,δ,Ω,Sm,Km,μ,7個特征參數(shù)的數(shù)據(jù)子集3;數(shù)據(jù)集2采用與數(shù)據(jù)集1相同的特征參數(shù),但輸出數(shù)據(jù)選擇7種生成相(FCC,BCC,BMG,σ,IM,B2和L)作為參照標(biāo)準(zhǔn),同時每一組樣本可以屬于多種類別。
圖1為三種特征參數(shù)(δ,VEC,Δχ)相關(guān)的306組HEAs生成相的分布情況,HEAs數(shù)據(jù)集來自數(shù)據(jù)集1。由圖可以看出,五類相在空間分布重合部分較少,ML模型可有效識別生成相,提高其預(yù)測精度。
圖1 HEAs數(shù)據(jù)集的生成相分布可視化圖
在預(yù)測HEAs生成相的實驗過程中,其合金特征參數(shù)的選擇是保證實驗成功的關(guān)鍵,它不僅決定了訓(xùn)練ML預(yù)測生成相模型效果的上限,同時還實現(xiàn)對5種生成相的合理分類。由于無關(guān)的特征對HEAs中的相位分類是冗余的,在實驗中增加預(yù)測特征的數(shù)量可能會引發(fā)維數(shù)災(zāi)難的問題,故選取與HEAs相最相關(guān)的9種特征參數(shù)。為了保證選取到最適宜的特征參數(shù),優(yōu)化HEAs生成相模型的泛化能力,同時盡可能減少實驗過程中過多合金特征帶來的維度災(zāi)難,減少訓(xùn)練時間、減少過擬合、增強(qiáng)對HEAs特征值的理解,對數(shù)據(jù)集進(jìn)行簡單的特征子集分類。最后,為實現(xiàn)最佳分類精度,對數(shù)據(jù)集進(jìn)行預(yù)處理,保留與相位分布相關(guān)的特征,對實驗結(jié)果進(jìn)行對比分析。
文中使用一些被廣泛接受的經(jīng)驗參數(shù)作為HEAs生成相的特征參數(shù)。通過冗余檢查,并通過相關(guān)系數(shù)選擇最佳的9種經(jīng)驗參數(shù)作為文中特征參數(shù)。圖2所示為皮爾遜相關(guān)系數(shù)熱圖以檢查特征參數(shù)之間的正相關(guān)和負(fù)相關(guān)。
圖2 HEAs特征參數(shù)皮爾遜相關(guān)系數(shù)熱圖
從圖2中可以看出這9個經(jīng)驗參數(shù)之間的相關(guān)性,如,和相關(guān)系數(shù)達(dá)到了0.87,具有很強(qiáng)的相關(guān)性,在特征選擇時優(yōu)先考慮。在HEAs生成相預(yù)測實驗中作為依據(jù),選擇相關(guān)性高的特征以表征合金屬性。表1展示了文中實驗數(shù)據(jù)所采用的9個特征參數(shù)的相關(guān)定義。
表1 HEAs生成相相關(guān)特征參公式[23]
文中基于PyCharm編譯平臺,使用Python作為編程語言,同時使用Scikit-Learn作為開源庫。利用ANN、SVM、特征選擇等[23]技術(shù)對HEAs的相結(jié)構(gòu)進(jìn)行預(yù)測,預(yù)期發(fā)現(xiàn)HEAs類和生成相的相互關(guān)系。如圖3階段預(yù)測分類的ML建??蚣芩?首先從已有論文和實驗資料中收集大量的HEAs數(shù)據(jù),經(jīng)過篩選和清洗數(shù)據(jù)得到最終用于文中的HEAs相預(yù)測實驗數(shù)據(jù)集。對于HEAs相預(yù)測的實驗,選擇了多分類和多標(biāo)簽分類兩種模型進(jìn)行實驗,同時選擇目前ML的主流算法分別對收集到的HEAs數(shù)據(jù)集進(jìn)行相預(yù)測測試。為了盡量保證實驗的準(zhǔn)確度和減小誤差,通過對不同模型的實驗參數(shù)進(jìn)行調(diào)整達(dá)到優(yōu)化模型的目的。在實驗最后通過不斷測試以及模型調(diào)整,詳細(xì)記錄了不同模型和算法的最終相預(yù)測相關(guān)數(shù)據(jù)。
圖3 HEAs階段分類的ML建??蚣?/p>
使用歸一化對對HEAs數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理,數(shù)據(jù)歸一化會使得求得最優(yōu)解的過程變得更加平滑,減少時間,從而可以更好的得到最優(yōu)解。HEAs數(shù)據(jù)集特征參數(shù)歸一化處理前后的對比如圖4所示,為9個特征參數(shù)歸一化前后的分布。
圖4 HEAs特征參數(shù)歸一化處理前后的對比
文中對HEAs生成相的預(yù)測過程中采用了有監(jiān)督學(xué)習(xí)算法。對于HEAs生成相預(yù)測使用的多分類算法學(xué)習(xí)模型包括:KNN,DT,RF,SVM,ANN,梯度提升樹(Gradient Boosting Decision Tree,GBDT)、自適應(yīng)增強(qiáng)(Adaptive Boosting,AdaBoost)和XGBoost(eXtreme Gradient Boosting)。用多標(biāo)簽學(xué)習(xí)模型進(jìn)行HEAs相預(yù)測,選擇了KNN,DT,RF和GBDT算法。對于不同問題的提出與數(shù)據(jù)結(jié)構(gòu)的不同,學(xué)習(xí)算法的選擇依賴于收集到的HEAs數(shù)據(jù)結(jié)構(gòu)以及對實驗問題的提出和達(dá)到的目的。文中通過對ML用于材料研究方面的主流學(xué)習(xí)算法進(jìn)行分析,以尋求和識別最適用于解決本次HEAs相預(yù)測的最佳策略。
兩個HEAs數(shù)據(jù)集都被隨機(jī)分為兩個子集,訓(xùn)練集占80%的樣本數(shù)據(jù),其被用來訓(xùn)練和選擇生成相預(yù)測模型的最佳參數(shù),測試集占用20%的樣本數(shù)據(jù),被用來評估模型的精度和泛化能力。同時為進(jìn)一步從有限的高熵數(shù)據(jù)樣本中獲取有效信息以及在一定程度上減小過擬合問題,實驗過程中采用交叉驗證方法,對模型進(jìn)行實施培訓(xùn)和測試。
評價分類器性能的指標(biāo)一般是分類準(zhǔn)確率(Acc),但對于二分類問題,其評價指標(biāo)為精確率(Precision)與召回率(Recall),除此之外還有F1值(F1Score)、PR曲線、ROC曲線、AUC等幫助理解的評估標(biāo)準(zhǔn)。對于分類算法只使用準(zhǔn)確率的評價標(biāo)準(zhǔn)是不夠的,且對于一些情況是存在問題的,需要使用混淆矩陣進(jìn)行進(jìn)一步分析。
使用的混淆矩陣評價指標(biāo)正確率和Kappa指數(shù)由式(1)(2)給出,同時表2給出了術(shù)語的解釋。評價指標(biāo)定義為
(1)
表2 評估指標(biāo)相關(guān)描述
(2)
針對收集到的306組樣本進(jìn)行實驗,其包含9種特征參數(shù)。選擇了基于DT、RF、GBDT和XGBoost對特征重要性進(jìn)行簡單的選擇以及特征重組,從而提高其可用性以及識別提供最佳分類性能的特征子集。圖5為DT、RF、GBDT和XGBoost四種算法對HEAs相關(guān)的9個特征的重要性曲線。其計算了研究所選HEAs特征參數(shù)在預(yù)測生成相過程中的有用程度,可以加深對HEAs規(guī)律以及模型更深入的了解,提高HEAs預(yù)測模型的效率。
圖5 DT、RF、GBDT和XGBoost特征重要性曲線
圖5給出了進(jìn)行二分類和多分類的特征重要性曲線,流動電子濃度(e/a)對各合金相的形成規(guī)則可忽略。同時在合金相形成階段可將電負(fù)性、價電子濃度和原子尺寸差作為主要預(yù)測特征參數(shù)。
由圖5可以看出,特征重要性曲線遵循相位形成規(guī)則,各主元的晶格類型對形成簡單固溶體的影響較大,晶體結(jié)構(gòu)相同時,有利于各組元的固溶,形成無限固溶體。當(dāng)各主元的晶格類型不同時,主元間原子固溶受到抑制,只能形成有限固溶體,同時,原子在發(fā)生擴(kuò)散固溶的同時,會造成晶格的變形,當(dāng)溶質(zhì)原子半徑大于溶劑原子半徑時,晶格會發(fā)生膨脹,反之,則會收縮。晶格的變形程度取決于各主元原子半徑之差,在一定條件下,原子尺寸差異較小時易形成固溶體、當(dāng)混合焓相同時,混合熵越大,則吉布斯自由能越小,體系傾向于生成簡單固溶體。熵作用判據(jù)認(rèn)為,混合焓和混合熵在體系凝固過程中處于相互競爭的關(guān)系,可以把混合熵和混合焓看作是形成固溶體的驅(qū)動力和阻力。當(dāng)熵作用判據(jù)大于1時,表明混合熵提供的驅(qū)動力大于混合焓產(chǎn)生的阻力,有助于體系形成簡單固溶體;反之,驅(qū)動力小于阻力,體系易形成金屬間化合物,并會導(dǎo)致成分偏析。
通過表1所展現(xiàn)的不同算法在合金相位預(yù)測的重要設(shè)計參數(shù),分別選取前3個、前5個、前7個和所有9個特征進(jìn)行不同分類器的精度、Kappa指數(shù)以及ROC-AUC曲線的分類性能統(tǒng)計測量。統(tǒng)計分類結(jié)果見圖6,表3和表4。
表3 不同特征組合的不同ML算法的分類精度
表4 不同模型關(guān)于所選特征數(shù)量的Kappa系數(shù)Tab.4 Kappa coefficients for different models regarding the number of selected features
圖6 ROC-AUC曲線
由圖5以及表3、表4可以發(fā)現(xiàn)在ML算法中,選擇合適的特征參數(shù)可以很好的避免數(shù)據(jù)的冗余,有效提高了預(yù)測分類精度,且經(jīng)過排序的特征子集提供了更穩(wěn)健的性能預(yù)測。對于殘余排序的特征參數(shù)來說,其排名順序為Δχ,VEC,δ,Ω,Sm,Km,μ,Hmix和e/a。其中,e/a作為特征參數(shù),在預(yù)測性能評估表現(xiàn)不佳。也可以看出,不同的特征參數(shù)對于不同分類器的重要性大體上是沒有巨大的區(qū)別,但也有些特征參數(shù)對于某一個分類器影響很大,其中KNN和DT對于參數(shù)數(shù)量的變化不敏感,但參數(shù)數(shù)量變化對ANN算法的分類精度影響較大,在只有前3個特征參數(shù)時,ANN預(yù)測模型達(dá)到最高0.818 2,但在參數(shù)數(shù)量為7時達(dá)到最低為0.688 3。
表3和表4總結(jié)了不同特征分類子集對不同算法模型的總體性能統(tǒng)計測量??梢灾庇^地看出,不同分類器對同樣的數(shù)據(jù)集表現(xiàn)不同,總體來說RF、SVM和KNN分類器比較適用于小數(shù)據(jù)集的預(yù)測,故其在文中性能優(yōu)于其他算法模型。準(zhǔn)確率和Kappa系數(shù)作為衡量多分類性能的常用評估標(biāo)準(zhǔn),在特征參數(shù)為3的數(shù)據(jù)集,ANN分類器得到了最好的分類準(zhǔn)確率0.818 2和Kappa系數(shù)0.708 4。在特征參數(shù)為9的數(shù)據(jù)集中,RF和SVM達(dá)到最好分類精度和Kappa系數(shù),分別為0.831 2,0.748 1和0.857 1,0.787 2。這說明在不同的特征參數(shù)數(shù)量的選擇對于學(xué)習(xí)模型的質(zhì)量是十分重要的。
混淆矩陣在二分類模型的應(yīng)用中十分實用。其通過將預(yù)測結(jié)果與真實結(jié)果相對比,給出了四種評價模型的定義。在HEAs相多分類場景中,這樣會導(dǎo)致真否定數(shù)的增加,導(dǎo)致特異性膨脹(TN/(TN+FP)),由于把生成相分為五種類別,故簡單繪制數(shù)據(jù)集的ROC曲線不具有實際意義。而多類分類的軟分類器用于評估提供分?jǐn)?shù)而不是預(yù)測的輸出,故使用截止來評估多類分類器的性能或曲線下面積(AUC),通過對不同算法對每個類別繪制ROC-AUC曲線,可以更加直觀的看到不同分類器對于HEAs特征參數(shù)及生成相預(yù)測的影響。圖6繪制了不同算法的ROC-AUC曲線。由圖可知,每個ROC曲線針對不同類別進(jìn)行了繪制,每條曲線繪制時,將此類別設(shè)置為正,其他類別設(shè)置為負(fù),其去線下面積(AUC)越大,其基尼指數(shù)越小,其隨機(jī)變量的不確定度越小,表明模型質(zhì)量越好,具有更好的泛化性。
現(xiàn)實情況下,HEAs由于其溫度、制備工藝以及其他各種問題,其不會產(chǎn)生單一的相。同時不同合金相的區(qū)別很大,除研究所搜集的FCC、BCC、BMG、σ、IM、B2和L其中相以外,還包括金屬間化合物(IM)、固溶體相(SS)、非晶相(AM)以及混合相等。單一的按照多分類算法無法滿足實際中的需求,而ML中的多標(biāo)簽算法則能解決因此帶來的問題。但相生成數(shù)量無法確定以及類標(biāo)簽之間相互依賴,導(dǎo)致多標(biāo)簽的訓(xùn)練集比較難以獲取,這時多標(biāo)簽分類算法的難題。文中簡單實現(xiàn)對HEAs生成相的多標(biāo)簽預(yù)測,以獲取HEAs相包含的更多有效信息。
目前有很多關(guān)于多標(biāo)簽的學(xué)習(xí)算法,依據(jù)解決問題的角度,這些算法可以分為兩大類:一是基于問題轉(zhuǎn)化的方法,二是基于算法適用的方法。
文中采用Scikit-Learn自帶的多標(biāo)簽分類器,使用多標(biāo)簽DT、多標(biāo)簽RF、多標(biāo)簽KNN和多標(biāo)簽FNN實現(xiàn)對HEAs的分類,如表5所示。由圖可以看到,文中的多標(biāo)簽算法對于生成相的預(yù)測準(zhǔn)確率很高,但由于其適應(yīng)性受限,對于現(xiàn)有的多分類算法封裝較少,同時在深度神經(jīng)網(wǎng)絡(luò)中,需要自行修改最后一層的輸出,對于沒有專業(yè)編程知識的材料從業(yè)者不夠友好,同時其黑盒性質(zhì),不能有效解釋其模型,輸出結(jié)果不能足夠引起研究者的信任。
表5 多標(biāo)簽分類算法準(zhǔn)確率
由于HEAs的數(shù)據(jù)標(biāo)簽大多數(shù)依賴每位研究者的標(biāo)準(zhǔn),故會造成噪音標(biāo)簽的問題。同時HEAs不僅要考慮特征參數(shù)之間的關(guān)系,還需要研究者使用相應(yīng)模型對標(biāo)簽之間的相關(guān)性關(guān)系進(jìn)行提取、學(xué)習(xí)以及借助其他工具尋找其對應(yīng)關(guān)系。多標(biāo)簽算法與圖模型以及其他技術(shù)相結(jié)合,可以有效識別HEAs相圖的微觀結(jié)構(gòu),發(fā)現(xiàn)其隱藏規(guī)律,對HEAs的進(jìn)一步發(fā)展意義重大。
HEAs作為當(dāng)前研究的熱點(diǎn),其與ML的結(jié)合輔助從力學(xué)性能和變形機(jī)制等方面進(jìn)行探索以及集合相圖計算等計算材料學(xué)方法,可以在已有的HEAs中添加新的元素,通過模擬和實驗和現(xiàn)有的材料比較,提高HEAs的性能。
HEAs由于其獨(dú)特的多組元成分結(jié)構(gòu),其相階段相較于其他材料比較復(fù)雜,同時相階段對于合金設(shè)計至關(guān)重要。而通常材料的成分和組織決定了材料最終的性能,故如何通過理論計算相形成規(guī)律,從而準(zhǔn)確地預(yù)測出給定成分HEAs的相組成成為一個難題和熱點(diǎn)。
文中采用Scikit-Learn庫的分類器,通過對兩個HEAs數(shù)據(jù)集進(jìn)行多分類和多標(biāo)簽分類模型,其中,在多分類算法中,SVM和ANN算法優(yōu)于其他算法分別達(dá)到了0.8571和0.8182的準(zhǔn)確率,在多標(biāo)簽分類模型中,集成學(xué)習(xí)算法的RF表現(xiàn)最佳,準(zhǔn)確率達(dá)到了0.9400。
在運(yùn)用不同的算法進(jìn)行HEAs生成相的預(yù)測的同時,考慮了特征選擇對模型的影響,特征參數(shù)進(jìn)行了HEAs相類選擇的強(qiáng)材料描述符(Δχ,VEC,δ等),同時說明獨(dú)立識別和量化HEAs設(shè)計中常用因素的重要性,可以更好的捕捉HEAs相形成中存在的熱力學(xué)非線性信息。在以后的研究中應(yīng)將制備工藝、元素組成成分、HEAs經(jīng)驗參數(shù)以及實驗中觀察得到的微觀結(jié)構(gòu)相結(jié)合,作為ML模型的特征標(biāo)簽,能更好的表征和識別HEAs生成相。
比較了各個算法模型之間的對HEAs生成相的影響以及改進(jìn),綜合來說SVM、RF和ANN在HEAs生成相方面的表現(xiàn)優(yōu)于其他算法模型。同時多標(biāo)簽分類模型的高準(zhǔn)確度以及其余圖像模型結(jié)合在識別生成相方面可對HEAs在相設(shè)計和微觀性能調(diào)控方面有巨大潛力。