付佳博,王晨充,MATEO Carlos Gracia,CARABALLO Isaac Toda,CABALLERO Francisca Garcia,于 皓
(1.東北大學(xué) 軋制技術(shù)及連軋自動化國家重點實驗室,遼寧 沈陽 110819) (2.西班牙國家冶金研究中心物理冶金系,西班牙 馬德里 28040)
鎳基單晶高溫合金作為航空發(fā)動機渦輪葉片的關(guān)鍵材料,具備優(yōu)異的承溫性能和抗蠕變性能[1]。然而在抗蠕變性能的研究中,討論最多的是高溫低應(yīng)力條件下的蠕變,這與鎳基單晶高溫合金渦輪葉片在實際應(yīng)用中的情況相契合[2,3]。因此,提高新一代鎳基單晶高溫合金在高溫和低應(yīng)力下的蠕變壽命是合金設(shè)計的主要目標(biāo)之一。
鎳基單晶高溫合金由于涉及大量昂貴的金屬元素、單晶制造技術(shù)成本高、蠕變試驗周期長,同時缺乏成分、組織和性能之間的定量關(guān)系,通過傳統(tǒng)的試錯法來提高合金的蠕變抗力需要耗費大量的時間和成本。因此,如何加速預(yù)測鎳基單晶高溫合金的蠕變壽命具有重要意義。傳統(tǒng)預(yù)測蠕變壽命的方法主要分為外推法和蠕變本構(gòu)模型兩種。外推法一般根據(jù)短期數(shù)據(jù)尋求經(jīng)驗公式,用以計算外推長期結(jié)果,或者是根據(jù)高溫蠕變與蠕變斷裂的微觀過程,建立起溫度、應(yīng)力、蠕變速率或蠕變斷裂時間之間的關(guān)系式[4,5]。但是這種方法沒有充分考慮實際蠕變過程中的顯微組織演化信息,缺乏嚴(yán)謹(jǐn)?shù)睦碚摶A(chǔ)。蠕變本構(gòu)模型則是基于蠕變過程中的組織演化信息,從微觀角度出發(fā)建模預(yù)測合金的蠕變行為。Zhu等[6]通過考慮析出物的形態(tài)、尺寸和間距等幾何結(jié)構(gòu)因素,認(rèn)為蠕變速率取決于γ/γ′界面處位錯的滑移和攀移以及從俘獲組態(tài)中逃逸的速率,提出了一種對化學(xué)成分和顯微組織敏感的鎳基單晶高溫合金蠕變變形行為模型。Reed等[7,8]則是考慮高溫下的位錯攀移繞過蠕變機制,基于控制位錯蠕變和空位輔助擴散的原子尺度過程的預(yù)期相似性,通過計算有效擴散系數(shù)來評估合金的蠕變抗力。Kim等[9]通過對已有模型的修正和組合,描述了將理論模型與相圖計算(CALPHAD)方法相結(jié)合的高通量計算,建立了基于組織、工藝和蠕變條件以及材料性能的數(shù)學(xué)模型,并將該模型用于預(yù)測鎳基高溫合金中溫區(qū)蠕變性能。雖然相關(guān)學(xué)者已經(jīng)對如何加速預(yù)測鎳基單晶高溫合金的蠕變壽命進(jìn)行了大量的研究,這些理論方法能夠準(zhǔn)確地描述合金的蠕變過程,并能在較短的時間內(nèi)成功地預(yù)測合金的蠕變斷裂壽命,但是由于鎳基單晶高溫合金的蠕變過程涉及長時間的顯微組織演化,并且在不同溫度應(yīng)力下蠕變機制有所不同。因此想要進(jìn)一步提升模型的準(zhǔn)確性和適用性是非常困難的。
近年來,隨著人工智能的快速發(fā)展,機器學(xué)習(xí)算法在建立高通量數(shù)據(jù)關(guān)聯(lián)方面具有極大的優(yōu)越性,已被越來越多地應(yīng)用于材料性能的預(yù)測。Han等[10]基于從文獻(xiàn)中收集的小數(shù)據(jù)集,通過數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)方法,開發(fā)了一種基于雙模型聯(lián)動的方法來預(yù)測合金的蠕變壽命?;诟呔饶P蛠砼袛嗪驼{(diào)整低精度模型,最終成功改善了整體蠕變壽命預(yù)測的精度。然而該方法僅考慮了成分參數(shù)和測試條件,并沒有進(jìn)一步考慮工藝參數(shù)和物理冶金參數(shù)對鎳基單晶高溫合金蠕變壽命的影響,缺乏可解釋性。Liu等[11]在考慮化學(xué)成分、測試溫度、測試應(yīng)力和熱處理工藝的基礎(chǔ)上,同時基于相圖計算方法和各種基本材料結(jié)構(gòu)-性質(zhì)關(guān)系計算并引入了層錯能、晶格參數(shù)、γ′相的摩爾分?jǐn)?shù)、擴散系數(shù)和剪切模量5個物理冶金參數(shù),基于聚類方法區(qū)分混合蠕變機制,為每個類別訓(xùn)練出一個最優(yōu)模型,大大提高了機器學(xué)習(xí)模型的預(yù)測能力。但是需要指出的是,該方法雖然能夠區(qū)分不同的蠕變機制并分別建立機器學(xué)習(xí)模型,但對于不同蠕變條件的形變機制(如圖1所示),此工作并未考慮引入不同的物理冶金參數(shù)來指導(dǎo)機器學(xué)習(xí)模型,如層錯能和剪切模量對應(yīng)中低溫蠕變機制[12,13]并不適用于高溫蠕變機制,這可能會惡化基于單一蠕變機制建立的機器學(xué)習(xí)模型的預(yù)測準(zhǔn)確性和可解釋性。
圖1 單晶高溫合金在不同服役溫度及應(yīng)力范圍內(nèi)的蠕變變形機制示意圖[12,13]Fig.1 Deformation map for a single crystal superalloy illustrating the dependence on stress,temperature and strain rate[12,13]
綜上所述,人工智能分析策略對于高溫合金材料蠕變性能的預(yù)測頗有成效,但是目前所建立的機器學(xué)習(xí)模型沒有考慮符合高溫低應(yīng)力蠕變機制的物理冶金參數(shù),不能夠?qū)Ω邷氐蛻?yīng)力條件下鎳基單晶高溫合金的蠕變性能實現(xiàn)準(zhǔn)確預(yù)測。對此,本文的研究目的在于通過人工智能算法,建立起高溫低應(yīng)力下鎳基單晶高溫合金成分、工藝以及引入的物理冶金參數(shù)和蠕變壽命之間的關(guān)系,最終能夠有效地預(yù)測蠕變壽命,有望應(yīng)用于合金成分工藝的反向設(shè)計。
本數(shù)據(jù)庫的文獻(xiàn)信息部分來源于Liu等[11]的研究,基于數(shù)據(jù)質(zhì)量分析保留122條高溫低應(yīng)力下的蠕變數(shù)據(jù)。此外基于文獻(xiàn)調(diào)研[14-37],收集鎳基單晶高溫合金的蠕變數(shù)據(jù)合計110條。最終建立了較高質(zhì)量的鎳基單晶合金蠕變數(shù)據(jù)集(成分/工藝/測試條件-蠕變壽命)。
如表1所示,數(shù)據(jù)集中包括23個輸入特征和1個輸出特征(蠕變壽命)。數(shù)據(jù)集的輸入特征,綜合考慮了材料特性和環(huán)境因素。材料特性包括15個元素(Ni,Cr,Mo,W,Co,Re,Ru,Al,Ti,Ta,Hf,C,B,Nb,Y)含量特征和6個工藝參數(shù)(固溶溫度(ST)和時間(St)、一次時效溫度(1aT)和時間(1at)、二次時效溫度(2aT)和時間(2at))。環(huán)境因素則包括與蠕變過程密切相關(guān)的蠕變溫度(tT)和蠕變應(yīng)力(tS)。
表1 鎳基單晶高溫合金蠕變數(shù)據(jù)特征的基本信息Table 1 Basic information of the features in the creep dataset of Ni-based single crystal superalloy
對于基于機器學(xué)習(xí)回歸策略的性能預(yù)測,引入物理冶金變量可以有效地提高泛化能力,而對于設(shè)計過程,可以消除不符合物理冶金原則的中間解,從而提高設(shè)計的精度和效率[38]。由于鎳基單晶高溫合金在高溫和低應(yīng)力下,熱激活攀移繞過是主要的變形機制,此時的蠕變變形主要來自于位錯在γ基體相中的滑移和沿γ/γ′界面的攀移,與筏狀結(jié)構(gòu)的形成有關(guān)。因此基于這一蠕變機制,對于鎳基單晶高溫合金的抗蠕變性能預(yù)測,最終考慮引入以下微觀結(jié)構(gòu)參數(shù)作為模型輸入:γ′相體積分?jǐn)?shù)Vf,晶格錯配度δ,擴散系數(shù)DL,如表2所示。
表2 基于Thermo-Calc計算引入的三維物理冶金信息Table 2 Three-dimensional physical metallurgical information based on Thermo-Calc calculation
γ′相作為鎳基單晶高溫合金的主要強化相,其數(shù)量、形態(tài)、尺寸和分布與合金的力學(xué)性能以及蠕變性能是密切相關(guān)的[39]。本工作中基于CALPHAD方法中的Thermo-Calc來計算獲得服役溫度下的γ′相體積分?jǐn)?shù),作為模型的輸入。
在高溫合金中,γ和γ′相間的晶格錯配度會對界面處位錯網(wǎng)絡(luò)的密度和演化速率以及蠕變斷裂壽命產(chǎn)生重要的影響[40,41]??紤]到計算獲得服役溫度下晶格參數(shù)的公式過于依賴經(jīng)驗,因此在本研究中只采取室溫下的晶格錯配度[42]作為輸入,如式(1)~式(3):
(1)
(2)
(3)
在高溫低應(yīng)力下,原子擴散機制是合金發(fā)生蠕變變形的重要原因之一,原子的擴散會影響蠕變發(fā)生的速率、γ′相的粗化以及擴散控制的氧化速率。在Zhu等[6]的研究中將γ相的晶格擴散系數(shù)作為其高溫蠕變模型中的有效擴散系數(shù),這其實是一種簡化計算擴散系數(shù)的方法,特別是對擴散系數(shù)以復(fù)雜基體形式存在的多元體系的鎳基單晶高溫合金而言。通過進(jìn)一步數(shù)學(xué)上的推導(dǎo)簡化,本研究中采取式(4)進(jìn)行擴散系數(shù)的計算:
(4)
本研究基于人工智能策略建立蠕變壽命的最優(yōu)預(yù)測模型的基本流程如圖2所示。在建立了數(shù)據(jù)庫并且引入了物理冶金參數(shù)之后,首先對數(shù)據(jù)進(jìn)行預(yù)處理,基于歸一化處理將原始的數(shù)據(jù)特征去量綱化并縮放至相同的尺度,如式(5)所示:
圖2 蠕變壽命最優(yōu)預(yù)測模型建立的基本流程Fig.2 The basic flow of establishing the optimal prediction model of creep life
(5)
基于Pearson系數(shù)和隨機森林平均精確度降低(MDA)值等數(shù)據(jù)關(guān)聯(lián)性分析方法評估數(shù)據(jù)特征之間的關(guān)聯(lián)性以及重要性。選擇7種經(jīng)典的機器學(xué)習(xí)算法建立性能預(yù)測模型,包括線性回歸(LR)、支持向量回歸(SVR)、多層感知機(MLP)、隨機森林(RF)、梯度提升回歸(GBR)、極端梯度提升回歸(XGB)和自適應(yīng)提升回歸(AdB)模型,訓(xùn)練模型之前需要將數(shù)據(jù)集按照8∶2的比例劃分為訓(xùn)練集和測試集,建模過程中基于網(wǎng)格搜索法調(diào)參,訓(xùn)練并優(yōu)化機器學(xué)習(xí)模型。最后基于平方相關(guān)系數(shù)(R2)和平均絕對誤差(MAE)評估模型性能,分別如式(6)和式(7)所示:
R2=
(6)
(7)
對數(shù)據(jù)集進(jìn)行了Pearson系數(shù)相關(guān)性分析(如圖3所示):任意兩個特征之間Pearson系數(shù)的絕對值均小于1,這說明所有的特征均可以視為獨立變量。每個特征相對于輸出變量的Pearson系數(shù)的絕對值均大于0,這意味著每個特征對于蠕變壽命都有自己的貢獻(xiàn)。因此,單獨分析各特征對蠕變壽命的重要性是合理的。
圖3 Pearson系數(shù)熱力圖Fig.3 Heat map of the Pearson correlation coefficient
圖4a定量地顯示了基于平均精確度降低值評估的每個特征對蠕變壽命預(yù)測的重要性。值得注意的是,引入的3個物理冶金變量Vf、δ、DL的重要性均位于前列,這意味著本研究中引入的3個物理冶金參數(shù)對于鎳基單晶高溫合金蠕變壽命的預(yù)測有著重要意義,同時這與高溫低應(yīng)力下位錯攀移繞過機制基本吻合,表明本研究所建立的數(shù)據(jù)集基本符合物理冶金原理。二次時效溫度的平均精確度降低值較高,這意味著所收集數(shù)據(jù)的熱處理工藝中二次時效溫度極大地影響著合金的蠕變壽命,根據(jù)傳統(tǒng)的物理冶金理論,二次時效過程影響著γ′相的形貌和尺寸,進(jìn)而影響著γ基體相和γ′相的晶格錯配度,是影響蠕變過程中γ′相能否定向粗化(筏化)的關(guān)鍵因素。此外,測試條件和測試應(yīng)力的平均精確度降低值位于前列,這說明環(huán)境因素對合金蠕變壽命的影響較為重要。同時可以看到γ基體相元素Ni、γ′相形成元素Al和Ta以及固溶強化元素Cr和Re的平均精確度降低值均位于前列,這說明所建立的數(shù)據(jù)集中成分特征影響同樣顯著,因為蠕變過程時間較長,涉及顯微組織的演化,這與合金元素的擴散過程密切相關(guān),這進(jìn)一步證明了本研究中所使用的數(shù)據(jù)集具有一定的可信度和可解釋性。
圖4 特征重要性評估結(jié)果:(a)原始數(shù)據(jù)特征平均精確度降低(MDA)值,(b)含有Y元素數(shù)據(jù)集中的MDA值Fig.4 Feature importance evaluation results:(a)the mean decrease accuracy (MDA)value of original data feature,(b)the MDA value of each feature in the dataset containing Y element
平均精確度降低值低估了Ru元素對蠕變壽命的貢獻(xiàn),這是因為作為最新一代鎳基單晶高溫合金,所能收集到的數(shù)據(jù)中含Ru元素的樣本僅有32個。不可否認(rèn)的是Ru元素的添加會抑制拓?fù)涿芘?TCP)相的析出但同時增加了成本,因此不少學(xué)者[18,19,26]致力于追尋調(diào)控其他固溶強化元素如Co,Mo和Cr的含量來降低或者替代Ru元素以期降低成本,這意味著基于所建立的數(shù)據(jù)集通過機器學(xué)習(xí)算法有希望為高性能低Ru或無Ru單晶高溫合金成分工藝的反向設(shè)計服務(wù)。
不難發(fā)現(xiàn),平均精確度降低值高估了Y元素的貢獻(xiàn),因此后續(xù)基于Y元素的有無將數(shù)據(jù)集分成了兩類,評估了有Y元素數(shù)據(jù)集中的特征重要性。如圖4b所示,含有Y元素的數(shù)據(jù)集中Y元素的特征重要性評估排名非常靠后,這也就表明高估Y元素的原因是數(shù)據(jù)集中Y元素分布不均勻。
在建立穩(wěn)定的蠕變預(yù)測模型之前,將歸一化后的數(shù)據(jù)全部打亂并進(jìn)行隨機劃分,將其中的80%用作訓(xùn)練集,余下的20%用作測試集,共進(jìn)行了100次計算。通過評估100次隨機劃分訓(xùn)練后的R2和平均絕對誤差,對各種機器學(xué)習(xí)模型的性能進(jìn)行了比較分析,圖5顯示了這些模型的R2和平均絕對誤差。
從圖5a中可以發(fā)現(xiàn),LR模型和AdB模型訓(xùn)練集和測試集的R2值相對較低,而大多數(shù)其他模型的R2表現(xiàn)遠(yuǎn)遠(yuǎn)好于LR和AdB模型。值得注意的是,雖然RF模型的訓(xùn)練集具有較高的R2值(95%以上),但是在測試集上表現(xiàn)確不盡人意(80%以下),這意味著RF在本研究中具有很強的過擬合趨勢。這也表明具有26個輸入特征的蠕變壽命預(yù)測是一個比較復(fù)雜的問題,遠(yuǎn)遠(yuǎn)超出了RF模型的最大分析能力。同樣地,SVR模型、MLP模型、GBR模型和XGB模型4種機器學(xué)習(xí)算法在訓(xùn)練集上均有良好的表現(xiàn),R2均在95%以上;然而在測試集上并沒有保持這種優(yōu)異的性能,R2的值集中在80%~90%之間。SVR模型在訓(xùn)練集上的R2達(dá)到了96.88%;在測試集上的R2相對較高,達(dá)到了87.17%,并且擁有較窄的誤差范圍。這意味著與其他模型相比,SVR模型更加穩(wěn)定,過擬合的風(fēng)險更低。這一結(jié)論也可以從平均絕對誤差結(jié)果中得到證明,如圖5b所示,SVR模型在訓(xùn)練集和測試集上的平均絕對誤差值分別為0.1689和0.3542,并且誤差范圍相對較窄。
由于在小樣本問題上,機器學(xué)習(xí)模型的過度擬合是一個重要的風(fēng)險。因此,為了進(jìn)一步評估SVR、MLP、GBR和XGB這4種算法的性能,需要對模型的過擬合程度進(jìn)行評估分析,圖6給出了在100次隨機劃分訓(xùn)練后,訓(xùn)練集和測試集R2差在10%~20%、20%~30%和>30%范圍內(nèi),SVR、MLP、GBR和XGB這4種算法的過擬合模型的確切個數(shù)。由圖6可以清晰地看到,相比MLP、GBR和XGB算法,SVR算法的過擬合模型的個數(shù)是最少的,這意味著SVR模型擁有最小的過擬合風(fēng)險。因此,最終選擇SVR作為鎳基單晶高溫合金高溫低應(yīng)力條件下蠕變壽命預(yù)測的模型。
圖6 過擬合程度分析Fig.6 The number of overfitting models
由于對數(shù)據(jù)集進(jìn)行了100次不同的隨機劃分,因此每個樣本都能夠多次被劃分至訓(xùn)練集和測試集中,也就是說每個樣本均可以獲得多個預(yù)測。圖7顯示了SVR在不同數(shù)據(jù)集上的蠕變壽命平均預(yù)測結(jié)果。如圖7a所示,SVR模型在訓(xùn)練集中表現(xiàn)為幾乎所有的數(shù)據(jù)點都落在了斜率為1的直線上,誤差棒也比較小,這一結(jié)果證明SVR模型在各自的訓(xùn)練集中都有著優(yōu)異的性能。如圖7b所示,在測試集中,SVR模型的表現(xiàn)不如在訓(xùn)練集中穩(wěn)定,少量數(shù)據(jù)偏離了這條線,并顯示出較大的誤差條,這說明本研究中所使用的SVR模型對數(shù)據(jù)集的劃分存在一定的敏感性。
圖7 蠕變壽命預(yù)測結(jié)果:(a)SVR在訓(xùn)練集上的表現(xiàn),(b)SVR在測試集上的表現(xiàn),(c)SVR在少量新數(shù)據(jù)上的表現(xiàn)Fig.7 Creep life prediction results:(a)performance of the SVR model on the training set,(b)performance of the SVR model on the testing set,(c)performance of SVR model on a small amount of new data
為了進(jìn)一步驗證SVR模型的預(yù)測效果,基于文獻(xiàn)調(diào)研,收集25個新數(shù)據(jù),蠕變壽命范圍為25.985~1364 h,與高溫低應(yīng)力這一蠕變機制基本吻合(其測試溫度范圍為900~1140 ℃,測試應(yīng)力范圍為124~392 MPa)[43-45]。圖7c為SVR模型預(yù)測結(jié)果,其R2為84.44%,平均絕對誤差值為0.3568。相比于測試集,SVR模型預(yù)測精度雖然出現(xiàn)一定程度的下降,但綜合來看仍在可接受范圍內(nèi),這也證明了基于物理冶金指導(dǎo)SVR模型具有良好的魯棒性和可拓展性。
為了進(jìn)一步明確物理冶金參數(shù)在計算中所起到的作用,分別建立了不同層次的蠕變數(shù)據(jù)集(即原始特征+γ′相體積分?jǐn)?shù)Vf、原始特征+晶格錯配度δ、原始特征+擴散系數(shù)DL以及原始特征+兩兩組合的物理冶金參數(shù))對SVR模型進(jìn)行訓(xùn)練和測試。其中,數(shù)據(jù)集100次隨機劃分下,SVR模型在測試集上的平均絕對誤差如圖8所示。
圖8 基于不同程度數(shù)據(jù)挖掘的SVR模型在測試集上的表現(xiàn):(a)R2,(b)平均絕對誤差Fig.8 Performance of SVR model based on different levels of data mining on the testing set:(a)R2,(b)MAE
當(dāng)模型的輸入僅為成分工藝和測試條件時,SVR模型表現(xiàn)最差,而當(dāng)使用原始特征和不同物理冶金參數(shù)作為輸入時,模型的性能得到了一定提升。值得注意的是,在所有的模型中,模型SVR+Vf+δ與模型SVR+ALL的預(yù)測效果最好且相近,但是后者的平均絕對誤差值更低同時R2和平均絕對誤差的標(biāo)準(zhǔn)偏差更小,依此可以說明SVR+ALL擁有最好的預(yù)測效果。這進(jìn)一步說明了在物理冶金原理的指導(dǎo)下對原始數(shù)據(jù)進(jìn)行挖掘的重要性:物理冶金參數(shù)的引入不僅改善了機器學(xué)習(xí)模型的預(yù)測精度,同時可以改善模型的魯棒性。
本文在充分調(diào)研國內(nèi)外加速鎳基單晶高溫合金蠕變壽命預(yù)測的研究基礎(chǔ)上,基于文獻(xiàn)調(diào)研,建立起了高溫低應(yīng)力下的單晶高質(zhì)量蠕變數(shù)據(jù)集,并且基于鎳基單晶高溫合金高溫低應(yīng)力下的蠕變機制,引入了三維物理冶金信息:γ′相體積分?jǐn)?shù)Vf,晶格錯配度δ,擴散系數(shù)DL。通過基于物理冶金指導(dǎo)機器學(xué)習(xí)的方法預(yù)測了高溫低應(yīng)力下鎳基單晶高溫合金的蠕變壽命,并且通過平方相關(guān)系數(shù)(R2)、平均絕對誤差(MAE)、過擬合程度等方面對機器學(xué)習(xí)模型性能進(jìn)行了評估,分析了物理冶金參數(shù)的作用效果。主要研究結(jié)論如下:
(1)基于Pearson系數(shù)的特征相關(guān)性分析表明,數(shù)據(jù)
集中的每個特征對蠕變壽命都有著自己的貢獻(xiàn);同時基于隨機森林平均精確度降低的特征重要性評估表明,本研究中所使用的數(shù)據(jù)集在物理冶金學(xué)原理上存在一定合理性。
(2)基于7種經(jīng)典的機器學(xué)習(xí)算法預(yù)測了合金的蠕變壽命,其中支持向量回歸(SVR)模型的預(yù)測效果最佳,在訓(xùn)練集上的平方相關(guān)系數(shù)為96.88%,平均絕對誤差值為0.1689;而在測試集上的平方相關(guān)系數(shù)為87.17%,平均絕對誤差值為0.3542,并且擁有最少的過擬合模型個數(shù)。
(3)在引入三維物理冶金信息后,獲得最高的平方相關(guān)系數(shù)和最小的平均絕對誤差,同時降低了平方相關(guān)系數(shù)和平均絕對誤差的標(biāo)準(zhǔn)偏差,說明物理冶金參數(shù)的引入改善了原始數(shù)據(jù)的質(zhì)量,提高了SVR模型的預(yù)測準(zhǔn)確性以及泛化能力。