吳 迪, 曹培智, 張國(guó)英, 焦興強(qiáng)
(沈陽(yáng)師范大學(xué) 物理科學(xué)與技術(shù)學(xué)院, 沈陽(yáng) 110034)
傳統(tǒng)的材料科學(xué)研究和材料制備過(guò)程大都依賴(lài)于大量實(shí)驗(yàn),這個(gè)過(guò)程中需要投入大量的時(shí)間、人力、物質(zhì)資源,尤其研究成本較高。專(zhuān)家系統(tǒng)可以利用領(lǐng)域內(nèi)已有的專(zhuān)家經(jīng)驗(yàn)進(jìn)行推理并做出決策,提高了研究效率,但材料中依然存在一些較為復(fù)雜的內(nèi)在規(guī)律很難用明確的數(shù)學(xué)模型描述,因此在一些材料研究中專(zhuān)家系統(tǒng)也不能解決所有現(xiàn)有問(wèn)題。
近年來(lái)計(jì)算機(jī)仿真在材料科學(xué)的研究中發(fā)揮了巨大的作用,計(jì)算材料學(xué)的發(fā)展為材料科學(xué)的研究提供了新的方法,常用的計(jì)算材料學(xué)方法有有限元方法、第一原理法、人工神經(jīng)網(wǎng)絡(luò)等。對(duì)于一些結(jié)構(gòu)復(fù)雜很難描述其表達(dá)函數(shù)的材料結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)直接對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行迭代訓(xùn)練來(lái)得到反應(yīng)數(shù)據(jù)內(nèi)在規(guī)律的模型,因此對(duì)復(fù)雜的非線性系統(tǒng)有很好的映射能力,人工神經(jīng)網(wǎng)絡(luò)在材料制備、結(jié)構(gòu)分析、性能分析中有很多應(yīng)用。劉貴立等[1]利用BP神經(jīng)網(wǎng)絡(luò)對(duì)高Co-Ni二次硬化鋼進(jìn)行結(jié)構(gòu)分析和力學(xué)性能預(yù)測(cè)。但BP神經(jīng)網(wǎng)絡(luò)需要重復(fù)迭代訓(xùn)練,速度較慢,可能陷入局部極小值,又有學(xué)習(xí)率不確定的問(wèn)題。極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)相較于BP神經(jīng)網(wǎng)絡(luò),通過(guò)設(shè)置隱層節(jié)點(diǎn)數(shù),隨機(jī)賦予網(wǎng)絡(luò)輸入權(quán)值和閾值,在算法過(guò)程中只需計(jì)算隱層輸出權(quán)值,有訓(xùn)練速度快、泛化程度高、訓(xùn)練參數(shù)少的優(yōu)點(diǎn)[2]。針對(duì)普通的極限學(xué)習(xí)機(jī)隱層節(jié)的最佳選擇問(wèn)題,本文采用增量型極限學(xué)習(xí)機(jī)[3](incremental extreme learning machine,I-ELM)對(duì)高Co-Ni二次硬化鋼進(jìn)行研究。I-ELM會(huì)逐漸向網(wǎng)絡(luò)中添加節(jié)點(diǎn),然后計(jì)算網(wǎng)絡(luò)輸出誤差,直到達(dá)到滿(mǎn)足誤差要求或到達(dá)最大節(jié)點(diǎn)數(shù)時(shí)算法結(jié)束,既能滿(mǎn)足訓(xùn)練速度快、擬合程度高的條件,又可以避免ELM節(jié)點(diǎn)選取不當(dāng)導(dǎo)致的算法不穩(wěn)定問(wèn)題。
高Co-Ni二次硬化鋼樣本數(shù)據(jù)取自文獻(xiàn)[1]共41組見(jiàn)表1,合金元素C、Ni、Co、Cr、Mo、Nb、Ti和時(shí)效溫度、淬火溫度為9項(xiàng)輸入指標(biāo)分別用I1~I(xiàn)9表示;屈服強(qiáng)度E0.2(MPa)、抗拉強(qiáng)度Eb(MPa)、韌性Kic(MPam1/2)、延伸率(W)、截面收縮率(ψ)為5項(xiàng)輸出指標(biāo),分別用O1~O5表示。將其劃分為33組訓(xùn)練集,8組測(cè)試集見(jiàn)表2。
表1 高Co-Ni二次硬化鋼部分樣本數(shù)據(jù)Table 1 The partial sample data of high Co-Ni secondary hardened steel
表2 高Co-Ni二次硬化鋼數(shù)據(jù)集劃分
圖1 SLFN網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 The SLFN network structure
實(shí)驗(yàn)數(shù)據(jù)經(jīng)過(guò)歸一化使值域在區(qū)間[0,1]內(nèi),令一組數(shù)據(jù)中最大值為a,最小值為b,則歸一化前數(shù)據(jù)X對(duì)應(yīng)歸一化后為
c=(X-b)/(a-b)
(1)
同理,網(wǎng)絡(luò)輸出的數(shù)據(jù)c經(jīng)過(guò)反歸一化后是實(shí)際物理數(shù)據(jù):
X=a+c×(b-a)
(2)
BP神經(jīng)網(wǎng)絡(luò)是一種誤差反向傳播結(jié)構(gòu)如圖1所示,在其網(wǎng)絡(luò)結(jié)構(gòu)中有20個(gè)隱層神經(jīng)元,9個(gè)輸入層神經(jīng)元,5個(gè)輸出層神經(jīng)元。
aij表示第i個(gè)輸入層神經(jīng)元到第j個(gè)隱層神經(jīng)元連接權(quán)值,取值范圍是[-1,1];bL表示第L個(gè)隱層神經(jīng)元的閾值,取值范圍是[-1,1]。參考文獻(xiàn)[1]中的網(wǎng)絡(luò)指標(biāo)函數(shù)E為
(3)
其中:Dij表示訓(xùn)練模擬輸出值;Oij表示對(duì)應(yīng)的實(shí)際數(shù)據(jù);P為樣本數(shù)。設(shè)置BP網(wǎng)絡(luò)訓(xùn)練的最大循環(huán)次數(shù)為1 000次,期望誤差指標(biāo)E小于0.001。
3.1I-ELM
增量型極限學(xué)習(xí)機(jī)(I-ELM)也是一種單隱層前向傳播神經(jīng)網(wǎng)絡(luò)[6], 其網(wǎng)絡(luò)結(jié)構(gòu)同圖1所示。 I-ELM網(wǎng)絡(luò)結(jié)構(gòu)為m個(gè)輸入神經(jīng)元,n個(gè)輸出神經(jīng)元,L個(gè)隱層神經(jīng)元。 訓(xùn)練樣本為X=[x1,x2,…,xm],X的維數(shù)為m×N;Y=[y1,y2,…,yn],Y的維數(shù)為N×n。 假設(shè)網(wǎng)絡(luò)隱層神經(jīng)元個(gè)數(shù)最大值為N, 網(wǎng)絡(luò)余差為E(指網(wǎng)絡(luò)輸出與實(shí)際數(shù)據(jù)間的差值矩陣), 期望誤差為ε。 則I-ELM訓(xùn)練過(guò)程[4]如下:
1) 首先給隱層神經(jīng)元與輸入節(jié)點(diǎn)的連接權(quán)值a和閾值b設(shè)定一個(gè)隨機(jī)值。
2) 計(jì)算當(dāng)前加法隱層神經(jīng)元輸入x公式為:
x=aX+b
(4)
3) 計(jì)算當(dāng)前加法隱層神經(jīng)元輸出:
(5)
4) 由最小二乘法計(jì)算該隱層神經(jīng)元輸出權(quán)值矩陣:
(6)
5) 計(jì)算增加一個(gè)隱層神經(jīng)元后網(wǎng)絡(luò)的余差:
E′=E-βH
(7)
6) 判斷是否超過(guò)最大節(jié)點(diǎn)數(shù)L>N或誤差指標(biāo)是否滿(mǎn)足要求E<ε,若是則算法結(jié)束,否則令L=L+1,返回1)繼續(xù)循環(huán)。
文獻(xiàn)[3]中的Theorem Ⅱ.1證明了隨著隱層節(jié)點(diǎn)添加,由式(6)最小二乘法計(jì)算出的權(quán)值可以使網(wǎng)絡(luò)誤差逐漸下降。
I-ELM訓(xùn)練速度快的優(yōu)點(diǎn)對(duì)材料數(shù)學(xué)模型進(jìn)行在線預(yù)測(cè)有很多的潛在作用[12]。
本文對(duì)高Co-Ni二次硬化鋼進(jìn)行了I-ELM模型和BP神經(jīng)網(wǎng)絡(luò)模型的研究,并將其結(jié)果進(jìn)行對(duì)比,2種方法均在同一計(jì)算機(jī)的Matlab 2018a版本上完成。
I-ELM模型初始化參數(shù)設(shè)置:隱層節(jié)點(diǎn)最大值3 000,初始隱層節(jié)點(diǎn)數(shù)N=0,初始誤差矩陣E為測(cè)試集輸出矩陣,網(wǎng)絡(luò)精度ε為誤差矩陣E的二范數(shù),即矩陣ETE的最大特征值開(kāi)平方。設(shè)定期望精度ε不高于1.5。表1為高Co-Ni二次硬化鋼數(shù)據(jù)集的劃分。
圖2為I-ELM網(wǎng)絡(luò)對(duì)測(cè)試集數(shù)據(jù)的預(yù)測(cè)結(jié)果與材料實(shí)際數(shù)據(jù)的對(duì)比,結(jié)果表明擬合效果良好。圖2中有5組數(shù)據(jù),每一組有2條的數(shù)據(jù)線,其中紅線表示I-ELM模型預(yù)測(cè)輸出的數(shù)據(jù)值,藍(lán)線表示實(shí)際數(shù)據(jù)值。為了便于觀察對(duì)數(shù)據(jù)繪圖時(shí)進(jìn)行了放縮操作,圖中數(shù)據(jù)與真實(shí)值比例對(duì)應(yīng)關(guān)系參照表3。
圖2 5組I-ELM模型預(yù)測(cè)結(jié)果Fig.2 Five groups prediction results of I-ELM model
表3 繪圖數(shù)據(jù)值與真實(shí)值對(duì)應(yīng)比例Table 3 The corresponding ratio of plot data values to real values
以表1中樣本40數(shù)據(jù)為基礎(chǔ),通過(guò)控制變量分別改變微量元素Co含量和時(shí)效溫度,研究微量元素Co和時(shí)效溫度對(duì)材料力學(xué)性能的影響。計(jì)算結(jié)果如圖3和圖4所示。為便于觀察,圖中顯示韌性,截面收縮率指標(biāo)為實(shí)際值10倍,延伸率為實(shí)際值100倍。當(dāng)微量元素Co含量由8%逐漸增加時(shí),材料的屈服強(qiáng)度、抗拉強(qiáng)度逐漸增加,而延伸率和韌性會(huì)降低;當(dāng)時(shí)效溫度由480 ℃逐漸增加,材料的屈服強(qiáng)度、抗拉強(qiáng)度會(huì)降低,延伸率和韌性增加。截面收縮率受微量元素Co和時(shí)效溫度變化影響較小。
圖3 Co元素對(duì)材料力學(xué)性能影響Fig.3 The effect of Co element on mechanical materials
圖4 時(shí)效溫度對(duì)材料力學(xué)性能影響
理論分析:根據(jù)文獻(xiàn)[10]研究,材料中Co元素的加入使得鐵短程有序,降低了鐵自擴(kuò)散系數(shù);元素Co還是一種固溶強(qiáng)化元素,能削減殘余奧氏體量,致使的強(qiáng)度性能降低,增添了馬氏體量。但鐵中Co元素含量不應(yīng)過(guò)多,過(guò)多會(huì)使韌性下降,I-ELM預(yù)測(cè)結(jié)果與文獻(xiàn)[10]結(jié)果相符。文獻(xiàn)[11]指出隨著時(shí)效溫度的提高,強(qiáng)度會(huì)下降,韌性會(huì)提高;時(shí)效溫度對(duì)延伸率及截面收縮率影響較小,這與I-ELM網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果相符。
(8)
表4表示I-ELM和BP神經(jīng)網(wǎng)絡(luò)對(duì)高Co-Ni二次硬化鋼數(shù)據(jù)訓(xùn)練結(jié)束后模型預(yù)測(cè)結(jié)果的決定系數(shù)對(duì)比。5項(xiàng)評(píng)價(jià)指標(biāo)中,對(duì)材料的擬合程度I-ELM均優(yōu)于BP神經(jīng)網(wǎng)絡(luò),其中韌性指標(biāo)由于1號(hào)和3號(hào)樣本存在離群點(diǎn)導(dǎo)致擬合精度較低。
表4 決定系數(shù)R2對(duì)比結(jié)果Table 4 The determination coefficient comparison results
還可以通過(guò)如下幾項(xiàng)指標(biāo)來(lái)衡量I-ELM和BP神經(jīng)網(wǎng)絡(luò)對(duì)高Co-Ni二次硬化鋼的訓(xùn)練效果,其結(jié)果列在表5中。
表5 I-ELM和BP神經(jīng)網(wǎng)絡(luò)各項(xiàng)性能對(duì)比
1) 決定系數(shù)均值是5組決定系數(shù)R2的平均值,反映網(wǎng)絡(luò)預(yù)測(cè)模型的擬合效果。
2) 均方根誤差(RMSE)是指觀察值與真實(shí)值偏差的平方和觀測(cè)次數(shù)n比值的平方根,本次試驗(yàn)中反映預(yù)測(cè)值和實(shí)際值的關(guān)系,是預(yù)測(cè)值與真實(shí)值的誤差的平方的算術(shù)平均值再開(kāi)方。RMSE反映了預(yù)測(cè)數(shù)據(jù)偏離真實(shí)值的程度,RMSE越小,表示模型預(yù)測(cè)精度越高。
(9)
3) 誤差矩陣的2范數(shù)(E2)是指即誤差矩陣ETE矩陣的最大特征值的開(kāi)平方,此次實(shí)驗(yàn)中用來(lái)表征模型訓(xùn)練精度。
4) 訓(xùn)練時(shí)間(s)反映網(wǎng)絡(luò)對(duì)數(shù)據(jù)訓(xùn)練的速度快慢。
本文采用I-ELM訓(xùn)練高Co-Ni二次硬化鋼材料模型,同BP神經(jīng)網(wǎng)絡(luò)相比,直接計(jì)算隱層神經(jīng)元輸出權(quán)值矩陣可極大地減少計(jì)算量,然后通過(guò)增加隱層節(jié)點(diǎn)的方式調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),防止出現(xiàn)過(guò)擬合問(wèn)題。結(jié)果表明,I-ELM對(duì)樣本數(shù)量少、材料結(jié)構(gòu)復(fù)雜的高Co-Ni二次硬化鋼材料擬合效果很好。模型預(yù)測(cè)的結(jié)果能較好地反映材料力學(xué)性能規(guī)律。下一步I-ELM網(wǎng)絡(luò)模型還可以通過(guò)對(duì)隱層輸出增加偏置從而提高部分神經(jīng)元輸出權(quán)值,提高網(wǎng)絡(luò)模型的結(jié)構(gòu)效率。綜上,本文為高Co-Ni二次硬化鋼材料力學(xué)性能研究提供了一種在樣本數(shù)量少條件下采用現(xiàn)代優(yōu)化算法進(jìn)行快速高精度擬合的有益參考。