劉志偉,馬勁紅,陳偉,王文正
(1. 華北理工大學 冶金與能源學院,河北 唐山 063210;2. 現(xiàn)代冶金技術教育部重點實驗室,河北 唐山 063210)
Q235鋼的生產(chǎn)需要經(jīng)過熔煉、熱處理、軋制等復雜的過程,力學性能往往難以優(yōu)化。傳統(tǒng)的力學性能優(yōu)化方法是通過結合理論與經(jīng)驗探究軋制、成型等過程中復雜的物理機制,設計優(yōu)化材料的力學性能。目前對于金屬材料力學性能的預測方法可分為3種[1]:第一種是在實驗設計和生產(chǎn)過程中整理出來的經(jīng)驗模型。此類模型往往精度不高,且只對單一產(chǎn)品有效,泛化能力較差。第二種是變形機制、成型理論等基礎上開發(fā)的物理模型。此種模型偏理論化,實際中差異往往較大,需要理想化假設,導致適用范圍過窄。第三種方法是神經(jīng)網(wǎng)絡智能學習算法。神經(jīng)網(wǎng)絡具有良好的收斂復雜非線性系統(tǒng)的特點,可自發(fā)組織、學習及處理[2,3]。
目前,曾有很多學者對神經(jīng)網(wǎng)絡模型進行改進。Govindhasamya等[4]探討了隱含層層數(shù)和激活函數(shù)類型對BP網(wǎng)絡性能的影響。Shubhabrata等[5,6]將BP神經(jīng)網(wǎng)絡、模糊邏輯推理與遺傳算法結合,通過優(yōu)化BP學習算法的網(wǎng)絡結構,建立預測能力更強的神經(jīng)網(wǎng)絡模型,提高了模型對H型鋼力學性能的預測精度[7]。
利用BP神經(jīng)網(wǎng)絡自身的結構特點,研究了BP網(wǎng)絡結構設計中的重要因素—隱藏層節(jié)點數(shù)的選取方案。隱含層數(shù)確定后,隱含層上的神經(jīng)元會影響性能。如果神經(jīng)元數(shù)量過少,網(wǎng)絡難以達到預期訓練結果,就會產(chǎn)生較大誤差。如果隱含層的神經(jīng)元太多,雖然網(wǎng)絡可以很好地學習并達到預期的精度,但它會產(chǎn)生過擬合并降低 BP 神經(jīng)網(wǎng)絡的泛化能力[8]。因此,已經(jīng)確定隱含層的神經(jīng)元數(shù)量后,目標是讓網(wǎng)絡不僅能夠達到預期的效果,在增大誤差精度同時也具有較高的泛化性?;谀充撹F公司Q235鋼生產(chǎn)數(shù)據(jù)建立BP神經(jīng)網(wǎng)絡預測模型,提出BP網(wǎng)絡隱含層節(jié)點數(shù)的選取方法。討論隱含層節(jié)點數(shù)與模型之間的規(guī)律,從訓練步數(shù)和預測精度2個角度分析了最優(yōu)的隱含層節(jié)點數(shù)選取過程,并利用實際生產(chǎn)數(shù)據(jù)進行驗證和泛化能力測試。
與生物學習類似,利用BP網(wǎng)絡預測時,同樣存在訓練過程,使模型經(jīng)訓練后具備預測能力。神經(jīng)網(wǎng)絡類似于具有生物神經(jīng)元的節(jié)點或神經(jīng)元的網(wǎng)絡。節(jié)點與加權相互連接且可調(diào)節(jié),因此神經(jīng)網(wǎng)絡具有良好的非線性映射能力。利用某鋼鐵實際生產(chǎn)數(shù)據(jù)集進行網(wǎng)絡訓練,擬合出此種加工工藝下合金元素和力學性能之間的關系。
BP網(wǎng)絡訓練過程一般分為前饋和反饋2個過程。輸入層m個變量后,前饋到隱含層和輸出層。輸入層與隱含層、隱含層與輸出層均由權值和閾值連接。xi(i=1,2…,m)表示任一輸入量,隱含層有s個神經(jīng)元,yi(j=1,2…,s)表示隱含層的輸出量。則神經(jīng)網(wǎng)絡正向傳播過程可表示為[10-15]:
(1)
(2)
式中:激活函數(shù)為f;ω和v表示權值;γ和θ表示閾值;zk表示網(wǎng)絡的輸出量;輸出層有n個神經(jīng)元。式(1)和式(2)完成了xi(i=1,2…,m)到zk(k=1,2…,n)的映射,則誤差可表示為式(3):
(3)
式中:Mk(k=1,2…,n)表示輸出目標值;δ為誤差。將公式(3)作為目標函數(shù),誤差反饋傳播使目標函數(shù)最小化。利用誤差對隱含層和輸出層之間的權重進行反饋調(diào)整分別為:
(4)
(5)
式中:η為學習率;v'和θ'為調(diào)整后的權重。對于輸入層和輸出層之前權重ω和γ,同理可調(diào)整為ω'和閾值γ':
(6)
(7)
用于訓練BP網(wǎng)絡模型的數(shù)據(jù)庫來自某鋼鐵公司100組實際生產(chǎn)的Q235鋼連續(xù)數(shù)據(jù)如表1所示,其中包括合金成分(C、Si、Mn、P、S、V、Nb、Ti、Cr、Ni、Cu、Sn、Mo、B)、碳當量(CE)、屈服強度(YS)、抗拉強度(UTS)、延伸率(EL)。將100組數(shù)據(jù)分為3組:其中70組作為訓練集,15組作為測試集,15組作為泛化能力驗證集。
表1 某鋼鐵公司實際Q235生產(chǎn)數(shù)據(jù)
依據(jù)BP網(wǎng)絡的基本原理,建立一個輸入層、隱含層和輸出層構成的3層BP網(wǎng)絡預測模型。依照表1,輸入變量為合金元素種類(C、Si、Mn、P、S、V、Nb、Ti、Cr、Ni、Cu、Sn、Mo、B)和碳當量,輸出變量為3種力學性能指標(屈服強度(YS)、抗拉強度(UTS)、延伸率(EL),因此將BP網(wǎng)絡輸入層和輸出層節(jié)點數(shù)分別確定為15和3,隱含層和輸出層的激活函數(shù)默認為型函數(shù)(Tansig)和線性傳遞函數(shù)(Purelin)。以往的隱含層節(jié)點數(shù)確定方法:第一種是根據(jù)經(jīng)驗確定節(jié)點數(shù)(Empirical method),如輸入神經(jīng)元個數(shù)與輸出神經(jīng)元個數(shù)之和的一半,即(m+n)/2;第二種為修剪法(Pruning method),初始建立足夠多的節(jié)點數(shù),在訓練過程中,根據(jù)節(jié)點數(shù)的相關程度,刪除重復的節(jié)點,此方案工作量巨大,該研究不采取此方法。因神經(jīng)網(wǎng)絡的訓練精度不僅與網(wǎng)絡結構相關,同時與輸入的樣本數(shù)量息息相關,因此提出利用樣本數(shù)量和修正系數(shù)對第一種經(jīng)驗方法進行修正,即公式(8):
(8)
式中:α為修正系數(shù)取0.1~0.5;Q為訓練集樣本數(shù)70個;m為輸出神經(jīng)元個數(shù);n為輸出神經(jīng)元個數(shù)。
從BP網(wǎng)絡自身特點及預測效果兩方面出發(fā),且由樣本的平均絕對百分比誤差(MAPE)來表示模型訓練的精度,采用如下公式:
(9)
式(9)中,Q為測試集樣本數(shù)420個;Xtest為測試集樣本;Xsim為輸出結果。當MAPE值越小時,說明模型精度越高;當訓練步數(shù)越小,說明模型訓練效率越高。訓練總次數(shù)即為網(wǎng)絡收斂到設定誤差時運行的總步數(shù)(Epochs);相同訓練次數(shù)下測試樣本的均方誤差值反映了測試集樣本預測值與目標值的偏差。2個指標反映了神經(jīng)網(wǎng)絡模型的性能,訓練總次數(shù)小,說明模型運行的時間越短、效率高;相同訓練次數(shù)下測試樣本的均方誤差值小,說明模型的預測精度高。由此可制定如表2所示的實驗對比方案:
表2 隱含層節(jié)點數(shù)的選取
圖1所示為修正系數(shù)的確定過程。根據(jù)測定,測試集輸出力學性能均在α為0.2時,MAPE值最低,模型精度最高,對應的隱含層節(jié)點數(shù)為12。根據(jù)圖1可知,模型的訓練步數(shù)隨著α增大,呈現(xiàn)先下降再升高的趨勢。當α為0.2、隱含層節(jié)點數(shù)為12時,模型的訓練步數(shù)最少,訓練速度最快,訓練步數(shù)為110步。
圖1 訓練步數(shù)與α的關系
泛化能力是指機器學習算法對新樣本的適應能力,適應隱含在數(shù)據(jù)背后的規(guī)律,對具有同一規(guī)律的學習集以外的數(shù)據(jù),經(jīng)過訓練的網(wǎng)絡也能給出合適的輸出,該能力稱為泛化能力。
通常情況下,通過測試MAPE值來評價機器學習方法的泛化能力。并非訓練的次數(shù)越多越能得到正確的輸入輸出映射關系,網(wǎng)絡的性能還需用其泛化能力來衡量。利用剩余的15組數(shù)據(jù)進行泛化能力測試,如圖2所示。
圖2 泛化能力測試過程中訓練步數(shù)與α的關系
根據(jù)測定,當α為0.2時,MAPE值分別為6.5%、15.1%、11.2%,模型針對抗拉強度、屈服強度、延伸率3個指標的預測精度仍然較高,達到最佳效果,且訓練步數(shù)最少為116。表明該模型對同一來源的新數(shù)據(jù)也具有一定的準確性和適用性。隱含層節(jié)點數(shù)的選取過程中,利用α因子作為指導可相對更快速地找到最優(yōu)值。
北京科技大學管克智、周紀華[16]利用高速變形凸輪試驗機對多種鋼材進行了高溫、高速變形抗力試驗,建立了常用的熱軋變形抗力結構模型,如公式(10)所示。為了使變形抗力模型適應計算機控制的要求,對鋼種數(shù)據(jù)進行非線性回歸分析,得到如表3所示Q235鋼的回歸系數(shù)。
表3 Q235鋼變形抗力模型回歸系數(shù)
(10)
計算變形抗力,先在Excel表格中輸入?yún)?shù)變量數(shù)值,然后運行MATLAB程序語言。最后系統(tǒng)自動計算出相應的變形抗力結果,保存到指定位置。
部分代碼如下:
%% 變形抗力計算
%% 基本參數(shù)設定
H=xlsread('data.xlsx', 1, 'A2:A10000');
% sigma
x=x0.*exp(b1.*T+b2).*power((rp/10),(b.*T+b4)).*b6.*power((r/0.4),b5)-(b6-1).*r/0.4;
%% 寫入excel
%% 輸出結果
xlswrite('data.xlsx',x,1,s);
(1)在BP網(wǎng)絡模型中,隱含層節(jié)點數(shù)的選擇會對預測結果產(chǎn)生重要影響。從模型的效率和精度角度考慮,輸出3個力學性能指標均在α為0.2時,MAPE值最低,模型精度最高,對應的隱含層節(jié)點數(shù)為12。BP網(wǎng)絡的效率最高,精度最高,模型的訓練步數(shù)也最少,訓練速度最快,訓練步數(shù)為110步。
(2)通過泛化能力測試進一步驗證了此隱含層節(jié)點數(shù)下的BP網(wǎng)絡預測能力極佳。其中,抗拉強度、屈服強度、延伸率3個指標的預測精度仍然較高,當α為0.2時,MAPE值分別為6.5%、15.1%、11.2%,達到最佳效果,且訓練步數(shù)最少為116步。
(3)利用數(shù)學模型,MATLAB程序對Q235鋼的變形抗力進行了預測,為生產(chǎn)實踐提供新的方法。