唐江凌, 蔡從中, 皇思潔, 肖婷婷
(重慶大學(xué)應(yīng)用物理系,重慶 401331)
Al-Cu-Mg-Ag系鋁合金是在2000系合金的基礎(chǔ)上通過(guò)提高合金化元素純度和改變合金元素含量以及利用新的時(shí)效工藝發(fā)展起來(lái)的。因?yàn)榫哂休^高的強(qiáng)度和熱穩(wěn)定性,Al-Cu-Mg-Ag系鋁合金是航空航天工業(yè)上很有發(fā)展?jié)摿Φ闹袦馗邚?qiáng)材料,具有廣闊的應(yīng)用前景。目前,國(guó)內(nèi)外新型Al-Cu-Mg-Ag合金已經(jīng)從機(jī)理研究進(jìn)入實(shí)際應(yīng)用開(kāi)發(fā)階段[1~5]。
力學(xué)性能是鋁合金的一個(gè)極其重要的性能指標(biāo),而抗拉強(qiáng)度、屈服強(qiáng)度則是鋁合金材料力學(xué)性能的主要參數(shù)。因此,在生產(chǎn)鋁合金的工藝過(guò)程中,通過(guò)建立加工工藝參數(shù)與合金力學(xué)強(qiáng)度關(guān)系的預(yù)測(cè)模型,對(duì)于準(zhǔn)確估計(jì)該鋁合金的力學(xué)性能具有十分重要的指導(dǎo)意義。然而,由于加工過(guò)程中各工藝參數(shù)與合金力學(xué)強(qiáng)度之間呈現(xiàn)出高度的非線性特性,傳統(tǒng)的預(yù)測(cè)模型很難精確地描述它們之間的復(fù)雜關(guān)系。因此,一些新的建模方式,如偏最小二乘(PLS)、反向傳播人工神經(jīng)網(wǎng)絡(luò)(BPNN)等方法被用來(lái)建立鋁合金的力學(xué)性能預(yù)測(cè)模型[6,7]。盡管這些方法能較好地預(yù)測(cè)鋁合金的力學(xué)性能,但它們的預(yù)測(cè)精度還不夠高,泛化能力也不夠理想。所以,進(jìn)一步探索和尋求更加準(zhǔn)確、有效的理論預(yù)測(cè)方法很有必要。
支持向量機(jī)(Support Vector Machines,SVM)是20世紀(jì)90年代由Vapnik等[8]提出的一種新的機(jī)器學(xué)習(xí)方法。它是在統(tǒng)計(jì)學(xué)習(xí)理論(Statistical Learning Theory,SLT)的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structure Risk Minimization,SRM)準(zhǔn)則基礎(chǔ)上,由給定的有限樣本信息,對(duì)經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化性能進(jìn)行折中,以得到最佳的訓(xùn)練和泛化性能。近幾年SVM在其理論研究和算法實(shí)現(xiàn)方面都取得了突破性進(jìn)展,并逐漸成為克服“維數(shù)災(zāi)難”和“過(guò)學(xué)習(xí)”等傳統(tǒng)困難的有力工具,在分類和回歸分析領(lǐng)域得到了廣泛應(yīng)用[9-15]。當(dāng)SVM用于回歸預(yù)測(cè)時(shí),又被稱為支持向量回歸(Support Vector Regression,SVR)。
本研究利用文獻(xiàn)[7]報(bào)道的Al-Cu-Mg-Ag鋁合金在不同的時(shí)效工藝下的強(qiáng)度實(shí)驗(yàn)數(shù)據(jù)集,應(yīng)用基于粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法進(jìn)行參數(shù)尋優(yōu)的SVR方法,對(duì)該鋁合金的強(qiáng)度性能進(jìn)行建模和預(yù)測(cè)研究,并與文獻(xiàn)[7]報(bào)道的應(yīng)用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果進(jìn)行比較。
設(shè)樣本集為(x1,y1),…,(xm,ym)(xm∈Rn是n 維輸入變量,y∈R是相應(yīng)的輸出變量,m為樣本個(gè)數(shù)),尋找一個(gè)輸入空間到輸出空間的非線性映射Φ(x),通過(guò)該映射,將樣本集中的數(shù)據(jù)x映射到高維特征空間F,并在特征空間F中用下述線性函數(shù)進(jìn)行擬合,即:
式中w是回歸系數(shù)向量,b是閾值。由于Φ固定不變,因此影響w的是經(jīng)驗(yàn)風(fēng)險(xiǎn)的總和以及使其在高維空間平坦的 w2,即:
上兩式中,R(C)為風(fēng)險(xiǎn)泛函,Lε(f(xi)-yi)是損失函數(shù),C是懲罰因子,ε是誤差。為了控制函數(shù)的復(fù)雜性,應(yīng)使線性回歸函數(shù)盡量平坦,并考慮可能超出精度的回歸誤差,引入松弛因子ξ*和ξ以處理未滿足(3)式的數(shù)據(jù)點(diǎn)。根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)化準(zhǔn)則,SVR通過(guò)極小化目標(biāo)函數(shù)R(w,ξi,ξ*i)來(lái)確定(1)式中的w和b:
上式 R(w,ξi,)中第一項(xiàng)是使回歸函數(shù)更為平坦,泛化能力更好,第二項(xiàng)則為減少誤差,懲罰因子C是一個(gè)常數(shù),且C>0,用來(lái)控制對(duì)超出誤差ε的樣本的懲罰程度。為求w和b,建立拉格朗日方程:
要使(5)式取得最小值,對(duì)于參數(shù)w,b,ξi,ξ*i的偏導(dǎo)都應(yīng)等于零。即:
代入(5)式,可以得到對(duì)偶優(yōu)化問(wèn)題:
由此,支持向量機(jī)的函數(shù)回歸問(wèn)題就可以歸結(jié)為對(duì)偶優(yōu)化問(wèn)題(7)。求解該對(duì)偶優(yōu)化問(wèn)題,可以得到用訓(xùn)練樣本點(diǎn)表示的w:
式中 αi和是最小化R(w)的解。由此可求得線性回歸函數(shù):
式中k(x,xi)=Ф(x)·Ф(xi)為核函數(shù)。選擇不同形式的核函數(shù)就可以生成不同的SVR回歸模型。常用的核函數(shù)有:徑向基函數(shù)、多項(xiàng)式函數(shù)、感知器函數(shù)、線性函數(shù)等。本工作采用徑向基函數(shù)(10)來(lái)建立SVR回歸模型:
由于SVR回歸模型的泛化性能很大程度上依賴于不敏感損失函數(shù)ε、誤差懲罰因子C和核函數(shù)參數(shù)γ等3個(gè)參數(shù)。因此,對(duì)(ε,C,γ)參數(shù)進(jìn)行尋優(yōu)是十分關(guān)鍵的。本研究采用PSO算法來(lái)尋找最優(yōu)組合參數(shù)(ε,C,γ)。
PSO 是由 Eberhart和 Kennedy[16]模擬鳥群的飛行捕食行為而于1995年提出的一種高效多維并行尋優(yōu)算法。設(shè)群體中的每個(gè)粒子由3維參數(shù)向量(ε,C,γ)組成,第 i個(gè)粒子在3維解空間的位置為ui=(ui1,ui2,ui3)T,其速度為 vi=(vi1,vi2,vi3)T,當(dāng)前時(shí)刻的個(gè)體極值記為 pibest,全局極值記為 gbest。在每次迭代中,粒子跟蹤個(gè)體極值、全局極值和自己前一時(shí)刻的狀態(tài)來(lái)調(diào)整當(dāng)前時(shí)刻的位置和速度,迭代公式如下:
式中v(t),v(t+1),u(t)和 u(t+1)分別是粒子在當(dāng)前時(shí)刻、下一時(shí)刻的速度和位置;rand()是[0,1]之間的隨機(jī)數(shù);c1和c2是學(xué)習(xí)因子,通常取為2;ω是權(quán)重因子,為加快收斂速度,其值應(yīng)隨算法迭代的進(jìn)行而自動(dòng)調(diào)節(jié),一般定義為:
式中ωmax和ωmin分別為最大和最小權(quán)重因子,它們的值一般分別取為0.9和0.4。iter為當(dāng)前迭代次數(shù),itermax為總的迭代次數(shù)。為了直接反映SVR模型的回歸性能,選用均方根誤差(RMSE)作為適應(yīng)度函數(shù):
式中m是訓(xùn)練樣本數(shù),yi和^yi分別是第i個(gè)訓(xùn)練樣本目標(biāo)量的實(shí)測(cè)值和預(yù)測(cè)值。
文中所用Al-Cu-Mg-Ag合金成分如表1。對(duì)合金的工藝處理方式見(jiàn)文獻(xiàn)[7]。實(shí)驗(yàn)數(shù)據(jù)共27組,是在時(shí)效狀態(tài)的每個(gè)時(shí)效時(shí)間點(diǎn)取兩片Al-Cu-Mg-Ag合金試樣,等時(shí)效完畢后再測(cè)量試樣在室溫下的抗拉強(qiáng)度和屈服強(qiáng)度,取其平均值(詳見(jiàn)表2)。
為了與文獻(xiàn)[7]中神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)效果進(jìn)行直接比較,本研究也采用實(shí)驗(yàn)數(shù)據(jù)集中的前25個(gè)樣本進(jìn)行建模,并將后兩組(第26和27組)樣本作為測(cè)試樣本用于檢驗(yàn)?zāi)P偷念A(yù)測(cè)能力。其中,時(shí)效溫度、時(shí)效時(shí)間兩個(gè)工藝參數(shù)作為模型的輸入變量,抗拉強(qiáng)度和屈服強(qiáng)度兩個(gè)力學(xué)性能量為輸出變量。
采用平均絕對(duì)誤差(MAE)、平均絕對(duì)百分誤差(MAPE)對(duì)所建模型的預(yù)測(cè)性能進(jìn)行評(píng)價(jià):
在式(15)和式(16)中n是檢驗(yàn)樣本數(shù),yj和^yj分別是第j個(gè)檢驗(yàn)樣本的實(shí)測(cè)值和預(yù)測(cè)值。
表1 實(shí)驗(yàn)合金成分Table 1 Composition of Al-Cu-Mg-Ag alloy
表2 實(shí)驗(yàn)數(shù)據(jù)Table 2 Experimental data
表3列出了BP神經(jīng)網(wǎng)絡(luò)模型和SVR模型的預(yù)測(cè)結(jié)果。由表3可見(jiàn),無(wú)論是抗拉強(qiáng)度還是屈服強(qiáng)度,SVR模型的預(yù)測(cè)結(jié)果都更接近于實(shí)測(cè)值。這表明SVR模型的預(yù)測(cè)精度高于BP神經(jīng)網(wǎng)絡(luò)模型,可以用于Al-Cu-Mg-Ag合金強(qiáng)度性能的預(yù)測(cè)。表4對(duì)比了BP神經(jīng)網(wǎng)絡(luò)模型和SVR模型二者預(yù)測(cè)值的平均絕對(duì)誤差MAE和平均絕對(duì)百分誤差MAPE。表中數(shù)據(jù)顯示,SVR模型的MAE和MAPE都分別小于BP神經(jīng)網(wǎng)絡(luò)模型。這進(jìn)一步說(shuō)明,SVR模型具有更高的預(yù)測(cè)精度,更好的泛化能力,是一種更有效的預(yù)測(cè)、分析手段。
表3 BP神經(jīng)網(wǎng)絡(luò)模型和SVR模型的預(yù)測(cè)結(jié)果比較Table 3 Comparison of predicted result between BP neural network and SVR
表4 BP神經(jīng)網(wǎng)絡(luò)模型和SVR模型的預(yù)測(cè)性能比較Table 4 Comparison of prediction between BP neural network and SVR
(1)Al-Cu-Mg-Ag合金力學(xué)性能與時(shí)效溫度和時(shí)效時(shí)間關(guān)系密切。隨著溫度升高,合金抗拉強(qiáng)度和屈服強(qiáng)度達(dá)到峰值時(shí)效的時(shí)間變短;隨著時(shí)間加長(zhǎng),合金抗拉強(qiáng)度和屈服強(qiáng)度下降。
(2)支持向量回歸方法對(duì)Al-Cu-Mg-Ag合金強(qiáng)度性能的預(yù)測(cè)非常有效,其準(zhǔn)確程度超過(guò)BP神經(jīng)網(wǎng)絡(luò),可以用于Al-Cu-Mg-Ag鋁合金時(shí)效過(guò)程中工藝參數(shù)與強(qiáng)度性能的關(guān)系的預(yù)測(cè)和分析。
[1]HUTCHINSON C R,F(xiàn)AN X,PENNYCOOK S J,et al.On the origin of the high coarsening resistance of Omega plates in Al-Cu-Mg-Ag alloys[J].Acta Mater,2001,49(14):2827-2841.
[2]SONG M,CHEN K H,HUANG L P.Effects of Ag addition on mechanical properties and microstructures of Al-8Cu-0.5Mg alloy [J].Trans Nonferrous Met Soc China,2006,16(4):766-771.
[3]肖代紅,黃伯云,宋 旼,等.Al-Cu-Mg-(Ag,La)合金的顯微組織與力學(xué)性能[J].中國(guó)有色金屬學(xué)報(bào),2008,18(4):571-576.
(XIAO D H,HUANG B Y,SONG M,et al.Microstructures and mechanical properties of Al-Cu-Mg-(Ag,La)alloys [J].The Chinese Journal of Nonferrous Metals,2008,18(4):571-576.)
[4]毛柏平,雷文平,沈健.Ag對(duì)Al-Cu-Mg合金組織與性能的影響[J].熱加工工藝,2009,38(14):48-50.
(MAO B P,LEI W P,SHEN J.Effects of Ag on microstructure and properties of Al-Cu-Mg Alloy [J].Hot Working Technology,2009,38(14):48-50.)
[5]侯延輝,劉志義,李云濤,等.Al-Cu-Mg-Ag合金峰時(shí)效前微觀組織演變及屈服強(qiáng)度數(shù)值模擬[J].稀有金屬材料與工程,2010,39(8):1435-1438.
(HOU Y H,LIU Z Y,LI Y T,et al.Simulation of microstructure evolution and yield strength of Al-Cu-Mg-Ag alloys before peak aging stage[J].Rare Metal Materials and Engineering,2010,39(8):1435-1438.)
[6]方善鋒,汪明樸,王正安,等.PLS-BPN法用于7005鋁合金力學(xué)性能與工藝參數(shù)的定量研究[J].中國(guó)有色金屬學(xué)報(bào),2007,17(12):1948-1954.
(FANG S F,WANG M P,WANG Z A,et al.Quantitative study between mechanical properties and processing parameters for 7005Al alloys predicted using PLS-BPN method[J].The Chinese Journal of Nonferrous Metals,2007,17(12):1948-1954.)
[7]侯延輝,劉志義,柏松,等.Al-Cu-Mg-Ag合金時(shí)效強(qiáng)化的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[J].材料熱處理學(xué)報(bào),2009,30(3):203-208.
(HOU Y H,LIU Z Y,BAI S,etal.Prediction of aging strengthening of Al-Cu-Mg-Ag alloy based on neural network [J].Transactions of Materials and Heat Treatment,2009,30(3):203-208.)
[8]VAPNIK V.The nature of statistical learning theory[M].New York:Springer,1995.
[9]CAI C Z,HAN L Y,JI Z L,et al.SVM-Prot:web-based support vector machine software for functional classification of a protein from its primary sequence[J].Nucleic Acids Res,2003,31(13),3692-3697.
[10]CAI C Z,HAN L Y,JI Z L,et al.Enzyme family classification by support vector machines[J].Proteins,2004,55(1):66-76.
[11]LIANG G Z,LI Z L,ZHOU Y H,et al.A new peptide sequences representation technique and support vector machine for quantitative structure-retention modeling of peptides in HPLC[J].Acta Phys Chim Sin,2006,22(9):1052-1055.
[12]DING Y M,ZHANG T T,LIU X,et al.Phase diagram of CsF-RbF system[J].Acta Phys Chim Sin,2007,23(4)614-616.
[13]LI P,TAN N X,RAO H B,et al.Classification Models for HERG Potassium Channel Inhibitors Based on the Support Vector Machine Approach[J].Acta Phys Chim Sin,2009,25(8):1581-1586.
[14]LU W,XUE Y.Activity Prediction of Hormone-Sensitive Lipase Inhibitors Based on Machine Learning Methods[J].Acta Phys Chim Sin,2010,26(2)471-477.
[15]YANG G B,LI Z R,RAO H B,et al.Classification Models for Acetylcholinesterase Inhibitors Based on Machine Learning Methods[J].Acta Phys Chim Sin,2010,26(12):3351-3359.
[16]KENBEDY J,EBERHART R.Particle swarm optimization[C]//Proc IEEE Int Conf Neural Networks,1995.