戴宇佳, 高 勛, 劉子源*
1. 浙江農(nóng)林大學光機電工程學院, 浙江 杭州 311300
2. 長春理工大學物理學院, 吉林 長春 130022
鋁合金是世界上使用量第二大金屬材料, 僅次于鋼。 由于其強度高、 密度低、 塑性好, 廣泛應用于汽車、 建筑、 衛(wèi)星以及化學工業(yè)等諸多領域[1-4]。 鋁合金中各種元素的含量將直接影響鋁合金的質(zhì)量和性能, 其中Mn是鋁合金的重要元素, 能夠止鋁合金的再結晶過程, 提高再結晶溫度。 為了保證鋁合金的質(zhì)量, 對其元素含量的實時、 快速檢測提出了很高的要求。
傳統(tǒng)的鋁合金成分檢測技術主要有電感耦合等離子體原子發(fā)射光譜法(inductive-coupled plasma-atomic emission spectrometry, ICP-AES)、 火花源原子發(fā)射光譜法(spark source atomic emission spectrometry, spark-OES)和X射線熒光法(X-ray fluorescence spectrometer, XRF)[5-7], 上述方法通常需要復雜的預處理、 較長的檢測時間、 昂貴的設備以及專業(yè)人員, 所使用的試劑可能對樣品造成二次污染。 LIBS技術作為一種快速、 綠色的新興化學檢測技術, 被譽為分析化學中的“未來巨星”[8-9]。 激光誘導擊穿光譜(laser-induced breakdown spectroscopy, LIBS)技術在金屬制廠的快速元素分析中具有突出的優(yōu)勢, 如樣品制備量少或無需樣品制備、 實時和全元素分析[10-11]。 因此, LIBS是在線、 原位、 實時元素分析中最有前途的技術, 在冶金[12]、 煤炭生產(chǎn)[13]和礦物開發(fā)[14]等制造業(yè)中具有廣闊應用市場。
盡管如此, LIBS技術由于定量分析性能的限制, 導致其目前無法大規(guī)模商業(yè)化。 量化性能始終是LIBS技術的一個短板, 相對較低的測量精度和準確度是LIBS在廣泛應用中成為常規(guī)分析方法的主要障礙。 等離子體的時空不均勻性導致的自吸收效應、 樣品的物理性質(zhì)和化學組成造成的基體效應、 激光不穩(wěn)定和光散射等產(chǎn)生的噪聲都導致元素含量與 LIBS光譜譜線強度的線性關系出現(xiàn)偏差, 降低測量的精度和準確度。 近年來, 許多研究者開始將LIBS技術與多元分析回歸模型[15]結合起來進行定量研究。 多元方法可以充分利用LIBS發(fā)射譜線的信息, 克服其他干擾因素的影響, 從而提高LIBS在定量分析中的性能。 李明亮等[16]利用多變量線性回歸、 中值高斯核SVM回歸法和標準化偏最小二乘回歸(partial least squares regression, PLSR)模型對鋁合金中的Cu元素進行定量分析, 結果表明, 標準化PLSR模型的精度和準確度都有明顯的提高,R2值達到0.997。 Song等[17]基于RF-ANN算法建立了合金鋼中Cr和V元素檢測的多元模型, 與內(nèi)標法相比, Cr和V的RMSECV值分別降低了65.0%和83.3%, 結果表明, RF-ANN方法可以改善合金鋼的LIBS定量分析性能。
多變量分析技術有許多種, 其中PLSR模型是一種常用的多變量分析方法, 但其也具有一定局限性。 根據(jù)定義, 對于每個感興趣的樣本, PLSR能夠獲取全部預測變量(對于LIBS, 這意味著每個光譜通道的強度)。 然而, LIBS數(shù)據(jù)中的許多通道對于濃度的預測是沒有意義的, 可能會產(chǎn)生噪聲和錯誤的結果。 因此, 在進行LIBS定量分析之前, 可以使用特征選擇技術對光譜中有意義的區(qū)域進行挑選。 目前, 基于先驗知識的特征譜線的手動選擇和自動優(yōu)化方法[11-12]已成功應用于LIBS光譜數(shù)據(jù)分析中。 Lü等[18]提出了一種線性回歸(LR)與稀疏欠完全自動編碼器(SUAC)相結合的特征提取方法, 對陶瓷LIBS高維光譜數(shù)據(jù)進行非線性特征提取和降維, 大大減少了輸入數(shù)據(jù)維數(shù)和冗余信息, 成功提高了LIBS定量分析性能。 Deng等[19]分別利用競爭自適應重加權采樣法(CARS)和連續(xù)投影算法(SPA)對煤炭LIBS光譜進行特征向量選擇, 并結合PLS建立回歸模型, 結果表明, SPA-PLS最終通過連續(xù)投影分別篩選出14(N元素)和11(S元素)個變量, 并獲得了最佳的預測結果。 楊淋玉等[20]利用遺傳算法對鋼鐵LIBS光譜進行特征向量選擇, 將挑選出的有效信息帶入PLS模型中, 成功提高了PLS的分析性能。 為了提高LIBS定量分析性能并減少計算成本, 可以將高維回歸技術與自動減少輸入變量數(shù)量的功能結合起來。 本文將最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)和最小二乘支持向量機(least squares support vector machine, LSSVM)模型相結合, 建立了鋁合金中Mn元素的回歸模型。 對于鋁合金數(shù)據(jù)的LIBS技術定量分析, 幾乎沒有探索過這種數(shù)據(jù)分析組合。
本文分別利用傳統(tǒng)單變量線性校準法、 PLSR、 和LASSO-LSSVM回歸對鋁合金中Mn元素的LIBS光譜數(shù)據(jù)進行定量分析, 對比了三種回歸模型的分析精度和準確度, 以驗證多元校準模型的穩(wěn)定性和準確性。
納秒激光誘導擊穿光譜實驗裝置如圖1所示。 該實驗系統(tǒng)采用Nd∶YAG激光器(Power8000, Continuum, 波長: 1 064 nm, 脈沖寬度: 10 ns, 重復頻率: 10 Hz, 光束直徑: 6 mm, 最大能量: 1 J)。 激光束通過焦距為120 mm的平凸石英透鏡(L1)聚焦到鋁合金樣品表面產(chǎn)生等離子體, 并通過由半波片和格蘭棱鏡組成的能量衰減系統(tǒng)調(diào)節(jié)激光脈沖能量。 等離子體輻射光譜由焦距為75 mm的收集透鏡L2聚焦到配有ICCD(1 024 Pixel×1 024 Pixel, DH334T)的中階梯光柵光譜儀(Mechelle 5000, Andor)的光纖探頭(纖芯直徑200 μm)內(nèi), 其中光譜儀的采集波長范圍為200~975 nm, 精度為±0.05 nm, 分辨率為λ/Δλ=5 000, ICCD探測器的門寬為1 μs。 實驗過程中, 激光能量為80 mJ, 延遲時間為1 μs。 為避免對鋁合金樣品表面同一位置的過度燒蝕, 樣品在PI三維電動平移臺(M-521DD, Physik Instrumente, Germany)上以0.5 mm·s-1的速度做“弓”字形運動。 數(shù)字延時觸發(fā)器(DG645)同步觸發(fā)激光器和光譜儀。 為了降低光譜探測的隨機誤差, 每個光譜累積50個脈沖。 實驗樣品為鋁合金國家標準樣品(購買于西南鋁業(yè)集團有限責任公司, LD7.8系列), 物質(zhì)含量符合國家標準, 表1為鋁合金標樣中各元素的質(zhì)量濃度參數(shù)。
表1 LD7.8鋁合金樣品元素濃度參數(shù)(wt%)
圖1 激光誘導擊穿光譜實驗系統(tǒng)
為了評價LIBS回歸模型的性能, 選用R2、 平均相對誤差(average relative error, ARE)、 訓練集均方根誤差(root mean square error calibration, RMSEC)和測試集均方根誤差(root mean square error prediction, RMSEP)作為評價參數(shù)。 具體表達式如式(1)—式(3)
(1)
(2)
(3)
為了降低外界環(huán)境等因素對定量分析結果的影響, 采用小波閾值法和三階極小值算法對光譜數(shù)據(jù)進行降噪處理, 其中小波閾值法的最佳參數(shù)為5層分解層和bior2.6小波。
最小絕對收縮和選擇算子(LASSO)是一種有效的變量選擇方法。 LASSO對模型系數(shù)進行L1范式懲罰, 與L2相比, 使用L1正則化可以將無關變量的權重值壓縮至0。 進而得到一個稀疏矩陣, 并提取與定量分析相關的變量, 從而實現(xiàn)光譜數(shù)據(jù)的有效降維。 LASSO的損失函數(shù)可以表達為[21]
(4)
式(4)中,α是正則化系數(shù),ω是回歸系數(shù)。
LSSVM是基于SVM法的改進機器學習方法, 對于非線性問題的處理具有一定優(yōu)勢。 LSSVM模型在進行數(shù)據(jù)分析時通常選擇徑向基函數(shù)(RBF)作為核函數(shù)。 核函數(shù)表達式為
K(xi,xj)=exp(-‖x-xk‖2/2σ2)
(5)
式(5)中,σ為核參數(shù)。
LSSVM回歸模型
(6)
為了降低基體效應對LIBS定量分析結果的影響, 采用內(nèi)標法對鋁合金中的Mn元素進行定量分析。 選取內(nèi)標參考線時, 選擇含量穩(wěn)定、 且對待分析元素無干擾的特征譜線, 同時參考線的譜線位置盡量與內(nèi)標元素位置接近。 因此, 選擇Mn Ⅰ 383.9 nm作為分析譜線, 附近的Al Ⅰ 396.2 nm作為參考線。 選擇每塊鋁合金樣品的8組光譜數(shù)據(jù)作為訓練集, 4組數(shù)據(jù)作為預測集, 對12組樣品數(shù)據(jù)進行統(tǒng)一分析。 定量分析結果如圖2所示, Mn元素的相關系數(shù)R2、 RMSEC、 RMSEP和ARE分別為74.62%、 0.66 wt%、 0.58 wt%和22.38%。 結果表明, 通過內(nèi)標法校準后, Mn元素的預測準確性不是很高, 需要探索更有效的鋁合金微量元素濃度檢測方法。 因此, 為了能夠減小誤差并提高Mn元素的定量分析性能, 下面采用基于偏最小二乘法和LASSO-LSSVM的多變量分析方法。
圖2 基于內(nèi)標法的Mn元素定標曲線
目前, 多元分析方法在LIBS定性和定量分析的應用中發(fā)揮著重要作用。 PLSR是一種常用的多元方法, 該方法可有效避免基體效應, 并且可以較好地處理LIBS光譜中的噪聲, 同時數(shù)據(jù)處理速度較快。 為了避免PLSR模型因為包含不相關因素而出現(xiàn)過擬合現(xiàn)象, 采用10倍交叉驗證方法優(yōu)化PLSR模型的參數(shù)。 當RMSECV值最小時, Mn元素的主成分數(shù)量為11。 為了降低光譜數(shù)據(jù)的復雜性, 降低過度擬合的風險, 選擇Mn元素403~437 nm波段的譜線作為PLSR模型的輸入變量。 利用這些譜線建立實際濃度和預測濃度之間的關系曲線, 如圖3所示。 Mn元素的相關系數(shù)R2、 RMSEC、 RMSEP和ARE分別為95.27%、 0.18 wt%、 0.19 wt%和9.79%。 從以上結果可以看出, 與內(nèi)標法相比, PLSR模型校準曲線的R2有了很大的提高, RMSEC、 RMSEP和ARE值都大大降低了, 該模型提高了定量分析的準確性和穩(wěn)定性。
圖3 基于PLSR的Mn元素定標曲線
根據(jù)定義, PLSR模型從每個目標樣本中獲得所有預測變量(對于LIBS光譜, 這代表每個波長的強度)。 但是, LIBS數(shù)據(jù)中許多光譜通道無法完成元素含量的準確預測, 即使它們具有較小的相關系數(shù), 也可能產(chǎn)生噪聲和錯誤的結果。 為了克服PLSR模型的局限性, 利用LASSO模型進行特征向量選擇。 通過交叉驗證對模型參數(shù)進行優(yōu)化, 選擇均方根誤差最小時的Alpha值為最優(yōu)參數(shù)。 將LIBS光譜數(shù)據(jù)帶入到LASSO回歸模型中, 得到的結果如圖4所示。 LASSO回歸模型為每個分析元素選擇了特定波長, 同時每個波長都具有非零ω系數(shù)值。 圖4(a)給出了Mn元素的12個光譜通道的非零ω系數(shù)(Mn Ⅰ 383.3 nm、 Mn Ⅰ 383.9 nm、 Mn Ⅰ 403.07 nm、 Mn Ⅰ 403.3 nm等), 圖4(b)表示LASSO模型選擇的Mn光譜波長范圍區(qū)域。 這些通道中的一部分對應于強分析線, 另一部分對應于連續(xù)光譜。 以上結果表明, 在整個波長范圍內(nèi), LASSO模型可以有效地搜索一個小而合理的預測因子子集, 而PLSR模型中的每個波長都具有相關系數(shù), 計算過程相對比較復雜。 LASSO模型用多個譜線來預測每個元素的濃度, 而自吸收效應只可能發(fā)生在強譜線上, 因此, 與單變量分析模型相比, 多變量LASSO模型出現(xiàn)自吸收的可能性較小。
圖4 (a) 具有非零系數(shù)的光譜通道的值; (b)代表LASSO選擇的Mn光譜波長范圍區(qū)域
利用LSSVM算法對LASSO挑選出的Mn元素的光譜數(shù)據(jù)進行建模, 結果如圖5所示。 圖5給出了六個樣品中Mn元素的標準濃度和預測濃度值的關系曲線。 回歸模型中共有6個樣本的72個光譜數(shù)據(jù)(48組作訓練集, 24組作測試集)。 可以看到, 相比于內(nèi)標法和偏最小二乘法, LASSO-LSSVM模型的RMSEC、 RMSEP和ARE數(shù)值都大大降低了, 同時R2也有很大程度的提高。
圖5 基于LASSO-LSSVM的Mn元素定標曲線
表2對比了內(nèi)標法、 PLSR和LASSO-LSSVM三種定量分析模型的參數(shù)。 相比于內(nèi)標法, 相關系數(shù)R2從74.62%提高到99.29%, ARE從22.38%降低到3.56%, RMSEC從0.66 wt%降低到0.040 wt%, RMSEP從0.58 wt%降低到0.042 wt%。 可以看出, LASSO-LSSVM回歸模型的定量分析精度和準確度都有大幅度的提高, LASSO模型在內(nèi)標法、 PLS法之間選擇“中間位置”, 能高效地為整個光譜中的待分析元素搜索到少量的特征波長, 并且這些波長可以匹配特定的輻射特性, 該特性可以有效降低基體效應和自吸收效應的影響。
表2 Mn元素的三種定量分析參數(shù)對比
本文開展了基于LIBS技術與LASSO-LSSVM回歸模型相結合提高鋁合金中Mn元素的定量分析精度的研究, 該方法可有效消除自吸收效應和發(fā)射源噪聲引起的偏差。 首先, 采用LASSO模型進行光譜特征選擇, 并結合LSSVM算法對鋁合金材料中的微量元素Mn建立回歸模型, 進一步將分析結果與傳統(tǒng)的單變量分析模型(內(nèi)標法)和PLSR模型進行比較, 驗證了多元校準模型的準確性。 與內(nèi)標法和PLSR相比,R2提高到99.29%, ARE、 RMSEC和RMSEP分別降低到3.56%、 0.040 wt%和0.042 wt%。 以上結果表明, LIBS技術和LASSO-LSSVM的結合是測量鋁合金材料中微量元素的有效方法。 LIBS技術與機器學習相結合可以確定鋁合金中微量元素的含量, 進而可以對航空航天設備中的金屬成分檢測提供技術支持。