林曉梅,黃玉濤,林京君,陶思宇,車長金
1. 長春工業(yè)大學(xué)電氣與電子工程學(xué)院,吉林 長春 130012 2. 長春工業(yè)大學(xué)機(jī)電工程學(xué)院,吉林 長春 130012
土壤是維持人類生存和生活的重要組成部分。隨著工業(yè)化程度的不斷提高,工業(yè)生產(chǎn)中產(chǎn)生的重金屬廢棄物也越來越多,并在土壤中不斷累積,對土壤造成很嚴(yán)重的污染。同時這些重金屬還會通過動植物進(jìn)入食物鏈,最終進(jìn)入人體,對身體健康造成很大的影響[1]。因此,提高土壤重金屬定量分析的精確度和穩(wěn)定性意義重大。
在檢測土壤成分含量的過程中,常用的方法有原子吸收分光光度法、X射線熒光光譜法、電感耦合等離子體質(zhì)譜法和中子活化法等。激光誘導(dǎo)等離子體技術(shù)(LIBS)是一種成分含量分析光譜技術(shù)[2]。相對于以上幾種檢測方法,LIBS技術(shù)具有無需制樣、檢測時間短、可多元素同時檢測等優(yōu)勢[3],被逐漸應(yīng)用于土壤定性、定量分析領(lǐng)域。Ramli Muliadi等[4]用LIBS技術(shù)檢測土壤中的Cs元素,檢測限為0.3 ppm。Edilene C Ferreira等[5]用人工神經(jīng)網(wǎng)絡(luò)對Cu元素的定標(biāo)曲線進(jìn)行校準(zhǔn),使Cu的檢測限降到2.3 ppm。Li等[6]通過把電火花放電和LIBS技術(shù)相結(jié)合,進(jìn)行土壤中Cr等元素的檢測,把光譜的信噪比提高了2~3倍。谷艷紅等[7]把CF-LIBS與LIBS技術(shù)相結(jié)合,提高了土壤中Cr元素含量分布的準(zhǔn)確度。這些研究側(cè)重于檢測技術(shù)的結(jié)合和樣品檢出限的提高,但對樣品精確度和穩(wěn)定性的研究較少。由于土壤的基體效應(yīng)較大[8],會對定量分析產(chǎn)生很大影響,降低LIBS的分析精度。本工作主要研究了偏最小二乘法(PLS)和最小二乘支持向量機(jī)(LSSVM)算法在提高土壤精確度和穩(wěn)定性檢測方面的效果。
首先研究了能量和延時對譜線強(qiáng)度和信噪比的影響,同時為了降低土壤基體效應(yīng)對譜線的影響,提高LIBS的重復(fù)性和檢測精度,在最佳實(shí)驗(yàn)條件下,分析對比了PLS和LSSVM算法對定標(biāo)模型的影響。通過擬合系數(shù),均方根誤差和平均相對誤差等參數(shù)對結(jié)果進(jìn)行評價,得到最佳的定標(biāo)模型。
實(shí)驗(yàn)裝置如圖1所示。用輸出波長為1 064 nm,脈沖寬度為8 ns,脈沖頻率為1~10 Hz的Nd∶YAG激光器(Nimma-400型,中國鐳寶光電)作為光源。激光經(jīng)過焦距為150 mm的聚焦透鏡,將能量聚焦在樣品表面,使樣品激發(fā)產(chǎn)生等離子體,等離子體的光譜信號經(jīng)光纖探頭耦合至具有CCD的四通道光譜儀(Avaspec-ULS2048CL-4-EVO型,荷蘭Avantes)進(jìn)行分光等處理。實(shí)驗(yàn)中用三維移動平臺(YMC400,中國江云光電)來控制樣品的移動,激光器與光譜儀由數(shù)字延時發(fā)生器(BNC575,美國Berkeley Nucleonics Corp)同步控制,觸發(fā)信號為激光器的調(diào)Q信號。光譜儀的探測延時為0.9 μs。為了降低因能量波動對實(shí)驗(yàn)帶來的影響,取不同位置光譜的平均值作為實(shí)驗(yàn)最終譜線。
圖1 實(shí)驗(yàn)系統(tǒng)原理圖Fig.1 Schematic diagram of the experimental system
實(shí)驗(yàn)中所用的樣品由標(biāo)準(zhǔn)土壤樣品GBW07403和結(jié)晶狀的Cu(NO3)2混合而成。先將混合好的樣品反復(fù)研磨,再對樣品進(jìn)行烘干處理。取5 g樣品放入模具中,用壓片機(jī)施加30 MPa的壓強(qiáng),持續(xù)30 min,壓制成直徑30 mm,厚度3 mm的圓餅形薄片。壓制好的樣品如圖2所示,樣品濃度如表1所示。
偏最小二乘法(PLS)是一種多元線性回歸方法,通過提取元素濃度和譜線強(qiáng)度的主成分,實(shí)現(xiàn)多因變量對多自變量的回歸建模。最小二乘支持向量機(jī)(LSSVM)是基于支持向量機(jī)(SVM)發(fā)展而來的機(jī)器學(xué)習(xí)方法,把SVM中的不等式
圖2 實(shí)驗(yàn)樣品圖Fig.2 Pictures of experimental samples
表1 樣品中Cu元素的濃度Table 1 Certified concentration (Wt%) of Cu in the samples
約束替換為等式約束,訓(xùn)練過程的復(fù)雜度大大降低,并且能夠較好地解決高維度和非線性的問題[9]。在LSSVM算法中,把徑向基函數(shù)作為核函數(shù),用留一驗(yàn)證法進(jìn)行參數(shù)尋優(yōu)。該模型的優(yōu)化問題可以表示為
(1)
式(1)中,w為權(quán)向量,ei為誤差向量,λ為正則化參數(shù),用來平衡最優(yōu)超平面與最小偏差量,該式的約束條件為
yi[wTφ(xi)+b]=1-ei,i=1,…,N
(2)
式(2)中,b為偏差向量,φ(xi)為核空間映射函數(shù),提取原始空間中的數(shù)據(jù)特征,把原始樣本數(shù)據(jù)映射到高維空間中進(jìn)行處理。
最終可得LSSVM回歸模型為
(3)
式(3)中,αi為Lagrange乘子,k(x,xi)為滿足mercer條件下的核函數(shù)。
本實(shí)驗(yàn)對每種濃度樣品取9組數(shù)據(jù),其中6組作為訓(xùn)練集,3組作為預(yù)測集,建立定標(biāo)摸型。并對數(shù)據(jù)進(jìn)行Lorenz擬合,用預(yù)測集的偏離程度驗(yàn)證兩種算法在降低基體效應(yīng)和自吸收效應(yīng)方面的效果。
實(shí)驗(yàn)檢測了樣品在190~557 nm范圍內(nèi)的光譜數(shù)據(jù)[10]。由于土壤中Cu元素的特征譜線受附近譜線的影響較大,因此對比各特征譜線受影響程度,選擇Cu Ⅰ 324.75 nm和Cu Ⅰ 327.40 nm兩條較好的特征譜線進(jìn)行分析。對Cu Ⅰ 324.75 nm譜線產(chǎn)生影響的是Ti Ⅱ 324.86 nm譜線,由于選取的GBW07403標(biāo)準(zhǔn)土樣含Ti量很低,且衰減很快,因此把Ti Ⅱ 324.86 nm對Cu Ⅰ 324.75 nm的影響忽略不計。綜合光譜強(qiáng)度和美國原子光譜數(shù)據(jù)庫(NIST)的部分參數(shù),選擇Cu Ⅰ 324.75 nm譜線作為Cu的分析線。兩條Cu線的參數(shù)對比如表2所示。由于Cu在土壤中屬于微量元素,而Fe是土壤中的基體元素,含量相對穩(wěn)定,因此選擇Fe Ⅰ 393.26 nm作為內(nèi)標(biāo)元素。
表2 Cu Ⅰ 324.75 nm與Cu Ⅰ 327.40 nm的參數(shù)對比Table 2 Comparison of the parameters of Cu Ⅰ 324.75 nm and Cu Ⅰ 327.40 nm
2.2.1 激光能量對特征譜線的影響
激光誘導(dǎo)產(chǎn)生等離子體的過程中,激光能量的大小會對特征譜線和信噪比(SNR)產(chǎn)生影響[11]。Cu Ⅰ 324.75 nm的譜線強(qiáng)度和信噪比隨激光能量的變化如圖3所示。由圖可以看出,能量在30~90 mJ之間,譜線強(qiáng)度和信噪比隨能量的增加而增加。分析認(rèn)為在此過程中,等離子體密度不斷增加,并逐漸達(dá)到臨界值。激光能量在到達(dá)90 mJ后,譜線強(qiáng)度和信噪比開始趨于平緩。這是由于過高的能量使等離子體產(chǎn)生屏蔽效應(yīng),對后沿激光產(chǎn)生一定程度的散射,激光能量不能完全到達(dá)樣品表面。因此,選擇90 mJ作為本實(shí)驗(yàn)使用的最佳能量。
圖3 激光能量對譜線強(qiáng)度和SNR的影響Fig.3 The influence of laser energy onthe spectral intensity and SNR
2.2.2 采集延時對特征譜線的影響
在等離子體光譜信號的采集過程中,采集延時對光譜強(qiáng)度和信噪比會產(chǎn)生很大的影響[12]。具體變化如圖4所示,采集延時在0 ns時,光譜的信噪比比較低。推測等離子體產(chǎn)生初期,由于韌致輻射和復(fù)合輻射的作用,信號光譜會有很高的背景噪聲。隨著采集延時的不斷增加,韌致輻射和復(fù)合輻射的逐漸衰減,并且衰減速度比原子發(fā)射光譜的衰減速度快,因此,采集延時在0~1 000 ns時,信噪比逐漸增加并達(dá)到最高值。采集延時在1 000 ns之后,由于等離子體不斷冷卻擴(kuò)散,使得譜線強(qiáng)度和信噪比不斷降低。因此,選擇1 000 ns作為本次使用的最佳采集延時。后續(xù)實(shí)驗(yàn)均在最佳能量和最佳延時條件下進(jìn)行。
圖4 采集延時對譜線強(qiáng)度和SNR的影響Fig.4 The influence of delay time onthe spectral intensity and SNR
2.3.1 基于內(nèi)標(biāo)法的定標(biāo)模型
內(nèi)標(biāo)法是最常用來的定量分析方法之一,尤其是土壤的基體效應(yīng)比較明顯,內(nèi)標(biāo)法可以在一定程度上抑制基體效應(yīng),降低實(shí)驗(yàn)環(huán)境變動對譜線的影響[13]。在用內(nèi)標(biāo)法做定標(biāo)模型時,把每個濃度的樣品各采集9組數(shù)據(jù),以其中6組數(shù)據(jù)做訓(xùn)練集,3組數(shù)據(jù)做預(yù)測集。把訓(xùn)練集和預(yù)測集的全部數(shù)據(jù)擬合在一起,通過擬合系數(shù)R2來觀察模型的擬合效果。擬合結(jié)果如圖5所示。由圖可知,訓(xùn)練集的均方根誤差(RMSEC)為3.448 8 Wt%,預(yù)測集的均方根誤差(RMSEP)為1.280 7 Wt%,表明該模型的精確度較低。平均相對誤差(ARE)為13.340 0%,說明該模型的穩(wěn)定性不高,而且從擬合系數(shù)可以看出,擬合效果還有待提高,特別是濃度在2 Wt%和4 Wt%時,預(yù)測集濃度出現(xiàn)大幅度的偏離。
圖5 基于內(nèi)標(biāo)法的定標(biāo)模型Fig.5 Calibration model based on internal standard method
2.3.2 基于PLS的定標(biāo)模型
偏最小二乘法是一種常用的數(shù)學(xué)優(yōu)化方法,可以在一定程度上降低土壤基體效應(yīng)帶來的誤差,對定標(biāo)模型進(jìn)行校準(zhǔn)。用實(shí)驗(yàn)采集的所有數(shù)據(jù)建立實(shí)際濃度與預(yù)測濃度之間的關(guān)系曲線。擬合結(jié)果如圖6所示。由圖可以看出,定標(biāo)曲線的R2有了很大幅度的提高,提高到了0.985 1,RMSEC和RMSEP均有了很大程度的降低,降低到了0.1 Wt%量級,大大提高了模型的精確度。同時該模型的ARE降低到了7.455 6%,說明該模型的穩(wěn)定性有了一定的提升,但仍然無法滿足實(shí)驗(yàn)要求,需要進(jìn)一步優(yōu)化。
圖6 基于PLS的定標(biāo)模型Fig.6 Calibration model based on PLS
2.3.3 基于LSSVM的定標(biāo)模型
PLS算法的引入雖然在一定程度上提高了模型的精確度和穩(wěn)定性,但提高程度仍然不夠,因此引入了LSSVM算法來對定標(biāo)模型進(jìn)行校準(zhǔn)。校準(zhǔn)結(jié)果如圖7所示。從圖中可以看出,定標(biāo)曲線的R2有了明顯的提高,提高到了0.997 6,擬合效果較好。同時,RMSEC和RMSEP分別下降到了0.018 7 Wt%和0.149 1 Wt%,ARE下降到了2.137 0%。相比于內(nèi)定標(biāo)法和PLS,LSSVM的RMSE和ASE均得到了很大程度的降低,模型的穩(wěn)定性和精確度都得到大幅度的提高,基本消除了因基體效應(yīng)和自吸收效應(yīng)給實(shí)驗(yàn)結(jié)果帶來的影響。具體對比結(jié)果如表3所示。
圖7 基于LSSVM的定標(biāo)模型Fig.7 Calibration model based on LSSVM
表3 內(nèi)標(biāo)法、PLS和LSSVM數(shù)據(jù)對比Table 3 Internal standard method, PLS and LSSVM data comparison
實(shí)驗(yàn)首先對激光能量和采集延時進(jìn)行優(yōu)化,選取最佳能量為90 mJ,最佳延時為1 000 ns,在此最佳實(shí)驗(yàn)條件下分別利用內(nèi)標(biāo)法、PLS和LSSVM對土壤中的Cu元素建立定標(biāo)模型。對比可以看出,內(nèi)標(biāo)法定標(biāo)模型的穩(wěn)定性和精確度都很不理想,擬合系數(shù)R2只有0.870 1,RMSEC和RMSEP分別為3.448 8 Wt%和1.280 7 Wt%。說明實(shí)驗(yàn)結(jié)果波動性較大,而ARE高達(dá)13.340 0%,說明模型穩(wěn)定性較差,很難實(shí)現(xiàn)定標(biāo)曲線的精確校準(zhǔn)。用PLS建立的定標(biāo)模型,R2提高到了0.985 1,RMSEC和RMSEP分別降低為0.111 4 Wt%和0.251 1 Wt%,和內(nèi)標(biāo)法相比精確度有了很大的提高。ARE相比于內(nèi)標(biāo)法雖然也有了很大降低,但是模型的穩(wěn)定性依然較差,無法滿足實(shí)驗(yàn)要求。而用LSSVM建立的定標(biāo)模型,與內(nèi)標(biāo)法和PLS相比,模型的精確度和穩(wěn)定性都有很好的提高。R2提高到0.997 6,RMSEC和RMSEP分別下降到0.018 7 Wt%和0.149 1 Wt%。同時,ARE與內(nèi)標(biāo)法的相比提高了6.24倍,說明LSSVM的穩(wěn)定性較好,能夠滿足實(shí)驗(yàn)要求,適合用以提高定標(biāo)模型的精確度和穩(wěn)定性。