劉燁坤, 郝曉劍, 楊彥偉, 郝文淵, 孫 鵬, 潘保武
中北大學電子測試技術(shù)重點實驗室, 山西 太原 030051
生態(tài)環(huán)境保護已經(jīng)被列為我國最重要的治國理政與發(fā)展戰(zhàn)略, 而土壤修復是生態(tài)環(huán)境保護的重中之重。 土壤中重金屬元素如鋇、 鉻、 鎳等難以被微生物分解; 隨著食物鏈的傳遞重金屬元素逐漸富集, 有損動植物健康。 因此實現(xiàn)高精度土壤微量重金屬元素檢測, 對治理我國土壤污染有著重要意義。
激光誘導擊穿光譜(laser-induced breakdown spectroscopy, LIBS)技術(shù)在近二十年發(fā)展迅速, 由于分析速度快且無需對樣品預處理的特點, 被廣泛應用于多種物理形態(tài)樣品如: 液體[1-2]、 氣體[3-4]、 固體[5-6]的定量定性分析中。 傳統(tǒng)LIBS技術(shù)存在靈敏度低、 噪聲明顯、 重復性差等缺點, 從而影響了定量分析的精度。 國內(nèi)外研究學者提出利用磁場約束[7-8]、 雙脈沖激光[9]、 腔體約束[10]等提高光譜強度, 改善LIBS靈敏度低的缺點。 Cui[11]利用long-short double pulse LIBS(DP-LIBS)對鋼鐵樣品中的錳元素定量分析, 結(jié)果表明與single-pulse LIBS相比DP-LIBS擬合系數(shù)R2從0.810提升到0.988, 平均相對誤差從94.9%下降到4.9%。 Akhrar[12]等利用磁場約束LIBS對土壤中重金屬元素Cr進行含量檢測, 檢測限下降為原來的0.42倍。
為了提高LIBS定量分析精度, 李春艷[13]等建立了基于譜線篩選的PLS模型對煤炭灰分進行檢測, 以剔除噪聲對信息的干擾, 結(jié)果表明與傳統(tǒng)PLS相比, 基于譜線篩選的PLS對灰分預測精度更高, 其平均誤差由2.262%下降至1.972%。 周華茂[14]等建立基于粒子群算法-支持向量機(PSO-SVM)模型對稻殼中Cr元素定量分析, 其測試集RMSE為7.83, 平均絕對誤差為4.10%, 預測結(jié)果要優(yōu)于采用聯(lián)合區(qū)間最小二乘法(siPLS)。 Guo[15]等利用偏最小二乘回歸(PLSR)和支持向量回歸(SVR)對土壤中元素定量分析, 結(jié)果表明SVM魯棒性優(yōu)于PLSR。 目前腔體約束LIBS結(jié)合機器學習對土壤的定量分析還未見報道。
為了提高土壤中微量元素Ni和Ba的檢測精度, 分析了傳統(tǒng)LIBS與外加腔體約束LIBS條件下, 采集延遲時間對特征譜線強度的影響, 通過信噪比及增強因子確定最佳實驗條件。 利用主成分分析算法(principal component analysis, PCA)對采集到的光譜數(shù)據(jù)進行降維, 采用機器學習中Lasso、 自適應增強(AdaBoost)、 隨即森林(random forest, RF)模型對降維后光譜數(shù)據(jù)分析, 實現(xiàn)Ni和Ba元素高精度定量分析, 并對模型的性能進行評估。
實驗用儀器為美國ChemReveal集成式臺式激光誘導擊穿光譜儀。 該儀器配置的激光器為法國Quantel公司的Nd∶YAG激光器, 波長為1 064 nm, 激光脈沖能量0~200 mJ, 頻率1~10 Hz可調(diào)。 光譜儀采用Echelle的7通道iCCD高分辨率光譜儀, 探測波長范圍為180~980 nm。 實驗過程中將直徑為5 mm, 高度為4 mm的鋁制腔體薄片緊貼于土壤表面, 調(diào)節(jié)X-Y-Z三維樣品臺, 使得激光束聚焦在約束腔的圓心, 實驗裝置如圖1所示。
圖1 實驗裝置示意圖
實驗所用的9種土壤樣品來自中國不同省份的標準物質(zhì), 為了獲取均勻的激光燒蝕土壤樣品表面, 分別稱取4 g待測樣品, 并用臺式粉末壓片機將土壤粉末壓制成直徑32 mm, 厚度約為3 mm的圓形土壤壓片。 為減小外部環(huán)境因素及土壤顆粒大小不均勻等問題對實驗結(jié)果的影響, 設置激光器脈沖能量為70 mJ, 聚焦后光斑直徑為200 μm, 在樣本表面選取5個點, 分別對這5個點擊打45次, 對獲取的光譜數(shù)據(jù)求平均值, 作為樣本的最終光譜數(shù)據(jù)。 土壤中重金屬Ni, Ba元素的含量如表1所示。 隨機選擇1#, 2#, 4#, 5#, 7#和8#為訓練集, 3#, 6#和9#作為測試集。
表1 土壤樣品中Ni和Ba元素含量
首先利用外加腔體約束LIBS提高光譜強度及信噪比, 減少外部環(huán)境對光譜儀采樣的影響。 之后在Python環(huán)境下利用PCA實現(xiàn)特征譜線的降維, 通過協(xié)方差矩陣計算主成分貢獻率, PCA算法在反映樣品信息的同時, 可以有效降低計算成本。 定量分析模型屬于機器學習中的有監(jiān)督學習, 將PCA處理后的土壤數(shù)據(jù)輸入Lasso、 AdaBoost、 RF三個模型中, 對土壤中Ni、 Ba元素進行定量分析。 Lasso回歸解決了線性回歸出現(xiàn)的過擬合問題, 通過引入正則化L1懲罰項, 解決求解θ中出現(xiàn)的轉(zhuǎn)置不可逆的現(xiàn)象。 AdaBoost是一種迭代算法, 其核心思想是利用不同的弱學習器對同一個訓練集進行訓練, 之后將弱學習器集合成一個強學習器。 RF是Bagging的擴展變體, 它以決策樹構(gòu)建為基礎, 利用集成思想提升單個決策樹的性能, 獲取比單個模型更好的回歸表現(xiàn)。 通過對以上三個模型參數(shù)的調(diào)節(jié)實現(xiàn)土壤中重金屬元素的定量分析, 根據(jù)模型的相關系數(shù)R2, 均方根誤差RMSE對模型性能進行評估。
光譜儀采集到的等離子體數(shù)目與其設置的延遲時間有關。 設置光譜采集延遲時間在0.5~5 μs之間。 分析LIBS、 外加腔體約束LIBS(cavity confinement LIBS, CC-LIBS)兩種條件下Ni Ⅱ 221.648 nm和Ba Ⅱ 495.709 nm譜線強度及信噪比(signal-to-noise ratio, SNR)隨延遲時間的變化, 并計算Ni和Ba元素在不同情況下光譜強度的增強因子, 結(jié)果如圖2, 圖3和圖4所示。
從圖2、 圖3可以看到與傳統(tǒng)LIBS相比外加腔體約束可以增大特征譜線光譜強度及SNR, 這是由于激光燒蝕樣品表面后, 等離子擴散速度要遠小于沖擊波膨脹速度, 沖擊波膨脹過程中碰到腔體壁后向燒蝕點中心反射, 此時對等離子體進行壓縮, 增大了等離子的密度, 最終實現(xiàn)光譜強度的增強。 在0.5 μs處光譜儀采集到的等離子體數(shù)目最多, 光譜強度最大。 之后隨著采集時間的延長, 等離子體數(shù)目衰減較多, 譜線強度及SNR同時降低, 并趨于平緩。 從圖3可以觀察到, 延遲時間在1 μs處腔體約束LIBS條件下Ni和Ba的信噪比達到最大。
圖2 Ni, Ba在兩種LIBS條件下隨延遲時間的強度變化
圖3 兩種元素在不同條件下的信噪比
為了表征等離子體光譜的增強情況, 計算Ni和Ba元素的增強因子隨延遲時間的變化, 如圖4所示, 增強因子隨延遲時間在1.1~2.4范圍內(nèi)波動, 且當延遲時間為1 μs時, 增強因子達到最大, 分別為2.21和2.36。
圖4 Ni和Ba元素的增強因子隨延遲時間的變化
結(jié)果表明, 腔體約束LIBS不但可以增大光譜強度, 同時可以改善特征譜線的信噪比, 提高LIBS的靈敏度。 因此在后續(xù)分析中, 選擇外加腔體約束LIBS, 激光能量為70 mJ, 延遲時間為1 μs對樣品進行擊打, 獲取最優(yōu)條件下的土壤光譜數(shù)據(jù)。
光譜儀探測到的光譜范圍為190~980 nm, 每組光譜包括12 248個光譜特征變量, 將全光譜數(shù)據(jù)作為定量分析的輸入, 會增加計算機的運算量, 減緩運算速度。 因此在對腔體約束增強得到的光譜數(shù)據(jù)進行標準化處理后, 利用PCA對數(shù)據(jù)進行降維, 當選擇9個主成分時, 其主成分貢獻率分別為0.512, 0.157, 0.134, 0.072 7, 0.031 1, 0.024 2, 0.014, 0.007 3和0.004 4, 方差累計貢獻率已達到了95.67%, 可以較好地反映原始土壤樣品的信息, 如圖5所示。
圖5 PCA降維主成分累計貢獻圖
為了分析土壤中微量金屬元素Ni和Ba的含量, 將PCA降維后的光譜數(shù)據(jù)輸入Lasso, AdaBoost和RF模型中進行訓練, 訓練后的Ni、 Ba元素在三個模型中的預測結(jié)果結(jié)果如圖6, 圖7所示。
圖6 Ni元素在不同模型下的預測結(jié)果
圖7 Ba元素在不同模型下的預測結(jié)果
綜上所述, Lasso模型在對土壤中Ni和Ba元素進行定量分析時, 預測結(jié)果較差, 當使用集成學習中的AdaBoost模型對Ni分析時, 效果也不理想, 但在對Ba元素進行定量分析時, AdaBoost模型預測效果得到了提升。 就RF模型而言, 對兩種元素都有較好的定量分析結(jié)果。
研究了LIBS技術(shù)結(jié)合腔體約束在不同延遲時間下的特征光譜強度及信噪比的變化, 結(jié)果表明腔體約束LIBS可以提高光譜強度及信噪比, 同時在1 μs下元素的信噪比及增強因子達到最大, 因此腔體約束可以提高LIBS靈敏度。 利用機器學習中Lasso, AdaBoost, RF模型對土壤中Ni和Ba元素進行定量分析, RF的預測效果最優(yōu), 此時Ni和Ba元素在預測集中的擬合系數(shù)R2分別為0.937, 0.886, RMSEP分別為3.037, 90.515。