張義璇
華北理工大學礦業(yè)工程學院 河北唐山 063210
礦產(chǎn)資源開發(fā)促進了社會經(jīng)濟的發(fā)展,但也給礦區(qū)周邊生態(tài)環(huán)境造成了不同程度的污染[1]。尾礦庫一般是由筑堤截斷谷口或周圍地形成的,主要用作對堆存金屬材料或非金屬材料采礦,通過礦物選別后排出尾礦或其余工業(yè)廢棄物的場地。研究尾礦庫的重金屬含量以及鈍化尾礦庫中的重金屬對保護礦區(qū)及周邊尾礦環(huán)境有重要意義。
土壤中重金屬元素含量很低,在土地光譜反射率的各個波段吸收特性并不明顯,且由于土壤組成成分復雜,各種組成對反映光譜信號的直接影響往往是非線性地混合,從而造成了土壤的反射系統(tǒng)復雜化。常用方式主要是多元線性回歸分析和偏最小二乘回歸分析。鄭光輝等利用偏最小二乘回歸分析建立光譜反射率與土壤重金屬As含量的模型,檢驗預測模型精度,證明可以通過偏最小二乘回歸分析對土壤中As含量進行預測[2]。雖然偏最小二乘回歸分析模型一般都適用于土壤重金屬元素含量反演,但隨著科學技術的發(fā)展,一些非線性模型逐漸被用于土壤反演領域中。如BP神經(jīng)網(wǎng)絡分析(BP)、支持向量機(SVM)、隨機森林(RF)等,這些非線性的數(shù)學分析方法在一定程度上提高了預測模型的精度。王金鳳等通過對Zn光譜的7種變換分析,并采用3種建模方法,研究得出基于二階微分變換的隨機森林算法準確度最高[3]。成功等基于多元線性回歸、偏最小二乘回歸、BP神經(jīng)網(wǎng)絡回歸模型,分別建立土壤重金屬(Cr、Zn、Ni)含量的反演模型,結果表明BP模型的Cr反演效果最好[4]。本文以承德某礦區(qū)的釩鈦磁鐵尾礦庫為研究區(qū),通過礦區(qū)尾礦樣品采集并進行室內(nèi)測試,再進行光譜與重金屬元素檢測,建立尾礦重金屬含量反演最佳模型。
對河北省承德市某礦區(qū)尾礦庫進行尾礦樣本采集,取樣深度為20cm,重量約為1000g。根據(jù)需要可以分層采集尾礦樣品,共采集尾礦樣品81個,采集的尾礦樣品取樣深度以及采集量基本保持一致。采集的尾礦樣品用密封袋保存并且用手持GPS定位,同時對尾礦樣點的情況進行記錄。
影響光譜數(shù)據(jù)的有很多因素,所以需要對尾礦進行室內(nèi)處理,通過對尾礦樣品進行室內(nèi)自然風干來降低水分影響,用橡膠錘敲砸、研具研磨來減小尾礦粒徑影響,將處理后的尾礦過20目篩子,將過篩后的每個尾礦樣品分為3份,其中一份用來測尾礦光譜,另一份密封保存?zhèn)溆茫詈笠环萦脕頊y理化性質(zhì)再過100目篩子用來測重金屬含量,采用四分法處理尾礦進行含量測定。參考《土壤農(nóng)化分析》尾礦理化性質(zhì)測定方法,使用酸溶消解法提取重金屬元素,重金屬提取態(tài)使用火焰法以及石墨爐法(島津AA-6880)進行重金屬含量測定[5]。
本研究采用的是ASD Field spec4地物光譜儀進行光譜數(shù)據(jù)采樣,光檢測范圍為30~2500nm,使用前先進行白板校正,待儀器穩(wěn)定后再進行實驗,實驗過程中每檢測5個樣本,需要重新優(yōu)化一次。每份樣本采樣間隔為1nm,共采集10次,并對10條光譜曲線計算平均值,作為該樣點光譜標準曲線。對原始光譜(R)進行SG濾波變換(SG)、一階微分變換(FD)以及二階微分變換(SD)的數(shù)學處理。
實驗檢測了研究區(qū)尾礦樣品重金屬含量,并分析了其統(tǒng)計特征值(表1),在土壤學研究中,通常使用偏度系數(shù)、峰度系數(shù)來描述土壤測定數(shù)據(jù)分布情況、偏離對稱性程度,變異系數(shù)來描述土壤性質(zhì)的異常程度。本文利用統(tǒng)計分析可知,研究區(qū)尾礦重金屬元素的均值、標準差、偏度系數(shù)、峰度系數(shù)及變異系數(shù)[6]。
根據(jù)重金屬含量統(tǒng)計結果可知,該礦區(qū)尾礦庫尾礦樣本全量Cu平均含量為200.44mg/kg,含量范圍為144.02~251.68mg/kg。標準差為22.82,偏度系數(shù)與峰度系數(shù)分別為-0.1、-0.3,變異系數(shù)為11.38%。全量Zn平均含量為168.78g/kg,含量范圍為155.16~180.69mg/kg,標準差為5.48,偏度系數(shù)與峰度系數(shù)分別為-0.27、-0.43,變異系數(shù)為3.25%。全量Cr平均含量為454.52mg/kg,含量范圍為141.16~739.71mg/kg,標準差為139.29,偏度系數(shù)與峰度系數(shù)分別為-0.41、-0.67,變異系數(shù)為30.65%。全量Pb平均含量為1.81mg/kg,含量范圍為0.89~3.05mg/kg,標準差為0.69,偏度系數(shù)與峰度系數(shù)分別為0.13、-1.64,變異系數(shù)為38.24%。全量Cd平均含量為0.09μg/kg,含量范圍為0.07~0.12mg/kg,標準差為0.01,偏度系數(shù)與峰度系數(shù)分別為0.15、1.96,變異系數(shù)為12.45%。土壤標準值參照GB15618-2018《土壤環(huán)境質(zhì)量農(nóng)用地土壤污染風險管控標準(試行)》pH>7.5。
根據(jù)偏度系數(shù)的程度可知:假如偏度系數(shù)在-0.5~0.5之間,那么數(shù)據(jù)是較為對稱的;假如偏度系數(shù)在0.5~1之間(正偏度)或者-1~-0.5之間(負偏度),那么數(shù)據(jù)偏斜;假如偏度系數(shù)大于1(正偏度)或小于-1(負偏度),那么數(shù)據(jù)高度偏斜。如果峰度系數(shù)為0,則表示該總體數(shù)據(jù)分布與正態(tài)分布的陡緩程度相同;如果峰度系數(shù)大于0,則表示該總體數(shù)據(jù)分布與正態(tài)分布相比較為陡峭;如果峰度系數(shù)小于0則表示該總體數(shù)據(jù)分布與正態(tài)分布相比較為平坦,峰度系數(shù)的絕對值數(shù)值越大表示其分布形態(tài)的陡緩程度與正態(tài)分布的差異程度越大。根據(jù)變異的程度可將變異系數(shù)進行等級劃分,變異系數(shù)在0~15%之間分為小變異,變異系數(shù)在16%~35%之間為中等變異,變異系數(shù)在高于36%為高度變異。
從尾礦5個重金屬的偏度系數(shù)來看,全量Cu、全量Zn、全量Cr、全量Pb偏度系數(shù)在在0.5~1之間或者-1~-0.5之間,是輕度偏斜,全量Cd是高度偏斜,偏度系數(shù)大于1。由峰度系數(shù)可知全量Cu、全量Zn、全量Cr峰度系數(shù)小于0,這幾種重金屬含量分布呈平頂峰趨勢,由峰度系數(shù)可知全量Pb、全量Cd峰度系數(shù)大于0,這幾種重金屬含量分布呈尖頂峰趨勢。根據(jù)全量Cu、全量Zn、全量Cd變異系數(shù)可知這3種重金屬屬于小變異,表明尾礦重金屬含量在尾礦中的分布比較均勻,全量Cr變異系數(shù)為30.65%屬于中等變異,全量Pb變異系數(shù)為38.24%屬于高度變異,表明這兩種重金屬含量分布差異性較大。
將尾礦現(xiàn)場采樣樣品使用KS選擇法2∶1分為建模集和驗證集,并對研究區(qū)尾礦的原始光譜(R)進行以下3種數(shù)學預處理,光譜平滑去噪(SG)、光譜一階微分(FD)、二階微分(SD),并選取與重金屬含量相關性最高的8個波段作為特征波段作為多元逐步回歸(MLSR)的自變量,尾礦的重金屬元素Cu、Zn、Cr、Cd、Pb分別作為因變量,分別建立多種光譜變換的尾礦重金屬含量預測模型。并將驗證集數(shù)據(jù)代入多元逐步回歸模型中,并對模型的精度和穩(wěn)定性進行綜合評價(表1)。
多元逐步回歸模型(MLSR)屬于線性模型,該模型容易出現(xiàn)建模集過度擬合情況,導致建模集精度過高,驗證集精度較低。從多元逐步回歸尾礦各個重金屬含量反演最優(yōu)模型評價結果可知,在建模樣本中,Cu最優(yōu)模型R2小于0.6,模型擬合精度較低;Zn最優(yōu)模型R2小于0.6,模型擬合精度較低;Cr最優(yōu)模型R2小于0.6,模型擬合精度較低;Cd最優(yōu)模型R2均小于0.6,模型擬合精度較低。Pb三種模型R2小于0.6,模型擬合精度較低。在驗證集中Cu的R2低于0.6;Zn的R2低于0.6,綜合來說二階特征變換精度相對較高,但不具備樣本重金屬含量預測能力(RPD<1.4);Cr的模型不具備預測能力;Cd二階微分特征變換預測模型精度R2小于0.6,RPD也均小于1.4,不具備模型預測能力,Pb二階微分特征變換預測模型精度R2小于0.6,RPD也均小于1.4,不具備模型預測能力。綜合來說,在多元逐步回歸尾礦各種反演模型中,反演精度較高的是Zn,其他模型較低。光譜的微分變換能高建模樣本和驗證樣本的精度,提高模型的預測能力。
從偏最小二乘尾礦各個重金屬含量最優(yōu)反演模型評價結果可知,在建模樣本中,Cu一階微分變換R2大于0.6,一階微分特征變換具有較高的模型擬合效果,Zn一階微分變換模型精度較高,Cr二階微分變換具有較高的模型擬合效果,Cd最優(yōu)模型R2均小于0.6,不具有較高的擬合效果,Pb最優(yōu)反演模型R2均小于0.6,不具有較高的擬合效果。在驗證集中Cu的模型R2小于0.6,不具有一定的樣本預測能力(RPD<1.4);Zn一階特征變換模型R2大于0.6,具有粗略的樣本重金屬含量預測能力;Cr最優(yōu)模型R2小于0.6;Cd最優(yōu)模型R2低于0.6,不具有的樣本預測能力,Pb最優(yōu)模型R2低于0.6,不具有的樣本預測能力(RPD<1.4)。
從BP神經(jīng)網(wǎng)絡尾礦各個重金屬含量最優(yōu)反演模型評價結果可知(表2),在建模樣本中,Cu二階微分變換模型R2小于0.6,Zn一階微分變換模型精度較高,Cr二階微分變換具有較高的模型擬合效果,Cd二階微分特征變換R2小于0.6,不具有較高的擬合效果,Pb一階微分特征變換R2均小于0.6,不具有較高的擬合效果。在驗證集中Cu的模型R2低于0.6,不具有樣本預測能力(RPD<1.4);Zn二階微分特征變換模型R2接近0.5,樣本重金屬含量預測能力較差(RPD<1.4);Cr一階微分特征變換模型R2均小于0.6,PRD指數(shù)小于1.4,不具備樣本重金屬含量預測能力;Cd二階微分特征變換模型R2低于0.6,不具有的樣本預測能力(RPD<1.4),Pb一階微分特征變換模型R2低于0.6,不具有的樣本預測能力(RPD<1.4)。
表2 不同重金屬對應的最優(yōu)反演模型
本章詳細介紹了尾礦光譜建模方法以及模型精度評定方法,采用多元逐步回歸模型(MLR)、偏最小二乘模型(PLS)、BP神經(jīng)網(wǎng)絡模型分別建立研究區(qū)尾礦重金屬含量預測模型,并通過交叉驗證法對建立的特征波段模型進行精度驗證,并按照精度評定指標對模型進行精度評定,以選擇各重金屬元素的最佳特征波段反演模型。
(1)尾礦光譜經(jīng)微分變換后,其與各重金屬元素含量的相關性大多數(shù)變高,基于Cu、Zn、Cr、Cd、Pb建立的重金屬含量反演模型,光譜經(jīng)過微分特征變換后,幾乎所有的模型建模集以及驗證集精度都能顯著提高。
(2)MLR模型精度普遍較低,基于多元逐步回歸篩選剔除剩下的顯著波段,構建ASD光譜信息PLS模型,能夠有效地提高模型的預測精度??梢酝ㄟ^BP神經(jīng)網(wǎng)絡進行大量的模型訓練,篩選出最優(yōu)模型。
(3)模型精度整體偏低,PLS-FD反演Cu以及BP-FD反演Zn含量模型能夠粗略預測尾礦重金屬含量。