儲陽
關(guān)鍵詞:近紅外反射光譜;標(biāo)準(zhǔn)歸一化;隨機森林;最小均方根誤差;巖石礦物
隨著社會經(jīng)濟的不斷發(fā)展,我國各個領(lǐng)域的建設(shè)對各種礦物資源的需求量也在不斷提升。礦物資源的利用涉及開采、儲存、使用等過程,各種巖石礦物成分、含量的準(zhǔn)確測定對實現(xiàn)礦物資源的合理利用有著極為重要的現(xiàn)實意義。實際上,礦物中各種組分與含量的測定均于實驗室中采用專業(yè)的化學(xué)方法進(jìn)行。但是,實驗檢測過程涉及較多實驗操作步驟,對人力、物力的需求量較大,且對各種檢測設(shè)備儀器的精確度有較高的要求,即使如此,也要采用破壞分解的方式對樣本進(jìn)行檢測[1]。隨著礦物檢測技術(shù)的發(fā)展,實驗室檢測范圍的局限性越來越弱。各種較為先進(jìn)的測定技術(shù),如近紅外漫反射光譜分析技術(shù)等的應(yīng)用,在計算機精密計算的輔助下,大大提高了檢測結(jié)果的準(zhǔn)確性,并且不會對實驗樣本造成破壞。
1 天然巖石礦物成分分析
巖石的主要成分是礦物,但風(fēng)化后的巖石內(nèi)不僅有礦物,還存在諸多鹽類等其他物質(zhì),且?guī)r石內(nèi)的礦物成分直接決定抗風(fēng)化能力。通常,礦物由巖漿內(nèi)結(jié)晶出來的順序影響硅酸鹽礦物的風(fēng)化順序,因此,可以根據(jù)晶系劃分礦物。晶系主要是根據(jù)礦物晶體對稱情況進(jìn)行分類的一種級別,根據(jù)具體對稱點的差別能劃分為3個晶族。在地表中,最快分解的是地下深處巖漿內(nèi)最早結(jié)晶的礦物,在巖漿內(nèi)最后結(jié)晶的礦物具有最強的抗風(fēng)化能力。因此,含有較多硅鋁礦物的中性巖、酸性巖比含有較多鐵鎂礦物的基性巖與超基性巖更容易風(fēng)化[2]。
變質(zhì)巖的礦物成分主要包括兩種:(1)和沉積巖或巖漿巖共有的礦物,包括云母、長石、石英;(2)變質(zhì)巖中存在的獨特礦物,包括蛇紋石、綠泥石以及滑石等。幾乎所有的單礦巖均由一類礦物構(gòu)成,體脹系數(shù)、導(dǎo)熱率以及顏色都相同,而且不會因為受到物理風(fēng)化影響而發(fā)生破碎。但是復(fù)礦巖不同,其中存在穩(wěn)定性較差的元素,會與晶格相脫離而移走,影響巖石的完整性。
2 近紅外光譜概述
近紅外光譜屬于一類分子吸收光譜,因為原子在物質(zhì)內(nèi)始終處于振動的狀態(tài),一旦用紅外光照射物質(zhì),分子吸收、分子振動以及轉(zhuǎn)動頻率相同的紅外光會出現(xiàn)分子振動能級的躍遷,從基態(tài)躍遷至較高能量能級,因為具體化學(xué)鍵均有不一樣的吸收頻率,在紅外光譜中會呈現(xiàn)不同的吸收峰,所以化學(xué)鍵吸收頻率不同時,實際所得的紅外光譜也會呈現(xiàn)一定差別[3]。近紅外光譜主要指位于4000~12000cm﹣1的紅外光譜,能將水分子,NH、OH、CH等含氫基團、羥基和金屬離子的結(jié)合方式以及合頻、倍頻吸收峰的振動特征反映出來。一般外界與內(nèi)部環(huán)境不會過多地影響該類基團的近紅外光譜特征,差異較為明顯,所以有一定的鑒別特征。
3 近紅外光譜在天然巖石礦物成分測定中的應(yīng)用
近紅外光譜技術(shù)在天然巖石礦物成分測定中的實際檢測效果需要通過正態(tài)性檢驗確定。實驗采用的樣本由白云母、高嶺土、蒙脫石3種成分組成。完成礦物質(zhì)配合后,采用近紅外光譜進(jìn)行礦物樣本成分檢測,對收集的光譜進(jìn)行分析與研究。在這一過程中,主要采用標(biāo)準(zhǔn)歸一化法分析收集到的相關(guān)數(shù)據(jù),通過人工神經(jīng)網(wǎng)絡(luò)、主成分回歸、隨機森林、偏最小二乘法等模型處理相關(guān)數(shù)據(jù)[4]。在實驗中,通過分析、預(yù)測樣本中的3種成分得到的預(yù)測值和真實值之間的最小方根差對檢測結(jié)果進(jìn)行評價。
4 采用近紅外光譜進(jìn)行天然巖石礦物成分含量測定實驗
4.1 樣本獲取
在工業(yè)生產(chǎn)過程中,白云母、高嶺土、蒙脫石是3種使用量相對較大的礦物資源,因此,實驗采用這3種巖石制作實驗樣本更具代表性。
4.2 礦物光譜采集系統(tǒng)配置
完成樣本制作后,需采用礦物光譜采集樣本成分及其組成信息。天然巖石成分測定分析系統(tǒng)主要包括計算機顯示控制系統(tǒng)、采集控制模塊、近紅外光譜采集模塊。其中,近紅外光譜采集模塊主要包括線陣探測器、近紅外光譜儀、光纖、參考白板等;采集控制模塊主要由可平移、可升降、可旋轉(zhuǎn)的控制平臺組成[5]。
4.3 對光譜數(shù)據(jù)進(jìn)行預(yù)處理
近紅外光譜是一種較為常見的光譜類型,光譜區(qū)間介于中紅外區(qū)和可見光區(qū)之間,波長范圍為780~2 526 nm。在實驗中,巖石樣本的近紅外光譜波長區(qū)間為900~2 500 nm。實驗采用AvaSpec-NIR256-2.5光譜儀,剛好能實現(xiàn)波長為900~2 500 nm的光譜波長檢測。不同的巖石成分都有相應(yīng)的近紅外光譜放射信息,在實驗中可以實現(xiàn)清晰檢測,進(jìn)而分析光譜信息,得到對應(yīng)的巖石成分信息。
在處理數(shù)據(jù)前,采用預(yù)處理的方式避免不必要因素影響實驗結(jié)果的準(zhǔn)確性。較為常用的方法包括標(biāo)準(zhǔn)歸一化法、一階導(dǎo)數(shù)法、平滑法、平滑濾波法等,光譜處理波長也集中在950~2 450 nm。完成預(yù)處理之后就可通過構(gòu)建數(shù)學(xué)模型分析、預(yù)測礦物的未知組分。應(yīng)用較為廣泛的數(shù)學(xué)模型有人工神經(jīng)網(wǎng)絡(luò)、主成分回歸、隨機森林、最小二乘法等。標(biāo)準(zhǔn)歸一化法的應(yīng)用可以在較大程度上排除散射、噪聲對實驗結(jié)果的干擾,適用性較為顯著。
5 近紅外光譜對天然巖石礦物成分含量測定實驗的預(yù)測原理
在天然巖石礦物成分含量測定分析中,近紅外光譜技術(shù)是一種間接的分析技術(shù),正處于應(yīng)用發(fā)展階段。這一技術(shù)的應(yīng)用需要以一定實驗為基礎(chǔ),采用數(shù)學(xué)模型,以定性或者定量的方式分析、預(yù)測樣本成分及含量,達(dá)到實驗?zāi)康摹T趯嶒炦^程中,采用抽樣的方式進(jìn)行天然樣本實驗,對樣本的成分情況建立不同的模型,如主成分回歸分析、人工神經(jīng)網(wǎng)絡(luò)分析、偏最小二乘法分析等模型,實現(xiàn)對巖石礦物成分及含量的有效分析與預(yù)測。在充分實驗的基礎(chǔ)上,對未檢測的樣本礦物情況進(jìn)行預(yù)測,驗證該檢測方法的準(zhǔn)確性。
5.1 主成分回歸分析
主成分回歸分析主要是通過構(gòu)建矩陣的方式分析未知成分。在具體操作中,應(yīng)用內(nèi)容與方法包括主成分矩陣、光譜數(shù)據(jù)點分析、多元性回歸模型、待測組成含量矩陣等。
5.2 偏最小二乘回歸分析
偏最小二乘回歸分析是另一種對未知組分進(jìn)行預(yù)測的方法,是基于主成分回歸分析的一種方法。在實際操作中,需要結(jié)合光譜矩陣與組分含量矩陣的有效應(yīng)用對實驗數(shù)據(jù)進(jìn)行分析,得出兩者之間的相互關(guān)系,提升實驗結(jié)果的關(guān)聯(lián)性[6]。
5.3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是一種主要由非變換神經(jīng)元組成的前回饋神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)較為復(fù)雜,采用反向傳播的算法,在預(yù)測與逼近實際數(shù)據(jù)方面有較好的應(yīng)用效果。
5.4 隨機森林
在處理實驗數(shù)據(jù)時,隨機森林也是較為常用的處理方法,這種方法的應(yīng)用是以Bagging算法為前提構(gòu)建的數(shù)學(xué)模型。相比于其他算法,隨機森林模型設(shè)計的參數(shù)相對較少,省略了對過多擬合問題的考慮、處理。所以隨機森林算法可以實現(xiàn)對數(shù)量較大樣本數(shù)據(jù)的處理,并且可以在較大程度上避免噪聲對實驗數(shù)據(jù)的干擾。隨機森林算法的應(yīng)用原理是采用自助采樣的方式進(jìn)行樣本處理,在實際應(yīng)用過程中,要求以較快速度生成測試樣本和訓(xùn)練樣本,并以此為依據(jù)形成隨機森林。實際實驗的預(yù)測結(jié)果可以結(jié)合具體分類樹分析得到具體情況。
6 采用近紅外光譜進(jìn)行天然巖石礦物成分含量測定實驗結(jié)果與討論
完成實驗后,對獲得的各組實驗情況進(jìn)行處理,將樣本數(shù)據(jù)平均分為兩組,一組用作測試樣本,另一組用作光譜訓(xùn)練樣本。首先,采用一階導(dǎo)數(shù)、平滑、標(biāo)準(zhǔn)化歸一、五點平滑濾波等較為常用的方法對光譜信息進(jìn)行科學(xué)處理,并以此為基礎(chǔ)建立數(shù)學(xué)模型進(jìn)行數(shù)據(jù)處理。將這4種數(shù)據(jù)模型分為非線性建模、線性建模兩種類型和方式。其中,非線性建模主要是人工神經(jīng)網(wǎng)絡(luò)模式與隨機森林模式,線性建模主要是主成分回歸模式與偏最小二乘法。其次,采用最小均方根誤差對判斷的準(zhǔn)確性進(jìn)行合理預(yù)測。
在實際操作中,采用隨機森林法分別對高嶺土、白云母、蒙脫石的預(yù)測結(jié)構(gòu)進(jìn)行制圖處理。其中,高嶺土預(yù)測值與真實值之間呈線性關(guān)系,白云母預(yù)測值與真實值之間呈線性關(guān)系,蒙脫石預(yù)測值與真實值之間呈相關(guān)性關(guān)系。
7 結(jié)語
隨著我國生產(chǎn)技術(shù)的不斷提升,各個領(lǐng)域的生產(chǎn)對各種礦物的需求量也在不斷提升,只有明確礦物組成成分,才能提高礦產(chǎn)資源開采的準(zhǔn)確性,提高對礦產(chǎn)資源的開采與利用效益。采用高嶺土、白云母、蒙脫石3種具有代表性的礦物進(jìn)行相關(guān)實驗,采用反射光譜信息測定的方式,結(jié)合各種預(yù)處理技術(shù),構(gòu)建數(shù)學(xué)模型,分析紅外光譜得到的成分檢測結(jié)果。研究發(fā)現(xiàn),采用標(biāo)準(zhǔn)歸一化法進(jìn)行建模處理最有利,采用非線性回歸模型比線性回歸模型得到的分析預(yù)測效果好。通過分析,希望能為相關(guān)礦物檢測人員與檢測工作提供有效借鑒。