閆鵬程,周孟然*,劉啟蒙,王 瑞,劉 駿
1.安徽理工大學(xué)電氣與信息工程學(xué)院,安徽 淮南 232001 2.礦山地質(zhì)災(zāi)害防治與環(huán)境保護安徽省重點實驗室,安徽 淮南 232001 3.安徽理工大學(xué)地球與環(huán)境學(xué)院,安徽 淮南 232001
LIF技術(shù)與PLS-DA算法聯(lián)合辨識礦井涌水水源類型的研究
閆鵬程1,周孟然1*,劉啟蒙2, 3,王 瑞1,劉 駿1
1.安徽理工大學(xué)電氣與信息工程學(xué)院,安徽 淮南 232001 2.礦山地質(zhì)災(zāi)害防治與環(huán)境保護安徽省重點實驗室,安徽 淮南 232001 3.安徽理工大學(xué)地球與環(huán)境學(xué)院,安徽 淮南 232001
快速的礦井涌水水源辨識對于礦井的水災(zāi)預(yù)警及災(zāi)后救援意義重大。常規(guī)方法使用離子濃度做為判別因子,耗時過長,因此提出一種激光誘導(dǎo)熒光光譜(LIF)技術(shù)與偏最小二乘判別分析(PLS-DA)算法聯(lián)合快速辨識礦井涌水水源類型的方法。實驗使用405 nm激光對被測水體進行激發(fā),獲取礦井5個不同含水層100組水樣的熒光光譜,根據(jù)光譜曲線特征,對數(shù)據(jù)進行壓縮處理,獲取合適的光譜數(shù)據(jù)。每種水樣使用15組共75組光譜數(shù)據(jù)作為建模集,剩余的25組水樣的光譜數(shù)據(jù)作為測試集。為驗證實驗結(jié)果,設(shè)計了簇類的獨立軟模式(SIMCA)算法與PLS-DA算法構(gòu)建的實驗?zāi)P瓦M行對比。實驗發(fā)現(xiàn)礦井不同含水層水樣的熒光光譜差異較大,在不進行任何預(yù)處理的情況下,以PLS模型為基礎(chǔ)的PLS-DA算法較SIMCA算法的建模正確率高,達到了100%,其校正及驗證結(jié)果與實際分類變量的相關(guān)系數(shù)均大于0.951,校正集均方根誤差(RMSECV)和驗證集均方根誤差(RMSEP)均小于0.123,利用模型對測試集中五種水樣樣本的識別正確率均為100%。
礦井涌水;水源辨識;激光誘導(dǎo)熒光光譜;偏最小二乘判別分析
煤礦突水與瓦斯、煤塵、火和頂板并稱煤礦五大災(zāi)害,近年來,煤礦水害無論是從發(fā)生事故數(shù)量上還是死亡人數(shù)上皆僅次于瓦斯事故位居第二,因此建立煤礦水災(zāi)預(yù)警系統(tǒng)極其重要[1-3]。水源識別的正確性和及時性是涌水量預(yù)測的基礎(chǔ),無論對于水災(zāi)預(yù)警還是災(zāi)后救援意義都十分重大[4-6]?,F(xiàn)有的水源識別全部以水化學(xué)為基礎(chǔ),在各水層的長觀孔、突水監(jiān)測點采集水樣,測定水中代表離子的離子濃度、pH值、電導(dǎo)率等參數(shù)[7-10],以此建模進行水源識別進而進行突水預(yù)警。但是傳統(tǒng)的水化學(xué)檢測這些參數(shù)需要1~2小時,對于煤礦的突水預(yù)警以及災(zāi)后急救來說耗時太長。
本工作提出利用LIF技術(shù)獲取涌水水源熒光光譜,根據(jù)PLS-DA原理對熒光光譜進行模式識別,辨識涌水水源類型。LIF技術(shù)使用穩(wěn)功率穩(wěn)光譜的半導(dǎo)體激光器作為激光光源,由微型熒光探頭采集熒光信號,最后由熒光光譜儀實時檢測接收。依靠激光的定向、集束、穩(wěn)光譜、窄線寬等特性大幅提高了熒光光譜的檢出線靈敏度。目前激光誘導(dǎo)熒光已經(jīng)開始作為一種新型的技術(shù)在熒光標記DNA分析[11],生物制藥[12],太陽能電池板品控[13]和毛細管電泳[14]檢測等領(lǐng)域發(fā)揮重要作用,PLS-DA算法也開始應(yīng)用于木材,煙葉,潤滑油[16]的辨識。將LIF技術(shù)結(jié)合PLS-DA算法應(yīng)用于煤礦突水水源類型識別尚未見諸任何相關(guān)文獻。
1.1 儀器
圖1為實驗系統(tǒng)示意圖。半導(dǎo)體激光器(北京華源拓達激光技術(shù)有限公司405 nm-LASER)提供波長為405 nm激光,激光功率輸出為100 mW,經(jīng)5股UV/Vis照明光纖組成的光纖束傳至浸入式微型探頭( 廣東科思凱公司FPB-405-V3),由浸入式微型探頭將激光打入被測水體,被測水體受激輻射,發(fā)出熒光,由浸入式微型探頭檢測接收,并經(jīng)1股UV/Vis讀出光纖傳至熒光光譜儀(美國海洋光學(xué)公司USB2000+)。熒光光譜儀接收范圍設(shè)置為400~799 nm波段,積分時間為500 ms/1 000 nm,光譜采樣間隔設(shè)置為0.5 nm。所有光纖接口皆為SMA905。
圖1 實驗系統(tǒng)框圖
1.2 材料
根據(jù)煤礦的含水層分布特點及常見的突水事故情況,選取了煤礦4種含水層的水樣(煤系砂巖裂隙水、奧陶系灰?guī)r巖溶水、煤系灰?guī)r水和第四系沖積層水)以及1種常見的突水事故水樣(老窯水)做為實驗材料。在2015年3月5日現(xiàn)場采集淮南礦業(yè)集團某煤礦的5組水樣,各組分別采集樣本20個,在得到采集的水樣后立即放入褐色玻璃容器,并密封避光帶回實驗室。
1.3 光譜模式識別
模式識別中的經(jīng)典算法以LDA和PCA為代表,但是這兩種算法又各有缺點。光譜數(shù)據(jù)的特殊性表現(xiàn)在其樣本數(shù)相對于維數(shù)來說過小(小樣本問題),這使得LDA算法使用在光譜數(shù)據(jù)處理時有巨大障礙;PCA算法雖可以克服小樣本問題,但是其本質(zhì)是基于無監(jiān)督學(xué)習(xí),未考慮樣本類間鑒別信息(多重相關(guān)性),因此存在產(chǎn)生非優(yōu)化鑒別模型的危險。
PLS-DA算法的本質(zhì)是基于監(jiān)督學(xué)習(xí)特征提取方法的一種,可以將其看作是主成分分析、多元統(tǒng)計回歸和典型相關(guān)分析的有機結(jié)合。與LDA算法相比,PLS-DA算法不存在小樣本問題,與PCA相比,PLS-DA不僅做到了樣本主成分的特征提取,而且通過建模最大限度的保留了樣本信息,解決了多重相關(guān)性問題,因此其提取的主成分說服力更強,模式識別效果更好。
為對比實驗結(jié)果,在不對光譜進行任何預(yù)處理的情況下,分別采用以PCA建模為基礎(chǔ)的SIMCA算法和以PLS建模為基礎(chǔ)的PLS-DA算法進行水樣的光譜模式識別。
2.1 數(shù)據(jù)壓縮
對淮南礦業(yè)集團某煤礦的5組共100個水樣樣本進行激光激發(fā),獲取熒光光譜。為盡可能降低外界光影響,實驗中,探頭與水樣樣本都置于暗室中進行激光激發(fā)。對每個樣本進行3次測量取平均值,以降低實驗中的隨機誤差,共得到熒光數(shù)據(jù)100組。實驗獲取的熒光光譜數(shù)據(jù)為400~799 nm,間隔0.5 nm,共800個數(shù)據(jù),如圖2所示。實驗使用其中的75個樣本(每組15個樣本)光譜進行建模,剩余25個樣本用于對測試。
通過觀察圖2中5組水樣的熒光光譜可以發(fā)現(xiàn),水樣的熒光光譜總體差異明顯,但是在400~420 nm波段以及670~799 nm波段差異較小,為了減少不必要的運算量,選擇420~669波段共500個數(shù)據(jù)做為處理對象,為了進一步提高運算效率,對此波段內(nèi)的數(shù)據(jù)每2個點取平均值,此時各樣本的光譜數(shù)據(jù)就由原始的800個數(shù)據(jù)壓縮至250個數(shù)據(jù),壓縮后熒光光譜見圖3。
圖2 水樣原始熒光光譜
圖3 壓縮后熒光光譜
2.2 SIMCA建模與分類
對75組數(shù)據(jù)進行PCA建模,由表1主成分的累積貢獻率可發(fā)現(xiàn)第1主成分的貢獻率很大,因此在對數(shù)據(jù)建模時使用前2個主成分。圖4為主成分數(shù)為2情況下的水樣得分分布圖。由圖4可以看出五種水樣的分類效果顯著。
圖4 PC-1與PC-2得分聚類圖
根據(jù)PCA建模情況,在顯著性程度,主成分數(shù)為2的情況下,使用SIMCA法對各水樣進行識別。所建立的預(yù)測集及測試集的結(jié)果如表2所示。由表2可以看出經(jīng)PCA建模和SIMCA分類識別的建模集正確率為97.33%,錯誤的原因主要是由于砂巖水出現(xiàn)了2個誤判;使用未參與建模的水樣對建模集的驗證得出測試集正確率為100%。
表1 不同主成分數(shù)的累積貢獻度
2.3 PLS-DA建模與分類
PLS-DA算法是以PLS模型為基礎(chǔ),建立樣本分類變量與熒光光譜特征間的回歸模型。實驗分組情況與SIMCA算法實驗的分組一致。第一步根據(jù)水樣的類別特征,建立五種水樣的分類變量,見表3,第二步根據(jù)PLS模型對建模集的熒光光譜數(shù)據(jù)和五種水樣的分類變量進行回歸分析,最終建立熒光光譜和樣本分類變量的PLS模型。
表2 不同水樣的SIMCA識別結(jié)果
Table 2 SIMCA classification of different water samples
水樣類別數(shù)量建模集正確率數(shù)量測試集正確率奧灰水15/155/5老窯水15/155/5沖積層水15/15(73/75)97.33%5/5(25/25)100%砂巖水13/155/5灰?guī)r水15/155/5
表3 五種水樣的分類變量表
表4 PLD-DA模型的校正集與驗證集結(jié)果
圖5 PLS模型真實值與預(yù)測值回歸曲線圖
表4和圖5為五種水樣PLS-DA 算法的校正和驗證結(jié)果,由表4可知,利用PLS模型建立的水樣樣本與分類變量之間的相關(guān)性良好,模型對校正集和驗證集所有的水樣樣本皆能準確的判識水樣類別,識別率為100%,校正集和驗證集樣本的相關(guān)系數(shù)r最小分別為0.971和0.951,其校正集均方根誤差(RMSECV)和驗證集均方根誤差(RMSEP)最大分別為0.087和0.123,說明模型具有良好的擬合度。
圖5依次為奧灰水、老窯水、沖積層水、砂巖水和灰?guī)r水五種水樣的分類變量的PLS真實值與預(yù)測值的回歸曲線圖。由圖5a可以看出,奧灰水樣本的預(yù)測值分布在1附近,而其他四種水樣樣本的預(yù)測值皆分布在0附近,其他4幅圖也可以清晰的看出對應(yīng)的水樣樣本與其他樣本皆可明顯區(qū)分。這說明了以PLS模型為基礎(chǔ)的PLS-DA算法具有良好的預(yù)測精度,可以使用其進行水樣類別的辨識。
為了測試模型的正確性,利用建立的PLS-DA模型對測試集的25個水樣樣本進行類別辨識,結(jié)果如圖6所示。由圖6(a)可見所有奧灰水的樣本預(yù)測值皆在1左右,偏差最大為0.92,其他四種水樣樣本的預(yù)測值皆在0附近,偏差小于0.1。根據(jù)PLS-DA算法的識別標準,由圖6(a)可見測試集中所有的奧灰水樣本均正確識別,剩余四種水樣樣本不具備奧灰水樣本的特征,PLS-DA模型對奧灰水樣本的識別正確率為100%。圖6中的其他4幅辨識圖以此為已建立的老窯水、沖積層水、砂巖水和灰?guī)r水的PLS-DA模型對測試樣本的辨識結(jié)果,對剩余的這4幅圖使用與圖6(a)同樣的識別標準可知,模型對測試集中老窯水、沖積層水、砂巖水和灰?guī)r水樣本的識別正確率同樣為100%。
圖6 測試集PLS-DA模型水樣辨識圖
利用LIF技術(shù)獲取礦井5個含水層的水樣熒光光譜圖,利用光譜特征進行數(shù)據(jù)壓縮,依據(jù)相關(guān)原理建立了PLS-DA的水樣識別模型,并建立了SIMCA識別模型進行識別結(jié)果對比,結(jié)果表明。
(1)在不進行任何光譜預(yù)處理的情況下,PLS-DA的建模正確率為100%,而SIMCA識別模型對建模水樣樣本出現(xiàn)了誤判,正確率為97.33%,PLS-DA識別模型教SIMCA識別模型更適宜應(yīng)用在水樣類別的辨識上。
(2)5個模型校正集的相關(guān)系數(shù)均大于0.97,模型具有良好的擬合度,對于測試集樣本的識別正確率均為100%,說明LIF技術(shù)結(jié)合PLS-DA 算法,可對奧灰水、老窯水、沖積層水、砂巖水和灰?guī)r水的類別進行有效的識別。
(3)本法可實現(xiàn)水樣類別的快速識別,為礦井涌水類型的模式識別提供了一種新的方法,對于礦井涌水類型辨識儀器的開發(fā)具有一定的理論指導(dǎo)意義。
[1] LU Jin-tao, LI Xi-bing, GONG Feng-qiang(魯金濤, 李夕兵, 宮鳳強).China Safety Science Journal(中國安全科學(xué)學(xué)報), 2012, 22(7): 109.
[2] GONG Feng-qiang, LU Jin-tao(宮鳳強, 魯金濤).Journal of Mining & Safety Engineering(采礦與安全工程學(xué)報), 2014, 31(2): 236.
[3] WANG Xin-yi, XU Tao, HUANG Dan(王心義, 徐 濤, 黃 丹).Journal of China Coal Society(煤炭學(xué)報), 2011, 36, (8): 1334.
[4] HU Wei-yue, YIN Shang-xian(虎維岳, 尹尚先).Chinese Journal of Rock Mechanics and Engineering(巖石力學(xué)與工程學(xué)報), 2010, 29, (1): 3344.
[5] ZHAO Su-qi, WU Qiang, YIN Shang-xian(趙蘇啟, 武 強, 尹尚先).Journal of China Coal Society(煤炭學(xué)報), 2006, 31(1): 618.
[6] WANG Chang-shen, SUN Ya-jun, HANG Yuan(王長申, 孫亞軍, 杭 遠).Chinese Journal of Rock Mechanics and Engineering(巖石力學(xué)與工程學(xué)報), 2009, 28(2): 298.
[7] YANG Yong-guo, HUANG Fu-chen(楊永國, 黃福臣).Journal of China University of Mining and Technology(中國礦業(yè)大學(xué)學(xué)報), 2007, 36(3): 283.
[8] YAO Jie, TONG Min-ming, LIU Tao(姚 潔, 童敏明, 劉 濤).Coal Mine Safety(煤炭安全), 2013, 44(2): 29.
[9] ZHANG Rui-gang, QIAN Jia-zhong, MA Lei(張瑞鋼, 錢家忠, 馬 雷).Journal of China Coal Society(煤炭學(xué)報), 2009, 34(1): 33.
[10] WEI Wen-xue, LU Xin-ming, SHI Long-qing(衛(wèi)文學(xué), 盧新明, 施龍青).Journal of China Coal Society(煤炭學(xué)報), 2010, 35(5): 811.
[11] SANG Fu-ming, REN Xiu-lian, PAN Jian-xin(桑付明, 任秀蓮, 潘建新).Journal of Instrumental Analysis(分析測試學(xué)報), 2009, 28(9): 1100.
[12] DING Juan-juan, JIN Bao-kang, KANG Jing-wu(丁娟娟, 金葆康, 康經(jīng)武).Acta Chimica Sinica(化學(xué)學(xué)報), 2009, 67(9): 945.
[13] XIAO Guan-hui, QIN Hai, LAN He(肖光輝, 覃 海, 藍 劾).Journal of Applied Optics(應(yīng)用光學(xué)), 2011, 32(5): 1016.
[14] XU Xu, GAO Hong-jun, LIN Bing-cheng(許 旭, 高紅軍, 林炳承).Journal of Instrumental Analysis(分析測試學(xué)報), 2005, 24(5): 122.
[15] SHI Feng-cheng, LI Dong-liang, FENG Guang-lin(施豐成, 李東亮, 馮廣林).Tobacco Chemistry(煙草化學(xué)), 2013, 4: 56.
[16] OUYANG Ai-guo, ZHAO Zhan-you(歐陽愛國, 趙戰(zhàn)友).Journal of Chinese Agricultural Mechanization(中國農(nóng)機化學(xué)報), 2013, 34(1): 181.
*Corresponding author
(Received May 8, 2015; accepted Sep.16, 2015)
Research on the Source Identification of Mine Water Inrush Based on LIF Technology and PLS-DA Algorithm
YAN Peng-cheng1, ZHOU Meng-ran1*, LIU Qi-meng2, 3, WANG Rui1, LIU Jun1
1.College of Electrical and Information Engineering, Anhui University of Science and Technology, Huainan 232001, China 2.Anhui Provincial Key Lab of Geohazards Prevention and Environment Protection, Huainan 232001, China 3.College of Earth and Environment, Anhui University of Science and Technology, Huainan 232001, China
Rapid source identification of mine water inrush has great significance for early warning and rescuing after the mine water inrush.Conventional method taking the concentration of ions as the discriminant factor takes such a long time that a method of rapid source identification of mine water inrush is in urgent need.This method is combined with Laser induced fluorescence (LIF) technology and Partial Least Squares-Discriminant Analysis (PLS-DA) algorithm.In the experiment, 405 nm laser was used to excite the water and 100 groups of fluorescence spectrum from 5 different aquifer of the mine were obtained.According to the spectra curve features, the data was compressed to obtain proper spectral data.15 groups of spectrum of each water inrush samples were applied, with a total of 75 groups of spectrum as the prediction set while the rest of 25 groups of spectrum as the test set.To verify the experimental result, an experimental model was built with soft independent modeling of class analogy (SIMCA) to compare with PLS-DA.The result shows that the fluorescence spectra of different aquifer water samples is of great difference, without any pre-treatment, the PLS-DA algorithm based on the PLS model has higher modeling accuracy compared with SIMCA algorithm, which reaches to 100%, the validation results and the correlation of separation of variables are both more than 0.951, the RMSECV and RMSEP are both less than 0.123, using the model to identify the 5 water samples of test set, the accuracy are up to 100%.
Mine water inrush; Source identification; LIF; PLS-DA
2015-05-08,
2015-09-16
“十二五”國家科技支撐計劃項目(2013BAK06B01)和國家安全生產(chǎn)重大事故防治關(guān)鍵技術(shù)科技項目(an-hui-0001-2016AQ)資助
閆鵬程,1988年生,安徽理工大學(xué)電氣與信息工程學(xué)院博士研究生 e-mail: pcyan1988@126.com *通訊聯(lián)系人 e-mail: mrzhou8521@163.com
O657.3
A
10.3964/j.issn.1000-0593(2016)09-2858-05