張敏 郭天太 洪博 孫睿
摘 要:礦井氣體的定量分析對(duì)于是實(shí)現(xiàn)礦井安全實(shí)時(shí)檢測(cè)反饋的基礎(chǔ)。采用傅里葉變換紅外光譜法獲取甲烷、乙烷等5種煤礦井氣體的光譜數(shù)據(jù),并基于支持向量回歸機(jī)(SVR)建立非線性回歸模型,對(duì)未知樣本進(jìn)行定量分析。使用SVR對(duì)氣體紅外光譜進(jìn)行定量分析時(shí),懲罰系數(shù)和核參數(shù)的選擇直接決定了算法的精度和耗時(shí)。該文分別采用網(wǎng)格搜索法、遺傳算和及粒子群算法對(duì)SVR模型的重要參數(shù)對(duì)進(jìn)行優(yōu)化,并比較上述3種算法優(yōu)化后的模型性能。結(jié)果表明:3種算法的回歸精度基本都能達(dá)到10-4,但預(yù)測(cè)精度差異較大。其中,粒子群算法計(jì)算時(shí)間較短,最小均方差為2×10-4,能達(dá)到較高的精度,在實(shí)踐中值得推廣。
關(guān)鍵詞:礦井氣體 紅外吸收光譜 支持向量機(jī)回歸 參數(shù)優(yōu)化 粒子群算法
中圖分類(lèi)號(hào):TP181 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2015)12(b)-0095-02
礦井氣體組分主要包括一氧化碳、二氧化碳、甲烷、乙烷、丙烷等[1-2]。根據(jù)氧化氣體產(chǎn)物的構(gòu)成、濃度及其變化速率等特性,可對(duì)煤炭自然發(fā)火做出準(zhǔn)確的預(yù)測(cè)預(yù)報(bào)[3-4],用來(lái)指導(dǎo)煤礦的防滅火安全生產(chǎn)工作。紅外光譜法作為檢測(cè)有害氣體的主要方法之一,具有較高的信噪比和較快的分析速度,在礦井氣體分析領(lǐng)域有廣泛的應(yīng)用[5]。
由于氣體特征譜帶較寬,而且烷烴類(lèi)氣體的特征峰嚴(yán)重重疊,以致單獨(dú)預(yù)測(cè)每種氣體的屬性和濃度較為困難。目前主要使用的方法有主成分回歸、偏最小二乘法等風(fēng)險(xiǎn)經(jīng)驗(yàn)最小化方法,和以支持向量回歸機(jī)(SVR)為代表的非線性建模方法,其中SVR具有較高的回歸精度和預(yù)測(cè)性能。
1 支持向量機(jī)回歸算法概述
SVM是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的新型學(xué)習(xí)機(jī)。SVR是建立在SVM思想上,可用于解決回歸問(wèn)題的新型算法。SVR不但具有SVM的優(yōu)點(diǎn),而且其通過(guò)將數(shù)據(jù)映射到高維空間進(jìn)行線性擬合,較傳統(tǒng)非線性擬合方法具有更低的過(guò)擬合風(fēng)險(xiǎn),但是SVR的理論優(yōu)勢(shì)取決于其關(guān)鍵參數(shù)懲罰系數(shù)C和核參數(shù)g是否合適。
C、和g這3種參數(shù)優(yōu)選法的實(shí)現(xiàn),都基于將SVR的模型結(jié)構(gòu)及其預(yù)測(cè)算法嵌入對(duì)應(yīng)的算法步驟中。網(wǎng)格搜索法(GRID)、遺傳算法(GA)以及粒子群算法(PSO)作為成熟的優(yōu)化算法,在理論上較高的精度和可靠性,且耗時(shí)更短。文章比較這3種優(yōu)化SVR,并選取均方差(MSE)作為評(píng)判精度的指標(biāo):
(1)
式中,為新樣本的估計(jì)值;n為樣本數(shù)。
2 基于SVR的礦井氣體預(yù)測(cè)模型
礦井氣體組分濃度的定量分析是指在待測(cè)氣體濃度或其他性質(zhì)與測(cè)試儀器的測(cè)量結(jié)果之間構(gòu)建定量關(guān)聯(lián)關(guān)系。對(duì)紅外光譜分析而言,則是用統(tǒng)計(jì)的方法在礦井氣體組分的種類(lèi)和濃度值與紅外光譜數(shù)據(jù)之間建立一個(gè)關(guān)聯(lián)模型(校正模型),應(yīng)用建立的校正模型即可對(duì)待測(cè)氣體組分濃度進(jìn)行預(yù)測(cè)。定量模型建立之后,必須對(duì)其進(jìn)行驗(yàn)證,以確保模型對(duì)光譜信息和樣品濃度信息之間的回歸關(guān)系表征正確,模型的預(yù)測(cè)能力滿足定量分析的精度要求。
文章采用選用RBF核函數(shù),分別使用GRID、GA、PSO算法進(jìn)行參數(shù)優(yōu)化,對(duì)甲烷、乙烷、丙烷等5種典型礦井氣體的組分濃度進(jìn)行回歸預(yù)測(cè)。
3 不同算法下礦井氣體定量分析結(jié)果對(duì)比
文章使用美國(guó)賽默飛世爾科技公司的Nicolet-Nexus870型傅里葉變換紅外光譜儀,共測(cè)得186組模擬礦井氣體的光譜數(shù)據(jù),將其中136組作為訓(xùn)練樣本,剩余50組樣本數(shù)據(jù)作為測(cè)試集。用優(yōu)化所得的C和g對(duì)校正集各維進(jìn)行訓(xùn)練建立SVR校正模型,利用原始數(shù)據(jù)對(duì)模型進(jìn)行回歸驗(yàn)證。
通過(guò)計(jì)算得到,采用不同優(yōu)化算法時(shí)的MSE值都小于0.06,且R值接近1,說(shuō)明各模型的學(xué)習(xí)能力較好。為進(jìn)一步評(píng)價(jià)各參數(shù)優(yōu)選法對(duì)礦井氣體組分濃度的預(yù)測(cè)性能優(yōu)劣,對(duì)不同參數(shù)設(shè)置下模型的預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比(如表1所示),其中T為各SVR完成訓(xùn)練校正集以并獲得預(yù)測(cè)結(jié)果參數(shù)所需的總時(shí)長(zhǎng)。
由表1可以看出,3種SVR計(jì)算時(shí)長(zhǎng)都在80 s以下,但PSO和GA的計(jì)算時(shí)長(zhǎng)普遍短于GRID。甲烷、乙烷以及二氧化碳在混合氣體中的濃度均能被這3種SVR實(shí)現(xiàn)較為準(zhǔn)確的預(yù)測(cè),其中相關(guān)系數(shù)R均大于0.9,且最小MSE都在0.02以下,而乙烷、丙烷的濃度預(yù)測(cè)誤差則相對(duì)較大。由于烷類(lèi)氣體的紅外吸收光譜在波段以及波峰吸收值上存在較大的重疊,丙烷和丁烷尤為嚴(yán)重,其預(yù)測(cè)結(jié)果如圖1所示。
由圖1可以看出,對(duì)于丙烷和丁烷,基于PSO優(yōu)化模型明顯優(yōu)于其他兩種算法,且其對(duì)丙烷和丁烷預(yù)測(cè)后所得均方差均低于其他兩種算法,相關(guān)系數(shù)也高于其他算法優(yōu)化的SVR,從而證明利用PSO優(yōu)化SVR模型參數(shù)對(duì)(C,g)的適用性。
4 結(jié)語(yǔ)
礦井氣體的紅外吸收光譜能夠反映其組分種類(lèi)及其濃度的信息,但是烷烴類(lèi)氣體存在較為嚴(yán)重的波峰重疊,所以需要通過(guò)非線性建模的方法對(duì)其進(jìn)行定量分析。SVR在對(duì)礦井氣體紅外光譜進(jìn)行定量分析時(shí),具有較高的精度;但是實(shí)現(xiàn)此優(yōu)勢(shì)的前提則是選取到最佳參數(shù)對(duì)(C,g)。經(jīng)過(guò)試驗(yàn)分析,對(duì)現(xiàn)階段較為常用的參數(shù)選擇法如GRID、GA以及PSO的性能進(jìn)行了對(duì)比,發(fā)現(xiàn)使用PSO優(yōu)化的模型在對(duì)礦井氣體的定量回歸預(yù)測(cè)上的綜合性能更好。
參考文獻(xiàn)
[1]張國(guó)樞.通風(fēng)安全學(xué)[M].徐州:中國(guó)礦業(yè)大學(xué)出版社,2007.
[2]王顯政.煤礦安全新技術(shù)[M].北京:煤炭科學(xué)出版社,2002.
[3]梁運(yùn)濤.煤炭自然發(fā)火預(yù)測(cè)預(yù)報(bào)的氣體指標(biāo)法[J].煤炭科學(xué)技術(shù),2008(6):5-8.
[4]羅海珠,梁運(yùn)濤.煤自然發(fā)火預(yù)測(cè)預(yù)報(bào)技術(shù)的現(xiàn)狀與展望[J].中國(guó)安全科學(xué)學(xué)報(bào),2003(3):79-81.
[5]Naoual Makhoukhia,Eve Pere.Determination of the composition of a mixture of gases by infrared analysis and chemometric methods[J]. Journal of Molecular Structure,2005(744-747): 855-859.