吳兆立
(江蘇建筑職業(yè)技術(shù)學(xué)院,江蘇 徐州 221008)
礦井突水一直是煤礦開采過程中最容易引發(fā)安全事故的重要原因之一。一旦礦井發(fā)生突水很有可能造成重大財(cái)產(chǎn)損失和人員傷亡事故,如何及時準(zhǔn)確地對突水成因進(jìn)行判斷,對突水水源進(jìn)行判別,是預(yù)防和解決礦井突水災(zāi)害的關(guān)鍵步驟。因此,準(zhǔn)確判別突水水源,提前開展礦井水害防治,是保證礦井安全生產(chǎn)的重要措施。
在對礦井突水水源進(jìn)行判別研究方面,楊建等[1]通過研究溶解性有機(jī)質(zhì)在不同含水層之間的差異和分布規(guī)律,提出了一種有機(jī)-無機(jī)相結(jié)合的礦井突水水源判別方法,可實(shí)現(xiàn)水源的快速判別;毛志勇等[2]在對礦井各含水層水化學(xué)特征綜合考慮基礎(chǔ)上,提出了一種基于核主成分分析-改進(jìn)粒子群算法-極限學(xué)習(xí)機(jī)(KPCA-MPSO-ELM)相結(jié)合的礦井突水水源判別模型,可以很好地對數(shù)據(jù)進(jìn)行判別和優(yōu)化,從而實(shí)現(xiàn)準(zhǔn)確識別突水水源;曲興玥等[3]基于水樣變量因子,把水化學(xué)成分指標(biāo)作為礦井突水水源判別依據(jù),采用MATLAB因子分析及距離判別模型,實(shí)現(xiàn)了對不同礦井突水水源的識別;琚棋定等[4]結(jié)合主成分分析和貝葉斯(Bayes)方法,構(gòu)建了突水水源識別模型判別法,對不同礦井的突水水源識別;牟林[5]通過利用已有勘探數(shù)據(jù),提出了以“獨(dú)立識別區(qū)”和“關(guān)鍵離子”為主的水質(zhì)動態(tài)曲線,用于突水過程的預(yù)測分析。此外還有一些方法根據(jù)水樣的水化學(xué)特征進(jìn)行水源判別的方法,包括Fisher判別法、BP神經(jīng)網(wǎng)絡(luò)、可拓判別法、灰色關(guān)聯(lián)度等。目前國內(nèi)外學(xué)者對于礦井突水水源判別研究不斷深入,但主要從地面水質(zhì)化驗(yàn)指標(biāo)判斷水源,對一些復(fù)雜地區(qū)的判斷結(jié)果往往與實(shí)際有很大出入,而且在實(shí)際應(yīng)用過程中限制因素較多,不能實(shí)現(xiàn)對每類水源的全覆蓋,導(dǎo)致識別方法的推廣性略差。因此,本文提出采用蜻蜓算法和最小二乘支持向量機(jī)相結(jié)合的方式,對各類礦井突水水源進(jìn)行科學(xué)的判別,為礦井安全生產(chǎn)提供參考。
最小二乘支持向量機(jī)(LS-SVM)是支持向量機(jī)(SVM)的一個變種,由于標(biāo)準(zhǔn)SVM算法計(jì)算復(fù)雜度與訓(xùn)練樣本數(shù)量有關(guān),當(dāng)樣本數(shù)量較大時,求解的相應(yīng)二次規(guī)劃問題變得非常復(fù)雜,計(jì)算速度就會變慢,而LS-SVM將標(biāo)準(zhǔn)SVM的算法轉(zhuǎn)化成為求解線性方程組的問題,使得求解速度加快,改善了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的缺陷[6]。使用最小二乘支持向量機(jī)對礦井突水水源判別數(shù)據(jù)訓(xùn)練步驟如下所述[7]。
1) 建立水源判別數(shù)據(jù)訓(xùn)練樣本集S={(xi,yi)}(i=1,2,…,N),其中,xi和yi分別為LS-SVM的輸入量和輸出量;N為訓(xùn)練集樣本的數(shù)量。
2) 對分類超平面進(jìn)行描述,并設(shè)置其約束條件,計(jì)算見式(1)。
yi[ωTφ(xi)+b]-1+εi=0
(1)
式中:εi為松弛向量(即誤差量);φ(xi)為xi在高維空間的映射定義;ω為超平面的法線方向;b為常數(shù)。
3) 為了使訓(xùn)練集到超平面的最小距離最大,將確定最優(yōu)超分類面的問題轉(zhuǎn)化為二次規(guī)劃的問題,具體表達(dá)見式(2)。
(2)
式中,c為懲罰因子。
4) 利用拉格朗日函數(shù)L來解決上述問題,并對其進(jìn)行進(jìn)一步的優(yōu)化,計(jì)算公式見式(3)。
(3)
進(jìn)一步優(yōu)化得到式(4)。
(4)
式中,α為拉格朗日乘子。
5) 結(jié)合以上步驟,得到最小二乘支持向量機(jī)的回歸函數(shù)模型見式(5)。
(5)
式中,κi(x,xi)為核函數(shù)。
根據(jù)LS-SVM特點(diǎn),本文運(yùn)用泛化能力較好的徑向基核函數(shù)作為核函數(shù),其表達(dá)式見式(6)。
κi(x,xi)=exp(-‖x-xj‖2/2σ2)
(6)
式中,σ為核寬度。
在LS-SVM進(jìn)行對礦井突水水源判別的數(shù)據(jù)訓(xùn)練中,c和σ是必須要進(jìn)行調(diào)整的兩個重要參數(shù),這兩個參數(shù)取值不同將會得到不同的LS-SVM模型,c和σ的取值沒有非常準(zhǔn)確的參數(shù)調(diào)節(jié)方法,本文在實(shí)際應(yīng)用中引入蜻蜓算法,尋找最優(yōu),從而在蜻蜓算法和最小二乘支持向量機(jī)的基礎(chǔ)上對回歸模型進(jìn)行預(yù)測。
蜻蜓算法(DA算法)是運(yùn)用數(shù)學(xué)方法模擬蜻蜓狩獵行為和遷徙行為的一種新型群智能算法[8]。種群行為一般都遵循分離、對齊和內(nèi)聚3個基本準(zhǔn)則,據(jù)此衍生出5種行為計(jì)算。
1) 分離指防止個體與相鄰個體的靜態(tài)碰撞,其表達(dá)見式(7)。
(7)
式中:X為當(dāng)前個體所在的位置;Xj為第j個相鄰個體的所處位置;N為蜻蜓個體的總量。
2) 對齊指個體與相鄰個體兩者保持著相同的速度,其表達(dá)見式(8)。
(8)
式中,Vj為第j個相鄰個體的速度。
3) 內(nèi)聚指個體有向相鄰個體中心進(jìn)行聚攏的傾向,其表達(dá)見式(9)。
(9)
4) 食物吸引力的計(jì)算見式(10)。
Fi=X+-X
(10)
式中:X+為食物源位置;X為當(dāng)前個體所在的位置。
5) 天敵排斥力的計(jì)算見式(11)。
Ei=X-+X
(11)
式中:X-為天敵位置;X為當(dāng)前個體所在的位置。
根據(jù)上述5種行為,為模擬下一代蜻蜓在搜索空間的位置,引入位置向量和步向量,計(jì)算見式(12)。
VXt+1=(sSi+aAi+cCi+fFi+eEi)+wVXt
Xt+1=Xt+VXt+1
(12)
式中:VXt+1為第t+1代蜻蜓種群的位置更新步長;Xt為第t代蜻蜓種群的個體位置;t為種群迭代的次數(shù);s、a、c分別為蜻蜓種群的分離度、對齊度、內(nèi)聚度權(quán)重;i為第i個蜻蜓個體;f為蜻蜓種群的食物因子;e為蜻蜓種群的天敵因子;w為蜻蜓種群的慣性權(quán)重。
為了提高蜻蜓探索狀態(tài)下的隨機(jī)性,當(dāng)個體周圍沒有相近的個體時,則采用隨機(jī)游走的方式,種群的更新位置計(jì)算見式(13)。
Xt+1=Xt+Le′vy(d)Xt
(13)
在LS-SVM預(yù)測模型中,c值和σ值的選擇直接關(guān)系到預(yù)測精度,如果選值不合適,將會導(dǎo)致預(yù)測結(jié)果的可靠性低、精度不高。蜻蜓算法由于將群體行為的所有可能因素都進(jìn)行了考慮,使算法能夠在最優(yōu)值附近快速地收斂,具有全局尋優(yōu)能力良好和穩(wěn)定性良好的特點(diǎn)。將蜻蜓算法與LS-SVM相結(jié)合,尋找最合適的c和σ,其主要步驟如下所述。
1) 收集礦井突水水源判別的樣本數(shù)據(jù),作為訓(xùn)練集和測試集使用,對測試集數(shù)據(jù)要采取歸一化的處理方式。
2) 初始化蜻蜓算法參數(shù),主要是設(shè)置蜻蜓種群個數(shù)及蜻蜓種群的最大迭代次數(shù);初始化LS-SVM模型參數(shù),主要是設(shè)置c值和σ值。
3) 隨機(jī)對蜻蜓種群的位向量和步長向量進(jìn)行初始化,并將蜻蜓的個體位置信息依次賦值c值和σ值。
4) 根據(jù)LS-SVM模型,將預(yù)測模型的準(zhǔn)確率數(shù)值作為蜻蜓個體當(dāng)前的適應(yīng)度值,每進(jìn)行一次操作,計(jì)算一次蜻蜓個體的最大適應(yīng)度值,并通過對比,選取最大適應(yīng)度值作為最優(yōu)值,保存尋找到最優(yōu)值時所對應(yīng)的c值和σ值。
5) 計(jì)算蜻蜓個體行為,對蜻蜓個體的鄰域半徑和相對位置進(jìn)行更新。
6) 當(dāng)滿足蜻蜓算法的最大迭代次數(shù)時,則停止LS-SVM模型的參數(shù)尋優(yōu)過程,輸出蜻蜓的最大適應(yīng)度值和最優(yōu)值所對應(yīng)的參數(shù)c值和σ值;否則繼續(xù)迭代,重復(fù)執(zhí)行步驟4。
7) 用訓(xùn)練好的礦井突水水源判別的模型進(jìn)行預(yù)測和誤差分析。
表1 訓(xùn)練樣本數(shù)據(jù)
補(bǔ)給條件等各類水的化學(xué)特征,將某礦區(qū)的礦井突水水源共分為4大類,即Ⅰ類為二灰和奧陶紀(jì)含水層、Ⅱ類為八灰含水層、Ⅲ類為頂板砂巖含水層和Ⅳ類為第四系含水層。在礦區(qū)的不同地點(diǎn)共采取24個突水水樣,選取以上6種離子組分作為輸入量,以類型判別作為輸出量,從而建立礦井突水水源判別的數(shù)學(xué)模型,模型訓(xùn)練數(shù)據(jù)見表1。
為了進(jìn)一步驗(yàn)證基于蜻蜓算法和最小二乘支持向量機(jī)模型對礦井突水水源判別的準(zhǔn)確性,用訓(xùn)練好的判別模型對采集到的其他4組驗(yàn)證數(shù)據(jù)進(jìn)行檢驗(yàn),結(jié)果見表2。由表2可知,本文采用的基于蜻蜓算和最小二乘支持向量機(jī)的方法能夠較好地對礦井突水水源進(jìn)行判別,預(yù)測結(jié)果和實(shí)際計(jì)算結(jié)果一致,滿足實(shí)際的判別需求。
表2 突水水源判別及驗(yàn)證
礦井突水水源判別直接影響礦井的生產(chǎn)安全,正確對突水水源進(jìn)行判別,提前采取相應(yīng)的應(yīng)急處理措施,對于提高礦井的生產(chǎn)安全、穩(wěn)定性及經(jīng)濟(jì)性具有重要意義。本文基于不同含水層的水化學(xué)成分存在的差異特性提出了一種新的判別礦井突水水源的方法,以最小二乘支持向量機(jī)為基礎(chǔ),并輔以蜻蜓算法實(shí)現(xiàn)對礦井突水水源的準(zhǔn)確判別,經(jīng)過實(shí)際數(shù)據(jù)驗(yàn)證顯示該模型具有操作簡單、快速高效、結(jié)果可靠等優(yōu)點(diǎn),對礦井水源的判別具有較高的辨識度,為礦井突水的預(yù)防和治理工作提供了參考和借鑒。