王江榮 文 暉 任泰明
(蘭州石化職業(yè)技術(shù)學(xué)院 信息處理與控制工程系,蘭州 730060)
礦井突水嚴(yán)重危害著煤炭的開采、礦工的生命和財(cái)產(chǎn)安全,因此,對礦井突水的預(yù)測預(yù)報(bào)工作顯得十分必要,對煤礦安全生產(chǎn)有著重要意義[1-2]。影響煤礦突水的主要因素(指標(biāo)或特征)有:含水性、水壓、隔水層厚度、突水系數(shù)、導(dǎo)水性、構(gòu)造發(fā)育、巖性組合、推進(jìn)步距、工作面斜長等9個(gè)因素[3]。這些判別指標(biāo)之間界限很不明顯,存在一定的模糊性、信息的不精確性以及信息疊加性等,特別是信息的疊加會(huì)導(dǎo)致突水狀況誤判的問題。另外,這些判斷指標(biāo)與礦井突水之間存在著很強(qiáng)的非線性關(guān)系[4]。為此,該文采用主成分分析(PCA,Principal Components Analysis)法對影響突水狀態(tài)的指標(biāo)數(shù)據(jù)進(jìn)行信息提煉,把多個(gè)彼此相關(guān)聯(lián)的指標(biāo)變量通過線性組合轉(zhuǎn)化為彼此獨(dú)立的樣本指標(biāo),有效地提取原突水狀態(tài)的指標(biāo)變異信息,消除指標(biāo)間信息疊加造成的影響。模糊神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)功能又具有模糊語言表達(dá)能力,同時(shí)具有高度非線性擬合能力,是集學(xué)習(xí)、聯(lián)想、識(shí)別、自適應(yīng)及模糊信息處理于一體的智能信息處理方法。本文擬用模糊神經(jīng)網(wǎng)絡(luò)對礦井突水樣本數(shù)據(jù)進(jìn)行判別(突水,不突水),較好地解決了信息的不足、環(huán)境的模糊性以及判斷指標(biāo)的非線性等問題,并以主成分分析生成的樣本數(shù)據(jù)(或特征向量)作為模糊神經(jīng)網(wǎng)絡(luò)的輸入,用遺傳算法對模型系數(shù)及參數(shù)進(jìn)行優(yōu)化。從淄博礦井突水案例中選取20個(gè)典型底板突水資料作為原始的建模樣本數(shù)據(jù),另選6個(gè)原始樣本數(shù)據(jù)作為模型的檢測樣本數(shù)據(jù)。實(shí)例仿真結(jié)果表明本文建立的基于主成分分析和遺傳算法的模糊神經(jīng)網(wǎng)絡(luò)礦井突水判斷模型效果優(yōu)于常用的神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)回歸等方法,具有一定的借鑒意義。
影響礦井突水的因素是多方面的,且各因素的重要性有所不同。在很多情況下,變量之間有一定的相關(guān)性,從而使得這些變量所提供的信息在一定程度上有所重疊。主成分分析法[5-6]是一種數(shù)據(jù)壓縮和特征信息提取技術(shù),利用該方法對數(shù)據(jù)進(jìn)行處理,可有效地消除高維數(shù)據(jù)組之間的相關(guān)性,使數(shù)據(jù)降維,數(shù)據(jù)結(jié)構(gòu)簡化,同時(shí)保留了所需要的主要信息。
主成分分析法的計(jì)算步驟如下:
設(shè)X是一個(gè)含有n個(gè)數(shù)據(jù)樣本和p個(gè)變量的二維數(shù)據(jù)表,X=(xij)n×p。其中列向量(x1j,x2j,…,xnj)Τ對應(yīng)第j個(gè)變量。
1.1.1數(shù)據(jù)標(biāo)準(zhǔn)化
利用MATLAB提供的函數(shù)zscore()或利用式(1)消除數(shù)量級和量綱不同造成的影響。
(1)
1.1.2計(jì)算樣本各維間相關(guān)系數(shù)矩陣
1.1.3計(jì)算特征值與特征向量
利用MATLAB提供的eig()函數(shù)求出相關(guān)系數(shù)矩陣R=(rij)p×p的p個(gè)特征值l1,l2,…,lp(l1≥l2≥…≥lp≥0)與相對應(yīng)的特征向量e1,e2,…,ep,從而有Rei=liei。
1.1.4計(jì)算貢獻(xiàn)率
1.1.5計(jì)算主成分載荷矩陣
設(shè)e1,e2,…,em是根據(jù)1.1.4節(jié)選定的m個(gè)主成分特征值對應(yīng)的特征向量,計(jì)算標(biāo)準(zhǔn)化后的各變量x1,x2,…,xp在各主成分上的載荷矩陣,其計(jì)算公式:
式中:eij為向量ei的第j個(gè)分量。經(jīng)過計(jì)算后,可以得到的主成分載荷矩陣。主成分yi的表達(dá)式為:
yi=li1x1+li2x2+…+lipxpi=1,2,…,m
(2)
這樣可將p維樣本向量(x1,x2,…,xp)轉(zhuǎn)化為新的m維樣本向量(y1,y2,…,ym),達(dá)到降維和消除信息重疊(使樣本的各個(gè)屬性之間是相互獨(dú)立)的目的,并將新的m維向量(y1,y2,…,ym)作為下文模糊神經(jīng)網(wǎng)絡(luò)算法的輸入向量。
T-S(Takagi-Sugeno:T-S)神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的自學(xué)習(xí)和聯(lián)想功能,人工干預(yù)少,精度較高,對專家知識(shí)的利用也較好。但缺點(diǎn)是它不能處理和描述模糊信息,不能很好利用已有的經(jīng)驗(yàn)知識(shí),對樣本的要求較高;模糊系統(tǒng)相對于神經(jīng)網(wǎng)絡(luò)而言,具有推理過程容易理解、專家知識(shí)利用較好、對樣本的要求較低等優(yōu)點(diǎn),但它同時(shí)又存在人工干預(yù)多、推理速度慢、精度較低等缺點(diǎn),很難實(shí)現(xiàn)自適應(yīng)學(xué)習(xí)的功能。將二者有機(jī)地結(jié)合起來,可起到優(yōu)勢互補(bǔ),取長補(bǔ)短[8-9]。
1.2.1T-S模糊神經(jīng)網(wǎng)絡(luò)計(jì)算步驟[10-12]
1)對于k維輸入向量y=[y1,y2,…,yk],根據(jù)模糊規(guī)則計(jì)算各輸入變量yj的隸屬度,隸屬度函數(shù)采用高斯型:
(3)
2)將各隸屬度進(jìn)行模糊計(jì)算,模糊算子采用連乘算子:
(4)
3)T-S模糊神經(jīng)網(wǎng)絡(luò)輸出數(shù)學(xué)表達(dá)式為:
(5)
4)計(jì)算誤差
(6)
式中,yd是網(wǎng)絡(luò)期望輸出;yc是網(wǎng)絡(luò)實(shí)際輸出。
5)修正系數(shù)和參數(shù)
T-S模糊神經(jīng)網(wǎng)絡(luò)根據(jù)網(wǎng)絡(luò)輸出和期望輸出的誤差平方和e來修正系數(shù)和參數(shù)。
系數(shù)修正表達(dá)式:
(7)
式中,m為對應(yīng)層的結(jié)點(diǎn)個(gè)數(shù);a 為網(wǎng)絡(luò)學(xué)習(xí)率;yj為網(wǎng)絡(luò)輸入?yún)?shù);ωi為輸入?yún)?shù)隸屬度連乘積。
參數(shù)修正:
(8)
1.2.2基于T-S模糊神經(jīng)網(wǎng)絡(luò)的礦井突水樣本識(shí)別模型
采用T-S模糊神經(jīng)網(wǎng)絡(luò)對礦井突水樣本分類,分為T-S模糊神經(jīng)網(wǎng)絡(luò)構(gòu)建、訓(xùn)練和預(yù)測3個(gè)部分。模糊神經(jīng)網(wǎng)絡(luò)的構(gòu)建確定了網(wǎng)絡(luò)的輸入和輸出數(shù)量、隸屬度函數(shù)和參數(shù)的個(gè)數(shù);模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練采用選定的樣本數(shù)據(jù),測試數(shù)據(jù)選用其它樣本數(shù)據(jù)。
1.2.3實(shí)驗(yàn)數(shù)據(jù)
影響礦井突水的因素有:含水性x1、水壓x2、隔水層厚度x3、突水系數(shù)x4、導(dǎo)水性x5、構(gòu)造發(fā)育x6、巖性組合x7、推進(jìn)步距x8、工作面斜長x9等9個(gè)因素。選取淄博礦井突水案例中20個(gè)典型底板突水資料作為原始標(biāo)準(zhǔn)樣本數(shù)據(jù)[3],以這20個(gè)樣本數(shù)據(jù)作為建模數(shù)據(jù),具體數(shù)據(jù)見表1。表1中的實(shí)際突水性一列里的數(shù)值“1”表示不突水,數(shù)值“2”表示突水。
表1 淄博煤礦突水各影響因素與實(shí)際突水量(訓(xùn)練樣本)
注:突水量單位:m3/h;含水性、突水系數(shù)、導(dǎo)水性、構(gòu)造發(fā)育、巖性組合均為量化值,無量綱。
1.2.4數(shù)據(jù)的PCA處理
首先對表1中的樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后對標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù)進(jìn)行PCA處理。其中,相關(guān)系數(shù)矩陣的特征值及貢獻(xiàn)率見表2。
通過表2中的數(shù)據(jù)可知,取前4個(gè)特征值累計(jì)貢獻(xiàn)率達(dá)84.5308%,根據(jù)累計(jì)貢獻(xiàn)率大于80%也可以接受的原則,提取前4個(gè)特征值(其中3個(gè)大于1)為主成分。根據(jù)PCA主成分表達(dá)式的系數(shù)矩陣(主成分的載荷矩陣)得到新因子Y1,Y2,Y3和Y4與原始變量(標(biāo)準(zhǔn)化后)之間的關(guān)系表達(dá)式為:
Y1=0x1+0.6315x2+0.5301x3+0.2313x4+
0.0154x5-0.0438x6+0x7+0.4824x8+
0.1784x9
(9)
Y2=0x1+0.0249x2+0.3662x3-0.4707x4-
0.3761x5+0.3625x6+0x7-0.3490x8+
0.4991x9
(10)
Y3=0x1+0.0470x2-0.1587x3+0.4244x4+
0.4746x5+0.6874x6-0x7-0.1440x8+
0.2721x9
(11)
Y4=0x1-0.0632x2+0.2235x3-0.4933x4+
0.7914x5-0.2423x6+0x7-0.0221x8+
0.1309x9
(12)
將4個(gè)主成因子Y1,Y2,Y3和Y4作為模糊神經(jīng)網(wǎng)絡(luò)的4個(gè)輸入指標(biāo)。結(jié)合表1,由4個(gè)主成分生成新的礦井突水指標(biāo),新指標(biāo)見表3。
表2各項(xiàng)指標(biāo)相關(guān)系數(shù)矩陣的特征值及貢獻(xiàn)率
主成分序號特征值差值貢獻(xiàn)率%累計(jì)貢獻(xiàn)率%12 30660 645032 951432 951421 66160 645023 736756 688131 14620 343416 374473 062540 80280 120811 468384 530850 68200 29849 742994 273660 38360 36635 479799 753470 01730 01730 2466100 000082 6653e-0332 6653e-0333 8076e-032100 0000900100 0000
表3 4個(gè)主成分生成的礦井突水狀態(tài)的新判別指標(biāo)
本文利用遺傳算法工具箱的GUI進(jìn)行參數(shù)優(yōu)化計(jì)算[13]。適應(yīng)度函數(shù)為:
(13)
打開遺傳算法的GUI,在Fitnessfunction窗口輸入@fitess(函數(shù)的計(jì)算過程由MATLAB編寫,在此略去),在Number of variables窗口輸入變量數(shù)目104,邊界約束:Lower輸入0.01*ones(1,104);Upper輸入3.5*ones(1,104),種群規(guī)模選50,迭代次為1000,其它參數(shù)選默認(rèn)值。
訓(xùn)練結(jié)束后,輸出訓(xùn)練樣本是否突水判斷的擬合值,并近似處理,結(jié)果見表3(正確:表3第7列)。和實(shí)際突水狀態(tài)值比較,本文方法的預(yù)報(bào)值精確率為100%??梢娊?jīng)訓(xùn)練樣本創(chuàng)建的突水判斷模型具有很高的精確性和穩(wěn)定性。下面我們對本文所創(chuàng)建的模型作進(jìn)一步測試,測試樣本見表4。
表4 測試樣本[3]
將表4待判樣本數(shù)據(jù)標(biāo)準(zhǔn)化后代入文中1.2.4節(jié)由PCA提取的4個(gè)主成分表達(dá)式(9)~(12)得到待測樣本的主成分指標(biāo)見表5。
表5 待判樣本的判別結(jié)果及有關(guān)數(shù)據(jù)
在MATLAB命令窗口輸出104個(gè)優(yōu)化參數(shù)(此處省略),將適應(yīng)度函數(shù)中訓(xùn)練集自變量輸入矩陣換成測試集自變量輸入矩陣(數(shù)據(jù)見表5中主成分所在列),代入優(yōu)化參數(shù)(訓(xùn)練樣本所得)求出6個(gè)測試樣本突水性的預(yù)報(bào)值,具體結(jié)果見表5。表5數(shù)據(jù)顯示本文方法的預(yù)測正確率為83.33%(錯(cuò)了一個(gè))。作為比較下面給出另三種方法的預(yù)測結(jié)果(訓(xùn)練樣本和測試樣本不變),具體數(shù)據(jù)見表6。
通過對比表5和表6的預(yù)報(bào)值,本文方法的預(yù)報(bào)結(jié)果顯然優(yōu)于表6中的方法。究其原因,本文方法充分利用PCA法能消除變量之間相互信息疊加而產(chǎn)生的影響,用少量指標(biāo)表征突水特性;利用模糊神經(jīng)網(wǎng)很好地解決了突水環(huán)境的模糊性和非線性性。同時(shí)發(fā)揮了遺傳算法所具有的全局搜索能力,優(yōu)化了模型的系數(shù)和參數(shù),增強(qiáng)了模型的精確性和穩(wěn)定性。而表6中的方法有著明顯的缺陷,所以誤差較大。
結(jié)合礦井突水的信息特征,本文提出了基于PCA和模糊神經(jīng)網(wǎng)絡(luò)的突水判別預(yù)測方法。在突水判別預(yù)測過程中,利用PCA法處理原始數(shù)據(jù)后,不僅可以用少量的指標(biāo)變量有效地表征礦井突水特性,而且能消除由于變量之間相互信息疊加而產(chǎn)生的影響。研究結(jié)果表明,對數(shù)據(jù)信息進(jìn)行PCA法處理后,礦井突水類型(突水或不突水)的判別精度比單純使用模糊神經(jīng)網(wǎng)絡(luò)判別法有較大提高,也比其它一些方法效果要好。
T-S模糊神經(jīng)網(wǎng)絡(luò)的權(quán)系數(shù)和高斯隸屬度函數(shù)參數(shù)較多,采用遺傳算法優(yōu)化后,提高了T-S模糊神經(jīng)網(wǎng)絡(luò)模型計(jì)算結(jié)果的穩(wěn)定性,摒棄了模型對權(quán)值選取的主觀性和敏感性,充分發(fā)揮了模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)的各自優(yōu)勢,使模型的泛化能力得到了加強(qiáng),而且多次運(yùn)行識(shí)別結(jié)果保持一致。優(yōu)化后的T-S模糊神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性和穩(wěn)定性遠(yuǎn)好于單一的神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)回歸等模型,值得礦業(yè)技術(shù)人員借鑒。
[1]張立新,李長洪,趙宇.礦井突水預(yù)測研究現(xiàn)狀及發(fā)展趨勢[J].中國礦業(yè),2009,18(1):88-90
[2]張自政,楊勇,等.模糊評價(jià)分類模型在礦井底板突水判別中的應(yīng)用[J].礦業(yè)安全與環(huán)保,2010,37(6):41-43
[3]張文泉.礦井底板突水災(zāi)害的動(dòng)態(tài)機(jī)理及綜合判測和預(yù)報(bào)軟件開發(fā)研究[D].青島:山東科技大學(xué),2004:164-166
[4]邱秀梅,王連國.煤層底板突水人工神經(jīng)網(wǎng)絡(luò)預(yù)測[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào),2002,33(1):62-65
[5]杜紅兵,王雪莉.基于主成分分析法的空管多指標(biāo)安全綜合評估研究[J].中國安全科學(xué)學(xué)報(bào),2009,19(7):124-128
[6]張文,陳劍平,秦勝武,等.基于主成分分析的FCM法在泥石流分類中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào),2010,40(2):368-372
[7]王英,黃容,段繼紅.基于主成分分析的重慶市房地產(chǎn)供求協(xié)調(diào)關(guān)系的研究[J].工程管理學(xué)報(bào),2012,26(5):089-093
[8]譚濤,任開春,等.模糊神經(jīng)網(wǎng)絡(luò)技術(shù)[J].重慶文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,30(1):71-74
[9]錢光耀,夏二勇,王滬陽,等.基于遺傳算法和小波神經(jīng)網(wǎng)絡(luò)的傳感器輸出擬合方法研究[J].計(jì)量技術(shù),2011(9):3-6
[10]王小川,史峰,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2013:288-289
[11]周潤景,張麗娜.基于MATLAB與fuzzyTECH的模糊與神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)[M].北京:電子工業(yè)出版社,2010:196-201
[12]周燕,王里奧.模糊神經(jīng)網(wǎng)絡(luò)在重慶市飲用水原水水質(zhì)評價(jià)中的應(yīng)用[J].三峽環(huán)境與生態(tài),2010,3(1):33-35
[13]許國根,賈瑛.模式識(shí)別與智能計(jì)算的MATLAB實(shí)現(xiàn)[M].北京:北京航空航天大學(xué)出版社,2012:175-180
[14]陳果,周伽.小樣本數(shù)據(jù)的支持向量機(jī)回歸模型參數(shù)及預(yù)測區(qū)間研究[J].計(jì)量學(xué)報(bào),2008,29(1):92-96