雷 萌,李 翠,王 鑫,陳瑞成
(中國礦業(yè)大學(xué) 信息與電氣工程學(xué)院,江蘇 徐州 221116)
基于模糊聚類徑向基神經(jīng)網(wǎng)絡(luò)的煤質(zhì)分析模型
雷 萌,李 翠,王 鑫,陳瑞成
(中國礦業(yè)大學(xué) 信息與電氣工程學(xué)院,江蘇 徐州 221116)
為了實現(xiàn)煤炭指標(biāo)的快速智能預(yù)測,建立了基于模糊聚類的徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)預(yù)測模型,將已測定的收到基全水、收到基灰分、收到基揮發(fā)分和收到基全硫的含量作為分類指標(biāo)進行模糊聚類,根據(jù)分類結(jié)果分別建立了基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的定量分析模型,對干燥無灰基揮發(fā)分、空干基全硫、收到基低位發(fā)熱量和空干基高位發(fā)熱量進行了預(yù)測,并與直接使用徑向基神經(jīng)網(wǎng)絡(luò)模型進行比較。結(jié)果表明,該分析模型不僅精度高,且泛化能力強,魯棒性好。
煤質(zhì)分析;分類指標(biāo);模糊聚類;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò);定量分析模型
煤炭作為一種重要的化石能源,其質(zhì)量的優(yōu)劣對煤炭資源的生產(chǎn)、加工和應(yīng)用有著極大影響,從而使得煤質(zhì)分析工作顯得尤為必要。 在實際生產(chǎn)加工過程中,通常采用工業(yè)分析和發(fā)熱量等指標(biāo)來研究煤的性質(zhì)和組成[1-2]。根據(jù)文獻[1],反映煤質(zhì)的主要指標(biāo)有全水、灰分、揮發(fā)分、全硫、高位發(fā)熱量及低位發(fā)熱量,其中高位發(fā)熱量可以采用氫彈量熱法測得,低位發(fā)熱量可以根據(jù)相關(guān)指標(biāo)采用公式計算得到。對于上述指標(biāo),如果采用傳統(tǒng)的煤質(zhì)化驗方法測得,則煤質(zhì)分析的過程繁瑣,分析時間較長,需要消耗大量的人力和物力,且無法實時反饋煤炭的質(zhì)量情況,具有一定局限性[3]。
由于煤炭的工業(yè)分析指標(biāo)存在復(fù)雜的對應(yīng)關(guān)系[4],因此可以根據(jù)部分指標(biāo)推算得到剩余指標(biāo)。例如:文獻[5]介紹了一種利用粒子群優(yōu)化算法進行煤炭發(fā)熱量的預(yù)測;文獻[6]介紹了一種基于機器學(xué)習(xí)的煤質(zhì)近紅外光譜分析的方法。文章利用模糊聚類的方法,將已測定的收到基全水、收到基灰分、收到基揮發(fā)分和收到基全硫的含量作為分類指標(biāo),對數(shù)據(jù)進行分類,并根據(jù)分類結(jié)果分別建立徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測模型,實現(xiàn)了干燥無灰基揮發(fā)分、空氣干燥基全硫、收到基低位發(fā)熱量和空氣干燥基高位發(fā)熱量的快速預(yù)測。
模糊聚類是按照一定的規(guī)則來對事物進行區(qū)分和分類的過程,在這個過程中沒有任何關(guān)于分類的先驗知識的指導(dǎo),僅據(jù)事物屬性的相似性作為類別劃分的依據(jù),它屬于無監(jiān)督的范疇。模糊聚類就是用數(shù)學(xué)的方法研究和處理給定對象的分類[7]。
模糊聚類的數(shù)學(xué)模型是使用數(shù)學(xué)語言及表達式對模糊聚類進行描述[8-9]。設(shè)樣本集X={x1,x2,…,xn},它的每一個對象xk(k=1,2,…,n)有特征向量P(xk)=(xk1,xk2,…,xkn),其中xki是xk第i個特征上的值。聚類分析即為分析數(shù)據(jù)集X中的n個樣本所對應(yīng)的特征向量間的相似性問題,按照樣本間的相似性關(guān)系,將樣本分成不相交的子集X1,X2,…,XC,該子集滿足條件:
X=X1∪X2∪……∪XC,
Xi∪Xj=Φ(1≤i≤j≤C)。
樣本點xk(k=1,2,…,n)對子集X1,X2,…,XC的隸屬關(guān)系可表示為:
(1)
模糊聚類的方法一般可分為以下幾種:譜系聚類方法、基于等價關(guān)系的聚類方法、基于圖論的聚類方法和基于目標(biāo)函數(shù)的聚類方法[10]。本研究主要采用譜系聚類法對樣本進行分類。
徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)是一種兩層神經(jīng)網(wǎng)絡(luò),其隱含層的激活函數(shù)是高斯函數(shù),輸出層的激活函數(shù)是線性函數(shù)。由于高斯函數(shù)具有局部化接收輸入信息的特點,所以RBF神經(jīng)網(wǎng)絡(luò)具有較強的局部映射能力,并且泛化能力較好,學(xué)習(xí)收斂速度很快,在非線性函數(shù)逼近、系統(tǒng)建模和模式識別等領(lǐng)域應(yīng)用較為廣泛。
隱含層第j個節(jié)點的輸出為:
(2)
式中:u1,j為隱含層第j個節(jié)點的輸出;x為n維輸入向量;w1,j為隱含層第j個高斯函數(shù)的中心;σ2j是反映第j個高斯函數(shù)的寬度;N1是隱含層的節(jié)點數(shù)。
輸出層第i個節(jié)點的輸出為:
yi=wT2,iu1(i=1,2,…,N2),
(3)
式中:yi為輸出層第i個節(jié)點的輸出;w2,i為隱含層指向輸出層第i個節(jié)點的權(quán)值向量;u1為隱含層的輸出向量;N2是輸出層的節(jié)點數(shù)。
由隱含層和輸出層節(jié)點的輸出表達式可以看出,RBF神經(jīng)網(wǎng)絡(luò)有三類可調(diào)參數(shù),分別為高斯函數(shù)的中心w1,i和寬度σ2i以及隱含層和輸出層之間的連接權(quán)值w2,i。RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)就是以上三個參數(shù)的整定。1989年,Moody和Darken提出了一種由兩個階段組成的混合學(xué)習(xí)過程的思路[11]。兩個階段分別為:
(1)根據(jù)所有輸入樣本信息,利用聚類方法進行隱含層徑向基函數(shù)(高斯函數(shù))中心和寬度的學(xué)習(xí),屬于無導(dǎo)師學(xué)習(xí)方法,常采用K均值聚類算法[12]。
(2)根據(jù)給定的訓(xùn)練樣本,利用有導(dǎo)師學(xué)習(xí)算法調(diào)整隱含層節(jié)點和輸出節(jié)點之間的連接權(quán)值,一般采用基于Delta學(xué)習(xí)規(guī)則的最小均方算法[13]。
利用譜系聚類的方法,將樣本中收到基全水分Mt(%)、收到基灰分Aar(%)、收到基揮發(fā)分Var(%)和收到基全硫St,ar(%)的含量作為分類指標(biāo),建立煤質(zhì)成分數(shù)據(jù)分類模型,將樣本進行分類。
煤質(zhì)成分數(shù)據(jù)分類模型建立步驟:①樣本數(shù)據(jù)集X={x1,x2,…,xn}中的n個樣本點各自成為一類,計算任意兩個樣本點間的距離;②計算各類中的距離的最小值,如果兩類中的距離值最小,則兩類歸為一類,并由此建立新的分類;③計算合并后的新類別之間的距離值,此距離的計算準(zhǔn)則要和上步驟中計算距離的準(zhǔn)則一樣;④重復(fù)計算距離并合并類,一直將各類樣本歸為一類為止;⑤設(shè)置分類數(shù)目,將給定的樣本集合劃分成不同的類別[14]。
根據(jù)模糊聚類得到的分類結(jié)果,分別建立每一組樣本的RBF神經(jīng)網(wǎng)絡(luò)模型,輸入變量為收到基全水Mt(%)、收到基灰分Aar(%)、收到基揮發(fā)分Var(%)和收到基全硫St,ar(%);輸出變量為干燥無灰基揮發(fā)分Varf(%)、空干基全硫St,ad(%)、收到基低位發(fā)熱量Qnet,v,ar(kcal/kg)和干燥基高位發(fā)熱量Qgr,v,d(kcal/kg)。
RBF神經(jīng)網(wǎng)絡(luò)模型建立步驟:①初始化高斯函數(shù)的中心和寬度以及隱含層和輸出層的連接權(quán)值;②選擇均方誤差作為適應(yīng)度函數(shù)訓(xùn)練網(wǎng)絡(luò);③利用測試集樣本驗證RBF網(wǎng)絡(luò)的性能。
根據(jù)國家標(biāo)準(zhǔn)[15],利用水分快速測定儀、灰分爐、揮發(fā)份爐、量熱儀、天平和干燥箱等設(shè)備測量煤炭樣本的收到基全水、收到基灰分、收到基揮發(fā)分、收到基全硫、干燥無灰基揮發(fā)分、空氣干燥基全硫、低位發(fā)熱量和干燥基高位發(fā)熱量[1]。所有測定指標(biāo)的精度均滿足相應(yīng)國家標(biāo)準(zhǔn)的要求,為預(yù)測模型提供了高可靠性的學(xué)習(xí)數(shù)據(jù)。
隨機抽取160組數(shù)據(jù)進行分類,選取收到基全水、收到基灰分、收到基揮發(fā)分、收到基全硫作為分類指標(biāo),將數(shù)據(jù)分為兩類。模糊聚類分類模型的參數(shù)設(shè)置如下:樣本點距離采用歐氏距離d(xi,xj),類間距離采用類平均距離Dpq,分類數(shù)為2。d(xi,xj)和Dpq計算公式如下:
(4)
(5)
式中:xi、xj為兩個樣本點;p為樣本容量;d(xi,xj)為兩個樣本點之間的距離;Gp、Gq為兩類不同的樣本;np、nq分別為各類樣本的樣本點數(shù)量;Dpq為類平均距離。
經(jīng)過仿真,得到前30個樣本點的譜系聚類圖,橫坐標(biāo)表示每個樣本點,縱坐標(biāo)表示樣本點之間的距離,如圖1所示。圖1描述了樣本按距離準(zhǔn)則的聚集過程。
圖1 譜系聚類圖
模糊聚類的結(jié)果是:樣本被分為兩組,分別取名為樣本1和樣本2,樣本1容量為69,樣本2容量為91。每個樣本分別作為下一步驟中徑向基網(wǎng)絡(luò)預(yù)測模型的樣本集。
從樣本1中抽取60組樣本點作為訓(xùn)練集,8組樣本點作為測試集。建立RBF網(wǎng)絡(luò)模型,RBF網(wǎng)絡(luò)模型參數(shù)通過迭代法得到,參數(shù)設(shè)置結(jié)果如表1所示。
按照表1中設(shè)置的參數(shù),使用MATLAB軟件進行仿真。圖2為樣本1各指標(biāo)徑向基網(wǎng)絡(luò)建立的訓(xùn)練過程,其中:圖2(a)為干燥無灰基揮發(fā)分訓(xùn)練過程,圖2 (b)為收到基低位發(fā)熱量訓(xùn)練過程,圖2 (c)為空干基全硫訓(xùn)練過程,圖2 (d)為空干基高位發(fā)熱量訓(xùn)練過程。從圖2中可看出,各指標(biāo)的訓(xùn)練過程在30步以內(nèi)均能完成,最終誤差小于0.000 4,即在設(shè)置的目標(biāo)誤差之下。
表1 迭代法得到的RBF網(wǎng)絡(luò)模型參數(shù)
圖2 樣本1各指標(biāo)訓(xùn)練過程
按照表1中設(shè)置的參數(shù),使用MATLAB軟件進行仿真。圖3為樣本1各指標(biāo)徑向基網(wǎng)絡(luò)建立的訓(xùn)練過程。從圖3中可看出,各指標(biāo)的訓(xùn)練過程在30步以內(nèi)均能完成,最終誤差小于0.000 4,即在設(shè)置的目標(biāo)誤差之下。選取的評價指標(biāo)為相對誤差Eri,同時為了更好地觀察同一徑向基網(wǎng)絡(luò)的總體性誤差,定義一個標(biāo)準(zhǔn)誤差Emsr,其中Eri和Emsr計算公式如下:
(6)
(7)
式中:pi表示測試值;ti表示真實值;Eri表示相對誤差;Emsr為反映總體性的標(biāo)準(zhǔn)誤差;N表示每個樣本點的包含的指標(biāo)數(shù)量。
通過進行了8次仿真實驗得到了各類誤差結(jié)果。表2為該樣本的干燥無灰基揮發(fā)分、空氣干燥基全硫、收到基低位發(fā)熱量和空干基高位發(fā)熱量的相對誤差Er1、Er2、Er3、Er4,以及根據(jù)這四項指標(biāo)計算的反映總體性的標(biāo)準(zhǔn)誤差Emsr。從表2中可以看出,各指標(biāo)的相對誤差均較小,總體誤差在0.005~0.025之間。
表2 樣本1四項指標(biāo)相對誤差與總體的標(biāo)準(zhǔn)誤差
從樣本2中抽取60組樣本點作為訓(xùn)練集,8組樣本點作為測試集,建立RBF網(wǎng)絡(luò)模型,參數(shù)設(shè)置與樣本1相同。圖3為樣本2各指標(biāo)徑向基網(wǎng)絡(luò)建立的訓(xùn)練過程,圖3 (a)為干燥無灰基揮發(fā)分訓(xùn)練過程,圖3 (b)為收到基低位發(fā)熱量訓(xùn)練過程,圖3 (c)為空氣干燥基全硫訓(xùn)練過程,圖3 (d)為空氣干燥基高位發(fā)熱量訓(xùn)練過程。從圖3可以看出,和樣本1相似,訓(xùn)練網(wǎng)絡(luò)在30步以內(nèi)也可以達到目標(biāo)誤差。
圖3 樣本2各指標(biāo)訓(xùn)練過程
建立樣本2的訓(xùn)練網(wǎng)絡(luò),對測試樣本進行測試,可得到各指標(biāo)相對誤差和標(biāo)準(zhǔn)誤差,如表3所示。從表3數(shù)據(jù)可看出,樣本2建立的RBF預(yù)測模型,預(yù)測誤差略大,但也在允許范圍內(nèi)。
對抽取的160組樣本數(shù)據(jù)不做聚類處理,從中隨機抽取60組樣本點作為訓(xùn)練集,8組樣本點作為測試集,建立RBF網(wǎng)絡(luò)預(yù)測模型,參數(shù)設(shè)置不變。在同一張圖上繪制不分類和分類后樣本1與樣本2的標(biāo)準(zhǔn)誤差,如圖4所示。
表3 樣本2四項指標(biāo)相對誤差與總體的標(biāo)準(zhǔn)誤差
圖4 樣本1、2與不分類樣本的總體標(biāo)準(zhǔn)誤差
從圖4可以明顯看出,不進行模糊聚類,預(yù)測誤差遠大于分類后的預(yù)測誤差。因此得出如下結(jié)論:基于模糊聚類的RBF網(wǎng)絡(luò)預(yù)測模型比僅僅使用RBF網(wǎng)絡(luò)預(yù)測模型的預(yù)測更加準(zhǔn)確,效果更好。
煤質(zhì)分析在煤炭資源的生產(chǎn)、加工和利用中起著至關(guān)重要的作用,因此尋找一種預(yù)測精度更高的煤質(zhì)指標(biāo)分析預(yù)測模型尤為必要。實驗證明,基于模糊聚類的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測模型對干燥無灰基揮發(fā)分、空氣干燥基全硫、收到基低位發(fā)熱量和空干基高位發(fā)熱量等煤質(zhì)指標(biāo)的預(yù)測較為準(zhǔn)確,為實現(xiàn)煤質(zhì)智能分析系統(tǒng)的設(shè)計提供了一種預(yù)測精度高的新模型。
[1] 張雙全, 吳國光. 煤化學(xué)[M].徐州:中國礦業(yè)大學(xué)出版社, 2004.
[2] 龔利華,劉廣新.用工業(yè)分析數(shù)據(jù)預(yù)測煤炭發(fā)熱量[C]. 工業(yè)技術(shù)委員會地質(zhì)分會/中國煤炭學(xué)會礦井地質(zhì)專業(yè)委員會2001年學(xué)術(shù)年會論文集.福建:煤炭工業(yè)技術(shù)委員會地質(zhì)分會、中國煤炭學(xué)會礦井地質(zhì)專業(yè)委員會,2001:118-120.
[3] 施玉英.煤炭分析試驗儀器設(shè)備的使用與維修[M].北京:煤炭工業(yè)出版社,2007.
[4] 江文豪,韋紅旗,屈天章,等.基于遺傳算法優(yōu)化參數(shù)的支持向量機燃煤發(fā)熱量預(yù)測[J].熱力發(fā)電,2011(3):14-19.
[5] 王建軍,王世營,雷 萌.粒子群優(yōu)化算法在煤炭發(fā)熱量中的應(yīng)用[J].工礦自動化,2012(5):50-53.
[6] 雷 萌.基于機器學(xué)習(xí)的煤質(zhì)近紅外光譜分析[D].徐州:中國礦業(yè)大學(xué),2013.
[7] 高新波.模糊聚類分析及其應(yīng)用[M].西安:電子科技大學(xué)出版社,2004.
[8] 李晶皎,朱志良,王愛俠.模式識別(第二版)[M].北京:電子工業(yè)出版社,2004.
[9] 葉海軍. 模糊聚類分析技術(shù)及其應(yīng)用研究[D]. 合肥:合肥工業(yè)大學(xué),2006.
[10] 汪慶淼. 基于目標(biāo)函數(shù)的模糊聚類新算法及其應(yīng)用研究[D].鎮(zhèn)江:江蘇大學(xué), 2014.
[11] 鞏敦衛(wèi),孫曉燕.智能控制技術(shù)簡明教程[M].北京:國防工業(yè)出版社,2010.
[12] 張 彬.基于聚類算法的RBF神經(jīng)網(wǎng)絡(luò)設(shè)計綜述[J].綜述與評論,2012,31(12):1-7.
[13] 張 艷.基于RBF網(wǎng)絡(luò)辨識的模型參考自適應(yīng)控制系統(tǒng)分析與仿真[D].西安:西安交通大學(xué),2007.
[14] 葉海軍.模糊聚類分析技術(shù)及應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2006.
[15] GB/T 213—2008煤的發(fā)熱量測定方法[S].
Coal assay analytical model based on fuzzy clustering RBF Neural Network
LEI Meng, LI Cui, WANG Xin, CHEN Rui-cheng
(School of Information and Electrical Engineering, China University of Mining and Technology, Xuzhou, Jiangsu 221116, China)
To achieve rapid and intelligent prediction of coal quality, a radial basis function (RBF) neural network prediction model based on fuzzy clustering was established. Based on measured contents of total moisture of as
basis, ash of as received basis, volatile matter of as received basis and total sulfur of as received basis in coal, fuzzy clustering was made; according to the results, several quantitative analytical models RBF based on neural network were established. The model can predict volatile matter of dry ash-free basis, total sulfur of air dried basis, low calorific value of as received basis and gross calorific value of dry basis in coal. And the comparison between the model and the direct use of RBF neural network model was made. The experimental results showed that the analytical model has high precision, strong generalization ability and good robustness.
coal assay; classification index;fuzzy cluster; RBF neural network; quantitative analytical modeling
TQ533
A
1001-3571(2015)04-0010-05
2015-04-09
10.16447/j.cnki.cpt.2015.04.003
江蘇省自然科學(xué)基金(BK20140215);中國博士后基金(2014M551695)
雷 萌(1987—),女,安徽省碭山市人,講師,博士,從事機器學(xué)習(xí)、煤質(zhì)智能在線分析等方面研究。
E-mail:leimengniee@163.com Tel:15895208707