[摘 要]本文應(yīng)用模糊綜合評價法得到煤礦本質(zhì)安全等級和指標(biāo)體系,應(yīng)用模糊聚類算法確定主關(guān)鍵條件屬性集,使用模糊數(shù)據(jù)挖掘出評估對象中煤礦本質(zhì)安全等級同評估指標(biāo)之間的規(guī)則知識,以一個實(shí)例為對象建立的煤礦本質(zhì)安全模糊數(shù)據(jù)挖掘驗證了該方法的可行性。[關(guān)鍵詞]煤礦本質(zhì)安全;模糊數(shù)據(jù)挖掘;模糊聚類
doi:10.3969/j.issn.1673-0194.2009.12.026
[中圖分類號]F270.7;F224.0;TP311.5[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2009)12-0073-05
數(shù)據(jù)挖掘可以揭示出非常有價值的信息,而這些信息不是通過一般的查詢所能察覺到的。但是數(shù)據(jù)倉庫的容量越大,系統(tǒng)復(fù)雜性越高,相應(yīng)的精確度就越低, 也就是說模糊性越強(qiáng), 因而僅僅靠復(fù)雜算法和推理并不能完全發(fā)現(xiàn)知識,而且單純的數(shù)據(jù)挖掘可能會
導(dǎo)致“尖銳邊界”等問題。因此,本文考慮將由模糊算法和數(shù)據(jù)挖掘結(jié)合起來的模糊數(shù)據(jù)挖掘技術(shù)引入到煤礦本質(zhì)安全評價系統(tǒng)中。
1 煤礦本質(zhì)安全模糊綜合評價模型
煤礦本質(zhì)安全管理綜合評價指標(biāo)體系涉及人、機(jī)、環(huán)境、管理四大單元,評價對象的某些評價因子往往帶有一定程度的模糊性,即具有非線性特征。它沒有十分明確的界限和清楚的外延,不存在絕對的十分精確的肯定與否定。煤礦本質(zhì)安全管理具有不確定性因素多,模糊性大,動態(tài)變化復(fù)雜等特性,人們的認(rèn)識不同,對這些因素的褒貶程度也不盡相同,很難直接用統(tǒng)計學(xué)的方法確定這些因素的具體數(shù)值。
模糊綜合評價法在利用評價矩陣計算各指標(biāo)的隸屬度時,取評價指標(biāo)與隸屬度的乘積的最大值,采用這樣的方式有可能會丟失評價信息。此外,此評價結(jié)果得到的只是各級別的評價結(jié)果的隸屬度,評價結(jié)果不夠直觀。因此,對此算法進(jìn)行了改進(jìn),在利用評價矩陣計算各指標(biāo)的隸屬度時,按矩陣運(yùn)算的方法進(jìn)行。對于最后得到的評價結(jié)果的隸屬度進(jìn)行量化,得到直觀的評價值。這樣能極大限度地保留原始的評價信息,并通過了隸屬度的量化,讓評價結(jié)果更加直觀。改進(jìn)的模糊綜合評價法的具體實(shí)現(xiàn)方法如下:
步驟1:確定評價因素集。
在表1層次中,分別用t1,t2,t3,t4來表示人員的不安全因素、機(jī)具的不安全因素、環(huán)境的不安全因素、管理的不安全因素,則得評價因素集T={t1,t2,t3,t4}。類似地,在分指標(biāo)層中分別用u101,u102,…,u412,u413來表示操作不安全性,現(xiàn)場指揮的不安全性,…,沒有有效的本質(zhì)安全文化,其他管理的不安全因素,則得評價因素集U={u101,u102,…,u412,u413}。
確定指標(biāo)集對應(yīng)的權(quán)重集Q={q1,q2,…,qm},按照層次分析法和BP網(wǎng)絡(luò)法,求得了各指標(biāo)和分指標(biāo)的權(quán)重。再求其平均值,就得到各指標(biāo)和分指標(biāo)的綜合權(quán)重,如表1所示。
步驟2:確定評語集。
對指標(biāo)采用5級評語:煤礦本質(zhì)安全管理Ⅰ(v1)、煤礦本質(zhì)安全管理Ⅱ(v2)、煤礦本質(zhì)安全管理Ⅲ(v3)、煤礦本質(zhì)安全管理Ⅳ(v4)和非煤礦本質(zhì)安全管理(v5)五個檔次,并用評語集V={v1,v2,v3,v4,v5}表示。
確定評語集對應(yīng)的數(shù)值集N={n1,n2,n3,n4,n5}。
步驟3:建立隸屬函數(shù),確定隸屬度。
構(gòu)造隸屬度子集Ri={ri1,ri2,ri3,ri4,ri5},其中:ri(i=1,2,…,m)指評價因素集中第i個指標(biāo)對應(yīng)評語集中每個v1,v2,v3,v4,v5的隸屬度。
根據(jù)指標(biāo)的不同性質(zhì),隸屬函數(shù)分為兩種情況:定量指標(biāo)的評價和定性指標(biāo)的評價。
(1)定量指標(biāo)的單因素評價隸屬函數(shù)。
ui的取值范圍與評語集vj相對應(yīng)的5個區(qū)間(-∞,60] 、(60,70] 、(70,80] 、(80,90] 、(90,∞] 。若將ui看成是某個區(qū)間上的普通集合,則會造成兩個區(qū)間邊緣點(diǎn)數(shù)值相差不大,而評語相差一個級別的不合理現(xiàn)象,為了消除這種不合理現(xiàn)象需作模糊化處理。具體做法是:設(shè)在中間區(qū)間的中點(diǎn)其隸屬函數(shù)取最大值1,而在相鄰兩區(qū)間的中點(diǎn)其隸屬函數(shù)取最小值0,連接1與0,得ui對評語等級vj的隸屬函數(shù)μvj(ui)。
(2)定性指標(biāo)的單因素評價隸屬函數(shù)。
對于定性指標(biāo)的單因素評價較難以量化,常采用模糊統(tǒng)計的方法。即讓參與評價的各位專家按預(yù)先劃定的評價標(biāo)準(zhǔn)給各評價因素劃分等級,然后依次統(tǒng)計各評價因素屬于等級vj的頻數(shù)Mij,其隸屬函數(shù)如下:
μvj(ui)=Mijn
其中:Mij是u1∈v1的次數(shù);n是參與評價的專家人數(shù);μvj(ui)是隸屬函數(shù)。
為指標(biāo)ui的單因素評價,它是評語集V上的模糊子集。
步驟4:計算評價矩陣。
對于每一個評價指標(biāo)ti都可以得到一個隸屬度子集Ri,那么m個Ri構(gòu)成一個T×V域上的
計算T的用隸屬度表示的評判值:
步驟6:如還有上一級評價指標(biāo),則用下一級求得的所有評判值S構(gòu)成新的評價矩陣R,并重復(fù)步驟4和步驟5,直至最高一級,則可得到模糊綜合評價的結(jié)果S。
步驟7:利用
S×N=(S1,S2,…,s5)
n1n2n5
,可以得到模糊綜合評價的量化結(jié)果。
2 模糊數(shù)據(jù)挖掘
中國的煤礦經(jīng)過幾十年的安全管理和生產(chǎn)肯定有海量的安全評價數(shù)據(jù),這些數(shù)據(jù)已經(jīng)成為煤礦管理部門管理和決策的寶貴資源,從這些數(shù)據(jù)中發(fā)現(xiàn)有價值的信息成為一項非常艱巨的任務(wù)。實(shí)際上,在挖掘過程中要想把這些數(shù)據(jù)精確地分類是不可能的,也沒有必要?,F(xiàn)實(shí)的分類往往伴隨著模糊性,所以用模糊理論來進(jìn)行聚類分析,然后再進(jìn)行預(yù)測,會顯得更自然,更符合客觀現(xiàn)實(shí)。這就是本文提到的模糊數(shù)據(jù)挖掘。對煤礦本質(zhì)安全評價數(shù)據(jù)倉庫的不同層次進(jìn)行不同規(guī)則的推斷,以得出對決策有用的規(guī)則,有利于領(lǐng)導(dǎo)的決策。運(yùn)用模糊理論來進(jìn)行數(shù)據(jù)挖掘的具體步驟如下。
在搜集了大量煤礦本質(zhì)安全數(shù)據(jù)資料的情況下,建立待分類的樣本集U,把要分類的對象稱為樣本如
,則U=u1,u2,u3,…,un為樣本集。具體定性本質(zhì)安全評價指標(biāo)量化后的屬性數(shù)據(jù)稱為樣本指標(biāo),設(shè)有m項指標(biāo),這可用m維向量描述樣本,用集合表示為:
u1=(xi1,xi2,xi3,…,xim)
,得到原始數(shù)據(jù)矩陣為
,由于采集到的數(shù)據(jù)往往不是[0,1] 閉區(qū)間的數(shù)據(jù),根據(jù)模糊矩陣的要求,通過下面兩個公式將數(shù)據(jù)變換壓縮到區(qū)間[0,1] 上。
(1)平移標(biāo)準(zhǔn)差變換。
x′ik=xik-xksk(i=1,2,…,n;k=1,2,…,m)(1)
是平均值。此時得到的標(biāo)準(zhǔn)化數(shù)據(jù)x′ik也不一定全在[0,1] 閉區(qū)間之內(nèi),還必須進(jìn)行下面的變換。
(2)平移極差變換。
2.2 建立模糊相似矩陣
標(biāo)出衡量被分類對象間相似程度的統(tǒng)計量。設(shè)論域U={u1,u2,u3,…,un},其中每個元素為一個樣本,建立U上的模糊相似矩陣:
計算rij的方法很多,在這里采用夾角余弦法,即:
2.3 聚類分析
常用聚類分類有3種方法:傳遞閉包法、最大樹方法和編網(wǎng)法。傳遞閉包法用計算機(jī)容易實(shí)現(xiàn),本文用平方法依次求:
R→R2→R4→…
,當(dāng)?shù)谝淮纬霈F(xiàn)Rk#8226;Rk=Rk時,Rk就是模糊相似矩陣 R的傳遞閉包t(R),即t(R)=Rk。再讓λ由大變到小,就可形成動態(tài)聚類圖。
3 應(yīng)用研究
3.1 評價指標(biāo)體系的建立
煤礦本質(zhì)安全管理是指在一定經(jīng)濟(jì)技術(shù)條件下,在煤礦全生命周期過程中對系統(tǒng)中已知規(guī)律的危險源進(jìn)行預(yù)先辨識、評價、分級,進(jìn)而對其進(jìn)行消除、減小、控制,實(shí)現(xiàn)煤礦人-機(jī)-環(huán)境系統(tǒng)的最佳匹配,使事故降低到人們期望值和社會可接受水平的風(fēng)險管理措施與辦法。本質(zhì)安全管理的重點(diǎn)是對危險源的管理,對其辨識過程應(yīng)考慮人、機(jī)、環(huán)境、管理等4個方面的不安全因素。煤礦本質(zhì)安全評價二級指標(biāo)體系模型,如表1所示。
3.2 煤礦本質(zhì)安全的模糊數(shù)據(jù)挖掘
為探究煤礦本質(zhì)安全評估數(shù)據(jù)庫中評估等級同評估項目之間的規(guī)則知識,以及這些規(guī)則對煤礦本質(zhì)安全工作的影響,先選取中國某一產(chǎn)煤區(qū),采用現(xiàn)場調(diào)查和問卷調(diào)查方式對隨機(jī)抽取的10個煤礦2007年安全等級的評估進(jìn)行討論,找出評價指標(biāo)同安全等級之間的規(guī)則知識。為使問題簡單化,用上面的模糊綜合評價法編制的程序分別計算10個煤礦4項一級指標(biāo)的量化得分和煤礦安全評估等級,得到的數(shù)據(jù)如表2所示。
用F統(tǒng)計量確定最佳閾值λ≥0.711,此時關(guān)聯(lián)強(qiáng)度最大,得主條件屬性為{t1,t4}。其中,t1為人員的不安全因素,t4為管理的不安全因素??梢姡瑢τ诿旱V本質(zhì)安全評估數(shù)據(jù)庫經(jīng)過用模糊聚類方法進(jìn)行分析得出,對于煤礦安全等級T這一結(jié)論屬性而言,主條件屬性集為{t1,t4}。
下面用粗糙集知識來進(jìn)一步考察由主條件屬性集得到的分類規(guī)則。
基于安全等級這一結(jié)論屬性集T的記錄值,可將表2劃分為5類,分別用集合
當(dāng)mi(i=1,2,…,10)作為分類條件,Kj(j=1,2,3,4,5)作為分類結(jié)論條件時,歸納總結(jié)后可得如下的分類規(guī)則:
綜合以上4條規(guī)則分析如下:當(dāng)人不安全因素得分
t1≥90
時安全等級T一定為“本安Ⅰ”;人不安全因素t1得89~80分時安全等級T一定為“本安Ⅱ”;人不安全因素t1得79~70分時安全等級T一定為“本安Ⅲ”;人不安全因素t1得69~60分時安全等級T一定為“本安Ⅳ”。從以上分類規(guī)則可知人不安全因素(t1)為互信息最大的特征屬性。即凡是注重人不安全因素的煤礦,安全等級高,因此人不安全因素要放在煤礦本質(zhì)安全首位,即煤礦要以人為本,注意人的安全教育和培訓(xùn)等。
由于該地區(qū)為國家新興煤礦能源基地,煤礦生產(chǎn)裝備現(xiàn)代化水平較高,且該地區(qū)地質(zhì)條件簡單,水、瓦斯、煤塵等環(huán)境因素引起安全隱患較少,故在本質(zhì)安全評估指標(biāo)體系中,人不安全因素和管理不安全因素兩方面非常重要,每個煤礦都應(yīng)引起高度重視。顯然這與已有的研究成果和實(shí)際相吻合。
通過對煤礦本質(zhì)安全管理綜合評價,可以確定煤礦某一時期的安全生產(chǎn)狀況,用于指導(dǎo)下一時期的安全管理工作, 其結(jié)果可作為煤礦本質(zhì)安全管理評價的依據(jù), 可以改善目前的安全管理狀況。
4 結(jié)束語
本文使用模糊數(shù)據(jù)挖掘發(fā)現(xiàn)煤礦本質(zhì)安全等級同評價指標(biāo)之間的規(guī)則知識,依據(jù)該規(guī)則知識對挖掘結(jié)果進(jìn)行有效的評價,并且在分析、預(yù)測方面有著很大的優(yōu)勢,從而可以幫助煤礦管理決策者找到影響該地區(qū)煤礦安全的關(guān)鍵因素。
主要參考文獻(xiàn)
[1] 梁保松,曹殿立.模糊數(shù)學(xué)及其應(yīng)用[M] . 北京:科學(xué)出版社, 2007: 67-78.
[2]洪月華. 基于模糊綜合評價的課堂教學(xué)質(zhì)量數(shù)據(jù)挖掘[J] . 計算機(jī)科學(xué),2008, 35(2): 154-170.
[3]杜春宇,陳東科,杜翠鳳,等. 煤礦本質(zhì)安全管理綜合評價體系模型與應(yīng)用[J] . 重慶大學(xué)學(xué)報,2008, 31(2): 197-201.
[4]王金國. 構(gòu)建本質(zhì)安全型礦井對策研究[J] . 煤炭工程,2007(6): 8-10.