倪景峰,樂(lè)曉瑞,,常立峰,鄧立軍
(1.遼寧工程技術(shù)大學(xué) 安全科學(xué)與工程學(xué)院,遼寧 葫蘆島 125105; 2.遼寧工程技術(shù)大學(xué) 礦山熱動(dòng)力災(zāi)害與防治教育部重點(diǎn)實(shí)驗(yàn)室,遼寧 葫蘆島 125105; 3.山西瑞通路橋新技術(shù)有限公司,山西 太原 030000)
復(fù)雜通風(fēng)網(wǎng)絡(luò)故障診斷和風(fēng)速傳感器優(yōu)化布置是實(shí)現(xiàn)智慧礦山的關(guān)鍵技術(shù)之一,礦井通風(fēng)仿真系統(tǒng)的應(yīng)用與人工智能的蓬勃發(fā)展,使得礦井通風(fēng)智能故障診斷的實(shí)現(xiàn)成為可能。故障診斷系統(tǒng)的應(yīng)用具有較大的社會(huì)價(jià)值和經(jīng)濟(jì)效益,但目前故障診斷系統(tǒng)的研究較少[1-2]。
決策樹(shù)由心理學(xué)家和計(jì)算機(jī)科學(xué)家E.B.Hunt于1962年提出,其運(yùn)行速度快、魯棒性好、易擴(kuò)展到大型數(shù)據(jù)庫(kù)中、可嵌入式特征選擇等優(yōu)點(diǎn)使其廣泛應(yīng)用于醫(yī)療診斷、股票預(yù)測(cè)和目標(biāo)檢測(cè)等領(lǐng)域[3-4]。決策樹(shù)學(xué)習(xí)算法不僅可以構(gòu)建分類(lèi)和回歸故障診斷模型,還可以進(jìn)行嵌入式特征選擇,二者在同一過(guò)程中完成,是解決礦井通風(fēng)故障診斷與風(fēng)速傳感器優(yōu)化布置的最優(yōu)解決方案。
在礦井通風(fēng)故障智能診斷方面,劉劍等[5]將礦井風(fēng)門(mén)失效、巷道冒落變形、巷道堵塞、巷道掘進(jìn)延伸或報(bào)廢等現(xiàn)象稱(chēng)為通風(fēng)系統(tǒng)阻變型故障;郭欣[6]、姚志強(qiáng)[7]利用機(jī)器學(xué)習(xí)的方法對(duì)通風(fēng)網(wǎng)絡(luò)和管網(wǎng)進(jìn)行故障診斷,通過(guò)礦井通風(fēng)仿真系統(tǒng)建立阻變-風(fēng)量(風(fēng)壓)故障樣本,以分支編號(hào)作為分類(lèi)標(biāo)簽,阻變量作為回歸值,利用支持向量機(jī)對(duì)樣本進(jìn)行訓(xùn)練和分類(lèi)預(yù)測(cè),初步實(shí)現(xiàn)礦井通風(fēng)智能診斷。
在傳感器優(yōu)化布置方面,火源探測(cè)傳感器優(yōu)化布置[8]和瓦斯傳感器無(wú)盲區(qū)優(yōu)化布置[9]等研究相對(duì)成熟,但針對(duì)故障診斷的風(fēng)速傳感器優(yōu)化布置研究較少。趙丹等[10]、潘競(jìng)濤等[11]對(duì)角聯(lián)巷道傳感器位置優(yōu)化進(jìn)行研究,并在大明礦礦井通風(fēng)故障診斷系統(tǒng)中進(jìn)行實(shí)際布置實(shí)驗(yàn);劉劍等[12-13]在礦井通風(fēng)系統(tǒng)阻變型故障診斷及風(fēng)速傳感器位置優(yōu)化研究中提出 “掃帚模型”的傳感器布置方法;居銀銀[14]提出基于決策樹(shù)和特征選擇的神經(jīng)網(wǎng)絡(luò)釣魚(yú)網(wǎng)站檢測(cè)研究,通過(guò)特征選擇減少維度災(zāi)難,提高釣魚(yú)網(wǎng)站監(jiān)測(cè)能力?,F(xiàn)有的風(fēng)速傳感器優(yōu)化布置主要是通過(guò)計(jì)算巷道分支相關(guān)度來(lái)選擇傳感器布置地點(diǎn),本質(zhì)是過(guò)濾式特征選擇,未將診斷模型的性能作為傳感器布置評(píng)價(jià)標(biāo)準(zhǔn),難以滿(mǎn)足故障診斷系統(tǒng)需要與傳感器布置相匹配的實(shí)際要求。
鑒于此,本文提出1種嵌入式風(fēng)速傳感器優(yōu)化布置方法,構(gòu)建基于決策樹(shù)的智能故障診斷系統(tǒng),并在唐安礦進(jìn)行模擬實(shí)驗(yàn),該方法的步驟如下:
1)利用IMVS構(gòu)建唐安礦礦井通風(fēng)仿真系統(tǒng),通過(guò)改變巷道分支風(fēng)阻構(gòu)建空間數(shù)據(jù)集,地理位置靠近的巷道分支產(chǎn)生的故障對(duì)通風(fēng)系統(tǒng)的影響相似。
2)對(duì)空間數(shù)據(jù)集預(yù)處理,分別確定適合回歸和分類(lèi)的故障樣本集的無(wú)量綱化方式。通過(guò)比較ID3和分類(lèi)與回歸樹(shù)(CART)故障診斷準(zhǔn)確率,選擇更適合的決策樹(shù)模型。
3)對(duì)決策樹(shù)進(jìn)行剪枝處理,以獲得更優(yōu)復(fù)雜度的故障診斷模型,降低泛化誤差,提高準(zhǔn)確率。
4)設(shè)置對(duì)照實(shí)驗(yàn),確定風(fēng)速傳感器最優(yōu)布置數(shù)量及布置地點(diǎn),驗(yàn)證布置方法的有效性。
本文為礦井通風(fēng)故障診斷提供1種新的嵌入式風(fēng)速傳感器優(yōu)化布置及智能診斷方法,并通過(guò)唐安礦驗(yàn)證模型的有效性。其應(yīng)用可解決風(fēng)速傳感器布置與故障診斷模型不匹配的問(wèn)題,提高模型故障診斷準(zhǔn)確率。智能診斷系統(tǒng)能夠及時(shí)發(fā)現(xiàn)隱患,避免故障可能帶來(lái)更大的損失,提高煤礦智能化水平。
礦井通風(fēng)智能故障診斷系統(tǒng)主要由礦井通風(fēng)故障樣本集、故障位置分類(lèi)判斷模型、故障量回歸預(yù)測(cè)模型及風(fēng)速傳感器優(yōu)化布置4個(gè)方面構(gòu)成。
數(shù)據(jù)是故障診斷的基礎(chǔ),礦井通風(fēng)故障樣本集是由通風(fēng)網(wǎng)絡(luò)映射產(chǎn)生,具有空間自相關(guān)性[15]。保持唐安礦結(jié)構(gòu)及風(fēng)機(jī)動(dòng)力不變,改變巷道分支風(fēng)阻模擬通風(fēng)網(wǎng)絡(luò)阻變型故障,利用礦井通風(fēng)仿真系統(tǒng)IMVS[16]生成“阻變地點(diǎn)—阻變故障量—風(fēng)量”關(guān)系的空間數(shù)據(jù)集D。
將礦井通風(fēng)空間數(shù)據(jù)集不同規(guī)格的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一規(guī)格,能夠提高模型收斂速度和提升模型準(zhǔn)確率,避免某個(gè)取值范圍較大的特征對(duì)模型計(jì)算造成影響。其主要處理方式為數(shù)據(jù)歸一化和標(biāo)準(zhǔn)化[17]。不同的模型需要獨(dú)特的數(shù)據(jù)處理方式,不能脫離模型評(píng)價(jià)數(shù)據(jù)預(yù)處理方式的好壞。數(shù)據(jù)歸一化的公式如式(1)所示:
(1)
式中:x*為樣本數(shù)據(jù)歸一化值;x為樣本數(shù)據(jù);max(x)為樣本數(shù)據(jù)最大值;min(x)為樣本數(shù)據(jù)最小值。
數(shù)據(jù)標(biāo)準(zhǔn)化的公式如式(2)所示:
(2)
式中:x′為樣本數(shù)據(jù)標(biāo)準(zhǔn)化值;μ為樣本數(shù)據(jù)均值;σ為樣本數(shù)據(jù)標(biāo)準(zhǔn)差。
在構(gòu)建礦井通風(fēng)故障診斷模型之后,還需要對(duì)模型診斷性能進(jìn)行評(píng)估。礦井通風(fēng)故障位置判斷的目標(biāo)為盡可能正確地診斷故障地點(diǎn),因此需對(duì)模型使用故障診斷準(zhǔn)確率進(jìn)行度量,其計(jì)算如式(3)所示:
(3)
式中:Accuracy為故障診斷準(zhǔn)確率;M為模型正確分類(lèi)樣本個(gè)數(shù);m為故障位置診斷所有樣本數(shù)。
故障量回歸預(yù)測(cè)的目標(biāo)為使預(yù)測(cè)值與真實(shí)值盡可能接近,因此使用均方誤差對(duì)模型進(jìn)行度量,如式(4)所示:
(4)
決策樹(shù)是1個(gè)有向無(wú)環(huán)圖,其用樹(shù)狀圖的結(jié)構(gòu)來(lái)呈現(xiàn)通風(fēng)網(wǎng)絡(luò)故障診斷規(guī)則,以解決故障位置分類(lèi)判斷和故障量回歸預(yù)測(cè)問(wèn)題[18]。礦井通風(fēng)故障診斷的決策樹(shù)模型如圖1所示。由圖1可知,1棵決策樹(shù)包含1個(gè)根結(jié)點(diǎn)Q1,表示監(jiān)測(cè)風(fēng)量,若干對(duì)應(yīng)測(cè)試特征的內(nèi)部結(jié)點(diǎn)Q2和若干對(duì)應(yīng)故障位置和故障量結(jié)果的葉結(jié)點(diǎn)ei,樹(shù)杈表示對(duì)特征的1次劃分;v表示決策樹(shù)劃分時(shí)選擇的風(fēng)量。
圖1 礦井通風(fēng)故障診斷的決策樹(shù)模型Fig.1 Decision tree model for fault diagnosis of mine ventilation
風(fēng)速傳感器優(yōu)化布置的核心是從所有巷道分支中確定最適合布置傳感器的地點(diǎn)和最優(yōu)布置數(shù)量,即利用最少的特征達(dá)到最優(yōu)的分類(lèi)和回歸效果[19],嵌入式傳感器布置原理如下:
1)決策樹(shù)每次分枝均會(huì)選擇對(duì)信息熵或基尼系數(shù)影響大的特征,因此,在決策樹(shù)模型中選擇排序靠前的特征是對(duì)分類(lèi)、回歸模型影響較大的特征,該特征即為傳感器布置巷道分支。
通過(guò)信息增益為準(zhǔn)則來(lái)選擇劃分特征的決策樹(shù)稱(chēng)為ID3[20],空間數(shù)據(jù)集D的信息熵Ent(D)定義為式(5),Ent(D)的值越小,則數(shù)據(jù)集D的純度越高。
(5)
式中:D為空間數(shù)據(jù)集;k為1,2,…,|y|;pk為第k類(lèi)樣本所占的比例。
以基尼指數(shù)作為劃分特征標(biāo)準(zhǔn)的決策樹(shù)稱(chēng)為CART,Gini(D)反應(yīng)從數(shù)據(jù)集D中隨機(jī)抽取2個(gè)樣本,其類(lèi)別標(biāo)記不一樣的概率,Gini(D)越小,則數(shù)據(jù)集的純度越高??臻g數(shù)據(jù)集D的純度用基尼值表示的計(jì)算如式(6)所示:
(6)
式中:K為樣本的總類(lèi)別;Gini(D)為樣本集D的基尼值。
2)將選擇的巷道分支代入到模型中,權(quán)衡模型故障診斷準(zhǔn)確率與風(fēng)速傳感器數(shù)量的關(guān)系,選擇最優(yōu)布置數(shù)量。
嵌入式風(fēng)速傳感器優(yōu)化布置方法將特征選擇與故障診斷訓(xùn)練在同一個(gè)算法中進(jìn)行,有效地解決模型與特征選擇不匹配的問(wèn)題[21]。風(fēng)速傳感器優(yōu)化布置不僅能夠降低監(jiān)測(cè)成本,提高傳感器利用率,還是降低數(shù)據(jù)維度、避免維度災(zāi)難重要手段。
唐安煤礦坐落于山西省高平市馬村鎮(zhèn)唐西村西,占地50萬(wàn)m2,可采資源儲(chǔ)量約1.4億t,巷道分支數(shù)n=88,其中13處巷道分支安設(shè)通風(fēng)調(diào)節(jié)設(shè)施,原始參數(shù)情況下,風(fēng)機(jī)工況點(diǎn)的風(fēng)機(jī)風(fēng)量和網(wǎng)絡(luò)風(fēng)阻分別為107 m3/s,1 874 Pa,構(gòu)建唐安礦空間數(shù)據(jù)集的步驟為:
1)對(duì)唐安礦通風(fēng)系統(tǒng)進(jìn)行普查,其內(nèi)容包括記錄巷道、掘進(jìn)工作面、采煤工作面、構(gòu)筑物的參數(shù)和主要結(jié)點(diǎn)標(biāo)高。
2)對(duì)唐安礦礦井通風(fēng)系統(tǒng)進(jìn)行阻力測(cè)定,確定各段巷道的實(shí)際風(fēng)量、風(fēng)阻和阻力系數(shù),測(cè)量構(gòu)筑物的風(fēng)量和阻力。
3)構(gòu)建唐安礦礦井通風(fēng)仿真系統(tǒng)IMVS,并綜合調(diào)試。
4)保持通風(fēng)網(wǎng)絡(luò)結(jié)構(gòu)及風(fēng)機(jī)動(dòng)力不變,通過(guò)改變巷道分支風(fēng)阻生成“阻變地點(diǎn)-阻變故障量-風(fēng)量”故障樣本,通過(guò)重復(fù)步驟1)~4)生成空間數(shù)據(jù)集D。
將空間數(shù)據(jù)集隨機(jī)劃分為70%的訓(xùn)練樣本和30%的測(cè)試樣本,由式(3)可計(jì)算出,數(shù)據(jù)標(biāo)準(zhǔn)化的唐安礦通風(fēng)故障位置診斷的十折交叉驗(yàn)證故障診斷準(zhǔn)確率為85.58%。數(shù)據(jù)歸一化的故障位置診斷的十折交叉驗(yàn)證故障診斷準(zhǔn)確率為86.3%。對(duì)于礦井通風(fēng)故障位置判斷模型,數(shù)據(jù)的歸一化處理準(zhǔn)確率優(yōu)于標(biāo)準(zhǔn)化處理。
數(shù)據(jù)歸一化的唐安礦礦井通風(fēng)故障位置判斷圖如圖2所示。實(shí)際阻變位置和預(yù)測(cè)阻變位置重合代表故障位置判斷正確。
圖2 唐安礦礦井通風(fēng)故障位置判斷模型Fig.2 Judgment model of mine ventilation fault location in Tang’an mine
唐安礦故障位置判斷的錯(cuò)誤主要為鄰近巷道分支,其原因?yàn)猷徑锏婪种У陌l(fā)生故障對(duì)系統(tǒng)影響相似,故障診斷錯(cuò)誤在一定程度上不影響故障維修人員對(duì)故障地點(diǎn)的判斷。
由式(4)可計(jì)算出,空間數(shù)據(jù)集歸一化的唐安礦通風(fēng)故障回歸預(yù)測(cè)十折交叉驗(yàn)證的均方誤差為0.603 1。數(shù)據(jù)標(biāo)準(zhǔn)化的故障量回歸預(yù)測(cè)的十折交叉驗(yàn)證均方誤差為0.286 3,空間數(shù)據(jù)集集標(biāo)準(zhǔn)化處理能明顯提高決策樹(shù)回歸準(zhǔn)確率。
空間數(shù)據(jù)集標(biāo)準(zhǔn)化的唐安礦礦井通風(fēng)巷道分支故障量回歸預(yù)測(cè)圖如圖3所示。
圖3 唐安礦礦井通風(fēng)巷道分支故障量回歸預(yù)測(cè)模型Fig.3 Regressive prediction model of branch fault quantity in mine ventilation roadway of Tang’an mine
本文使用貝爾實(shí)驗(yàn)室設(shè)計(jì)的開(kāi)源圖表工具graphviz對(duì)決策樹(shù)進(jìn)行可視化,以CART可視化的前2層為例對(duì)決策樹(shù)進(jìn)行解釋?zhuān)鐖D4所示。
圖4 唐安礦通風(fēng)網(wǎng)絡(luò)故障診斷CART前2層可視化圖Fig.4 Visualization diagram for first two layers of fault diagnosis CART on ventilation network in Tang’an mine
決策樹(shù)每個(gè)方框中包含的數(shù)據(jù)有特征劃分值qi,將結(jié)點(diǎn)劃分為2類(lèi);根結(jié)點(diǎn)的樣本數(shù)為1 253,經(jīng)過(guò)劃分將樣本分為1 186和67;決策樹(shù)將基尼系數(shù)高的特征作為根結(jié)點(diǎn),該特征也是對(duì)決策樹(shù)影響最大的特征;劃分比例value,根據(jù)劃分結(jié)果class將每種分類(lèi)結(jié)果按比例放置在value中。
根據(jù)式(3)計(jì)算,礦井通風(fēng)故障診斷ID3決策樹(shù)故障位置分類(lèi)十折交叉驗(yàn)證的平均故障診斷準(zhǔn)確率為84.9%,其故障診斷準(zhǔn)確率低于CART決策樹(shù)。
唐安礦巷道CART決策樹(shù)基尼系數(shù)最高的20條巷道分支基尼系數(shù)見(jiàn)表1。其中,num為基尼值排序;label為巷道分支編號(hào);gini為基尼系數(shù);samples為樣本數(shù)。
表1 唐安礦巷道分支基尼系數(shù)Table 1 Gini coefficients of roadway branch in Tang’an mine
唐安礦通風(fēng)網(wǎng)絡(luò)風(fēng)速傳感器優(yōu)化布置圖如圖5所示,標(biāo)注Qi的巷道分支為風(fēng)速傳感器布置巷道。嵌入式風(fēng)速傳感器布置能夠在算法運(yùn)行過(guò)程中自動(dòng)忽略相似和冗余特征。
圖5 唐安礦通風(fēng)網(wǎng)絡(luò)風(fēng)速傳感器優(yōu)化布置Fig.5 Optimized layout of wind speed sensors in ventilation network of Tang’an Mine
風(fēng)速傳感器數(shù)量的選擇需要多次構(gòu)建決策樹(shù)模型,不斷減少特征數(shù)來(lái)權(quán)衡準(zhǔn)確率和特征數(shù)量之間的平衡。以基尼系數(shù)從大到小的順序選擇傳感器布置點(diǎn),風(fēng)速傳感器布置數(shù)量與隨機(jī)布置對(duì)比如圖6所示。
圖6 唐安礦風(fēng)速傳感器布置數(shù)量?jī)?yōu)化Fig.6 Optimization on layout number of wind speed sensors in Tang’an mine
由圖6可知,風(fēng)速傳感器的數(shù)量與故障診斷準(zhǔn)確率成正比,基尼系數(shù)大的巷道分支對(duì)準(zhǔn)確率影響較大。隨著風(fēng)速傳感器布置數(shù)量的增加,模型故障診斷準(zhǔn)確率的提升放緩。選擇基尼系數(shù)最大的15條巷道分支作為風(fēng)速傳感器布置點(diǎn),根據(jù)式(3)計(jì)算其故障診斷準(zhǔn)確率為84.5%,高于隨機(jī)對(duì)照組的故障診斷準(zhǔn)確率68.2%。
決策樹(shù)學(xué)習(xí)算法會(huì)傾向于過(guò)擬合,使得模型泛化能力下降。決策樹(shù)剪枝處理能夠有效地降低模型復(fù)雜度,提升故障診斷準(zhǔn)確率。
選擇故障診斷準(zhǔn)確率更高的CART決策樹(shù)進(jìn)行剪枝處理,決策樹(shù)最大深度對(duì)準(zhǔn)確率影響關(guān)系如圖7所示。由圖7可知,當(dāng)最大深度小于45時(shí),決策樹(shù)擬合不足,不足以刻畫(huà)模型。當(dāng)最大深度大于45時(shí),模型過(guò)擬合,故障診斷準(zhǔn)確率下降。
圖7 決策樹(shù)最大深度剪枝效果Fig.7 Pruning effect on maximum depth of decision tree
決策樹(shù)葉結(jié)點(diǎn)最小樣本數(shù)min_samples_leaf與故障診斷準(zhǔn)確率關(guān)系圖如圖8所示。由圖8可知,當(dāng)葉結(jié)點(diǎn)最小樣本數(shù)為6時(shí),故障診斷準(zhǔn)確率最高。
圖8 決策樹(shù)葉結(jié)點(diǎn)最小樣本數(shù)剪枝效果Fig.8 Pruning effect of minimum sample number for leaf node of decision tree
當(dāng)葉結(jié)點(diǎn)最小樣本數(shù)為6,最大深度為45時(shí),CART決策樹(shù)泛化誤差最小,故障診斷準(zhǔn)確率最高為91.1%。
1)決策樹(shù)學(xué)習(xí)算法不僅能夠構(gòu)建礦井通風(fēng)故障位置判斷分類(lèi)模型、故障量預(yù)測(cè)回歸模型,還能對(duì)嵌入式風(fēng)速傳感器優(yōu)化布置。
2)礦井通風(fēng)空間數(shù)據(jù)集由礦井通風(fēng)網(wǎng)絡(luò)映射產(chǎn)生,具有空間自相關(guān)性的特點(diǎn)。嵌入式特征選擇由算法本身刪除相似特征與冗余特征,解決故障診斷算法與風(fēng)速傳感器匹配度低的問(wèn)題。
3)空間數(shù)據(jù)集歸一化能夠提高故障位置判斷分類(lèi)模型準(zhǔn)確率,標(biāo)準(zhǔn)化能夠提高故障量預(yù)測(cè)回歸模型準(zhǔn)確率。
4)CART準(zhǔn)確率略高于ID3決策樹(shù),決策樹(shù)剪枝處理能夠降低泛化誤差,提高模型故障診斷準(zhǔn)確率。
5)選擇基尼系數(shù)最高的15條巷道分支作為風(fēng)速傳感器布置地點(diǎn),其故障診斷準(zhǔn)確率優(yōu)于隨機(jī)布置對(duì)照組。隨著風(fēng)速傳感器布置數(shù)量的增加,故障診斷準(zhǔn)確率提升放緩。
中國(guó)安全生產(chǎn)科學(xué)技術(shù)2021年2期