單亞峰,湯月,任仁,謝鴻
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島125105)
基于鄰域粗糙集與支持向量極端學(xué)習(xí)機(jī)的瓦斯傳感器故障診斷*
單亞峰*,湯月,任仁,謝鴻
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島125105)
針對于瓦斯傳感器故障診斷速度慢、診斷精度不高的問題,以常見的沖擊型、漂移型、偏置型和周期型傳感器輸出故障作為研究對象,提出一種基于鄰域粗糙集(NRS)和支持向量極端學(xué)習(xí)機(jī)(SVM-ELM)的故障診斷方法。首先對瓦斯傳感器的特征屬性值進(jìn)行歸一化處理,然后利用NRS信息約簡理論降低屬性維度,提取出影響瓦斯傳感器的關(guān)鍵屬性構(gòu)成約簡集。將約簡集作為SVM-ELM的輸入進(jìn)行訓(xùn)練,利用訓(xùn)練好的SVM-ELM對測試樣本進(jìn)行模式識別。最后通過實(shí)驗(yàn)對比驗(yàn)證該方法具有訓(xùn)練速度快、分類精度高的特點(diǎn),辨識正確率在95%以上,能夠顯著提高故障診斷的速度和準(zhǔn)確性。
瓦斯傳感器;鄰域粗糙集(NRS);支持向量極端學(xué)習(xí)機(jī)(SVM-ELM);故障診斷
EEACC:7230doi:10.3969/j.issn.1004-1699.2016.09.018
瓦斯傳感器作為煤礦安全監(jiān)測系統(tǒng)中的關(guān)鍵部件,它肩負(fù)著檢測礦井瓦斯?jié)舛鹊闹厝?,它輸出的信號正確與否直接關(guān)系到整個(gè)煤礦瓦斯安全監(jiān)測系統(tǒng)的安全水平的高低和性能好壞[1],然而煤礦井下高溫、高壓等惡劣的環(huán)境,常常導(dǎo)致瓦斯傳感器輸出失真,靈敏度下降,準(zhǔn)確性、可靠性降低,從而導(dǎo)致誤報(bào)的情況[2]。作為煤礦安全檢測系統(tǒng)中重要部件,瓦斯傳感器發(fā)生故障后及時(shí)準(zhǔn)確地對其做出診斷和修復(fù),可以有效地保護(hù)人們生命財(cái)產(chǎn)的安全,因此,對瓦斯傳感器進(jìn)行故障檢測與診斷的研究是具有重要意義的。近年來,眾多學(xué)者在故障診斷領(lǐng)域做了大量研究,并取得了一定的研究成果,采用的算法無非也是神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,但經(jīng)實(shí)踐證明,這些方法存在一定的缺陷,文獻(xiàn)[3]將神經(jīng)網(wǎng)絡(luò)應(yīng)用于變壓器的故障診斷中,盡管該方法一定程度上提高了診斷的準(zhǔn)確性,但在小樣本學(xué)習(xí)訓(xùn)練上具有局限性,而瓦斯傳感器故障診斷訓(xùn)練樣本有限,無法達(dá)到分類精度高的要求。文獻(xiàn)[4]將支持向量機(jī)應(yīng)用于滾動軸承的故障診斷中,雖然解決了小樣本問題,彌補(bǔ)了神經(jīng)網(wǎng)絡(luò)的不足,但其性能對參數(shù)選擇的依賴性很高,在一定程度上影響了瓦斯傳感器故障診斷的速度。Huang等提出的極端學(xué)習(xí)機(jī)算法是近幾年應(yīng)用比較廣泛的新型機(jī)器學(xué)習(xí)方法[5],吸引了許多學(xué)者的目光,然而傳統(tǒng)的極端學(xué)習(xí)機(jī)存在隱含層節(jié)點(diǎn)個(gè)數(shù)選擇困難問題,本文有效結(jié)合支持向量機(jī)中的核函數(shù)映射,構(gòu)建支持向量極端學(xué)習(xí)機(jī)模型算法,克服了傳統(tǒng)極端學(xué)習(xí)機(jī)的缺陷[6],為機(jī)器學(xué)習(xí)提供了理論依據(jù)。為了提高瓦斯傳感器故障診斷的精度和效率,有必要對提取的冗余特征信息進(jìn)行屬性約簡。鄰域粗糙集數(shù)值型屬性約簡算法[7]能夠直接處理數(shù)值型屬性,快速準(zhǔn)確地提取出關(guān)鍵屬性,無須對其進(jìn)行離散化處理,無論在選擇特征數(shù)量和分類精度方面都有較大的優(yōu)勢。
通過上述分析,本文將鄰域粗糙集與支持向量極端學(xué)習(xí)機(jī)有機(jī)結(jié)合,充分發(fā)揮兩者的優(yōu)勢,提出一種有效的瓦斯傳感器故障診斷方法,通過MATLAB仿真實(shí)驗(yàn)對比分析驗(yàn)證該方法具有收斂速度快,分類精度高的優(yōu)點(diǎn)。
1.1鄰域粗糙集理論
鄰域粗糙集是胡清華[8]等人利用鄰域模型對經(jīng)典粗糙集理論的一種拓展模型,該模型以實(shí)數(shù)空間中的每一個(gè)點(diǎn)形成一個(gè)鄰域δ,δ鄰域族構(gòu)成了描述空間中任一概念的基本信息粒子。經(jīng)典粗糙集只能處理完備的信息,還要對樣本數(shù)據(jù)進(jìn)行離散化,這就不可避免地對數(shù)據(jù)的準(zhǔn)確性造成一定的信息影響,計(jì)算結(jié)果往往取決于離散化的效果。而鄰域粗糙集的最大優(yōu)點(diǎn)在于,可以直接處理數(shù)值型屬性,不需要進(jìn)行離散化,這樣就使得鄰域粗糙集在屬性約簡和分類器的構(gòu)造上都有更大的優(yōu)勢。
1.2前向貪心數(shù)值屬性約簡
鄰域粗糙集中前向搜索算法可以保證重要的屬性優(yōu)先被加入到約簡的行列匯總,不損失重要的特征,而后向搜索就很難保證這樣的結(jié)果,因此就會使一些冗余特征的決策系統(tǒng)的一些重要屬性被刪除,從而致使系統(tǒng)的區(qū)分能力降低,因此文中選取前向貪心數(shù)值屬性約簡算法。屬性的重要度由屬性本身、屬性相對屬性子集、決策變量組成的函數(shù)。此算法是根據(jù)屬性的重要度指標(biāo)來構(gòu)造貪心式屬性約簡算法,簡單地說就是以空集為起點(diǎn),計(jì)算全部剩余知識屬性的屬性重要度,取最大重要度數(shù)值的屬性加入到約簡集合中,直到剩余屬性的重要度全部為0時(shí)就不再加入新的屬性,即系統(tǒng)的依賴型函數(shù)不再發(fā)生任何變化。基于鄰域粗糙集模型的數(shù)值屬性約簡算法如下:
在瓦斯?jié)舛葯z測過程中,瓦斯傳感器的輸出由風(fēng)速、風(fēng)量、溫度、CO2及其臨近測點(diǎn)的瓦斯?jié)舛戎倒餐瑳Q定[9],這些數(shù)據(jù)有著不同的工程單位,各變量的大小在數(shù)值上差異也很大,直接使用原始測量數(shù)據(jù)進(jìn)行計(jì)算可能丟失信息和引起數(shù)值計(jì)算的不穩(wěn)定,因此要對各參數(shù)進(jìn)行歸一化處理。所謂對數(shù)據(jù)的歸一化處理是對數(shù)據(jù)進(jìn)行尺度變換和預(yù)處理。尺度變換常常將它們變換到[-1,0]或[0,1]的范圍,這里數(shù)據(jù)的歸一化采用如下算式[10]:
式中,x,x′為歸一化前、后數(shù)據(jù),xMax、xMax為歸一化前數(shù)據(jù)的最大和最小值。
歸一化后的數(shù)據(jù)可以消除由于不同特征因子的量綱不同和數(shù)量級不同所帶來的影響。
2.1極端學(xué)習(xí)機(jī)(ELM)理論
ELM是一種新的前饋神經(jīng)網(wǎng)絡(luò)模型[11],克服了收斂速度慢,易陷入局部最優(yōu)等缺陷,其輸入權(quán)值和隱含層偏置值隨機(jī)生成且在訓(xùn)練中保持不變,僅需采用線性回歸的方法確定輸出權(quán)值,極大的提高了網(wǎng)絡(luò)泛化能力和學(xué)習(xí)速度,其結(jié)構(gòu)如圖1所示。
圖1 極端學(xué)習(xí)機(jī)結(jié)構(gòu)示意圖
ELM數(shù)學(xué)表達(dá)式為:
式中:m,M,n分別為網(wǎng)絡(luò)輸入層、隱含層和輸出層的節(jié)點(diǎn)數(shù);g(x)為激活函數(shù),一般取Sigmoid函數(shù)。設(shè)由N個(gè)不同的樣本(xi,yi),(1≤i≤N),其中yi=[yi,1,yi,2,…,yi,n]T∈Rn,ok=[ok,1,ok,2,…,ok,n]T為網(wǎng)絡(luò)輸出,αi=[α1,i,α2,i,…,αm,i]為輸入層和第i個(gè)隱含層的連接權(quán)值,bi為隱含層閾值,βi=[βi,1,βi,2,…,βi,n]T為第i個(gè)隱含層和輸出層的輸出權(quán)值。如果一個(gè)有M個(gè)隱含點(diǎn)的SLFNs能以接近于0的誤差來逼近這N個(gè)樣本,則存在αi,βi,bi有:
簡化為:Hβ=Y式中:H為網(wǎng)絡(luò)隱含層輸出矩陣;β為輸出權(quán)值矩陣;Y為期望輸出矩陣。表示如下:
在訓(xùn)練開始時(shí),輸入層到隱含層的連接權(quán)值α和隱含層閾值b隨機(jī)生成并保持固定,僅需訓(xùn)練確定輸出權(quán)值β。通常采用偽逆算法一步計(jì)算得
式中:H*是矩陣H的MP廣義逆。對?求解后,完成對ELM的網(wǎng)絡(luò)訓(xùn)練過程。
2.2極端學(xué)習(xí)機(jī)算法改進(jìn)
影響極端學(xué)習(xí)機(jī)建模性能的一個(gè)重要參數(shù)即隱含層節(jié)點(diǎn)個(gè)數(shù),通常需要根據(jù)訓(xùn)練任務(wù)的不同,采用較為繁瑣的交叉驗(yàn)證方法進(jìn)行選擇[12]。Schrauwen和Williams等學(xué)者已經(jīng)證明:具有無窮個(gè)隱節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)方法是等價(jià)的,而具有有限隱節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)可看作是支持向量機(jī)方法的低維逼近。為避免極端學(xué)習(xí)機(jī)模型中隱節(jié)點(diǎn)選擇問題,本文將傳統(tǒng)極端學(xué)習(xí)機(jī)的隱含層節(jié)點(diǎn)映射h(x)擴(kuò)展為核方法中的核函數(shù)映射φ(x),對支持向量機(jī)進(jìn)行低維逼近,以此構(gòu)建支持向量極端學(xué)習(xí)機(jī)模型(SVM-ELM)。該模型有效結(jié)合了極端學(xué)習(xí)機(jī)訓(xùn)練簡便和核方法的泛化性能好的優(yōu)勢,且表現(xiàn)出較傳統(tǒng)極端學(xué)習(xí)機(jī)更好的學(xué)習(xí)能力。
在該極端學(xué)習(xí)機(jī)的特殊實(shí)現(xiàn)中,隱含層特征映射h()
x可以是未知的,可對極端學(xué)習(xí)機(jī)定義如下核矩陣:
因此,輸出函數(shù)為
式中C為正則化系數(shù),以平衡模型精度和模型復(fù)雜度。
核函數(shù)的選擇有以下3種:一是利用專家經(jīng)驗(yàn)選擇核函數(shù);二是核函數(shù)的選取時(shí),分別適用不同的核函數(shù),比較出誤差最小的核函數(shù)就是最好的核函數(shù);三是采用由Smits等提出的構(gòu)造混合核函數(shù)方法。根據(jù)長久經(jīng)驗(yàn)及實(shí)踐證實(shí),徑向基核函數(shù)是目前應(yīng)用較廣泛的一種核函數(shù),本文選用該函數(shù)作為支持向量極端學(xué)習(xí)機(jī)的核函數(shù)。
NRS-SVM-ELM模型算法步驟:
步驟1 根據(jù)式(2)利用MATLAB軟件對各類傳感器采集的樣本數(shù)據(jù)進(jìn)行歸一化處理;
步驟2 運(yùn)用鄰域粗糙集方法,按照上述步驟進(jìn)行屬性約簡;
步驟3 確定K(u,v),初始化支持向量機(jī)極端學(xué)習(xí)機(jī);
步驟4 給定訓(xùn)練樣本集N,激活函數(shù)g(x)以及隱含層節(jié)點(diǎn)數(shù)M,隨機(jī)生成輸入層到隱含層的連接權(quán)值α和隱含層閾值b,根據(jù)偽逆算法確定輸出權(quán)值β,進(jìn)行訓(xùn)練;
步驟5 判斷
是否成立,若成立轉(zhuǎn)步驟6,否則轉(zhuǎn)步驟4;
步驟6利用訓(xùn)練好的支持向量極端學(xué)習(xí)機(jī)對測試樣本上進(jìn)行故障識別;
3.1實(shí)驗(yàn)配置
實(shí)驗(yàn)選取山西某煤礦正常工作面的傳感器采集到5類狀態(tài)下的各60組實(shí)測數(shù)據(jù),將前40組數(shù)據(jù)作為訓(xùn)練樣本集,后20組數(shù)據(jù)作為測試樣本集。用U={}1,2,…,60來表示60個(gè)樣本集合,以風(fēng)速V、溫度T、CO2濃度C、上隅角傳感器T0、回風(fēng)巷瓦斯傳感器T1、T2、T3、T4和進(jìn)風(fēng)巷瓦斯傳感器T5作為樣本集合U上的特征屬性A,A={V,T,C,T0,T1,T2,T3,T4,T5},以識別類型沖擊型、漂移型、偏置型、周期性和正常型作為決策屬性D,D={di},i=1,2,3,4,5。經(jīng)查閱文獻(xiàn),通過長久經(jīng)驗(yàn)將前40組數(shù)據(jù)進(jìn)行預(yù)處理得到約簡后的關(guān)鍵屬性集red={V,T,C,T1,T2},將約簡集對應(yīng)的數(shù)據(jù)作為SVM-ELM的輸入進(jìn)行編碼和訓(xùn)練,完成網(wǎng)絡(luò)訓(xùn)練,然后用另外的20組測試樣本進(jìn)行測試。
另外,將支持向量極端學(xué)習(xí)機(jī)的輸出層節(jié)點(diǎn)設(shè)定為4,這5種狀態(tài)對應(yīng)關(guān)系如表1。根據(jù)約簡集red可知輸入層節(jié)點(diǎn)個(gè)數(shù)為5,將隱含層節(jié)點(diǎn)數(shù)設(shè)定為6,則該支持向量極端學(xué)習(xí)機(jī)采用5-6-4的結(jié)構(gòu)。
表1 傳感器狀態(tài)與模型輸出映射關(guān)系
3.2結(jié)果分析
取5類狀態(tài)下的各20組實(shí)測數(shù)據(jù)進(jìn)行測試,由于篇幅限制只列出部分輸出結(jié)果,見表2,全部樣本診斷識別后的分類情況如圖2所示,可以看出每種故障的識別率都在95%以上,符合辨識分類的要求。因此,本文的設(shè)計(jì)方法可以有效地診斷出瓦斯傳感器的故障類型,達(dá)到了最初的設(shè)計(jì)目的。
圖2 樣本識別的分類結(jié)果
表2 實(shí)驗(yàn)輸出結(jié)果
3.3對比實(shí)驗(yàn)
為了驗(yàn)證本文提出的NRS和SVM-ELM相結(jié)合的故障診斷模型的的優(yōu)越性,進(jìn)行了如下對比實(shí)驗(yàn),分別將約簡前后的原始數(shù)據(jù)輸入到OS-ELM[13],PCA-PSO-ELM[14]和SVM-ELM模型中,得到故障診斷結(jié)果對比見表3。其中極端學(xué)習(xí)機(jī)的輸入輸出節(jié)點(diǎn)個(gè)數(shù)及參數(shù)設(shè)置與文中3.1小節(jié)保持一致,同樣選取40組訓(xùn)練樣本,20組測試樣本,將訓(xùn)練時(shí)間,診斷時(shí)間和診斷正確率作為評價(jià)標(biāo)準(zhǔn),進(jìn)行分析。
表3 不同模型的屬性約簡前后診斷結(jié)果對比表
從表3可以看出,支持向量極端學(xué)習(xí)模型與傳統(tǒng)的極端學(xué)習(xí)機(jī)和經(jīng)粒子群優(yōu)化的極端學(xué)習(xí)機(jī)算法相比,盡管在訓(xùn)練時(shí)間和診斷時(shí)間上并沒有太明顯的優(yōu)勢,但診斷的準(zhǔn)確率明顯提高,無論是采用OS-ELM、PCA-PSO-ELM還是SVM-ELM模型,經(jīng)NRS進(jìn)行屬性約簡后,三種模型的精度都有所提高,而且還極大的縮短了訓(xùn)練和診斷時(shí)間,診斷速度顯著提升。實(shí)驗(yàn)數(shù)據(jù)表明,本文提出的基于NRS與SVM-ELM的故障診斷模型算法要明顯優(yōu)于傳統(tǒng)的極端學(xué)習(xí)機(jī),具有更好的泛化能力,可應(yīng)用于其他工程領(lǐng)域。
本文將鄰域粗糙集與支持向量極端學(xué)習(xí)機(jī)相耦合,充分發(fā)揮兩者的優(yōu)勢,提出一種能夠快速、準(zhǔn)確識別出故障類型的模型算法。鄰域粗糙集屬性約簡算法相比于其它屬性約簡算法能夠快速提煉出影響故障診斷精度的關(guān)鍵屬性,縮減了支持向量極端學(xué)習(xí)機(jī)的輸入空間規(guī)模,極大地減少了計(jì)算量,具有很好的泛化能力。支持向量極端學(xué)習(xí)機(jī)故障診斷模型克服了傳統(tǒng)極端學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)選擇困難的缺陷,使診斷速度更快,診斷精度更高。NRS與SVM-ELM兩種方法的結(jié)合不僅能夠擴(kuò)大系統(tǒng)處理信息的廣度,同時(shí)豐富了系統(tǒng)處理信息的方法,極大地提高了瓦斯傳感器故障診斷的準(zhǔn)確率,具有一定理論研究價(jià)值和工程應(yīng)用意義。
[1]黃凱峰,劉澤功,王其軍,等.基于ASGSO-SVR模型的瓦斯傳
單亞峰(1968-),男,副教授,遼寧阜新人,遼寧工程技術(shù)大學(xué)碩士研究生導(dǎo)師,1991年畢業(yè)于哈爾濱建筑工程學(xué)院電氣自動化專業(yè)。多年來一直工作在科研和教學(xué)第一線,近年來發(fā)表論文10余篇,參編教材2部,主持承擔(dān)科研課題多項(xiàng)。主要研究方向?yàn)闄z測技術(shù)及其應(yīng)用,shanyf68@163.com;
湯月(1992-),女,遼寧錦州人,碩士研究生,主要研究方向?yàn)楝F(xiàn)代傳感技術(shù),764406729@qq.com。
Gas Sensor Fault Diagnosis Based on Neighborhood Rough Set Combined with Support Vector Machine and Extreme Learning Machine*
SHAN Yafeng*,TANG Yue,REN Ren,XIE Hong
(College of Electrical and Control Engineering,Liaoning Technical University,Huludao Liaoning 125105,China)
In order to solve the problem that the gas sensor diagnosis speed is slow and the diagnosis accuracy is not high,this paper takes the common type gas sensor fault such as impact,drift,bias and periodic fault as research ob?ject and proposes a pattern classification and identification of the fault diagnosis of gas sensor method based on neighborhood rough set(NRS)combined with support vector machine and extreme learning machine(SVM-ELM).First of all,normalize the feature attribute of the gas sensor,the reduction set is formed via reducing the attribute di?mension with NRS information reduction theory,including key attributes of the gas sensor.Train SVM-ELM taking the reduction set for input data and recognize the fault patterns using test samples.Finally,through experiment con?trast analysis,this method has the features of fast training speed,high accuracy of classification,and the identifica?tion correct rate is more than 95%.It can significantly improve the effectiveness and accuracy of the fault diagnosis.
gas sensor;neighborhood rough set;Support Vector Machine and Extreme Learning Machine(SVMELM);fault diagnosis
TP212;TP181
A
1004-1699(2016)09-1400-05
項(xiàng)目來源:國家自然科學(xué)基金項(xiàng)目(51274118);遼寧省科技攻關(guān)基金項(xiàng)目(2011229011);遼寧省教育廳基金項(xiàng)目(L2012119)
2016-03-14修改日期:2016-04-16