云世豪, 涂 煊, 彭道剛, 張 浩, 張 騰
(1.上海電力大學(xué), 上海 200090; 2.上海工業(yè)自動(dòng)化儀表研究院有限公司, 上海 200233)
燃?xì)廨啓C(jī)在國(guó)家發(fā)電體系中具有非常重要的作用,其控制系統(tǒng)控制著燃?xì)廨啓C(jī)的安全穩(wěn)定運(yùn)行[1]。傳感器作為控制系統(tǒng)中重要的測(cè)量元件,負(fù)責(zé)測(cè)量各種信號(hào)來(lái)監(jiān)測(cè)燃?xì)廨啓C(jī)的運(yùn)行狀態(tài),并及時(shí)反饋給控制系統(tǒng)。因此,當(dāng)發(fā)生故障時(shí),就需要對(duì)其進(jìn)行故障診斷以判斷其故障類(lèi)型,避免后續(xù)造成巨大損失[2]。
常見(jiàn)的燃?xì)廨啓C(jī)控制系統(tǒng)傳感器故障診斷方法主要分為基于解析模型的方法和基于數(shù)據(jù)驅(qū)動(dòng)的方法[3]。其中基于解析模型的方法需要對(duì)燃?xì)廨啓C(jī)的控制系統(tǒng)進(jìn)行準(zhǔn)確的數(shù)學(xué)建模,但是由于燃?xì)廨啓C(jī)控制系統(tǒng)是一種復(fù)雜的、非線(xiàn)性的動(dòng)態(tài)系統(tǒng),因此難以對(duì)其進(jìn)行準(zhǔn)確的建模來(lái)反映實(shí)時(shí)的系統(tǒng)狀態(tài)。為此,本文采用基于數(shù)據(jù)驅(qū)動(dòng)的方法對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)傳感器的故障進(jìn)行診斷。該方法不需要對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)建立準(zhǔn)確的數(shù)學(xué)模型,只需對(duì)其運(yùn)行數(shù)據(jù)進(jìn)行分析即可。
信息融合是一種常用的基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法,具有多種分類(lèi)[4],其中貝葉斯理論和DS證據(jù)理論是基于知識(shí)的理論方法,需要獲得相關(guān)問(wèn)題的先驗(yàn)知識(shí),而這些知識(shí)往往在實(shí)際問(wèn)題中很難獲得,從而使得這些方法存在一定的局限性[5]。粗糙集(Rough Set,RS)理論的優(yōu)勢(shì)在于不依賴(lài)先驗(yàn)知識(shí),可以通過(guò)對(duì)故障數(shù)據(jù)的條件屬性和決策屬性進(jìn)行分析和推理,從中找出潛在的規(guī)律,從而對(duì)條件屬性進(jìn)行約簡(jiǎn),去除其中一部分相關(guān)性較低的條件屬性,得到簡(jiǎn)化的傳感器故障診斷決策表[6]。RS理論的缺點(diǎn)在于其容錯(cuò)能力較低,也意味著單獨(dú)的RS理論無(wú)法滿(mǎn)足故障診斷的實(shí)際需求[7];而神經(jīng)網(wǎng)絡(luò)作為一種廣泛應(yīng)用于各個(gè)領(lǐng)域的技術(shù),與其他領(lǐng)域的技術(shù)具有很強(qiáng)的兼容性,因此可以將神經(jīng)網(wǎng)絡(luò)與RS理論相結(jié)合,從而形成復(fù)合的故障診斷系統(tǒng)[8]。
然而,在實(shí)際的燃?xì)廨啓C(jī)運(yùn)行過(guò)程中,不僅產(chǎn)生離散數(shù)據(jù),還存在著大量的連續(xù)數(shù)據(jù)。RS理論只適用于離散屬性,因此就需要選擇一種合適的離散化方法。等頻離散化方法是一種較為常用的離散化方法[9]。本文利用改進(jìn)的等頻離散化方法對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)傳感器的故障征兆屬性進(jìn)行離散化處理,而后利用RS理論消除與故障類(lèi)型關(guān)聯(lián)度低的條件屬性;最后,利用徑向基(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)完成對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)傳感器故障類(lèi)型的診斷。實(shí)驗(yàn)結(jié)果表明,改進(jìn)離散化方法與粗糙集神經(jīng)網(wǎng)絡(luò)的良好結(jié)合,在燃?xì)廨啓C(jī)控制系統(tǒng)傳感器故障診斷中可以取得更好的效果。
等頻離散化方法將數(shù)據(jù)放在k個(gè)區(qū)間,每個(gè)區(qū)間大約包含p/k個(gè)數(shù)據(jù),保證每個(gè)區(qū)間數(shù)據(jù)的數(shù)量大致相同,其中p為數(shù)據(jù)的總個(gè)數(shù)。
等頻離散化方法作為一種常用的連續(xù)屬性離散化方法,優(yōu)點(diǎn)是減少了異常值的影響,可以在同一個(gè)區(qū)間內(nèi)收集相似的數(shù)據(jù)。缺點(diǎn)是很難找到最佳區(qū)間數(shù)k,而且可能將大小相同的值放在不同的區(qū)間中。
以一組數(shù)據(jù){10,20,30,40,20,50,20,60,20}為例,對(duì)其進(jìn)行等頻離散化處理。設(shè)置區(qū)間數(shù)k為3,每個(gè)區(qū)間內(nèi)數(shù)據(jù)的數(shù)量為p/k=3。由于數(shù)據(jù)中存在重復(fù)數(shù)值,且重復(fù)值的數(shù)量大于區(qū)間中的數(shù)據(jù)數(shù)量,這時(shí)就會(huì)導(dǎo)致等頻離散化方法將相同的數(shù)值分配到不同的區(qū)間中,從而對(duì)后續(xù)的故障診斷造成不利影響。
(1) 分別輸入待離散化的故障征兆集合A中的各個(gè)故障征兆屬性Ai={a1,a2,a3,…,ap-1,ap}(i=1,2,3,…,n);
(2) 將Ai中的所有值按升序排列;
(5) 根據(jù)每個(gè)區(qū)間的元素?cái)?shù)量創(chuàng)建k個(gè)數(shù)據(jù)集Bj(j=1,2,3,…k)來(lái)存放數(shù)據(jù),并計(jì)算每個(gè)數(shù)據(jù)集中數(shù)據(jù)的平均值Bavgj(j=1,2,3,…,k);
(7) 通過(guò)確定A′i中各值所屬的區(qū)間,將它們的連續(xù)值轉(zhuǎn)化為離散值;
(8) 輸出離散化后的條件屬性集合C中各條件屬性Ci(i=1,2,3,…,n)。
對(duì)于一個(gè)信息決策系統(tǒng)S=(U,R,V,f),其中:U是對(duì)象集合;R是屬性集合,包含條件屬性集合C和決策屬性集合D;V是屬性的值域;f是一種映射,反映對(duì)象的屬性值[11]。
設(shè)X為U的非空子集,B為R的非空子集,定義X的下近似集為
B_(X)=∪{x|(x∈U∧[X]B?X)}
(1)
定義X關(guān)于B的正域?yàn)?/p>
POSB(X)=B_(X)
(2)
決策屬性集合D對(duì)條件屬性集合C的依賴(lài)程度可以表示為
(3)
條件屬性Ci對(duì)于決策的重要程度可以定義為
SGF(Ci,C,D)=γC(D)-γC-Ci(D)
(4)
若SGF(Ci,C,D)=0,則Ci對(duì)于決策屬性來(lái)說(shuō)是冗余的。
圖1為粗糙集RBF神經(jīng)網(wǎng)絡(luò)故障診斷模型,包含粗糙集約簡(jiǎn)層、輸入層、隱藏層和輸出層4層[12]。
圖1 粗糙集RBF神經(jīng)網(wǎng)絡(luò)模型
粗糙集約簡(jiǎn)層的每個(gè)輸入對(duì)應(yīng)的是傳感器的每個(gè)故障征兆,也就是傳感器故障診斷決策表中的條件屬性。有n個(gè)條件屬性的傳感器故障樣本在經(jīng)過(guò)粗糙集約簡(jiǎn)層之后會(huì)被約簡(jiǎn)為具有m個(gè)條件屬性的傳感器故障樣本,最后將其輸入到RBF神經(jīng)網(wǎng)絡(luò)當(dāng)中。
可以得知,RBF神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為約簡(jiǎn)后的條件屬性數(shù)m,輸出節(jié)點(diǎn)數(shù)根據(jù)故障類(lèi)型編碼的維數(shù)來(lái)選擇,記為l,α為1~10之間的常數(shù)。隱藏層節(jié)點(diǎn)數(shù)s的計(jì)算公式為
(5)
選取高斯函數(shù)作為隱藏層神經(jīng)元的作用函數(shù),對(duì)輸入信息進(jìn)行空間映射的變換,輸出層再對(duì)其進(jìn)行線(xiàn)性加權(quán)輸出故障診斷結(jié)果。RBF神經(jīng)網(wǎng)絡(luò)的輸入輸出響應(yīng)為
(6)
δi——高斯函數(shù)的方差。
本文對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)傳感器進(jìn)行故障診斷,主要是利用改進(jìn)的等頻離散化方法先對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)傳感器的故障數(shù)據(jù)進(jìn)行預(yù)處理,得到離散化后的故障數(shù)據(jù),再用粗糙集對(duì)故障數(shù)據(jù)進(jìn)行約簡(jiǎn),尋找屬性間的關(guān)系,從而簡(jiǎn)化神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)。圖2所示是基于改進(jìn)等頻離散化方法的粗糙集神經(jīng)網(wǎng)絡(luò)故障診斷流程。
圖2 粗糙集神經(jīng)網(wǎng)絡(luò)故障診斷系統(tǒng)框
其具體實(shí)現(xiàn)步驟為:
(1) 將燃?xì)廨啓C(jī)控制系統(tǒng)傳感器故障數(shù)據(jù)利用改進(jìn)等頻離散化方法進(jìn)行離散化處理,將各個(gè)故障征兆中的值按照升序排列并消除重復(fù)數(shù)據(jù),根據(jù)各個(gè)條件屬性中值的數(shù)量分別確定區(qū)間k的數(shù)量,以此得到各個(gè)故障征兆的離散區(qū)間;
(2) 從傳感器故障數(shù)據(jù)中隨機(jī)產(chǎn)生訓(xùn)練樣本集與測(cè)試樣本集,并根據(jù)得到的離散區(qū)間分別對(duì)它們進(jìn)行離散化,得到離散化后的條件屬性;
(3) 利用粗糙集理論消除與故障類(lèi)型關(guān)聯(lián)度低的條件屬性,簡(jiǎn)化傳感器故障診斷樣本;
(4) 將簡(jiǎn)化的訓(xùn)練樣本集輸入到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,并將訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行保存;
(5) 用簡(jiǎn)化的測(cè)試樣本集對(duì)訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,并輸出診斷結(jié)果。
燃?xì)廨啓C(jī)控制系統(tǒng)傳感器按照故障原因可以分為偏差故障、沖擊故障、漂移故障和周期性干擾故障。4種故障描述如表1所示。
表1 4種傳感器故障類(lèi)型及特征
本文以燃?xì)廨啓C(jī)壓氣機(jī)進(jìn)氣溫度傳感器為例進(jìn)行故障診斷,選取在某一負(fù)荷下傳感器處于上述4種狀態(tài)及正常狀態(tài)時(shí),整個(gè)控制系統(tǒng)中各種參數(shù)(如壓氣機(jī)排氣溫度、壓氣機(jī)進(jìn)氣壓力等)的數(shù)據(jù)作為故障征兆屬性,進(jìn)行溫度傳感器的故障診斷。分別對(duì)燃?xì)廨啓C(jī)傳感器正常狀態(tài)和4種故障狀態(tài)進(jìn)行編碼,作為故障決策表的決策屬性和神經(jīng)網(wǎng)絡(luò)的輸出。表2列出了其對(duì)應(yīng)關(guān)系。表3為故障征兆屬性編碼對(duì)應(yīng)的各種測(cè)量參數(shù)名稱(chēng)。
表2 傳感器狀態(tài)類(lèi)型及編碼
表3 測(cè)量參數(shù)與故障征兆屬性對(duì)應(yīng)關(guān)系
隨機(jī)選取其中的300組數(shù)據(jù),其中240組作為訓(xùn)練樣本集,60組作為測(cè)試樣本集,其部分故障診斷決策如表4所示。
表4 傳感器故障診斷決策表
利用改進(jìn)的等頻離散化方法對(duì)故障數(shù)據(jù)進(jìn)行離散化處理。根據(jù)離散區(qū)間可以得到離散化后的訓(xùn)練樣本集故障決策表,部分?jǐn)?shù)據(jù)如表5所示。
表5 傳感器故障診斷決策表中的部分?jǐn)?shù)據(jù)
利用RS理論對(duì)離散化后的訓(xùn)練集故障決策表的條件屬性進(jìn)行約簡(jiǎn),約簡(jiǎn)后的部分結(jié)果如表6所示。
表6 屬性約簡(jiǎn)后的傳感器故障診斷決策表
將選取的測(cè)試集樣本進(jìn)行離散化和屬性約簡(jiǎn),并輸入到已經(jīng)訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)中。故障診斷結(jié)果和故障類(lèi)型的對(duì)比曲線(xiàn)如圖3所示。
分別采用RBF神經(jīng)網(wǎng)絡(luò)方法和RS-RBF神經(jīng)網(wǎng)絡(luò)方法對(duì)燃?xì)廨啓C(jī)控制系統(tǒng)的傳感器進(jìn)行故障診斷,可以得到2種方法的診斷準(zhǔn)確率和診斷絕對(duì)誤差,如表7所示。
圖3 改進(jìn)離散化粗糙集RBF神經(jīng)網(wǎng)絡(luò)故障診斷對(duì)比
表7 3種診斷方法的比較
由表7中可以看到,運(yùn)用RS可以簡(jiǎn)化神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),提升診斷率,這是因?yàn)镽S可以對(duì)條件屬性進(jìn)行約簡(jiǎn),簡(jiǎn)化故障診斷規(guī)則。改進(jìn)等頻離散化RS-RBF的故障診斷準(zhǔn)確率和精度更高,這是因?yàn)楦倪M(jìn)的等頻離散化方法通過(guò)消除重復(fù)值,解決了兩個(gè)相同大小的數(shù)據(jù)被分到不同區(qū)間的問(wèn)題,避免破壞故障診斷規(guī)則,有利于粗糙集對(duì)故障診斷規(guī)則的提取。此外,通過(guò)設(shè)定區(qū)間數(shù)k的取值方法,解決了k值過(guò)大不利于有效提取故障診斷規(guī)則和k值過(guò)小丟失故障診斷規(guī)則的問(wèn)題,使得RS能夠?qū)收弦?guī)則進(jìn)行有效的提取,進(jìn)而得到完整的故障診斷規(guī)則。
(1) RS理論可以有效地對(duì)條件屬性進(jìn)行約簡(jiǎn),簡(jiǎn)化神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),相比于單純的RBF神經(jīng)網(wǎng)絡(luò),診斷的準(zhǔn)確率有所提高,并且減小了診斷的誤差;
(2) 采用改進(jìn)的等頻離散化方法提高了故障診斷的準(zhǔn)確率并且減小了故障診斷的誤差,由此證明了該方法的可行性,可以在故障診斷領(lǐng)域中得到良好的應(yīng)用。