姜甲玉,劉仕一,張 煒,孫迎豐
(1.海軍駐沈陽地區(qū)軍事代表局,沈陽 110031;2.91206 部隊,山東 青島 266108;3.92854 部隊705 廠,廣東 湛江 524016;4.海軍航空工程學(xué)院 研究生管理大隊,山東 煙臺 264001)
粗糙集理論是一種處理不精確、不確定與不完全數(shù)據(jù)的數(shù)學(xué)方法,在數(shù)據(jù)約簡、特征提取等方面功效卓著,而且該理論與概率論、模糊數(shù)學(xué)、信息論和證據(jù)理論等其他處理不確定性和不精確性問題的理論有很強的互補性[1-3]。模糊神經(jīng)網(wǎng)絡(luò)是模糊理論與神經(jīng)網(wǎng)絡(luò)的融合,它同時擁有模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)的優(yōu)點,它既能像模糊邏輯那樣表達定性的知識,處理不完整、模糊的數(shù)據(jù),又擁有神經(jīng)網(wǎng)絡(luò)強大的自學(xué)習(xí)、自調(diào)整能力。
粗糙集能夠?qū)Σ煌耆?、不確定的信息進行有效的處理,消除冗余數(shù)據(jù),提取有用信息,但是由于粗糙集方法本身的局限性,它很難處理新數(shù)據(jù),并且對連續(xù)性數(shù)據(jù)辦法不多,不具備推廣性。模糊神經(jīng)網(wǎng)絡(luò)中蘊含的模糊規(guī)則,避免了神經(jīng)網(wǎng)絡(luò)在知識表達中的黑箱性,但模糊規(guī)則的獲取存在困難,是模糊神經(jīng)網(wǎng)絡(luò)應(yīng)用的障礙。上述兩者雖然各有不足,但在功能上可以互補。模糊神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)具有很強的泛化能力,可彌補粗糙集的不足;同時,可以發(fā)揮粗糙集數(shù)據(jù)約簡的功能確定初始知識,解決初始模糊規(guī)則獲取的問題,降低網(wǎng)絡(luò)輸入數(shù)據(jù)的維數(shù),縮短網(wǎng)絡(luò)訓(xùn)練的時間,避免網(wǎng)絡(luò)構(gòu)造的困難。
因此,本文將粗糙集與模糊神經(jīng)網(wǎng)絡(luò)技術(shù)相結(jié)合,建立故障診斷模型(見圖1),對其中的數(shù)據(jù)預(yù)處理、粗糙集方法應(yīng)用和模糊神經(jīng)網(wǎng)絡(luò)構(gòu)造等關(guān)鍵技術(shù)進行具體研究,并通過殲擊機操縱面故障[4]診斷實例,檢驗該方法的可行性和有效性。
圖1 基于粗糙集—模糊神經(jīng)網(wǎng)絡(luò)的故障診斷模型
圖1所示故障診斷的工作過程:首先,對數(shù)據(jù)庫中的樣本數(shù)據(jù)進行預(yù)處理,即對連續(xù)數(shù)據(jù)進行離散化處理,并獲取各模糊集的初始隸屬函數(shù);其次,對離散化后的數(shù)據(jù)進行粗糙集處理,即數(shù)據(jù)約簡(包括屬性約簡和值約簡),獲取診斷規(guī)則;第三,根據(jù)診斷規(guī)則確定網(wǎng)絡(luò)的基本結(jié)構(gòu),由隸屬函數(shù)以及相關(guān)參數(shù)初始化網(wǎng)絡(luò),用約簡后形成的樣本數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),調(diào)整相關(guān)參數(shù);最后,用訓(xùn)練好的模糊神經(jīng)網(wǎng)絡(luò)對采集的待診斷數(shù)據(jù)進行處理,給出診斷結(jié)論。
粗糙集理論不能直接對連續(xù)數(shù)據(jù)進行處理,而工程領(lǐng)域中故障診斷的各種特征參數(shù)多是連續(xù)性的,如何將其離散化是首先需要解決的問題。目前,在粗糙集的應(yīng)用研究中,離散化過程大多基于領(lǐng)域?qū)<业慕?jīng)驗知識來實現(xiàn),尋找最優(yōu)的離散化方法的問題還處在研究中,許多人提出了各自不同的方法:基本法、概念樹法、期望值法、動態(tài)聚類法等[5]。一般來講,不論哪一種方法,都應(yīng)盡可能滿足兩點要求[6]:① 連續(xù)屬性離散化后的空間維數(shù)應(yīng)盡可能小,也就是經(jīng)過離散化后的每一個屬性都應(yīng)包含盡量少的屬性值的種類;② 連續(xù)屬性值離散化處理后丟失的信息應(yīng)盡可能小。本文采用模糊 C-均值(FCM)聚類算法[7]對數(shù)據(jù)進行離散化,使用此方法可獲得各條件屬性值隸屬于相應(yīng)離散集的隸屬度,為獲得隸屬函數(shù)奠定了基礎(chǔ)。
1)確定c(1<c<n),m ∈ [1,∞),初始化 V0并令迭代次數(shù) t=1;
3)由tU和公式更新
在構(gòu)造模糊神經(jīng)網(wǎng)絡(luò)時要給出初始隸屬函數(shù)。由上述討論可知,在數(shù)據(jù)離散化的過程中,已經(jīng)獲得了一些關(guān)于模糊集的信息,本文以此為基礎(chǔ),采用下述方法獲取初始隸屬函數(shù)。隸屬函數(shù)采用高斯型,第i個模糊集合的隸屬函數(shù)為:
隸屬函數(shù)中心取聚類中心iv,與聚類中心的距離 dij最小的樣本數(shù)據(jù),設(shè)為xmin,為保證該值對于不同模糊集合的隸屬度有所差別,故對該值的隸屬度取值應(yīng)為一較小值 μmin(一般不大于0.5),將 xmin和 μmin代入上式即可求得。
在故障診斷工程應(yīng)用中,為保證故障診斷精度,一般利用較多的特征條件進行判斷,其中,一些關(guān)鍵條件對故障比較敏感,而且相互獨立,能夠提供互補信息,提高診斷精度,應(yīng)該加以充分利用;一些冗余條件對故障不敏感,或者與其他條件相互關(guān)聯(lián),沒有利用價值,會增加診斷工作量和成本,應(yīng)該從診斷規(guī)則中剔除。
粗糙集理論作為一種分析不確定性數(shù)據(jù)的數(shù)學(xué)工具,與經(jīng)典集合理論不同,它從“知識”的角度處理客觀事物的不確定性,認為知識是將對象進行分類的依據(jù),通過這些知識可以將對象劃分為不同的類別。知識表達系統(tǒng)的基本成分是研究論域?qū)ο蟮募?,關(guān)于這些對象的知識是通過對象的屬性和屬性值來描述的。
一個知識表達系統(tǒng)(也稱信息表)可以表示為S=(U,R,V,f),其中:U是對象的集合;R=C ∪D,C ∩ D=φ,C稱為條件屬性集,D稱為決策屬性集;是屬性r的值域;是一個信息函數(shù),它為對象的每個屬性賦予一個信息值,即
應(yīng)用粗糙集理論最顯著的特點是在保持知識系統(tǒng)分類能力不變的前提下,通過屬性約簡和值約簡,導(dǎo)出問題的決策或分類規(guī)則。
在已知關(guān)于粗糙集的研究成果中,Skowron 提出的可辨識矩陣為求取最佳屬性約簡提供了很好的思路,該方法將信息表中所有有關(guān)屬性區(qū)分信息都濃縮進一個矩陣當中,通過該矩陣方便地得到信息表的屬性核(屬性核是指信息表中不可刪除的屬性)。在此基礎(chǔ)上,基于“屬性重要性”思想[5]的啟發(fā)式算法得到了廣泛研究。以屬性核作為計算的初始約簡,引入“屬性重要性”這樣一個度量作為啟發(fā)信息,按照屬性重要程度的大小逐個將屬性加入約簡集,直到該集合是一個約簡為止。
對信息表進行值約簡的過程即是提取規(guī)則的過程。在屬性約簡所獲得的最小屬性子集的基礎(chǔ)上,文獻[8]改進的值約簡算法使獲得的規(guī)則集規(guī)模最小。文獻[9-10]受屬性約簡中屬性重要性的啟發(fā),故在值約簡過程中引入類似規(guī)則重要性的啟發(fā)信息,且文獻[9]認為文獻[8]給出的值約簡算法存在規(guī)則冗余。但是本文采用文獻[8]的值約簡算法并沒有出現(xiàn)文獻[9]所示的冗余規(guī)則,而且文獻[10]最后給出的規(guī)則集卻有明顯的冗余規(guī)則。因此,本文仍采用文獻[8]給出的值約簡算法:
1)對信息表中條件屬性進行逐列考察。除去該列后,若產(chǎn)生沖突記錄,則保留沖突記錄的原該屬性值;若未產(chǎn)生沖突但含有重復(fù)記錄,則將重復(fù)記錄的該屬性值標為“*”;對其他記錄,將該屬性值標為“?”。
2)刪除可能產(chǎn)生的重復(fù)記錄,并考察每條含有標記“?”的記錄。若僅由未被標記的屬性值即可判斷出決策,則將“?”標記為“*”,否則,修改為原屬性值;若某條記錄的所有條件屬性均被標記,則將標有“?”的屬性項修改為原屬性值。
3)刪除所有條件屬性均被標為“*”的記錄及可能產(chǎn)生的重復(fù)記錄。
4)若兩條記錄僅有一個條件屬性值不同,且其中一條記錄該屬性被標為“*”,那么,對該記錄如果可由未被標記的屬性值判斷出決策,則刪除另外一條記錄;否則刪除本記錄。
圖2是本文就殲擊機操縱面故障診斷實例所構(gòu)造的模糊神經(jīng)網(wǎng)絡(luò)。下面以此對網(wǎng)絡(luò)結(jié)構(gòu)進行說明。
圖2 模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
網(wǎng)絡(luò)第一層為輸入層,每個神經(jīng)元表示一個輸入變量,變量值是條件屬性的精確值;第二層為模糊化層,每個神經(jīng)元表示一個模糊集合,用以模擬粗糙集規(guī)則前件的離散化,第一層神經(jīng)元只與表示其離散集合的第二層神經(jīng)元相連,通過各模糊集的隸屬函數(shù)將輸入值映射為模糊集的隸屬度;第三層為規(guī)則層,實現(xiàn)粗糙集規(guī)則匹配的功能,該層節(jié)點數(shù)與規(guī)則數(shù)相同;第四層為結(jié)論層,實現(xiàn)模糊與運算,其輸出為各規(guī)則的適用度;第五層為輸出層,其功能是去模糊輸出精確量。
由此,通過神經(jīng)網(wǎng)絡(luò)構(gòu)建了完整的模糊推理系統(tǒng),通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,可以調(diào)整隸屬函數(shù)的各個參數(shù),實現(xiàn)模糊系統(tǒng)的自學(xué)習(xí)、自適應(yīng)。本文利用Matlab的模糊邏輯工具箱對此進行了設(shè)計和實現(xiàn)。
本文采用的數(shù)據(jù)來自文獻[4]的殲擊機操縱面故障識別實例,數(shù)據(jù)共6種狀態(tài)、105組數(shù)據(jù),每組數(shù)據(jù)有8個參數(shù),即構(gòu)建知識系統(tǒng) S=(U,R,V,f),本文在預(yù)處理過程中取聚類數(shù)為6,經(jīng)數(shù)據(jù)約簡后的最佳屬性子集為{c3,c5},最簡規(guī)則數(shù)目為12,得到的模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示,網(wǎng)絡(luò)訓(xùn)練前后的各隸屬函數(shù)如圖3所示,圖4為網(wǎng)絡(luò)學(xué)習(xí)誤差。
圖3 網(wǎng)絡(luò)訓(xùn)練前后的各隸屬函數(shù)
圖4 網(wǎng)絡(luò)學(xué)習(xí)誤差
為了驗證診斷模型的可行性和有效性,本文在樣本數(shù)據(jù)中加入一定的隨機噪聲構(gòu)成測試數(shù)據(jù),將得到的1 000組測試數(shù)據(jù)輸入網(wǎng)絡(luò),診斷正確率如表1所示。
表1 診斷的仿真結(jié)果
本文詳細研究了粗糙集與模糊神經(jīng)網(wǎng)絡(luò)技術(shù)結(jié)合過程中的幾個關(guān)鍵技術(shù),并用Matlab 對殲擊機操縱面故障實例數(shù)據(jù)進行了仿真。結(jié)果表明:數(shù)據(jù)離散化過程不僅完成了粗糙集方法應(yīng)用的預(yù)處理,還解決了屬性數(shù)據(jù)各模糊集合初始隸屬函數(shù)的獲取問題;通過粗糙集方法進行數(shù)據(jù)約簡,得到最簡規(guī)則,從而可以構(gòu)建結(jié)構(gòu)簡潔的神經(jīng)網(wǎng)絡(luò),且網(wǎng)絡(luò)各層都有明確的物理意義,有較好的語義;而且,構(gòu)建的網(wǎng)絡(luò)也使粗糙集方法獲取的規(guī)則得以泛化,使得該方法對故障診斷表現(xiàn)出更優(yōu)越的診斷特性。
[1]張文修,吳偉志.粗糙集理論介紹和研究綜述[J].模糊系統(tǒng)與數(shù)學(xué),2000,14(4):1-12.
[2]梁瑞勝,孫有田,周希亞.小波包變換和神經(jīng)網(wǎng)絡(luò)的某型導(dǎo)彈故障診斷方法研究[J].海軍航空工程學(xué)院學(xué)報,2008,23(2):217-220.
[3]劉瑋,宋貴寶,陳小衛(wèi).基于粗糙集和神經(jīng)網(wǎng)絡(luò)的導(dǎo)彈故障診斷方法[J].海軍航空工程學(xué)院學(xué)報,2009,24(2):214-216.
[4]許潔,胡壽松.灰關(guān)聯(lián)分析在殲擊機操縱面故障識別中的應(yīng)用[J].南京師范大學(xué)學(xué)報:工程技術(shù)版,2006,6(3):5-9.
[5]石紅,沈毅,劉志言,等.關(guān)于粗糙集理論及應(yīng)用問題的研究[J].計算機工程,2003,29(3):1-3.
[6]郝麗娜,徐心和.粗糙集理論在故障診斷規(guī)則獲取中的應(yīng)用[J].信息與控制,2001,30(7):586-590.
[7]孫即祥.現(xiàn)代模式識別[M].長沙:國防科技大學(xué)出版社,2003:268-271.
[8]常梨云,王國胤,吳渝.一種基于Rough Set 理論的屬性約簡及規(guī)則提取方法[J].軟件學(xué)報,1999,10(11):1206-1211.
[9]林嘉宜,彭宏,鄭啟倫.一種新的基于粗糙集的值約簡算法[J].計算機工程,2003,29(4):70-71.
[10]劉艷麗,王海涌,鄭麗英.基于粗集理論的決策規(guī)則約簡算法的研究與應(yīng)用[J].蘭州交通大學(xué)學(xué)報:自然科學(xué)版,2004,23(6):78-80.