石新發(fā) 邢廣笑 賀石中 謝小鵬
(1.廣州機械科學研究院有限公司 廣東廣州 510530;2.中國人民解放軍92001部隊 山東青島 266000;3.華南理工大學機械與汽車工程學院 廣東廣州 510640)
船舶柴油機集成化、自動化程度以及功率密度不斷提升,其運行可靠性、安全保障難度加大[1]。磨損是柴油機主要故障源之一,對其進行監(jiān)測診斷,能夠保證柴油機正常運行,延長其使用壽命[2]。油液監(jiān)測作為船舶柴油機等往復式機械潤滑磨損故障診斷的主要技術之一[3],隨著船舶柴油機運行可靠性要求的增高,磨損監(jiān)測與診斷需求增大,且特征屬性數(shù)量的增加,使得油液監(jiān)測多技術手段所獲取的信息特征無論從量級、單位、粒度等均有很大的不同[4],因而在診斷過程中易受到無用或冗余數(shù)據的干擾,造成診斷決策過程的復雜程度增高[5]。特征約簡是將大量無關和冗余的特征屬性去除的有效方法[6-7],當前在對油液監(jiān)測數(shù)據屬性約簡中,大都使用的是有監(jiān)督方法,例如石新發(fā)和劉東風[8]應用的粗糙集理論,徐啟圣等[9]應用的支持向量機,存在依賴專家經驗的問題。同時,實現(xiàn)潤滑磨損故障診斷智能化也是油液監(jiān)測發(fā)展的重要趨勢[12],BP神經網絡作為相對成熟的模式識別與分類算法,具有結構設計簡單、識別速度快的特點。
本文作者基于熵理論和BP神經網絡組合,構建了一種能夠實現(xiàn)診斷屬性無監(jiān)督約簡和磨損故障模式智能識別的融合算法模型,并以某型船舶柴油機44個磨損監(jiān)測數(shù)據樣本為應用對象,對模型進行了應用驗證,結果表明該模型在保證數(shù)據集分類特性的基礎上,有效降低了冗余數(shù)據的干擾,提升了故障診斷的準確性。
在對一個系統(tǒng)狀態(tài)數(shù)據進行分析時,一般需要對數(shù)據進行預處理,保留有用或者信息量較大的特征。文中應用信息熵方法對該型柴油機磨損診斷數(shù)據進行一次約簡篩選。
(1)
則系統(tǒng)總信息熵值為
(2)
為了更好地實現(xiàn)系統(tǒng)狀態(tài)數(shù)據特征的優(yōu)化選擇,同時保留系統(tǒng)樣本間的分類特性,引入熵度量理論,對能夠表征系統(tǒng)分類特性的數(shù)據集優(yōu)化,實現(xiàn)數(shù)據的二次約簡降維。熵度量法是一種基于特征重要度的特征約簡,以樣本間的距離作為熵計算的基本要素,以此實現(xiàn)特征選擇[12-13]。
熵度量算法基于一個相似性度量,該度量與樣本之間的距離成反比[14],具體表示為
Sgh=e-aDgh
(3)
其中:g,h=1,2,…,N。
式(3)中Sgh表示樣本Yg和Yh之間的相似度;Dgh為樣本Yg和Yh之間的距離,一般用標準化的歐氏距離計算,其計算式為
(4)
式中:k=1,2,…,n,n為樣本維數(shù),maxYk和minYk分別表示樣本集第k個屬性的標準化數(shù)據最大值和最小值。
式(3)中a是一個參數(shù),其計算式為
a=-(ln0.5)/D
(5)
對于包含N個數(shù)據樣本的數(shù)據特征集,其熵按照式(6)計算。
(6)
當系統(tǒng)移除屬性元素ci后引起已知數(shù)據集的信息熵的變化為
ΔE(ci)=|Eci-E(ci-{ci})|
(7)
ΔE(ci)是屬性ci重要度的一個量化值,其值越大,說明屬性ci對原始數(shù)據集越重要。
(8)
約簡集合C′中最優(yōu)約簡子集C″定義為
(9)
磨損診斷屬性集合經過2次約簡后,所產生的新子集能夠有效保留系統(tǒng)信息量和分類特性,降低后續(xù)診斷識別過程中的工作量和復雜程度。
依據構建的潤滑磨損特征選擇方法,設計特征子集優(yōu)選流程如圖1所示。按照設計的流程,柴油機磨損故障診斷原始屬性集經過2次特征屬性約簡,并按照自己選取條件優(yōu)選新的特征集合。
圖1 磨損故障診斷特征子集優(yōu)選流程
在第一次約簡中,參照主成分特征提取的特征約簡規(guī)則,以新特征集中屬性的信息熵值和大于或等于原始特征集信息熵值的80%為選擇規(guī)則,對屬性集進行第一次選擇。
選擇用于某型船舶柴油機磨損故障診斷研究的44個油樣的磨損監(jiān)測數(shù)據,其數(shù)據集可表示為
C={cs1,cs2,…,csp,…,cz1,cz2,…,czt}
其中:數(shù)據集包含發(fā)射光譜的Fe、Cr、Pb、Cu、Al、Si、Na、Mg、Ca、P、Zn等11種元素指標(屬性),DL(大鐵磁性顆粒)、DS(小鐵磁性顆粒)、DL+DS、DL-DS、Is等5個直讀鐵譜指標(屬性)。按照式(1)計算每個監(jiān)測指標的信息熵,具體見圖2。
圖2 某型船舶柴油機磨損故障診斷指標信息熵值
按照各磨損指標信息熵值從大到小累加,當累加至某個指標時,累加的信息熵值大于等與原監(jiān)測數(shù)據集信息熵的80%時,選擇用于累加的指標作為新的數(shù)據指標(屬性)集,從原始數(shù)據集中選擇10個指標構成新的數(shù)據集,具體如下:
C1={Fe,Cr,Cu,Al,Na,Mg,DL,DL+
DS,DL-DS,Is}
按照式(5)—式(8)對經過一次約簡的新子集C1進行二次約簡,計算篩選過程中的各磨損診斷指標的熵重要度EI結果見表1。表中約簡第一、二、三維表示將C1依次減少一維的計算過程,表中的EI是約簡過程中計算的各熵重要度。按照式(9)選擇每減少一維的最優(yōu)子集,進入下一步約簡優(yōu)化。
表1 特征約簡過程中各指標的熵重要度
按照專家提供的約簡規(guī)則,對C1約簡3維后獲得的新子集為
C″={Fe,Cu,Al,Na,Mg,DL-DS,Is}
新的子集各指標數(shù)據見圖3、圖4,分別為原子發(fā)射光譜數(shù)據和直讀鐵譜數(shù)據。
圖3 油樣原子發(fā)射光譜數(shù)據
圖4 油樣直讀鐵譜數(shù)據
BP神經網絡是多層前向傳播的網絡,由輸入層、隱含層(可能有多層)、輸出層構成,3層神經網絡可以很好地解決一般的模式識別問題[15]。由于該網絡被大量應用,文中不再對網絡的基本結構、算法過程等贅述。經過2次約簡,獲取的該型柴油機磨損診斷指標(屬性)集為7維。按照網絡構建的規(guī)則,一般隱含層神經元的個數(shù)為2,因此,將神經網絡的層數(shù)設計為3層,網絡輸入層神經元數(shù)為7個,輸出層神經元數(shù)為6個,則隱含層神經元個數(shù)為15個,網絡輸入向量范圍為[0,1],隱含層傳遞函數(shù)選擇tansig,輸出層傳遞函數(shù)選擇logsig,訓練函數(shù)選擇trainlm,最大訓練次數(shù)為100,網絡誤差0.001,網絡結構見圖5。
圖5 BP神經網絡結構
文中研究的柴油機在使用中故障模式主要有以下幾種類型:①主軸承異常磨損S2;②活塞異常磨損S3;③潤滑油進海水S4;④鐵質摩擦副異常磨損S5;⑤綜合磨損狀態(tài)較差S6等5種。
通過希爾變量(0或者1)來實現(xiàn)故障模式征兆的表達,加上正常狀態(tài),故障模式向量由6個元素組成,即為V={S1,S2,S3,S4,S5,S6},如果某種故障模式存在,則向量對應的元素為1,其余為0。由此以上故障模式可以表達為
正常狀態(tài):S1={1,0,0,0,0,0};
主軸承異常磨損:S2={0,1,0,0,0,0};
活塞異常磨損:S3={0,0,1,0,0,0};
潤滑油進海水:S4={0,0,0,1,0,0};
鐵磁性顆粒較多:S5={0,0,0,0,1,0};
綜合磨損狀態(tài)較差:S6={0,0,0,0,0,1};
對于多種故障現(xiàn)象的存在,則需要將故障模式表征向量對應的元素同時為1,例如同時存在活塞異常磨損征兆和潤滑油進海水故障時,表示為
S多={0,0,1,1,0,0}
該型柴油機磨損診斷數(shù)據集,經過特征選擇與優(yōu)化后得到的特征子集為
C″={Fe,Cu,Al,Na,Mg,DL-Ds,Is}
將該型柴油機的44個油樣的磨損監(jiān)測數(shù)據通過故障診斷專家分類,進行故障類別標識。將標識后的樣本選取30個作為訓練樣本,14個作為測試樣本,應用選擇的子集和設計的BP神經網絡驗證文中構建的識別模型的有效性。被識別的14個磨損故障測試樣本的神經網絡類編碼見表2。
表2 測試樣本識別的神經網絡編碼
將測試樣本的神經網絡編碼與該型柴油機故障模式表達的希爾變量對應,雖然部分油樣識別編碼的希爾變量表征存在不足1,在數(shù)值上為0.8、0.75,但也可基本認定為屬于對應的故障模式。
為驗證特征約簡對潤滑磨損故障識別效能的提升,應用所構建的BP神經網絡直接對以上44個樣本的原始數(shù)據集進行訓練與測試,結果見表3。
表3 未進行特征約簡的測試樣本識別的神經網絡編碼
表3給出了未進行特征選擇的14個磨損故障測試樣本的神經網絡識別編碼。與表2相比,測試樣本識別結果的準確性和識別編碼的規(guī)則性均較差。例如:9號樣本,表2中的識別結果為主軸承異常磨損,而表3中的識別結果在3個故障模式的編碼均為0.9以上,造成了識別混亂,實際反饋9號樣本對應的設備確實發(fā)生了主軸承異常磨損。
從與專家給出的故障分類對比整體上看,表2中的測試樣本油樣神經網絡編碼對應的故障模式與故障診斷專家的分類標識基本一致,說明了所構建的特征屬性約簡和BP神經網絡組合模型的有效性。
(1)應用熵理論,構建了某型船舶柴油機磨損故障診斷特征無監(jiān)督約簡算法,該算法經過基于信息熵值的特征集一次約簡和基于度量熵的特征子集二次約簡,在保證數(shù)據集分類特性的基礎上,有效降低磨損故障識別的特征指標維度。
(2)在特征約簡的基礎上,應用設計BP神經網絡和磨損故障模式識別規(guī)則對某型船舶柴油機44個油樣磨損監(jiān)測數(shù)據進行磨損故障識別分析,以其中的30個油樣數(shù)據為訓練樣本,以剩余14個為測試樣本,識別結果與專家的分類基本一致。
(3)經過對實施特征約簡前后的識別結果對比驗證,所構建的柴油機磨損故障識別模型,實現(xiàn)了從特征集選擇到故障模式識別的融合應用,有效降低了模型構建的復雜程度和無用數(shù)據的干擾,提升了故障識別的準確性。