侯國安,田舟祺
(銀川能源學院,寧夏 銀川 750015)
壓縮機是化工生產(chǎn)中的重要設(shè)備,隨著科學技術(shù)的飛速發(fā)展,壓縮機結(jié)構(gòu)日益復(fù)雜化,在工作中經(jīng)常會發(fā)生一些故障,導(dǎo)致生產(chǎn)停頓,甚至機毀人亡,造成重大經(jīng)濟損失和社會影響。如何及時發(fā)現(xiàn)和預(yù)測故障就顯得十分重要,于是出現(xiàn)了數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)就是應(yīng)用設(shè)備產(chǎn)生的振動數(shù)據(jù),進行分析處理,找到分類規(guī)則,從而進行設(shè)備故障的診斷[1]。
壓縮機屬于旋轉(zhuǎn)機械的一類,轉(zhuǎn)子運作過程中將會產(chǎn)生振動,依據(jù)振動的頻域和時域特征進行分析,對故障的診斷具有重要意義[2]。壓縮機轉(zhuǎn)子故障的主要類型有以下幾種:
故障特征從頻率角度分析,主要出現(xiàn)一倍頻和二倍頻;如果故障比較微小,軸心軌跡會出現(xiàn)橢圓形;嚴重時會呈現(xiàn)“8”字形[3]。
故障特征主要是一倍頻,軸心軌跡會出現(xiàn)橢圓形或圓形[4]。
故障特征1 倍頻、2 倍頻、3 倍頻與4 倍頻都存在,軸心軌跡會出現(xiàn)橢圓形或圓形[5]。
故障特征主要為二倍頻以上,軸心軌跡是發(fā)散的曲線,有時會出現(xiàn)花瓣狀[6]。
決策樹是一種歸納學習算法,它可以從大量無序、無規(guī)則的數(shù)據(jù)中找出分類規(guī)則。
決策樹是一種樹狀的流程圖模型,模型樹的頂層是其根節(jié)點,是不同的信息集合,各個樹枝是屬性的測試,樹葉表示分析結(jié)果。
針對類型判別的過程,決策樹是人們普遍采用的經(jīng)典歸類方式。分析時,決策樹的樹根結(jié)點首先選取恰當?shù)膶傩?,將全部初始?shù)據(jù)離散規(guī)劃為一些子集,接著在各個子集中設(shè)立低層次的結(jié)點和分枝,這樣便能夠?qū)⒎眮y的分類任務(wù)簡單化。在模式識別中,決策樹作為模式識別中一種行而有效的分類方法,通過從根節(jié)點開始選擇合適的屬性,將樣本數(shù)據(jù)集分割為若干子集,在子集中重復(fù)建立下層節(jié)點和分支,可以將繁雜的多類別分類問題轉(zhuǎn)變?yōu)橐环N簡單的分類問題。主要的決策樹方法有:ID3 算法、SPRIND 算法、CLS 算法和C4.5 算法等。
本文中的數(shù)據(jù)是關(guān)于30 個壓縮機的振動樣本監(jiān)控數(shù)據(jù),其中,訓(xùn)練集選用了16 組數(shù)據(jù),另14 組將作為決策樹的測試數(shù)據(jù),第213 頁表1 為頻域下的故障下的樣本,在故障狀態(tài)中選定1 為轉(zhuǎn)子不平衡,2 為轉(zhuǎn)子不對中,3 為轉(zhuǎn)子的碰磨,讀取數(shù)據(jù)庫中BLOL 型的時域信號進行FFT 變化,提取出能反映設(shè)備故障特征的1 個~6 個倍頻值對應(yīng)的幅值[7]。在決策表中這個故障特征作為條件屬性e=(F1,F(xiàn)2,F(xiàn)3,F(xiàn)4,F(xiàn)5,F(xiàn)6),C 為決策屬性,這里由于原始樣本數(shù)據(jù)是連續(xù)性的因此首選要對樣本進行離散化處理,數(shù)據(jù)測試樣本見第213 頁表2,離散化后的樣本見第213 頁表3。數(shù)據(jù)的離散化方法常用的有3 種,即,基于最大熵法、等寬間距法及等頻率區(qū)間法,綜合考慮本文將選用等寬間距法來進行數(shù)據(jù)的離散化處理,它主要是把數(shù)據(jù)平均分為相等的區(qū)間,具體如下:
表1 頻域下的故障下的樣本
表2 數(shù)據(jù)測試樣本
表3 離散化后的樣本
根據(jù)算法所介紹的方法對樣本進行計算。在決策表中這個故障特征F 作為條件屬性,C 為決策屬性樣本共有6 個條件屬性值,其中,每個描述屬性都對應(yīng)3 個類1 不平衡、2 不對中、3 碰磨[7]。
其中,P(C1)=9/16,P(C2)=3/16,P(C3)=4/16。
對訓(xùn)練集分類所需期望為:
描述屬性F1有5 個屬性值分別為1,2,3,4,5,它們的信息量分別為:
同理,可得訓(xùn)練集F2所得信息量為:
F3的信息量:
F4的信息量:
F5的信息量:
F6的信息量:各屬性劃分訓(xùn)練集所得熵為:
各屬性劃分訓(xùn)練集的信息增益為:
計算各信息熵如下:
各描述屬性的信息增益比:
比較各個描述屬性的信息增益比,選擇信息增益比最大的屬性F6作為該決策樹的根節(jié)點。當F65個不同的取值時將產(chǎn)生相應(yīng)的樣本子集,樣本子集如表4、表5。
表4 F6 取1 的樣本集
表5 F6 取2 的樣本子集
由表4、表5 可知當F6取值為2 時樣本均對應(yīng)同一類別3,則作為葉子節(jié)點故障類別為轉(zhuǎn)子碰磨,取1 時樣本子集并不“純”以此要在該屬性下繼續(xù)選擇信息增益比最大的,如此下來將構(gòu)造出一棵決策樹如第215 頁圖1。
圖1 C4.5 生成的的故障診斷決策樹
決策樹生成根據(jù)以下規(guī)則:
每一條規(guī)則都為轉(zhuǎn)子故障診斷的分類。如第一條“if A=3 then ②”,可解釋為如果旋轉(zhuǎn)機械轉(zhuǎn)子特征頻率F6的頻率大于0.08 小于1.6,則可能發(fā)生轉(zhuǎn)子碰磨了。同理,第二條可解釋為如果轉(zhuǎn)子特征頻率F6的頻率大于0 小于0.8 且特征頻率F5的頻率大于0 小于0.8,且特征頻率F3 的頻率大于0.8 小于1.6,則可能發(fā)生轉(zhuǎn)子不平衡了[8]。這樣,通過基于粗糙集的數(shù)據(jù)挖掘技術(shù),將6 個屬性約簡變?yōu)? 個,使旋轉(zhuǎn)機械轉(zhuǎn)子故障診斷分類維度降低,挖掘出更方便的分類規(guī)則。我們可以按照這些規(guī)則,代入新的樣本進行分類,也可以在數(shù)據(jù)庫建立過程中形成檢索和匹配的規(guī)則。
本文分析了壓縮機轉(zhuǎn)子系統(tǒng)常見振動故障與頻域的關(guān)系,利用粗糙集理論中可辨識矩陣方法進行屬性約簡,刪除了冗余屬性,克服了在決策樹生成過程中產(chǎn)生子樹重復(fù)的缺點,用C4.5 方法進行分類,得到故障診斷規(guī)則,通過診斷規(guī)則可以預(yù)測壓縮機故障的發(fā)生。