孟 臻 胡 宇 唐恒光高級工程師
(1.北京信息科技大學 自動化學院,北京 100101;2.中國福利彩票發(fā)行管理中心,北京 100101)
隨著現(xiàn)代工業(yè)技術和信息技術的發(fā)展,新能源、通信、計算機和工業(yè)等各個領域的生產(chǎn)制造系統(tǒng)日趨復雜。由于結構的復雜性和各種潛在因素的影響,這些系統(tǒng)不可避免的存在故障隱患,隱患一旦誘發(fā)事故會造成不同程度的人員傷亡及經(jīng)濟損失。因此,系統(tǒng)的故障診斷方法成為研究者關注的焦點。目前常見的故障診斷方法主要包括以下3類:基于控制模型的故障診斷[1]、基于統(tǒng)計方法的故障模型診斷[2]、基于人工智能的故障診斷[3]。目前,大量研究著眼于優(yōu)化故障診斷模型的準確率,通常由診斷有度衡量其改進結果。然而,實際應用中模型穩(wěn)定性越高,成本代價付出越大。因此,有必要分析模型穩(wěn)定性對故障診斷有效性的影響。目前,對模型準確率的衡量仍缺乏統(tǒng)一體系,主要方法有相對偏差、殘差平方和法[4]等誤差分析法,以及灰色相關理論[5]和基于統(tǒng)計數(shù)據(jù)的ED檢驗、置信區(qū)間[6]等方法。灰色相關理論可以實現(xiàn)多數(shù)據(jù)輸入診斷,但只能應用于同一特征參數(shù)的范圍內(nèi),不能分析不同特征范圍的參數(shù)關聯(lián)性,不適用不同范圍特征參數(shù)故障診斷模型間的相對比較;殘差平方和法是適用于回歸模型的評估方法,受因變量和自變量絕對值大小的影響,不利于在不同故障診斷模型間進行相對比較;置信區(qū)間指標是基于測試數(shù)據(jù)的診斷推理結果,同時符合正態(tài)分布的假設,但是在數(shù)據(jù)規(guī)模較小的情況下將產(chǎn)生較大誤差,且置信區(qū)間上限不隨準確度的增加而收斂于1,所以不適用于故障診斷準確度高的模型。在上述研究的基礎上,考慮故障診斷輸出結果的真實分布情況,提出基于橢圓傅利葉描述子的故障診斷模型(Clustering Stability Index Method Based on Elliptic Fourier Descriptor,EFDCSI)穩(wěn)定性評估方法,能夠在不了解故障診斷模型的參數(shù)等情況下提供客觀的評價,并采用基于特征聚類故障診斷模型的電動機軸承診斷應用實例進行對比驗證,證明所提方法有效。
形狀是目標物重要的視覺特征之一?,F(xiàn)有的形狀表示方法可以分為2大類:基于區(qū)域特征的形狀表示方法和基于輪廓特征的形狀表示方法?;谳喞姆椒ㄖ饕媚繕烁采w區(qū)域邊界的像素信息來描述形狀[7-8]。
傅利葉描述子是一種經(jīng)典的基于輪廓的形狀表示方法,最早由COSGRIFF(1960)提出。其主要思想是利用表示形狀整體頻率的一組數(shù)據(jù)來描述輪廓特征,對旋轉(zhuǎn)、平移等操作具有不變性,是形狀研究最廣泛的描述子。在算法研究方面,研究人員在改進基于傅利葉算子的形狀表示方面做了很多工作,以提高對形狀的描述能力。如ZHANG等[9]提出一種增強的通用傅利葉描述子抽取圖像內(nèi)容描述關鍵部分的方法,用以解決大數(shù)形狀描述不適合泛型形狀描述的缺點;LI等[10]提出一個基于區(qū)域的仿射不變量環(huán)傅利葉描述子進行仿射不變特征提取的方法,可用在具有多個組件的對象輪廓特征提?。籏ASAUDHAN等[11]提出一個增強版本的網(wǎng)格距離傅利葉描述子計算圖像相似度的方法,提高圖像匹配率;BELKHAOUI等[12]將傅利葉描述子與分水嶺算法(Watershed Algorithm,WS)相結合,提出一種利用逆合成孔徑雷達圖像進行目標自動識別的過程和方法,解決雷達圖像的目標識別問題。
1.2.1 邊緣檢測
Canny邊緣檢測算子相對于Roberts Cross算子、Prewitt算子、Sobel算子、Kirsch算子具有明顯優(yōu)勢。因此運用Canny算子進行邊緣檢測,以識別其輪廓邊界。
首先為了平滑圖像,以減少邊緣檢測器上明顯的噪聲影響,對圖像采用式(1)所示大小為的高斯濾波器核對圖像進行高斯濾波。
(1)
式中:
σ—標準差;
K0—核矩陣的維數(shù),是正整數(shù);
d1、d2—像素點的位置。
若圖像中一個3×3的窗口為W,要濾波的像素點為e,則經(jīng)過高斯濾波后e,像素點的亮度值為:
(2)
其中,*為卷積體符號,sum表示矩陣中所有元素相加求和。Canny算法采用4個算子來檢測圖像中的水平、垂直和對角邊緣,邊緣檢測的算子返回水平方向梯度Gx和垂直方向梯度Gy的一階導數(shù),由此便可以確定像素點的梯度強度G和方向梯度θ,如式(3)。
θ=arctan(Gy/Gx)
(3)
將當前像素的梯度強度與沿正負梯度方向上的2個像素進行比較,如果當前像素的梯度強度最大,則該像素點保留為邊緣點,否則被抑制掉,稱之為最大值抑制。在施加最大值抑制后,仍然存在由噪聲和顏色變化引起的一些邊緣像素,為解決這些雜散響應,通過設立選擇高低閾值來實現(xiàn)。如果邊緣像素的梯度值高于高閾值,則標記為強邊緣像素;如果邊緣像素的梯度值小于高閾值大于低閥值,則記為弱邊緣像素點,但如果弱邊緣像素的8個鄰域像素只要有一個為強邊緣像素,則可以作為邊緣點保留下來;如果邊緣像素的梯度值小于低閾值,則被抑制。
1.2.2 邊緣特征的傅利葉描述子
確定目標邊界的一個起始點(x0,y0)沿逆時針方向以一定速度移動后,就可以用邊界點的坐標對序列來描述邊界。邊界曲線被用復數(shù)形式定義:
s(t)=x(t)+jy(t),t=0,1,…,N-1
(4)
式中:
t—沿邊界曲線移動的單位弧長;
x(t)—t時刻移動點位置的橫坐標;
y(t)—t時刻移動點位置的縱坐標;
j—表示虛數(shù)單位;
N—正整數(shù),表示坐標對的個數(shù)。
為描述圖像輪廓的需要,選定的起始點需要沿邊界曲線移動一周。因此,s(t)是一個周期2π的周期函數(shù)。為取得邊界曲線的橢圓傅利葉描述子,首先進行傅利葉級數(shù)展開,對s(t)可將其用一維傅利葉級數(shù)展開為:
(5)
式中:
l—第l個分量;
w—角頻率;
T—周期。
根據(jù)式(4)可以有橢圓系數(shù)表達式:
sk=sxk+jsyk
(6)
(7)
根據(jù)三角函數(shù)與指數(shù)函數(shù)的關系,有:
(8)
則:
(9)
m是輪廓曲線的采樣點數(shù)量,通常為輪廓曲線像素點數(shù)量的1/2。xi和yi是x(t)和y(t)第個樣本點值。根據(jù)式(8)和式(9),sk可以看作復數(shù)對之和。即
sk=Ak-jBk,s-k=Ak+Bk
(10)
(11)
式(5)可以被表達為:
(12)
稱式(13)為輪廓曲線的橢圓描述子。
(13)
1.2.3 基于傅利葉描述子的故障診斷模型穩(wěn)定性評價
如果基于特征聚類故障診斷模型的穩(wěn)定性好,則類中心的凝聚力較強,即向某一類中添加或移除同類數(shù)據(jù)時,聚類結果的形狀變化極小,反之則形狀變化較大。假設類內(nèi)元素數(shù)據(jù)變化前后映射圖像的邊界描述子分別為EFD1和EFD2,將2個故障分類結果輪廓形狀的相似性定義為故障診斷模型的穩(wěn)定性評價標準,如式(14)所示:
(14)
式中,
cov()—2個描述子的協(xié)方差;
σ—描述子向量的標準差。
sim的值越接近1,說明故障分類模型的穩(wěn)定性越好。
為了電動機軸承故障新技術、新理論的實驗與驗證,一個由ROCKWELL開發(fā)的電機軸承狀態(tài)評估系統(tǒng)獲取一系列可以用來驗證或改進電機性能評價技術的電機性能數(shù)據(jù)庫[13]。平臺包括一個1.5kW的電動機,一個扭矩傳感器/譯碼器,一個功率測試計,還有電子控制器。待檢測的軸承支撐著電動機的轉(zhuǎn)軸,驅(qū)動端軸承為SKF6205,風扇端軸承為SKF6203,軸承用電火花加工單點損傷,損傷直徑分為0.177 8、0.355 6、0.533 4、1.016、1.016mm。其中,軸承外圈的損傷點在時鐘:3、6、12點鐘3個不同位置進行設置。電動機風扇端和驅(qū)動端的軸承座上方各放置一個加速度傳感器,用來采集故障軸承的振動加速度信號。共采集正常軸承、單點驅(qū)動端和風扇端故障的數(shù)據(jù)。對于驅(qū)動端軸承,分別使用12kHz和48kHz的頻率進行數(shù)據(jù)采集。對于風扇端軸承,僅使用12kHz的頻率進行數(shù)據(jù)采集。數(shù)據(jù)文件均為Matlab格式(.mat格式)。每一個文件包含風扇端和驅(qū)動端振動數(shù)據(jù),也包含電機轉(zhuǎn)速。對于所有文件,變量名字的含義如下:DE:驅(qū)動端加速度數(shù)據(jù);FE:風扇端加速度數(shù)據(jù);BA:基本加速度數(shù)據(jù);Time:時間序列數(shù)據(jù);RPM: Rpm During Testing。部分數(shù)據(jù),見表1。
聚類分析是一種無監(jiān)督學習,無需事先定義類別或給出訓練樣例等先驗來說明數(shù)據(jù)關系,可以直接將一個數(shù)據(jù)集劃分為若干差異性較大的類,而類內(nèi)數(shù)據(jù)具有極高的相似性。這對于無法確定標準信息征兆群的場景是非常適用的,如故障診斷。由于真實環(huán)境中系統(tǒng)參數(shù)、環(huán)境干擾與噪聲很難準確確認,造成很難建立起精確的故障診斷模型,基于數(shù)據(jù)驅(qū)動的方法避免了對過程進行數(shù)學建模,在不清楚診斷對象機理信息的情況下,可以通過歷史數(shù)據(jù)進行學習建模完成故障診斷。常用聚類算法有K-means[14]、Birch[15]、Em[15]、Dbscan[16]、Clara[17]等。本文主要研究故障診斷模型穩(wěn)定性評價方法EFDCSI。因此,直接采用Clara、K-means、Dbscan方法進行基于特征聚類的電機驅(qū)動端軸承故障診斷。表1中數(shù)據(jù)DE是具有時序特征的驅(qū)動端加速度數(shù)據(jù),如圖1。
表1 部分驅(qū)動端軸承故障數(shù)據(jù)
圖1 DE時間序列圖
在電機軸承故障診斷過程中,故障特征提取的效果決定最終診斷率的高低,振動數(shù)據(jù)的峰均比(Peak-to-AverageRatio,PAR)、峭度(Kurtosis)、偏度(Skewness)涵蓋振動的分布特征、統(tǒng)計特征、線性特征,能有效反映振動事件主要特性。因此,將這3個特征作為故障診斷的依據(jù)。具體計算方法如式(15)-(17):
(15)
式中:
E—數(shù)學期望;
p—峰值功率,W。
(16)
(17)
式中:
U(t)—瞬時振幅;
q(x)—概率密度;
由于振動的部分特征向量可能具備一定的相關性,會影響聚類故障診斷模型的穩(wěn)定性。所以,去除相關特征向量是完成故障診斷的第一步。利用主成分分析法提取不相關的特征向量,計算結果顯示PAR、Kurtosis可以表征表1中DE的特征向量,見表2。
表2 DE的特征向量表
為有效驗證所提的EFDCSI評價方法的可靠性,采用如戴維森堡丁指數(shù)(Davies-Bouldin,DB)[18]、鄧恩指數(shù)(Dunn Validity Index,DVI)[19]、輪廓系數(shù)(Silhouette Coefficient,SC)[20]等10余項聚類評價指標對DE的特征向量的最佳聚類個數(shù)進行預評估,將電機軸承故障分為2類。即將采用Clara、K-means、Dbscan分別將故障分為2類。將特征集F按照3:1的比例從中隨機抽取測試集T,然后分別對測試集T和特征集F進行二分類。分類結果,如圖2。
(a)特征集F的Clara聚類
分別將測試集T與特征集F相對應的第一類數(shù)據(jù)提取出來,如圖3。
(a)特征集F的Clara聚類結果的I類
為利用圖像邊緣檢測技術評價基于特征聚類的故障診斷模型的穩(wěn)定性,需要將二維空間點根據(jù)一定規(guī)則映射為圖像。采用狄利克雷圖對空間點坐標進行圖形化映射,以任一點作為三角形的頂點,將與頂點歐氏距離最近的2個點與頂點連接,經(jīng)過若干次迭代得到Delaunay三角網(wǎng)。測試集T與特征集F的第I類數(shù)據(jù)的泰森圖,如圖4。
(a)特征集F的Clara聚類泰森圖
經(jīng)過Canny算子邊緣檢測后,圖4的邊緣輪廓,如圖5。
(a)特征集F的Clara聚類泰森圖輪廓
按照式(13)可得圖5所示的故障分類輪廓曲線的橢圓傅利葉描述子,并將其歸一化,部分數(shù)據(jù),見表3。
表3 故障分類邊緣的橢圓傅利葉描述子
聚類結果的驗證通常采用2種技術,一類是簇內(nèi)距離,如簇內(nèi)總和的平方(within.cluster.ss)計算的是每個聚內(nèi)部的距離平方,值越小說明類內(nèi)數(shù)據(jù)的特征越相似,聚類效果越好;一類是簇間距離,如平均輪廓寬度(avg.silwidth)計算的是平均輪廓系數(shù),值越大說明不同類的數(shù)據(jù)特征差距越大,聚類算法的數(shù)據(jù)區(qū)越好。將聚類算法評估指標:within.cluster.ss、avg.silwidth與提出的指標sim進行比較,見表4。由表4可知,sim值表明3種聚類算法的故障診斷效果K-means算法最好,Clara算法次之,Dbscan算法最差,與評估指標avg.silwidth和within.cluster.ss的結論一致,證明提出的EFDCSI方法對于基于特征聚類的故障診斷模型穩(wěn)定性的評價是有效的。
表4 Clara、K-means與 Dbscan算法性能評價
EFDCSI針對基于特征聚類的故障診斷模型穩(wěn)定性效果評價問題,從聚類問題的核心思想出發(fā),結合圖像輪廓檢測技術,將故障診斷模型穩(wěn)定性評估問題轉(zhuǎn)化為圖形結構相似度計算問題,通過提取故障分類結果輪廓曲線的特征向量計算輪廓形狀相似度來評價故障診斷效果,是一種新型的基于特征聚類故障診斷模型穩(wěn)定性的評價方法。該方法可以在數(shù)據(jù)樣本及數(shù)據(jù)方法未知的情況下,僅根據(jù)故障分類結果的可視化圖形輪廓特征向量來評價模型故障診斷效果的穩(wěn)定性。與經(jīng)典聚類評估算法K-means、Clara、Dbscan的評估結果一致,且計算簡單。從實驗方法與原理來計,該評價適用于基于特征聚類的故障診斷模型穩(wěn)定性評價。