侯照文 張 斌
(廣州市特種機(jī)電設(shè)備檢測研究院 廣東 廣州 510180)
隨著越來越多的復(fù)雜機(jī)電設(shè)備被應(yīng)用在多種工業(yè)領(lǐng)域,對(duì)這些設(shè)備做出高效和準(zhǔn)確的狀態(tài)監(jiān)測以及故障診斷是保證其穩(wěn)定運(yùn)行的關(guān)鍵所在,而有效的數(shù)據(jù)挖掘技術(shù)正是提高診斷效率和精度的重要手段。 目前人們往往將各種智能算法應(yīng)用于機(jī)械信號(hào)的特征提取,取得了一定成效,但這些算法也有各自不同的優(yōu)點(diǎn)和缺點(diǎn)[1-2]。 為了更好地選取機(jī)械信號(hào)中的敏感特征,本文提出了基于粒計(jì)算的旋轉(zhuǎn)機(jī)械信號(hào)特征提取技術(shù)。
作為粒計(jì)算領(lǐng)域中的重要分支,鄰域粗糙集在屬性約簡方面的作用越來越受到人們的關(guān)注和研究[3]。 由于省去了以往粗糙集約簡都要先進(jìn)行連續(xù)屬性離散化的過程,因此這種算法可以在極大的保留原有決策表包含的數(shù)據(jù)信息的前提下,最大限度的剔除冗余信息。
本文首先介紹基于歐式距離評(píng)估的鄰域粗糙集的基本概念和?;s簡方法;然后通過實(shí)驗(yàn)室齒輪振動(dòng)信號(hào)分析驗(yàn)證了新方法的作用。
首先定義鄰域概念,對(duì)于xi∈U,U 為論域,定義xi的δ-鄰域?yàn)?/p>
其中Δ 是一個(gè)距離函數(shù),對(duì)于
?x1,x2,x3∈U,Δ 滿足如下關(guān)系:
Δ(x1,x2)≥0,Δ(x1,x2)=0,當(dāng)且僅當(dāng)x1=x2;
Δ(x1,x2)=Δ(x2,x1);
Δ(x1,x3)≤Δ(x1,x2)+Δ(x2,x3);
δ(xi)稱為由xi生成的δ 鄰域信息粒子,也就是所取鄰域值,所以當(dāng)選擇不同大小鄰域值時(shí),論域就可以相應(yīng)被劃分為不同的粒度層。
為了方便討論對(duì)論域的?;xA 包含于B 的強(qiáng)度函數(shù)I(A,B)為
當(dāng)A=? 時(shí),規(guī)定I(A,B)=0。 這時(shí)有0≤I(A,B)≤1。
設(shè)集合X 為論域U 的非空子集, 定義可變精度k-下近似和上近似分別為:
其中k≥0.5。
鄰域粗糙集?;瘜傩缘年P(guān)鍵在于選擇合適的鄰域δ 值。本文先用基于特征歐式距離的方法得到鄰域基點(diǎn), 設(shè)S=(U,A,V,f)是一個(gè)數(shù)值型信息系統(tǒng),其中U:對(duì)象的非空集合,即論域;A: 屬性的非空有限集合,V=a∈A∪Va,V?R,R 為N 維實(shí)數(shù)
空間,Va為屬性a 的值域;f:U×A→V 是一個(gè)信息函數(shù), 它為每個(gè)對(duì)象的每個(gè)屬性賦予一個(gè)信息值,即?a∈A,x∈U,f(x,a)∈Va。 則U 關(guān)于屬性集P 的歐式距離矩陣Mdp=(dp(xi,xj))是一個(gè)|U|×|U|的矩陣。 其中任一元素為:
即取得鄰域基點(diǎn)值為
取兩側(cè)鄰域值:n_value1=n_value2-r;n_value3=n_value2+r,其中r 為半徑。
1.2 節(jié)中選取了三個(gè)不同大小的鄰域值, 分別對(duì)應(yīng)三個(gè)粒度層。 為了使不同粒度層的k 值配合上正區(qū)域的動(dòng)態(tài)變化[4-5],需要在原鄰域粗糙集中加入動(dòng)態(tài)調(diào)節(jié)因子。 在改進(jìn)的模型中,包含度k 值將隨著選取鄰域值的逐層增加而相應(yīng)減小。
首先,在鄰域基點(diǎn)即中間層n_value2 下可變精度k 的定義同1.1 節(jié)中(3)和(4)式。
接著引入動(dòng)態(tài)調(diào)節(jié)因子k0,0.01≤k0≤0.1, 則在第一層鄰域值n_value1 下定義可變精度k1=k+k0下近似和上近似分別為:
在第三層n_value3 下定義可變精度k2=k-k0下近似和上近似分別為:
X 的近似邊界定義類似中間層。
由上述定義可以看出,粗糙集包含度隨著鄰域值的增大而減小,這種動(dòng)態(tài)的變化改善了約簡的k 區(qū)間和正區(qū)域動(dòng)態(tài)變化的配合問題,從而進(jìn)一步改進(jìn)原有鄰域粗糙集模型對(duì)噪聲信號(hào)的容納能力。
分別在三個(gè)鄰域值和相應(yīng)包含度下對(duì)提取到的屬性集進(jìn)行約簡?;?。 定義決策D 對(duì)屬性B 的依賴度為γB(D)=Card(NBD)/Card(U),其中Card( )表示求集合的基數(shù)。
由此給定一個(gè)鄰域決策系統(tǒng)
NDT=<U,A,D>,B?A,?a∈A-B,其中U:對(duì)象的非空集合,即論域;A:屬性的非空有限集合,D:決策屬性。
定義a 相對(duì)于B 的重要度為
基于屬性重要度指標(biāo),在一定鄰域值下構(gòu)造貪心式屬性約簡算法[3]。
基于鄰域粗糙集模型的數(shù)值特征選擇算法:
Input:NDT=<U,A,D>;
Output:約簡red.
Step 1:□a∈A:計(jì)算鄰域關(guān)系Na;
Step 2:?→red;
Step 3:對(duì)任意ai∈A-red
計(jì)算SIG(ak,red,D)=γred∪ai(D)-γred(D),//此處定義γ?(D)=0.
Step 4:選擇ak,其滿足:
Step 5:If SIG(ak,red,D)>0,
red∪ak→red
go to Step 3
else
return red, end.
該算法以空集為起點(diǎn),每次計(jì)算全部剩余屬性的屬性重要度, 從中選擇屬性重要度值最大的屬性加入約簡集合中,直到所有剩余屬性的重要度為0,即加入任何新的屬性,系統(tǒng)的依賴性函數(shù)值不再發(fā)生變化為止。 本文在1.2 節(jié)里取得依次從大到小的鄰域值n_value1、n_value2、n_value3 可以對(duì)應(yīng)得到三層核屬性集(Core Features Sets)。
圖1 實(shí)驗(yàn)?zāi)M裝置
為了驗(yàn)證提出的特征提取技術(shù)在實(shí)際應(yīng)用中的效果,在齒輪實(shí)驗(yàn)臺(tái)上進(jìn)行故障模擬,實(shí)驗(yàn)裝置如圖1 所示。 本故障實(shí)驗(yàn)臺(tái)由直流電機(jī)、加載電機(jī)、直流調(diào)速加載系統(tǒng)、齒輪減速器構(gòu)成,通過齒輪換檔實(shí)現(xiàn)不同故障齒輪的嚙合。 可以組合為6 種不同的齒輪形態(tài):正常、點(diǎn)蝕、剝落、剝落和偏心復(fù)合故障、點(diǎn)蝕和偏心復(fù)合故障、正常和偏心復(fù)合故障。
表1 列舉了齒輪傳動(dòng)系統(tǒng)的相關(guān)參數(shù)。
表1 齒輪傳動(dòng)系統(tǒng)的運(yùn)動(dòng)和動(dòng)力參數(shù)
在上述6 種齒輪組合形態(tài)下,利用加速度傳感器分別測取原始振動(dòng)信號(hào),實(shí)驗(yàn)時(shí)電動(dòng)機(jī)轉(zhuǎn)速為1000r/min,采樣頻率為6.4kHz,數(shù)據(jù)長度為116736。 測點(diǎn)布置在第二級(jí)齒輪的軸承座上,位置示于圖2 中。 數(shù)據(jù)記錄裝置安裝了低通濾波器用來抗混濾波。 其中正常狀態(tài)的振動(dòng)信號(hào)示于圖3 中。
圖2 加速度傳感器位置
圖3 正常齒輪的原始時(shí)域信號(hào)波形圖
采用10 階Daubechies 離散正交小波db10 對(duì)采集的各個(gè)故障形態(tài)的振動(dòng)信號(hào)進(jìn)行3 層小波包分解,得到8 個(gè)頻帶的分解信號(hào),分解后每段信號(hào)的頻率寬度為分析頻率的八分之一,即0.4kHz。 這8 段分解信號(hào)分別分布在0~0.4kHz;0.4~0.8kHz;0.8~1.2kHz;1.2~1.6kHz;1.6~2.0kHz;2.0~2.4kHz;2.4~2.8kHz 以及2.8~3.2kHz 上。
分別提取每個(gè)頻帶的6 個(gè)時(shí)域特征和13 個(gè)頻域特征,共152 個(gè)特征組成原始特征集。 通過前述的歐氏距離特征評(píng)估取得鄰域基點(diǎn)為n_value2=0.10106, 根據(jù)鄰域基點(diǎn)的大小設(shè)半徑為0.1,k0=0.01。 則取得另外兩個(gè)鄰域值分別為n_value1=0.001057, n_value3=0.20106。 基于取得的三層鄰域值用前述的前向貪心算法對(duì)特征集進(jìn)行?;s簡,進(jìn)行特征評(píng)估時(shí)第一層第一次迭代如圖4 所示,每層鄰域的每次迭代選取重要度最大的特征加入核屬性中,直至剩余屬性為0 時(shí)獲得核屬性集。 第一層鄰域經(jīng)過4 次迭代,第二層鄰域經(jīng)過12 次迭代,第三層鄰域經(jīng)過9 次迭代獲得如表2 所示核屬性集。
圖4 鄰域?yàn)?.001057 時(shí)第一輪計(jì)算特征重要度值
表2 三層鄰域下選擇的核屬性集
從表2 可以看出,本文提出的特征提取技術(shù)可以將冗余復(fù)雜的特征集約簡到了不同的粒度層中,提取到的核屬性集具有更多的分類信息和多分辨特性。 從而為下一步信號(hào)分類提供依據(jù),更好地完成旋轉(zhuǎn)機(jī)械的狀態(tài)監(jiān)測和故障診斷。
本文提出了基于粒計(jì)算的旋轉(zhuǎn)機(jī)械信號(hào)特征提取技術(shù)。研究了?;謱拥膶?shí)現(xiàn)方法。 應(yīng)用基于鄰域粗糙集的屬性約簡?;惴▽?duì)特征集進(jìn)行了約簡?;?,確定了三層鄰域值來對(duì)特征集進(jìn)行?;謱?。 該方法體現(xiàn)了粒計(jì)算多分辨、多層次解決復(fù)雜問題的特點(diǎn)。
通過齒輪實(shí)驗(yàn), 提取了不同狀態(tài)、 不同粒度層的核屬性集,為下一步旋轉(zhuǎn)機(jī)械的狀態(tài)分類和智能診斷打好了基礎(chǔ)。
[1]Ham FM, Kostanic I. Principles of neurocomput ing for science & engineering [M]. New York: Mc-Graw Hill, 2001.
[2]Wei L L, Long W J, Zhang W X. Fuzzy data domain description using support vector machines [A]//International Conference on Machine Learning and Cybernetics[C].2003,5:3082-3085.
[3]Hu Qing-Hua, YU Da-Ren, Xie Zong-Xia. Numerical Attribute Reduction Based on Neighborhood Granulation and Rough Approximation, Journal of Software, Vol.19, No.3, March 2008:640-649.
[4]王加陽,羅安,陳松喬.可變精度粗糙集模型區(qū)間約簡[J].系統(tǒng)工程學(xué)報(bào),2007,22(6):126-133.
[5]Wang G Y. Algebra view and information view of rough sets theory[A]//Data Mining and Knowledge Discovery: Theory, Tools, and Technology [C]. Bellingham: SPIE-The International Society for Optical Engineering, 2001: 200-207.