亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于EMD與模糊聚類的樁缺陷特征提取與識(shí)別

        2019-03-15 12:52:02李衡康維新
        應(yīng)用科技 2019年2期
        關(guān)鍵詞:降維信息熵識(shí)別率

        李衡,康維新

        哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001

        信號(hào)特征的提取方法主要為傅里葉變換、小波分析等,提取的特征參量主要為信號(hào)的幅值、能量、頻率等。小波分析是目前常用的信號(hào)分解方法,經(jīng)小波分解,時(shí)域信號(hào)可分解為不同頻段的時(shí)域信號(hào)。但是小波變換不具有自適應(yīng)性,小波基的選擇比較困難,小波參數(shù)的選擇將直接影響到最后的診斷結(jié)果[1?4],存在很大的人為因素的影響。同時(shí)共振解調(diào)存在與小波變換相同的缺陷,需要人為地選擇一些參數(shù),也不具有自適應(yīng)性[5?7]。

        EMD算法是一種信號(hào)分解方法,把信號(hào)分解為一系列平穩(wěn)的信號(hào)分量,且分量按頻率由高到低排列,與小波分析相比不用人為地選擇小波基。但是目前的研究主要考慮EMD分解的某一部分分量,摒棄了大量的信號(hào)特征信息,且特征參量多只考慮幅值、能量等信息[8]。張志剛等[9]在提取滾動(dòng)軸承的故障特征時(shí)利用了灰色關(guān)聯(lián)度和互信息來改進(jìn)EMD算法,但是兩者都只能度量EMD分量的一個(gè)尺度,也就是相關(guān)性。胡愛軍等[10]利用了峭度準(zhǔn)則進(jìn)行特征提取時(shí)只選擇了一個(gè)固有模態(tài)函數(shù)(intrinsic mode function,IMF)分量,移除了大量的特征信息。

        在特征的選擇方面,眾多學(xué)者在選擇算法和特征評(píng)價(jià)中取得了豐碩的研究成果。要明確起關(guān)鍵作用的特征組,首先必須明確選擇的算法,再者就是制定相應(yīng)的評(píng)價(jià)準(zhǔn)則對(duì)所提取的特征向量進(jìn)行評(píng)價(jià)分析[11]。同時(shí),特征樣本數(shù)越多就會(huì)造成模型越復(fù)雜,訓(xùn)練的速度也越慢,因此數(shù)據(jù)降維也是一個(gè)研究的熱點(diǎn)。通常數(shù)據(jù)信號(hào)的降維從兩個(gè)方面來考慮:其一就是直接提取特征子集抽取特征;其二就是用線性或者非線性的方式通過變換空間實(shí)現(xiàn)信號(hào)特征的降維。第2種方法是目前運(yùn)用的主流。線性映射的方法主要有主成分分析(principal component analysis,PCA)、線性判別分析(linear discriminant analysis,LDA)。PCA 可以提取信號(hào)主要的信息,但是該方法需要計(jì)算協(xié)方差矩陣,計(jì)算量較大;LDA原理比較簡(jiǎn)單,容易理解,但是計(jì)算較復(fù)雜;而利用核函數(shù)的特征降維方法最后的結(jié)果受核的選擇的影響[12]。

        為了解決上面提到的問題,本文提出一種基于EMD的特征提取與識(shí)別方法。利用信號(hào)的信息熵構(gòu)建基于信息熵的均值特征向量,同時(shí)引入模糊聚類對(duì)特征向量進(jìn)行再選擇,探討不同聚類數(shù)下的特征向量對(duì)識(shí)別結(jié)果的影響。首先對(duì)信號(hào)數(shù)據(jù)進(jìn)行EMD分解,求取各個(gè)分量的信息熵,基于信息熵構(gòu)建均值特征向量;然后基于模糊聚類算法對(duì)均值向量進(jìn)行特征降維選擇;最后利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別訓(xùn)練。

        1 基于信息熵的特征向量構(gòu)建

        1.1 信息熵理論

        熵是隨機(jī)變量不確定性的度量。如果一個(gè)離散型隨機(jī)變量 X ,該隨機(jī)變量的取值空間為A,概率密度函數(shù) p (x)=Pr(X=x),x∈A。那么我們就可以把一個(gè)離散型隨機(jī)變量 X 的熵 H (X)記做[13]

        1.2 經(jīng)驗(yàn)?zāi)B(tài)分解

        EMD是一種會(huì)把信號(hào)分解為一系列平穩(wěn)信號(hào)分量的分解方法,且分量按頻率由高到低排列。目前在缺陷檢測(cè)、狀態(tài)監(jiān)測(cè)、特征向量的構(gòu)建以及信號(hào)去噪等方面得到了普遍且成熟的應(yīng)用,取得了豐碩的學(xué)術(shù)成果。經(jīng)驗(yàn)?zāi)B(tài)分解步驟如下:

        假設(shè)待分解信號(hào)模型為:

        式中: f (t)表示含有噪聲的觀察信號(hào); s (t)為觀察信號(hào); n (t)為Gaussian白噪聲。

        1)計(jì)算出信號(hào) f (t)所有的極值點(diǎn)。

        2)求取全部極大值點(diǎn)連接起來生成的包絡(luò)線u0(t),以及全部極小值點(diǎn)連接起來生成的包絡(luò)線v0(t)。

        3)對(duì)2條包絡(luò)線求取平均值為 m0(t),表示為

        并記信號(hào)與平均值 m0(t)的差值為 h0(t),表示為

        4)判斷 h0(t)是否滿足差值 h0(t)極值點(diǎn)數(shù)目和過零點(diǎn)數(shù)目的相差為0或者1;差值 h0(t)的上下包絡(luò)線由式(1)計(jì)算,所得的均值為0。若滿足這2個(gè)條件,則 h0(t)為IMF;否則,令 h0(t)為 f (t)繼續(xù)執(zhí)行步驟1)到步驟3),獲得一個(gè)合格的IMF,記為 c1(t)。

        5)記 r1(t)=f(t)?c1(t)為新的信號(hào) f (t),然后執(zhí)行步驟1)到步驟4),獲得第2個(gè)IMF分量,記為c2(t),以及余項(xiàng) r2(t)=r1(t)?c2(t)。循環(huán)執(zhí)行上述步驟,當(dāng)余項(xiàng) rn(t)是一個(gè)單調(diào)信號(hào)或 rn(t)的值已經(jīng)達(dá)到閾值的要求時(shí),分解完成。獲得的 n個(gè)IMF分量分別用 c1(t),c2(t),···,cn(t)表示,余項(xiàng)記為 rn(t),到此整個(gè)分解過程結(jié)束。原始信號(hào)被分解為

        1.3 構(gòu)建基于信息熵的均值特征向量

        為了構(gòu)建樁基缺陷數(shù)據(jù)的基于信息熵的均值特征向量,利用EMD方法對(duì)缺陷信號(hào)進(jìn)行分解。分解后的分量為了方便求取信息熵,在時(shí)間軸上選取固定長(zhǎng)度的信號(hào)作為一個(gè)檢測(cè)單元,然后再依次平移檢測(cè)單元,完成整個(gè)信號(hào)長(zhǎng)度的計(jì)算。檢測(cè)單元、平移距離如圖1所示。

        圖1 信號(hào)截取設(shè)定示意

        檢測(cè)單元寬度T和平移距離 Bt是2個(gè)需要在文中進(jìn)行選擇的參數(shù),它們的選擇會(huì)決定樁基缺陷信號(hào)特征提取的合理性,所以在構(gòu)建均值特征向量時(shí),要充分考慮檢測(cè)單元寬度和平移距離這2個(gè)參數(shù)。檢測(cè)單元寬度的設(shè)定一般與信號(hào)的波長(zhǎng)大致相同;平移距離決定了缺陷點(diǎn)在整個(gè)時(shí)間軸上的分辨率,平移距離越小,分辨率越高。參考相關(guān)文獻(xiàn)知識(shí),檢測(cè)單元的平移距離與檢測(cè)單元的寬度有關(guān)。綜合考慮,步進(jìn)長(zhǎng)度的設(shè)定范圍定為

        信息熵的求解重點(diǎn)是概率 p的求解。對(duì)于可以確認(rèn)具體的取值范圍的數(shù)據(jù),可以直接根據(jù)每一個(gè)取值出現(xiàn)的次數(shù)確定概率。但是,對(duì)于本文所分解的樁基缺陷信號(hào),數(shù)值的范圍并不是確定的,如果進(jìn)行變換,使其轉(zhuǎn)換到一個(gè)整數(shù)范圍的話,會(huì)造成數(shù)據(jù)的丟失,因此本文采用一種一維序列求取信息熵常用的方法。首先對(duì)信號(hào)在幅值范圍內(nèi)進(jìn)行分塊,通過計(jì)算幅值的最大值和最小值構(gòu)成的區(qū)間,均分為 N 塊;然后計(jì)算時(shí)間軸上固定長(zhǎng)度下每一塊的數(shù)據(jù)個(gè)數(shù)占所有數(shù)據(jù)總數(shù)的比例,求出相應(yīng)的概率;最后分別求取每個(gè)分量的信息熵后,求取它們的平均值,構(gòu)建基于信息熵的均值特征向量。

        2 基于模糊聚類的特征選擇

        2.1 模糊聚類

        假設(shè)存在論域 X ,則認(rèn)為從該論域到[0,1]區(qū)間的映射關(guān)系記為 μA:X→[0,1],構(gòu)成了該論域的一個(gè)模糊集。對(duì)于每一個(gè) x ∈X , μA(x)叫做元素 x對(duì)模糊集 A的隸屬度。隸屬度函數(shù)的值越大說明某一個(gè)元素屬于該類的程度越強(qiáng),但是再大也不會(huì)超過1;越小就說明越不屬于該類,但是再小也不會(huì)超過0。其本質(zhì)表示的是某一個(gè)元素是否屬于一個(gè)類的程度。

        模糊 C 均值聚類(fuzzy c-means,F(xiàn)CM)方法第一次由E Ruspini在論文中進(jìn)行較完整的闡述。隨著其他學(xué)者對(duì)該方法的進(jìn)一步研究,把算法在具體的應(yīng)用方法上進(jìn)行了推廣,開始應(yīng)用于模糊聚類的相關(guān)領(lǐng)域。這種推廣大大加速了FCM算法在實(shí)際工程中的應(yīng)用。FCM算法進(jìn)行聚類的主要原理是通過迭代的方式對(duì)目標(biāo)函數(shù)進(jìn)行計(jì)算更新,直到達(dá)到理想的聚類效果。通過隸屬度函數(shù),判斷每一個(gè)元素屬于一個(gè)類的程度,完成每一個(gè)類的劃分,只要在程序中設(shè)定了聚類數(shù),后續(xù)的處理將會(huì)自動(dòng)地自適應(yīng)完成[14?15]。

        FCM算法的目標(biāo)函數(shù)為

        FCM算法執(zhí)行步驟如下:

        1)給定聚類數(shù) c(11)、最大迭代次數(shù)T、收斂的精度、隨機(jī)初始劃分隸屬度矩陣U,確定初始聚類中心以及距離;

        4)判斷是否滿足停止條件(達(dá)到最大迭代次數(shù)或者達(dá)到收斂精度),如果滿足就停止,否則繼續(xù)執(zhí)行步驟2)。

        2.2 基于模糊聚類算法的數(shù)據(jù)處理

        假定待處理的基于信息熵的均值向量為

        首先對(duì)式(2)重新進(jìn)行構(gòu)造,構(gòu)成用于模糊聚類的輸入矩陣。以長(zhǎng)度 n進(jìn) 行分段,構(gòu)成 m行 n列的矩陣且 N =m·n 。如果 N 不能夠剛好被 n整除,則在末尾補(bǔ)零處理。構(gòu)造矩陣A如下:

        式(2)與(3)的對(duì)應(yīng)關(guān)系如表1所示。

        表1 均值向量與重構(gòu)矩陣各元素對(duì)應(yīng)關(guān)系

        從矩陣A我們可以看出,該矩陣有 m 行,確定聚類數(shù) c 后利用FCM算法生成 c個(gè)數(shù)目的聚類。對(duì)于相同聚類里面的行向量求取他們的平均值,生成 c 行 n列的簡(jiǎn)化矩陣,簡(jiǎn)化矩陣表示如下

        根據(jù)式(4)中的降維矩陣B生成新的特征向量,表示為 F ={f1,f2,···,fN}。F與降維矩陣B之間的對(duì)應(yīng)關(guān)系如表2所示。

        表2 新特征向量與降維矩陣關(guān)系

        這樣原本的均值向量X就被簡(jiǎn)化為了特征向量F。然后把新構(gòu)建的特征向量作為神經(jīng)網(wǎng)絡(luò)的輸入用于對(duì)缺陷信息進(jìn)行識(shí)別分類。

        但是在文中利用式(5)確定聚類數(shù)c并不可行,因?yàn)槊恳粋€(gè)缺陷我們有50組數(shù)據(jù),但是對(duì)每一組數(shù)據(jù)來說都可能存在不同的最佳聚類數(shù),這樣就會(huì)導(dǎo)致構(gòu)建的新特征向量維數(shù)不相同,也就無法作為神經(jīng)網(wǎng)絡(luò)的輸入。以擴(kuò)頸樁數(shù)據(jù)為例,第 1、3組數(shù)據(jù)計(jì)算得到的 L (c)值如表3、4所示。

        表3 擴(kuò)頸樁第1組數(shù)據(jù)不同聚類數(shù) c 下對(duì)應(yīng)的 L (c)的值

        表4 擴(kuò)頸樁第3組數(shù)據(jù)不同聚類數(shù) c 下對(duì)應(yīng)的 L (c)的值

        利用模糊聚類算法對(duì)相空間重構(gòu)后的矩陣進(jìn)行聚類分析,對(duì)于同類的行向量合并,達(dá)到對(duì)重構(gòu)的矩陣降維的效果;把降維后的矩陣再重構(gòu)回一維特征向量,構(gòu)建一種新的特征向量,實(shí)現(xiàn)對(duì)特征向量的選擇。

        3 實(shí)驗(yàn)仿真分析

        根據(jù)上述的新的特征向量的構(gòu)建規(guī)則對(duì)基于信息熵的均值向量進(jìn)行優(yōu)化處理。步驟總結(jié)如下:

        1)把基于信息熵的均值特征向量進(jìn)行相空間重構(gòu);

        2)利用FCM算法進(jìn)行聚類分析;

        3)根據(jù)分類結(jié)果構(gòu)造聚類后的矩陣;

        4)根據(jù)聚類后的矩陣生成新的特征向量。

        由基于信息熵的均值向量的仿真實(shí)驗(yàn)結(jié)果可知,基于信息熵的均值向量共有52個(gè)特征元素,在末尾補(bǔ)2個(gè)零元素,首先設(shè)定等于9,構(gòu)造成6行9列的矩陣。以縮頸樁數(shù)據(jù)為例,構(gòu)成的矩陣如下(保留兩位小數(shù)):

        對(duì)式(6)中的矩陣A進(jìn)行模糊聚類算法處理,設(shè)定聚類數(shù) c為3的情況下,可以得到隸屬度矩陣 U 為(為了方便表示,結(jié)果四舍五入并保留2位小數(shù)):

        聚類結(jié)果如表5所示。

        表5 當(dāng)聚類數(shù)為 3 時(shí)縮頸樁分類結(jié)果

        根據(jù)分類結(jié)果,生成新的優(yōu)化特征向量,并利用該向量進(jìn)行基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別訓(xùn)練,同時(shí)輸出為設(shè)定的如表6所示的網(wǎng)絡(luò)編號(hào)。

        表6 缺陷類型以及相對(duì)應(yīng)的網(wǎng)絡(luò)編號(hào)

        經(jīng)過BP神經(jīng)網(wǎng)絡(luò)識(shí)別后,識(shí)別率與差錯(cuò)率如圖2所示。

        圖2 基于聚類數(shù)為3時(shí)的優(yōu)化特征識(shí)別分類結(jié)果

        從圖2的識(shí)別結(jié)果可以看出,基于模糊聚類處理的優(yōu)化特征向量具有很好的識(shí)別結(jié)果,識(shí)別率達(dá)到了98%。然而單次的仿真實(shí)驗(yàn)具有一定的隨意性,沒有說服力。

        表 7 不同聚類數(shù)下的識(shí)別率對(duì)比 %

        圖3 30 次仿真實(shí)驗(yàn)識(shí)別率對(duì)比

        從表7可以看出,在10、20、30次實(shí)驗(yàn)的情況下,聚類數(shù)為3時(shí)的識(shí)別率均高于當(dāng)聚類數(shù)為2、4時(shí)的識(shí)別率;同時(shí)從圖3可以看出,當(dāng)聚類數(shù)為3時(shí)識(shí)別率最平穩(wěn),沒有出現(xiàn)其他2種情況的大波動(dòng)。

        PCA降維是目前應(yīng)用比較廣泛的降維方法,本文對(duì)于2種算法在降維后,維數(shù)為3時(shí)的識(shí)別率和時(shí)間開銷進(jìn)行了分析,分析結(jié)果如表8所示。

        表8 模糊聚類與PCA方法降維后構(gòu)建的特征識(shí)別分析

        從表8可以看出,2種方法相比,基于模糊聚類構(gòu)建的新特征取得的識(shí)別率明顯高于PCA方法構(gòu)建的特征,同時(shí)所消耗的時(shí)間顯著縮短。因而基于模糊聚類方法降維顯著地優(yōu)于PCA降維。

        4 結(jié)論

        本文主要解決樁基缺陷信號(hào)的特征提取、降維與識(shí)別?;贓MD分解構(gòu)建了基于信息熵的均值特征向量;引入模糊聚類的相關(guān)技術(shù)方法,對(duì)基于信息熵的均值特征向量進(jìn)行相空間重構(gòu)然后進(jìn)行降維,實(shí)現(xiàn)特征向量的降維選擇。所取得的結(jié)論如下:1)通過30次仿真實(shí)驗(yàn)以及10次與PCA的對(duì)比實(shí)驗(yàn)驗(yàn)證了基于信息熵的均值特征向量以及基于模糊聚類構(gòu)建的新特征向量取的了理想的識(shí)別效果;2)從識(shí)別率和穩(wěn)定性2個(gè)方面考慮了不同聚類數(shù)對(duì)識(shí)別結(jié)果的影響,實(shí)驗(yàn)結(jié)果顯示當(dāng)聚類數(shù)為3時(shí)識(shí)別效果最好。

        本文構(gòu)建了一種有效的特征類型,具有實(shí)際的應(yīng)用價(jià)值,但是在聚類數(shù)的選擇中只能通過仿真實(shí)驗(yàn)獲取,還需要進(jìn)一步的研究。

        猜你喜歡
        降維信息熵識(shí)別率
        Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
        基于信息熵可信度的測(cè)試點(diǎn)選擇方法研究
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
        降維打擊
        海峽姐妹(2019年12期)2020-01-14 03:24:40
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識(shí)別率的關(guān)系
        提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
        基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
        一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
        高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
        基于信息熵的IITFN多屬性決策方法
        国产精品久久1024| 国产三级精品三级| 夜先锋av资源网站| 国产人在线成免费视频麻豆| 97人妻蜜臀中文字幕| 国产日产一区二区三区四区五区| 亚洲乱码日产精品一二三| 麻豆国产成人av高清在线观看 | 精品少妇人妻av一区二区蜜桃| 午夜天堂精品久久久久| 久久久久久久性潮| 国产女女做受ⅹxx高潮| 久热爱精品视频在线观看久爱 | 极品粉嫩小仙女高潮喷水操av| 亚洲精品国产美女久久久| 国产精品片211在线观看| 日韩久久免费精品视频| 日韩女同精品av在线观看| 国产成人涩涩涩视频在线观看| 国产精品青草视频免费播放 | 亚洲国产中文字幕一区| 被黑人猛烈30分钟视频| 国产又黄又爽视频| 亚洲在中文字幕乱码熟女| 免费观看全黄做爰大片| 国产成人一区二区三区在线观看| 国产亚洲精品综合在线网址| 久久精品国产亚洲av一般男女| 欧美精品亚洲精品日韩专区| 午夜国产在线| 亚洲国产成人精品久久成人| 尤物yw午夜国产精品视频| 久久久久久九九99精品| 四川老熟女下面又黑又肥| 91av国产视频| 亚洲一区二区女优视频| 日本一区二区视频高清| 国产揄拍国产精品| 九色91精品国产网站| 91快射视频在线观看| 日韩精品久久无码中文字幕|