劉 杰 張福生 馮 達(dá)
(91388部隊(duì)92分隊(duì) 湛江 524022)
目前暴露潛艇的主要特征是聲波信號(hào)。潛艇在水下的噪聲主要可以分為機(jī)械噪聲、水動(dòng)力噪聲和螺旋槳噪聲,其中在潛艇常用的低速隱蔽工況下,機(jī)械噪聲通常是其水噪聲的主要來(lái)源[11~12]。所以研究潛艇噪聲源識(shí)別對(duì)于保證潛艇隱身性是至關(guān)重要的。而且,當(dāng)機(jī)器出現(xiàn)故障時(shí),其振動(dòng)和聲信號(hào)特征一定會(huì)發(fā)生變化,所以通過(guò)對(duì)噪聲源的識(shí)別定位研究,能夠更好地對(duì)機(jī)器進(jìn)行狀態(tài)檢測(cè)及故障診斷[2]。
由于潛艇機(jī)械設(shè)備異常復(fù)雜,在實(shí)際使用中,對(duì)其進(jìn)行狀態(tài)檢測(cè)及故障診斷非常麻煩,一般情況下都是通過(guò)使用大量的測(cè)量傳感器對(duì)設(shè)備實(shí)行實(shí)時(shí)監(jiān)測(cè),但是傳感器各測(cè)量值之間必然存在相關(guān)性以及隨機(jī)誤差的影響,在使用中極不方便[6~8]?;诮y(tǒng)計(jì)理論的線性判別分析算法(LDA)和主成分分析算法(PCA)[1],通過(guò)對(duì)大量樣本數(shù)據(jù)進(jìn)行分析建模,克服了傳統(tǒng)的基于機(jī)理模型的監(jiān)測(cè)診斷方法的缺點(diǎn)[3,11]。
線性判別分析算法是基于Fisher準(zhǔn)則尋找一組將高維樣本投影到低維空間的最佳的判別投影向量,使所有的投影樣本類(lèi)內(nèi)離散度最小且類(lèi)間離散度最大。主成分分析算法就是使用較少的綜合變量來(lái)代替原始數(shù)據(jù)中較多的變量,綜合變量之間互不相關(guān),從而減少變量之間的冗余,同時(shí)最大限度的保持原始數(shù)據(jù)的信息。LDA算法是直接以分類(lèi)為目的的特征提取方法,所以在噪聲的分類(lèi)識(shí)別中要優(yōu)于PCA算法。
在直接使用LDA算法進(jìn)行噪聲特征提取的時(shí)候可能存在小樣本問(wèn)題,導(dǎo)致無(wú)法建立正確的噪聲識(shí)別模型,所以本文先采用PCA對(duì)樣本進(jìn)行降維,再使用LDA進(jìn)行模型的建立[4~5]。建立模型后,通過(guò)將待測(cè)信號(hào)投影到模型空間上,再與已有的數(shù)據(jù)樣本庫(kù)進(jìn)行比較,確定噪聲信號(hào)類(lèi)別,達(dá)到狀態(tài)檢測(cè)及故障診斷的目的。
PCA是1901年由Pearson提出的一種多變量統(tǒng)計(jì)分析技術(shù),是一種最優(yōu)的正交線性變換,能夠?qū)⑿盘?hào)數(shù)據(jù)在一個(gè)較低維的空間進(jìn)行處理,目前廣泛應(yīng)用于信息壓縮。
設(shè)樣本信號(hào)集X=(x1,x2,…,xN),xi(i=1,2…,N)表示X中第i個(gè)信號(hào)向量,N表示樣本數(shù)目,M表示xi的維數(shù)。求解X的總體散度矩陣ST:
使用奇異值分解方法求解ST的特征值λi(i=1,2,…,M)及其對(duì)應(yīng)的特征向量(主元)φi(i=1,2,…,M)。λi值的大小是按降序排列,即λ1≥λ2≥…≥λM,λi值越大表示對(duì)應(yīng)的主元φi的貢獻(xiàn)度越大。
主元數(shù)目n(n≤M)通過(guò)交叉檢驗(yàn)法或主元貢獻(xiàn)率累積和百分比ξ(CPV)的方法確定。本文采用CPV方法,其中ξ=0.9,取使式(2)成立的最小值L為n:
最后確定的主元組成的矩陣就是PCA投影子空間WPCA= (φ1,φ2,…,φn)。
圖1 PCA和LDA對(duì)兩類(lèi)問(wèn)題投影子空間求解的比較[1]
LDA的原理就是尋找一個(gè)投影方向,所有樣本在這個(gè)方向的投影能夠?qū)崿F(xiàn)類(lèi)間離散度最大化和類(lèi)內(nèi)離散度最小化,即能夠使同類(lèi)樣本盡量聚集,不同類(lèi)樣本盡量分開(kāi)。LDA是以分類(lèi)為目的的特征提取方法,所以在識(shí)別分類(lèi)別中要優(yōu)于PCA,圖1給出了PCA和LDA分別在兩類(lèi)問(wèn)題上求解投影子空間的情況。
從中可以看出,經(jīng)過(guò)LDA投影后的子空間分類(lèi)能力明顯好于經(jīng)PCA投影后的子空間。
因?yàn)長(zhǎng)DA使用的是Fisher準(zhǔn)則函數(shù),所以LDA也稱(chēng)為Fisher線性判別分析Fisher準(zhǔn)則函數(shù)為
樣本類(lèi)間離散度矩陣Sb定義為
樣本的類(lèi)內(nèi)離散度矩陣Sw定義為
如果Sw是非奇異的,投影矩陣WLDA定義為
WLDA=w{i|i=1,2,…,}m相當(dāng)于通過(guò)式(7)求解:
其實(shí)質(zhì)就是求解S-1wSb的特征值問(wèn)題,WLDA= {wi|i=1,2,…,m}就是由最大的m(m≤n)個(gè)特征值對(duì)應(yīng)的特征向量組成,n表示樣本維數(shù),m表示W(wǎng)LDA的投影維數(shù),m的大小一般通過(guò)實(shí)驗(yàn)確定。
當(dāng)N≥n時(shí),即樣本的數(shù)量不小于樣本的維數(shù)時(shí),Sw是非奇異的,但是在N<n時(shí),Sw很可能是奇異的,這樣就無(wú)法對(duì)Sw求逆,即存在小樣本問(wèn)題。為了克服這種缺陷,本文先使用PCA對(duì)原始樣本集進(jìn)行降維,從而保證Sw的非奇異性。
圖2給出了使用線性判別分析算法進(jìn)行噪聲識(shí)別的整個(gè)流程。
設(shè):
l為測(cè)量傳感器的個(gè)數(shù);
ai(i=1,2,…,l)為第i個(gè)測(cè)量傳感器測(cè)量的參數(shù)個(gè)數(shù);
m為每一個(gè)樣本信號(hào)的維數(shù),m=a1+a2+…+al;
n為潛艇機(jī)械噪聲源的個(gè)數(shù);
ki(i=1,2,…,n)為第i個(gè)機(jī)械噪聲源包含的信號(hào)數(shù)量(不同工況下的信號(hào));
N:樣本信號(hào)的數(shù)量,N=k1+k2+…+kn。
噪聲訓(xùn)練樣本集X∈RN×m,首先根據(jù)式(1)和式(2)確定WPCA矩陣,對(duì)WPCA矩陣進(jìn)行LDA運(yùn)算,得到WLDA矩陣,最后得到算法模型矩陣W=WTPCA·WTLDA。
圖2 基于LDA的噪聲識(shí)別流程圖
得到算法模型后,再將待測(cè)信號(hào)與已知信號(hào)庫(kù)(機(jī)械設(shè)備正常工況下的噪聲信號(hào)和所有已知故障情況下的噪聲信號(hào))中所有信號(hào)分別投影到識(shí)別分類(lèi)模型上一一進(jìn)行相似度計(jì)算和比對(duì),最后根據(jù)相似度的大小確定待測(cè)信號(hào)的類(lèi)型,從而達(dá)到噪聲源的定位和故障診斷的目的。
相似度的計(jì)算可以采用歐氏距離、馬氏距離和歸一化互相關(guān)系數(shù)(Normalized Cross-Correlation,NCC)等方法。本文使用NCC計(jì)算相似度δ,計(jì)算公式如下:
x和y表示兩個(gè)不同的信號(hào)向量,n表示向量的維數(shù),0<δ≤1表示互相關(guān)系數(shù),即相似度,當(dāng)x=y(tǒng)時(shí),δ=1,表示兩個(gè)完全相同的特征向量。δ越大表示兩個(gè)信號(hào)的相關(guān)性越大。
利用四臺(tái)機(jī)械設(shè)備模擬潛艇噪聲源,通過(guò)改變?cè)O(shè)備的工況來(lái)模擬機(jī)械的故障噪聲,每臺(tái)設(shè)備使用四種不同的工況,共采用五個(gè)測(cè)量傳感器,每一個(gè)傳感器取四個(gè)參數(shù)作為特征值,這樣組成的訓(xùn)練樣本集為16×20的矩陣。采用另外四臺(tái)機(jī)械設(shè)備,每臺(tái)設(shè)備使用十種不同工況模擬待測(cè)噪聲信號(hào)。實(shí)驗(yàn)結(jié)果如圖3所示。m表示LDA模型的投影維數(shù),P表示在不同m下的模型識(shí)別率:
從結(jié)果看,剛開(kāi)始P隨著m的增加有明顯的提升,當(dāng)m=6時(shí)P取得最大值0.825,隨著m的進(jìn)一步增加,P有所下降,但趨于穩(wěn)定,這是因?yàn)長(zhǎng)DA是一種提取信號(hào)分類(lèi)特征信息的算法,m值越大,會(huì)引入其他的干擾信息,m值過(guò)小,則不足以提取足夠的分類(lèi)信息。
圖3 LDA模型識(shí)別率與投影維數(shù)的關(guān)系
通過(guò)改變訓(xùn)練樣本集中機(jī)械設(shè)備的數(shù)量和每臺(tái)設(shè)備使用的工況數(shù)量進(jìn)行實(shí)驗(yàn),測(cè)試影響LDA算法模型識(shí)別分類(lèi)效果的主要因素。實(shí)驗(yàn)結(jié)果如圖4和圖5所示。
圖4 LDA模型識(shí)別率與訓(xùn)練集機(jī)械設(shè)備數(shù)量的關(guān)系
圖5 LDA模型識(shí)別率與訓(xùn)練集每臺(tái)設(shè)備使用的工況數(shù)量的關(guān)系
N表示訓(xùn)練集機(jī)械設(shè)備的數(shù)量,K表示訓(xùn)練集每臺(tái)設(shè)備使用的工況數(shù)量,其中在圖4中K=4;圖5中N=4;從實(shí)驗(yàn)結(jié)果可知識(shí)別率P與N和K成正相關(guān)關(guān)系,在N或K達(dá)到一定值后,P都會(huì)趨于穩(wěn)定。在所有實(shí)驗(yàn)中LDA模型的投影維數(shù)m都是取最優(yōu)值。
使用LDA算法得到的算法模型一旦確定后,可以將其存儲(chǔ)起來(lái),在以后的使用中直接進(jìn)行調(diào)用,不需要重新計(jì)算,使用比較方便。LDA的實(shí)質(zhì)是一種以分類(lèi)為目的的特征提取方法,其模型的生成與訓(xùn)練樣本信號(hào)的類(lèi)型沒(méi)有本質(zhì)的聯(lián)系,所以,使用其他信號(hào)(比如水面艦噪聲信號(hào)等)建立的算法模型,也可以用于潛艇的機(jī)械噪聲信號(hào)識(shí)別中,具有較好的通用性。
從實(shí)驗(yàn)中可以看出,LDA模型的分類(lèi)識(shí)別能力主要受到訓(xùn)練樣本集規(guī)模的影響,樣本集中信號(hào)類(lèi)別數(shù)越多(即噪聲源越多)以及每一個(gè)噪聲源包含的信息類(lèi)型越多,在計(jì)算LDA類(lèi)間協(xié)方差矩陣和類(lèi)內(nèi)協(xié)方差矩陣的時(shí)候就能夠得到更多的分類(lèi)信息,其分類(lèi)識(shí)別能力就越強(qiáng)。此外,在實(shí)際使用中,已知信號(hào)庫(kù)中不可能包含每臺(tái)機(jī)械設(shè)備噪聲源的所有故障信息,從而影響實(shí)際的使用效果,所有,下一步的研究重點(diǎn)是需要在模型中加入拒識(shí)功能,提高算法的分類(lèi)識(shí)別能力。
[1]A.M.Martinez and A.C.Kak.PCA versus LDA[J].IEEE Trans.On Pattern Analysis and Machine Intelligence,2001,23(2):228-233.
[2]高明杰,呂志強(qiáng),章林柯.多元統(tǒng)計(jì)分析在潛艇噪聲源識(shí)別中的應(yīng)用[J].船海工程,2009,38(1):93-97.
[3]邊肇棋,張長(zhǎng)水,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000:87-112.
[4]章林柯,崔立林.潛艇機(jī)械噪聲源分類(lèi)識(shí)別的小樣本研究思想及相關(guān)算法評(píng)述[J].船舶力學(xué),2011,15(8):940-947.
[5]楊德森.水下航行器噪聲分析及主要噪聲源識(shí)別[D].哈爾濱:哈爾濱工程大學(xué),1998:13-26.
[6]姚耀中,林立.潛艇機(jī)械噪聲控制技術(shù)綜述[J].艦船科學(xué)技術(shù),2007,29(1):21-26.
[7]余桐奎.基于多輸入/輸出模型的噪聲源分離方法研究[D].哈爾濱:哈爾濱工程大學(xué),2009:10-21.
[8]孔建益,李公法,侯宇.潛艇振動(dòng)噪聲的控制研究[J].噪聲與振動(dòng)控制,2006:1-4.
[9]施引,朱石堅(jiān),何琳.艦船動(dòng)力機(jī)械噪聲及其控制[M].北京:國(guó)防工業(yè)出版社,1990:122-147.
[10]劉萍,廖廣銳.高噪聲背景下的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)與數(shù)字工程,2009(7).
[11]方開(kāi)泰.實(shí)行多元統(tǒng)計(jì)分析[M].上海:華東師范大學(xué)出版社,1986:54-71.
[12]俞孟薩,黃國(guó)榮,伏同先.潛艇機(jī)械噪聲控制技術(shù)的現(xiàn)狀與發(fā)展概述[J].船舶力學(xué),2003,7(4):110-120.