陳毓坤, 于 暉, 陸寧云,*
(1. 南京航空航天大學(xué)自動(dòng)化學(xué)院, 江蘇 南京 211106; 2. 中國電子科技集團(tuán)公司第三十八研究所, 安徽 合肥 230088)
軍事用途的相控陣?yán)走_(dá)一般置于偏遠(yuǎn)邊疆,要求全天候工作,在連續(xù)大負(fù)荷工作模式和惡劣環(huán)境下,元器件故障不可避免會(huì)發(fā)生,維修計(jì)劃之外的突發(fā)性故障輕則影響雷達(dá)探測(cè)性能和數(shù)據(jù)有效性,重則引起任務(wù)中斷,設(shè)備使用效能下降而維護(hù)成本劇增。T/R組件是相控陣?yán)走_(dá)中故障頻次最高的部件之一[1],由于其故障成因繁多,難以建立準(zhǔn)確的故障模型和專家知識(shí)庫。雷達(dá)系統(tǒng)的數(shù)字化,以及信號(hào)處理技術(shù)和機(jī)器學(xué)習(xí)的發(fā)展,為基于數(shù)據(jù)的雷達(dá)故障診斷方法研究提供了良好的條件。
深度學(xué)習(xí)模型作為智能模型的典型代表,被廣泛應(yīng)用到復(fù)雜系統(tǒng)的故障診斷中[2-4]。按訓(xùn)練數(shù)據(jù)有無標(biāo)簽,深度學(xué)習(xí)算法可分為有監(jiān)督學(xué)習(xí)[5]、無監(jiān)督學(xué)習(xí)[6]和半監(jiān)督學(xué)習(xí)[7]3種。有監(jiān)督學(xué)習(xí)需要大量帶標(biāo)簽數(shù)據(jù)訓(xùn)練模型以得到特征與故障標(biāo)簽間的映射關(guān)系。小波變換[8]、傅里葉變換[9]、經(jīng)驗(yàn)?zāi)B(tài)分解[10]等信號(hào)處理技術(shù)常被用于對(duì)數(shù)據(jù)進(jìn)行特征提取,篩選與故障狀態(tài)強(qiáng)相關(guān)的特征輸入深度學(xué)習(xí)模型以進(jìn)行訓(xùn)練。文獻(xiàn)[11]引入小波包能量熵和多尺度位移熵計(jì)算不同故障下變速箱振動(dòng)信號(hào)的特征矩陣,然后基于閾值自適應(yīng)深度置信網(wǎng)絡(luò)(deep belief network, DBN)提取故障特征,對(duì)提取的特征進(jìn)行故障分類。文獻(xiàn)[12]直接將軸承振動(dòng)數(shù)據(jù)輸入DBN,利用堆疊受限玻爾茲曼機(jī)(restricted Boltzmann machine, RBM)學(xué)習(xí)特征表示并實(shí)現(xiàn)故障識(shí)別,避免了手動(dòng)特征提取和選擇。但在實(shí)際應(yīng)用中,大部分樣本沒有標(biāo)簽,監(jiān)督學(xué)習(xí)不再適用。
無監(jiān)督學(xué)習(xí)不需要先驗(yàn)信息,根據(jù)數(shù)據(jù)的分布規(guī)律進(jìn)行聚類。傳統(tǒng)的無監(jiān)督學(xué)習(xí)算法有主成分分析(principal components analysis, PCA)[13]、聚類算法[14]等。現(xiàn)階段主要有兩類深度學(xué)習(xí)模型被用于無監(jiān)督特征提取,一類是利用自編碼器(auto-encoder, AE),從抽象后的數(shù)據(jù)中盡可能無損地重現(xiàn)原始數(shù)據(jù)[15];一類是基于概率型的RBM及其改進(jìn)算法,使其達(dá)到穩(wěn)定狀態(tài)時(shí)原數(shù)據(jù)出現(xiàn)的概率最大[16-17]。由于缺少標(biāo)記數(shù)據(jù)的指導(dǎo),難以保證模型準(zhǔn)確性。
半監(jiān)督學(xué)習(xí)是將監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)相結(jié)合的一種方法,利用大量無標(biāo)簽樣本自主學(xué)習(xí)特征分布,輔以少量帶標(biāo)簽樣本實(shí)現(xiàn)模式識(shí)別。近年來,基于半監(jiān)督深度學(xué)習(xí)的故障診斷方法得到廣泛關(guān)注與研究。文獻(xiàn)[18]針對(duì)電力系統(tǒng)中隱匿虛假數(shù)據(jù)入侵攻擊的真實(shí)數(shù)據(jù)與模擬數(shù)據(jù)的差異性問題,首先基于DBN對(duì)海量目標(biāo)域無標(biāo)簽樣本進(jìn)行特征自學(xué)習(xí),然后用仿真得到的源域有標(biāo)簽樣本對(duì)模型進(jìn)行再訓(xùn)練,并結(jié)合遷移學(xué)習(xí)方法提高檢測(cè)精度。文獻(xiàn)[19]設(shè)計(jì)了一種基于深度卷積AE的半監(jiān)督模型,根據(jù)AE的編碼特征直接診斷健康狀況,降低了故障診斷對(duì)標(biāo)記數(shù)據(jù)的依賴。文獻(xiàn)[20]先用大量帶標(biāo)簽的燃?xì)廨啓C(jī)正態(tài)分布數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),再通過遷移學(xué)習(xí)重建模型映射規(guī)則,對(duì)少量樣本數(shù)據(jù)集提取特征,最后基于支持向量機(jī)(support vector machines, SVM)實(shí)現(xiàn)監(jiān)督故障診斷。文獻(xiàn)[21]整合RBM、長短期記憶網(wǎng)絡(luò)、前饋神經(jīng)網(wǎng)絡(luò)等多層深度神經(jīng)網(wǎng)絡(luò),從輸入數(shù)據(jù)中自動(dòng)學(xué)習(xí)抽象特征,用于預(yù)測(cè)渦輪風(fēng)扇發(fā)動(dòng)機(jī)的剩余使用壽命。文獻(xiàn)[22]在自我訓(xùn)練方法中使用偽標(biāo)簽策略,在對(duì)抗訓(xùn)練方法中使用監(jiān)測(cè)數(shù)據(jù),進(jìn)行半監(jiān)督學(xué)習(xí)。
半監(jiān)督學(xué)習(xí)突破了傳統(tǒng)方法只使用一種樣本的局限,既充分利用了大量無標(biāo)簽樣本數(shù)據(jù)資源,又避免了人工標(biāo)記耗費(fèi)的大量時(shí)間和精力,以及只使用少量有標(biāo)簽樣本訓(xùn)練造成的學(xué)習(xí)器泛化性能低下的問題。鑒于雷達(dá)裝備的實(shí)際監(jiān)測(cè)數(shù)據(jù)大部分是無標(biāo)簽的,無具體故障類型,很難被直接應(yīng)用于深度學(xué)習(xí)模型,本文提出一種自適應(yīng)優(yōu)化的半監(jiān)督深度學(xué)習(xí)方法,用于雷達(dá)T/R組件故障特征提取及智能診斷,主要?jiǎng)?chuàng)新點(diǎn)在于:① 利用DBN自主學(xué)習(xí)深層特征的優(yōu)勢(shì)和深度AE無監(jiān)督重構(gòu)輸入數(shù)據(jù)的特點(diǎn),直接從原始數(shù)據(jù)提取故障特征,增強(qiáng)了故障診斷智能性,解決了有標(biāo)簽樣本稀缺的問題;② 針對(duì)基于深度學(xué)習(xí)模型進(jìn)行故障識(shí)別時(shí)難以快速確定各隱層節(jié)點(diǎn)數(shù)量的問題,采用煙花算法(firework algorithm, FWA)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),進(jìn)而提升故障診斷準(zhǔn)確性。
相控陣?yán)走_(dá)具有掃描速度快、探測(cè)距離遠(yuǎn)、可靠性高等優(yōu)點(diǎn)[23],應(yīng)用前景廣闊。天線陣面子系統(tǒng)是相控陣?yán)走_(dá)最重要的子系統(tǒng)之一,也是其具備先進(jìn)性能的關(guān)鍵所在,系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 相控陣?yán)走_(dá)天線陣面子系統(tǒng)結(jié)構(gòu)圖Fig.1 Structure diagram of phased array radar antenna array subsystem
該系統(tǒng)由成百上千個(gè)單元或子陣組成,并通過T/R組件實(shí)現(xiàn)發(fā)射信號(hào)的功率放大、接收信號(hào)的低噪聲放大、天線波束的相移及幅度控制[24]。T/R組件是相控陣?yán)走_(dá)的核心部件,構(gòu)成模擬收發(fā)通道,發(fā)射通道包含功率放大器、上變頻器,用于放大射頻信號(hào)功率;限幅器、低噪聲放大器和下變頻器是構(gòu)成接收通道的主要器件,實(shí)現(xiàn)含噪接收信號(hào)的放大和變頻[25],圖2給出了T/R組件的結(jié)構(gòu)框圖。
圖2 T/R組件結(jié)構(gòu)圖Fig.2 Structure diagram of T/R module
現(xiàn)代相控陣?yán)走_(dá)的T/R組件是高度集成的,將多個(gè)T/R組件和數(shù)字收發(fā)通道集成設(shè)計(jì),形成一個(gè)最小可維修單元,稱為T/R模塊。通常是對(duì)一個(gè)模塊,而不是單個(gè)T/R組件進(jìn)行換件維修,因此只需將故障隔離到某個(gè)T/R模塊。雷達(dá)機(jī)內(nèi)測(cè)試能夠通過邏輯值對(duì)模塊故障進(jìn)行報(bào)警,1代表正常,0代表故障,但不能指示詳細(xì)的故障原因,難以給設(shè)備排故提供充分的依據(jù),致使維修維護(hù)工作效率低下,有時(shí)誤更換正常的元器件,造成資源浪費(fèi)。為了明確具體的故障類型,還需要分析運(yùn)行中采集的狀態(tài)數(shù)據(jù),挖掘蘊(yùn)含的故障信息。
依據(jù)雷達(dá)從實(shí)際運(yùn)行維修中返回的數(shù)據(jù)以及專家知識(shí),T/R模塊的常見故障模式有電源欠壓、電源過壓、發(fā)射通道故障、接收通道故障、發(fā)射和接收通道故障,故障表現(xiàn)如表1所示。
表1 雷達(dá)T/R模塊故障模式Table 1 Fault modes of radar T/R module
鑒于雷達(dá)系統(tǒng)中的有標(biāo)簽數(shù)據(jù)十分稀缺,本文提出一種基于FWA優(yōu)化的DBN-AE半監(jiān)督深度學(xué)習(xí)方法,將無監(jiān)督特征提取和有監(jiān)督分類器學(xué)習(xí)進(jìn)行結(jié)合。該方法的主要流程如圖3所示,實(shí)現(xiàn)步驟如下。
圖3 本文提出的特征提取及故障診斷算法流程Fig.3 Flowchart of feature extraction and fault diagnosis of the algorithm proposed in this paper
步驟 1對(duì)T/R模塊的故障模式進(jìn)行定義和編碼。
步驟 2數(shù)據(jù)集構(gòu)建:選取樣本數(shù)據(jù)和能表征模塊性能的狀態(tài)變量,進(jìn)行數(shù)據(jù)預(yù)處理,并劃分訓(xùn)練集和測(cè)試集。
步驟 3模型初始化:建立一個(gè)多層RBM模型,根據(jù)樣本特征維數(shù)確定輸入層節(jié)點(diǎn)數(shù),初始化連接權(quán)重。
步驟 4無監(jiān)督特征提取:采用預(yù)處理后的無標(biāo)簽樣本和有標(biāo)簽樣本對(duì)底層堆疊RBM進(jìn)行逐層預(yù)訓(xùn)練,使得模型參數(shù)適應(yīng)所有樣本的特征表達(dá),挖掘深層特征。然后,將預(yù)訓(xùn)練好的RBM逐層展開,構(gòu)建深度AE重構(gòu)輸入特征。
步驟 5網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化:通過FWA最小化重構(gòu)特征和原始特征之間的誤差,自適應(yīng)優(yōu)化網(wǎng)絡(luò)參數(shù),保存確定的網(wǎng)絡(luò)權(quán)重和偏置值,作為下一步DBN有監(jiān)督訓(xùn)練的初始參數(shù)。
步驟 6有監(jiān)督分類器學(xué)習(xí):利用有標(biāo)簽訓(xùn)練集對(duì)預(yù)訓(xùn)練好的RBM模型和Softmax分類層進(jìn)行有監(jiān)督再訓(xùn)練,并反向微調(diào)權(quán)重和偏置。
步驟 7將測(cè)試集輸入訓(xùn)練好的DBN,進(jìn)行故障診斷。
2006年,Hinton等首次提出了DBN[26],DBN是由多個(gè)RBM[27]堆疊而成的概率生成模型。RBM模型的基本結(jié)構(gòu)如圖4所示。
圖4 RBM結(jié)構(gòu)Fig.4 RBM structure
對(duì)于一個(gè)包含n個(gè)可視層單元、m個(gè)隱藏層單元的RBM,其能量函數(shù)為
(1)
式中:vi∈{0,1}表示第i個(gè)可視層神經(jīng)元的狀態(tài);bi為可視層單元vi的偏置;hj∈{0,1}表示第j個(gè)隱藏層神經(jīng)元的狀態(tài);aj為隱藏層單元hj的偏置;wij為vi與hj的連接權(quán)重;θ=[a,b,w]為RBM的網(wǎng)絡(luò)參數(shù)?;谑?1)定義的能量函數(shù),可視層與隱藏層之間的聯(lián)合概率密度分布為
(2)
式中:Z=∑v∑he-E(v,h|θ)為歸一化因子。通過式(2),得到可視層向量v的獨(dú)立分布為
(3)
隱藏層和可視層神經(jīng)元的激活概率分別為
(4)
(5)
P(v)值最大時(shí),RBM結(jié)構(gòu)下的概率分布與輸入數(shù)據(jù)較為一致,因此預(yù)訓(xùn)練優(yōu)化目標(biāo)函數(shù)為
(6)
為簡(jiǎn)化計(jì)算,利用對(duì)比散度算法[28]求解RBM的最優(yōu)參數(shù)θ,參數(shù)更新公式如下:
(7)
式中:ε為預(yù)訓(xùn)練學(xué)習(xí)率;m為動(dòng)量因子;t是迭代次數(shù);〈·〉d和〈·〉r分別表示數(shù)據(jù)分布和模型分布的數(shù)學(xué)期望。
DBN特征提取的質(zhì)量在很大程度上決定其故障診斷的性能,因此在將DBN模型用于分類之前,有必要驗(yàn)證RBM提取的高層特征能否表征原始特征。本節(jié)將從RBM隱含層單元對(duì)數(shù)據(jù)重構(gòu)的角度驗(yàn)證所提模型的特征提取能力。
為觀察原始數(shù)據(jù)經(jīng)RBMs無監(jiān)督學(xué)習(xí)后的輸出特征狀態(tài),最高層RBM的輸出不經(jīng)過分類器,直接將隱含層重構(gòu)數(shù)據(jù)逐層展開,建立一個(gè)深度自編碼器,稱為DBN-AE?;贒BN的重構(gòu)網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖5所示。其與傳統(tǒng)DBN最主要的區(qū)別是:DBN輸出的是標(biāo)簽,屬于有監(jiān)督學(xué)習(xí);DBN-AE是無監(jiān)督學(xué)習(xí),編碼和解碼過程沒有帶標(biāo)簽數(shù)據(jù)參與,輸出的是與輸入特征維度一致的重構(gòu)特征。
圖5 DBN-AE結(jié)構(gòu)示意圖Fig.5 Structure diagram of DBN-AE
RBMs的前向?qū)W習(xí)過程可以看作是AE的編碼過程,設(shè)輸入數(shù)據(jù)為x,可以用編碼形式簡(jiǎn)單描述為
h=1/(1+exp(-wx-b))
(8)
而RBM隱層單元的重構(gòu)相當(dāng)于AE的解碼過程[29],對(duì)應(yīng)的解碼函數(shù)定義為
(9)
式中:w為連接權(quán)重;b和c為對(duì)應(yīng)的偏置參數(shù)。
在網(wǎng)絡(luò)的編碼、解碼重構(gòu)中,信號(hào)被壓縮、重整,重構(gòu)信號(hào)與原始信號(hào)會(huì)存在一定的差異,兩者的差異大小可用于衡量DBN-AE的特征提取能力。本文用均方誤差(mean square error, MSE)量化這一差異。設(shè)經(jīng)過l層堆疊RBM的編碼輸出為ul(x),解碼輸出,即對(duì)初始樣本的重構(gòu)為yl(x)。基于重構(gòu)數(shù)據(jù)與原數(shù)據(jù)之間MSE的代價(jià)函數(shù)表示為
(10)
式中:n為樣本的數(shù)目。這一誤差越小,重構(gòu)信號(hào)與原始信號(hào)的一致性越高,表明模型提取的深層特征越能夠在一定程度上表征原始特征。使用反向傳播(back propagation, BP)[30]算法對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行調(diào)參,采用梯度下降方法最小化代價(jià)函數(shù),對(duì)參數(shù)求偏導(dǎo):
(11)
式中:θ=[w,b,c],1≤k≤l,更新參數(shù)展開得
(12)
迭代更新各層參數(shù)直至誤差處于穩(wěn)定收斂狀態(tài),獲得特征提取模型。
基于DBN-AE的特征重構(gòu)步驟如下。
步驟 1數(shù)據(jù)預(yù)處理。
步驟 2將原始數(shù)據(jù)輸入第一層RBM的可視層單元v1,通過無監(jiān)督貪婪學(xué)習(xí)算法自底向上逐層優(yōu)化各層RBM的連接權(quán)值和偏置,直到所有的RBM都學(xué)習(xí)完成。這一過程對(duì)應(yīng)AE的編碼過程,最高層RBM的隱藏層為得到的編碼特征。
步驟 3將RBM隱層單元的重構(gòu)逐層展開,這一過程相當(dāng)于AE的解碼,編碼部分和解碼部分的權(quán)重矩陣互為轉(zhuǎn)置,得到與原始特征對(duì)應(yīng)的重構(gòu)特征。
步驟 4基于BP算法對(duì)DBN-AE網(wǎng)絡(luò)的權(quán)重和偏置進(jìn)行微調(diào),使可視層單元和重構(gòu)可視層單元之間的差異最小,得到能夠表征原始特征的編碼特征,實(shí)現(xiàn)無監(jiān)督特征自學(xué)習(xí)。
為了快速確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),本文運(yùn)用FWA,通過最小化DBN-AE網(wǎng)絡(luò)的重構(gòu)數(shù)據(jù)和原始數(shù)據(jù)的誤差,自適應(yīng)選取網(wǎng)絡(luò)全局最優(yōu)結(jié)構(gòu)參數(shù),進(jìn)一步提高其無監(jiān)督特征提取性能。
FWA[31]是模擬煙花爆炸現(xiàn)象而提出的一種群體智能優(yōu)化算法,通過爆炸進(jìn)行尋優(yōu),每個(gè)煙花的位置信息等同于解空間中的一個(gè)可行解。FWA具有局部搜索和全局搜索能力自調(diào)節(jié)、可并行運(yùn)算、耗時(shí)短等優(yōu)點(diǎn),在路徑規(guī)劃[32]、參數(shù)優(yōu)化[33]、模式識(shí)別[34]等領(lǐng)域得到廣泛應(yīng)用。
第一次迭代時(shí),先隨機(jī)生成N個(gè)初始煙花,逐一根據(jù)其相對(duì)于其他煙花的適應(yīng)度值執(zhí)行爆炸操作,產(chǎn)生火花。對(duì)于煙花xi,其爆炸半徑Ri和爆炸火花數(shù)量Si的計(jì)算公式分別為
(13)
(14)
式中:Er和En分別是爆炸半徑和爆炸數(shù)目常數(shù),可控制爆炸半徑和爆炸產(chǎn)生的火花數(shù)量;f(xi)是適應(yīng)度函數(shù);ymin=min(f(xi))(i=1,2,…,N)是當(dāng)前煙花種群中適應(yīng)度最好的個(gè)體的適應(yīng)度值;ymax=max(f(xi))是適應(yīng)度最差的個(gè)體的適應(yīng)度值;eps是近似0的常數(shù)。
接著,將煙花對(duì)應(yīng)維度的數(shù)值進(jìn)行位移,模擬真實(shí)煙花爆炸產(chǎn)生火花的過程:
(15)
為了避免陷入局部最優(yōu)解,煙花算法引入變異算子產(chǎn)生高斯變異火花。在煙花種群中隨機(jī)選擇一個(gè)煙花xi,對(duì)其維度k執(zhí)行高斯變異操作:
(16)
式中:g服從均值為1、方差為1的高斯分布,即g~N(1,1)。
將超出邊界的火花映射到可行域內(nèi)的映射規(guī)則如下:
(17)
最后,從初始煙花、爆炸火花和高斯變異火花中選擇一定數(shù)量的個(gè)體作為下次迭代的初始煙花。先選取適應(yīng)度值最優(yōu)的個(gè)體,再用輪盤賭的方式選擇剩余N-1個(gè)。個(gè)體xi被選中的概率為
(18)
式中:R(xi)為個(gè)體xi與其他個(gè)體的歐式距離之和。
由式(18)可知,分布較分散的個(gè)體被選中的概率更大,有利于找到全局最優(yōu)解。
經(jīng)過上述預(yù)訓(xùn)練過程,得到底層RBMs和編碼特征,然而此時(shí)還不能進(jìn)行直接分類。要實(shí)現(xiàn)故障診斷,還需在頂層添加分類層和標(biāo)簽,對(duì)增加的分類層進(jìn)行訓(xùn)練。
底層RBMs的初始權(quán)重和偏置直接采用無監(jiān)督訓(xùn)練中得到的值,最高層以softmax模型作為分類器。設(shè)DBN含l個(gè)RBM,初始樣本為x,根據(jù)前向傳播算法,最后一層RBM輸出向量為ul(x):
(19)
第i個(gè)樣本經(jīng)前向l層RBM學(xué)習(xí)后,屬于類別yi,yi∈(1,2,…,c)的概率為
(20)
式中:V為參數(shù)系數(shù),選取概率最大的類別作為分類器輸出。網(wǎng)絡(luò)第l層的代價(jià)函數(shù)為
(21)
式中:λl={wl,bl,cl,Vl};1{·}為邏輯指示函數(shù)。當(dāng)yi=q時(shí),1{yi=q}的值為1,否則值為0。為使代價(jià)函數(shù)值最小,采用BP算法[29]將網(wǎng)絡(luò)輸出與真實(shí)數(shù)值標(biāo)簽之間的誤差自頂向下BP至每一層,微調(diào)參數(shù)直至訓(xùn)練集準(zhǔn)確率穩(wěn)定收斂,至此半監(jiān)督DBN模型的整個(gè)訓(xùn)練過程完成。
不同于傳統(tǒng)DBN直接用帶標(biāo)簽數(shù)據(jù)訓(xùn)練分類器,本文提出的算法在底層RBMs和AE無監(jiān)督學(xué)習(xí)得到的特征的基礎(chǔ)上,再加入標(biāo)簽數(shù)據(jù)進(jìn)行有監(jiān)督再訓(xùn)練,完整的過程如圖6所示。
圖6 DBN模型的半監(jiān)督訓(xùn)練過程Fig.6 Semi-supervised training process of DBN model
本文選用某型相控陣?yán)走_(dá)在2019年3月至9月的在線監(jiān)測(cè)數(shù)據(jù),采樣間隔為1 min,以其中一個(gè)8通道T/R模塊為研究對(duì)象,可供采集的狀態(tài)量如表2所示。
表2 雷達(dá)T/R模塊監(jiān)測(cè)變量Table 2 Monitored variables of radar T/R module
在無監(jiān)督特征提取實(shí)驗(yàn)中,選取10 000組有標(biāo)簽和無標(biāo)簽樣本進(jìn)行預(yù)訓(xùn)練,其中1 800個(gè)樣本有標(biāo)簽,包含正常狀態(tài)和5類故障狀態(tài)在內(nèi)的6類數(shù)據(jù)各300組,故障類型如表1所示,其他為無標(biāo)簽樣本。每個(gè)樣本包含26個(gè)特征,按4∶1的比例劃分訓(xùn)練集和測(cè)試集。
在有監(jiān)督故障分類實(shí)驗(yàn)中,采用1 800組有標(biāo)簽樣本訓(xùn)練分類器,為6種工況分別添加標(biāo)簽C=[1,2,3,4,5,6]。在每種工況下選取250個(gè)樣本作為訓(xùn)練集,以50個(gè)樣本作為測(cè)試集。
DBN-AE的訓(xùn)練參數(shù)如表3所示,輸入層為T/R模塊的26個(gè)原始狀態(tài)量,輸出層為重構(gòu)的26個(gè)特征,隱層數(shù)選擇4。深度神經(jīng)網(wǎng)絡(luò)的分類錯(cuò)誤率會(huì)隨著深度增加而降低,但增加到4層以上時(shí),泛化性能反而下降[29]。為兼顧算法的收斂速度與穩(wěn)定性,設(shè)置學(xué)習(xí)率為0.1,初始動(dòng)量為0.5,在誤差平穩(wěn)增加時(shí)動(dòng)量變?yōu)?.9。
表3 DBN-AE訓(xùn)練參數(shù)Table 3 DBN-AE training parameters
采用FWA優(yōu)化DBN-AE各層節(jié)點(diǎn)數(shù),FWA的基本參數(shù)如表4所示,變量維數(shù)為要尋優(yōu)的網(wǎng)絡(luò)參數(shù)數(shù)量,適應(yīng)度函數(shù)取模型重構(gòu)特征與原始特征的MSE,如式(10)所示。尋優(yōu)得到編碼部分各隱層神經(jīng)元最佳數(shù)量依次為11-37-26-9,解碼部分隱層節(jié)點(diǎn)數(shù)依次為26-37-11。
表4 FWA基本參數(shù)Table 4 Parameters of FWA
為了驗(yàn)證FWA優(yōu)化深度置信重構(gòu)網(wǎng)絡(luò)的有效性及所提方法的特征提取能力,將其與經(jīng)粒子群優(yōu)化(particle swarm optimization, PSO)算法優(yōu)化的PSO-DBN-AE、未優(yōu)化的DBN-AE和單一DAE對(duì)比,其中PSO算法的參數(shù)設(shè)置為:初始粒子數(shù)為20,加速度因子c1=0.5,c2=0.9,慣性權(quán)重μ=0.5,變量上、下界分別為50和1,迭代50次,DBN參數(shù)均與本文方法保持一致。
本實(shí)驗(yàn)采用訓(xùn)練誤差、測(cè)試誤差和訓(xùn)練時(shí)間指標(biāo)衡量各模型的特征提取性能,訓(xùn)練誤差和測(cè)試誤差分別指模型在訓(xùn)練集和測(cè)試集上輸出的重構(gòu)特征與原始特征之間的MSE。為了消除算法隨機(jī)性,將每個(gè)算法都重復(fù)運(yùn)行10次,取10次結(jié)果的平均值,結(jié)果如圖7和表5所示。
圖7 不同無監(jiān)督特征提取算法特征重構(gòu)誤差對(duì)比Fig.7 Reconstruction error comparison of different unsupervised feature extraction algorithms
表5 不同無監(jiān)督算法特征提取指標(biāo)對(duì)比Table 5 Comparison of feature extraction indicators of different unsupervised algorithms
由圖7可以看出,隨著迭代次數(shù)增加,各模型的訓(xùn)練誤差和測(cè)試誤差都在不斷減小,FWA-DBN-AE的收斂速度更快,擬合效果更好。
由表5可以看出,FWA-DBN-AE算法的訓(xùn)練誤差和測(cè)試誤差最小,重構(gòu)特征更接近于實(shí)際值,在訓(xùn)練集上的MSE值為0.053 8,在測(cè)試集上的MSE值為0.059 2。相比單一DAE、未經(jīng)優(yōu)化的DBN-AE和PSO-DBN-AE,測(cè)試誤差分別降低了22.41%、10.57%和3.9%;且其測(cè)試誤差也最接近訓(xùn)練誤差,說明擬合效果較好,基本不存在過擬合情況。在時(shí)間復(fù)雜度上,DBN的訓(xùn)練時(shí)間受神經(jīng)元數(shù)量影響,神經(jīng)元數(shù)目越多,訓(xùn)練時(shí)間越長,相比未優(yōu)化的DBN-AE和DAE,本文方法的訓(xùn)練時(shí)間增加了30~50 s,但特征提取效果大大提升。
綜合均方根誤差和訓(xùn)練時(shí)間,FWA優(yōu)化的DBN-AE特征提取性能最優(yōu)。因此,對(duì)于雷達(dá)T/R模塊數(shù)據(jù),FWA能夠提升DBN-AE的無監(jiān)督特征提取性能和訓(xùn)練效率。
DBN模型的隱層層數(shù)為4,輸入為無編碼26個(gè)特征,輸出為樣本分別屬于6種狀態(tài)的概率值,取值最大的狀態(tài)作為診斷結(jié)果。底層堆疊RBM的隱層節(jié)點(diǎn)數(shù)、初始權(quán)重和偏置值采用第3.2節(jié)預(yù)訓(xùn)練中得到的最優(yōu)參數(shù)。綜合考慮精度和時(shí)間,將DBN反向微調(diào)的迭代次數(shù)設(shè)為300次。
為了評(píng)估模型的故障診斷能力,采用總體準(zhǔn)確率和單一故障識(shí)別準(zhǔn)確率作為評(píng)價(jià)指標(biāo)??傮w準(zhǔn)確率是指分類正確的樣本數(shù)與所有樣本數(shù)的比值。單一故障識(shí)別準(zhǔn)確率指在某類單一故障下,被正確識(shí)別的樣本與該類別樣本總數(shù)的比值,可以通過混淆矩陣進(jìn)行可視化。在T/R模塊測(cè)試集上的故障分類準(zhǔn)確率變化曲線和混淆矩陣分別如圖8和圖9所示。
圖8 半監(jiān)督DBN故障分類準(zhǔn)確率變化Fig.8 Fault classification accuracy curve of semi-supervised DBN
模型在訓(xùn)練集和測(cè)試集上的總體準(zhǔn)確率分別為96.6%和96%,其中正常模式和發(fā)射通道故障的識(shí)別率為100%,電源過壓、電源欠壓、發(fā)射和接收通道故障的識(shí)別率達(dá)到94%以上,說明所提算法對(duì)于雷達(dá)T/R組件故障具有良好的識(shí)別能力。
第3.2節(jié)的實(shí)驗(yàn)從RBM隱層單元重構(gòu)數(shù)據(jù)與原始數(shù)據(jù)的一致性出發(fā)驗(yàn)證了DBN的特征提取能力,本部分實(shí)驗(yàn)將從一個(gè)完整的DBN,即特征提取和有監(jiān)督分類器組合的角度,驗(yàn)證模型在T/R模塊故障診斷中的逐層特征提取能力。由于原始數(shù)據(jù)和模型每層提取的特征維數(shù)都比較高,為便于在一張圖中觀察,利用PCA降維方法顯示各層特征的前2個(gè)主成分PC1和PC2,圖10給出了原始特征的分布圖。
圖10 原始特征二維PCA映射散點(diǎn)圖Fig.10 Two-dimensional PCA mapping scatter plot of original features
圖10中6類故障數(shù)據(jù)的特征重疊在一起,相互交叉,難以區(qū)分。采用DBN模型進(jìn)行故障特征提取后的可視化結(jié)果如圖11所示。
圖11 DBN故障特征提取二維PCA映射散點(diǎn)圖Fig.11 Two-dimensional PCA mapping scatter plot of DBN fault feature extraction
由圖11可以看出,與原始故障特征相比,半監(jiān)督DBN提取的特征具有更好的可分性,最終6類故障數(shù)據(jù)被完全分散開,有利于分類器進(jìn)行識(shí)別。以上結(jié)果表明,本文方法能夠自適應(yīng)地從原始數(shù)據(jù)中逐層提取有效故障特征,無需人工參與,并在一定程度上提高了特征分類的準(zhǔn)確率。
為更加充分地驗(yàn)證本文所提半監(jiān)督算法中無監(jiān)督預(yù)訓(xùn)練的有效性,將其與其他6種分類方法在T/R模塊數(shù)據(jù)集上的故障診斷準(zhǔn)確率進(jìn)行比較,其中包括2種半監(jiān)督深度學(xué)習(xí)方法:PSO-DBN-AE、DBN-AE,以及只使用有標(biāo)簽樣本進(jìn)行訓(xùn)練的4種有監(jiān)督方法:單一DBN、DBN-ELM、SVM和樸素貝葉斯。其中,DBN訓(xùn)練參數(shù)與FWA-DBN-AE保持一致,PSO-DBN-AE的參數(shù)設(shè)置和第3.2節(jié)相同;SVM的核函數(shù)為徑向基函數(shù),誤差精度設(shè)置為1×10-3。
每個(gè)算法重復(fù)運(yùn)行10次,取10次結(jié)果的均值,各算法的故障診斷結(jié)果如表6所示。
表6 不同算法故障診斷結(jié)果對(duì)比Table 6 Fault diagnosis results of different algorithms %
通過表6的對(duì)比可知,本文所提方法的故障診斷準(zhǔn)確率最高,在訓(xùn)練集和測(cè)試集上的準(zhǔn)確率分別為96.67%和96%,與同為半監(jiān)督深度學(xué)習(xí)的PSO-DBN-AE、DBN-AE方法相比,訓(xùn)練準(zhǔn)確率分別提升了1.93%和2.33%,測(cè)試準(zhǔn)確率分別提升了2%和2.67%;與單一DBN、DBN-ELM、SVM和樸素貝葉斯有監(jiān)督學(xué)習(xí)方法相比,訓(xùn)練準(zhǔn)確率分別提升了3.07%、2.47%、4.5%和6%,測(cè)試準(zhǔn)確率分別提升了3.33%、2.67%、5.67%和6.67%。在模型訓(xùn)練效率方面,DBN的網(wǎng)絡(luò)結(jié)構(gòu)雖然比SVM、樸素貝葉斯復(fù)雜,但采用對(duì)比散度算法逐層預(yù)訓(xùn)練,對(duì)參數(shù)分布有較好的預(yù)估計(jì),能避免陷入局部最優(yōu),且模型收斂速度快。從圖8可以看出,算法在第180代左右已經(jīng)收斂,這說明模型一旦訓(xùn)練完成,診斷時(shí)間很短,具有良好的工程應(yīng)用前景。
相比直接將DBN用于分類,提前用大量無標(biāo)簽樣本基于DBN-AE進(jìn)行預(yù)訓(xùn)練,學(xué)習(xí)通用特征表達(dá),有助于提高診斷的準(zhǔn)確率。由于經(jīng)過前期的無監(jiān)督特征自學(xué)習(xí),模型參數(shù)適應(yīng)所有樣本的特征表達(dá),提高了DBN高層特征的通用性,從而改善了模型的故障診斷性能。其準(zhǔn)確率優(yōu)于傳統(tǒng)的有監(jiān)督學(xué)習(xí)算法和其他半監(jiān)督深度學(xué)習(xí)算法。
本文針對(duì)相控陣?yán)走_(dá)系統(tǒng)采集的有標(biāo)簽數(shù)據(jù)稀缺的問題,提出了一種基于FWA-DBN-AE模型的雷達(dá)T/R模塊故障診斷方法,將無監(jiān)督特征提取和有監(jiān)督分類器學(xué)習(xí)相結(jié)合。首先,利用RBM自主學(xué)習(xí)相關(guān)特征的優(yōu)勢(shì),對(duì)大量無標(biāo)簽和有標(biāo)簽樣本進(jìn)行預(yù)訓(xùn)練,然后通過隱層重構(gòu)的方式逐層展開RBM建立DBN-AE網(wǎng)絡(luò),以較低的失真度重構(gòu)輸入數(shù)據(jù),從而實(shí)現(xiàn)特征提取;接著,以提高重構(gòu)信號(hào)與原始信號(hào)的一致性為目標(biāo),運(yùn)用FWA優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu);最后,利用少量有標(biāo)簽樣本再訓(xùn)練新增的分類層,得到T/R模塊故障診斷的最優(yōu)模型。
實(shí)驗(yàn)結(jié)果表明,該半監(jiān)督深度學(xué)習(xí)方法不僅能取得較高的故障識(shí)別精度,并且簡(jiǎn)化了特征提取過程,具有直接從原始數(shù)據(jù)自動(dòng)提取故障特征的能力。FWA能自適應(yīng)地確定網(wǎng)絡(luò)結(jié)構(gòu),節(jié)省了大量時(shí)間和精力,并進(jìn)一步提升了模型的特征提取性能和故障診斷準(zhǔn)確率,相比單純的有監(jiān)督故障診斷方法具有更好的泛化性。