張 原,姜煥成
(西北工業(yè)大學(xué)電子信息學(xué)院,陜西 西安 710129)
當(dāng)今的火炮發(fā)展趨勢是智能化、科技化和輕量化[1],大口徑火炮殺傷力大,作用范圍廣,同時(shí)又兼具經(jīng)濟(jì)性,雖然其現(xiàn)代化的進(jìn)程較慢,但大口徑火炮在軍隊(duì)中的地位依舊不可替代。大口徑火炮在軍隊(duì)中主要用作火力壓制,是戰(zhàn)場上十分關(guān)鍵的壓制武器。目前,大口徑火炮故障問題是影響其任務(wù)成功率的最主要障礙,由于其工作環(huán)境嚴(yán)酷,再加上高溫高壓的工作狀態(tài)[2],劇烈的后坐力和振動[3],火炮各個部件消耗嚴(yán)重,很容易導(dǎo)致火炮射擊精度不達(dá)標(biāo)[4]。當(dāng)下大部分大口徑火炮的預(yù)先維護(hù)保養(yǎng)是根據(jù)火炮發(fā)射次數(shù)和易損件使用次數(shù)等來進(jìn)行的,這樣只能在某種特定情況下做到有效的維修,一旦環(huán)境和影響因素發(fā)生變化,便無法保證火炮的工作狀態(tài)[5],因此針對大口徑火炮服役現(xiàn)狀,設(shè)計(jì)能夠高效完成預(yù)先維護(hù)保養(yǎng)工作的大口徑火炮健康管理系統(tǒng)尤為重要[6]。
隨著計(jì)算機(jī)行業(yè)的發(fā)展,杰弗里-辛頓提出的深度學(xué)習(xí)概念作為人工智能技術(shù)中神經(jīng)網(wǎng)絡(luò)的重要分支,在機(jī)械故障診斷方面大放異彩[7],也為機(jī)械故障診斷指出了一條新的道路[8]。目前,深度學(xué)習(xí)技術(shù)已經(jīng)廣泛應(yīng)用于各個領(lǐng)域,除去尖端科技航空航天領(lǐng)域,還在民用飛機(jī)、汽車、核電站和大型水壩等民用領(lǐng)域獲得了廣泛應(yīng)用[9]。但是,在地面裝備領(lǐng)域,特別是對于大口徑火炮的應(yīng)用研究,由于其模型數(shù)據(jù)難以獲得,對目標(biāo)預(yù)測準(zhǔn)確性要求高,以及實(shí)驗(yàn)機(jī)會難以獲取,幾乎所有研究都被限制在理論與仿真環(huán)境下。因此,本文在針對大口徑火炮進(jìn)行健康管理系統(tǒng)的開發(fā)的同時(shí),提出加入深度學(xué)習(xí)算法對火炮的故障診斷與預(yù)測進(jìn)行探索與研究。
作為第三方設(shè)備,項(xiàng)目針對大口徑火炮開發(fā)的健康管理系統(tǒng)在接入火炮系統(tǒng)的同時(shí),不影響其他任何部分的工作,完成了對大口徑火炮部分運(yùn)行狀態(tài)的實(shí)時(shí)顯示與記錄,利用傳統(tǒng)專家分析[10]對數(shù)據(jù)進(jìn)行處理,并提出一種基于改進(jìn)深度置信網(wǎng)絡(luò)的大口徑火炮故障預(yù)測方法,利用DBN(Deep Belief Network)技術(shù)的無監(jiān)督自動提取數(shù)據(jù)特征的能力,結(jié)合多層感知機(jī)MLP(Multi Layer Perception)11]有監(jiān)督學(xué)習(xí)[12]分類特點(diǎn),完成對大口徑火炮的故障檢測。
大口徑火焰健康管理系統(tǒng)上位機(jī)按照功能模塊擬劃分為過程回放、數(shù)據(jù)導(dǎo)出、電子履歷以及故障預(yù)測4部分。系統(tǒng)對火炮系統(tǒng)各個部分記錄的數(shù)據(jù)進(jìn)行顯示,后期對報(bào)文記錄文件進(jìn)行回放和分類轉(zhuǎn)存,對火炮狀態(tài)進(jìn)行分析與評估。既可對火炮的狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)控,發(fā)現(xiàn)并排除故障,又可對火炮系統(tǒng)的故障等進(jìn)行預(yù)測與預(yù)防。其結(jié)構(gòu)如圖1所示。
Figure 1 Structure of health management system of large caliber artillery圖1 大口徑火炮健康管理系統(tǒng)結(jié)構(gòu)
大口徑火炮健康管理系統(tǒng)是針對利用CAN(Controller Area Network)總線傳輸數(shù)據(jù)的火炮系統(tǒng)進(jìn)行設(shè)計(jì)的,利用VxWorks下位機(jī)系統(tǒng)接入CAN總線火炮系統(tǒng),完成對數(shù)據(jù)包的捕獲和記錄,將數(shù)據(jù)存儲于VxWorks嵌入式系統(tǒng)[13]中的FTP(File Transfer Protocol)服務(wù)器,等待上位機(jī)對記錄的數(shù)據(jù)進(jìn)行下載和分析。
FTP連接的實(shí)現(xiàn)方式多種多樣,本項(xiàng)目基于MFC技術(shù)[14]進(jìn)行設(shè)計(jì),因此使用其自帶的網(wǎng)絡(luò)通訊包AFXINET.H建立FTP連接,并設(shè)置可選的遠(yuǎn)程地址、近端地址、用戶名和密碼等,靈活完成對數(shù)據(jù)的下載。中央處理界面設(shè)計(jì)如圖2所示。
Figure 2 Design of central processing interface圖2 中央處理界面設(shè)計(jì)
過程回放功能界面分為左右2部分,左半部分設(shè)計(jì)為標(biāo)簽頁式分欄,分別對應(yīng)各個設(shè)備之間的數(shù)據(jù)解析結(jié)果;右半部分又分為上下2塊,上半部分為原始數(shù)據(jù)的顯示,便于再次核對火炮各個部分工作狀態(tài),下半部分為數(shù)據(jù)回放的控制,包括回放速率、單幀回放、自動回放以及文件的讀取和退出?;胤胚^程利用多線程技術(shù),分別完成左半部分解析結(jié)果的UI(User Interface)刷新和右半部分對數(shù)據(jù)的解析,以模塊化方式實(shí)現(xiàn)最少資源占用情況下的高效工作。過程回放界面設(shè)計(jì)如圖3所示。
Figure 3 Design of process playback interface圖3 過程回放界面設(shè)計(jì)
數(shù)據(jù)導(dǎo)出功能頁面由文件讀取導(dǎo)出控制部分和各個報(bào)文選中狀態(tài)復(fù)選框組成。文件控制部分由界面上對應(yīng)的各個文件路徑行編輯框,以及內(nèi)部對記錄文件的解析函數(shù)組成,在解析函數(shù)中對記錄文件的總幀數(shù)、每一幀包含的報(bào)文種類等進(jìn)行解析,并顯示于UI上,供分析人員對記錄文件導(dǎo)出范圍、導(dǎo)出內(nèi)容等的控制。復(fù)選框部分則是對報(bào)文類型進(jìn)行直觀展示,便于對導(dǎo)出報(bào)文的種類進(jìn)行選擇。數(shù)據(jù)導(dǎo)出界面設(shè)計(jì)如圖4所示。
Figure 4 Design of data export interface圖4 數(shù)據(jù)導(dǎo)出界面設(shè)計(jì)
電子履歷功能需要完成對存在于VxWorks下位機(jī)中的SQLite數(shù)據(jù)庫的讀取和顯示,因此包含SQLite操作頭文件,完成對數(shù)據(jù)庫的連接與讀取,以及在建立連接后,對記錄數(shù)據(jù)的增刪改查。具備這些功能便可以對各個設(shè)備的使用壽命進(jìn)行查看與重圍,從而更加精確可控地記錄火炮工作狀態(tài)。電子履歷界面設(shè)計(jì)如圖5所示。
Figure 5 Design of electronic resume interface圖5 電子履歷界面設(shè)計(jì)
深度學(xué)習(xí)作為基于人工神經(jīng)元網(wǎng)絡(luò)的一種新型的人工智能算法,擁有很強(qiáng)的特征自動提取能力[15],并因此在大數(shù)據(jù)領(lǐng)域取得了不小的成就[16]。目前,最常用的深度學(xué)習(xí)模型[17]包括多層感知機(jī)(MLP)、卷積神經(jīng)網(wǎng)絡(luò)、堆疊自動編碼機(jī)、遞歸神經(jīng)網(wǎng)絡(luò)和深度置信網(wǎng)絡(luò)(DBN)。
相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),DBN可直接從低層原始信號出發(fā),通過逐層貪婪學(xué)習(xí)[17]得到高層特征表示,避免特征提取與選擇的人工操作,有效地降低傳統(tǒng)人工特征提取與選擇所帶來的復(fù)雜性和不確定性,增強(qiáng)識別的可靠性。相較于傳統(tǒng)的故障診斷方法,如基于數(shù)理模型的故障診斷與預(yù)測和基于專家知識的故障預(yù)測與診斷,DBN的優(yōu)勢首先在于能夠擺脫對大量信號處理技術(shù)與診斷經(jīng)驗(yàn)的依賴,實(shí)現(xiàn)故障特征的自適應(yīng)提取與健康狀態(tài)的智能預(yù)測;其次,傳統(tǒng)的故障診斷方法所針對的時(shí)域信號特征通常為某種波形出現(xiàn)的頻率,這就要求被監(jiān)聽的信號具有時(shí)域周期性,而DBN對時(shí)域信號沒有周期性要求,具有較強(qiáng)的通用性和適應(yīng)性;最后是其具有處理高維、非線性數(shù)據(jù)的能力,相較于傳統(tǒng)故障診斷方法,DBN能夠利用更加復(fù)雜且無規(guī)律的數(shù)據(jù)來完成診斷。從此角度看,深度置信網(wǎng)絡(luò)適合用于處理具有海量性、多模態(tài)性、不確定性、涌現(xiàn)性、多源異構(gòu)性和價(jià)值低密度性等的新時(shí)期工業(yè)“大數(shù)據(jù)”故障診斷問題。
多層感知機(jī)[11]是深度學(xué)習(xí)的基礎(chǔ),是近幾年在工業(yè)界新興的一個機(jī)器學(xué)習(xí)領(lǐng)域的研究內(nèi)容,因此本文優(yōu)先選擇多層感知機(jī)來實(shí)現(xiàn)大口徑火炮故障預(yù)測神經(jīng)網(wǎng)絡(luò)的搭建,其結(jié)構(gòu)如圖6所示。
Figure 6 Structure of three-layer perception 圖6 3層結(jié)構(gòu)的多層感知機(jī)
圖6為最基本的多層感知機(jī)模型,其中有一個輸入層,包含3個輸入節(jié)點(diǎn),一個隱含層,包含4個隱含層節(jié)點(diǎn),一個輸出層,包含2個輸出節(jié)點(diǎn)。輸入節(jié)點(diǎn)、隱含層節(jié)點(diǎn)和輸出節(jié)點(diǎn)的個數(shù)可以根據(jù)實(shí)際情況增加或減少,此外,隱含層的個數(shù)也可以增加或減少。
(1)
多層感知機(jī)的前向傳播算法就是依照式(1),根據(jù)輸入數(shù)據(jù)xk,一層一層計(jì)算得到輸出值。前向傳播完成后,需要對模型進(jìn)行參數(shù)學(xué)習(xí)。
根據(jù)各種變量之間的關(guān)系式推導(dǎo)可得:
(2)
(3)
用δ(l)來定義第l層神經(jīng)元的誤差向量,如式(4)所示:
δ(l)
f′l(z(l))⊙((w(l+1))Tδ(l+1))
(4)
總的來說反向傳播算法的含義是:第l層的一個神經(jīng)元的誤差項(xiàng)是所有與神經(jīng)元相連的第l+1層神經(jīng)元的誤差項(xiàng)的權(quán)重和,再乘以該神經(jīng)元激活函數(shù)的梯度。
DBN提取數(shù)據(jù)特征的能力是建立在RBM(Restricted Boltzmann Machine)結(jié)構(gòu)堆疊的基礎(chǔ)上的。RBM是一種典型的隨機(jī)神經(jīng)網(wǎng)絡(luò)。RBM的結(jié)構(gòu)簡潔明了,分為可見單元組(Visible Unit)和隱含層單元組(Hidden Unit)。這2種單元之間互相連接,但是同一單元組之間不允許連接,其結(jié)構(gòu)如圖7所示。
Figure 7 Schematic diagram of the internal connections of a restricted Boltzmann machine圖7 受限玻爾茲曼機(jī)內(nèi)部連接示意圖
圖7中V=(v1,v2,v3,…,vm)為RBM的可視層,H=(h1,h2,h3,…,hn)為RBM的隱含層,RBM的能量定義函數(shù)如下所示:
E(V,H)=-∑ivibi-∑jhjcj-∑i,jvihjwij
(5)
其中,b=(b1,b2,b3,…,bm)是對應(yīng)可視層每個神經(jīng)元的偏置量,c=(c1,c2,c3,…,cn)是對應(yīng)隱含層每個神經(jīng)元的偏置量,wn×m是隱含層第n個神經(jīng)元對應(yīng)可視層第m個神經(jīng)元的權(quán)重。
由式(5)推導(dǎo)得,可視層與隱含層之間的聯(lián)合概率分布為:
(6)
其中z為歸一化系數(shù):
z=∑V,He-E(V,H)
(7)
由2層之間的聯(lián)合概率分布式與每一層的各數(shù)據(jù)項(xiàng),在任意一層已知的基礎(chǔ)上,可以求得另一層各個神經(jīng)元被激活的概率,其計(jì)算公式如下所示:
(8)
(9)
其中,σ(x)為激活函數(shù),通常選擇sigmoid函數(shù),其函數(shù)表達(dá)式如下:
(10)
RBM利用輸入的數(shù)據(jù)特征量,在可視層與隱含層之間正向與反向的學(xué)習(xí)來校正2層間的權(quán)重矩陣和各自的偏置量,通過對比由隱含層反向得到輸入層數(shù)據(jù)來判斷學(xué)習(xí)效果并不斷修正,直至滿足精度要求。
DBN則是將多個RBM以首尾相接的方式連接起來,上一個RBM 的隱含層即為下一個RBM 的可視層,上一個RBM的輸出即為下一個RBM的輸入。依照此方式構(gòu)成DBN網(wǎng)絡(luò)后,利用貪婪算法來依次處理每一個RBM,以達(dá)到整體優(yōu)化的目的。
本文針對大口徑火炮的故障預(yù)測問題,提出將DBN與MLP相結(jié)合,搭建DBN-MLP故障預(yù)測模型,利用該模型完成火炮故障的預(yù)測,實(shí)現(xiàn)健康管理系統(tǒng)的故障預(yù)測功能。利用DBN強(qiáng)大的數(shù)據(jù)特征提取能力對數(shù)據(jù)進(jìn)行處理,對DBN處理后的數(shù)據(jù)利用MLP結(jié)構(gòu)進(jìn)行有監(jiān)督學(xué)習(xí),高效地完成數(shù)據(jù)的判別。DBN-MLP模型結(jié)構(gòu)如圖8所示。
Figure 8 Schematic diagram of fault prediction model structure圖8 DBN-MLP故障預(yù)測模型結(jié)構(gòu)示意圖
DBN-MLP故障預(yù)測模型主要包含DBN網(wǎng)絡(luò)預(yù)訓(xùn)練、DBN網(wǎng)絡(luò)全局微調(diào)、MLP網(wǎng)絡(luò)參數(shù)設(shè)置、MLP網(wǎng)絡(luò)訓(xùn)練和故障預(yù)測網(wǎng)絡(luò)檢驗(yàn)等部分。
(1)DBN網(wǎng)絡(luò)預(yù)訓(xùn)練。
這個過程又稱為參數(shù)初始化。即將深度置信網(wǎng)絡(luò)分解為一系列受限玻爾茲曼機(jī),逐層訓(xùn)練參數(shù),為整個深度置信網(wǎng)絡(luò)提供較優(yōu)的網(wǎng)絡(luò)初始化權(quán)值。首先將原始數(shù)據(jù)V作為可視層的輸入向量,訓(xùn)練第1個受限玻爾茲曼機(jī)的連接權(quán)值矩陣w1,接著固定w1,通過P(H1|V)=P(H1|V,w1)訓(xùn)練得到第1個受限玻爾茲曼機(jī)的隱含層向量h1,將h1當(dāng)作第2個受限玻爾茲曼機(jī)的可視輸入向量,用以訓(xùn)練第2個受限玻爾茲曼機(jī)的連接權(quán)值矩陣w2,以此類推,逐層計(jì)算得到每一層的隱含層神經(jīng)元激活向量和與前一層神經(jīng)元的連接權(quán)值矩陣。換言之,將深度置信網(wǎng)絡(luò)的低層輸出作為其高一層的輸入,每次只無監(jiān)督地學(xué)習(xí)一層特征變換,最終依次將學(xué)得的網(wǎng)絡(luò)連接權(quán)值堆疊成為整個深度置信網(wǎng)絡(luò)的初始化權(quán)值。
(2)DBN網(wǎng)絡(luò)全局微調(diào)。
為了進(jìn)一步提升模型性能,當(dāng)完成一系列受限玻爾茲曼機(jī)無監(jiān)督預(yù)訓(xùn)練后,再把原始訓(xùn)練數(shù)據(jù)當(dāng)作監(jiān)督數(shù)據(jù)對整個深層結(jié)構(gòu)進(jìn)行有監(jiān)督學(xué)習(xí),依據(jù)最大似然函數(shù),采用反向傳播算法對整個深度置信網(wǎng)絡(luò)進(jìn)行進(jìn)一步優(yōu)化,精調(diào)各層參數(shù)。
(3)MLP網(wǎng)絡(luò)參數(shù)設(shè)置。
根據(jù)MLP所需,確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),包括MLP網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量(輸入層、隱含層和輸出層)、初始權(quán)重矩陣、神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率、迭代次數(shù)、允許誤差,以及多層感知機(jī)所選激活函數(shù)的相關(guān)參數(shù)。
(4)MLP網(wǎng)絡(luò)訓(xùn)練。
利用已經(jīng)訓(xùn)練好的DBN網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)特征進(jìn)行提取,將得到的特征高度集中的數(shù)據(jù)用作多層感知機(jī)的訓(xùn)練數(shù)據(jù),以訓(xùn)練神經(jīng)網(wǎng)絡(luò)。MLP的訓(xùn)練是基于前向傳播的有監(jiān)督學(xué)習(xí)訓(xùn)練方式,通過梯度下降法對模型進(jìn)行訓(xùn)練,得到特定網(wǎng)絡(luò)節(jié)點(diǎn)下較為適合的網(wǎng)絡(luò)權(quán)重矩陣,完成對多層感知機(jī)的訓(xùn)練。
(5)深度學(xué)習(xí)網(wǎng)絡(luò)檢驗(yàn)。
在DBN與MLP網(wǎng)絡(luò)訓(xùn)練完畢的基礎(chǔ)上,將測試數(shù)據(jù)輸入故障預(yù)測模型中得到數(shù)據(jù)結(jié)果并與實(shí)際結(jié)果進(jìn)行對比,計(jì)算模型對故障預(yù)測的精確度,完成對模型可行性的評估。
由于大口徑火炮的各個部位實(shí)際數(shù)據(jù)涉密,不便成文發(fā)表,因此本文選擇在實(shí)驗(yàn)初期使用的美國凱斯西儲大學(xué)電子工程實(shí)驗(yàn)室為了便于他人研究和測試所公布的一組旋轉(zhuǎn)軸承數(shù)據(jù)來替代火炮關(guān)鍵部位的振動數(shù)據(jù)[19]。這組數(shù)據(jù)是由位于旋轉(zhuǎn)軸承上方機(jī)殼上的振動傳感器在12 kHz的采樣頻率下,在4種不同的負(fù)荷下記錄的旋轉(zhuǎn)軸承振動數(shù)據(jù)。軸承是安裝在由2個不同的驅(qū)動力構(gòu)成的機(jī)械系統(tǒng)之中的,與大口徑火炮故障發(fā)生的關(guān)鍵部位內(nèi)部的軸承結(jié)構(gòu)類似,可以替代用以研究。
本次實(shí)驗(yàn)選擇軸承振動實(shí)驗(yàn)數(shù)據(jù)組中較有代表性的5組數(shù)據(jù),分別是電機(jī)負(fù)載為0,電機(jī)轉(zhuǎn)速約為1 797 rpm的條件下,軸承正常工作振動數(shù)據(jù),以及單點(diǎn)驅(qū)動端在12 000樣本/秒采樣頻率的條件下,故障直徑分別為0.007 inch(英寸,1 inch=25.4 mm),0.014 inch,0.021 inch,0.028 inch時(shí)軸心部位的振動數(shù)據(jù),在這些數(shù)據(jù)集當(dāng)中分別挑選12 000個作為實(shí)驗(yàn)數(shù)據(jù),由于要對大口徑火炮的整個生命周期進(jìn)行評價(jià)與預(yù)測,將數(shù)據(jù)以100個連續(xù)數(shù)據(jù)為一組,整合為時(shí)間序列數(shù)據(jù)(time- series)[20],共構(gòu)成每種故障尺寸各120組數(shù)據(jù)用以實(shí)驗(yàn)。從每組數(shù)據(jù)中取出100組作為訓(xùn)練數(shù)據(jù),其余100組數(shù)據(jù)組成檢驗(yàn)數(shù)據(jù)。模型學(xué)習(xí)目的在于識別軸承工作狀態(tài)正常與否,在識別精確度高的前提下,完成對故障尺寸的鑒別,實(shí)現(xiàn)真正高精度的故障識別系統(tǒng)模型。實(shí)驗(yàn)數(shù)據(jù)如表1所示。
Table 1 Data for testing
對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析得到數(shù)據(jù)集合的數(shù)學(xué)特征如表2所示。
Table 2 Statistical characteristics of experimental data
由實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)學(xué)特征可得,在數(shù)據(jù)量足夠大的情況下,正常無故障實(shí)驗(yàn)組Wn的振動平均數(shù)最小,故障組W2,W1,W3,W4的振動平均數(shù)依次增大,正常無故障實(shí)驗(yàn)組Wn的振動幅度極值最小,故障組W1,W2,W3,W4的振動幅度極值依次增大,且遠(yuǎn)大于實(shí)驗(yàn)組Wn的振動幅度。振動平均數(shù)與振動幅度極值的變化規(guī)律表明,絕對振動數(shù)據(jù)中正常無故障振動數(shù)據(jù)的振動幅度明顯小于其他故障情況下的振動幅度。由故障尺寸的標(biāo)準(zhǔn)差可得,正常無故障實(shí)驗(yàn)組Wn的標(biāo)準(zhǔn)差最小,小于故障組W2,W1,W3,W4的,說明在當(dāng)前情況下無故障數(shù)據(jù)的波動范圍小于其他故障數(shù)據(jù)的,但簡單的統(tǒng)計(jì)學(xué)特征只能作為參考,無法定論具體情況,需做進(jìn)一步分析。
要將故障數(shù)據(jù)傳入多層感知機(jī)模型,需要將數(shù)據(jù)在保留其數(shù)據(jù)特征的情況下,映射到(0,1),因此要對原始數(shù)據(jù)進(jìn)行歸一化[21]。歸一化后數(shù)據(jù)峰值變化如圖9所示。
Figure 9 Schematic diagram of peak data changes after normalization圖9 歸一化后數(shù)據(jù)峰值變化示意圖
由于多組振動數(shù)據(jù)處理過后會重疊,不便觀察,因此本文在做完歸一化處理之后,對各組曲線進(jìn)行了平移,以便觀察。從圖9中可以看出,0/1歸一化將不同組數(shù)據(jù)的特征變換到同樣區(qū)間,消除了量綱,使得他們之間具有可比性,并且滿足模型輸入要求。
利用歸一化處理之后的數(shù)據(jù)進(jìn)行深度置信網(wǎng)絡(luò)與多層感知機(jī)的訓(xùn)練,流程圖如圖10所示。
Figure 10 Flowchart of fault prediction network training 圖10 故障預(yù)測模型訓(xùn)練流程圖
將數(shù)據(jù)進(jìn)行分組,每100個連續(xù)數(shù)據(jù)為一組,這樣50 000個訓(xùn)練數(shù)據(jù)整合為500組長度為100的數(shù)據(jù),根據(jù)該數(shù)據(jù)分組的方式,深度置信網(wǎng)絡(luò)的輸入端神經(jīng)元個數(shù)設(shè)置為100個。此次實(shí)驗(yàn)選擇3層RBM堆疊的深度置信網(wǎng)絡(luò),共有4層神經(jīng)元,除去第1層的100個神經(jīng)元外,另外幾層的神經(jīng)元分別設(shè)置為250,250,100,這樣在深度置信網(wǎng)絡(luò)對數(shù)據(jù)提取特征之后,得到的輸出神經(jīng)元個數(shù)為100,即提取特征之后得到的數(shù)據(jù)個數(shù)為100。
由于特征提取處理后的特征數(shù)據(jù)要應(yīng)用于多層感知機(jī)進(jìn)行有監(jiān)督學(xué)習(xí),根據(jù)DBN結(jié)構(gòu)可得,處理后的數(shù)據(jù)為每組100個,訓(xùn)練神經(jīng)網(wǎng)絡(luò)層數(shù)為4層,因此多層感知機(jī)輸入層神經(jīng)元個數(shù)為100,其余3層的個數(shù)分別為2 500,100,5,多層感知機(jī)輸出的5個特征即為故障預(yù)測結(jié)果,其結(jié)果以獨(dú)熱碼[22]的方式進(jìn)行顯示,即10000為正常,01000,00100,00010和00001均為故障,并且每一種碼字對應(yīng)一種故障。故障預(yù)測網(wǎng)絡(luò)訓(xùn)練結(jié)果如圖11所示。
Figure 11 Training effect curve圖11 訓(xùn)練效果曲線圖
預(yù)訓(xùn)練次數(shù)設(shè)置為50,由預(yù)訓(xùn)練次數(shù)與識別錯誤率局部曲線可得,在使用了由深度置信網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)特征提取,再由多層感知機(jī)進(jìn)行數(shù)據(jù)分類的模型后,識別正確率較高,曲線大概在預(yù)訓(xùn)練21次左右趨于平穩(wěn),通過調(diào)整神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),有望改善最終結(jié)果。
模型訓(xùn)練完畢后,使用測試數(shù)據(jù)對網(wǎng)絡(luò)預(yù)測效果進(jìn)行評價(jià),結(jié)果如表3所示。
表3所示為改進(jìn)模型對多分類情況的預(yù)測效果。由表3可以看出,故障預(yù)測網(wǎng)絡(luò)對故障類型的預(yù)測結(jié)果較好,對于正常數(shù)據(jù)和故障尺寸為0.021 inch和0.028 inch的數(shù)據(jù)都有很高的預(yù)測精確度,誤判率分別是0%,5%和0%;但在預(yù)測故障尺寸為0.007 inch和0.014 inch的數(shù)據(jù)方面,識別誤判率較高,分別是15%和25%,預(yù)測結(jié)果還有待改善。
Table 3 Experimental results of fault prediction
故障預(yù)測結(jié)果散點(diǎn)圖和混淆矩陣分別如圖12和圖13所示。
Figure 12 Scatter plots of experimental results圖12 實(shí)驗(yàn)結(jié)果散點(diǎn)圖
Figure 13 Confusion matrix of experimental results圖13 實(shí)驗(yàn)結(jié)果混淆矩陣
由圖12可以看出,識別錯誤的8組數(shù)據(jù)中,有7組集中在故障尺寸為0.007 inch和0.014 inch的故障數(shù)據(jù)中,說明故障尺寸為0.007 inch和0.014 inch的數(shù)據(jù)識別問題較大,其他組別的識別結(jié)果僅有故障尺寸為0.021 inch的數(shù)據(jù)出現(xiàn)了一個錯誤,說明其他數(shù)據(jù)識別率較高。由圖13可以清晰看出,排除W1和W2組數(shù)據(jù),其他組識別率都能達(dá)到95%及以上,而W1和W2的數(shù)據(jù)識別率較低,分別為85%和75%,且識別錯誤的情況基本都是這2組數(shù)據(jù)互相干擾引起的。故障預(yù)測模型整體的預(yù)測結(jié)果優(yōu)良。
本文針對大口徑火炮的故障診斷與預(yù)測問題,提出基于深度學(xué)習(xí)的大口徑故障預(yù)測與診斷模型。該模型首先運(yùn)用深度置信網(wǎng)絡(luò)自動提取數(shù)據(jù)特征,避免了人工處理數(shù)據(jù)的麻煩及其引入的復(fù)雜不確定數(shù)據(jù)波動;而后利用多層感知機(jī)的有監(jiān)督學(xué)習(xí)的分類識別能力,對特征高度集中的數(shù)據(jù)進(jìn)行簡單有效的分類,實(shí)現(xiàn)對故障數(shù)據(jù)的預(yù)測與識別。從測試結(jié)果來看,該模型可以勝任對大口徑火炮故障狀態(tài)的診斷與預(yù)測,具有較高的實(shí)用價(jià)值。