亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度學習在裝備剩余使用壽命預測技術中的研究現(xiàn)狀與挑戰(zhàn)

        2021-02-25 12:35:16劉振宇郟維強張棟豪譚建榮
        計算機集成制造系統(tǒng) 2021年1期
        關鍵詞:特征提取神經(jīng)網(wǎng)絡領域

        劉 惠,劉振宇,郟維強,張棟豪,譚建榮

        (浙江大學 計算機輔助設計與圖形學國家重點實驗室,浙江 杭州 310027)

        0 引言

        故障預測和健康管理(Prognostic and Health Management, PHM)是指利用大量狀態(tài)監(jiān)測數(shù)據(jù)和信息,借助統(tǒng)計算法或模型來評估和管理裝備健康狀態(tài)的技術。PHM可以提前對潛在故障進行預測,并結合各種裝備信息提供維護決策,實現(xiàn)視情維護,從而提高生產(chǎn)過程的安全性及降低維護成本[1-4]。近年來,PHM技術在航空航天、制造業(yè)等領域表現(xiàn)出了良好的應用前景,為生產(chǎn)活動提供了安全保障[2,5]。剩余使用壽命(Remaining Useful Life, RUL)預測技術是PHM的關鍵技術之一,可通過分析傳感器監(jiān)測的運行數(shù)據(jù)或建立合適的退化模型對系統(tǒng)或部件的RUL進行提前預測[6-8]。參考相關文獻[3,8-9],RUL可定義為系統(tǒng)或部件可繼續(xù)正常使用的時間長度,即當前時刻與失效時刻之間的時間間隔。

        在工業(yè)生產(chǎn)中,對系統(tǒng)或部件的RUL進行準確預測能及時改進維護計劃,以確保工業(yè)活動順利進行,同時還能降低維護和生產(chǎn)成本,簡化操作流程。與傳統(tǒng)故障診斷相比,RUL預測技術可提前預測系統(tǒng)或部件的正常工作時間,對將發(fā)生的故障進行事先警報,較大程度上避免了生產(chǎn)事故的發(fā)生,因此更加實用[10-11]。本文研究對象為復雜裝備及其關鍵零部件,發(fā)動機、數(shù)控機床和風力發(fā)電機等復雜裝備在各行業(yè)中占據(jù)著重要地位。例如渦輪發(fā)動機是航空領域發(fā)展的核心裝備,也是最容易發(fā)生故障的部件之一,其致命性故障會對飛行器造成不可挽回的損失[11-12]。而復雜裝備的關鍵零部件的失效會導致復雜裝備無法正常運行,例如滾動軸承[13]?;谏鲜銮闆r,對復雜裝備及其關鍵零部件進行RUL預測研究是必要且緊迫的。

        基本的RUL預測技術主要分為兩類[14-15],分別是基于模型的方法[16-17]和數(shù)據(jù)驅(qū)動的方法[6,18]?;谀P偷腞UL預測技術往往需要確定精確的物理或數(shù)學模型來描述系統(tǒng)退化過程。然而,很多復雜裝備都難以建立精確的模型,對于難以確定具體退化模型的復雜裝備而言,數(shù)據(jù)驅(qū)動的方法已成為一種重要的RUL預測手段[11,19]。通常,基于測試數(shù)據(jù)或者傳感器數(shù)據(jù)進行預測的方法稱為數(shù)據(jù)驅(qū)動的RUL預測技術,該方法通過對系統(tǒng)或部件各個階段的測試數(shù)據(jù)、傳感器歷史數(shù)據(jù)進行融合與特征提取,得到上述監(jiān)測數(shù)據(jù)和剩余使用壽命之間的映射關系[20]。該方法無需對象系統(tǒng)的先驗知識,以現(xiàn)有采集的數(shù)據(jù)為基礎,通過各種分析處理方法挖掘出數(shù)據(jù)中的隱含關聯(lián)信息進行預測操作,是一種較為實用的方法[11,21-22]。

        數(shù)據(jù)驅(qū)動的RUL預測技術最核心的任務在于建立一個有效的RUL預測模型對監(jiān)測數(shù)據(jù)進行處理以實現(xiàn)RUL預測,主要包括以下流程:數(shù)據(jù)獲取、數(shù)據(jù)預處理、特征工程、模型建立、模型訓練與預測[20]。

        目前適用于建立RUL預測模型的方法主要有3類:①統(tǒng)計模型方法,主要包括粒子濾波、卡爾曼濾波及其擴展算法等[23-26];②傳統(tǒng)機器學習方法,主要包括隱馬爾可夫模型、支持向量機、相關向量機和極限學習機等[27-31];③深度學習方法,主要包括各種神經(jīng)網(wǎng)絡算法及其拓展算法。

        基于統(tǒng)計模型的方法通常需要足夠的先驗知識構建退化過程的經(jīng)驗模型。傳統(tǒng)機器學習預測方法的特征提取工作較為復雜,需要豐富的先驗知識。此外,傳統(tǒng)機器學習方法的數(shù)據(jù)擬合能力有限,難以有效處理大數(shù)據(jù)問題。深度學習是機器學習的一個重要分支,是一種對人腦仿真的數(shù)學算法[32],主要基于各種人工神經(jīng)網(wǎng)絡對數(shù)據(jù)進行深度處理和特征提取。隨著神經(jīng)網(wǎng)絡技術的發(fā)展,深度神經(jīng)網(wǎng)絡在各行業(yè)的應用已成為研究熱點。與其他算法相比,深度神經(jīng)網(wǎng)絡具有非常強的數(shù)據(jù)處理能力。理論上,深度神經(jīng)網(wǎng)絡能以任意精度逼近任意連續(xù)函數(shù),可以很好地實現(xiàn)對復雜高維函數(shù)的近似表示[33]。而且,隨著網(wǎng)絡層數(shù)的增多,深度神經(jīng)網(wǎng)絡的學習能力將增強。不過,深度學習所依賴的反向傳播(Back Propagation, BP)算法可能導致梯度消失和梯度爆炸問題,這在一定程度上限制了深度學習的發(fā)展[34]??偠灾?,深度學習能夠?qū)?shù)據(jù)進行自動特征提取且不需要先驗知識,是目前最有希望實現(xiàn)人工智能的方法。

        當前深度學習在許多研究領域都取得了開拓性的成就,如自然語言處理[35]、圖像處理[36]、故障診斷及健康監(jiān)測[37-38]、RUL預測[39]等?,F(xiàn)階段深度學習獲得廣泛關注主要有以下原因:

        (1)與傳統(tǒng)機器學習方法相比,深度學習具有更強的特征提取能力,能提取到更多反應數(shù)據(jù)本質(zhì)的有用特征。而且,這一特征提取過程不需要人工干預,可以實現(xiàn)自動特征提取和端到端的學習[40]。

        (2)通常,傳統(tǒng)機器學習方法難以有效處理大數(shù)據(jù),而深度學習是目前處理大數(shù)據(jù)最有效的方法。理論上深度學習所提取的有效特征隨著數(shù)據(jù)量的增加而變多,預測精度也隨之提高。隨著物聯(lián)網(wǎng)(Internet of Things, IoT)及先進傳感器技術的發(fā)展,工業(yè)大數(shù)據(jù)的逐步發(fā)展進一步促進了深度學習的應用[8,41-42]。

        (3)隨著計算機硬件技術的不斷發(fā)展,先進的圖形處理器單元、張量處理單元和中央處理器等硬件都為深度學習算法的實現(xiàn)提供了所需要的算力資源。

        由于深度學習無可比擬的優(yōu)勢,其為RUL預測技術的進一步發(fā)展帶來了機遇。一方面,在基于深度學習的RUL預測技術的主要流程中,特征工程不是必需的。這是因為基于深度學習的RUL預測技術可以實現(xiàn)退化特征的自動提取,進而實現(xiàn)端到端的RUL預測。這種革新在一定程度上有助于降低對RUL預測領域先驗知識的依賴,提高RUL預測方法的適用性[22]。但值得關注的是,端到端的預測并非基于深度學習的RUL預測的唯一選擇。在近年來的一些研究中[13,43],特征工程與深度學習的結合也取得了較好的預測效果。這類方法結合了手動特征提取和深度學習的優(yōu)勢,在一定程度上也促進了深度學習在RUL預測中的應用。另一方面,隨著工業(yè)4.0的到來,工業(yè)大數(shù)據(jù)的逐步發(fā)展必然導致對RUL預測算法算力要求的提高。而深度學習由于具有強大的計算能力,恰好滿足了上述需求。綜上所述,研究基于深度學習的RUL預測技術具有現(xiàn)實意義。

        參考近年來的文獻可知,基于深度學習的RUL預測方法已成為學術界和工業(yè)界共同的研究熱點[41]。目前,RUL預測領域常用的深度學習方法主要包括各類神經(jīng)網(wǎng)絡模型及其變體,如卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)[40]、循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks, RNN)[44]、自編碼器(Autoencoder, AE)[43]和深度置信網(wǎng)絡(Deep Belief Network, DBN)[34]等?;谄鋸姶蟮臄?shù)據(jù)處理能力,上述深度學習方法在多個方面與RUL預測研究進行了深度結合,取得了較大成就。

        本文主要總結了2015年1月~2020年6月期間前人在基于深度學習的RUL預測領域所做出的優(yōu)秀成果,并在其基礎上結合深度學習算法的基本原理,對該領域的研究現(xiàn)狀進行了系統(tǒng)性總結。結合已有研究,思考并提煉出了當前基于深度學習的RUL預測所面臨的一些挑戰(zhàn)與難點,并探討了未來該領域的發(fā)展方向??紤]到刀具磨損預測可轉(zhuǎn)換成RUL預測問題,本文調(diào)研的文獻也包括部分涉及刀具磨損預測的研究。

        1 深度學習及其在剩余使用壽命預測領域的研究現(xiàn)狀

        近年來,深度學習算法在RUL預測領域中得到了廣泛關注,各種新的研究成果不斷涌現(xiàn)。本章將圍繞幾種主要的深度學習算法,對基于深度學習的RUL預測研究現(xiàn)狀進行闡述與探討。

        1.1 全連接神經(jīng)網(wǎng)絡及其應用

        全連接神經(jīng)網(wǎng)絡(Fully-Connected Network, FCN)是一種簡單的前饋神經(jīng)網(wǎng)絡,也是最常見的神經(jīng)網(wǎng)絡之一。多層FCN又稱為多層感知機(Multilayer Perceptron, MLP),采用單向多層的全連接結構,其中每層都包含若干神經(jīng)元,因其具有較強的數(shù)據(jù)擬合能力,所以很早就被應用于RUL預測領域[7,45-47]。如圖1所示為一個簡單的多層FCN框架圖。

        Tian[46]開發(fā)了一種用于預測設備RUL的多層FCN模型,將多個狀態(tài)監(jiān)測量作為輸入,并將設備壽命百分比作為輸出。但參考圖1可知,多層全連接神經(jīng)網(wǎng)絡僅是對數(shù)據(jù)在高維空間中做擬合,并沒有考慮數(shù)據(jù)的時間特征,因此其效果并不是特別理想。Lim等[7]提出一種用于航空發(fā)動機RUL預測的框架,該框架通過時間窗口對傳感器數(shù)據(jù)進行處理,以便提取時序特征,并使用多層全連接神經(jīng)網(wǎng)絡取得了相對較好的預測結果。但該方法沒有充分挖掘傳感器信號的時序特征,且容易出現(xiàn)過擬合的情況。此外,BP算法難以有效訓練深層的全連接網(wǎng)絡,限制了FCN模型的預測精度。在現(xiàn)階段的RUL預測研究中,F(xiàn)CN很少被單獨應用于建立RUL預測模型,通常是與其他深度神經(jīng)網(wǎng)絡進行聯(lián)合應用[6]。

        1.2 循環(huán)神經(jīng)網(wǎng)絡及其應用

        循環(huán)神經(jīng)網(wǎng)絡(RNN)是一類流行的深度學習模型,對時序數(shù)據(jù)具有非常強的處理能力[44]。FCN在當前時刻的輸出由當前時刻的輸入決定,但RNN當前時刻的輸出不僅依賴于當前時刻的輸入數(shù)據(jù),還依賴于之前時刻所提取的信息。在處理時序數(shù)據(jù)時,RNN通過信息流的方式將不同時刻的信息在同一層內(nèi)進行傳遞,并利用記憶單元保留不同時刻的信息,進而學習到不同時刻信息之間的依賴關系,即時序特征。綜上可知,RNN可以從時序數(shù)據(jù)中學習到與時間相關的特征信息[32]。

        工業(yè)中的傳感器數(shù)據(jù)本質(zhì)上是時序數(shù)據(jù)[19],因此RNN可以用于處理RUL預測問題。Heimes[44]將循環(huán)神經(jīng)網(wǎng)絡應用于傳感器數(shù)據(jù)的時間維度上,取得了較好的預測效果。但在監(jiān)督學習任務中,RNN通過時序反向傳播(Back Propagation Through Time, BPTT)算法進行訓練的過程中存在梯度消失的問題。這意味著傳統(tǒng)RNN無法捕捉長時間的依賴關系,極大地限制了其實際應用[19]。近年來,傳統(tǒng)RNN算法幾乎不再被應用于解決RUL預測問題。

        長短期記憶網(wǎng)絡(Long Short-Term Memory, LSTM)是RNN的一種重要改進形式,通過記憶體信息流和門結構的設計,在一定程度上解決了梯度消失問題[48],因而在各個領域都獲得了廣泛應用。如圖2所示為單層LSTM的基本工作原理,圖中cell代表記憶體,在每個cell中,有3個門控單元(分別為輸入門it、遺忘門ft和輸出門ot)管理信息流[48]。其在t時刻的工作原理表達如下:

        it=σ(Uixt+Viht-1+bi),

        (1)

        ot=σ(Uoxt+Voht-1+bo),

        (2)

        ft=σ(Ufxt+Vfht-1+bf),

        (3)

        ct=ftct-1+it°tanh(Ucxt+Vcht-1+bc),

        (4)

        ht=ottanh(ct)。

        (5)

        其中:xt表示t時刻的輸入;Ui,Uo,Uf,Uc∈m×l和Vi,Vo,Vf,Vc∈m×m分別表示輸入權重矩陣和循環(huán)權重矩陣,b∈m表示偏置,m和l分別代表LSTM的隱藏層神經(jīng)元數(shù)和輸入數(shù)據(jù)特征維度;ct和ht分別表示cell狀態(tài)和cell輸出;σ和tanh表示激活函數(shù),在大部分文獻中,σ采用的是sigmoid激活函數(shù)。

        通過上述結構,LSTM能很好地學習時序數(shù)據(jù)中的長期依賴關系,因此在RUL預測領域得到了非常廣泛的應用。Zheng等[19]提出一種基于多層LSTM與MLP相結合的RUL預測方法,充分利用了傳感器信號時序上的特征,取得了較好的預測結果;Wu等[49]結合LSTM和動態(tài)差分技術對航空渦扇發(fā)動機的運行數(shù)據(jù)進行處理,實現(xiàn)了較好的RUL預測;Wang等[50]從軸承振動信號中提取時域、頻域、時頻域以及相似度特征,經(jīng)過特征篩選后利用多層LSTM進行處理以預測軸承RUL,實驗結果表明,與FCN和支持向量機相比,LSTM的RUL預測效果更好。LSTM在RUL預測領域已經(jīng)取得了較大成就,為進一步提高LSTM的預測性能和計算效率,業(yè)界學者對其進行了諸多改進,其中門控循環(huán)單元(Gated Recurrent Unit, GRU)就是一種比較流行的變體[51]。

        與LSTM結構相似,GRU主要由記憶體和門控單元組成。與前者不同的是,GRU只有兩個門控單元(重置門和更新門),這大大簡化了其內(nèi)部結構,降低了計算復雜度[51]。一些研究表明,GRU和LSTM在許多任務中可以實現(xiàn)相似的預測精度,但GRU的收斂速度更快,所需要的計算時間更少?;谏鲜鲆蛩?,GRU在RUL預測中也得到了一定的應用[52-55]。Xu等[52]提出一種基于GRU的刀具磨損預測模型,發(fā)現(xiàn)GRU可以很好地處理時間序列數(shù)據(jù)并避免梯度消失問題,實驗結果也表明GRU比支持向量回歸和MLP效果都要好;Chen等[53]提出一種通用的RUL預測兩步方案:第一階段基于核主成分分析法對輸入數(shù)據(jù)進行非線性特征提??;第二階段基于GRU對RUL進行回歸預測。

        與LSTM相比,GRU在結構上有一定優(yōu)勢。不僅可以有效降低網(wǎng)絡的計算復雜度,還在許多任務上取得與LSTM相近甚至更好的效果。從現(xiàn)有文獻可以看出,基于GRU的RUL預測方法近兩年受到了本領域研究者的關注。

        雙向網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡的一個重要發(fā)展方向。雙向長短期記憶網(wǎng)絡(Bidirectional Long Short-Term Memory, BLSTM)是LSTM的一種改進模型,在處理輸入序列時,同時考慮了過去和未來的信息特征對當前時刻的影響,可以更好地學習時間維度上的長期依賴關系[6]。單層BLSTM網(wǎng)絡的基本結構如圖3所示。由于BLSTM具有很強的時序建模能力,近年來RUL預測領域的相關研究逐漸增多。Zhang等[56]利用感知機從多維傳感器數(shù)據(jù)中提取與發(fā)動機RUL相關的健康指數(shù),然后使用BLSTM對健康指數(shù)進行分析并預測發(fā)動機的RUL;Huang等[57]直接通過多層BLSTM對傳感器數(shù)據(jù)進行分析,并以發(fā)動機運行過程的工況數(shù)據(jù)(如馬赫數(shù)、海拔高度等)作為模型的輔助輸入,對多工況下的發(fā)動機進行RUL預測;此外,BLSTM也被用于處理數(shù)控機床刀具加工過程中的傳感器數(shù)據(jù)[20,58]。類似地,雙向門控循環(huán)單元(Bidirectional Gated Recurrent Unit, BGRU)在RUL預測中也得到了應用[39,59-60]。總而言之,雙向網(wǎng)絡是當前研究的一個熱點,在未來將會受到更多的關注。

        近年來,循環(huán)類神經(jīng)網(wǎng)絡在RUL預測中越來越受重視,為了更清晰地了解循環(huán)類神經(jīng)網(wǎng)絡在RUL預測中的應用,表1對常用的幾種方法進行了簡單的比較與總結。

        表1 RUL預測中的各種循環(huán)神經(jīng)網(wǎng)絡方法比較

        1.3 卷積神經(jīng)網(wǎng)絡及其應用

        卷積神經(jīng)網(wǎng)絡(CNN)是深度學習中最具有代表性的算法之一,被廣泛應用于圖像處理領域[1,32,67]。CNN主要包括兩個重要結構層:卷積層和池化層。卷積層將多個卷積濾波器與輸入數(shù)據(jù)進行卷積生成特征圖,可以對高維輸入數(shù)據(jù)進行降維處理,具有自動提取有效特征的優(yōu)點;池化層又稱下采樣層,對各個維度數(shù)據(jù)進行采樣,可以進一步降低數(shù)據(jù)規(guī)模并提高網(wǎng)絡的泛化能力[40,67]。在調(diào)研的文獻中,最常用的池化策略主要包括最大池化和平均池化。卷積層和池化層逐層對輸入數(shù)據(jù)進行交替處理,可以對輸入數(shù)據(jù)的空間特征進行有效表達。卷積層是CNN的核心,具有稀疏連接和空間權值共享兩個重要特性,能對數(shù)據(jù)的局部特征進行有效挖掘。如圖4所示為卷積操作的一個簡單示例,其數(shù)學表達如下:

        yj=φ(x*vj+b),

        (6)

        Y=[y1,y2,…,yj,…,yJ]。

        (7)

        其中:x表示輸入特征,*表示卷積運算,vj表示第j個卷積核,b表示偏置項,φ表示激活函數(shù),yj表示卷積層輸出的第j個特征映射;Y表示卷積層的輸出,由J個卷積核生成的J個特征映射所組成。

        CNN自提出以來,在圖像處理領域已經(jīng)獲得了成功應用[68]。近年來的一些研究成功地將CNN應用于序列數(shù)據(jù)處理,并取得了較好的效果,包括自然語言處理[35]和RUL預測[11,40]等。圖5展示了一種多層CNN的典型結構圖。在RUL預測中,CNN基于BP算法進行誤差的反向傳播,并結合梯度下降等優(yōu)化方法訓練每層的權重參數(shù),可以實現(xiàn)輸入數(shù)據(jù)的局部特征提取,并生成抽象的高維空間特征,然后由FCN進行擬合,進而實現(xiàn)對RUL的預測。目前,基于CNN及其變體的深度學習方法已經(jīng)在RUL預測中得到了較好應用。

        Babu等[40]提出一種基于多層CNN的回歸預測方法,首次將CNN應用于復雜裝備的RUL預測。該方法中的卷積操作和池化操作都是沿著傳感器信號的時間維度進行的,以便學習原始傳感信號中的時序信息。Li等[11]改進了文獻[40]中的CNN模型,通過5個卷積層對傳感器信號進行處理,獲得了更好的效果。該研究表明,CNN的核心處理層是卷積層,池化層的作用主要是降低數(shù)據(jù)規(guī)模,若數(shù)據(jù)規(guī)模不大,池化反而可能破壞一些重要特征。上述結論對于CNN在RUL預測領域的發(fā)展具有一定指導意義。此外,針對軸承RUL預測問題,一些研究利用CNN對振動信號直接進行處理與分析,在應用中取得了良好的效果[69]。

        總結文獻可知,基于CNN的RUL預測實現(xiàn)方法主要可分為兩種,如圖6所示。第一種方法不需要經(jīng)過額外特征提取,直接利用基于CNN的模型對預處理后的數(shù)據(jù)進行特征提取與預測,上一段介紹的研究主要是基于第一種方法;第二種方法首先需要基于一定先驗知識進行一些特定的特征提取,然后再利用CNN進行深度特征挖掘。上述兩種方法各有優(yōu)勢,第一種方法能實現(xiàn)自動特征提取,不需要額外的特征處理過程,可以實現(xiàn)端到端的RUL預測[6,69];第二種方法在結合一定先驗知識的基礎上對數(shù)據(jù)進行深度特征提取,在某些場景下能實現(xiàn)更高的預測精度[70-72]。目前,這兩種方法的應用都比較廣泛,如何進行選取需要根據(jù)具體場景決定。

        第二種方法的代表性研究有:Ren等[70]通過快速傅里葉變換對軸承振動信號進行處理得到頻譜特征,并利用多層CNN和FCN對頻譜特征進行處理,以預測軸承的RUL;Yoo等[71]基于連續(xù)小波變換從振動信號中提取小波功率譜,并通過多層CNN和FCN提取功率譜中的健康指數(shù),最后通過高斯過程回歸實現(xiàn)軸承RUL預測;Huang等[72]對數(shù)控機床加工過程的多傳感器信號進行處理,提取信號中的時域、頻域和時頻域特征作為刀具磨損的健康指數(shù),然后通過CNN模型建立健康指數(shù)和刀具磨損之間的非線性關系??偨Y文獻可知,常用的特征包括時域、頻域和時頻域上的各種統(tǒng)計特征,如峰值、均值、均方根值、頻譜和功率譜等。主要特征提取方法包括各種信號處理手段,例如時域統(tǒng)計特征提取[20,72]、小波變換及小波包變換[71,73]、希爾伯特黃變換[74]、快速傅里葉變換[70]和短時傅里葉變換[13]等。

        隨著CNN在RUL預測領域中的深入應用,一些研究將CNN與其他方法結合起來處理RUL預測問題,如LSTM[75-80]、BLSTM[6,20,81]、GRU[82]、BGRU[39,83]、XGBoost[84]和支持向量回歸[74]等。Kong等[75]和Yu等[76]都在CNN與LSTM結合的基礎上進行了研究,并在發(fā)動機RUL預測中取得了較好的效果;此外,Zhao等[20]結合CNN和BLSTM對數(shù)控機床刀具加工過程的傳感器數(shù)據(jù)進行處理;Chen等[83]結合CNN、BGRU和注意力機制對軸承振動數(shù)據(jù)進行處理以構建健康因子,并通過線性回歸方法預測RUL。上述方法中兩者的結合屬于串行結構,都是先利用CNN對傳感器數(shù)據(jù)進行空間局部特征提取,然后利用循環(huán)類神經(jīng)網(wǎng)絡進一步提取時序特征。Liu等[6]則是先利用BLSTM提取傳時序特征,然后利用CNN進一步挖掘空間特征,最后通過多層FCN進行RUL預測。此外,也有研究者對并行結構進行了研究與分析[77-79]。Al-Dulaimi等[78]提出一種并行網(wǎng)絡的框架,在該框架中CNN和LSTM分別由兩個并行的路徑提取空間特征和時序特征,能更充分地發(fā)揮各自的數(shù)據(jù)處理能力。

        由上述研究可知,CNN與其他方法的有機結合可以取長補短實現(xiàn)優(yōu)勢互補,進一步提高RUL預測效果。目前,CNN與循環(huán)類神經(jīng)網(wǎng)絡的結合研究比較多,與其他方法的結合則有待進一步研究。筆者認為,既要重視不同方法之間的互補效應,也不能為提高預測效果盲目疊加多種方法組成復雜模型。因此,結合何種方法、如何結合以實現(xiàn)優(yōu)勢互補將是該領域未來的研究重點。

        1.4 自編碼器及其應用

        上述方法均屬于監(jiān)督學習方法,而自編碼器(AutoEncoders, AE)是一種典型無監(jiān)督神經(jīng)網(wǎng)絡模型,其核心作用在于提取輸入數(shù)據(jù)的深層表達[1]。AE主要由編碼器與解碼器兩部分組成,如圖7所示為一個典型的AE結構圖,編碼器的主要作用是通過編碼函數(shù)f(x)對輸入數(shù)據(jù)進行特征提取得到深層特征表達(H)。而解碼器的作用與編碼器相反,主要通過解碼函數(shù)g(H)對深層特征表達進行數(shù)據(jù)重構。上述編解碼函數(shù)可通過神經(jīng)網(wǎng)絡實現(xiàn)。在應用中,AE致力于使輸出數(shù)據(jù)對輸入數(shù)據(jù)實現(xiàn)最大程度的還原。通??捎镁秸`差來表示AE的損失函數(shù),其數(shù)學表達式如下:

        (8)

        式中:x表示輸入數(shù)據(jù),x表示輸出數(shù)據(jù),n表示數(shù)據(jù)量。在該損失函數(shù)中,訓練數(shù)據(jù)的標簽為其本身,不需要額外標簽,這也表明AE是一種典型的無監(jiān)督學習方法。

        在實際應用中,AE主要有特征提取和非線性降維兩方面的重要功能?;谏鲜鰞蓚€功能,AE在RUL預測中得到了較廣泛應用。Yan等[42]利用集成的去噪自編碼器對數(shù)控加工中心的工業(yè)數(shù)據(jù)進行處理,實現(xiàn)了退化特征的自動提取,并利用線性回歸方法擬合特征以實現(xiàn)RUL預測;Ren等[44]基于深度AE模型對振動信號進行自動特征選擇和數(shù)據(jù)壓縮,并利用深度FCN對軸承RUL進行預測;Ding等[59]利用AE模型處理從原始信號中提取出的時域和頻域特征,實現(xiàn)進一步特征提取和非線性降維,最后通過BGRU實現(xiàn)采煤機關鍵部件的RUL預測;此外,Yu等[58]提出一種基于BLSTM的AE模型,將傳感器數(shù)據(jù)轉(zhuǎn)換為一維健康因子以提取退化特征,該方法在發(fā)動機和數(shù)控機床刀具的研究中取得了較好的效果。上述研究中,AE起到的主要作用是對數(shù)據(jù)進行特征提取和非線性降維,為后期預測提供良好的特征表達。

        堆棧自編碼器(Stacked Autoencoders, SAE)是AE的一種重要應用形式,由多個AE堆疊而成。如圖8所示為一個由l個基本AE所組成的典型SAE模型。在SAE的實現(xiàn)過程中,將多個AE進行串行疊加,利用上一個AE的特征表達(H)作為下一個AE的輸入,而上一個AE的輸出部分則被丟棄了。SAE通過多個AE進行多次特征提取,可以得到輸入數(shù)據(jù)更抽象和更本質(zhì)的特征表達,其輸出可以視為輸入數(shù)據(jù)經(jīng)過特征提取后的深層特征表達[1,22]。

        在實現(xiàn)過程中,SAE通常采用無監(jiān)督逐層貪婪預訓練方法[34]進行訓練,該方法主要包括預訓練階段和微調(diào)階段兩個階段。在預訓練階段,采用的是逐層預訓練的方法。如圖8所示,通過構建多個AE模型,每個AE模型對應于一個隱藏層。在逐層訓練中,將上一個AE模型的特征表達作為下一個AE模型的輸入,依次訓練每個AE模型并得到最優(yōu)權重參數(shù);在微調(diào)階段,將AE模型的最優(yōu)權重參數(shù)作為SAE各層神經(jīng)網(wǎng)絡的初始化參數(shù),并利用普通神經(jīng)網(wǎng)絡的訓練方式進行微調(diào)訓練。具體而言,基于BP算法計算訓練誤差,然后通過梯度下降等方法來最小化訓練誤差,以達到參數(shù)調(diào)節(jié)的目的[32]。

        近年來,SAE由于其強大的深層特征表達能力,受到了RUL預測領域研究者的關注。通常,在工業(yè)活動中,傳感器所采集的數(shù)據(jù)規(guī)模較大,且存在一定噪聲,這可能會導致預測模型的計算復雜度增大,而預測精度降低。因此,在一些研究中,SAE常與其他特征提取方法相結合進行數(shù)據(jù)處理。Lin等[85]基于快速傅里葉變換提取傳感器信號中的頻譜特征,然后利用集成SAE對頻譜特征進行處理得到軸承的一維健康因子;此外,Xia等[47]和Xu等[86]的研究也將快速傅里葉變換和SAE應用于軸承傳感器信號處理中;在其他研究中,希爾伯特黃變換[87]、連續(xù)小波變換[88]等也被用于傳感器數(shù)據(jù)的特征處理。

        上述特征處理方法在一定程度上有利于提高RUL預測精度,但特征處理過程需要一定先驗知識,而且不合適的特征可能導致較差的預測結果。因此,近年來也有部分研究者使用SAE直接對傳感器數(shù)據(jù)進行深度特征提取。

        針對航空發(fā)動機,Ma等[89]首先使用稀疏SAE模型處理傳感器數(shù)據(jù)以提取深層退化特征,然后利用邏輯回歸處理上述特征并進行RUL預測;Sun等[90]利用多層SAE模型對傳感器數(shù)據(jù)進行特征提取,然后將學習到的特征權重遷移到新的SAE模型中,并結合非線性回歸方法對刀具的RUL進行預測;此外,多層SAE被用于預測中碳鋼的疲勞壽命[91],實現(xiàn)了從輸入數(shù)據(jù)到預測值的端到端處理。通常,利用SAE直接對傳感器數(shù)據(jù)進行處理,可以實現(xiàn)深層特征的自動提取,進而實現(xiàn)從原始數(shù)據(jù)到預測結果的端到端處理。因此,該方法可以減少對先驗知識的依賴,更具實用性。

        也有研究將上述兩種SAE應用方式進行結合。Shi等[92]用快速傅里葉變換和小波包變換分別提取振動信號中的頻域和時頻域特征,然后利用稀疏SAE模型分別處理原始振動信號、頻域特征及時頻域特征,并進行特征融合,最后基于非線性回歸函數(shù)進行刀具磨損預測。該研究為SAE在本領域的應用提供了一種新的思路,即將SAE直接處理原始數(shù)據(jù)、SAE處理初步特征提取后的數(shù)據(jù)這兩種方式融合在一個框架下。

        上述兩種SAE應用方式具有各自的應用特點及應用場景,在RUL預測中應用較為廣泛。筆者認為,一方面應該根據(jù)具體應用場景選擇合適的處理方式;另一方面,可以考慮將基于先驗知識的手動特征與基于深度學習的自動特征進行融合,嘗試進一步提高預測模型的精度和可解釋性。

        1.5 深度置信網(wǎng)絡及其應用

        深度置信網(wǎng)絡(DBN)是Hinton等[34]在2006年提出的一種神經(jīng)網(wǎng)絡算法,是最早實現(xiàn)深度結構訓練的非卷積模型之一。DBN的提出具有階段性意義,引導了當前深度學習的復興[32]。本質(zhì)上而言,DBN是一個典型的概率生成模型,其通過訓練網(wǎng)絡參數(shù),建立標簽和觀測數(shù)據(jù)之間的聯(lián)合分布,按最大概率來生成訓練數(shù)據(jù)。DBN的基本組成部分是受限玻爾茲曼機(Restricted Boltzmann Machines, RBM),為了更好地理解DBN,先對RBM進行簡單介紹。

        RBM是一種常見的概率無向圖模型,與AE相似,是常用的預訓練模型和無監(jiān)督學習模型。如圖9所示,RBM由兩個神經(jīng)元網(wǎng)絡層組成,即可視層和隱藏層??梢晫佑址Q為輸入層,用于接收輸入數(shù)據(jù);隱藏層又稱為特征檢測器,用于提取輸入數(shù)據(jù)的抽象特征表達。在常用的RBM中,狀態(tài)的取值只有激活和未激活兩種,分別用1和0來表示,其取值是根據(jù)概率統(tǒng)計法決定的[1,93]。RBM中的“受限”是指同層之間神經(jīng)元互不連接。若同層之間也存在連接,則此時的模型為玻爾茲曼機(Boltzmann Machines, BM)。BM由于網(wǎng)絡訓練代價太高,較少使用。

        RBM具有強大的無監(jiān)督學習能力,能起到特征提取和數(shù)據(jù)降維的作用,因此在RUL預測領域也有所應用。Deutsch等[93]提出一種基于RBM的軸承RUL預測方法,該方法通過RBM進行特征提取,并在RBM后添加線性回歸層,經(jīng)過預訓練和微調(diào)后進行RUL預測;Liao等[94]提出一種帶有正則項的增強RBM模型,從振動信號提取軸承運行過程中的退化特征,并基于相似度的方法進行RUL預測;Ellefsen等[12]提出一種基于RBM和LSTM的RUL預測模型,首先無監(jiān)督的RBM自動地從原始數(shù)據(jù)中提取退化特征并實現(xiàn)數(shù)據(jù)降維,然后再用有監(jiān)督的LSTM對退化特征進行處理以預測發(fā)動機的RUL。

        總結文獻可知,RBM在RUL預測中的主要作用在于實現(xiàn)無監(jiān)督的故障特征提取及數(shù)據(jù)降維,為解決RUL預測問題提供了一定幫助。但RBM作為一種比較早的深度學習方法,其功能逐漸被其他方法替代[12],目前直接應用RBM的研究比較少。

        DBN是RBM的一個重要發(fā)展方向,近年來得到了廣泛認可和應用。如圖10所示,一個典型的DBN框架由若干個RBM和單層BP神經(jīng)網(wǎng)絡組成。與SAE的訓練過程相似,DBN也是借助無監(jiān)督逐層貪婪預訓練方法進行訓練的[34]。該方法主要包括兩個過程:①逐層無監(jiān)督地訓練每一層的RBM。當上一層RBM訓練好之后,其隱藏層特征作為下一層RBM的輸入。當所有RBM訓練完之后,就實現(xiàn)了對權重參數(shù)的初始化;②在DBN的最后一層設置BP神經(jīng)網(wǎng)絡。該BP神經(jīng)網(wǎng)絡的主要作用是處理上述RBM的輸出特征,然后基于監(jiān)督學習方法訓練模型。雖然第一步中每個RBM都訓練得到了最優(yōu)權重,但該最優(yōu)不是整個DBN網(wǎng)絡的最優(yōu)權重,依然需要基于BP算法進行微調(diào)。經(jīng)過上述RBM預訓練權重和反向微調(diào)之后,就得到了DBN預測模型。

        近年來,DBN在RUL預測領域得到了較為廣泛的應用。由于DBN具有很強的自動特征提取能力,所以常被用于退化特征提取與健康因子構建。Deutsch等[95]結合DBN和粒子濾波方法,對陶瓷軸承的RUL進行預測,其中DBN主要的作用在于挖掘退化特征信息;Peng等[96]利用多層DBN提取發(fā)動機傳感器數(shù)據(jù)中的深層退化特征,并構建退化過程的健康因子,最后利用改進粒子濾波方法預測RUL;此外,Pan等[97]提出了一種基于DBN和自組織特征映射方法的性能退化評估方法,構建出風力發(fā)電機齒輪箱運行過程的健康因子,然后通過改進粒子濾波方法進行RUL預測。針對軸承RUL預測問題,Hu等[98]提出了一個基于兩階段的預測方法,第一階段基于DBN提取高維退化特征,并基于局部線性嵌入算法進行特征篩選確定健康因子;第二階段利用擴散過程對RUL進行預測。

        上述方法將DBN作為特征提取器,對各種設備運行過程中的信號進行深層特征提取,并構建合適的健康因子以表征退化狀態(tài)。基于DBN的特征提取可以有效地克服手動特征提取帶來的不確定性,且不依賴于領域先驗知識,對提高RUL預測精度具有促進作用。在完成特征提取之后,可借助相關統(tǒng)計方法對DBN所提取的特征進行處理,實現(xiàn)RUL預測,如粒子濾波及其改進算法、擴散過程和支持向量機等[95-99]。

        另外一些研究將DBN同時作為特征提取器和預測器,不需要借助額外的統(tǒng)計方法進行預測[21,100-103]。Zhang等[21]提出一種基于多目標優(yōu)化的DBN集成方法,該方法通過集成多目標優(yōu)化下訓練的DBN模型,提取傳感器數(shù)據(jù)中的深層特征進行設備RUL預測;針對齒輪和軸承,Deutsch等[100]提出一種基于DBN的RUL預測方法,利用DBN提取深層特征,并在DBN的輸出層使用FCN以進行RUL預測;此外,Zhao等[101]提出一種基于堆棧RBM和回歸輸出層的DBN模型用于特征提取及健康預測,該方法在2012年國際PHM挑戰(zhàn)賽的軸承數(shù)據(jù)集上取得了較好的預測效果;針對液壓泵,Li等[103]提出一種基于雙譜熵特征提取和DBN的RUL預測方法,并引入量子粒子群優(yōu)化算法對網(wǎng)絡初始化參數(shù)進行優(yōu)化。

        總結文獻[21]和文獻[100-103]可知,第二種方法同時將DBN作為特征提取器和預測器。該方法充分利用DBN作為深度神經(jīng)網(wǎng)絡的優(yōu)勢,實現(xiàn)了深層特征的自動提取與端到端的RUL預測?;谏鲜鲈?,該方法在RUL預測中受到了研究者的重視。此外,對DBN模型參數(shù)的選擇和進一步優(yōu)化也是本領域的重要研究內(nèi)容。目前,常用的優(yōu)化算法包括粒子群優(yōu)化算法、遺傳算法和蟻群算法等[102-103],可以預見,隨著DBN在RUL預測中的進一步應用,未來該方向的研究將會越來越多。

        1.6 小結

        本章介紹了5種應用于RUL預測的深度學習方法,并基于近年來本領域的文獻調(diào)研情況,對所述方法的應用現(xiàn)狀進行了分析。上述5種方法的共性在于,在實際退化模型及失效機理未知的情況下,利用其本身強大的數(shù)據(jù)挖掘能力,從監(jiān)測數(shù)據(jù)中提取出與退化相關的特征信息,進而建立監(jiān)測數(shù)據(jù)與預測目標之間的非線性關系。下面將對各種深度學習方法的優(yōu)劣進行簡單總結。

        (1)FCN是最基礎的神經(jīng)網(wǎng)絡,并且較早地被引入了RUL預測領域。但FCN難以有效處理時序數(shù)據(jù),且深層的FCN難以進行有效訓練,這限制了其在RUL預測領域的發(fā)展。但是FCN并沒有被拋棄,現(xiàn)有的研究通常將FCN與其他深度神經(jīng)網(wǎng)絡聯(lián)合進行使用。

        (2)循環(huán)類神經(jīng)網(wǎng)絡可以挖掘信號之間的時序特征,從本質(zhì)上而言非常適用于處理RUL預測問題中的時序數(shù)據(jù)?;谏鲜鲈颍h(huán)類神經(jīng)網(wǎng)絡在RUL預測中得到了廣泛應用,是處理RUL預測問題最常用的深度學習方法。但循環(huán)類神經(jīng)網(wǎng)絡的計算復雜度較高,當數(shù)據(jù)量非常大且存在噪聲時,循環(huán)類神經(jīng)網(wǎng)絡的預測能力將受到一定限制。

        (3)CNN可以實現(xiàn)局部特征的自動提取,具有權值共享和稀疏連接的特點,適合處理海量數(shù)據(jù)且具有降噪的功能,是實現(xiàn)大數(shù)據(jù)處理的重要方法之一。隨著傳感技術的發(fā)展,RUL預測領域工業(yè)數(shù)據(jù)將呈現(xiàn)海量化和高維化的特點。可以預見,CNN在RUL預測中將繼續(xù)發(fā)揮重要作用。但CNN對傳感器信號中時序特征的提取能力不如循環(huán)類神經(jīng)網(wǎng)絡,可能會丟失一些重要的時序特征。在一些新的研究中,CNN常與循環(huán)類神經(jīng)網(wǎng)絡聯(lián)合使用。

        (4)AE及SAE是典型的無監(jiān)督學習方法,具有高效的特征學習能力,其本質(zhì)作用在于提取輸入數(shù)據(jù)的深層表達。SAE可以通過無監(jiān)督逐層貪婪預訓練方法進行深度神經(jīng)網(wǎng)絡的參數(shù)初始化及預訓練,用來規(guī)避有監(jiān)督學習中難以有效訓練深層網(wǎng)絡的缺點。然而,近年來日漸成熟的正則化方法在一定程度上已經(jīng)克服了該缺點,如隨機失活(dropout)和批標準化。此外,該訓練方法使用了兩個單獨的訓練階段,訓練過程相對復雜,要訓練出一個有效的RUL預測模型比較困難。

        (5)DBN屬于概率生成模型,擅長分析數(shù)據(jù)中的概率分布,其算法本質(zhì)是從數(shù)據(jù)中學習到相關的特征。與SAE相同,DBN也是通過無監(jiān)督逐層貪婪預訓練方法進行訓練的,其訓練過程相對復雜。此外,DBN本身沒有學習數(shù)據(jù)中的時序特征的能力,在處理RUL預測中的時序數(shù)據(jù)時受到一定限制。相比于CNN和LSTM,近年來DBN在RUL預測中的應用較少,但仍是一個重要的研究方向。

        2 應用案例及分析

        2.1 數(shù)據(jù)集介紹

        本章使用美國國家航空航天局(NASA)的C-MAPSS數(shù)據(jù)集[104]來比較和總結各種深度學習剩余使用壽命預測方法的有效性。C-MAPSS渦扇發(fā)動機運行數(shù)據(jù)集在RUL預測領域被廣泛使用,該數(shù)據(jù)集是通過使用NASA開發(fā)的商用模塊化航空推進系統(tǒng)(C-MAPSS)進行仿真得到的模擬運行數(shù)據(jù)。表2記錄了該數(shù)據(jù)集的一些基本情況。根據(jù)運行狀態(tài)和故障模式的不同,可以進一步分為4個子集,每個子集包含一個訓練集和一個測試集,且每個子集都包含了監(jiān)測發(fā)動機運行的21維傳感器數(shù)據(jù)以及3維的操作設置數(shù)據(jù)。數(shù)據(jù)中的21維傳感器數(shù)據(jù)主要包括風扇進氣口總溫度、低壓壓縮機出氣口總溫度和高壓壓縮機出氣口總溫度等。此外,3維操作設置數(shù)據(jù)指飛行海拔、馬赫數(shù)和海平面溫度。上述3種操作設置的組合構成了6種運行模式。該數(shù)據(jù)集的更多詳細內(nèi)容可在文獻[104]中進行查詢。

        表2 C-MAPSS數(shù)據(jù)集基本情況[6]

        在仿真程序中,訓練集包括在不同運行條件和故障模式下收集的多個渦扇發(fā)動機運行至故障的監(jiān)測數(shù)據(jù)記錄。隨著時間的推移,發(fā)動機單元不斷退化,直到程序認為發(fā)動機不能再使用,即發(fā)生系統(tǒng)故障。與訓練集不相同的是,測試集的發(fā)動機從生命周期的某個點開始記錄數(shù)據(jù),在退化過程中的某個時間點停止運行,相當于截取了發(fā)動機全生命周期的一段數(shù)據(jù)。在模型訓練中,可將發(fā)動機運行數(shù)據(jù)樣本作為訓練樣本,每個樣本對應的RUL作為訓練標簽。訓練好模型后,對測試集中每個渦扇發(fā)動機的RUL進行預測,并將預測的RUL與數(shù)據(jù)集提供的實際RUL值進行比較,以驗證預測模型的有效性[6,11,40]。

        2.2 評價指標

        為評價模型的有效性,本文采用兩個常用的評價指標進行評估,分別是均方根誤差RMSE和評分函數(shù)Score。

        2.2.1 均方根誤差

        RUL預測屬于典型的回歸問題,而RMSE是回歸問題中最常用的評價指標之一,常被用于反映真實值和預測值之間的偏差,

        (9)

        Δ=RULpredicted-RULactual。

        (10)

        其中:N表示測試樣本的總數(shù),RULactual表示測試數(shù)據(jù)樣本的真實標簽值,RULpredicted表示模型的預測值。

        2.2.2 評分函數(shù)

        在RUL預測領域中,許多研究都采用評分函數(shù)作為評價標準[11,19,40],而且該評價指標也被2008年國際PHM數(shù)據(jù)挑戰(zhàn)大賽采用。如圖11所示,與RMSE相比,評分函數(shù)的最大特點是對預測值過大的懲罰較為嚴重。這是滿足實際工程要求的,因為

        在航空航天等領域,預測的故障時間晚于實際故障時間可能會導致錯誤的維修決策,進而造成非常嚴重的損失。評分函數(shù)的數(shù)學表達式如下:

        (11)

        (12)

        2.3 結果分析

        為進一步了解深度學習技術在RUL預測領域的應用情況,表3總結了近年來在C-MAPSS數(shù)據(jù)集上進行驗證的一些深度學習方法,并給出了各種方法在第一個子集(FD001)上的實驗結果。同時,表3也對這些具有代表性的深度學習方法進行了簡要的介紹。雖然各種方法在數(shù)據(jù)處理過程中不盡一致,但C-MAPSS數(shù)據(jù)集指定了訓練集和測試集,因此基于不同深度學習的RUL預測方法可在該數(shù)據(jù)集上進行比較。下面將介紹不同方法的使用情況,并進行簡單的應用分析。

        表3 基于深度學習的RUL預測代表性方法及其在C-MAPSS(FD001)數(shù)據(jù)集上的表現(xiàn)

        表3共提供了17種在C-MAPSS數(shù)據(jù)集上應用的深度學習方法。由表3可知:第1章提到的5種深度學習方法在該數(shù)據(jù)集上均有所應用,其中應用最為廣泛的是循環(huán)類神經(jīng)網(wǎng)絡與CNN。表3中涉及循環(huán)類神經(jīng)網(wǎng)絡的方法有11種,涉及CNN的方法有8種,其他幾種方法在該數(shù)據(jù)集上的應用則相對較少。上述情況與第1章對各種方法在RUL預測領域的應用總結基本一致。通常在工業(yè)領域采集到的傳感器信號都是時序數(shù)據(jù),而循環(huán)類神經(jīng)網(wǎng)絡在時序數(shù)據(jù)建模中展現(xiàn)了獨特的優(yōu)勢和潛力,是處理時序數(shù)據(jù)的最合適的方法,因此在該數(shù)據(jù)集上應用較多;CNN具有強大的特征提取能力,適合處理數(shù)據(jù)規(guī)模較大且具有噪聲的傳感器數(shù)據(jù),因此在該數(shù)據(jù)集上也得到了廣泛應用;此外,DBN等方法雖然可以提取數(shù)據(jù)中潛在的深層特征,但其模型訓練過程較為復雜,因此應用相對較少。

        從表3也可看出,結合不同方法的優(yōu)勢,學習到更多與退化相關的深層特征表達,進而提高預測精度是本領域的一個研究熱點,如CNN與LSTM、RBM與LSTM、BGRU與注意力機制等。值得注意的是,表3中結果顯示各種模型結合對RUL預測精度的提升效果是有限的。筆者認為,多種方法簡單結合組成復雜模型并不是提高預測性能的關鍵,而如何靈活地利用不同方法進行優(yōu)勢互補,進而有效提高模型的RUL預測性能才是值得研究的問題。在未來的研究中,不僅可以考慮不同深度學習方法之間的互補性,還可以考慮傳統(tǒng)方法對深度學習方法的促進作用。

        3 挑戰(zhàn)性問題及展望

        隨著深度學習技術的蓬勃發(fā)展,基于深度學習的RUL預測技術也成為了學術界近年來的研究熱點。相比于傳統(tǒng)方法,深度學習方法憑借本身卓越的數(shù)據(jù)處理能力可以實現(xiàn)更精確、更魯棒的RUL預測效果??梢灶A期的是,對于RUL預測問題而言,深度學習方法將繼續(xù)發(fā)揮重要作用,值得本領域的研究者進行深入研究。如圖12所示,本文將從數(shù)據(jù)、模型及應用3個方面存在的一些問題進行總結,并討論未來的發(fā)展方向。

        3.1 RUL預測領域有效工業(yè)數(shù)據(jù)及數(shù)據(jù)集的缺乏

        基于深度學習的RUL預測方法屬于數(shù)據(jù)驅(qū)動型方法,因此數(shù)據(jù)才是本領域技術的核心支撐所在。雖然近年來先進傳感技術的迅速發(fā)展為工業(yè)數(shù)據(jù)的采集提供了基礎,從宏觀角度來說,RUL預測領域的工業(yè)大數(shù)據(jù)是非常豐富的,但從應用的角度考慮,RUL預測技術的研究一直飽受有效工業(yè)數(shù)據(jù)不足的困擾[22,41,105]??偨Y文獻可知,公開的RUL預測數(shù)據(jù)集較少且數(shù)據(jù)規(guī)模不大,這也在一定程度上限制了深度學習方法在RUL預測領域的進一步發(fā)展。

        獲取有效的工業(yè)數(shù)據(jù)及進一步設計大型RUL預測數(shù)據(jù)集也是本領域的重要研究內(nèi)容。筆者認為,在獲取有效工業(yè)數(shù)據(jù)的過程中應考慮以下實際問題:如何在不干擾正常工業(yè)活動的前提下采集數(shù)據(jù)?如何得到工業(yè)數(shù)據(jù)的準確標簽?如何獲得低噪聲的工業(yè)數(shù)據(jù)?針對RUL預測數(shù)據(jù)集較少且數(shù)據(jù)規(guī)模不大的問題,筆者認為本領域的研究者可以與工業(yè)界合作嘗試設計大型RUL預測數(shù)據(jù)集,從而有效促進深度學習在RUL預測領域的深入發(fā)展。近年來,有部分研究者已經(jīng)對此進行了嘗試。例如西安交大—昇陽科技聯(lián)合實驗室發(fā)布的滾動軸承加速壽命實驗數(shù)據(jù)集,為本領域的發(fā)展提供了有效的數(shù)據(jù)支撐[105-106]。

        3.2 退化機理與深度學習模型的可解釋性

        參考近年來RUL預測領域的文獻可知,基于深度學習的方法往往更關注于預測精度,其中間過程的計算機理卻難以解釋。而且深度學習方法難以通過顯式的關系函數(shù)進行表示,常被視為黑箱模型。這意味著深度學習方法難以對設備退化及失效機理映射做出相應的解釋。而在實際應用中,研究者更傾向于得到設備監(jiān)測信號、設備運行參數(shù)與具體退化之間的關聯(lián)映射。隨著深度學習在RUL預測領域的深入應用,退化機理與模型的可解釋性問題已成為本領域極具挑戰(zhàn)性的難題[107-109]。

        在基于深度學習的RUL預測領域中,要實現(xiàn)退化機理與預測精度兼得,就必須提高神經(jīng)網(wǎng)絡模型的可解釋性。筆者認為,深度學習方法是基于數(shù)學的統(tǒng)計方法,可以嘗試結合RUL預測問題的特點從多個方面對模型的可解釋性進行分析。首先是數(shù)據(jù)的可視化,必須先了解數(shù)據(jù)才能對問題進行解釋。例如,對設備運行過程的監(jiān)測數(shù)據(jù)進行預處理和可視化處理,了解監(jiān)測數(shù)據(jù)與退化之間的關系,可提高對設備退化及失效的有效理解;其次是建立本身具有可解釋性的模型,如在部分深度學習模型中可以提取到與預測結果具有單調(diào)性關系的特征,這將使模型更具可解釋性。此外,建模的過程中,需要結合RUL預測問題本身對模型進行科學的解釋,如對神經(jīng)網(wǎng)絡的各個隱藏層特征進行分析等[107,110-111]。最后則是將RUL領域的先驗知識融入到深度學習方法中,在提高可解釋性的基礎上,實現(xiàn)對退化機理的進一步理解。

        3.3 基于深度學習的RUL預測模型超參數(shù)的選擇

        深度學習模型的超參數(shù)選擇對模型性能有著極其重要的影響,只有合適的超參數(shù)才能帶來準確且魯棒的RUL預測結果。目前,常用的超參數(shù)選擇方法有手動調(diào)整超參數(shù)、網(wǎng)格搜索和隨機搜索等[112],然而這些方法要么依賴人工經(jīng)驗,要么依賴計算機暴力枚舉,不符合當下的實際需求。很多時候,這些方法無法獲得與RUL預測問題相適應的超參數(shù),容易導致欠擬合或過擬合等問題。

        因此,研究出一套完備且適應RUL預測問題的理論來指導超參數(shù)的選擇是一個有意義的研究課題,對于深度學習在RUL預測領域的推廣應用有著十分重要的意義。一些研究者已經(jīng)對該課題做了相關研究嘗試,比如將超參數(shù)搜索問題轉(zhuǎn)換為優(yōu)化問題,利用遺傳算法、粒子群優(yōu)化算法等進行最優(yōu)求解。但目前這方面的研究尚不完備,需要進行更多的深入探討[101-102,113-114]。此外,筆者認為,在超參數(shù)選擇的過程中可以考慮RUL預測的領域背景以及對象特點。例如,在建立軸承的深度學習RUL預測模型時,可以考慮軸承監(jiān)測數(shù)據(jù)的特點,并參考本領域內(nèi)其他針對軸承的深度學習RUL預測模型的結構和超參數(shù)設置,然后進行適應性選擇與調(diào)節(jié),進而提高超參數(shù)選擇的合理性。

        3.4 基于深度學習的RUL預測與先驗知識結合

        如引言中所述,目前基于深度學習的RUL預測方法屬于數(shù)據(jù)驅(qū)動類方法,其核心在于構建預測模型對工業(yè)數(shù)據(jù)進行分析,并挖掘出與退化相關的特征信息進行RUL預測。因此,基于深度學習的RUL預測方法在一定程度上擺脫了對系統(tǒng)先驗知識的依賴,更具有實用性[11,39]。但這種方法忽略了系統(tǒng)本身的一些先驗知識和規(guī)則,常給人留下黑箱模型的印象。深度學習RUL預測模型的可解釋性較低已經(jīng)成為了備受關注的問題,該問題導致其泛化能力受到質(zhì)疑。

        基于模型的RUL預測方法依賴于系統(tǒng)的先驗知識和規(guī)則,其實現(xiàn)過程較為復雜,但其可解釋性和準確性較高,可以實現(xiàn)精確的RUL預測[6,19,115]。數(shù)據(jù)驅(qū)動和基于模型的方法各有優(yōu)劣,筆者認為兼取兩家之長進行優(yōu)勢互補,可進一步促進本領域研究的發(fā)展。一些研究也初步表明,將本領域的先驗知識結合到深度學習模型中,有利于進一步提高模型的性能[14-15]。因此,未來在建立基于深度學習RUL預測模型的過程中,可以將系統(tǒng)的先驗知識和規(guī)則考慮進去,進而提高模型的RUL預測精度和可解釋性。基于上述因素,對先驗知識的選擇與應用或?qū)⒊蔀楸绢I域未來的研究熱點。

        3.5 RUL預測領域的不確定性問題

        在RUL預測中,實際工程應用不僅對模型的預測精度有較高的要求,還期望模型可以提供預測結果的不確定性,如置信區(qū)間。在航空航天等對安全性要求非常高的領域,若可靠性較低的預測結果被維護系統(tǒng)采納,將導致嚴重的工業(yè)事故,這在PHM中是不能接受的。然而,大部分現(xiàn)有的深度學習方法只能實現(xiàn)點預測,無法提供預測結果的不確定性,這極大地限制了深度學習在RUL預測領域的實際應用[63,116]。因此,如何利用深度學習解決RUL預測中的不確定性問題是一個具有挑戰(zhàn)性的難題。

        在調(diào)查的文獻中,部分研究者嘗試建立基于貝葉斯神經(jīng)網(wǎng)絡的RUL預測模型來解決不確定性問題[116-117]。貝葉斯神經(jīng)網(wǎng)絡將普通神經(jīng)網(wǎng)絡中的參數(shù)由確定的值轉(zhuǎn)換為服從特定分布的隨機變量,以估計模型的不確定性。通過貝葉斯神經(jīng)網(wǎng)絡可得到預測結果的分布,進而求得置信區(qū)間。雖然貝葉斯神經(jīng)網(wǎng)絡可用于解決RUL預測的不確定性問題,但訓練代價過高等缺點限制了貝葉斯神經(jīng)網(wǎng)絡的實際應用。筆者認為,在未來的研究中,一方面可以進一步研究貝葉斯神經(jīng)網(wǎng)絡的應用,嘗試解決貝葉斯神經(jīng)網(wǎng)絡存在的一些不足;另一方面,可以嘗試將其他領域的基于深度學習的不確定性研究方法引入到本領域,如計算機視覺領域提出的蒙特卡羅dropout和損失函數(shù)改進法[118-119]。

        3.6 變工況及多種失效模式下的RUL預測

        設備的工況主要指的是其在運行過程中所處的環(huán)境條件和操作條件[120]。環(huán)境條件主要包括外在的溫度、濕度和氣壓等;而操作條件則主要包括裝備或零件本身的運行狀態(tài)設置,如滾動軸承運行過程的轉(zhuǎn)速及載荷,數(shù)控機床加工過程中的切削速度、進給量和主軸轉(zhuǎn)速等。在實際工程應用中,復雜裝備及其關鍵零件所處的環(huán)境條件可能發(fā)生實時變化,且其本身的操作條件也可能發(fā)生變化,即處于變工況運行狀態(tài)。通常,工況條件的變化會對裝備及零件的退化產(chǎn)生顯著的影響。受到環(huán)境條件、操作條件等不確定性因素的影響,運行過程中可能會出現(xiàn)多種失效模式,其失效機理和失效時間也會呈現(xiàn)出一定隨機性[121]?,F(xiàn)有的研究多側(cè)重于單一工況及單一失效模式下的RUL預測,在一定程度上忽略了對環(huán)境條件和操作條件的考慮,因此在實際工程應用中缺乏泛化性,進而影響了預測的有效性。為了更好地服務于工業(yè)生產(chǎn),變工況及多種失效模式下的RUL預測值得深入研究[8]。

        首先,深度學習是解決上述問題的一個重要途徑。在提供足夠有效監(jiān)測數(shù)據(jù)的基礎上,深度學習可以學習到內(nèi)在失效機理并進行有效預測。簡言之,當訓練好的深度學習模型預測能力和泛化性足夠強,可以在一定程度上降低多種失效模式及變工況帶來的不確定性[122]。然而,在工業(yè)生產(chǎn)中難以獲得大量有效監(jiān)測數(shù)據(jù),這限制了該方法的實用性;其次,可以考慮引進工況數(shù)據(jù)作為模型訓練的輔助數(shù)據(jù),所述工況數(shù)據(jù)既包括設備的操作條件參數(shù),也包括外在環(huán)境條件參數(shù)。針對工況數(shù)據(jù)和傳感器監(jiān)測數(shù)據(jù)的差異性,運用不同神經(jīng)網(wǎng)絡進行處理,而后再將從兩類數(shù)據(jù)中提取到的特征進行融合。該方法有助于提高模型對不同工況條件及失效模式的識別能力,進一步提高預測精度[57,63];最后,考慮將變工況及失效模式的先驗知識與深度學習預測模型結合,在先驗的基礎上提高模型對變工況及多種失效模式的應對能力。

        4 結束語

        本文綜述了近年來基于深度學習的剩余使用壽命預測領域的最新研究,并在總結與分析相關研究的基礎上,對該領域的研究現(xiàn)狀以及存在的挑戰(zhàn)性問題進行了闡述。在此基礎上,筆者為如何應對所面臨的挑戰(zhàn)和促進未來該領域的發(fā)展提供了研究思路與建議。

        猜你喜歡
        特征提取神經(jīng)網(wǎng)絡領域
        神經(jīng)網(wǎng)絡抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        領域·對峙
        青年生活(2019年23期)2019-09-10 12:55:43
        基于Daubechies(dbN)的飛行器音頻特征提取
        電子制作(2018年19期)2018-11-14 02:37:08
        Bagging RCSP腦電特征提取算法
        基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
        新常態(tài)下推動多層次多領域依法治理初探
        基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡的PID整定
        基于MED和循環(huán)域解調(diào)的多故障特征提取
        肯定與質(zhì)疑:“慕課”在基礎教育領域的應用
        亚洲a∨无码男人的天堂| 亚洲蜜桃视频在线观看| 久久婷婷综合激情亚洲狠狠| 亚洲欧洲免费无码| 久精品国产欧美亚洲色aⅴ大片| 欧美成人小视频| 性感人妻中文字幕在线| 偷拍视频网址一区二区| 尤物在线精品视频| 美女胸又www又黄的网站| av大片在线无码永久免费网址| 成人爽a毛片在线播放| 日日拍夜夜嗷嗷叫国产| av无码久久久久久不卡网站| 午夜无码亚| 成av人片一区二区久久| 亚洲国产一区二区三区在线观看| 国产色诱视频在线观看| 丰满少妇人妻无码超清| 丝袜美腿福利视频在线| 国产超碰人人爽人人做人人添| 久久99精品久久久久久久清纯| 日本少妇爽的大叫高潮了| 国产免费在线观看不卡| 老少配老妇老熟女中文普通话| 亚洲伊人久久大香线蕉影院| 一二区视频免费在线观看| 久久精品无码专区东京热| 国产一级一厂片内射视频播放| 亚洲综合极品美女av| 日日噜狠狠噜天天噜av| 亚洲影院天堂中文av色| 国产小车还是日产的好 | 国内精品免费一区二区三区 | 亚洲av无码日韩精品影片| 亚洲精品成人网线在线播放va| 国产女人乱码一区二区三区| 人妻少妇精品视频专区| 欧美日韩不卡中文字幕在线| 日本人妖一区二区三区| 国产自国产自愉自愉免费24区|