姜宇迪,胡 暉,殷躍紅
(上海交通大學 機械與動力工程學院,上海 200240)
電梯制動器是電梯的重要安全裝置,其性能衰減將直接影響電梯的運行安全[1-4].目前,電梯制動器壽命預測多采用傳統(tǒng)的機器學習法[4-5],即根據(jù)全生命周期的標注數(shù)據(jù)學習回歸算法并進行預測分析[6-7].然而,電梯制動器作為高可靠性設備,其衰退周期長,全生命周期下的大量標注數(shù)據(jù)不易被采集,從而嚴重限制了傳統(tǒng)機器學習方法的壽命預測效果.因此,需要探索能夠得到大量電梯制動器衰退數(shù)據(jù)并進行剩余生命周期(RUL)精確預測的新方法.利用實驗室樣機仿真加速電梯制動器衰變的方法可以采集到大量標注數(shù)據(jù),但所得仿真數(shù)據(jù)與在真實工作環(huán)境中得到的數(shù)據(jù)存在明顯分布差異,會影響預測算法的結(jié)果.因此,如何遷移運用不同類型的大數(shù)據(jù)是算法研究的關(guān)鍵.
遷移學習[8]是一種機器學習新方法,其將仿真數(shù)據(jù)集定義為源領(lǐng)域,將真實工作環(huán)境中的數(shù)據(jù)集定義為目標領(lǐng)域[8-9],以減少分布差異對預測結(jié)果的影響,從而提高算法的精度[10-13].在工業(yè)設備的應用方面,基于遷移學習的壽命預測和故障診斷算法尚不成熟.Sun等[14]利用稀疏自編碼和Kullback-Leibler (KL)散度實現(xiàn)了對機器工具的壽命預測.Jia 等[15]利用基于域自適應的深度卷積神經(jīng)網(wǎng)絡實現(xiàn)了在不同噪聲環(huán)境下軸承的故障診斷.Zhang等[16]提出通過快速傅里葉變換的方法將頻譜數(shù)據(jù)映射到子空間,并利用子空間對齊的方式實現(xiàn)不同工況下軸承的故障分析.以上方法利用遷移學習將源領(lǐng)域與目標領(lǐng)域的數(shù)據(jù)在特征空間進行對齊,可以實現(xiàn)不同工況下設備的高精度RUL預測.但以上算法針對不同型號設備的預測效果卻不佳,且其中的特征提取器并未考慮傳感器數(shù)據(jù)在時間序列上產(chǎn)生的異常情況.此外,在訓練過程中,將特征提取器和回歸網(wǎng)絡聯(lián)合訓練導致了對同一型號設備的過擬合,從而直接影響最終預測結(jié)果.
針對上述問題,提出一種基于映射的無監(jiān)督深度遷移學習(UDTL)法,利用仿真制動器的訓練網(wǎng)絡判定實際制動器的健康狀態(tài),從而對真實工作環(huán)境中電梯制動器的RUL進行精準預測.該方法借助長短期記憶網(wǎng)絡自編碼器(LSTM-ED)實現(xiàn)對原始數(shù)據(jù)的特征提取.其根據(jù)健康數(shù)據(jù)訓練模型,將網(wǎng)絡重構(gòu)序列與原始序列的差方序列作為特征序列,因此特征領(lǐng)域?qū)嶋H是傳感器數(shù)據(jù)在時間序列上異常值的數(shù)據(jù)表征,從而保證了不同設備在特征領(lǐng)域中均具有一定的相似性;結(jié)合最大平均差異實現(xiàn)仿真數(shù)據(jù)與實際制動器數(shù)據(jù)在特征領(lǐng)域的再次對齊,從而保證兩者在特征序列上的一致性,提高預測精度.同時,用分步訓練法代替?zhèn)鹘y(tǒng)的聯(lián)合訓練法.在預測過程中,提出在線微調(diào)的方法,利用得到的新數(shù)據(jù)逐步更新特征提取器,從而實現(xiàn)對新設備的高精度壽命預測.
在電梯運行過程中,制動器的主要制動工作模式如下:當電梯轎廂到達需停站時,曳引機根據(jù)設定好的程序減速至極低的轉(zhuǎn)速,同時電磁線圈斷電.在彈簧壓力作用下,閘瓦再次抱緊制動輪,并利用摩擦片的摩擦力制停曳引機.
根據(jù)電梯的工作模式進行制動器失效分析(見圖1).可知,電梯在運行過程中出現(xiàn)制動衰退的原因主要為制動力矩過小、制動器氣隙和制動距離過大以及摩擦片磨損.在設計過程中,本文選用的電梯制動器符合設計指標,即初始條件下制動器氣隙、制動距離、摩擦噪聲和制動力均為正常值.但在長期運行過程中,制動瓦片磨損會增大制動器氣隙,摩擦噪聲會隨摩擦系數(shù)減小而增大,制動力減小,制動距離隨之增大.根據(jù)具體失效原因,將制動器間隙、編碼器讀數(shù)、摩擦噪聲和制動加速度作為原始數(shù)據(jù),進行制動器壽命預測算法分析與試驗.
圖1 制動器失效分析Fig.1 Failure analysis of brake
根據(jù)電梯制動器制動衰退的成因,提出一種基于LSTM-ED的剩余生命周期預測算法.利用長短期記憶(LSTM)網(wǎng)絡對數(shù)據(jù)進行重構(gòu)處理,將重構(gòu)誤差作為數(shù)據(jù)的特征序列,通過非線性的全連接層將特征序列映射成剩余生命周期,并利用真實剩余生命周期對回歸模型進行訓練.不同于典型的遷移學習方法,以 LSTM-ED為特征提取器可以直接將傳感器數(shù)據(jù)在時間軸上的異常反映在特征領(lǐng)域上,LSTM-ED可以根據(jù)不同設備的初始狀態(tài)進行微調(diào),因此特征領(lǐng)域具備對不同型號設備的泛化性.
LSTM網(wǎng)絡單元是一種循環(huán)單元,其通過輸入層、上一時刻的隱藏層和記憶細胞層計算當前時刻的隱藏層.該單元結(jié)合了記憶細胞層、輸入門、忘記門和輸出門,能夠決定是否需要使用輸入門記住輸入,何時需要使用忘記門保留記憶,以及何時需要使用輸出門輸出記憶.為便于表示,將Tn1,n2:Rn1→Rn2表示為矩陣W和適當維度的矢量b做運算z→Wz+b.在t時刻的輸入門(it)、忘記門(ft)、輸出門(ot)、隱藏層(at)和記憶細胞層(ct),由輸入層(xt)和上一時刻的隱藏層(at-1)以及記憶細胞值(ct-1)計算得到:
(1)
ct=ftct-1+itgt
(2)
at=ottanh(ct)
(3)
式中:gt為新的記憶細胞候選值;m為輸入維度;n為隱藏層維度;σ(x)和tanh(x)可以表示為
tanh(x)=2σ(2x)-1
其中:x為任意變量.4個變量的推導公式可以由以上簡化矩陣符號得到,如
it=σ(W1xt+W2at-1+bi)
不再贅述.
自編碼(ED)重構(gòu)模型可以通過網(wǎng)絡輸出與輸入向量維度相同的向量,因此可以檢測輸入數(shù)據(jù)中的異常值.利用自編碼的異常值檢測特性,將健康狀態(tài)下的數(shù)據(jù)重構(gòu)誤差最小化以提取傳感器數(shù)據(jù)中的異常值特征,從而提高預測精度.
圖2 LSTM-ED重構(gòu)原理Fig.2 Reconstruction principle of LSTM-ED
各個時刻的重構(gòu)誤差為
(4)
將損失函數(shù)優(yōu)化至規(guī)定的閾值以下得到更新后的LSTM-ED網(wǎng)絡,則新網(wǎng)絡可以重構(gòu)出健康狀態(tài)下的傳感器數(shù)據(jù).當設備制動衰減時,傳感器數(shù)據(jù)會隨機產(chǎn)生異常值,導致重構(gòu)序列與原始序列之間會存在較大差異,因此需要將X′u與Xu的各元素進行方差處理:
(5)
(6)
式中:Rt為真實壽命.
在實際預測過程中,通常僅有少量初始狀態(tài)為有標注的數(shù)據(jù)和無標定的數(shù)據(jù),因此將訓練好的網(wǎng)絡運用到新設備上并對其進行預測具有一定挑戰(zhàn)性.對此,提出一種無監(jiān)督的深度遷移學習法.
在UDTL中,假設在源領(lǐng)域內(nèi)均為有標注的數(shù)據(jù),則源領(lǐng)域為
(7)
此外,假設在目標領(lǐng)域內(nèi)標簽是不可得的,則目標領(lǐng)域為
(8)
源領(lǐng)域和目標領(lǐng)域分別遵循概率分布P和Q.由于源領(lǐng)域和目標領(lǐng)域的傳感器數(shù)據(jù)分別于不同的電梯制動器設備中采集得到,所以這些數(shù)據(jù)存在嚴重的分布差異,導致2.2節(jié)中的智能診斷模型不再適用.對此,利用UDTL減少源領(lǐng)域和目標領(lǐng)域之間的特征分布誤差,從而在目標領(lǐng)域內(nèi)實現(xiàn)準確的壽命預測.
最大平均差異(MMD)是一種用于測量兩個數(shù)據(jù)集之間分布差異的非參數(shù)距離度量,當兩個樣本的MMD距離足夠小時,可以認為分布相同.當Xs和Xt分別遵循概率分布P和Q時,兩個數(shù)據(jù)集之間的MMD距離為
DH(Xs,Xt)=
(9)
式中:sup(·)為輸入聚合的上確界;H表示再生核Hilbert空間(RKHS);φ(·)為從原始特征空間到RKHS的非線性映射;E(·)為數(shù)學期望.通過對RKHS的非線性映射,評估兩個數(shù)據(jù)集分布之間的相似程度.由式(9)進一步運算得到
(10)
式中:k(·,·)為特征核函數(shù).線性核函數(shù)、多項式核函數(shù)和高斯核函數(shù)為常用的核函數(shù),而高斯核函數(shù)可以實現(xiàn)非線性映射且對于多維數(shù)據(jù)的計算量較小,因此選擇高斯核函數(shù)進行運算,即
式中:σ為速度參數(shù),σ越大,則高斯核函數(shù)的局部影響范圍越大.本文選取σ=5.
3.3.1權(quán)重遷移 在源領(lǐng)域內(nèi)的LSTM-ED深度特征提取網(wǎng)絡中提取訓練好的權(quán)重和偏置,并直接遷移至目標領(lǐng)域中的新LSTM-ED網(wǎng)絡中,將其作為新深度特征提取網(wǎng)絡的初始權(quán)重和偏置:
(11)
(12)
3.3.2特征遷移 經(jīng)權(quán)重遷移后,Xt可以通過新的LSTM-ED提取特征
Ht=L(Xt)
其中:L(·)為LSTM-ED的處理函數(shù);Ht為目標領(lǐng)域的特征序列.因此,源領(lǐng)域的特征序列(Hs)與Ht的遷移誤差(LMDD)可由MMD標量表示為
(13)
特征遷移使得目標領(lǐng)域與源領(lǐng)域的特征序列分布一致,因此由源領(lǐng)域數(shù)據(jù)的先驗知識訓練得到的回歸預測全連接網(wǎng)絡可以直接作用于新目標特征序列上,從而得到高精度的預測結(jié)果.
遷移學習算法的整體框圖如圖3所示.算法的損失函數(shù)為
圖3 遷移學習算法框圖Fig.3 Overall block diagram of transfer learning
L=αLrec+βLMMD+γLR
(14)
式中:α、β和γ為3個損失函數(shù)的修正系數(shù).
典型的遷移學習多采用將目標領(lǐng)域和源領(lǐng)域的數(shù)據(jù)整合在一起訓練,即將α、β和γ均設為非零值進行聯(lián)合訓練.該訓練模式未考慮各損失函數(shù)的實際意義,易導致對源領(lǐng)域數(shù)據(jù)的過擬合,而對目標領(lǐng)域數(shù)據(jù)的預測結(jié)果不理想[9].此外,該方法需要完整的目標領(lǐng)域數(shù)據(jù),因此在實際運用中無法對目標領(lǐng)域設備進行在線預測.對此,提出一種分步訓練方法,其通過保證各模塊的準確性實現(xiàn)RUL精準預測,具體步驟如下:
步驟1令β=γ=0,將源領(lǐng)域中前10%的數(shù)據(jù)作為健康狀態(tài)數(shù)據(jù)輸入,從而更新LSTM-ED網(wǎng)絡的權(quán)重和偏置.根據(jù)訓練得到的重構(gòu)網(wǎng)絡,將輸入序列轉(zhuǎn)化為與輸入等長的特征序列,并將這一過程定義為特征提取.
步驟2在進行回歸預測訓練時,令α=β=0,即將源領(lǐng)域數(shù)據(jù)的回歸誤差作為更新權(quán)重的損失函數(shù),同時固定LSTM-ED的權(quán)重不變,僅更新全連接層的權(quán)重和偏置.
步驟3權(quán)重遷移利用源領(lǐng)域?qū)W習得到的LSTM-ED網(wǎng)絡和全連接網(wǎng)絡,初始化目標領(lǐng)域網(wǎng)絡.通過特征提取模塊,將新得到的目標領(lǐng)域序列轉(zhuǎn)化為Ht,并將Ht與Hs進行領(lǐng)域適應,即令α=γ=0,利用損失函數(shù)更新LSTM-ED,從而減小Ht與Hs的分布誤差.
步驟4LSTM-ED網(wǎng)絡能夠針對目標領(lǐng)域數(shù)據(jù)進行傳感器異常監(jiān)測,因此利用由步驟3更新后的LSTM-ED參數(shù)得到新特征序列,并將其輸入到全連接網(wǎng)絡中得到當前預測的RUL.本文預測的RUL值均小于1,其含義為剩余生命周期占總生命周期的比例.若預測值小于90%,則直接將其作為該點的RUL值;若預測值大于90%,則說明該時間段內(nèi)的數(shù)據(jù)為電梯制動器前10%的健康生命周期數(shù)據(jù),需要根據(jù)LSTM-ED的異常值檢測特性,令β=γ=0、α=1,再次訓練更新LSTM-ED參數(shù),并利用新LSTM-ED得到新特征序列,將其作為全連接網(wǎng)絡的輸入值,重新預測該點的RUL.
其中,步驟1和2為利用源領(lǐng)域數(shù)據(jù)進行訓練網(wǎng)絡,完成之后即可得到針對源領(lǐng)域數(shù)據(jù)的高精度RUL預測算法.步驟3和4為借助目標領(lǐng)域數(shù)據(jù)進行在線微調(diào)訓練并得到預測結(jié)果.
仿真試驗平臺由迅達曳引機、PLC控制柜和變頻器組成,如圖4(a)所示.其中,a為加速度,D為制動距離,d為間隙,LI為聲強級,N為運行次數(shù).變頻器和制動器(110 V直流電壓)聯(lián)動能夠加速制動器的制動失效,從而仿真制動器制動力不足的失效模式.基于上述方法,采集得到制動器從初始狀態(tài)運行至失效的全生命周期數(shù)據(jù)(見圖4(b)),并將其作為源領(lǐng)域數(shù)據(jù).當制動器在寧波申菱電梯塔(見圖5(a))運作時,人工定期檢查得到制動器從初始狀態(tài)運行至失效的全生命周期數(shù)據(jù)(見圖5(b)),并將其作為目標領(lǐng)域數(shù)據(jù).利用源領(lǐng)域數(shù)據(jù)訓練模型,并基于所提遷移學習法實現(xiàn)對目標領(lǐng)域的RUL精確預測.
圖4 制動器仿真實驗Fig.4 Simulation experiment of brake
圖5 寧波申菱電梯塔實驗Fig.5 Shenling elevator tower experiment in Ningbo
利用傳感器網(wǎng)絡連續(xù)采集制動器間隙、編碼器讀數(shù)、摩擦噪聲和制動加速度等相關(guān)物理參數(shù),并將數(shù)據(jù)預處理為多個長度l=50的子序列作為網(wǎng)絡輸入,即輸入為5×50個節(jié)點(兩個制動間隙).LSTM-ED網(wǎng)絡分為輸入層、隱藏層和輸出層,分別輸出30×50個節(jié)點、20×50個節(jié)點和5×50個節(jié)點.截取仿真數(shù)據(jù)中前10%的數(shù)據(jù)作為健康數(shù)據(jù),對LSTM-ED進行訓練,并利用訓練好的網(wǎng)絡將傳感器數(shù)據(jù)投射到如圖6所示的特征區(qū)域中,其中F為經(jīng)學習得到的特征值,ε為運行進度(運行時間占總壽命的比例).可知,5個特征值(F1~F5)隨時間的增加而增大,且增大趨勢相似,表明LSTM-ED可以作為特征提取器并有效地反映制動器衰退現(xiàn)象.
圖6 仿真實驗數(shù)據(jù)提取得到的特征Fig.6 Features of simulation experiment data
利用全連接網(wǎng)絡(輸入層為提取特征,隱藏層包括20個節(jié)點,輸出層為一維)對LSTM-ED提取的特征進行回歸預測,并利用仿真數(shù)據(jù)中的真實壽命訓練全連接網(wǎng)絡.經(jīng)訓練后,仿真數(shù)據(jù)的損失函數(shù)降低至小于0.015,即得到針對源領(lǐng)域數(shù)據(jù)的高精度RUL預測算法.
利用在線微調(diào)方法(步驟3和4),進一步訓練LSTM-ED的特征提取器參數(shù),并基于新的特征提取器將電梯塔中的數(shù)據(jù)轉(zhuǎn)化為如圖7所示的特征數(shù)據(jù).可知,該提取器同樣可以作為特征提取器并有效地反映制動器衰退現(xiàn)象.
圖7 電梯塔數(shù)據(jù)通過UDTL學習得到的特征Fig.7 Features of elevator tower data learned through UDTL
在預測過程中,利用全連接層預測回歸得到的特征,預測結(jié)果如圖8所示.可知,RUL的預測曲線與真實曲線的吻合度較高.為量化UDTL的預測結(jié)果,引入平均絕對值誤差(MAE)、均方誤差(MSE)和均方根誤差(RMSE):
圖8 UDTL對電梯塔的剩余生命周期預測Fig.8 RUL prediction of elevator tower by UDTL
(15)
(16)
(17)
根據(jù)上式計算得到:MAE=0.03、MSE=0.001 6、RMSE=0.04.可知,利用UDTL預測的誤差均很小,表明本文提出的UDTL可以有效預測真實工況下的電梯制動器剩余生命周期.
為證明所提方法的有效性,將未進行遷移學習的預測算法和傳統(tǒng)訓練法作為對比,進行電梯塔數(shù)據(jù)的RUL預測,結(jié)果如圖9所示.可知,與圖8中的UDTL方法相比,圖9中各方法的預測誤差均較大.
圖9 電梯塔剩余生命周期預測結(jié)果Fig.9 RUL prediction of elevator tower
利用上節(jié)所述量化方法,計算不同方法下電梯塔的RUL預測誤差,結(jié)果如表1所示.可知,在MSE方面,本文所提UDTL方法較無遷移學習的情況降低了59%,較傳統(tǒng)訓練法降低了54%,證明該方法能夠有效提高電梯制動器壽命預測的準確度.
表1 不同方法下電梯塔的剩余生命周期預測誤差Tab.1 RUL prediction error of elevator tower by multiple methods
為驗證所提方法的優(yōu)越性,將其他遷移學習方法作為對比,利用源領(lǐng)域數(shù)據(jù)對網(wǎng)絡進行訓練,并在真實情況下對電梯制動器進行RUL預測.引入遷移損失作為遷移學習效果的判斷指標,其值為源領(lǐng)域與目標領(lǐng)域的MSE之差,結(jié)果如表2所示.
表2 各遷移方法對比結(jié)果Tab.2 Comparison results of different migration methods
可知,在保證源領(lǐng)域內(nèi)的高精度RUL預測的情況下,本文所提UDTL方法的遷移損失值最小,說明其對目標領(lǐng)域電梯制動器的RUL預測結(jié)果優(yōu)于其他方法,遷移過程中的精度損失較低.
分別利用無遷移和經(jīng)遷移更新后的LSTM-ED對真實工作情況下的電梯制動器進行特征提取,計算特征值總和(Fs)并與仿真制動器提取的特征值總和進行對比,結(jié)果如圖10所示.其中,仿真制動器的特征標注為制動器1;在真實工作情況下,無遷移和經(jīng)UDTL遷移更新后的的LSTM-ED提取的特征分別標注為制動器2和制動器3.
圖10 各制動器的特征值總和Fig.10 Sum of eigenvalues of different brakes
可知,在Fs值在大小方面,制動器3與制動器1更接近;在Fs值的變化趨勢方面,制動器3與制動器2更接近,即UDTL通過尋找兩個制動器的共有特征進行特征的遷移.利用相關(guān)度系數(shù)(r)量化各特征之間的相關(guān)性,其絕對值越大,則相關(guān)度越高.
(18)
利用式(18),得到相關(guān)度系數(shù)結(jié)果,如表3所示.可知,制動器3與制動器1的特征值總和的相關(guān)度最高,這表明制動器1通過遷移將特征保留在了制動器2的特征中,從而進一步證明所提方法可以有效提高電梯制動器在真實工作情況下的RUL預測準確度.
表3 相關(guān)度系數(shù)結(jié)果Tab.3 Results of correlation coefficient
為改善電梯制動器在真實工作情況下的壽命預測效果,提出一種基于無監(jiān)督深度遷移學習的制動器RUL預測方法.該方法利用LSTM-ED將原始數(shù)據(jù)映射到特征空間中,通過MMD實現(xiàn)真實數(shù)據(jù)與仿真數(shù)據(jù)的對齊,最終利用全連接網(wǎng)絡進行回歸并完成預測.試驗和量化數(shù)據(jù)表明:該算法RUL預測值的均方誤差僅為 0.001 6,比無遷移學習的情況降低了59%;其可以對真實工作情況下的電梯制動器進行高精度壽命預測,有助于提升電梯等同類特種設備的安全性.