韓 延 林志超 黃慶卿* 向 敏 文 瑞 張 焱
①(重慶郵電大學(xué)自動化學(xué)院 重慶 400065)
②(重慶郵電大學(xué)工業(yè)互聯(lián)網(wǎng)研究院 重慶 401122)
滾動軸承是機(jī)械設(shè)備中易受損部件之一,其健康狀況直接影響到整個(gè)設(shè)備的運(yùn)轉(zhuǎn)狀態(tài)。因此,對軸承的剩余使用壽命進(jìn)行有效預(yù)測將有利于避免嚴(yán)重威脅生命和財(cái)產(chǎn)安全的事故發(fā)生[1-3]。
基于深度學(xué)習(xí)的軸承剩余使用壽命預(yù)測方法在近幾年取得快速發(fā)展。如:Wang等人[4]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶神經(jīng)網(wǎng)絡(luò),提取軸承的時(shí)序特征和空間特征,對滾動軸承進(jìn)行壽命預(yù)測;Yang等人[5]將振動信號分解為固有尺度分量,并選擇有效的分量重構(gòu)信號并建立特征集,然后利用灰色回歸模型修復(fù)通過融合改進(jìn)的獨(dú)立分量和馬氏距離計(jì)算的退化指標(biāo)得到健康指標(biāo)并訓(xùn)練模型實(shí)現(xiàn)軸承的剩余使用壽命預(yù)測;Ding等人[6]利用C均值聚類將軸承的全壽命數(shù)據(jù)分為正常運(yùn)行、輕微退化、嚴(yán)重退化3階段,并用粒子群算法優(yōu)化網(wǎng)絡(luò),實(shí)現(xiàn)剩余使用壽命預(yù)測。上述方法能夠?qū)ν环N工況下軸承的剩余使用壽命進(jìn)行有效的預(yù)測,然而在實(shí)際應(yīng)用中,大多數(shù)軸承在不同的工況下運(yùn)行,跨工況條件下數(shù)據(jù)分布的差異導(dǎo)致剩余使用壽命(Remain Useful Life, RUL)預(yù)測模型的預(yù)測性能急劇下降[7]。
在跨工況條件下,可通過挖掘源域特征和目標(biāo)域特征之間的相似性關(guān)系,將源域的知識應(yīng)用于目標(biāo)域,提高目標(biāo)域軸承RUL預(yù)測精度[8,9]。如:Hu等人[10]通過多個(gè)自編碼器提取源域和目標(biāo)域軸承的私有特征和公共特征,并將公共特征進(jìn)行領(lǐng)域適應(yīng)實(shí)現(xiàn)RUL預(yù)測;Cheng等人[11]通過可轉(zhuǎn)移特征注意力和可轉(zhuǎn)移實(shí)體注意力對目標(biāo)域特征進(jìn)行加權(quán),提高了目標(biāo)域軸承RUL預(yù)測精度;Zou等人[12]通過重建的退化指標(biāo)提取具有顯著特征的退化樣本,并輸入到多域?qū)咕W(wǎng)絡(luò)以實(shí)現(xiàn)特征轉(zhuǎn)移,最后通過雙向長短期記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory, Bi-LSTM)實(shí)現(xiàn)RUL預(yù)測。上述方法在跨工況條件下的軸承剩余使用壽命預(yù)測取得了一定的結(jié)果,但是上述方法在對齊源域和目標(biāo)域數(shù)據(jù)時(shí),只是通過距離度量拉近兩個(gè)域的數(shù)據(jù)分布,未考慮決策邊界模糊的問題,導(dǎo)致邊界周圍的樣本依然難以實(shí)現(xiàn)有效預(yù)測;并且目標(biāo)域軸承樣本沒有對應(yīng)的標(biāo)簽,目標(biāo)域樣本的特征不能實(shí)現(xiàn)與真實(shí)RUL之間的映射,不同樣本可能會被提取出相同或相近的特征,從而導(dǎo)致不同樣本預(yù)測出相同的RUL。
為解決上述問題,本文提出一種正交約束的最大分類器差異方法 (Maximum Classifier Discrepancy network with Orthogonal Constraints,MCD_OC)。針對現(xiàn)有域適應(yīng)方法的模型決策邊界模糊的問題,使用最大分類器差異方法對源域和目標(biāo)域特征進(jìn)行領(lǐng)域適應(yīng)。針對目標(biāo)域軸承無標(biāo)簽導(dǎo)致難以提取反映軸承退化趨勢的特征,在訓(xùn)練時(shí)對每個(gè)mini-batch的目標(biāo)域特征正交約束,以增強(qiáng)不同剩余壽命狀態(tài)下樣本特征的可辨識性。最后,基于PHM2012數(shù)據(jù)集構(gòu)建多個(gè)跨工況軸承剩余使用壽命預(yù)測實(shí)驗(yàn),論證所提模型的有效性與穩(wěn)定性。
遷移學(xué)習(xí)是一種能夠?qū)F(xiàn)有知識應(yīng)用于相關(guān)領(lǐng)域的方法。在遷移學(xué)習(xí)中被遷移的領(lǐng)域稱為源域(Source domain),待學(xué)習(xí)的領(lǐng)域稱為目標(biāo)域(Target domain)。源域獲取的數(shù)據(jù)集 {,}中,共有Ns個(gè)樣本,是樣本對應(yīng)的標(biāo)簽。源域中的樣本來自樣本空間χs,標(biāo)簽來自空間ys,即∈χs,∈ys,數(shù)據(jù)分布服從P(χs)。目標(biāo)域獲取的數(shù)據(jù){}中,包含Nt個(gè)樣本,樣本來自于樣本空間χt,數(shù)據(jù)分布服從Q(χy),并且Q≠P。
域適應(yīng)是遷移學(xué)習(xí)的分支,能夠充分利用源域和目標(biāo)域與數(shù)據(jù),從而解決兩個(gè)域特征分布不一致的問題。通過源域的帶標(biāo)簽數(shù)據(jù)訓(xùn)練模型,建立樣本空間χs到 源域樣本標(biāo)簽ys的 非線性映射關(guān)系f:χs→ys,在源域上學(xué)習(xí)知識。為減小源域和目標(biāo)域的數(shù)據(jù)分布存在的差異,適配源域與目標(biāo)域的數(shù)據(jù)分布,使模型在源域?qū)W習(xí)到的知識應(yīng)用于目標(biāo)域。
目前大部分領(lǐng)域適應(yīng)方法都是通過不同的度量方法度量兩個(gè)分布的距離,或通過混淆域判別器將兩域的特征對齊。然而對齊的結(jié)果只是拉近兩個(gè)域的特征分布,沒有考慮模糊的決策邊界對預(yù)測造成的影響,處于邊界周圍的樣本依然難以預(yù)測。此外,軸承不同退化程度的樣本的特征存在差異,而目標(biāo)域上存在的某些相似的樣本特征可辨識性低,模型難以識別。
為解決上述問題,本文提出MCD_OC方法,通過最大分類器差異將源域和目標(biāo)域的特征進(jìn)行領(lǐng)域適應(yīng),同時(shí)為保證提取出能夠反映目標(biāo)域軸承退化的特征,求取點(diǎn)積作為損失優(yōu)化網(wǎng)絡(luò)參數(shù),使目標(biāo)域軸承特征保持正交。
如圖1所示,普通域適應(yīng)方法為減小源域和目標(biāo)域的差異,只是將兩個(gè)域的特征拉到相同的分布下,但是兩個(gè)域的分布可能不能夠準(zhǔn)確對齊,會出現(xiàn)決策邊界模糊的問題。由于模型已充分學(xué)習(xí)源域上的知識,因此能夠準(zhǔn)確預(yù)測源域上的樣本,然而對目標(biāo)域的樣本預(yù)測時(shí),模糊的決策邊界導(dǎo)致分類器難以準(zhǔn)確預(yù)測其RUL。為減小模糊的決策邊界對RUL預(yù)測造成的影響,本文引入最大分類器差異[13]。通過兩個(gè)不同的分類器預(yù)測的目標(biāo)域樣本RUL,得到分類器差異損失 Lossdisc,再使用 Lossdisc交替訓(xùn)練特征提取器和分類器,不斷優(yōu)化模型的特征提取能力和決策邊界,拉近源域和目標(biāo)域之間的距離。優(yōu)化方法分為以下3步:
圖1 普通的域適應(yīng)方法和最大分類器差異
首先在源域數(shù)據(jù)上對軸承剩余壽命預(yù)測模型訓(xùn)練,構(gòu)建對軸承剩余壽命的預(yù)測能力,以向目標(biāo)域提供可遷移的預(yù)測知識
其中,Ns是源域樣本的個(gè)數(shù),為源域上第i個(gè)樣本,F(xiàn)(·) 為模型的特征提取器,C1(·)和C2(·)為模型的兩個(gè)分類器,通過特征提取器和分類器得出兩個(gè)RUL預(yù)測結(jié)果C1(F())和C2(F(),并與真實(shí)RUL標(biāo)簽計(jì)算損失 Lossreg1和 Lossreg2,優(yōu)化整個(gè)網(wǎng)絡(luò)。
然后,在保證模型的預(yù)測精度的同時(shí),引入分類器差異損失L ossdisc增大兩個(gè)分類器的差異,即最大化L ossdisc優(yōu) 化分類器。分類器差異損失 Lossdisc表示為
最后,為提高特征提取器的特征提取能力,最小化 Lossdisc并優(yōu)化特征提取器。通過 Lossdisc優(yōu)化特征提取器,使特征提取器能夠提取出表達(dá)能力更強(qiáng)的特征,以減小兩個(gè)不同分類器對難預(yù)測樣本預(yù)測的分歧。
使用源域有標(biāo)簽數(shù)據(jù)訓(xùn)練模型,模型學(xué)習(xí)到源域數(shù)據(jù)的特征,然后分類器通過建立特征和標(biāo)簽之間的映射關(guān)系,能夠準(zhǔn)確預(yù)測源域上軸承的RUL。然而目標(biāo)域軸承的樣本沒有剩余壽命標(biāo)簽,模型不能直接構(gòu)建特征與RUL之間的映射,因此經(jīng)過無監(jiān)督訓(xùn)練后模型的特征提取器依然可能難以提取能夠反映目標(biāo)域軸承的退化特征。軸承的壽命預(yù)測中,不同的樣本對應(yīng)不同的剩余使用壽命,因此將不同的樣本表示為不同的類。如圖2所示,對目標(biāo)域特征施加正交約束,在一定程度上強(qiáng)制特征之間保持正交,能夠增大類間的距離[14],從而增大樣本之間的差異,確保不同樣本的可辨識性。分類器根據(jù)存在差異的不同樣本的特征,能夠避免混淆不同樣本。
圖2 對目標(biāo)域特征正交約束增大特征差異
通過特征提取器能夠提取軸承的深層特征,并沿batch維度將每個(gè)mini-batch中目標(biāo)域深層特征z等分為兩組樣本特征集(z′和z′′),進(jìn)而基于劃分的兩組樣本特征集,進(jìn)行樣本特征間的點(diǎn)積運(yùn)算求得正交約束損失Lossoc
其中,nz′和nz′′為z′和z′′中各自的樣本特征數(shù)量。是z′中第i個(gè)樣本特征,是z′′中第j個(gè)樣本特征。將z′和z′′的所有樣本間的點(diǎn)積均值作為 Lossoc。通過最小化 Lossoc,優(yōu)化特征提取器參數(shù),對提取的特征正交約束,增大特征之間的差異。
網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,主要由特征提取器F(·)、分類器C1(·) 和分類器C2(·)組成。其中,特征提取器F(·)由卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Networks, CNN)和門控循環(huán)單元(Gate Recurrent Unit, GRU)構(gòu)成,通過CNN提取輸入軸承的空間特征,連續(xù)的空間特征堆疊成時(shí)間序列,將提取的源域和目標(biāo)域特征領(lǐng)域適應(yīng),同時(shí)在訓(xùn)練時(shí)對目標(biāo)域特征正交約束,增大不同樣本特征間的可辨識性。
圖3 MCD_OC 網(wǎng)絡(luò)結(jié)構(gòu)
用θF,θC1,θC2表示特征提取器、分類器C1、分類器C2的參數(shù),ε,δ,η為學(xué)習(xí)率。
首先用大量源域數(shù)據(jù)訓(xùn)練模型,提高模型在源域上的RUL預(yù)測精度,此時(shí),模型的總損失Lossall1為
此時(shí)的優(yōu)化目標(biāo)
然后最大化分類器之間的差異,α為 Lossdisc的系數(shù)。模型的總損失 Lossall2為
此時(shí)優(yōu)化目標(biāo)為
最后,為保證特征提取器能夠提取出表達(dá)能力更強(qiáng)的特征,減小分類器預(yù)測結(jié)果的差異,最小化Lossdisc。同時(shí),為了增大目標(biāo)域特征的差異,最小化L ossoc,優(yōu)化特征提取器。其中β為 Lossdisc的系數(shù),γ為 Lossoc的系數(shù)。模型總損失 Lossall3為
優(yōu)化目標(biāo)為
MCD_OC方法預(yù)測流程如圖4所示,分為3個(gè)步驟:振動信號采集與數(shù)據(jù)預(yù)處理;模型的建立與訓(xùn)練;軸承RUL預(yù)測性能驗(yàn)證。
圖4 正交約束域適應(yīng)的跨工況滾動軸承剩余使用壽命預(yù)測方法流程
(1) 振動信號采集與數(shù)據(jù)預(yù)處理:采集振動信號,對源域上采集的軸承振動信號標(biāo)記剩余使用壽命標(biāo)簽,提取源域和目標(biāo)域軸承振動信號的頻域特征。
(2) 模型的建立與訓(xùn)練:建立模型,用帶標(biāo)簽的源域樣本和無標(biāo)簽的目標(biāo)域樣本訓(xùn)練模型。將源域和目標(biāo)域軸承的特征領(lǐng)域適應(yīng),使模型具有目標(biāo)域樣本壽命預(yù)測能力。
(3) 軸承RUL預(yù)測性能驗(yàn)證:用經(jīng)訓(xùn)練的模型測試目標(biāo)域測試集,將兩個(gè)分類器得出的預(yù)測結(jié)果求取平均值,作為模型預(yù)測結(jié)果,分析所提方法的性能并與對比方法進(jìn)行對比,證明模型的有效性和穩(wěn)定性。
本文采用PHM2012挑戰(zhàn)數(shù)據(jù)集[15]驗(yàn)證所提模型的性能,該數(shù)據(jù)集由PRONOSTIA實(shí)驗(yàn)臺提供,包含加速度傳感器采集的17組軸承的全壽命周期振動信號。信號的采樣頻率為25.6 kHz,采樣間隔10 s,每次采樣時(shí)間0.1 s,當(dāng)振動信號的幅值超過20 g時(shí)設(shè)定軸承失效,停止采樣。用軸承剩余壽命占全壽命的比值作為樣本的標(biāo)簽,如式(11)所示
其中,yi為第i時(shí)刻的剩余使用壽命,T為軸承從開始運(yùn)行到直到失效所用時(shí)間。
實(shí)驗(yàn)數(shù)據(jù)集包括3種不同的工況,各軸承的運(yùn)行情況如表1所示。數(shù)據(jù)集劃分如表2所示,通過6個(gè)預(yù)測任務(wù)評估模型性能,分別為工況1分別域適應(yīng)學(xué)習(xí)工況2 、工況3;工況 2分別域適應(yīng)學(xué)習(xí)工況1、工況3;工況3分別域適應(yīng)學(xué)習(xí)工況1、工況2。6個(gè)預(yù)測任務(wù)的訓(xùn)練集包含源域的有標(biāo)簽數(shù)據(jù)和目標(biāo)域的無標(biāo)簽數(shù)據(jù),測試數(shù)據(jù)集包含目標(biāo)域未標(biāo)記數(shù)據(jù)。
表1 軸承運(yùn)行的3種不同工況
表2 MCD_OC試驗(yàn)數(shù)據(jù)集
采集軸承原始振動信號后,利用快速傅里葉變換將時(shí)域信號轉(zhuǎn)換為頻域信號作為模型的輸入,此時(shí)每個(gè)時(shí)刻的頻域信號包含128 0維特征。軸承時(shí)域信號和歸一化后的頻域信號如圖5所示。為充分利用數(shù)據(jù)之間潛在的時(shí)序信息,將連續(xù)n個(gè)時(shí)刻振動信號的頻域特征作為模型的輸入,xi表示第i時(shí)刻信號的頻域特征,此時(shí)模型每個(gè)樣本Xi=(xi,xi+1,...,xi+n) , 表示第i時(shí) 刻到第i+n時(shí)刻信號的頻域特征。數(shù)據(jù)集經(jīng)重新排列后為
圖5 軸承2-1的時(shí)域信號和歸一化后的頻域信號
本文所提模型參數(shù)如表3所示。特征提取器F(·)由3層1維卷積層、3層池化層和1層GRU組成,分類器C1(·),C2(·)都由3層全連接層組成,并且結(jié)構(gòu)相同。由Adam優(yōu)化器對網(wǎng)絡(luò)的參數(shù)更新,學(xué)習(xí)率為0.000 2,訓(xùn)練批次大小為50,重復(fù)訓(xùn)練網(wǎng)絡(luò)次數(shù)40次。為了減小隨機(jī)性對實(shí)驗(yàn)結(jié)果的影響,本節(jié)中所有實(shí)驗(yàn)均獨(dú)立重復(fù)3次。
表3 模型參數(shù)
為驗(yàn)證本文所提方法對于軸承壽命預(yù)測的有效性和穩(wěn)定性,將模型與深度域混淆網(wǎng)絡(luò)(Deep Domain Confusion, DDC)[16]、域?qū)惯w移網(wǎng)絡(luò)(Domain Adaptive Neural Network, DANN)[17]、最大分類器差異網(wǎng)絡(luò)(Maximum Classifier Discrepancy for Unsupervised Domain Adaptation, MCD_DA)[13]、相關(guān)對齊網(wǎng)絡(luò)(Correlation Alignment for Deep Domain Adaptation, CORAL)[18]、正交約束深度域混淆網(wǎng)絡(luò)(Deep Domain Confusion with Orthogonal Constraint, DDC_OC)方法進(jìn)行對比,DDC_OC通過最大均值差異將源域和目標(biāo)域的特征對齊的同時(shí),對目標(biāo)域特征正交約束。每個(gè)模型涉及相同模塊的參數(shù)結(jié)構(gòu)相同,6組實(shí)驗(yàn)結(jié)果如圖6所示,圖中橫坐標(biāo)為時(shí)間,縱坐標(biāo)為剩余壽命量化指標(biāo)。
圖6 不同方法在不同任務(wù)下的軸承壽命預(yù)測結(jié)果對比
為了定量分析本文提出MCD_OC方法的有效性和穩(wěn)定性,本文采用平均絕對誤差(Mean Absolute Error, MAE)、均方根誤差(Root Mean Squared Error, RMSE)衡量3組實(shí)驗(yàn)的RUL預(yù)測結(jié)果。MAE和RMSE的計(jì)算公式如式(13)、式(14)所示
其中,yi表示RUL標(biāo)簽,y?i表示模型的RUL預(yù)測結(jié)果,N為測試集樣本數(shù)量。
不同方法在不同任務(wù)中的MAE和RMSE的結(jié)果統(tǒng)計(jì)如表4所示。在部分任務(wù)中,DDC和DANN取得了一定的預(yù)測效果,但是在某些工況下的預(yù)測誤差大,預(yù)測精度仍然需要進(jìn)一步提高。CORAL通過將2階統(tǒng)計(jì)量對齊,對比DDC和DANN,在C13任務(wù)中取得了最優(yōu)結(jié)果,然而在C32任務(wù)中,預(yù)測誤差在所有的方法中最大。通過對目標(biāo)域特征進(jìn)行正交約束,對比DDC, DDC_OC在5組實(shí)驗(yàn)中取得更優(yōu)的MAE和RMSE結(jié)果,在C13, C21,C23實(shí)驗(yàn)中,MAE分別降低了0.038, 0.04, 0.017,RMSE分別降低了0.02, 0.035, 0.027,模型的預(yù)測能力明顯上升。DDC,DANN,CORAL方法由于沒有考慮到?jīng)Q策邊界模糊的問題,因此平均MAE和RMSE均劣于MCD_DA。本文結(jié)合正交約束和最大分類器差異方法,在對目標(biāo)域特征正交約束的條件下,增大了不同樣本特征之間的可辨識度,同時(shí)解決了決策邊界模糊的問題,在多組任務(wù)下取得了較優(yōu)的結(jié)果。在不同的任務(wù)中,源域和目標(biāo)域的數(shù)據(jù)分布存在差異,導(dǎo)致域適應(yīng)任務(wù)存在差異性和不確定性,難以確保所有的任務(wù)都能取得最優(yōu)的結(jié)果。雖然本文所提方法在C13中未取得最優(yōu)結(jié)果,綜合所有任務(wù)的MAE和RMSE,能夠反映出本文方法具有更強(qiáng)的穩(wěn)定性和有效性,對跨工況軸承剩余使用壽命具有一定預(yù)測能力。
表4 MCD_OC和對比模型的預(yù)測結(jié)果
針對跨工況條件下分類器決策邊界模糊、目標(biāo)域特征難以區(qū)分,導(dǎo)致跨工況條件下軸承剩余使用壽命預(yù)測精度低的問題,本文提出了一種正交約束域適應(yīng)的跨工況滾動軸承剩余使用壽命預(yù)測方法。利用最大分類器差異將源域和目標(biāo)域的特征分布對齊,解決了分類器決策邊界模糊的問題,同時(shí),通過正交約束增大特征之間的差異,加強(qiáng)特征的可辨識度,提高了目標(biāo)域軸承的預(yù)測精度。最后,基于軸承壽命數(shù)據(jù)集開展了跨工況軸承壽命預(yù)測對比實(shí)驗(yàn),本文所提正交約束域適應(yīng)方法取得了最佳的平均MAE和RMSE結(jié)果,論證了本文所提方法在綜合性能上具有更強(qiáng)的泛化性和穩(wěn)定性。
本文所討論的各跨工況滾動軸承剩余使用壽命預(yù)測方法均假設(shè)目標(biāo)域軸承數(shù)據(jù)集為全壽命數(shù)據(jù)集,在實(shí)際應(yīng)用場景,獲取某些工況下軸承的全壽命數(shù)據(jù)集十分困難,因此,在后續(xù)的工作中擬開展在不具備全壽命數(shù)據(jù)集條件下的跨工況滾動軸承剩余使用壽命預(yù)測方法研究。