張英杰, 張彩華, 陸碧良, 丁 晨, 李蒲德
(湖南大學 信息科學與工程學院,長沙 410082)
滾動軸承已成為旋轉機械和設備中使用最頻繁和最核心的部件之一,廣泛應用于風電、航空航天、交通運輸等工業(yè)領域。由于工作環(huán)境是復雜的高負荷、非線性、強耦合、不穩(wěn)定系統(tǒng),在經歷長期運轉后,滾動軸承極易發(fā)生故障,危及系統(tǒng)安全運行,造成經濟財產損失,為了旋轉機械的可靠性,應當及時診斷出滾動軸承故障以降低事故風險。
隨著機器學習的興起,國內外學者提出了多種智能故障診斷算法。傳統(tǒng)的智能故障診斷算法主要分為基于信號分析結合傳統(tǒng)機器學習的模型以及基于深度學習的模型?;趥鹘y(tǒng)機器學習方法的診斷模型分為兩步:首先篩選出原始信號的代表特征,比如快速傅里葉變換(fast fourier transform,FFT)[1]、小波變換[2]等信號處理技術[3],進而利用傳統(tǒng)的機器學習進行分類,如支持向量機(support vector machine,SVM)、貝葉斯分類器以及BP(back propagation)神經網絡等,此類方法對原始信號的特征篩選不能充分利用原始數據的隱藏信息,而且傳統(tǒng)的機器學習都是一些較為淺層的分類器,其學習能力有限,存在較多局限性。近年來,深度學習在模式識別、故障診斷等領域得到了廣泛而又成功的應用。Yuan等[4]提出了一種基于快速傅里葉變FFT結合卷積神經網絡(convolutional neural networks, CNN)的滾動軸承故障診斷方法。Lu等[5]提出了一種多通道輸入連續(xù)卷積神經網絡結合支持向量機的早期故障診斷模型。Chen等[6]提出了一種基于多個小波變換的一維卷積遞歸神經網絡。王琦等[7]在一維卷積神經網絡的基礎上進行改進提出了FRICNN-ID(fault recognition based on improved one-dimensional convolutional neural network)方法,可以準確識別滾動軸承不同故障的狀態(tài)。雷春麗等[8]采用馬爾科夫轉移場處理數據再用CNN進行自動特征提取和故障診斷。試驗結果表明在滾動軸承變工況和數據集小時具有良好的泛化性。Zhang等[9]利用一維卷積神經網絡提取特征,并輸入到經過粒子群優(yōu)化的支持向量機分類器中,提高了診斷的精度和準確性。Yang等[10]利用二維卷積神經網絡與隨機森林結合,在噪聲環(huán)境下仍能取得不錯的性能。這些方法在滾動軸承數據集上取得了良好的診斷效果,但都需要足夠的帶標簽樣本進行訓練,并且訓練數據和測試數據要遵循相同的分布[11]。然而,在實際工業(yè)生產中,對采集的大量數據進行人為標注代價高昂,鑒于風電場的地理環(huán)境不同、風機型號多樣、實時運行期間工況也多變復雜,采集的數據很難與訓練數據服從同一分布[12]。因此在跨域故障診斷情況下,前述方法診斷性能將急劇下降。
為了解決上述實際問題:本文引入遷移學習中的領域自適應方法,領域自適應在計算機視覺領域,自然語言處理等領域[13-17]取得了極大的成果。在故障診斷領域中領域自適應方法主要分為三類:一是基于差異方法利用深度網絡提取高維故障特征,再通過自適應層減小域分布距離。如Lu等[18]通過DNN網絡最小化兩個域之間的最大均值差異以減少域間分布距離,完成了滾動軸承在不同工況下的健康狀態(tài)識別。Li等[19]利用深度卷積神經網絡作為特征提取器,并最小化自適應層兩個域之間的多核最大均值差異,在不同負載條件下驗證了該方法的有效性。康守強等[20]將源域共享模型參數遷移到目標域在線訓練模型中構建分類模型,在變負載工況下具有較高的分類準確率和穩(wěn)定性。Wang等[21]將子域適應與域適應相結合構建子域適應遷移模型以減少聯合分布偏差。二是基于對抗的領域自適應方法,Guo等[22-23]通過梯度反轉層優(yōu)化特征提取器,使鑒別器損失最大化,使其無法區(qū)分源域和目標域,達到域自適應的效果。Chai等[24]進一步提出基于細粒度對抗網絡的領域自適應方法,既能對兩個域進行全局比對,又能對兩個域的每個故障類進行細粒度比對。第三類是結合差異和對抗的方法,Shao等[25]將原始數據通過短時傅里葉變換轉為時頻域圖像作為輸入,并采用50層深殘差網絡預訓練ImageNet作為特征提取器。使用域混淆和多核最大平均差異最小化源域與目標域之間的差異,并在兩個軸承數據集上證明了該方法的有效性,但該方法需要將時間序列信號通過短時傅里葉變換轉換成更明顯的高維特征進行訓練,而不能直接挖掘具有代表性的特征。前述域自適應的方法僅考慮了源域和目標域類別一致時的閉集跨域故障診斷問題,忽略了更為普遍的目標域類別是源域類別子集的部分跨域故障診斷問題,因此本文提出了一種基于類別域自適應的模型。主要貢獻如下:
(1) 采用一維卷積神經網絡1DCNN直接提取原始振動信號的特征,通過分類器實現智能故障診斷,實現了端到端智能故障診斷過程,同時也避免了特征轉換的損失。
(2) 提出了一種新的基于類別域自適應方法,將源域和目標域從域對齊精細到類別間的對齊。在軸承數據集上的試驗驗證了在閉集跨域故障診斷和部分跨域故障診斷情況下,本文方法跟經典的域自適應方法相比,仍具有競爭力和有效性。
為了更好理解域自適應的問題,引入更為常見的遷移學習。在遷移學習有兩個基本的術語:域D(Domain)和任務T(Task)。域D包括特征空間χ和特征分布P(X)兩個部分,其中D={χ,P(X)},X={x1,…,xn}∈χ,xi∈X為域中第i個訓練樣本。在任務T包括標簽空間Y和預測函數f(·),T={Y,f(·)},其中:f(x)=P(yi|xi)為條件概率分布函數;yi∈Y為域中第i個樣本的標簽。遷移學習中將域分為源域Ds和目標域Dt,相應地,任務分為源域任務Ts和目標域任務Tt。本文主要關注無監(jiān)督同構遷移學習即源域數據有標簽{xsi,ysi};xsi∈Xs,ysi∈Ys,目標域數據無標簽{xti};xti∈Xt,且源域和目標域有相同的特征空間和任務,僅域分布不同。下面給出域自適應的定義。
定義1給定一個源域Ds和源域的學習任務Ts,目標域Dt和目標域的學習任務Tt,利用在Ds和Ts上學習的知識提高目標域上預測函數f(·)的能力,其中Ds≠Dt:Ps(X)≠Pt(X),Ts=Tt。
在本文中,源域和目標域數據來自不同負載工況下以及不同損傷程度的軸承振動數據,對于每種遷移任務故障類別相同,即標簽空間相同,如何利用源域數據提升目標域的分類準確率是本文方法主要解決的問題。
卷積層卷積運算部分是CNN中最重要的運算模塊之一。卷積層通常使用多個卷積核對輸入數據進行卷積運算,從而提取出不同的局部特征,這個結果被稱為特征映射。每個卷積核的參數通過反向傳播算法最佳化得到,相比于完全連接層,卷積層具有參數共享,局部連接的結構特性,它可以利用更少的參數提取更豐富的特征,使得最終的訓練模型具有較強的泛化能力。卷積運算公式如下
gk=ωk*xi+bk;k=1,2,…,q;i=1,2,…,n
(1)
式中:ωk為卷積層的第k個卷積核系數;bk為卷積核的偏置參數;xi為輸入的第i個數據;gk為第k個卷積核提取第i個樣本的特征。
最大池化層池化層有時也稱為采樣層。池化層的主要功能是在盡可能保留原始顯著特征的同時減小特征的輸出維數,這樣不僅減少了參數的數量,提高了模型的訓練速度,而且很好地保留了主要特征。最大池化CNN中最常用的池化方法之一,它輸出指定范圍內的最大值。最大池化的數學表達式為
(2)
(3)
全連接層低維特征經過卷積層、池化層和批量歸一化后,輸入到全連接層。在全連接層中,將深度特征信息與分類進行整合,構建提取的特征與樣本標簽之間的映射關系。全連接層的最后一層稱為輸出層,或分類層。最常用的分類器是Softmax分類器。數學公式可以表示為
yl=f(ωlxl-1+bl)
(4)
式中:l為網絡的層數;yl為全連接層的輸出;xl-1為全連接層的輸入;ωl為權重參數;bl為偏置系數。
為了解決無標簽跨域故障診斷問題,本文提出了一種新的基于類別的域自適應模型。該模型主要分為3個部分:特征提取器、分類器以及錨定器,如圖1所示。模型總損失函數由分類損失和錨定損失構成,如下
圖1 本文模型架構Fig.1 Proposed model architecture
Ltotal=argminLcls+λLanchor
(5)
式中:Lcls為分類器的損失,見式(7);Lanchor為錨定器損失,見式(8);λ為一個跟迭代次數有關的權衡超參數,見式(6)。
(6)
本文中的特征提取器Fθ以一維卷積神經網絡1DCNN作為基本結構,將源域數據和目標域數據作為模型特征提取器的輸入,它直接提取分割后的原始信號特征,避免了人為特征的選擇,最大潛力地挖掘原始數據的相關狀態(tài)特征。如圖1中特征提取器模塊所示,它主要由4個卷積塊組成,每個卷積塊結構相同均在卷積層后引入了最大池化層和批量歸一化層,批量歸一化層保證特征提取過程中數據的分布不產生大的變化,減少協(xié)變量的偏移。最后引入全局平均池化GAP代替全連接層減少模型的訓練參數,加快訓練模型的速度。它的參數設置如表1所示。
表1 特征提取器架構的詳細配置Tab.1 Detailed configuration of the feature-extractor architecture
Lcls=E(xsi,ysi)~(Ds,Ys)lce{Fcls[Fθ(x)],y}
(7)
式中:E(xsi,ysi)~(Ds,Ys)為樣本來自源域數據;lce為交叉熵損失函數。
在反向傳播時更新分類器和特征提取器參數,隨著迭代的增加,分類器的損失越來越小,源域樣本分類準確率越來越高,同時保證了特征提取器獲取的高維特征代表性越來越強。
錨定器作為本文方法的核心部分,靈感來于心理學上的錨定效應,它是指在不確定情況下,目標值向初始值即“錨”的方向接近而產生估計偏差的現象[26]?;诖诵疚脑诩毩6壬蠟樵从虻拿總€故障種類分配一個獨立但結構相同的錨定器Fa。錨定器是一組由多層感知機構成的二分類器,見圖1中錨定器區(qū)域。以某故障類c為例,本文將源域數據中類c歸為正類,其他故障類歸為負類;而對于無標簽的目標域樣本,將屬于偽類c的概率超過動態(tài)錨值δc的樣本歸為正類,而低于動態(tài)錨值以及其他故障類的樣本歸為負類。其中動態(tài)錨值δc等于源域數據在分類器Softmax后類c上的最大和最小概率的均值,這確保了目標域偽標簽的可靠性。因此錨定器有別于Shao等研究中減少源域類c和目標域偽類c分布差異的思想,也不同于文獻[27]中將源域類c和目標域偽類c分別劃分為正負類進行對抗訓練的方法。錨定器的損失定義如下
(8)
隨著迭代的增加,通過源域樣本訓練的分類器損失越來越小,獲取的動態(tài)錨值的也逐漸精準可靠,因此目標域偽標簽誤差也隨之逐漸降低,對于c類的錨定器,目標域樣本中的正類會逐漸靠近c類的源域樣本,而負類的樣本作為會逐漸遠離c類的源域樣本?;谝陨显?本文模型一方面可以保證目標域和源域中的同故障類互相靠近,同時使異類之間逐漸遠離,最終實現基于類別高精度的跨域故障診斷目標。
本文的算法處理流程,如表2所示。同時采用L2正則化和Dropout技術減少模型的過擬合,從而提高模型的準確性。該模型在整個故障診斷過程中不需要人工提取特征,可以將滾動軸承的原始數據直接輸入到一維卷積網絡提取特征,然后通過錨定器減少域分布距離。從以上可以看出,這是一種“端到端”的算法結構,具有優(yōu)秀的通用性。
表2 基于類別域自適應算法的處理流程Tab.2 Process flow of domain adaptive algorithm based on class
該數據集由美國凱斯西儲大學(Case Western Reserve University,CWRU)進行試驗和發(fā)布。采集試驗臺的圖片,如圖2所示。包括一個1.5 kW的電動機,一個扭矩傳感器/譯碼器,一個功率測試計。由于驅動端采集到的軸承振動信號受到的干擾小于風扇端采集到的振動信號,因此試驗中采用驅動端加速度傳感器采集到的振動數據。
圖2 CWRU數據集試驗裝置Fig.2 Test rig of the CWRU dataset
數據集包括4種負載條件,0(1 797 r/min),0.75 kW(1 772 r/min),1.50 kW(1 750 r/min)和2.25 kW(1 730 r/min)滾動軸承振動信號。在每個負載條件下,其數據集包括9種故障類型和1種正常狀態(tài)數據。軸承用電火花加工單點損傷,軸承內圈、外圈和滾動體的故障直徑分別為7 mils(約0.18 mm)、14 mils(約0.36 mm)和21 mils(約0.53 mm),對于外圈本文選取6點鐘方向的采集的振動信號作為試驗數據。試驗中采集的數據根據采樣頻率分為12 kHz和48 kHz。本文采用采樣頻率為12 kHz的振動信號數據作為后面試驗的數據集。試驗選取4種負載工況(0,0.75 kW,1.50 kW,2.25 kW),每種負載工況選取10種滾動軸承狀態(tài)數據,按照相同個數、相同長度選取每種狀態(tài)數據作為試驗樣本。在開始訓練前,選取10個相同負荷條件下的不同狀態(tài)數據,每個狀態(tài)數據500條,并對每個狀態(tài)數據進行預處理,如調整格式、歸一化等。按照7∶3的比例分成訓練集和測試集。0負載和12 kHz采樣頻率下的9種滾動軸承故障狀態(tài),如表3所示。
表3 0負載下滾動軸承失效狀態(tài)的9種類型Tab.3 Detailed nine types of rolling bearing failure status under 0 load
3.1.1 特征提取器
首先為了驗證本文設計的1DCNN特征提取器的能力,對同負載下的故障數據進行分類。不同比較方法下的故障診斷性能,如表4所示。從表4中可以看出,本文方法訓練的診斷模型的特征提取能力明顯優(yōu)于比較方法,且平均準確率達到了100%。通過對比分析不難發(fā)現,機器學習技術受限于人工特征選擇和淺層特征表征學習能力。邏輯回歸(logistic regression,LR)和SVM的平均精度低于基于深度網絡的BPNN(back propagation neural network)和1DCNN(one-dimensional convolutional neural network);但在總體測試正確率方面,BPNN網絡的測試集正確率僅為92.44%,遠低于1DCNN。
表4 不同比較方法下的故障診斷性能Tab.4 The fault diagnosis performance under the different comparison methods 單位:%
3.1.2 試驗對比結果
對于跨域故障診斷,本文首先探討了目前大部分方法關注的源域故障種類和目標域故障種類一致時的情況。針對于4種負載情況,本試驗一共分12個跨域故障診斷的場景,以場景T01為例,源域是0負載下的振動數據,目標域則是0.75 kW下的振動數據。具體試驗數據如表5所示,本文對5次試驗的求均值,每次試驗的迭代次數均為100次。其中1DCNN只包含特征處理器和分類器,并未做域自適應處理,它將在源域訓練好的模型直接對目標域數據進行預測分類,為了保證試驗的可靠性和說服力,將其結果作為本文對比試驗的基準數據。本文對3種經典的深度域自適應模型作為對比方法,其中Coral和DDC是基于距離的深度域自適應模型,DANN是基于對抗的域自適應模型。本文對這些模型進行了改進,它們和提出的模型都使用1DCNN提取特征和預測分類。從試驗結果中,可以看出本文方法在跨域診斷中表現優(yōu)異,取得了不錯的試驗結果,其平均準確率達到了98.84%。
表5 當cs=ct時不同場景下不同方法的準確率Tab.5 The accuracy of different methods in different scenarios where cs=ct 單位:%
在12種場景中,本文所提模型均優(yōu)于基準數據,并且在幾乎所有的場景中優(yōu)于或達到對比方法的同一水準。本文提出的模型平均準確率優(yōu)于基于差異的模型,略低于DANN模型。cs=ct時不同場景下所提方法與經典方法的比較,如圖3所示。由圖3可知,場景T03中,DANN模型的表現遠高于其他模型為了驗證本文方法在類域自適應上的能力,又在部分域自適應領域進行了試驗對比,首先將目標域中內圈、外圈和滾動體的故障類都減少一類,此時目標域中只有7類故障,而源域中有10類故障。其試驗數據如表6所示,減少目標域類別后,在所有場景中,所有模型準確率均有明顯下降。cs=ct時不同場景下,所提方法與經典方法的比較,如圖4所示。由圖4可知,在域分布差異最大的T30,T03兩個場景中本文方法均表現最優(yōu)。在平均準確率上,基準模型1DCNN下降了2.44%,DANN方法下降最多,達到3.99%,本文方法僅下降了1.08%。雖然本文方法在個別場景下略低于DDC模型,但平均準確率在所有對比模型中取得了最優(yōu)的結果。
圖3 cs=ct時不同場景下所提方法與經典方法的比較Fig.3 Comparison between the proposed method and classical methods under different scenarios where cs=ct
表6 當ct∈cs時不同場景下不同方法的準確率Tab.6 The accuracy of different methods in different scenarios where ct∈cs 單位:%
圖4 ct∈cs時不同場景下,所提方法與經典方法的比較Fig.4 Comparison between the proposed method and classical methods under different scenarios where ct∈cs
此外以T30場景為例,對比本文所提出的模型與其余模型的迭代過程,如圖5所示,圖5(a)為源域和目標域類別一致的情形,本文方法比基于對抗的DANN模型收斂更快,并且優(yōu)于基于距離的模型。圖5(b)為減少目標域類別的情形,DANN震蕩十分顯著且不收斂,基于距離的模型也出現了小幅度的震蕩,而本文方法在保證高準確率的同時收斂也最快。最終結果驗證了本文方法的在跨域故障診斷中的有效性和優(yōu)越性。
圖5 不同模型的準確率對比Fig.5 Comparison of accuracys of different methods
3.1.3 特征可視化
為了直觀地觀察分類效果,本文使用t-SNE[28]技術將特征提取器提取的高維特征映射到二維空間中。以部分域自適應中的場景T30為例,如圖6所示,每個模型中均有兩個子圖,圖6(a)~圖6(d)左子圖不同形狀代表不同的類別,圖6(b)~圖6(d)右子圖圓狀代表源域樣本,叉狀代表目標域樣本。目標域中內圈、外圈和滾動體的故障類分別減少一類,每個模型都選取訓練好的特征提取器提取高維特征。
圖6 利用t-SNE可視化T30場景特征Fig.6 Visualization of T30 scenarios features with t-SNE
由圖6可知,相比其他模型本文提出的方法使源域和目標域的分布明顯更接近,而且在不同故障類之間,本文方法即保證了類內距離更近,也使類間的距離更遠,類間分布更為均勻,獲得了更好的分類結果。
進一步利用t-SNE可視化1DCNN模型,如圖7所示。由圖7可知,觀察到目標域中的加號故障類(故障類5)被誤分到方塊故障類(故障類2)中,即在高維空間中目標域中的故障類5相比真實類別距離故障類2更近。根據錨定效應,目標域故障類5將以源域故障類2為錨值,這種偏差隨著迭代次數增加而加強,最終導致分類錯誤。這解釋了為何在該場景下本文模型以及基于距離的模型表現不佳的原因。
圖7 利用t-SNE可視化T03場景下1DCNN模型特征Fig.7 T-SNE visualization of 1DCNN model features in T03 scenario
閉集域自適應中T03場景下的混淆矩陣圖,如圖8所示。基于距離的模型和本文方法都將故障類5劃分到故障類2中,而基于對抗的DANN模型可以避免這一現象。
圖8 T03場景下各模型混淆矩陣對比圖Fig.8 Comparison diagram of confusion matrix in T03 scenario
帕德博恩(Paderborn)大學軸承數據集采集自如圖9所示的模塊化試驗臺,它從左至右依次由電動機、轉矩測量軸、滾動軸承測試模塊、飛輪、負載電機組成。該數據集包含從健康軸承、人為損壞軸承和實際損壞軸承中獲得的信號數據。軸承的健康狀態(tài)分為正常(NO)、內圈(IF)和外圈(OF)故障所有這些軸承都包含3種不同的負載工況,如表7所示。人為損傷形式包括電火花加工、鉆削和手工電雕刻。此外,實際損傷以點蝕或塑性變形的形式出現。更詳細的試驗細節(jié)描述可見參考Lessmeier等的研究。
表7 操作參數Tab.7 Operating parameters
圖9 帕德伯恩數據集試驗裝置Fig.9 Test rig of the Paderborn dataset
為了進一步驗證模型的泛化性,在Paderborn數據集上設置兩組域自適應試驗:一是以人為損傷數據集為源域,不同工況下實際損壞軸承數據集為目標域,其中S1→T代表N15_M07_F10工況下采集的故障信號為源域,目標域為表7中3種工況下的振動數據;二是根據軸承的一級和二級損傷程度劃分源域和目標域。具體的域自適應試驗場景設置見表8所示。
表8 域自適應試驗設置說明Tab.8 Domain adaptive task description
對比試驗結果如表9、圖10所示。本文模型在5種域自適應任務中并未全部取得最優(yōu)結果,但是在不同的任務中,本文模型準確率一直保持穩(wěn)定,尤其是任務C中,并且最終的平均準確率比基準方法提高了5.31%,也因此取得最優(yōu)的表現。此外圖11、圖12分別展示了任務A下的迭代過程精度曲線與t-SNE可視化特征,與圖6類似每個t-SNE子圖分別包括兩部分,左部分為不同類別,右部分分別對應源域(圓狀)與目標域(叉狀)。
表9 不同任務下對比方法的準確率Tab.9 The accuracy of comparsion methods in different tasks 單位:%
圖10 所提方法與經典方法的比較Fig.10 Comparison between the proposed method and classical methods under different tasks
圖11 A任務下不同方法的測試精度曲線Fig.11 Test accuracy curves of different methods for Atask
圖12 利用t-SNE可視化A場景特征Fig.12 Visualization of A scenarios features with t-SNE
圖11可知,對比算法迭代過程中穩(wěn)定性較差,本文模型在收斂速度和穩(wěn)定性上更強。利用t-SNE可視化A場景特征,如圖12所示。由圖12可知,本文模型較于其他算法目標域樣本不同類別間距分割明顯,區(qū)分度更好。
針對滾動軸承的跨域故障診斷問題,本文提出一種基于類別的域自適應模型,它通過1DCNN將原始數據作為輸入,提取相鄰時間點之間的信息特征,無需對原始數據進行信號處理和人工特征篩選,擺脫了對人工特征提取的依賴,突破了傳統(tǒng)方法依賴專家經驗的局限性。并通過錨定器將域對齊精細到類別對齊,減小源域和目標域同類別間的距離,擴大不同類間的距離。最后在CWRU和Paderborn軸承數據集上驗證了模型的有效性和先進性?;阱^定思想可以將該模型作為一種通用架構應用到其他故障診斷研究中,促進跨域故障診斷領域的進步。
然而在軸承故障診斷領域,很難獲取真實有效的數據集,目前研究者們只能利用仿真數據驗證模型的有效性,這也是本文面臨的一個難點所在。此外在實際工業(yè)故障診斷中面臨更多的是開放集域自適應問題,不同來源的數據集中可能存在私有標簽,共享部分標簽。如何利用共享標簽提高開放集域自適應的準確率將是下一步的研究方向和工作重點。