(西南交通大學牽引動力國家重點實驗室,四川成都,610031)
由于地鐵載重容量大、運行密度高,線路條件復雜(如曲線半徑小、軌道結構多樣化),車輛啟動與制動頻繁,使輪軌相互作用加劇,鋼軌波浪形磨損(簡稱鋼軌波磨)嚴重[1]。鋼軌波磨會帶來一系列問題,如引起車輛軌道的異常振動與噪聲污染,降低車輛和軌道部件的疲勞可靠性。據(jù)文獻報道,存在鋼軌波磨的地鐵線路在打磨前、后司機室車內噪聲差異可達到近10 dB[2],而存在顯著鋼軌波磨的地鐵鋼軌扣件的振動加速度甚至能達到195g[3]。此外,一些車輛軌道零部件的疲勞斷裂失效與鋼軌波磨有直接關系,如車輛軸箱吊耳斷裂[4]、一系鋼彈簧疲勞斷裂[5]、鋼軌扣件彈條斷裂[3]等。鋼軌波磨嚴重影響車輛的安全營運并極大地增加了養(yǎng)護費用。目前,鋼軌打磨是控制鋼軌波磨最主要的手段之一,在制定打磨策略時(如打磨周期與打磨量),提前獲悉鋼軌波磨狀態(tài)是十分必要的,因此,對鋼軌波磨進行狀態(tài)監(jiān)測和故障識別具有重要意義。目前,鋼軌波磨的測量方法可歸納為弦測法[6]、慣性基準法[7]與機器視覺法[8]3類。弦測法使用鋼軌本身作為移動參考系,使測量參考的基準隨鋼軌高低不平順變化而處于變化狀態(tài),造成傳遞函數(shù)比(測量值與實際值之比)不恒為1,導致弦測法往往不能真實可靠地測試鋼軌波磨[7,9]。慣性基準法常通過軸箱加速度的二次積分來表征波磨值,其缺點是易受車輪磨耗的干擾,并且由于高通濾波器的影響,在低速工況下測量誤差較大,一般僅用于大型軌檢車[10-11]。機器視覺法往往需要精密的光電攝像設備以及復雜的圖像處理手段,運用龐雜的模式識別技術以進行特定的后端處理,實際應用難度較大且代價昂貴[8,12]。由于輪軌界面直接接觸,列車零部件振動行為可科學直觀地反映鋼軌表面狀態(tài),因此,諸多專家學者基于車輛振動響應對鋼軌狀態(tài)進行健康監(jiān)測研究[13-17]。BOCCIOLONE 等[18]針對鋼軌維護策略,研究了軸箱加速度與鋼軌波磨等級之間的相關性。MOLODOVA等[19]利用軸箱加速度信號的幅值與功率譜密度特征,對鋼軌短波缺陷進行檢測。SALVADOR 等[20]開展系列現(xiàn)場測試以獲悉鋼軌波磨狀態(tài),詳細分析了加速度傳感器的安裝位置、最佳采樣及濾波頻率對試驗的影響。WEI等[21]提出利用構架與車體加速度信號對城市軌道交通線路的鋼軌波磨進行監(jiān)測,并通過上海地鐵1號線的現(xiàn)場試驗對此方法進行了驗證。江航等[22-23]結合傳統(tǒng)的機器學習技術與車輛振動響應對鋼軌波磨的智能檢測方法進行了研究,通過實驗與仿真的手段獲得振動信號,由經驗模態(tài)分解后得到本征模態(tài)函數(shù),分別利用BP神經網絡與支持向量機對鋼軌波磨進行回歸與分類。周志青等[24]通過地鐵實際運營車輛獲取振動信號、沖擊信號樣本數(shù)據(jù)各1 600條,提取振動信號其各頻率帶的功率與沖擊信號峭度,作為支持向量機的特征參數(shù)輸入以識別鋼軌波磨。近年來,深度學習[25]已經在圖像識別、聲音識別、自然語言處理、生物信息學等領域取得了突破性進展。卷積神經網絡(convolutional neural network,CNN)作為深度學習的重要分支之一[26],在滾動軸承[27]、齒輪箱[28]、航空發(fā)動機[29]等機械故障診斷研究領域得到應用。鑒于此,本文作者使用深度學習在機械故障診斷領域研究的基礎上[30],結合CNN與軸箱加速度對鋼軌波磨進行智能檢測,以期克服現(xiàn)有鋼軌波磨在線監(jiān)測方法中的不足。本文作者定義“空間域”的概念對實測軸箱振動信號進行分割,建立振動信號與鋼軌波磨的非線性映射關系,制定可供鋼軌波磨智能分類的數(shù)據(jù)集;同時為充分利用CNN 強大的自我學習能力,并且不破壞原始輸入信號的生態(tài)信息,提出一種基于一維輸入信號的鋼軌波磨識別模型即一維卷積神經網絡(1-dimensional convolutional neural network,1-DCNN)。
CNN 是由哺乳動物視覺皮層細胞感受野啟發(fā)而建立的一種典型的前饋神經網絡,其稀疏連接與權值共享等特性可以顯著減少網絡參數(shù)并避免算法過擬合,最終獲得輸入數(shù)據(jù)的平移、旋轉及縮放不變的特征表示,具有較強的魯棒性和泛化能力。傳統(tǒng)的CNN 模型通常包含特征提取和識別分類2部分,其中特征提取階段由卷積層和池化層交替進行。
卷積層由多個特征圖組成,1 個特征圖對應1個卷積核,卷積核與上一層傳遞的特征矢量局部區(qū)域相連,即稀疏連接。每個卷積核作用于局部感受野,通過預設的移動步長遍歷全部感受野,以對各輸入特征完成卷積操作,提取特征并輸出至下一層。此外,各卷積核的參數(shù)在同一輸入特征圖與同一輸出特征圖之間共享。在卷積層中,每一層的輸出對應多輸入的卷積結果,其數(shù)學模型可以簡述為
式中:i與j分別為輸入和輸出特征的位置變量;l為第l層網絡;k為網絡層數(shù);運算符*表示對各層輸入變量Xl-1j與權重變量進行卷積運算,對應得到第l個輸出特征映射Xlj;Blj表示偏置項。在CNN 中,往往會在卷積層后施加非線性層,本文使用修正線性單元(rectified linear units,ReLU)作為激活函數(shù),以提高網絡稀疏性并抑制過擬合,進一步加速CNN收斂,其函數(shù)表達式為
式中:x為卷積層計算后的輸出值,即送往非線性激活層的輸入值。
池化層是上一層數(shù)據(jù)的縮放映射,將某處神經元感知域內的總體統(tǒng)計特征變量作為該神經元的輸出變量。池化層的下采樣屬性可以加快網絡計算速度,同時對過擬合有一定抑制作用。針對池化層,有N個神經元輸入就有N個神經元輸出,假設Hlj為第l層池化層的第j個神經元變量,其產生過程如下式所示(其中pooling()為某一規(guī)則下的池化函數(shù)):
實際應用中常采用最大池化算子,它給出輸入特征相鄰矩形區(qū)域內的最大值,數(shù)學表達式為
式中:qli(t)為第l層第i個特征矢量中第t個神經元的激活值;K為池化區(qū)域寬度;Pil+1(j)為第l層的qli(t)經最大池化后送往第l+1層進行下一步運算的神經元對應值。
CNN 的分類階段由2 個全連接層組成。其中第一個全連接層實現(xiàn)“展平”操作,將所有卷積池化操作后的特征矢量首尾連接,整合為一維向量;第二個全連接層的神經元數(shù)量與故障類別數(shù)目保持一致。常見的二元分類問題多利用sigmoid函數(shù)實現(xiàn)目標輸出類別,其表達式如下:
式中:θ(i)(1≤i≤K)是模型的參數(shù),得到的f[θ(i)x]即為CNN模型輸出為某一類標簽的概率。
在圖像識別領域,CNN 以二維平面為研究對象。將振動信號作為一維時間序列,設計合理的1-DCNN 結構顯然更適于提取輸入信號的特征信息。
基于1-DCNN對鋼軌波磨進行狀態(tài)識別時分為5個步驟:1)信號采集與“空間域”切割;2)振動-波磨信號非線性映射;3)樣本集建立;4)1-DCNN結構設計與訓練;5)鋼軌波磨狀態(tài)識別,識別流程如圖1所示。
2.1.1 選苗。在樹木栽培過程中,相關人員需要科學合理地選擇樹苗,做好樹苗運輸過程中的管理工作,避免樹苗遭受損害,以助于提升樹苗的整體質量,確保樹苗的成活率。此外,移植樹木時,需合理修剪樹木的根系,將根系長度控制在30~40 cm,確保樹木的扎根質量。
通過在列車軸箱處安裝加速度傳感器以獲得振動信號,圖1(a)所示為采集到的軸箱垂向振動時域信號。不同于其他機械結構信號在一定工作時間段內往往具有固定旋轉頻率,即速度為定值,軌道車輛在實際運營時速度通常表現(xiàn)為非穩(wěn)態(tài)的特征,大部分時刻速度處于震蕩變化中。若仍以常見的固定時間窗口對振動信號進行切片劃分,則在此時間窗口內列車經過鋼軌的位移大小不一,這會對后續(xù)鋼軌波磨準確定位帶來更大的難度。因此,本文提出將振動時域信號轉化到位移空間域再進行分割。
首先,對列車速度進行積分,得到圖1(b)所示的位移隨時間變化圖,將振動時域信號引入位移空間域信號。
圖1 基于1-DCNN的鋼軌波磨狀態(tài)識別流程Fig.1 Process of rail corrugation identification based on 1-DCNN
其次,設置“空間域”窗口。以長度X在位移空間域上滑動,以便定位時間,即找到長度為1*X,2*X,…,(M-1)*X和S時對應的時間T1,T2,…,TM-1,TM(其中S為總位移,M=[S/X],[]為向上取整運算符)。
再次,將由“空間域”得到的時間序列節(jié)點T1,T2,…,TM-1和TM作為切割點,對原始時域信號進行分割。圖1(c)所示為經“空間域”節(jié)點切割后的樣本時域信號。
最后,由于列車時速不斷變化,切割后的每個時域信號長度參差不齊,甚至相差幾個數(shù)量級,這會大大降低樣本數(shù)據(jù)質量,不利于深度學習網絡模型的訓練。與此同時,機械振動時域信號具有的平移特性一直是特征提取與識別分類的難點之一,在聲源識別、圖像追蹤等研究領域,信號具有的平移不變性會導致特征提取與識別分類困難,解決這類問題具有重要意義[31]。傅里葉變換將時域信號轉化到頻域后可減小平移帶來的影響,是一種簡單有效的方法。JING等[28]對比分析時域、頻域與時頻組合域3種不同數(shù)據(jù)類型下的卷積網絡表現(xiàn)性能,可知當以頻域數(shù)據(jù)為樣本集時能大幅提高測試精度。因此,對分割后的時域信號進行傅里葉變換,統(tǒng)一關注某截止頻率N以下的頻域信號,得到圖1(d)所示的頻譜,大大降低了原始時域信號伸縮、平移及扭曲帶來的變化,將其作為1-DCNN的樣本輸入進行訓練。
綜上可知,該方法自適應性地克服了列車時速不斷變化導致樣本長度不一致與CNN 要求的輸入樣本平移不變的問題,并且通過設置“空間域”窗口長度可任意調節(jié)鋼軌波磨狀態(tài)識別定位的分辨率。
有關軸承與齒輪箱等機械系統(tǒng)的故障診斷研究,學術界已制定了響應的標準參考數(shù)據(jù)集,如凱斯西儲大學(CWRU)公開的軸承振動數(shù)據(jù)、PHM 2009 challenge提供的齒輪箱數(shù)據(jù)以及國內面向全球公開發(fā)布的滾動軸承加速壽命試驗數(shù)據(jù)[32],目前世界上沒有任何一種公認的鋼軌波磨激勵下的標準振動數(shù)據(jù)集。除此之外,由于鋼軌波磨具有波浪形磨損特征,導致傳統(tǒng)的通過電火花加工技術引入指定故障缺陷再獲取對應振動信號的手段不再適用。因此,鋼軌波磨與振動信號之間的映射關系需通過其他途徑加以表征,并且1-DCNN作為有監(jiān)督模型,輸入樣本必須配對相應的標簽類型。探尋振動-波磨信號之間準確的映射關系對1-DCNN的訓練至關重要。
對同一區(qū)間位置的鋼軌使用CAT[33]采集鋼軌波磨信號,利用加速度傳感器采集相應位置處軸箱振動信號,通過數(shù)學換算便可得到兩者之間的映射關系。圖1(f)所示為時域內所得為波磨測試信號,圖1(e)所示為波磨的1/3倍頻程頻譜。對2.1節(jié)經“空間域”切割后的振動時域信號進行均方根計算便得到圖1(f)所示空間域所示波形,通過設置恰當?shù)牟ラ撝当憧傻玫秸駝?波磨信號非線性映射關系,以區(qū)分鋼軌波磨狀態(tài)。
CNN 的樣本輸入數(shù)據(jù)本質上是計算機可識別的數(shù)字矩陣。針對本文所提出的1-DCNN,樣本集為M*N的矩陣,即“空間域”劃分后的所有樣本頻域數(shù)據(jù)。深度學習中,為驗證模型的泛化能力,通常將樣本集劃分為訓練集與測試集,若樣本集中p為訓練集,則剩余(1-p)為測試集。
本文提出的1-DCNN 框架如圖1(h)所示。圖1(h)中,輸入層為樣本集矩陣;前4 層網絡結構相同,經小卷積核卷積后通過ReLU 激活函數(shù)變?yōu)?組特征圖,送往最大池化層進行降采樣;第五層為大卷積核卷積,旨在使上一層輸入特征圖自動學習面向診斷的局部特征;將最后一個池化層的所有特征圖展平形成全連接層,經抑制過擬合技術Dropout處理后,傳遞到最后的sigmoid分類層。ZHANG 等[34]通過研究發(fā)現(xiàn)當作用于振動時域信號時,第一層大卷積核有益于過濾高頻噪聲污染從而俘獲中低頻帶相關特征信息。與ZHANG等[34]研究中第一層大卷積核不同的是,本文1-DCNN模型輸入樣本為頻域數(shù)據(jù),若第一層卷積核較大,則會破壞頻域中各頻帶相干關系。前4層小卷積核結構在較少參數(shù)下加深網絡,同時抑制過擬合。第五層大卷積核增加了卷積核濾波提取的特征表達能力,這在一定程度上約束了網絡內部協(xié)變量轉移,提高了網絡的識別精度與泛化能力。
在CNN 模型中,選擇適宜的模型超參數(shù)能確保在較高識別精度前提下兼顧模型訓練速度。針對本文構建的1-DCNN模型,使用隨機搜索法尋找各超參數(shù)最佳設置,最終得到如表1所示的1-DCNN參數(shù)配置。圖2所示為表1參數(shù)配置下1-DCNN 模型結構細節(jié),其中,前4 層小卷積核大小為3*1,第五層大卷積核大小為64*1,步長均為1*1。5 層卷積池化結構中卷積核數(shù)目分別為2,2,4,4 和8,池化層卷積核大小與步長均為2*1。卷積層使用“same”零補命令,使卷積層輸入與輸出長度相等。采用“Adam”優(yōu)化器訓練網絡,學習率設為0.001,損失函數(shù)為“binary_crossentropy”。為避免梯度彌散與梯度爆炸,利用批處理樣本進行訓練,批大小為128。Dropout 與Early Stopping 技術可有效地抑制訓練過程中過擬合問題。本文Dropout 設為0.5,早停機制中patience 設為20,即當測試集精度在20 輪內不再提高時便停止訓練。由于模型具有一維特性,輸入層在3個方向上僅有長度分量,寬與深均為1。隨著卷積池化的交替進行,特征圖長度逐漸減小,深度加深,輸入信號的拓撲結構特征被網絡逐層挖掘并自我學習。
表1 1-DCNN參數(shù)配置Table 1 Default settings of 1-DCNN
圖2 1-DCNN模型結構細節(jié)Fig.2 Architecture of proposed 1-DCNN model in details
此外,本文所提出的1-DCNN模型建立在基于Python語言的Keras深度學習庫中。PC硬件配置為i7-8700處理器、16 GB內存、Windows 10系統(tǒng)。
針對鋼軌波磨狀態(tài)識別,定義正常鋼軌標簽為0,波磨鋼軌標簽為1。規(guī)定若sigmoid激活層輸出小于0.5,則判斷此樣本標簽為0,否則為1。通過上述操作,則可以對鋼軌波磨狀態(tài)進行準確識別與定位。
對國內某城市地鐵線路進行現(xiàn)場試驗,如圖3所示。使用波磨測試儀CAT 測試該線路多個區(qū)間的鋼軌不平順,利用B&K3560D 多通道數(shù)據(jù)采集系統(tǒng)獲取軸箱振動信號。需要說明的是:試驗列車車輪呈初鏇狀態(tài),使車輪不圓、磨耗及扁疤等引起車輛零部件異常振動的影響源恢復至良好,力求軸箱振動信號主要來自軌道的不平順激勵。
通過現(xiàn)場試驗獲得的振動數(shù)據(jù)經過適當劃分便可直接用于1-DCNN的訓練。如前文所述,將振動信號進行“空間域”分割,本文設置“空間域”窗口長度X為10 m,將列車經過鋼軌每10 m 時的時域信號進行切割,再對其進行傅里葉變換,關注截止頻率N為1 024 Hz以下的頻譜,再將其轉化為可供計算機識別的數(shù)字矩陣。對現(xiàn)場試驗獲取的大量振動信號與波磨信號進行統(tǒng)計分析,將波磨閾值設為35(單位為m/s2),即時域信號均方根值值小于35 m/s2時標簽為0,否則為1。從而得到兩者之間的非線性映射關系,對樣本集數(shù)據(jù)編輯標簽??傊?,以“空間域”切割后的時域信號判斷樣本集的標簽類型,其頻域信號作為1-DCNN的樣本輸入。
圖3 現(xiàn)場測試圖Fig.3 Pictures of field tests
以上述方法處理現(xiàn)場試驗數(shù)據(jù),共得到13 460條樣本及其對應的標簽,其中90%作為訓練集,10%作為測試集,表2所示為鋼軌波磨樣本集的具體描述。
表2 鋼軌波磨樣本集描述Table 2 Descriptions of rail corrugation datasets
為減少訓練過程中的隨機誤差,在相同參數(shù)配置和PC硬件條件下觀察1-DCNN模型10次試驗的性能,如圖4所示,以測試集的識別精度與每條樣本測試耗時作為評判標準以驗證模型識別精度與時效性。由圖4可看出:10 次試驗下診斷率(即精度)均不低于99%,單個測試樣本耗時均少于0.2 ms,值得注意的是,此1-DCNN模型的樣本數(shù)據(jù)均來源于現(xiàn)場實測,充分說明該1-DCNN模型在復雜現(xiàn)場運營條件和列車速度時變工況下能有效、快速且穩(wěn)定地對鋼軌波磨進行智能識別并分類。與此同時,預測鋼軌波磨發(fā)生位置與現(xiàn)場實際狀況較吻合,印證了2.1 小節(jié)所提“空間域”理論,即不僅可以對鋼軌波磨進行智能識別與分類,還可以對線路上鋼軌波磨的空間位置準確定位。
圖4 試驗結果Fig.4 Test results
統(tǒng)計10 次試驗精度變化范圍為99.03%~99.33%,平均精度為99.20%,標準差為0.1;耗時變化僅在1 ms 內輕微波動,滿足鋼軌波磨在線監(jiān)測時效性需求,因此,本文不再對其進行更深入探究。為進一步了解1-DCNN網絡性能,分別以精度最高與最低的第2次、第7次試驗為例,分析模型訓練過程中其測試精度與標準差曲線演變規(guī)律,分別如圖5和圖6所示。由圖5和圖6可知:2次試驗的精度與標準差在數(shù)值上略有差異,并且精度較高的第2次試驗標準差較小,但2次試驗的曲線總體變化趨勢相同;精度與標準差曲線在訓練過程中均有所波動,這是1-DCNN模型引入的批處理技術所致。經迭代更新后精度與標準差分別達到本輪訓練的最佳值,恰當?shù)嘏幚順颖敬笮∧茱@著增大計算效率并避免訓練誤差時而收斂、時而陷入局部最優(yōu)從而導致診斷精度劇烈波動現(xiàn)象;前5次訓練輪數(shù)中精度與標準差變化幅度較大,這是由于初始卷積核參數(shù)隨機設置,經網絡的自適應學習后卷積核參數(shù)迅速自動調節(jié)至一合理區(qū)間,后續(xù)訓練輪數(shù)不斷縮小此參數(shù)區(qū)間,精度與標準差隨之變化,但其變化速率減??;由于引入Early Sopping機制,在訓練輪數(shù)達到44次后,精度達到最高不再提高,標準差均收斂到0.06 以下。以上現(xiàn)象均符合卷積神經網絡訓練過程中的自我學習與認知規(guī)律,通過分析10 次試驗下精度最高與最低的試驗的精度與標準差曲線變化,更加論證了本文所提1-DCNN方法的魯棒特性。
圖5 精度演變曲線Fig.5 Evolutional curves of accuracy
圖6 標準差演變曲線Fig.6 Evolutional curves of standard deviation
江航等[22]在鋼軌波磨回歸診斷目標輸出為(0,1,0)時得到了(0.042 7,0.945 3,0.021 3)的實際輸出,朱崇巧[23]獲得了98%的分類識別精度,周志青等[24]獲得了94.67%的識別精度。由上述可知本文提出的基于軸箱振動信號的1-DCNN網絡可“端到端”地直接作用于現(xiàn)場實測數(shù)據(jù)并輸出識別結果,識別精度與魯棒性較高,達到了99.20%,標準差僅為0.1,綜合表現(xiàn)性能優(yōu)于文獻[22-24]中的綜合性能。以本文數(shù)據(jù)來源的某城市地鐵線路為例,使用波磨測試儀CAT 測試該線路每區(qū)間的鋼軌波磨耗時達1月,而采用本文方法所需總時間不超過3 h,其中包含振動數(shù)據(jù)的采集與模型的預測,并且可安排正常營運的列車進行在線監(jiān)測,不影響車輛的日常營運計劃。針對亟待解決的鋼軌波磨在線監(jiān)測問題,本文所提出的技術手段能極大地提高生產效率,節(jié)省大量人力物力支出,為鋼軌波磨在線監(jiān)測提供新的解決方法。雖然本文提出的方法能準確地識別鋼軌波磨在線路上出現(xiàn)的位置,但還不能識別鋼軌波磨的波長和波磨的嚴重程度,這有待于下一步研究。
1)構建的前4層小卷積核、第五層大卷積核網絡模型可不依賴于人工特征提取與專家經驗,直接作用于原始振動頻域信號,能“端到端”地對鋼軌波磨進行狀態(tài)識別。
2)該1-DCNN 具有較強的泛化能力和魯棒特性,即使在復雜的現(xiàn)場運營條件和列車速度時變工況下,仍然保持較高的鋼軌波磨識別精度,穩(wěn)定在99.20%(標準差為0.1)。對每一條樣本的識別時間均少于0.2 ms,滿足鋼軌波磨在線監(jiān)測的時效性要求。