姚逸行 劉建國
(1.同濟大學道路與交通工程教育部重點實驗室 上海 201804;2.同濟大學上海市軌道交通結構耐久與系統(tǒng)安全重點實驗室 上海 201804)
隨著我國鐵路交通網(wǎng)的迅速發(fā)展,鄰近鐵路工程施工愈加頻繁。為了控制線路變形,保障線路運營安全,這就要求鄰近鐵路工程在進行合理化設計與施工的同時[1],加強對軌道結構變形的實時監(jiān)測。而影響監(jiān)測精度的重要干擾因素之一就是由溫度帶來的軌道結構變形。楊震等[2]通過分析合武客專無砟軌道曲線段不平順譜,發(fā)現(xiàn)無論是軌向還是高低,8月份的譜線位置都明顯高于其他月份的譜線,說明溫度力對無縫線路變形影響顯著。楊冠嶺[3]利用ANAYS軟件建立了有砟軌道無縫線路力學模型,考慮軌道橫豎向初始不平順矢度、橫豎向初始不平順波長、曲線半徑、曲線線型、軌枕豎向位移,道床參數(shù)等因素,分析了在溫度力作用下軌道位移變化規(guī)律,較其實測數(shù)據(jù)結果較為保守。對于無砟線路,文獻[4-5]通過光纖光柵等位移傳感器監(jiān)測了橋隧過渡段的鋼軌橫向位移,其隨著日溫波動呈現(xiàn)周期性的變化,變化幅度在0.3 mm左右。
事實上,由于實際的軌道結構力學性質(zhì)復雜,其變形情況與溫度分布場之間并非是簡單線性的映射關系,其變化規(guī)律難以通過傳統(tǒng)的統(tǒng)計學方法包括線性回歸、自回歸移動平均值等進行準確描述。因此,在實際監(jiān)測工作時無法針對現(xiàn)場情況對溫度帶來的結構變形進行實時預測,從而抵消溫度帶來的數(shù)據(jù)誤差。從監(jiān)測數(shù)據(jù)中實時提取軌道結構溫度變形的變化特點,從而做出滿足一定精度要求的預測,進而消除溫度帶來的軌道結構變形對鄰近鐵路工程軌道結構變形監(jiān)測的干擾,還原由鄰近鐵路工程引起的真實軌道結構變形,是亟待解決的問題。
軌道結構溫度變形實時預測可以視為一個非線性不穩(wěn)定的時間序列問題。近年來,隨著專家學者對機器學習算法的深入研究,基于大數(shù)據(jù)的人工智能神經(jīng)網(wǎng)絡算法逐漸發(fā)展成熟,包括模糊推理系統(tǒng)(fuzzy inference system,F(xiàn)IS)、人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)和支持向量機(support vector machine,SVM)等,其中的循環(huán)神經(jīng)網(wǎng)絡[6](recurrent neural network,RNN)在非線性擬合方面有著良好的表現(xiàn),在手寫識別[7]、機器翻譯[8]、文本分類[9-10]以及醫(yī)學診斷[11]等方面都有廣泛的應用。由于在處理復雜預測問題上表現(xiàn)突出,并逐漸應用于工程領域,如王增平等[12]針對短期電力負荷數(shù)據(jù)時序性特點,將GRU神經(jīng)網(wǎng)絡與DNN神經(jīng)網(wǎng)絡結合,提出了GRU-NN模型用于預測中國某地區(qū)的短期電力負荷,在兼顧時效性的同時預測精度達到97.12%。
長短期記憶網(wǎng)絡(long short-term memory,LSTM)是在RNN基礎上,為了解決時間序列學習的長期依賴問題而改進的一種特殊循環(huán)神經(jīng)網(wǎng)絡。本文提出了一種基于LSTM循環(huán)神經(jīng)網(wǎng)絡的軌道結構溫度變形預測方法,以某盾構下穿既有車站工程軌道結構橫向變形監(jiān)測數(shù)據(jù)為算例,并將該方法與多層感知機(multi-layer perceptron,MLP)進行對比。實驗證明,與MLP相比,本文提出的預測方法預測精度更高,能夠滿足一般監(jiān)測工作的實際需要。
循環(huán)神經(jīng)網(wǎng)絡(RNN)由于引入了循環(huán)單元結構,能夠在學習中保留過去信息,適合處理時間序列預測問題,但其存在的長期依賴問題,即在反向傳播算法中會出現(xiàn)梯度消失與梯度爆炸的現(xiàn)象,會導致循環(huán)神經(jīng)網(wǎng)絡無法掌握長時間跨度的非線性關系。
為了解決RNN的梯度消失問題,LSTM循環(huán)神經(jīng)網(wǎng)絡定義了一個新的循環(huán)單元結構,其狀態(tài)由稱為遺忘門、輸入門以及輸出門決定。遺忘門決定對前一時刻的狀態(tài)信息的保留程度;輸入門會根據(jù)當前時刻的輸入信息以及單元狀態(tài)決定信息更新程度;輸出門則負責從當前時刻的單元結構中輸出具體記憶。每個門都是一個單層神經(jīng)網(wǎng)絡,其參數(shù)通過模型訓練學習確定,這些參數(shù)表示了遺忘、輸入或輸出的執(zhí)行程度。
假設xi為輸入,LSTM循環(huán)神經(jīng)網(wǎng)絡隱藏層的單元結構可以用以下公式表示:
式中,ft、it、t、ct、ot、ht分別代表遺忘門、輸入門、候選狀態(tài)、單元狀態(tài)、輸出門以及最終單元輸出;Wf、Uf、bf、Wi、Ui、bi、Wc、Uc、bc、Wo、Uo、bo為訓練參數(shù)矩陣;⊙表示哈達瑪積。
之所以LSTM循環(huán)神經(jīng)網(wǎng)絡能夠避免梯度消失及梯度爆炸的問題,就在于其單元狀態(tài)ct的更新只涉及加法運算,而非像RNN中使用sigmoid等激活函數(shù)進行變換運算。從而在反向傳播過程中,對于每一步運算只會有恒定的誤差被傳播回去。因此,LSTM循環(huán)神經(jīng)網(wǎng)絡能夠更好地學習數(shù)據(jù)中的長期依賴關系以進行預測。
基于LSTM循環(huán)神經(jīng)網(wǎng)絡的軌道結構溫度變形預測算法流程如圖1所示,具體步驟如下:
利用循環(huán)的冷卻水作為加濕的水源,避免濕式冷凝器直接排放冷卻水所帶來的水資源浪費,省去風冷式冷凝器中的軸流風機所帶來的電能消耗,節(jié)約能源的同時沒有增加成本。建議在空調(diào)內(nèi)安裝制冷劑回收箱體對多余的制冷劑進行回收,將回收的制冷劑充入前進風格柵對室內(nèi)空氣進行預降溫,減小制冷劑蒸發(fā)溫度與被冷卻空氣溫度的差值,增大制冷效率,減少制冷劑的使用量,減少制冷劑的排放。
圖1 算法流程
(1)劃分數(shù)據(jù)集。記軌道結構第n個測點t時刻氣溫監(jiān)測值為,溫度變形監(jiān)測值為,則T時刻的模型輸入矩陣為。模型訓練數(shù)據(jù)集為:
(2)數(shù)據(jù)歸一化。為了避免神經(jīng)網(wǎng)絡運算求解時帶來的數(shù)值問題,滿足求解需要,對數(shù)據(jù)進行歸一化處理。公式如下:
溫度變形監(jiān)測值按上述公式類似處理。
(3)模型預測。將經(jīng)過歸一化處理的訓練數(shù)據(jù)集O作為模型輸入,根據(jù)模型輸出結果按照損失函數(shù)計算誤差梯度,并利用Adam優(yōu)化算法對預測模型中各個神經(jīng)單元的狀態(tài)進行更新,以上過程記作一次訓練。在模型學習到設定的訓練次數(shù)(epoch)后,得到預測模型參數(shù)。
(4)模型輸出及數(shù)據(jù)還原。將測試數(shù)據(jù)集P作為輸入,根據(jù)預測模型參數(shù)求解預測結果,并對其進行反歸一化處理,得到軌道結構溫度變形預測值。
本文建立的LSTM循環(huán)神經(jīng)網(wǎng)絡包含一個隱藏層,其層數(shù)為50。一次訓練的樣本個數(shù)(batch_size)設置為72,窗口長度(look_back)設置為12,激活函數(shù)選用‘tanh’與‘hard_sigmoid’。在模型訓練參數(shù)的迭代更新方面,采用Adam(adaptive moment estimation)優(yōu)化算法代替?zhèn)鹘y(tǒng)的隨機梯度下降算法,最終使模型的損失函數(shù)輸出值降到最小,完成訓練。同時,為了保證模型輸出結果在維度上與實際監(jiān)測值一致,在LSTM循環(huán)神經(jīng)網(wǎng)絡之后需要再添加一個1維的全連接層。
其中,損失函數(shù)采用平均絕對誤差(Mean Absolute Error),即:
式中,M為訓練集樣本個數(shù);為軌道結構第n個測點t時刻溫度變形實際監(jiān)測值;為對應的模型預測值。
本文采用了某地鐵盾構下穿既有車站工程的軌道結構變形監(jiān)測數(shù)據(jù)集。該工程下穿了車站中普速鐵路與客運專線兩條鐵路。其中,該普速鐵路為電氣化鐵路,有砟道床,混凝土軌枕,普通客運、貨運段鐵路,最高速度160 km/h。監(jiān)測儀器采用徠卡TM30型全站儀,該型儀器角度監(jiān)測精度為0.5″,距離監(jiān)測精度為0.2 mm+0.4 ppm。該監(jiān)測數(shù)據(jù)集包括了2018年7月14日至2018年8月17日10道共120個測點的軌道橫豎向變形數(shù)據(jù)以及氣溫數(shù)據(jù),采集間隔2 h,共m=412組數(shù)據(jù)。
針對軌道結構溫度變形的預測目標,訓練樣本中的軌道變形監(jiān)測數(shù)據(jù)應盡可能排除溫度影響以外的干擾因素。同時考慮到監(jiān)測設備精度,最終選取遠離下穿中心點且溫度變形幅值較大的普速鐵路8~10道兩側共6組軌道橫向變形監(jiān)測數(shù)據(jù)以及相應的氣溫監(jiān)測數(shù)據(jù)作為實驗樣本。實驗樣本劃分比例取0.8,即s=0.8 m(其中訓練數(shù)據(jù)集的后25%數(shù)據(jù)作為驗證集)。
為了進一步降低監(jiān)測數(shù)據(jù)的噪點影響,先將實驗樣本數(shù)據(jù)進行適當平滑處理,以8道96號測點為例,樣本數(shù)據(jù)平滑處理結果如圖2所示。之后將樣本數(shù)據(jù)歸一化至(-1,1)之間。最后將歸一化后的數(shù)據(jù)組成模型輸入矩陣。
圖2 監(jiān)測數(shù)據(jù)平滑處理結果
平均絕對誤差(MAE)能夠反映預測結果與實際值之間的絕對誤差,均方根誤差(RMSE)對預測結果中的誤差極值反應更為敏感,而相關系數(shù)(CORR)則描述了預測結果與實際值間的相關程度。本文選取上述三項指標作為評價預測結果的精度標準,其表達式如下:
將預處理后的訓練數(shù)據(jù)集輸入模型進行訓練,以8道96號測點為例,其模型訓練次數(shù)(epoch)與損失函數(shù)輸出值()的關系如圖3所示。
圖3 模型訓練次數(shù)與損失函數(shù)值關系曲線
可以看出,無論是訓練數(shù)據(jù)集還是測試數(shù)據(jù)集,預測模型在經(jīng)過350次訓練后,已經(jīng)得到充分訓練且損失函數(shù)輸出值衰減趨于穩(wěn)定,而訓練次數(shù)過大或者過小會使模型產(chǎn)生過擬合或欠擬合的情況,影響預測精度的同時可能還會增加運算時長。因此,將350次作為該測點模型的終止訓練條件。
同時,本文選擇多層感知機模型(MLP)與模型預測結果進行對比用以評判算法性能優(yōu)劣。為了保證科學性與有效性,兩種方法的實驗樣本及劃分比例均保持一致。
圖4為8道96號測點兩類模型預測結果對比圖。可以看到,兩類模型都能在一定程度上捕捉到軌道結構橫向變形隨日溫變化的周期性變化趨勢,但在軌道結構變形幅度的學習尤其是數(shù)據(jù)峰谷值特征的提取上,基于LSTM的軌道結構溫度變形預測模型效果明顯更好。
圖4 8道96號測點預測結果對比
兩種模型各測點的預測結果評價見表1。
表1 兩種模型預測結果評價
可以看出,本文提出的基于LSTM的軌道結構溫度變形預測模型相比于多層感知機模型(MLP),在整體預測精度上表現(xiàn)地更好。在相關系數(shù)(CORR)、均方根誤差(RMSE)以及平均絕對誤差(MAE)三項指標上其均值分別提高了0.36,降低了0.34以及0.29。
本文提出了一種基于LSTM循環(huán)神經(jīng)網(wǎng)絡模型的軌道結構溫度變形預測方法,通過將往期氣溫及軌道結構變形監(jiān)測數(shù)據(jù)作為學習樣本,利用訓練后的預測模型以及當前氣溫監(jiān)測值對軌道結構溫度變形作出實時預測。主要結論如下:
(1)依據(jù)某地鐵盾構下穿既有車站工程的監(jiān)測數(shù)據(jù),對軌道結構溫度變形作出預測,并將預測結果與多層感知機(MLP)進行對比,結果表明本文提出的預測方法可以獲得更高的預測精度,其預測精度在0.2 mm以下。
(2)未來可以在學習樣本中增加對軌道結構溫度變形相關的影響因素如軌溫等監(jiān)測數(shù)據(jù),進一步提高預測精度,使其適用于監(jiān)測等級更高的高速鐵路監(jiān)測數(shù)據(jù)降噪當中。