鐘琛宜曾興玉曹星星
(1.新余市國土勘測規(guī)劃院 江西新余 338000;2.江西省測繪地理信息局機關后勤服務中心江西南昌 330209;3.南昌市測繪勘察研究院 江西南昌 330000)
近年來,我國的地鐵建設蓬勃發(fā)展,但地鐵的安全問題也隨之而來。一方面,地鐵隧道的施工會不可避免地擾動地下巖體,使其失去平衡,從而造成地面沉降,另一方面地鐵隧道的沉降也會一定程度上影響地鐵運營的安全[1]。因此,有必要對地鐵沉降進行長期連續(xù)的觀測,鑒于此,很多科研人員通過分析地鐵沉降的實測數據,并在此基礎上進行預測,以獲得地鐵隧道沉降的未來趨勢。由于地鐵的不均勻沉降是一個非線性、非平穩(wěn)的動態(tài)系統(tǒng)[2],采用傳統(tǒng)的回歸分析法、時間序列分析法進行預測都會受到極大的約束,為此一些新的方法被引進來解決這一問題,如人工神經網絡法(ANN,Artificial Neural Network)[3]。然而,傳統(tǒng)的神經網絡通常采用梯度下降法調整權值參數,存在學習速度慢、學習率難以確定及泛化能力低等缺陷[4]。針對這些問題,Huang等提出了極限學習機(ELM,Extreme Learning Machine)算法,該算法僅需一步計算即可確定網絡的輸出權值,大大提高了網絡的學習速度和泛化能力[5]。本文結合經驗風險最小化和結構風險最小化原理,進一步改進了傳統(tǒng)的ELM回歸算法,并在此基礎上提出了一種基于改進ELM回歸算法的地鐵不均勻沉降預測模型。應用實例表明,該方法效果較好。
極限學習機的網絡訓練模型采用最簡單的單隱層結構,假設輸入層、隱含層、輸出層的節(jié)點數分別為m、N、1,則極限學習機的網絡結構如圖1所示。
圖1 極限學習機網絡結構圖
對于給定的數據集T={(x1,y1),L,(x1,y1)},其中:x1?Rm,yi?R,i=1,2,L,l?;?ELM 的訓練模型為
式中:βi、ai分別為輸出層神經元和輸入層神經元與第i個隱含層節(jié)點之間的連接權值;bi為第i個隱含層節(jié)點的偏置;h(x)=[G(ai,bi,xi),L,G(aN,bN,xN)]為隱含層輸出矩陣;G為激勵函數,一般選用sigmoid函數作為激勵函數,表示為:
訓練開始時,先隨機選定初始輸入權值ai和偏置bi,且在訓練過程中ai值不再變化;輸出權值βi則可通過求解下列線性方程組得到。
采用最小二乘法求解該線性方程組,并以輸出矩陣H的Moore-Penrose廣義逆H+表示,得到輸出權值參數 β=H+·Y。
ELM算法仍是采用以訓練誤差最小為衡量標準的經驗風險最小化原理,這使得訓練過程中會發(fā)生過擬合現象,降低模型的泛化能力[6]。針對這一問題,本文提出了一種結合經驗風險最小化和結構風險最小化原理的改進ELM算法。
線性方程組(3)可轉換為
其中,αi為拉格朗日算子。由最優(yōu)化原理,即令L對β、αi、δi的偏導皆為 0,則可得線性方程組
式中:y=(y1,y2,…yN)T,Iv(1,1,…,1)T,α=(α1,α2,…,αN)T, Ω 為方陣,Ω 的各元素值為
由式(5)、(6)可以看出,改進的 ELM 回歸算法在建模過程中不再需要求解隱含層偏置值bi,提高了訓練速率;且在改進的ELM回歸算法中,綜合考慮了經驗風險和結構風險兩大因素,可一定程度上降低發(fā)生過擬合的風險。
基于改進ELM回歸算法的時間序列預測方法流程如下:
1)歸一化處理。在訓練網絡之前,需對數據進行歸一化預處理,即將數據按比例線性映射至某區(qū)間,一般采用最大最小法。
式中,xmin和xmax為數據序列中的最大、最小值;
2)確定延遲步數。為了確定最佳的網絡輸入結構,需確定延遲步數,對于時間序列(x),計算其延遲k步的自相關系數為r(k)
若 r(k)滿足
則稱該時間序列延遲k步相關性顯著,否則不顯著[7],取使 r(k)最大的 k 值作為最終的延遲步數m;
3)確定網絡結構。上一步確定了延遲步數,由此可確定網絡結構,輸入層、輸出層的節(jié)點數分別設置為m、1,隱含層節(jié)點數可設置為N=2m+1;
4)模型檢驗。訓練模型,并通過測試數據檢驗模型精度,首先計算殘差值ε(i)=xp(i)-xi(i),xp、xt分別代表預測值和測試值;再分別計算測試序列及殘差的方差,得
5)模型預測及結果分析。輸入實測數據進行預測,采用均方根誤差(RMSE)、平均相對誤差和最大相對誤差評定預測結果的精度。
為了驗證本文提出的基于改進ELM算法的預測模型,采用某地鐵隧道內一個沉降監(jiān)測點最近7年的85期連續(xù)觀測數據作為實驗數據。選取前50期數據為訓練樣本,預測后35期的沉降值,并與實測數據進行對比。針對提前量為1期的沉降值進行建模預測,即采用前幾期的沉降數據預測下一期的沉降,基本思想如圖2所示。
圖2 沉降預測的基本思想示意圖
將原始數據歸一化處理后,首先計算原始觀測序列延遲 k(k取為 3~10)步的自相關系數為 r(k),得到最佳的延遲步數為5,從而確定了圖1中的窗口寬度為5,即用前5期的數據預測第6期的沉降數據;通過反復訓練(懲罰函數ζ設置為46.03)及模型檢驗最終確定了最佳的隱含層節(jié)點數為16,由此確定了用于預測的改進ELM模型網絡結構為5×16×1。
為了驗證本文提出的預測模型的優(yōu)越性,另外采用BP和ELM進行訓練和預測,激勵函數均采用sigmoid函數,均多次訓練以獲得最佳的網絡結構,三種模型的最佳網絡結構分別為 5×25×1、5×14×1、5×16×1,預測的殘差序列如圖3所示。
由圖3的預測殘差曲線可以看到,本文提出的基于改進ELM回歸算法的預測模型得到的預測殘差基本分布-0.15~0.15mm之間,相比其余兩種模型,本算法的預測結果與原始數據最為接近。
三種模型的預測結果比較如表1所示。
圖3 沉降預測殘差對比圖
表1 三種預測模型的結果比較
由表1可以看到:
2)從預測誤差(RMSE)來看,改進的 ELM 算法相對其余兩種算法,其預測精度有了較大幅度的提升;
3)從預測結果的平均相對誤差和最大相對誤差來看,改進的ELM算法也顯示出了其優(yōu)越性。
本文提出了一種結合經驗風險最小化和結構風險最小化原理的改進ELM算法進行地鐵的不均勻沉降預測。通過應用實例的檢驗,證實了改進的ELM算法在地鐵沉降預測領域確實有很高的實用價值。