張育鋒 李圖南
(陜西省土地工程建設(shè)集團(tuán),陜西 西安710075)
城市地鐵線路總體上會(huì)穿過城市交通擁擠、人口密集、建筑物林立、地下管線復(fù)雜的路段,在施工過程中會(huì)引起周邊巖土的變形,從而給地表建筑物、地下管線的運(yùn)營(yíng)帶來安全隱患,因此地鐵建設(shè)過程中沉降監(jiān)測(cè)預(yù)報(bào)顯得尤為重要。近年來,對(duì)變形數(shù)據(jù)分析與預(yù)報(bào)方面的方法很多,有回歸分析、時(shí)間序列分析法、灰色系統(tǒng)理論、BP神經(jīng)網(wǎng)絡(luò)法、卡爾曼濾波、小波分析等[1]。由于地鐵沉降預(yù)測(cè)的復(fù)雜性,單一模型只能描述其局部的變化規(guī)律,預(yù)測(cè)精度時(shí)高時(shí)低,不穩(wěn)定。因此對(duì)單一模型進(jìn)行改進(jìn)或建立組合預(yù)測(cè)模型成為提高地鐵沉降預(yù)測(cè)精度的重要途徑,孫景領(lǐng)提出了灰色神經(jīng)網(wǎng)絡(luò)地鐵沉降組合預(yù)測(cè)模型[2];王新洲等提出基于小波變換和支持向量機(jī)的大壩變形監(jiān)測(cè)[3];潘國(guó)榮等提出小波神經(jīng)網(wǎng)絡(luò)變形監(jiān)測(cè)數(shù)據(jù)組合預(yù)測(cè)模型[4]。組合模型繼承了單一模型的優(yōu)點(diǎn),預(yù)測(cè)效果較好。
灰色預(yù)測(cè)在時(shí)間序列預(yù)測(cè)中是一種非常有效的方法,但近年來研究表明灰色模型存在一些理論缺陷,原始離散數(shù)據(jù)序列的光滑度、模型的背景值、初始值等會(huì)使預(yù)測(cè)結(jié)果會(huì)出現(xiàn)較大誤差[5]。支持向量機(jī)(SVM)是一種機(jī)器學(xué)習(xí)算法,是在統(tǒng)計(jì)學(xué)的VC維理論和結(jié)合風(fēng)險(xiǎn)最小化原理的基礎(chǔ)上形成的,具有強(qiáng)大的泛化能力,能夠很好地解決小樣本數(shù)據(jù)、非線性和局部極小點(diǎn)等問題,避免出現(xiàn)過學(xué)習(xí)這種現(xiàn)象[6]。本文將灰色預(yù)測(cè)和支持向量機(jī)相融合,通過灰色預(yù)測(cè)將沉降數(shù)據(jù)累加產(chǎn)生具有單調(diào)遞增的新序列,弱化原始數(shù)據(jù)序列中隨機(jī)因素的影響,增強(qiáng)其規(guī)律性,采用區(qū)間滾動(dòng)的方式將最新的沉降的數(shù)據(jù)作為部分輸入值,使用支持向量機(jī)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測(cè),最后對(duì)預(yù)測(cè)值累減還原,從而構(gòu)建灰色支持向量機(jī)組合預(yù)測(cè)模型。通過實(shí)際測(cè)試,取得了較好的結(jié)果。
設(shè)通過監(jiān)測(cè)得到的地鐵原始沉降時(shí)間序列X(0)={x(0)(1),x(0)(2),…,x(0)(n)} ,通過一次累 加 形 成 新 的 1-AGO 序 X(1)={x(1)(1),x(1)(2),…,x(1)(n)} ,其 中 x(1)(k)=
對(duì)X(1)建立一階灰色模型微分方程:
其中,a為系統(tǒng)發(fā)展灰數(shù),b為系統(tǒng)內(nèi)生控制變量。對(duì)式(1-1)離散化處理,得到:
Y=BP
根據(jù)最小二乘法可得:
解微分方程建立預(yù)測(cè)公式:
累減還原的預(yù)測(cè)值為:
支持向量機(jī)回歸的目的是通過訓(xùn)練樣本,找出相對(duì)穩(wěn)定的函數(shù)逼近樣本集輸入與輸出之間的關(guān)系,并且對(duì)新的輸入也能給出準(zhǔn)確的輸出。支持向量機(jī)回歸分析分為線性回歸和非線性回歸,通常樣本呈非線性情況,隨著Vapnik的ε不敏感損失函數(shù)的引入,它已經(jīng)成功擴(kuò)展為解決非線性回歸估計(jì)問題,展現(xiàn)了極好的學(xué)習(xí)推廣性。對(duì)于非線性情況,SVM 模型可以有效地實(shí)現(xiàn)對(duì)基于小樣本的高維非線性系統(tǒng)精確擬合,并且采用結(jié)構(gòu)風(fēng)險(xiǎn)最小原則,具有很好的泛化性。已知一組訓(xùn)練數(shù)據(jù)集 (xi,yi) ,xi∈Rn,yi∈R,i=1,2,…,m,利用非線性映射φ把數(shù)據(jù)集從輸入空間映射到高維特征空間,以使輸入空間中的非線性擬合問題變成高維特征空間中的線性擬合問題。高維特征空間的線性回歸函數(shù)為:
其中,w和b為權(quán)值系數(shù)和偏差,φ(x)為特征特征空間。根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,f(x) 等價(jià)于求下面的最優(yōu)化問題:
為了尋找w和b,這里需要引入松弛變量ξi,ξi*求解,(2-2)式就變等價(jià)于求解下面的優(yōu)化問題:
約束條件為:
式(2-2)中,m是訓(xùn)練樣本,ε是不敏感系數(shù)常量。上面的約束優(yōu)化問題是一個(gè)典型的二次規(guī)劃問題,上述問題可用拉格朗日乘子法求解,得到原問題的對(duì)偶問題,該二次規(guī)劃問題對(duì)偶問題為
約束條件為
通過二次優(yōu)化方法控制參數(shù)C和ε就可以控制SVM的泛化性,式(2-6)中αi*和αi是拉格朗日乘子,(αi*-αi) 非零值對(duì)應(yīng)的數(shù)據(jù)就是支持向量。根據(jù)Mercer定理,引入核函數(shù)K解算得到支持向量機(jī)回歸方程的估計(jì)式為
支持向量機(jī)的特點(diǎn)在于不直接計(jì)算復(fù)雜的非線性變換,而是計(jì)算非線性變換的點(diǎn)積,即核函數(shù),采用的不用的核函數(shù)可以構(gòu)造實(shí)現(xiàn)輸入空間中不同的非線性回歸學(xué)習(xí)方法。SVM目前常用的核函數(shù)主要有多項(xiàng)式核函數(shù)、徑向基函數(shù)(RBF)和Sigmoid核函數(shù)等[7]。圖1顯示了支持向量機(jī)結(jié)構(gòu)示意圖。
考慮到地鐵沉降數(shù)據(jù)是一維時(shí)間序列,同時(shí)SVM多輸入單輸出結(jié)構(gòu)和不具備根據(jù)實(shí)際情況動(dòng)態(tài)調(diào)整預(yù)測(cè)值的能力,對(duì)原始數(shù)據(jù)序列可以采用區(qū)間滾動(dòng)預(yù)測(cè)的方法將其轉(zhuǎn)換成多維時(shí)間序列,即從左向右移動(dòng)該區(qū)間,區(qū)間內(nèi)最左的數(shù)據(jù)從定長(zhǎng)區(qū)間移動(dòng)出去,則從區(qū)間右側(cè)相應(yīng)地會(huì)有新數(shù)據(jù)加入,使得區(qū)間內(nèi)的數(shù)據(jù)始終保持在p個(gè)。具體做法:設(shè)有時(shí)間序列 {x(1),x(2),…,x(n)},取i(i<n)個(gè)作為支持向量機(jī)的訓(xùn)練樣本,(n-i)個(gè)樣本作為測(cè)試集,將輸出值反饋到輸入端作為下一次輸入值的一部分。圖2采用區(qū)間滾動(dòng)構(gòu)成支持向量機(jī)的訓(xùn)練樣本集的輸出與輸入。
其中,p是步長(zhǎng)。由于不同的時(shí)間序列前后數(shù)據(jù)關(guān)聯(lián)程度很不同,選取不同的數(shù)據(jù)長(zhǎng)度其預(yù)測(cè)結(jié)果也大不相同,將最小平方誤差步長(zhǎng)為p的xi-p,xi-p+1,…,xi-1作為支持向量機(jī)的輸入數(shù)據(jù),xi作為預(yù)測(cè)輸出量。
利用灰色生成弱化原始數(shù)據(jù)序列隨機(jī)性,增強(qiáng)其規(guī)律性的特性,然后利用支持向量機(jī)擬合非線性數(shù)據(jù)能力的優(yōu)勢(shì)對(duì)新序列建立預(yù)測(cè)模型,最后將預(yù)測(cè)結(jié)果進(jìn)行累減還原得預(yù)測(cè)值。具體的建模步驟如下:
(1)對(duì)原始沉降數(shù)據(jù)進(jìn)行一次累加生成新的序列,由于新生成的序列最大值最小值之間差異較大,因此對(duì)樣本進(jìn)行了歸一化處理,將大小控制在[0,1]之間。
(2)滾動(dòng)預(yù)測(cè)
將處理后的地鐵沉降樣本數(shù)據(jù)分為兩部分:訓(xùn)練集和測(cè)試集,訓(xùn)練集用來訓(xùn)練數(shù)據(jù)從而得到最優(yōu)模型,選定最佳模型后對(duì)測(cè)試集進(jìn)行預(yù)測(cè)。采用滾動(dòng)預(yù)測(cè)的方式對(duì)數(shù)據(jù)進(jìn)行處理確定訓(xùn)練集和測(cè)試集的輸入量和輸出量。
(3)參數(shù)的確定
目前,參數(shù)的選擇沒有統(tǒng)一的理論指導(dǎo)[8]。本文采用最常用的ε-不敏感損失函數(shù)作為損失函數(shù),選擇徑向基函數(shù)(RBF)為模型核函數(shù),ε通過控制回歸逼近誤差管道的大小,從而達(dá)到控制支持向量的個(gè)數(shù)和泛化能力。對(duì)于一個(gè)基于RBF為核函數(shù)的支持向量機(jī)而言,其性能由C(懲罰參數(shù))和g(RBF核參數(shù))決定,懲罰因子C用于控制模型復(fù)雜度和逼近誤差的折中;核參數(shù)g決定了映射函數(shù)和樣本特征子空間分布的復(fù)雜程度,C和g取值不當(dāng)都會(huì)影響SVM的學(xué)習(xí)效果。本文利用網(wǎng)格參數(shù)尋優(yōu)找到最佳參數(shù)C和g,即讓C和g在一定的范圍內(nèi)取值,為了避免“過學(xué)習(xí)”和“欠學(xué)習(xí)”的現(xiàn)象,將訓(xùn)練集利用K-折交叉驗(yàn)證法[9]訓(xùn)練,取交叉檢驗(yàn)下平均分類均方根誤差最小的那組C和g的值
(4)累減還原
訓(xùn)練樣本集經(jīng)過訓(xùn)練得到最優(yōu)回歸模型,將測(cè)試集代入到模型中得到預(yù)測(cè)值,對(duì)預(yù)測(cè)值反歸一化處理,生成的新序列累減還原就得到了原始地鐵沉降數(shù)據(jù)的預(yù)測(cè)值。
(5)為了方便評(píng)價(jià)預(yù)測(cè)模型的準(zhǔn)確度,本文選用平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MRE)和均方根誤差 (RMSE)作為評(píng)價(jià)指標(biāo)。
根據(jù)文獻(xiàn)[10]某點(diǎn)實(shí)測(cè)地鐵隧道施工累積沉降數(shù)據(jù)建立灰色支持向量機(jī)滾動(dòng)預(yù)測(cè)模型。本文采用 Matlab編程調(diào)用LIBSVM工具箱[11]實(shí)現(xiàn)組合模型。將2009/4/13~2009/5/24這42期作為樣本數(shù)據(jù),用前31期的數(shù)據(jù)作為訓(xùn)練集,后11期作為測(cè)試集并將其預(yù)測(cè)結(jié)果與實(shí)際值進(jìn)行比較。經(jīng)過網(wǎng)格參數(shù)尋優(yōu)得到灰色支持向量機(jī)主要參數(shù)值如下:取滾動(dòng)預(yù)測(cè)的數(shù)據(jù)步長(zhǎng)為6,K=3,C=128,g=0.0313。圖1顯示了網(wǎng)格參數(shù)尋優(yōu)的三維視圖,其中l(wèi)og2c?。?1,7],log2g?。?8,0],MSE表示的是K=3折交叉驗(yàn)證法平均分類均方根誤差。
現(xiàn)分別用灰色預(yù)測(cè)模型、支持向量機(jī)、灰色支持向量機(jī)對(duì)后11期進(jìn)行預(yù)測(cè)并對(duì)三種預(yù)測(cè)模型精度進(jìn)行比較,結(jié)果如表1所示。
表1 2009/5/14-2009/5/24地鐵沉降預(yù)測(cè)值及精度比較
從表1可以灰色模型的精度最低,支持向量機(jī)預(yù)測(cè)精度明顯優(yōu)于前者這也體現(xiàn)了機(jī)器學(xué)習(xí)方法泛化性好的優(yōu)點(diǎn),組合模型的預(yù)測(cè)精度最高,這主要是因?yàn)榛疑A(yù)測(cè)模型獨(dú)特的數(shù)據(jù)生成方式增強(qiáng)了數(shù)據(jù)的規(guī)律性,加上支持向量機(jī)良好的泛化性從而提高了預(yù)測(cè)精度。是灰色模型、SVM模型和灰色SVM組合模型預(yù)測(cè)值和實(shí)測(cè)值比較曲線(如圖4所示)。
支持向量機(jī)作為一種機(jī)器學(xué)習(xí)方法,具有強(qiáng)大的非線性逼近能力,相對(duì)人工神經(jīng)網(wǎng)路而言SVM能夠很好地解決小樣本數(shù)據(jù)、非線性和局部極小點(diǎn)等問題,避免出現(xiàn)過學(xué)習(xí)這種現(xiàn)象?;疑A(yù)測(cè)模型獨(dú)特的數(shù)據(jù)生成方式可以削弱數(shù)據(jù)序列的趨勢(shì)性,增強(qiáng)數(shù)據(jù)的規(guī)律性。本文將二者結(jié)合起來,充分利用兩者的優(yōu)勢(shì)對(duì)地鐵沉降數(shù)據(jù)進(jìn)行預(yù)測(cè),取得了較好的預(yù)測(cè)效果,可以將此方法借鑒到建筑物、大壩等工程項(xiàng)目中,具有一定的實(shí)用價(jià)值。