陳永紅,甘文娟,孟 雪,韓 靜
(長(zhǎng)安大學(xué) 信息工程學(xué)院,陜西 西安 710064)
隨著現(xiàn)代化的飛速發(fā)展,結(jié)構(gòu)工程建設(shè)的腳步不斷加快。工程建設(shè)進(jìn)程中結(jié)構(gòu)受多種主客觀因素影響而不可避免發(fā)生形變,嚴(yán)重形變量所引發(fā)的重大災(zāi)害給人民生命和財(cái)產(chǎn)安全帶來了巨大損失。因此,對(duì)結(jié)構(gòu)工程的施工和運(yùn)營(yíng)階段提出了更嚴(yán)格的安全性要求,并且對(duì)結(jié)構(gòu)變形進(jìn)行自動(dòng)監(jiān)測(cè)也至關(guān)重要。采用科學(xué)完備的預(yù)測(cè)模型對(duì)結(jié)構(gòu)沉降監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),可以指導(dǎo)有關(guān)部門及時(shí)采取有效的預(yù)防措施,提高工程建設(shè)的效率,保障施工建設(shè)的安全。當(dāng)前,為了對(duì)結(jié)構(gòu)沉降進(jìn)行客觀準(zhǔn)確實(shí)時(shí)的預(yù)測(cè),預(yù)測(cè)精度和訓(xùn)練速度已成為結(jié)構(gòu)沉降變形預(yù)測(cè)關(guān)注的重點(diǎn)。
常用的結(jié)構(gòu)變形預(yù)測(cè)模型主要有回歸分析預(yù)測(cè)模型、灰色理論預(yù)測(cè)模型、時(shí)間序列分析預(yù)測(cè)模型和人工智能預(yù)測(cè)模型等。回歸分析預(yù)測(cè)模型通過分析大量變形數(shù)據(jù)與影響變形因素之間的數(shù)學(xué)關(guān)系,建立回歸方程進(jìn)行模型預(yù)測(cè)[1]。其要求進(jìn)行分析的數(shù)據(jù)具有較好的分布規(guī)律。該預(yù)測(cè)模型的精度由影響結(jié)構(gòu)變形的因素決定。為達(dá)到簡(jiǎn)化預(yù)測(cè)模型的目的,通常采用線性回歸模型進(jìn)行結(jié)構(gòu)變形預(yù)測(cè),而實(shí)際的變形監(jiān)測(cè)變量之間都是相互關(guān)聯(lián)的,因此該模型在結(jié)構(gòu)沉降預(yù)測(cè)方面具有一定的局限性。灰色系統(tǒng)理論最早由鄧聚龍教授提出[2],用于研究小樣本數(shù)據(jù)、貧信息等問題。灰色系統(tǒng)理論的重要部分是灰色預(yù)測(cè),其中GM(1,1)是廣
泛應(yīng)用的預(yù)測(cè)模型[3]?;疑A(yù)測(cè)模型對(duì)數(shù)據(jù)的波動(dòng)變化不敏感,而對(duì)數(shù)據(jù)的光滑度要求較高?;疑治鲆髷?shù)據(jù)包含完整變化趨勢(shì),防止當(dāng)數(shù)據(jù)序列較大且快速變化時(shí)模型預(yù)測(cè)誤差增大預(yù)測(cè)精度降低而導(dǎo)致模型預(yù)測(cè)失效。以上問題限制了灰色系統(tǒng)理論在實(shí)際預(yù)測(cè)中的應(yīng)用。時(shí)間序列法是一種數(shù)理統(tǒng)計(jì)學(xué)的動(dòng)態(tài)數(shù)據(jù)處理法。AR自回歸模型、MA移動(dòng)平均模型、ARMA自回歸移動(dòng)平均模型[4-5]、ARIMA自回歸求和移動(dòng)平均模型[6]都是應(yīng)用廣泛的時(shí)間序列分析模型。時(shí)間序列的研究依賴于數(shù)據(jù)隨時(shí)間變化的規(guī)律,其最突出的優(yōu)點(diǎn)是可以找到歷史數(shù)據(jù)在時(shí)間變化范圍內(nèi)的規(guī)律,實(shí)現(xiàn)對(duì)未來數(shù)據(jù)的預(yù)測(cè)。時(shí)間序列的預(yù)測(cè)結(jié)合了影響結(jié)構(gòu)沉降的外部因素,但由于預(yù)測(cè)中的參數(shù)不能實(shí)現(xiàn)動(dòng)態(tài)變化,使模型對(duì)于快速變化的數(shù)據(jù)預(yù)測(cè)精度較差。時(shí)間序列模型進(jìn)行預(yù)測(cè)的前提是數(shù)據(jù)滿足線性關(guān)系,而實(shí)際的結(jié)構(gòu)變形數(shù)據(jù)是含趨勢(shì)項(xiàng)和隨機(jī)部分的非線性數(shù)據(jù)。因此時(shí)間序列法應(yīng)用于結(jié)構(gòu)沉降預(yù)測(cè)的發(fā)展不是很理想。
近些年,隨著人工智能的蓬勃發(fā)展及大數(shù)據(jù)時(shí)代的出現(xiàn)使得應(yīng)用人工智能預(yù)測(cè)方法解決結(jié)構(gòu)變形預(yù)測(cè)問題成為熱點(diǎn)。目前神經(jīng)網(wǎng)絡(luò)法[7]、支持向量機(jī)[8]等都是應(yīng)用廣泛的人工智能預(yù)測(cè)[7-12]方法。神經(jīng)網(wǎng)絡(luò)模型對(duì)非線性數(shù)據(jù)、非確定性系統(tǒng)具有良好的描述特性和抗干擾能力,是一種有效的結(jié)構(gòu)沉降預(yù)測(cè)算法。但是該模型參數(shù)設(shè)置缺乏理論支撐,易出現(xiàn)收斂速度慢、局部最優(yōu)等問題。支持向量機(jī)預(yù)測(cè)模型對(duì)于小樣本、非線性和局部極小點(diǎn)等問題具有良好的解決能力,但對(duì)于突變數(shù)據(jù)的處理存在預(yù)測(cè)失效的可能。最初針對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的研究大部分采用淺層結(jié)構(gòu),然而隨著人們對(duì)結(jié)構(gòu)沉降預(yù)測(cè)精度要求的不斷提高,淺層神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度已不能滿足實(shí)際需求,深度學(xué)習(xí)被提出。近些年來,隨著機(jī)器學(xué)習(xí)研究熱潮的出現(xiàn),深度學(xué)習(xí)逐漸應(yīng)用于結(jié)構(gòu)沉降變形預(yù)測(cè)。深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)質(zhì)是多層神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)能力和模型泛化性均良好,適合處理大規(guī)模數(shù)據(jù)。目前應(yīng)用深度學(xué)習(xí)的結(jié)構(gòu)沉降預(yù)測(cè)模型[13-15]已非常強(qiáng)大,但是仍然存在一些亟待解決的問題。為解決深度學(xué)習(xí)網(wǎng)絡(luò)模型結(jié)構(gòu)復(fù)雜、訓(xùn)練耗時(shí)等問題,寬度學(xué)習(xí)系統(tǒng)應(yīng)運(yùn)而生。寬度學(xué)習(xí)的提出旨在為深度學(xué)習(xí)提供一種替代方法。寬度學(xué)習(xí)是一種新的機(jī)器學(xué)習(xí)算法,和深度學(xué)習(xí)算法相比,具有模型結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快、實(shí)時(shí)性高的優(yōu)勢(shì)。寬度學(xué)習(xí)系統(tǒng)通過對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練,構(gòu)建預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)結(jié)構(gòu)沉降監(jiān)測(cè)數(shù)據(jù)的預(yù)測(cè)。與現(xiàn)有預(yù)測(cè)模型相比,寬度學(xué)習(xí)預(yù)測(cè)算法具有更快的訓(xùn)練速度和更高的預(yù)測(cè)精度。
寬度學(xué)習(xí)系統(tǒng)(board learning system,BLS)[16]是基于隨機(jī)向量函數(shù)鏈接神經(jīng)網(wǎng)絡(luò)(random vector functional-link neural network,RVFLNN)[17-18]提出的一種新的學(xué)習(xí)算法。RVFLNN是一種淺層神經(jīng)網(wǎng)絡(luò),基本思想是初始數(shù)據(jù)和其經(jīng)過簡(jiǎn)單映射后的結(jié)果共同構(gòu)成模型輸入訓(xùn)練得到輸出。寬度學(xué)習(xí)系統(tǒng)結(jié)構(gòu)如圖1所示。該模型的本質(zhì)是一個(gè)單層網(wǎng)絡(luò),其通常由輸入層、隱藏層和輸出層組成,隱藏層由映射特征節(jié)點(diǎn)層和增強(qiáng)節(jié)點(diǎn)層構(gòu)成。首先,初始數(shù)據(jù)經(jīng)過線性特征映射函數(shù)連接輸入權(quán)值矩陣變換得到映射特征組,輸入權(quán)值通過稀疏自編碼器產(chǎn)生。然后映射特征組經(jīng)過線性映射和非線性激活函數(shù)連接權(quán)值矩陣得到增強(qiáng)節(jié)點(diǎn)。最后增強(qiáng)節(jié)點(diǎn)和映射特征節(jié)點(diǎn)共同連接輸出權(quán)值矩陣得到系統(tǒng)輸出,輸出層權(quán)重通過嶺回歸近似廣義逆計(jì)算得到。
(1)映射特征組。
圖1 典型寬度學(xué)習(xí)系統(tǒng)結(jié)構(gòu)示意圖
X∈Ra×b表示模型訓(xùn)練的輸入數(shù)據(jù),其數(shù)量為a,維數(shù)為b,Y∈Ra×c表示模型訓(xùn)練輸出a個(gè)c維的數(shù)據(jù),φi(·)表示特征映射函數(shù),第i組特征映射用Zi表示,所有的特征映射組用Zn表示。
(1)
其中,Wei表示第i組由稀疏自編碼得到的最優(yōu)輸入連接權(quán)值矩陣,βei表示從輸入層到映射特征節(jié)點(diǎn)層的與Wei相對(duì)應(yīng)的偏置矩陣。權(quán)重Wei的維數(shù)決定了映射特征組Zi中的節(jié)點(diǎn)數(shù)。
(2)增強(qiáng)節(jié)點(diǎn)組。
增強(qiáng)節(jié)點(diǎn)組由映射特征組經(jīng)過函數(shù)映射變換得到,第j組增強(qiáng)節(jié)點(diǎn)組用Hj表示,所有的增強(qiáng)節(jié)點(diǎn)組用Hd表示:
(2)
其中,ξj表示非線性激活函數(shù),Whj表示第j組映射特征節(jié)點(diǎn)到增強(qiáng)節(jié)點(diǎn)層的隨機(jī)連接權(quán)值矩陣,βhj表示第j組偏置矩陣,增強(qiáng)特征組的個(gè)數(shù)為d。
(3)結(jié)果輸出。
增強(qiáng)特征節(jié)點(diǎn)和映射特征節(jié)點(diǎn)共同作為系統(tǒng)輸入,則寬度學(xué)習(xí)系統(tǒng)的輸出為Y:
Y=[Zn|Hd]Wm=
[Z1,Z2,…,Zn|H1,H2,…,Hd]Wm
(3)
其中,[Zn|Hd]矩陣表示BLS模型的實(shí)際輸入,Y作為系統(tǒng)輸出在文中表示結(jié)構(gòu)沉降預(yù)測(cè)值,Wm是連接系統(tǒng)輸入到輸出層的權(quán)值矩陣,通過求解嶺回歸矩陣偽逆的方式得到。
BLS的輸出用式(3)表示,該問題的求解通過采用嶺回歸近似廣義逆[Zn|Hd]+得到,計(jì)算公式如下:
Wm=(λI+ATA)-1AΤY
(4)
其中,A=[Zn|Hd],I表示單位矩陣,λ表示正則化系數(shù)。
圖2是BLS結(jié)構(gòu)變形預(yù)測(cè)算法流程。對(duì)地鐵沉降數(shù)據(jù)進(jìn)行預(yù)處理,將進(jìn)行歸一化處理的數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集用于BLS網(wǎng)絡(luò)的訓(xùn)練和測(cè)試。BLS網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)的全過程:輸入樣本P產(chǎn)生包含特征映射節(jié)點(diǎn)的映射特征組,映射特征組連接非線性激活函數(shù)產(chǎn)生增強(qiáng)節(jié)點(diǎn)組,映射特征組和增強(qiáng)節(jié)點(diǎn)組共同作用到輸出層得到BLS模型的輸出U。BLS模型的輸出數(shù)據(jù),需先進(jìn)行反歸一化得到最終的地鐵沉降預(yù)測(cè)數(shù)據(jù)。將原始地鐵沉降數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)比較,采用誤差值判斷BLS模型對(duì)結(jié)構(gòu)沉降數(shù)據(jù)的預(yù)測(cè)精度,采用測(cè)試時(shí)間驗(yàn)證BLS模型訓(xùn)練速度的優(yōu)越性。進(jìn)一步對(duì)不同預(yù)測(cè)模型的結(jié)果進(jìn)行比較,畫出不同模型預(yù)測(cè)形變量與真實(shí)形變量對(duì)比圖。
圖2 BLS結(jié)構(gòu)變形預(yù)測(cè)算法流程
(5)
(6)
Train_Y=Φ(Train_X)
(7)
(8)
(9)
(10)
(11)
實(shí)驗(yàn)數(shù)據(jù)來源于某地鐵5號(hào)線的地下隧道沉降數(shù)據(jù),該數(shù)據(jù)集包含131個(gè)數(shù)據(jù),監(jiān)測(cè)時(shí)間段是從2016年03月10日到2016年12月29日。寬度學(xué)習(xí)系統(tǒng)本質(zhì)是一種機(jī)器學(xué)習(xí)算法,由于原始131個(gè)地鐵監(jiān)測(cè)數(shù)據(jù)樣本量較少,為了驗(yàn)證模型的有效性,實(shí)驗(yàn)采用三次樣條插值法對(duì)監(jiān)測(cè)數(shù)據(jù)點(diǎn)進(jìn)行10倍插值。將插值后的數(shù)據(jù)按順序以7∶3的比例劃分為訓(xùn)練集和測(cè)試集,并對(duì)數(shù)據(jù)集進(jìn)行歸一化處理。對(duì)數(shù)據(jù)進(jìn)行歸一化可降低數(shù)據(jù)之間存在的差異性,在一定程度上減少訓(xùn)練時(shí)間,提高測(cè)試精度。實(shí)驗(yàn)采用最值歸一化(min-max normalization,MMN),其實(shí)質(zhì)是對(duì)數(shù)據(jù)進(jìn)行線性變換,使數(shù)據(jù)結(jié)果值定義到[0,1]區(qū)間。模型對(duì)歸一化數(shù)據(jù)進(jìn)行預(yù)測(cè),因此需要對(duì)預(yù)測(cè)結(jié)果進(jìn)行反歸一化。反歸一化公式由歸一化公式轉(zhuǎn)換得到。歸一化和反歸一化公式如下:
(12)
y'=y·(xmax-xmin)+xmin
(13)
其中,x表示原始數(shù)據(jù),x'表示原始數(shù)據(jù)歸一化后的數(shù)據(jù),xmin表示原始數(shù)據(jù)的最小值,xmax表示原始數(shù)據(jù)的最大值,y表示預(yù)測(cè)數(shù)據(jù),y'表示對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行反歸一化的值。
該文采用均方根誤差(root mean square error,RMSE)和平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)作為評(píng)價(jià)模型預(yù)測(cè)精度的指標(biāo)。這兩種誤差的公式如下:
(14)
(15)
RMSE的計(jì)算可以得到預(yù)測(cè)值與真實(shí)值之間的偏差。MAPE的計(jì)算可以得到絕對(duì)誤差與真實(shí)值之間的比例。RMSE、MAPE是常用的模型預(yù)測(cè)精度的評(píng)價(jià)指標(biāo)。RMSE、MAPE值的大小,表示預(yù)測(cè)精度的高低。值越小,預(yù)測(cè)精度越高。
經(jīng)過多次實(shí)驗(yàn),當(dāng)映射特征組數(shù)、映射特征組內(nèi)節(jié)點(diǎn)數(shù)和增強(qiáng)特征節(jié)點(diǎn)數(shù)分別取12、12、15,正則項(xiàng)參數(shù)C為2-20時(shí),寬度學(xué)習(xí)模型對(duì)地鐵沉降監(jiān)測(cè)數(shù)據(jù)的預(yù)測(cè)結(jié)果最好。模型預(yù)測(cè)值與原始地鐵沉降值對(duì)比結(jié)果如圖3所示。此時(shí),模型測(cè)試集均方根誤差為0.006 3,平均絕對(duì)百分比誤差為0.000 4,測(cè)試時(shí)間為0.069 3 s。
圖3 BLS預(yù)測(cè)結(jié)果
為了驗(yàn)證BLS模型在結(jié)構(gòu)沉降預(yù)測(cè)方面的有效性,實(shí)驗(yàn)將BLS模型與深度置信網(wǎng)絡(luò)-支持向量回歸(deep belief networks,support vector regression,DBN-SVR)、支持向量回歸(support vector regression,SVR)和人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)模型對(duì)地鐵沉降監(jiān)測(cè)數(shù)據(jù)的預(yù)測(cè)結(jié)果進(jìn)行比較。四種不同模型預(yù)測(cè)性能評(píng)價(jià)如表1所示。模型預(yù)測(cè)結(jié)果采用均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)和運(yùn)行時(shí)間進(jìn)行評(píng)估。
表1 四種模型性能評(píng)價(jià)
由表1可知,BLS模型預(yù)測(cè)誤差最小,運(yùn)行時(shí)間最快。BLS模型預(yù)測(cè)精度達(dá)到了99.96%,運(yùn)行速度最快僅為0.157 7 s(訓(xùn)練時(shí)間為0.088 4 s,測(cè)試時(shí)間為0.069 3 s)。對(duì)四種預(yù)測(cè)模型的性能進(jìn)行評(píng)價(jià)可知,BLS模型的預(yù)測(cè)均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)明顯小于其他三種對(duì)比模型。BLS的預(yù)測(cè)精度比DBN-SVR、SVR和ANN分別提高了94.81%,90.24%,97.10%。BLS模型的運(yùn)行速度相比于對(duì)比模型提高了數(shù)十倍至數(shù)千倍。綜合考慮模型的預(yù)測(cè)精度和運(yùn)行速度,BLS模型用于地鐵沉降數(shù)據(jù)預(yù)測(cè),具有非常高的預(yù)測(cè)精度和非??斓倪\(yùn)行速度。
通過上述DBN-SVR、SVR、ANN和BLS預(yù)測(cè)模型的實(shí)驗(yàn),得到BLS與DBN-SVR、SVR和ANN的預(yù)測(cè)值與真實(shí)地鐵沉降值的曲線對(duì)比結(jié)果,如圖4所示。
圖4 不同模型預(yù)測(cè)結(jié)果
由圖4可知,BLS對(duì)地鐵沉降數(shù)據(jù)預(yù)測(cè)的擬合度非常高,即預(yù)測(cè)值與原始地鐵沉降數(shù)據(jù)高度吻合;在沉降數(shù)據(jù)變化的拐點(diǎn)處也可以實(shí)現(xiàn)精確預(yù)測(cè),即局部擬合度也非常高;ANN的擬合度最差,其預(yù)測(cè)結(jié)果和原始數(shù)據(jù)的變換趨勢(shì)整體大致符合。
圖5為BLS、DBN-SVR、SVR和ANN的預(yù)測(cè)誤差對(duì)比,其直觀分析了四種預(yù)測(cè)模型的預(yù)測(cè)誤差。由圖5可知,BLS預(yù)測(cè)誤差最小,即預(yù)測(cè)精度最高。實(shí)驗(yàn)結(jié)果表明,BLS預(yù)測(cè)模型相比于其他預(yù)測(cè)模型具有更高的預(yù)測(cè)精度和更快的運(yùn)行速度,是一種預(yù)測(cè)性能優(yōu)良的結(jié)構(gòu)沉降數(shù)據(jù)預(yù)測(cè)算法。
圖5 不同模型誤差對(duì)比
進(jìn)一步在不改變模型其他參數(shù)的前提下,通過調(diào)整模型的正則項(xiàng)參數(shù)C,得到寬度學(xué)習(xí)系統(tǒng)對(duì)結(jié)構(gòu)沉降數(shù)據(jù)的預(yù)測(cè)結(jié)果(見表2),驗(yàn)證其對(duì)模型預(yù)測(cè)精度的影響。由表2可知,正則項(xiàng)參數(shù)C設(shè)置為2-20時(shí),模型預(yù)測(cè)效果最佳,即預(yù)測(cè)誤差最小,但此時(shí)模型運(yùn)行速率不是最快。
表2 正則項(xiàng)參數(shù)對(duì)BLS預(yù)測(cè)結(jié)果的影響
圖6 正則項(xiàng)參數(shù)對(duì)模型預(yù)測(cè)準(zhǔn)確率的影響
圖6中預(yù)測(cè)準(zhǔn)確率是通過1-MAPE定義的。圖中隨著正則項(xiàng)參數(shù)C的緩慢增加,寬度學(xué)習(xí)系統(tǒng)對(duì)于結(jié)構(gòu)沉降預(yù)測(cè)準(zhǔn)確率呈緩慢下降趨勢(shì),預(yù)測(cè)準(zhǔn)確率從99.96%下降到99.24%。在一定范圍內(nèi),改變正則項(xiàng)參數(shù)C對(duì)基于寬度學(xué)習(xí)系統(tǒng)的結(jié)構(gòu)沉降預(yù)測(cè)準(zhǔn)確率的影響非常小。
提出了一種基于寬度學(xué)習(xí)的結(jié)構(gòu)沉降數(shù)據(jù)預(yù)測(cè)模型,通過實(shí)測(cè)地鐵沉降數(shù)據(jù)測(cè)試結(jié)果表明,寬度學(xué)習(xí)系統(tǒng)模型的預(yù)測(cè)值和真實(shí)值基本吻合,即使在結(jié)構(gòu)沉降數(shù)據(jù)變化的拐點(diǎn)處吻合度也較高。進(jìn)一步將BLS與DBN-SVR、SVR和ANN模型預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,模型預(yù)測(cè)精度采用預(yù)測(cè)誤差進(jìn)行驗(yàn)證,模型預(yù)測(cè)速度采用模型運(yùn)行時(shí)間進(jìn)行評(píng)估。實(shí)驗(yàn)結(jié)果表明,提出的寬度學(xué)習(xí)系統(tǒng)模型預(yù)測(cè)精度高、運(yùn)行速度快,是一種性能良好的結(jié)構(gòu)沉降預(yù)測(cè)方法。寬度學(xué)習(xí)系統(tǒng)可通過引入增量學(xué)習(xí)算法,改變?cè)到y(tǒng)的性能,在將來的研究中應(yīng)進(jìn)一步研究增量學(xué)習(xí)算法對(duì)寬度學(xué)習(xí)系統(tǒng)結(jié)構(gòu)沉降預(yù)測(cè)精度的影響。