張紹成,殷 飛,胡俊亮,葉仲韜,胡友健
(1. 中國(guó)地質(zhì)大學(xué)(武漢) 地理與信息工程學(xué)院,武漢 430074;2. 橋梁結(jié)構(gòu)健康與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室, 武漢 430034;3. 中鐵大橋科學(xué)研究院有限公司,武漢 430034)
橋梁線形測(cè)量的主要工作是通過(guò)檢測(cè)橋梁在交通負(fù)載狀態(tài)下,橋梁主體在高程方向上的線形變化,獲悉橋梁的承載能力和健康狀態(tài),是橋梁日常運(yùn)營(yíng)維護(hù)的重要工作。
傳統(tǒng)橋梁線形測(cè)量是基于水準(zhǔn)儀、全站儀、傾角儀等對(duì)橋面點(diǎn)位的位移監(jiān)測(cè)[1],但傳統(tǒng)測(cè)量手段測(cè)量效率低,易受橋面交通的干擾,在橋梁的運(yùn)營(yíng)維護(hù)階段對(duì)橋面交通影響非常大?;谌蛐l(wèi)星導(dǎo)航系統(tǒng)(global navigation satellite system,GNSS)的實(shí)時(shí)動(dòng)態(tài)差分(real-time kinematic,RTK)技術(shù),能實(shí)現(xiàn)厘米級(jí)精度的動(dòng)態(tài)測(cè)量,在橋梁線形測(cè)量應(yīng)用中能較好地提高橋梁線性測(cè)量的效率[2],而且GNSS 連續(xù)的高頻采樣測(cè)量結(jié)果,能夠有效探測(cè)潛在的病害區(qū)域。然而在實(shí)際進(jìn)行大型橋面測(cè)量時(shí),GNSS 動(dòng)態(tài)測(cè)量信號(hào)容易受到橋面的橋塔、懸索、拉鎖等建筑的干擾,出現(xiàn)較大的多路徑干擾,導(dǎo)致相位信號(hào)失鎖,造成整周模糊度無(wú)法固定的情況。采用車(chē)載GNSS RTK,則能夠快速實(shí)現(xiàn)橋梁線形重復(fù)測(cè)量,快速獲得大量冗余數(shù)據(jù),若能夠合理地利用冗余數(shù)據(jù),則能有效地解決GNSS RTK 測(cè)量在橋面復(fù)雜觀測(cè)條件下的精度和可靠性問(wèn)題。目前,研究橋梁測(cè)量數(shù)據(jù)融合和預(yù)測(cè)的方法有很多,如采用最小二乘法對(duì)傾角儀所得橋梁撓度進(jìn)行融合[3];采用卡爾曼濾波(Kalman filter, KF)[4]法、灰色模型(grey model, GM)[5]法或神經(jīng)網(wǎng)絡(luò)[6]法預(yù)測(cè)橋梁形變并建立立模標(biāo)高,但這些方法均基于傳統(tǒng)橋梁撓度測(cè)量方法的觀測(cè)結(jié)果,不完全適用于GNSS RTK 這種連續(xù)多點(diǎn)的橋梁線測(cè)量方法。
支持向量機(jī)(support vector machine, SVM)是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論的機(jī)器學(xué)習(xí)方法,而支持向量機(jī)回歸(support vector regression, SVR)是SVM 的重要分支,其良好的泛化能力,使其能夠應(yīng)用到很多行業(yè)中[7]。本文使用了一種基于高斯徑向基(radial basis function, RBF)核函數(shù)支持向量機(jī)回歸的通用逼近函數(shù)方法,實(shí)現(xiàn)了高精度橋梁整體線形回歸的建模。
本文首先介紹支持向量機(jī)回歸的基本原理及相應(yīng)的參數(shù)選擇原則,然后基于橋梁實(shí)測(cè)數(shù)據(jù)建立了支持向量機(jī)回歸模型,以某橋梁的往返共10 組實(shí)測(cè)數(shù)據(jù)驗(yàn)證支持向量機(jī)回歸方法的有效性,最終實(shí)現(xiàn)測(cè)試橋梁的高精度線形測(cè)量。
為最小化結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù)R(ω),通過(guò)構(gòu)造拉格朗日函數(shù)及對(duì)偶求解,可將回歸方程式寫(xiě)為
任何滿足梅塞(Mercer)條件[8]的函數(shù)均可作為核函數(shù),若采樣點(diǎn)所對(duì)應(yīng)的核函數(shù)系數(shù)不為零,則該采樣點(diǎn)為支持向量,而最佳的支持向量的數(shù)據(jù)回歸等效于所有數(shù)據(jù)的回歸。
支持向量機(jī)回歸擬合表現(xiàn)主要取決于參數(shù)[9],主要包括懲罰系數(shù)C,不敏感損失函數(shù)參數(shù)ε、核函數(shù)及其參數(shù)。最優(yōu)參數(shù)選擇主要基于經(jīng)驗(yàn)對(duì)比、范圍搜尋及交叉檢驗(yàn)[10]進(jìn)行參數(shù)尋優(yōu),本文基于觀測(cè)數(shù)據(jù)及其估計(jì)噪聲確定C與ε,根據(jù)橋梁的線形特點(diǎn)確定核函數(shù),采用留出法(Hold-out)交叉驗(yàn)證[11]確定核函數(shù)參數(shù)。
橋梁的變形特性需要一種能夠逼近任意線形同時(shí)能保證函數(shù)平滑特性的核函數(shù)。高斯徑向基函數(shù)可將原始的空間映射為無(wú)窮維空間,實(shí)現(xiàn)任意數(shù)據(jù)線性可分,其基本公式為
式中:e 為自然常數(shù);γ為高斯核函數(shù)的幅寬參數(shù)。
通過(guò)調(diào)控該參數(shù),擬合函數(shù)可有效地逼近任意線性,但不合適的γ參數(shù)會(huì)使得最終回歸結(jié)果出現(xiàn)過(guò)擬合或欠擬合[12]。為計(jì)算最優(yōu)的γ值的范圍,確保回歸建模不出現(xiàn)過(guò)擬合和欠擬合,本文基于原始觀測(cè)值結(jié)果進(jìn)行Hold-out 驗(yàn)證,通過(guò)最小化預(yù)測(cè)風(fēng)險(xiǎn)(預(yù)測(cè)結(jié)果和觀測(cè)結(jié)果的殘差的均方根誤差)獲取γ參數(shù),并利用于高精度基準(zhǔn)點(diǎn)與SVR 預(yù)測(cè)的結(jié)果的均方根誤差作為最終的精度評(píng)估標(biāo)準(zhǔn)。
懲罰系數(shù)C主要用于權(quán)衡模型的復(fù)雜度(即高維平面的平整度)與采樣點(diǎn)落入ε范圍之外的容忍程度。根據(jù)馬特拉(Mattera)和海伊金(Haykin)理論[13],基于高斯徑向基核函數(shù)的SVR 理論最優(yōu)的C應(yīng)當(dāng)由輸出值的范圍確定,其定義為
參數(shù)ε控制著線性不敏感區(qū)間的范圍,由損失函數(shù)可知,在ε不敏感區(qū)間內(nèi)的采樣點(diǎn)均無(wú)損失。一般情況下ε值和采樣點(diǎn)的噪聲水平成一定比例關(guān)系,且和訓(xùn)練樣本大小存在負(fù)相關(guān)性[9]。依據(jù)該原則,采用一種經(jīng)驗(yàn)有效的確定方法,即
式中,σ為采樣點(diǎn)的標(biāo)準(zhǔn)差。
RTK 橋梁線形測(cè)量是通過(guò)車(chē)載高精度GNSS接收機(jī),對(duì)橋面同一路線進(jìn)行多次重復(fù)觀測(cè),然后采用數(shù)據(jù)融合的方法進(jìn)行建模,從而獲得高精度的橋梁線形信息。本文以某長(zhǎng)度約700 m 的公路橋單側(cè)輔橋?yàn)閷?shí)驗(yàn)測(cè)試區(qū)域,往返測(cè)量同一路線共10 次,獲取高頻RTK 測(cè)量結(jié)果共計(jì)8 051 個(gè)點(diǎn)位坐標(biāo),整周模糊度固定率約為78.3%。RTK 測(cè)量結(jié)果通過(guò)與高程異常改正后的36 個(gè)水準(zhǔn)測(cè)量基準(zhǔn)點(diǎn)對(duì)比,其結(jié)果如圖1 所示,圖1 中深色與淺灰色點(diǎn)位分別為10 次重復(fù)測(cè)量結(jié)果中的固定解與浮點(diǎn)解,三角點(diǎn)為高精度水準(zhǔn)測(cè)量基準(zhǔn)點(diǎn)。
圖1 RTK 測(cè)量橋梁線形觀測(cè)結(jié)果與水準(zhǔn)測(cè)量基準(zhǔn)點(diǎn)對(duì)比
Hold-out 驗(yàn)證又稱為外部測(cè)試(external testing,ET),是目前最為可靠的、估計(jì)基于統(tǒng)計(jì)模型預(yù)測(cè)能力方法之一[11]。該方法的基本原理是從最初的樣本中,隨機(jī)選出部分?jǐn)?shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩余數(shù)據(jù)則作為交叉驗(yàn)證數(shù)據(jù),利用訓(xùn)練數(shù)據(jù)所得的模型預(yù)測(cè)驗(yàn)證數(shù)據(jù),評(píng)估模型的泛化能力。實(shí)驗(yàn)從觀測(cè)數(shù)據(jù)中選出10%(805 個(gè))作為交叉驗(yàn)證數(shù)據(jù)集,然后利用公式分別計(jì)算C和ε,其結(jié)果如表1 所示。
表1 GNSS-RTK 測(cè)量數(shù)據(jù)支持向量機(jī)回歸參數(shù)表
從表1 可以看出,在Hold-out 模式下,回歸參數(shù)C和ε與全數(shù)據(jù)回歸差異不大。利用所有數(shù)據(jù)SVR 回歸計(jì)算并使用自身數(shù)據(jù)預(yù)測(cè)驗(yàn)證,以及使用90%數(shù)據(jù)回歸計(jì)算并使用Hold-out 驗(yàn)證方法驗(yàn)證,在不同RBF 核函數(shù)γ參數(shù)下得到的均方根誤差變化如圖2 所示。
圖2 回歸計(jì)算和預(yù)測(cè)結(jié)果的均方根誤差
從圖2 中可以看出,γ取值在1×10-5~1×10-3之間時(shí),隨著γ值的增大,二者的均方值誤差將大幅度地減少,表明SVR 所得結(jié)果為欠擬合;當(dāng)γ取值在1×10-1~1×101之間時(shí),隨著γ值的增大,自預(yù)測(cè)的均方根誤差逐步減少,而Hold-out 驗(yàn)證的均方根誤差卻逐漸增大,表明SVR 所得結(jié)果為過(guò)擬合。
為說(shuō)明Hold-out 驗(yàn)證所尋的最優(yōu)參數(shù)的效果,圖3 統(tǒng)計(jì)出了利用所有數(shù)據(jù)SVR 回歸計(jì)算并使用外部已有基準(zhǔn)點(diǎn)預(yù)測(cè)的均方根誤差隨γ的變化。
圖3 Hold-out 驗(yàn)證的均方根誤差
基于最小化基準(zhǔn)點(diǎn)預(yù)測(cè)風(fēng)險(xiǎn)和Hold-out 驗(yàn)證預(yù)測(cè)風(fēng)險(xiǎn)得出的最優(yōu)γ取值分別約為 1×10-1.7和1×10-1.6。與圖2 的結(jié)果對(duì)比可知,基準(zhǔn)點(diǎn)預(yù)測(cè)和Hold-out 驗(yàn)證結(jié)果在均方根誤差變化具有一致性,說(shuō)明最小化Hold-out 驗(yàn)證的預(yù)測(cè)風(fēng)險(xiǎn)所得的γ參數(shù)有效避免過(guò)擬合和欠擬合的問(wèn)題。
因此在本文的應(yīng)用中,取Hold-out 驗(yàn)證所得的γ參數(shù)1×10-1.6,在95%的可靠性條件下,估算出的原始觀測(cè)數(shù)據(jù)的固定解精度約為2.9 cm,含浮點(diǎn)解的總體觀測(cè)精度則超過(guò)100 cm,而基于整體觀測(cè)數(shù)據(jù)(含浮點(diǎn)解)的回歸建模得到結(jié)果如圖4 所示,橋梁線形統(tǒng)計(jì)精度達(dá)到1.3 cm。
圖4 SVR 最終建模結(jié)果及其殘差分布
此外考慮到Hold-out 交叉驗(yàn)證尋找γ參數(shù)計(jì)算耗時(shí)隨著數(shù)據(jù)量的增加而急劇增加,為提高計(jì)算效率,進(jìn)一步測(cè)試重復(fù)測(cè)量的次數(shù)對(duì)于最優(yōu)γ參數(shù)的取值影響。使用不同組數(shù)的實(shí)測(cè)數(shù)據(jù)的運(yùn)算結(jié)果如圖5 所示。
圖5 不同參與運(yùn)算觀測(cè)組數(shù)的Hold-out均方根誤差驗(yàn)證
從圖5 可以看出,不同數(shù)據(jù)模式下均顯示,γ的最優(yōu)取值范圍值為 1×1 0-2~1×1 0-1,并且數(shù)據(jù)量越小對(duì)過(guò)擬合越敏感,更易找出最優(yōu)γ值。
同時(shí),本文基于矩陣實(shí)驗(yàn)室(matrix laboratory,MATLAB)軟件,測(cè)算參與重復(fù)測(cè)量的次數(shù)與運(yùn)算時(shí)間對(duì)比如圖6 所示。
圖6 參與運(yùn)算觀測(cè)組數(shù)的計(jì)算耗時(shí)對(duì)比
從圖6 可以看出,由10 組數(shù)據(jù)總耗時(shí)5 585 s降低至一組數(shù)據(jù)總耗時(shí)41 s,γ參數(shù)尋優(yōu)速度提高約136 倍,因此,基于少量數(shù)據(jù)即可選取最優(yōu)回歸建模γ參數(shù)。
同時(shí),基于不同觀測(cè)組數(shù)量的建立的橋梁線形回歸模型的統(tǒng)計(jì)精度對(duì)比結(jié)果如圖7 所示。
圖7 參與運(yùn)算觀測(cè)組數(shù)的回歸建模精度
從圖7 可以看出,隨著參與運(yùn)算觀測(cè)組數(shù)的增多,回歸模型精度也在逐步升高?;鶞?zhǔn)點(diǎn)對(duì)比均方根誤差由單組的5.33 cm 提升至10 組的0.65 cm,當(dāng)觀測(cè)組數(shù)超過(guò)5 組時(shí),精度提升幅度逐步趨緩。由此可見(jiàn),對(duì)于橋梁的線形測(cè)量建模,通過(guò)首期多次測(cè)量數(shù)據(jù)建模分析,選取適當(dāng)?shù)闹貜?fù)觀測(cè)數(shù)據(jù)量,即可作為后續(xù)測(cè)量監(jiān)測(cè)外業(yè)任務(wù)的參考,在保證測(cè)量精度的前提下節(jié)約測(cè)量工作量。
本文將基于高斯徑向基核函數(shù)的支持向量機(jī)回歸應(yīng)用于橋梁RTK 線形測(cè)量建模。針對(duì)支持向量機(jī)選擇參數(shù)困難問(wèn)題,采用原始數(shù)據(jù)和先驗(yàn)噪聲水平確定的懲罰系數(shù)和線性不敏感系數(shù),同時(shí)使用Hold-out 交叉驗(yàn)證確定核函數(shù)參數(shù)。基于橋面實(shí)測(cè)數(shù)據(jù)結(jié)果回歸檢驗(yàn)及水準(zhǔn)基準(zhǔn)點(diǎn)數(shù)據(jù)對(duì)比表明以上參數(shù)的有效性,并利用單組數(shù)據(jù)尋找核函數(shù)參數(shù)大幅度減少參數(shù)尋優(yōu)時(shí)間,最后基于多次重復(fù)動(dòng)態(tài)車(chē)載測(cè)量數(shù)據(jù)實(shí)現(xiàn)了1.3 cm 精度的橋梁線形建模,在實(shí)際橋梁線形測(cè)量中具有較高的應(yīng)用價(jià)值。