萬祥 魏博文 徐富剛 張升
摘要:
針對傳統(tǒng)統(tǒng)計模型并不能完全涵蓋位移影響分量信息以及真實影響分量信息易受到噪聲干擾等問題,提出了一種融合小波閾值理論與多維自回歸的混凝土壩位移時序預(yù)報模型。該方法主要是將小波閾值理論與時間序列算法結(jié)合起來創(chuàng)建混凝土壩位移時序預(yù)報模型,模型通過不同小波分解層數(shù)、小波基、閾值選取準(zhǔn)則、閾值函數(shù)集成出一個MATLAB編碼平臺進行數(shù)據(jù)平滑處理,能高效挖掘大壩位移數(shù)據(jù)的影響分量信息,并選擇自回歸(autoregressive model,AR)時間序列模型作為預(yù)報模型。實例應(yīng)用表明,新的融合模型預(yù)測性能較好,能有效監(jiān)測大壩運行狀態(tài),且其分析結(jié)果對于其他數(shù)字工程的數(shù)據(jù)預(yù)測也具參考價值。
關(guān) 鍵 詞:
小波閾值; 多維自回歸模型; 混凝土重力壩; 位移預(yù)報
中圖法分類號: TV32
文獻標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2023.07.029
0 引 言
大壩作為一種關(guān)乎到人民生命財產(chǎn)安全的長久性建筑物,其運行期間受到水位、溫度、地震、材料老化等多種內(nèi)外環(huán)境因素共同影響[1-2],大壩位移偏移量并不像傳統(tǒng)統(tǒng)計模型一樣,只受到水壓分量、溫度分量、時效分量的影響,其影響因素具有一定的多維復(fù)雜關(guān)聯(lián)性[3]。而大壩建成后所處自然環(huán)境大體不變,其大壩位移偏移量所受到的環(huán)境因素影響具有周期性以及規(guī)律性[4],使得學(xué)者可借助時間序列算法建立相關(guān)數(shù)學(xué)模型,并根據(jù)已有的大壩位移觀測數(shù)據(jù)去預(yù)測大壩未來的位移偏移量成為可能。
伴隨著神經(jīng)網(wǎng)絡(luò)[5-7]、支持向量機[8-9]、隨機森林[10-11]、時間序列分析[12-13]等人工智能算法的蓬勃發(fā)展,研究人員已經(jīng)能夠做到對大壩位移的深入研究與預(yù)測,但是預(yù)測精度除了受算法本身影響外,還會受到數(shù)據(jù)中隨機變量的干擾,而模型訓(xùn)練了無效位移信號,將對模型預(yù)測精度產(chǎn)生影響。為了讓數(shù)學(xué)模型訓(xùn)練數(shù)據(jù)真實性更高,進行數(shù)據(jù)預(yù)處理很重要,相關(guān)學(xué)者在這一方面進行了深入的研究。李雙平等[14]首次將小波分析和譜分析引入到變形監(jiān)測分析和預(yù)報中,使得模型預(yù)報精度在傳統(tǒng)回歸模型基礎(chǔ)上有所提高;陳俊風(fēng)等[15]將小波變換理論與差分變異頭腦算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)結(jié)合起來應(yīng)用于大壩變形預(yù)測,運用小波分析將數(shù)據(jù)序列分成許多子系列進行預(yù)測,提高了模型預(yù)測精度。但是以上方法運用的小波分析不具有全面性、系統(tǒng)性,且預(yù)測模型處理數(shù)據(jù)過程過于繁瑣,不具普適性。
本文先通過MATLAB編程將不同小波基、分解層數(shù)、閾值選取準(zhǔn)則、閾值函數(shù)集成進小波閾值數(shù)據(jù)平滑處理系統(tǒng),在剔除掉一些不確定因素對預(yù)報精度干擾的前提下,通過對比得到降噪最佳的小波閾值處理結(jié)果;再結(jié)合貝葉斯準(zhǔn)則AR模型與赤池信息量準(zhǔn)則AR模型在預(yù)測方面的充分探討(這兩個準(zhǔn)則的選取其實是一種正則化的模式),挑選出眾多模型中預(yù)測效果最好的模型,得到融合小波閾值與多維自回歸的混凝土壩位移時序預(yù)報模型,以期在預(yù)測精度較高的前提下保證高效性。
3 融合小波閾值與多維自回歸的混凝土壩位移時序預(yù)報模型構(gòu)建
通過以上理論可知,小波閾值處理位移監(jiān)測數(shù)據(jù)減少了隨機變量對預(yù)測精度的干擾,提高了模型泛化能力,再結(jié)合AIC與BIC準(zhǔn)則定階下的AR時間序列算法對比研究,構(gòu)建了針對大壩監(jiān)測數(shù)據(jù)的大壩變形組合預(yù)報模型框架。充分運用上述理論,通過試驗比較得出最佳預(yù)測模型,最后進行小波閾值與多維自回歸的混凝土壩位移時序預(yù)報模型框架構(gòu)建,構(gòu)建流程如圖1所示。
(1) 將分解層、小波基、閾值準(zhǔn)則、閾值函數(shù)編碼于MATLAB平臺上,通過調(diào)整分解層、小波基、閾值準(zhǔn)則、閾值函數(shù)對大壩位移監(jiān)測數(shù)據(jù)進行試算,對比得到預(yù)處理最佳的小波閾值預(yù)處理組合方式。
(2) 對小波閾值預(yù)處理后的數(shù)據(jù)進行ACF,PACF相關(guān)性檢驗,確定時間序列模型。
(3) 在間序列模型下進行AIC準(zhǔn)則、BIC準(zhǔn)則定階,最后通過預(yù)測結(jié)果精度對比得到最佳預(yù)測模型。
4 工程實例
4.1 工程基本資料
位于中國福建省的棉花灘水電站,總庫容20.35億m3,年發(fā)電量15.2億kW·h,主壩全長308.5 m,壩頂高程179 m,壩高113.0 m,壩頂寬度7.0 m。該壩從左至右共6個壩段,其中1號、2號、5號、6號壩段為左右兩岸非溢流壩,3號、4號壩段為溢流壩,選取2號壩段2018年1月1日至2020年7月31日正垂線PL5水平位移自動化監(jiān)測序列進行分析,得到944組數(shù)據(jù)的位移實測序列,選取周期間隔1 d作為模型訓(xùn)練樣本。同時選取2020年8月1日至2020年8月30日的29組數(shù)據(jù)進行預(yù)報來檢驗?zāi)P偷目煽啃?。監(jiān)測時段內(nèi)PL5實測位移與上游水位的變化過程如圖2所示。
4.2 小波閾值數(shù)據(jù)預(yù)處理
將PL5測點的水平位移數(shù)據(jù)作為原數(shù)據(jù)信號進行小波變換閾值數(shù)據(jù)預(yù)處理,選取dbN、symN、coifN 3種小波基進行數(shù)據(jù)處理,并對大壩位移數(shù)據(jù)信號進行2~5層分解試算,根據(jù)信噪比比較,得知靜水壓力下的大壩位移數(shù)據(jù)信號在3層分解的情況下得到充分挖掘。由于文中主要是比較小波基、閾值準(zhǔn)則、閾值的選取問題對大壩位移數(shù)據(jù)平滑處理效果的影響情況,分解層數(shù)的處理效果將不在文中展示。大壩位移數(shù)據(jù)在分解層數(shù)為3的情況下,不同小波基、閾值準(zhǔn)則、閾值的降噪效果可由其降噪后的信噪比進行比較,如圖3所示。
選取了db3~db8、sym3~sym8、coif1~coif5等多種具有典型代表的小波基;4種閾值選取準(zhǔn)則分別為無偏似然估計準(zhǔn)則、啟發(fā)式閾值準(zhǔn)則、極大極小閾值準(zhǔn)則、固定閾值準(zhǔn)則;閾值函數(shù)為軟閾值、硬閾值函數(shù)。從圖3可以總結(jié)出以下結(jié)論:① 3種小波基的降噪效果雖有一定的差距,但都很均衡;② 無偏似然估計準(zhǔn)則數(shù)據(jù)預(yù)處理效果比另外3種閾值選取準(zhǔn)則更佳,信噪比波動也較大;③ 位移數(shù)據(jù)信號在硬閾值函數(shù)的情況下預(yù)處理效果普遍好于軟閾值函數(shù)。
將圖3全部降噪效果進行對比,得知該組數(shù)據(jù)信號在小波基db5、無偏似然估計準(zhǔn)則、硬閾值函數(shù)時降噪效果最佳,信噪比為43.083 9 db,隨后將這一組預(yù)處理效果最好的大壩位移數(shù)據(jù)輸入到預(yù)報模型中進行性能探究。當(dāng)然該MATLAB數(shù)據(jù)預(yù)處理平臺只是一個處理過程,對于不同測點、不同壩段的數(shù)據(jù)信號特點都具有差異性,得到的預(yù)處理效果最佳方式是不同的。
4.3 模型確定與效果對比
模型的選擇直接影響到該模型的預(yù)測效果,AR模型、MA模型、ARMA模型、ARIMA模型如何選擇,依據(jù)輸入大壩位移數(shù)據(jù)得到的自相關(guān)系數(shù)與偏自相關(guān)系數(shù)隨階數(shù)p的變化趨勢確定。預(yù)處理后的大壩位移監(jiān)測數(shù)據(jù)輸入時序模型其相關(guān)系數(shù)如圖4所示。
圖4(a)中,自相關(guān)系數(shù)隨著階數(shù)p的增加而呈現(xiàn)指數(shù)衰減情況,屬于拖尾現(xiàn)象;圖4(b)中,偏自相關(guān)系數(shù)在階數(shù)p為2時突然衰減,隨后在零附近波動,屬于2階截尾現(xiàn)象,根據(jù)拖尾、截尾狀況確定預(yù)測模型為AR模型。
模型確定之后,選取AIC準(zhǔn)則和BIC準(zhǔn)則分別對AR模型進行定階比較,其AIC值與BIC值隨階數(shù)p的變化如圖5所示。
從圖5可以看出:AIC準(zhǔn)則下模型的AIC值在延遲階數(shù)p為8后,變化相對平穩(wěn),到了延遲階數(shù)p為22時,達到了最小值56.099 8;而BIC準(zhǔn)則下模型的BIC值在延遲階數(shù)為4時就達到了最小值102.500 8,隨后BIC值伴隨延遲階數(shù)p呈現(xiàn)上升趨勢??梢夿IC準(zhǔn)則下的AR模型能夠?qū)崿F(xiàn)快速定階,達到預(yù)報模型最佳狀態(tài),而延遲階數(shù)越大、信息準(zhǔn)則值越小,其預(yù)報性能越好。
混凝土重力壩當(dāng)年所處環(huán)境如何,對大壩位移監(jiān)
測數(shù)據(jù)具有一定的影響,為了檢驗大壩所處環(huán)境的一
致性對位移量的影響,以多年測點水平位移進行pearson相關(guān)性分析,測點多年水平位移相關(guān)性分析如圖6所示。
根據(jù)圖6可知,PL5測點多年水平位移相關(guān)性較高(都高于0.7),PL2測點水平位移相關(guān)性較低,但都大于0.3,仍表明位移數(shù)據(jù)具有一定相關(guān)性。位移數(shù)據(jù)相關(guān)性的強弱對模型預(yù)測精度具有一定影響,測點數(shù)據(jù)相似性越高,其時間序列模型預(yù)測精度自然提高。
隨后將PL5測點的逐步回歸模型、小波變換閾值處理后的多維自回歸模型(AIC準(zhǔn)則下)擬合與預(yù)報結(jié)果以及殘差序列圖繪制于圖7。
為了進一步驗證整套預(yù)報流程的準(zhǔn)確性,將正垂線PL2大壩位移數(shù)據(jù)作為數(shù)據(jù)樣本建立模型進行校驗。同時,為了更加全面地比較以上幾種模型的預(yù)報精度,分別量化計算了PL5和PL2這兩個測點的統(tǒng)計指標(biāo),結(jié)果見表2,可以得出以下結(jié)論:
(1) 單從模型的角度比較,AR模型的擬合部分決定系數(shù)R2雖略高于逐步回歸模型,但在預(yù)測部分逐步回歸模型的決定系數(shù)遠遠小于AR模型,說明AR模型在大壩位移預(yù)測方面不僅存在很大的優(yōu)勢,而且模型建立過程簡便。
(2) 至于AR模型中所運用到的信息準(zhǔn)則函數(shù),AIC準(zhǔn)則下的AR模型無論是在大壩位移數(shù)據(jù)的擬合部分還是預(yù)測部分精度都要略高于BIC準(zhǔn)則下,究其原因是AR時間序列模型本身不存在維度或參數(shù)過多的原因使得模型過于復(fù)雜化,所以BIC準(zhǔn)則下的AR模型只能保證快速找到其相應(yīng)準(zhǔn)則下預(yù)測最佳的模型,而AIC準(zhǔn)則下的AR模型擁有最佳的預(yù)測效果。
(3) 單從兩個測點的擬合與預(yù)報精度來看,結(jié)合了小波變換閾值降噪的AR模型相比于單純的AR模型,無論是擬合精度還是預(yù)報精度都得到了一定程度的提升。
(4) PL5測點的模型預(yù)測精度明顯高于PL2測點的預(yù)測精度,證實了測點數(shù)據(jù)相關(guān)性越高(大壩所處環(huán)境相似性越高),其監(jiān)測模型的預(yù)測精度越高;若是大壩所處環(huán)境變化太大,大壩位移量偏差太大,可通過小波閾值預(yù)處理方式對前期數(shù)據(jù)進行適當(dāng)修正。
5 結(jié) 論
(1) 本文提出了融合小波閾值與多維自回歸的混凝土壩位移時序預(yù)報模型。研究了小波閾值預(yù)處理技術(shù):采用不同小波基、分解層數(shù)、閾值函數(shù)準(zhǔn)則、閾值函數(shù)進行系統(tǒng)性整合,這是降噪效果甚好的小波閾值降噪方法,它能較好地濾除大壩位移數(shù)據(jù)中蘊含的不確定信息帶來的影響分量,使得建立的模型預(yù)報精度不受干擾。
(2) 文中所用到的AR模型能從數(shù)據(jù)的角度將所有影響分量信息考慮在內(nèi),用過去的位移數(shù)據(jù)預(yù)測未來的位移偏移量,能有效解決傳統(tǒng)統(tǒng)計模型建立需處理多自變量與應(yīng)變量之間關(guān)系帶來的冗雜問題,同時還能在保證模型預(yù)測精度的前提下提高模型位移預(yù)報效率。
(3) 本文所建模型還能夠充分挖掘出混凝土壩位移數(shù)據(jù)的影響分量信息,在大壩位移數(shù)據(jù)預(yù)測方面具有精密性、快捷性,并且適用于相近工程大壩位移監(jiān)測數(shù)據(jù)預(yù)測,對于其他數(shù)字工程的數(shù)據(jù)預(yù)測也具有一定的借鑒價值。
參考文獻:
[1] 顧沖時,蘇懷智.混凝土壩工程長效服役與風(fēng)險評定研究述評[J].水利水電科技進展,2015,35(5):1-12.
[2] 周元春,甘孝清,李端有.大壩安全監(jiān)測數(shù)據(jù)粗差識別技術(shù)研究[J].長江科學(xué)院院報,2011,28(2):16-20.
[3] 李明超,任秋兵,孔銳,等.多維復(fù)雜關(guān)聯(lián)因素下的大壩變形動態(tài)建模與預(yù)測分析[J].水利學(xué)報,2019,50(6):687-698.
[4] 李廣春,戴吾蛟,楊國祥,等.時空自回歸模型在大壩變形分析中的應(yīng)用[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2015,40(7):877-881.
[5] 馮非凡,武雪玲,牛瑞卿,等.一種V/S和LSTM結(jié)合的滑坡變形分析方法[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2019,44(5):784-790.
[6] STOJANOVIC B,MILIVOJEVIC M,MILIVOJEVIC N,et al.A self-tuning system for dam behavior modeling based on evolving artificial neural networks[J].Advances in Engineering Software,2016,97:85-95.
[7] CHEN H Q,ZENG Z G.Deformation prediction of landslide based on improved back-propagation neural network[J].Cognitive Computation,2013,5(1):56-62.
[8] 林玲,陳福集,謝加良,等.基于改進灰狼優(yōu)化支持向量回歸的網(wǎng)絡(luò)輿情預(yù)測[J].系統(tǒng)工程理論與實踐,2022,42(2):487-498.
[9] 杜傳陽,鄭東健,張毅,等.基于改進PSO-SVM-MC模型的大壩變形監(jiān)測模型[J].水電能源科學(xué),2015,33(2):74-77.
[10] 林威偉,鐘登華,胡煒,等.基于隨機森林算法的土石壩壓實質(zhì)量動態(tài)評價研究[J].水利學(xué)報,2018,49(8):945-955.
[11] DAI B,GU C S,ZHAO E F,et al.Statistical model optimized random forest regression model for concrete dam deformation monitoring[J].Structural Control and Health Monitoring,2018,25(6):90-104.
[12] 胡安玉,包騰飛,楊晨蕾,等.基于LSTM-Arima的大壩變形組合預(yù)測模型及其應(yīng)用[J].長江科學(xué)院院報,2020,37(10):64-68.
[13] SONJA G,MARIA J H,MICHAEL O,et al.Analysis of periodicities in long-term displacement time series in concrete dams[J].Structural Control and Health Monitoring,2020,27(3):46-59.
[14] 李雙平,張斌.基于小波與譜分析的大壩變形預(yù)報模型[J].巖土工程學(xué)報,2015,37(2):374-378.
[15] 陳俊風(fēng),王玉浩,張學(xué)武,等.基于小波變換與差分變異BSO-BP算法的大壩變形預(yù)測[J].控制與決策,2021,36(7):1611-1618.
[16] 周濤濤,朱顯明,彭偉才,等.基于CEEMD和排列熵的故障數(shù)據(jù)小波閾值降噪方法[J].振動與沖擊,2015,34(23):207-211.
(編輯:胡旭東)
Time series forecasting model by fusion of wavelet threshold theory and multi-dimensional autoregressive
WAN Xiang,WEI Bowen,XU Fugang,ZHANG Sheng
(School of Infrastructure Engineering,Nanchang University,Nanchang 330031,China)
Abstract:
Aiming at the problems that the traditional statistical model can not fully cover the displacement influence component information and the real influence component information is susceptible to noise interference,a time series model for concrete dam displacement prediction based on wavelet threshold theory and multi-dimensional autoregressive was proposed.The core of this method was to integrate a MATLAB coding platform for data smoothing through different wavelet decomposition layers,wavelet bases,threshold selection criteria,and threshold functions,so as to fully and efficiently mine the influence component information of dam displacement data,and selected the auto-regressive time series model as the prediction model.The engineering application showed that the new fusion model had better prediction performance,which ensured the safe operation of the dam comprehensively and efficiently,and its analysis results had a certain reference value for the data prediction of other digital projects.
Key words:
wavelet threshold theory;multi-dimensional autoregressive model;concrete gravity dam;displacement prediction