張 燦 呂偉才 郭忠臣,4 劉 宇 謝世成
1 安徽理工大學空間信息與測繪工程學院,安徽省淮南市泰豐大街168號,232001 2 安徽理工大學礦山采動災害空天地協同監(jiān)測與預警安徽普通高校重點實驗室,安徽省淮南市泰豐大街168號,232001 3 安徽理工大學礦區(qū)環(huán)境與災害協同監(jiān)測煤炭行業(yè)工程研究中心,安徽省淮南市泰豐大街168號, 232001 4 宿州學院環(huán)境與測繪工程學院,安徽省宿州市汴河中路49號,234000
自動化GNSS監(jiān)測系統(tǒng)可為礦區(qū)開采引起的地表變形提供連續(xù)監(jiān)測數據,對監(jiān)測數據進行分析處理,建立地表下沉預測模型,能夠有效保障礦井安全生產,減少地表開采沉陷對人們生產生活的影響[1]。
地表沉陷變形預測的方法主要有神經網絡模型[2]、灰色系統(tǒng)模型[3]、卡爾曼濾波[4]等,但這些模型均存在一定局限性。周純擇等[2]利用BP神經網絡對盾構施工引起的地表沉降進行預測,預測效果較好,但BP神經網絡本身收斂速度慢,容易陷入局部極小值;劉茂華等[3]利用灰色模型方法預測高層建筑物沉降,對其施工監(jiān)測具有指導意義,但灰色系統(tǒng)模型僅適用于原始數據干擾較小且具有良好光滑性能情形;陳小杰等[4]利用卡爾曼濾波對上海某歷史建筑在基礎托換期間的沉降監(jiān)測數據進行濾波和預測,取得較好效果,模型精度受系統(tǒng)噪聲和觀測噪聲的影響較大,當噪聲統(tǒng)計特性不明確即系統(tǒng)噪聲和觀測噪聲無法精確獲得時,預測精度會隨之降低。對包含各種隨機干擾因素(如采深、采厚、煤層傾角、開采速度等)的GNSS自動化監(jiān)測系統(tǒng)進行地表下沉預測,采用單一預測方法時精度難以提高,因此尋求一種可以綜合多個模型優(yōu)點,有效提高預測效果的組合預測模型具有重要意義。
針對以上問題,本文提出一種地表下沉組合預測模型。首先根據小波變換理論[5],運用Mallat算法對GNSS CORS自動化監(jiān)測站數據進行分解,得到蘊含不同時頻特征的隨機序列和趨勢序列,使不同序列內部擁有更多相似特征。由于卡爾曼濾波具有數據存儲量小、精度高的優(yōu)點,選用卡爾曼濾波對趨勢項進行預測,同時采用遺傳算法(GA)對系統(tǒng)噪聲和觀測噪聲進行尋優(yōu),克服地表下沉過程中噪聲統(tǒng)計特性不明確的影響,構造GA-KF模型。BP-Adaboost神經網絡具有較強的非線性映射能力[6],能夠克服BP神經網絡容易陷入局部極小值的問題,選用BP-Adaboost神經網絡對隨機項進行預測,同時運用混沌理論對隨機項進行相空間重構,構造相空間重構BP-Adaboost模型。因此,本文分別使用GA-KF模型和相空間重構BP-Adaboost模型對趨勢序列和隨機序列進行預測,然后將趨勢序列和隨機序列預測值進行疊加,作為原始監(jiān)測數據的一步預測值。
根據GNSS監(jiān)測數據特征,選取合適的小波基函數確定最佳分解層數,通過小波變換將原始監(jiān)測數據f(t)分解成若干趨勢序列s(t)和隨機序列n(t)之和:
f(t)=s(t)+n(t)
(1)
重構得到的隨機序列和趨勢序列分別為d1,d2…dj和aj。
趨勢項采用GA-KF模型進行預測。以某一監(jiān)測站為例,卡爾曼濾波的動態(tài)離散系統(tǒng)函數模型可表示為:
(2)
式中,Xk為k時刻的系統(tǒng)狀態(tài)向量,Φk,k-1為k-1到k時刻的系統(tǒng)轉移矩陣,Γk,k-1為k-1時刻的系統(tǒng)噪聲系數陣,Wk-1為系統(tǒng)噪聲向量,Bk為k時刻觀測矩陣,Vk為k時刻觀測噪聲向量,Lk為k時刻觀測值。
與式(2)對應的卡爾曼濾波遞推公式為:
(3)
(4)
(5)
式中,n為數據樣本。按所選擇的適應度函數采用遺傳算法中復制、交叉及變異對個體進行篩選,通過不斷迭代,直至滿足終止條件,求得最優(yōu)Q、R值,建立GA-KF預測模型進行一步預測。
BP-Adaboost模型是把單獨一個BP神經網絡看成弱預測器,對BP神經網絡反復訓練以預測樣本輸出,再通過Adaboost算法將多個BP神經網絡加權組合成一種強預測器,最后輸出訓練結果[8]。
假設隨機序列為{x(i),i=1,2,…,N},N為該序列長度。采用坐標延遲法完成相空間重構,得到重構后的m維相空間Yj={xj,xj+τ,…,xj+(m-1)τ},其中j=1,2,…,M,并構造如式(6)所示映射作為BP-Adaboost模型的輸入與輸出,構建相空間重構BP-Adaboost模型對隨機序列進行預測。
(6)
式中,相點個數M=N-(m-1)τ,嵌入維數m和延遲時間τ分別采用G-P算法和自相關函數法獲取[9-10]。
將趨勢項預測值與隨機項預測值求和作為該組合模型的最終預測值。具體構建流程如圖1所示。
圖1 模型構建流程Fig.1 Flowchart of model construction
選取監(jiān)測站觀測時間為2021-09-12~11-27,觀測間隔為6 h,共305期(編號為1~305)高程分量監(jiān)測值作為實驗數據。首先以最近連續(xù)100期(編號為201~300)數據為例,對最后5期數據進行一步預測;再研究不同長度時間序列數據建模對預測精度的影響,劃分5種預測任務:分別選取連續(xù)300期(編號1~300)、200期(編號101~300)、150期(編號151~300)、100期(編號201~300)、50期(編號251~300)監(jiān)測數據對最后5期進行預測。
首先利用db4正交小波對監(jiān)測站201~305期數據進行2~5層分解與重構。根據去噪前后信噪比最高、均方誤差最小的原則,確定分解層數為3層,并得到趨勢項序列a3和隨機項d1、d2、d3,趨勢項和隨機項提取結果見圖2。對于趨勢項a3,利用GA-KF模型進行一步預測,得到趨勢項預測值,其中遺傳算法的最大迭代數為100,種群規(guī)模為30,交叉和變異概率分別為0.5和0.01。對于各隨機項d1、d2、d3,采用相空間重構BP-Adaboost預測模型進行一步預測。
圖2 趨勢項與噪聲項Fig.2 Trend and noise term
以隨機項d1為例進行相空間重構。首先采用G-P算法和自相關函數法確定隨機項d1的嵌入維數m和延遲時間τ。由G-P算法得到lnC(r)與lnr的關系如圖3所示,從圖中可以看出,隨著嵌入維數m增大,當m取7~10時雙對數曲線中直線段部分的斜率(即關聯維的大小)基本保持不變(達到飽和),取第1次達到飽和時的嵌入維數m=7,計算出關聯維D=2.85,為非整數,說明該隨機項具有混沌特性,可以進行相空間重構。將重構后的m維數據作為BP-Adaboost模型的輸入值進行預測,得到隨機項d1的預測值。
圖3 lnC(r)與lnr關系曲線Fig.3 Relationship between lnC(r) and lnr
BP-Adaboost模型對隨機項d1進行預測時的網絡輸入為相空間重構得到的7維數據,輸出為1維高程數據,隱含層節(jié)點數為8,網絡拓撲結構為7-8-1。d2和d3序列的關聯維和嵌入維如表1所示。同理,隨機項d2和d3可通過相同方法得到預測值。
表1 隨機序列的嵌入維和關聯維
最后將趨勢項序列和3個隨機項序列的預測結果疊加,得到組合模型預測值。為驗證組合模型的預測效果,采用GA-KF模型(方案1)、相空間重構BP-Adaboost模型(方案2)進行預測, 與本文組合模型(方案3)預測結果進行對比,結果見表2(預測值及其殘差),各方案預測值和實際值對比如圖4所示。
表2 各模型計算結果對比
圖4 建模序列長度為100期的預測結果Fig.4 Prediction results of modeling sequencelength with 100
由表2可知,方案1和方案2的預測殘差較大,其中方案1有3期殘差序列絕對值超過1 mm,最大殘差達到-1.534 mm;方案2有2期殘差序列絕對值超過1mm,最大殘差達到-1.774mm;而方案3各期殘差序列絕對值均小于1 mm,最大殘差僅為-0.479 mm。表明本文組合模型的預測精度相較于其他兩種模型有大幅提升。
由圖4可以看出,方案3的一步預測值在整體變化趨勢上更接近實測值,且每一期的相對誤差均小于方案1和方案2,最大相對誤差僅為0.002%;而方案1和方案2的最大相對誤差分別為0.006%和0.007%,說明方案3綜合了單一GA-KF模型和BP-Adaboost模型的優(yōu)點,可實現優(yōu)勢互補,能更加全面地分析預測復雜數據,預測效果也更加穩(wěn)定。
為驗證不同模型的預測精度是否與原始建模序列長度有關,分別選取最后5期數據的前50、150、200、300期數據建模,對其進行預測。按照上述同樣方法,分別使用3種方案對不同長度的沉降序列進行預測,結果見圖5和圖6。
圖5 不同長度沉降序列建模預測結果Fig.5 Modeling prediction results of subsidence sequences with different lengths
圖6 不同建模序列長度下各模型預測誤差Fig.6 Prediction errors of each models with different sequence lengths
由圖5和圖6可知,不同模型的預測精度與原始建模序列長度有一定關系,其中BP-Adaboost模型受影響最大,在序列長度為50期時精度最差,平均相對誤差和殘差平均值分別為0.008 5%和2.020 mm;當建模序列為100期時,平均相對誤差和殘差平均值降為0.004 5%和1.065 mm,此時預測精度最好;此后增加序列長度,預測效果逐漸降低,但降低幅度相對較小。GA-KF模型受建模序列長度影響相對較小,但總體預測精度較低,隨著序列長度增加,其預測精度并未顯著提升,且待預測位置與最開始位置數據的相關性會逐漸減弱,以至于在序列長度為300期時精度變低。本文組合模型受其他兩種模型影響,建模序列長度為50期時精度最差,平均相對誤差和殘差平均值為0.003 0%和0.667 mm;在建模序列長度為100期時精度最高,平均相對誤差和殘差平均值降為0.000 6%和0.132 mm;此后隨著建模序列長度增加,預測精度也小幅度降低,但相比于其他兩種模型,該組合模型受影響程度相對較小,且預測精度較高,平均相對誤差保持在0.003%以內,遠小于其他兩種模型。由此可見,本文提出的礦區(qū)地表下沉預測模型,抗干擾能力強,預測效果穩(wěn)定,在實際工程中,可以合理選擇建模序列長度,無需持續(xù)增加數據量,否則會導致計算效率變低,甚至影響預測精度。
為進一步比較3種模型的預測精度,采用平均絕對誤差(MAE)、均方根誤差(RMSE)對不同建模序列長度預報結果的精度進行統(tǒng)計分析(表3,單位mm)。
表3 各模型精度對比
由表3可知,對于不同建模序列長度,本文提出的組合模型預測效果均優(yōu)于其他兩種模型,在序列長度為100期時效果最好,相比于GA-KF模型和相空間重構BP-Adaboost模型,MAE分別降低0.847 mm和0.927 mm,RMSE分別降低0.852 mm和1.303 mm。由此可知,通過小波分析充分挖掘沉降數據中復雜的變化特征,采用GA-KF模型預測趨勢序列以及相空間重構BP-Adaboost模型預測隨機序列可以更好地提取各子序列的沉降信息,有效提高預測精度,對礦區(qū)GNSS監(jiān)測數據具有較強的適應性及穩(wěn)定的預測能力。
針對傳統(tǒng)預測模型的單一性,本文提出地表下沉組合預測模型。通過實驗分析,得出以下結論:
1)利用遺傳算法對卡爾曼濾波進行優(yōu)化,得到GA-KF預測模型,可有效克服噪聲矩陣難以直接確定的缺陷,對剔除大部分干擾的趨勢項進行單步預測;同時考慮隨機項的混沌特性,構建相空間重構BP-Adaboost預測模型對隨機項進行預測,最后得到的組合模型可綜合單一模型的優(yōu)勢,具有更好的預測效果。
2)通過分析發(fā)現,不同長度監(jiān)測序列建模的預測效果不同,本文構建的組合模型具有一定的抗干擾能力,受影響較小,在建模序列長度為100期時精度最高,平均絕對誤差僅為0.138 mm,均方根誤差為0.223 mm,遠小于其他兩種預測模型。