李 杰
(華北理工大學(xué)礦業(yè)工程學(xué)院,河北 唐山 064000)
變形監(jiān)測對于大壩安全狀態(tài)的評估有著重要的作用,因此確保監(jiān)測點(diǎn)的數(shù)據(jù)具有可靠性和良好的精度是非常有必要的[1-2]。但在實(shí)際的測量中,不可避免地會受到外界因素或人為因素的影響,由此產(chǎn)生的粗差會對整體數(shù)據(jù)的評估造成很大影響,此時再用經(jīng)典最小二乘法會使實(shí)驗(yàn)數(shù)據(jù)的精度受到粗差的影響,使結(jié)果不可靠。而穩(wěn)健估計(jì)法通過對粗差不斷進(jìn)行降權(quán),具有很強(qiáng)的抗差性效果。因此采用穩(wěn)健估計(jì)對大壩監(jiān)測點(diǎn)的數(shù)據(jù)進(jìn)行處理具有非常大的價值。
目前已有諸多學(xué)者使用穩(wěn)健估計(jì)法來降低數(shù)據(jù)采集過程中產(chǎn)生的粗差對實(shí)驗(yàn)數(shù)據(jù)的影響。甄龍等[3]選用了多種穩(wěn)健估計(jì)的方法對GPS中帶有的粗差進(jìn)行評估,得出結(jié)論:當(dāng)在對獨(dú)立變量進(jìn)行處理時,穩(wěn)健估計(jì)能得到較好的結(jié)果。陳開瑞[4]提出了穩(wěn)健的總體最小二乘回歸方法,對地鐵監(jiān)測點(diǎn)的沉降進(jìn)行建模,結(jié)果預(yù)測精度大大提高,證明了該方法在地鐵監(jiān)測中使用的可行性。王剛等[5]利用穩(wěn)健估計(jì)對重慶草堂隧道地表觀測點(diǎn)進(jìn)行研究,證明了穩(wěn)健估計(jì)能很好地剔除誤差,且Huber權(quán)函數(shù)較其他權(quán)函數(shù)有更好的抗差性。本文將運(yùn)用最小二乘法和穩(wěn)健估計(jì)法,在MATLAB環(huán)境中對大壩的變形監(jiān)測數(shù)據(jù)在含有粗差時和不含粗差時進(jìn)行處理,并對其中誤差和決定系數(shù)進(jìn)行對比分析,得出兩種方法的優(yōu)缺點(diǎn)及適用范圍。
在雙江口水電站大壩變形監(jiān)測中,觀測數(shù)據(jù)的精度尤其重要。原始測量由于測量人的疏忽和外部環(huán)境的干擾等,測量數(shù)據(jù)里往往帶有粗差[6]。如果直接對數(shù)據(jù)做平差處理,得到的結(jié)果往往不可靠。因此,為了降低粗差對整體觀測數(shù)據(jù)的影響與干擾,在數(shù)據(jù)處理時調(diào)用權(quán)函數(shù),使獲得的實(shí)驗(yàn)結(jié)果盡可能地接近真值的有效估計(jì)。
如果實(shí)驗(yàn)數(shù)據(jù)中存在自變量x1,x2,x3,…,xn與因變量Y,且因變量與自變量xk(k=1,2…n)有如下線性關(guān)系:
由于本次實(shí)驗(yàn)只涉及時間變化與大壩高程變化兩個變量,因此采用的回歸模型為一元線性回歸模型,即:
式中:Y——大壩高程變化量;
x1——時間變化;
β0——回歸方程常數(shù)項(xiàng);
β1——回歸系數(shù);
ε——隨機(jī)擾動項(xiàng),ε~N(0,σ2)。
根據(jù)測量數(shù)據(jù)與回歸函數(shù)對應(yīng)的擬合值,列出誤差方程式:
式中:V——觀測值的改正數(shù);
B——自變量的系數(shù)矩陣;
——未知參數(shù)的近似值;
L——觀測值Y的列向量。
最小二乘準(zhǔn)則為:
穩(wěn)健估計(jì)可以在有粗差的條件下,盡可能大地減小粗差對實(shí)驗(yàn)數(shù)據(jù)的影響,得出正常模式下的最佳預(yù)測[7-8]。其基本原則就是在平差處理的過程中,通過多次迭代反復(fù)計(jì)算其權(quán)值大小,對有效數(shù)據(jù)進(jìn)行充分利用,對觀測數(shù)據(jù)里精度不高的數(shù)據(jù)進(jìn)行降權(quán)[9],或?qū)写植畹挠^測數(shù)據(jù)不斷進(jìn)行降權(quán)直到接近于零,以消除粗差對實(shí)驗(yàn)數(shù)據(jù)的影響。此時可求出參數(shù)估值,此時的參數(shù)估計(jì)具有穩(wěn)健性,接著可求得回歸方程。設(shè)觀測值的誤差方程為:
限制條件為:
式中:P——觀測權(quán)陣(權(quán)因子初始值都為1);
p——密度函數(shù)。
對公式(6)求導(dǎo),得Ф(Vi)=?p/?Vi,則有:
令權(quán)因子Wi=Ф(Vi)/Vi,等價權(quán)元素,則有則可求出:
式(5)和式(8)為第一次迭代時殘差的估值和參數(shù)的估值,再通過V構(gòu)造新的等價權(quán)P,并計(jì)算法方程,得第二次迭代求出的參數(shù)和殘差V的估值。依照此迭代不斷地進(jìn)行下去,直到前后兩次的差值滿足限差[10]。此時可依此求出參數(shù)的第k次迭代的估值為:
研究使用了該大壩在2018 年6 月至2020 年5 月每月中旬的數(shù)據(jù),監(jiān)測點(diǎn)觀測數(shù)據(jù)如下表1所示。
表1 大壩監(jiān)測點(diǎn)原始觀測數(shù)據(jù)統(tǒng)計(jì)表
由于原始數(shù)據(jù)的變化主要在毫米級上,以2018年6月1 號的原始數(shù)據(jù)高程(Z=2290.3507m)為最初點(diǎn)的數(shù)據(jù),將其余原始數(shù)據(jù)處理為保留到毫米級的水庫點(diǎn)的累積變形量,如表2所示。
表2 處理為毫米級的累計(jì)沉降量統(tǒng)計(jì)表
將原始各時期累積沉降量數(shù)據(jù)Z代入MATLAB 軟件中,對Z變化量進(jìn)行離散值的檢驗(yàn),結(jié)果如圖1所示。
圖1 原始數(shù)據(jù)累積沉降量殘差圖
從圖1可以看出,原始數(shù)據(jù)中沒有離散值,說明原始數(shù)據(jù)是可靠的。接著,分別使用最小二乘回歸法與穩(wěn)健估計(jì)法對原始采樣數(shù)據(jù)進(jìn)行建模,得出各方法的回歸曲線,如圖2所示。
圖2 原始數(shù)據(jù)累積沉降量回歸曲線
此時最小二乘線性回歸方程為:y=5.8355-0.6662x;中誤差σ1=3.2024;R2=0.6934;穩(wěn)健估計(jì)回歸方程為:y=5.7743-0.6648x;中誤差σ2=3.4279;R2=0.7653;由以上實(shí)驗(yàn)結(jié)果可知,在沒有粗差時,最小二乘法和穩(wěn)健估計(jì)法的結(jié)果非常接近。
接著在第22期數(shù)據(jù)中對累積沉降量Z中加入粗差,對帶有粗差時的累積沉降量數(shù)據(jù)的進(jìn)行分析,如圖3所示。從圖3中可知第22期數(shù)據(jù)為粗差,會對整體數(shù)據(jù)精度造成影響,需要被剔除。帶粗差數(shù)據(jù)累積沉降量回歸曲線如圖4所示。
圖4 帶粗差數(shù)據(jù)累積沉降量回歸曲線
從圖4中可以看出,此時最小二乘線性回歸方程為:y=4.7453-0.52x,其中誤差σ1=4.7936,R2=0.3808;穩(wěn)健估計(jì)回歸方程為:y=5.4264-0.62x,其中誤差σ2=3.9471,R2=0.7562。
通過以上數(shù)據(jù)結(jié)果分析可知,對處理有粗差的數(shù)據(jù),穩(wěn)健估計(jì)的中誤差明顯更小,且它的R2也明顯優(yōu)于最小二乘線性回歸,與沒有粗差時的值接近。說明穩(wěn)健估計(jì)已自動對粗差進(jìn)行了降權(quán),使得粗差對整體數(shù)據(jù)的影響較小,也就是穩(wěn)健估計(jì)具有良好的抗差性。
通過對比原始數(shù)據(jù)與加入粗差后的數(shù)據(jù)可以看出,當(dāng)原始數(shù)據(jù)集中沒有粗差時,最小二乘法與穩(wěn)健估計(jì)法的中誤差和方程都比較相似;當(dāng)原始數(shù)據(jù)集中有粗差后,使用經(jīng)典最小二乘回歸擬合出來的結(jié)果明顯偏向粗差,偏離真實(shí)值。而帶有粗差的數(shù)據(jù)集中,穩(wěn)健估計(jì)能通過對粗差降權(quán),使粗差對整體數(shù)據(jù)集的影響降低,它有更小的中誤差和更高的精度表現(xiàn)。總之,采用經(jīng)典最小二乘法和穩(wěn)健估計(jì)法的計(jì)算結(jié)果表明,穩(wěn)健估計(jì)法具有良好的抗差性作用。