魯鐵定 何錦亮 徐華卿 賀小星
1 東華理工大學(xué)測繪工程學(xué)院,南昌市廣蘭大道418號(hào),330013 2 江西理工大學(xué)土木與測繪工程學(xué)院,江西省贛州市紅旗大道86號(hào),341000
受多路徑效應(yīng)、地質(zhì)構(gòu)造活動(dòng)、測站相關(guān)誤差以及外界環(huán)境影響,GNSS坐標(biāo)時(shí)間序列中不可避免地存在粗差[1-3],從而對建模精度和結(jié)果的可靠性產(chǎn)生重大影響。因此,探測并剔除GNSS坐標(biāo)時(shí)間序列中的粗差就顯得尤為重要。
經(jīng)典的統(tǒng)計(jì)量粗差探測方法有3σ準(zhǔn)則、四分位距法(inter-quartile range,IQR)以及中位數(shù)絕對偏差法(median absolute deviation,MAD)。其中,3σ法是利用最小二乘法求得觀測序列的殘差,然后對殘差進(jìn)行粗差探測。但最小二乘本身難以抵抗粗差,使得3σ法對殘差的中誤差估計(jì)有偏,從而影響粗差探測的可靠性[2]。IQR法相比3σ準(zhǔn)則受粗差影響較小,具有更好的穩(wěn)健性[4];但對于離散度較大的數(shù)據(jù)會(huì)使估計(jì)值偏大,從而影響粗差探測的效果[5]。MAD法具有抗差性強(qiáng)、對粗差敏感的優(yōu)點(diǎn),相比3σ準(zhǔn)則和IQR法具有更好的穩(wěn)健性[6-7],已廣泛應(yīng)用于粗差探測領(lǐng)域[7-9]。
在GNSS坐標(biāo)時(shí)間序列粗差探測中,首先需構(gòu)建合適的時(shí)間序列模型,獲取殘差序列[2]。近年來,國內(nèi)部分學(xué)者利用小波分析[10](wavelet analysis,WA)、奇異譜分析[1,5](singular spectrum analysis, SSA)、L1范數(shù)[3](L1-norm)獲取GNSS坐標(biāo)時(shí)間序列的殘差向量,并構(gòu)造粗差判別統(tǒng)計(jì)量進(jìn)行粗差探測。這些方法的關(guān)鍵在于如何準(zhǔn)確地提取原始序列的趨勢項(xiàng)和周期項(xiàng),以分離出含粗差的殘差項(xiàng)。其中,奇異譜分析在選取滯后窗口時(shí)具有一定主觀性,不同的滯后窗口對信號(hào)的提取影響較大[11];而文獻(xiàn)[3]中L1范數(shù)與IQR組合算法可能會(huì)對粗差產(chǎn)生“誤判”或“漏判”。小波分析具有局部化時(shí)頻分析能力和多分辨率分析特性,能準(zhǔn)確提取時(shí)間序列的趨勢項(xiàng)和周期項(xiàng),進(jìn)而反映出時(shí)間序列的內(nèi)在特征[12-13]。
因此,本文在MAD法基礎(chǔ)上結(jié)合小波分析,建立一種WT-MAD粗差探測方法,以提高傳統(tǒng)MAD法對GNSS高程時(shí)間序列中偏離度較小的粗差的探測能力。
黃博華等[7]在傳統(tǒng)MAD方法基礎(chǔ)上對其數(shù)學(xué)表達(dá)式進(jìn)行改進(jìn),得到式(1)形式的表達(dá)式。對于服從正態(tài)分布的觀測序列Xn={x1,x2,…,xi,…xn},將觀測數(shù)據(jù)xi與其中位數(shù)K及中位數(shù)絕對偏差(MAD)數(shù)倍之和進(jìn)行比較,若xi滿足
|xi-K|>n·MAD
(1)
則認(rèn)為xi為粗差點(diǎn)。式中,K=Med{xi},MAD=Med{|xi-K|/0.674 5}(Med表示求中位數(shù)),常數(shù)n取值按實(shí)際需求確定,n值較大不易剔除偏離度較小的粗差,而n值較小可能產(chǎn)生誤判,一般取3~5[7,9]。在探測出粗差后,將粗差值設(shè)為0或其他值予以剔除。
GNSS高程時(shí)間序列可看作由不同頻率部分組成的信號(hào),趨勢項(xiàng)、周期項(xiàng)主要集中在低頻信號(hào)中,噪聲和粗差干擾項(xiàng)主要集中在高頻信號(hào)中[14]。本文在傳統(tǒng)MAD方法基礎(chǔ)上,利用小波分析對其進(jìn)行改進(jìn),主要思路如下:利用小波多尺度分解提取原始時(shí)間序列的低頻系數(shù),將其重構(gòu)為趨勢項(xiàng)和周期項(xiàng);原始時(shí)間序列減去重構(gòu)序列得到殘差序列,再利用MAD法對殘差序列進(jìn)行粗差探測,進(jìn)而確定粗差位置。具體步驟如下:
1)利用3σ準(zhǔn)則剔除原始時(shí)間序列X(t)中偏離度較大的粗差,以避免小波分解和重構(gòu)受到影響。對于剔除粗差后的缺失值,采用線性插值法插補(bǔ)得到X′(t)。
(2)
式中,RMSEj表示分解層數(shù)為j時(shí)原始信號(hào)與降噪信號(hào)間的均方根誤差,可由式(3)求得;r為相鄰層數(shù)均方根誤差之比,當(dāng)r接近于1時(shí),則取最佳層數(shù)為j或j+1。
(3)
(4)
4)利用MAD估計(jì)值探測殘差序列中的粗差,當(dāng)殘差ri滿足
|ri-K|>n·MAD
(5)
時(shí),則認(rèn)為ri為粗差點(diǎn),即原始數(shù)據(jù)中xi為粗差點(diǎn)。式中,K為殘差序列的中位數(shù)。步驟1)和4)中探測的粗差即為WT-MAD法探測出的所有粗差。
為驗(yàn)證WT-MAD方法的有效性,采用由趨勢項(xiàng)、周期項(xiàng)和噪聲項(xiàng)所組成的函數(shù)模型[15]對GNSS坐標(biāo)時(shí)間序列進(jìn)行建模,構(gòu)造模擬時(shí)間序列,函數(shù)表達(dá)式如下:
y(t)=b+v0ti+
(6)
式中,i為坐標(biāo)歷元時(shí)刻標(biāo)識(shí),y(ti)為GNSS測站某一分量ti時(shí)刻的坐標(biāo),b為橫軸截距,v0為線性速度,m0為周期性信號(hào)個(gè)數(shù),fm為周期項(xiàng)頻率,am和bm表示頻率為fm的周期項(xiàng)對應(yīng)的振幅,rti為隨機(jī)噪聲。
將利用式(6)模擬的高程方向坐標(biāo)時(shí)間序列作為原始數(shù)據(jù),各參數(shù)設(shè)置為:b=5.0,v0=2,m0=2,a1=b1=5,a2=b2=3,σwn=4。
向原始數(shù)據(jù)中加入粗差:首先模擬服從正態(tài)分布且標(biāo)準(zhǔn)差為6σwn(σwn為噪聲標(biāo)準(zhǔn)差)的隨機(jī)誤差序列;然后提取大于3σwn的數(shù)據(jù),并將其隨機(jī)插入到原始數(shù)據(jù)中,得到一組被粗差污染的GNSS高程時(shí)間序列。模擬時(shí)間序列的時(shí)間跨度為2016~2020年,歷元間隔為1 d,總歷元數(shù)為1 827,粗差總數(shù)為115,粗差占總歷元比例為6.29%(圖1)。
圖1 模擬的高程時(shí)間序列
模擬實(shí)驗(yàn)采用4種方法進(jìn)行對比:LS-3σ法、LS-IQR法、LS-MAD法、WT-MAD法。前3種方法均基于式(6),利用最小二乘法去除趨勢項(xiàng)和周期項(xiàng)以獲取殘差序列,再構(gòu)造粗差判別式進(jìn)行粗差探測。在LS-MAD法中,經(jīng)篩選取n=3;在WT-MAD法中,經(jīng)篩選取n=3,選用db4小波基函數(shù),并利用式(2)求解最佳小波分解層數(shù),相鄰層數(shù)均方根誤差之比見表1。由表可知,第4層和第5層間的均方根誤差之比最小,因此取小波分解層數(shù)為5。粗差探測結(jié)果如圖2和表2所示。
表1 相鄰分解層數(shù)均方根誤差之比
從圖2可以看出,LS-3σ法可探測出大部分粗差,但對偏離度較小的粗差探測效果有限,而LS-IQR法、LS-MAD法和WT-MAD法均可探測出絕大部分粗差。由表2可知,WT-MAD法粗差剔除率為98.3%,高于其他3種方法;雖然LS-IQR法和LS-MAD法均存在1個(gè)誤判,但這兩種方法的粗差探測率與WT-MAD法相近,這主要是因?yàn)槟M時(shí)間序列未考慮季節(jié)項(xiàng)、階躍等非線性變化,且加入的噪聲僅為白噪聲。在先驗(yàn)?zāi)P蜏?zhǔn)確的情況下,利用最小二乘法同樣能準(zhǔn)確獲取模擬數(shù)據(jù)的殘差,從而得到較好的粗差探測效果。在利用WT-MAD法剔除粗差后,通過小波分析可得到去除趨勢項(xiàng)和周期項(xiàng)后的殘差,結(jié)果如圖3所示。從圖3可以看出,殘差序列為白噪聲序列,無明顯異常值,表明WT-MAD法可有效探測出模擬時(shí)間序列中的粗差。
圖2 LS-3σ法、LS-IQR法、LS-MAD法和WT-MAD法粗差探測結(jié)果
表2 各方法粗差探測結(jié)果對比
圖3 WT-MAD法剔除粗差后的殘差序列
本文選用SOPAC(scrips orbit and permanent array center)提供的“Raw”和“Clean”類型的單天高程(U)時(shí)間序列作為實(shí)測數(shù)據(jù),其中“Raw”為原始時(shí)間序列,“Clean”為刪除異常值的時(shí)間序列。
本次實(shí)驗(yàn)選取LHAZ、BJFS、TWTF三個(gè)IGS站2006~2020年共15 a的“Raw”數(shù)據(jù)進(jìn)行分析。在IGS站中,GNSS坐標(biāo)時(shí)間序列數(shù)據(jù)缺失的情況較為常見[16],而小波分析要求原始數(shù)據(jù)均勻采樣,因此在粗差探測前先利用線性插值法插補(bǔ)缺失值。得到完整時(shí)間序列后,以LHAZ站為例,分別利用小波變換與LS法獲取去除趨勢項(xiàng)和周期項(xiàng)后的殘差序列(圖4)。由圖可知,小波變換所得殘差趨近為白噪聲,而LS法獲取的殘差序列含有殘余的周期性信號(hào),表明LS法難以抵御粗差和有色噪聲的影響,而小波變換在無需數(shù)據(jù)先驗(yàn)信息的情況下,能夠更為準(zhǔn)確地提取原始數(shù)據(jù)的趨勢項(xiàng)和周期項(xiàng)。
圖4 LHAZ站高程方向殘差序列
利用WT-MAD法對各IGS站的時(shí)間序列進(jìn)行粗差探測,與模擬實(shí)驗(yàn)相同,采用db4小波基函數(shù),由式(2)求得各站最佳小波分解層數(shù)均為5,取n=3,探測結(jié)果見表3。
表3 LHAZ、BJFS、TWTF三個(gè)IGS站粗差探測結(jié)果
表3中粗差探測結(jié)果表明,3個(gè)IGS站均含有粗差,其中LHAZ站探測出的粗差最少,為100個(gè);BJFS站最多,為104個(gè)。為驗(yàn)證WT-MAD方法的有效性,以LHAZ站為例,得到該方法剔除粗差后的高程時(shí)間序列,并與SOPAC提供的“Raw”數(shù)據(jù)進(jìn)行對比,結(jié)果如圖5~6所示。
圖5 LHAZ站“Raw”高程時(shí)間序列
圖6 WT-MAD法剔除粗差后的LHAZ站高程時(shí)間序列
從圖5~6可以看出,原始時(shí)間序列在歷元2006.5 a、歷元2009.0 a、歷元2014.0 a、歷元2016.0 a以及歷元2019.0 a附近均含有偏離度較大的粗差,而WT-MAD法可剔除這些粗差。
在利用WT-MAD法剔除LHAZ站原始高程時(shí)間序列的粗差后,通過小波變換可得到去除趨勢項(xiàng)和周期項(xiàng)后的殘差,結(jié)果如圖7(a)所示。圖7(b)為SOPAC提供的LHAZ站去除粗差、趨勢項(xiàng)和周期項(xiàng)后的殘差。對比圖7(a)和圖7(b)可知,圖7(b)中歷元2014.0 a和歷元2021.0 a附近仍含有粗差,而圖7(a)中這兩個(gè)歷元附近均無異常值,且殘差序列近似為白噪聲序列,表明WT-MAD法可更有效地剔除原始時(shí)間序列中的粗差。
圖7 LHAZ站殘差序列
為進(jìn)一步驗(yàn)證WT-MAD方法的有效性,分別利用LS-3σ法、LS-IQR法、LS-MAD法和WT-MAD法對表3中3個(gè)IGS站的數(shù)據(jù)進(jìn)行粗差探測,并將利用小波分析提取的趨勢項(xiàng)和周期項(xiàng)作為參照,計(jì)算原始時(shí)間序列剔除粗差前后的RMSE,以此作為評判標(biāo)準(zhǔn),結(jié)果如表4所示。從表4可以看出,3個(gè)測站中WT-MAD法探測出的粗差數(shù)量均多于LS-3σ法、LS-IQR法和LS-MAD法,且RMSE均小于其他3種方法,表明WT-MAD法可得到較好的探測效果。
表4 4種方法粗差探測結(jié)果及精度統(tǒng)計(jì)
本文針對GNSS高程時(shí)間序列非線性、不平穩(wěn)性導(dǎo)致粗差探測困難的問題,構(gòu)建一種基于MAD改進(jìn)的WT-MAD粗差探測方法。該方法在進(jìn)行粗差探測時(shí)不易受趨勢項(xiàng)和周期項(xiàng)等影響,同時(shí)可降低數(shù)據(jù)非對稱分布對MAD法的影響,從而可有效探測粗差。模擬實(shí)驗(yàn)和實(shí)測結(jié)果均表明,相比LS-3σ法、LS-IQR法和LS-MAD法,WT-MAD法可得到較好的探測效果,說明本文方法具有適用性和有效性。
在進(jìn)行小波分析時(shí),小波基函數(shù)及分解層數(shù)根據(jù)經(jīng)驗(yàn)來選取,且需要進(jìn)行重復(fù)實(shí)驗(yàn)確定,這會(huì)影響粗差探測效率,且在一定程度上具有主觀性;若分解層數(shù)過大可能會(huì)造成粗差誤判,過小則可能造成漏判。因此,如何快速、準(zhǔn)確地選取小波基函數(shù)及分解層數(shù)還需進(jìn)一步研究。