陳西強(qiáng),黃張?jiān)?/p>
(河海大學(xué) 測(cè)繪科學(xué)與工程系,江蘇 南京 210098)
抗差估計(jì)的選權(quán)迭代法分析與比較
陳西強(qiáng),黃張?jiān)?/p>
(河海大學(xué) 測(cè)繪科學(xué)與工程系,江蘇 南京 210098)
在抗差穩(wěn)健估計(jì)中,選權(quán)迭代法應(yīng)用最廣,較易理解,M估計(jì)法計(jì)算簡(jiǎn)單?;贛估計(jì)的基本理論,深入分析Huber、Hampel、IGG 3種常用的選權(quán)迭代法,并利用水準(zhǔn)網(wǎng)數(shù)據(jù),分析這3種常用選權(quán)迭代法的適用范圍和相應(yīng)的抗差效果,表明IGG法比其他兩種的抗粗差效果要好,且易實(shí)現(xiàn)。
抗差穩(wěn)健估計(jì);選權(quán)迭代法;Huber法;Hampel法;IGG法
在抗差穩(wěn)健估計(jì)中,最常用的為M估計(jì)法,其估計(jì)方法有許多種,其中選權(quán)迭代法應(yīng)用最廣,較易理解,計(jì)算簡(jiǎn)單。對(duì)于選權(quán)迭代法,理論研究相對(duì)比較多,但對(duì)其中的參數(shù)選取,在理論上有所研究,實(shí)際應(yīng)用研究上存在不夠深入和不足的問題[1-2]。本文在分析M穩(wěn)健估計(jì)基本理論的基礎(chǔ)上,討論了3種常用的選權(quán)迭代法。選用水準(zhǔn)網(wǎng)實(shí)例,深入分析3種選權(quán)迭代法的初始權(quán)選取和條件參數(shù)選取,并從縱橫兩個(gè)方面來進(jìn)行比較、分析這3種常用選權(quán)迭代法的適用范圍和相應(yīng)抗差效果,表明IGG法比其他兩種方法的抗粗差效果要好,且易實(shí)現(xiàn)。
設(shè)有參數(shù)向量X是未知的非隨機(jī)量,為了估計(jì)未知向量值,進(jìn)行n次觀測(cè)得到向量L的觀測(cè)值l,由極大似然估計(jì)有[3]
式中:f是隨機(jī)量L的密度函數(shù)。
Huber提出用ρ(li,x)代替函數(shù)-lnf(li,^x),使其定義廣義化,于是有
式中:φ(li,^x)=?ρ(li,x)/?x。
由式(2)對(duì)參數(shù)x進(jìn)行估計(jì),就是廣義極大似然估計(jì),簡(jiǎn)稱M估計(jì)。測(cè)量平差中,觀測(cè)量L的殘差為V,M估計(jì)的函數(shù)ρ可取為ρ(vi),即M估計(jì)的準(zhǔn)則為
通常殘差V為未知數(shù)的函數(shù),將式(2)對(duì)未知數(shù)x求導(dǎo),取極值點(diǎn),則有
考慮到誤差方程vi=ai^x-li,ai為A的第i行向量,則有
令權(quán)函數(shù)pi(vi)=ρ′(vi)/vi,即得
用矩陣表示為
式(7)類似最小二乘估計(jì)的法方程形式,用權(quán)函數(shù)矩陣P(V)=diag(p1(vi),p2(vi),…,pn(vi))代替觀測(cè)權(quán)陣P。為此,可將穩(wěn)健估計(jì)的選權(quán)迭代法歸結(jié)為如下模型:
誤差方程與權(quán)函數(shù)為
估計(jì)準(zhǔn)則為
將平差模型轉(zhuǎn)換為最小二乘估計(jì)的模型,采用類似最小二乘估計(jì)。只是權(quán)函數(shù)P(V)是殘差的函數(shù),計(jì)算前V未知,只能通過給其賦予一定的初值,采用迭代法估計(jì)參數(shù)^x。具體計(jì)算過程如下:
1)列誤差方程,令各觀測(cè)權(quán)函數(shù)初值均為1,即令p1(vi)=p2(vi)=…=pn(vi)=1。
2)解算法方程,得出^x和V的第1次估值^x(1)=(ATA)-1ATl,V(1)=A^x(1)-l。
3)由V(1)確定各觀測(cè)權(quán)函數(shù)pi(vi),再解算法方程,通過迭代計(jì)算,直到前后兩次解的差值符合要求為止。
4)最后結(jié)果為
隨著函數(shù)ρ的選取不同,可以構(gòu)成權(quán)函數(shù)的多種不同的形式,通常權(quán)函數(shù)是一個(gè)在平差過程中隨改正數(shù)變化的量,經(jīng)過多次迭代,使含有粗差的奇異觀測(cè)的權(quán)函數(shù)為0(或者接近于0),而相應(yīng)的殘差值在很大程度上反映了其粗差值[4-5]。
2.1 Huber法
Huber法的極值估計(jì)準(zhǔn)則是假設(shè)觀測(cè)值在不利分布情況下求最優(yōu)估計(jì)[6]。取M估計(jì)的函數(shù)
由Huber權(quán)函數(shù)可以看出,Huber估計(jì)的權(quán)函數(shù)是單調(diào)的,它在c處的斜率有突然變化。當(dāng)所有改正數(shù)均在-c和c之間時(shí),Huber估計(jì)就是經(jīng)典最小二乘法估計(jì)[7]。而當(dāng)部分改正數(shù)大于c時(shí),其p(v)與改正數(shù)成反比,v愈大,對(duì)應(yīng)的p(v)愈小,與此相應(yīng)該觀測(cè)值對(duì)參數(shù)估計(jì)的影響也愈小。
2.2 Hampel法
對(duì)于Hampel法,取M估計(jì)的函數(shù)為3段截尾函數(shù)
求得權(quán)函數(shù)pi(vi)為
式中:a、b、c為3個(gè)系數(shù),可適當(dāng)選取,它們均為標(biāo)準(zhǔn)差的倍數(shù)。
2.3 IGG法(周文江法)
IGG法是由中國(guó)科學(xué)院測(cè)量與地球物理研究所周文江教授最初提出的,取M估計(jì)的函數(shù)[8]
求得權(quán)函數(shù)pi(vi)為
IGG法屬于有淘汰區(qū)的M估計(jì),權(quán)因子之間變化比較平緩,k值一般取一個(gè)很小的數(shù)。
水準(zhǔn)路線如圖1所示。
圖1 水準(zhǔn)路線
如表1所示水準(zhǔn)網(wǎng),A、B兩點(diǎn)的已知高程分別為HA=5.000 m,HB=6.000 m,觀測(cè)了7條水準(zhǔn)線路,表中帶*號(hào)的表示有粗差的觀測(cè)值,對(duì)h2賦以粗差0.050 m,h6賦以粗差-0.030 m。根據(jù)水準(zhǔn)路線觀測(cè)數(shù)據(jù),按最小二乘原理,在不含有粗差和含有粗差的條件下分別解算,如表2所示。
表1 水準(zhǔn)網(wǎng)觀測(cè)數(shù)據(jù)
表2 基于最小二乘解算結(jié)果
3.1 3種方法分析
對(duì)于 Huber法分析c選取對(duì)估計(jì)結(jié)果影響。在迭代過程中,σ值隨每次迭代后算出的觀測(cè)改正值來確定。在本次數(shù)據(jù)分析中,c分別取 0.4σ、0.8σ、σ、1.2σ、1.6σ、2.0σ、2.5σ,試驗(yàn)數(shù)據(jù)結(jié)果如表3所示。
表3 c選取對(duì)估計(jì)結(jié)果的影響
從表3的數(shù)據(jù)可以知道,隨著c取值的增大,總體上中誤差越來越大,迭代次數(shù)越來越多,到達(dá)一定的時(shí)候,迭代效果失效。而且當(dāng)c為一倍中誤差的時(shí)候,Vh2和Vh6的改正值是最能反映出含有粗差的數(shù)據(jù),但總體效果不是很理想。
對(duì)于Hampel法分析a、b、c的取值對(duì)估計(jì)結(jié)果影響。a、b、c3個(gè)系數(shù)分別取4組值進(jìn)行比較分析,即取a=0.9σ,b=1.8σ,c=2.7σ;a=σ,b=2σ,c=3σ; a=1.1σ,b=2.2σ,c=3.3σ和a=1.2σ,b=2.4σ,c= 3.6σ,試驗(yàn)數(shù)據(jù)結(jié)果如表4所示。
表4 a、b、c取值對(duì)估計(jì)結(jié)果的影響
從表4數(shù)據(jù)分析可知,在a、b、c三者的相互間隔增大的同時(shí),方案1、2、3的估計(jì)結(jié)果沒有大的變化,只是中誤差和迭代次數(shù)都有所增大。當(dāng)三者之間的間隔超出了一定的范圍時(shí),必將導(dǎo)致估計(jì)失效。試驗(yàn)分析得出間隔應(yīng)在0.9~1.1之間,而且當(dāng)間隔太小時(shí),會(huì)導(dǎo)致求解過程中的權(quán)陣單極化。
對(duì)于IGG法分析k取值對(duì)估計(jì)效果影響。分別取k為0.001、0.000 1、0.000 01,試驗(yàn)所得數(shù)據(jù)如表5所示。
表5 k取值對(duì)估計(jì)效果的影響 mm
從表5的數(shù)據(jù)分析可知,只要k值在一定的范圍之內(nèi),即對(duì)估計(jì)的效果沒有影響。權(quán)函數(shù)中的條件是隨著每次迭代得到的中誤差,在整個(gè)迭代過程中是變化的,而且越來越低,隨著滿足迭代條件而終止。
另外,對(duì)于3種選權(quán)迭代方法,分別分析初始權(quán)選取對(duì)估計(jì)結(jié)果的影響。在試驗(yàn)分析中分別采用了初始權(quán)都為1和初始權(quán)按距離定權(quán)的2種方案進(jìn)行數(shù)據(jù)分析,3種迭代方法計(jì)算結(jié)果完全相同,數(shù)據(jù)結(jié)果如表6所示。
表6 初始權(quán)選取對(duì)估計(jì)結(jié)果的影響 mm
從表6的數(shù)據(jù)分析可以看出,初始權(quán)的選取對(duì)3種方法的估計(jì)結(jié)果都沒有影響。
3.2 3種方法比較分析
現(xiàn)對(duì)Huber、Hampel、IGG方法作橫向比較,由這3種方法分別對(duì)這個(gè)已知含有粗差的水準(zhǔn)網(wǎng)觀測(cè)數(shù)據(jù)進(jìn)行平差處理,得到的結(jié)果如表7所示。
表7 不同選權(quán)迭代法比較
從表7的數(shù)據(jù)分析可知,在粗差較大的情況下,在迭代次數(shù)和最后的精度及計(jì)算結(jié)果綜合因素來看,IGG法比 Hampel法和Huber法效果要好。在抗粗差及剔除粗差方面,IGG和 Hampel都能很好地剔除由于h2帶來的粗差0.050 m和h6已賦的粗差-0.030 m,而Huber法相對(duì)來說要差點(diǎn),而且在Huber法中的c值的選取好壞直接影響到抗粗差的能力。
1)穩(wěn)健估計(jì)中的選權(quán)迭代法在初始化權(quán)方面都是相同的,即估計(jì)結(jié)果不受初始權(quán)的取值影響,且在選權(quán)迭代過程中,對(duì)于選權(quán)的標(biāo)準(zhǔn)或條件系數(shù)都是隨著每次迭代完后重新計(jì)算的中誤差相關(guān),說明3種選權(quán)迭代的條件系數(shù)是動(dòng)態(tài)的。
2)對(duì)于 Huber法,隨著c取值的增大,總體上中誤差越來越大,迭代次數(shù)越來越多,到達(dá)一定的時(shí)候,迭代失效,而且當(dāng)c為1倍中誤差時(shí),Vh2和Vh6的改正值是最能反映出含有粗差的數(shù)據(jù),但效果不是很理想,因此,在含粗差較大時(shí),建議 Huber法中c的取值范圍為中誤差的0.8~1.2之間。對(duì)于Hampel法,a、b、c三者的取值在一定范圍內(nèi)相互間隔增大時(shí),估計(jì)結(jié)果沒有大的變化,只是中誤差和迭代次數(shù)都有所增大,當(dāng)三者之間的間隔超出了一定的范圍,將導(dǎo)致估計(jì)失效,試驗(yàn)結(jié)果表明間隔應(yīng)在0.9~1.1之間,而且當(dāng)間隔太小時(shí),會(huì)導(dǎo)致求解過程中的權(quán)陣單極化。在IGG法分析中,k的取值足夠小就能滿足要求,如本文試驗(yàn)k值取0.001~0.000 01。
3)在這3種穩(wěn)健估計(jì)的選權(quán)迭代法中,IGG法比其他兩種的抗粗差效果要好,且易實(shí)現(xiàn);在不清楚數(shù)據(jù)分布的情況下,建議采用IGG法。
[1]陶本藻.穩(wěn)健估計(jì)的應(yīng)用問題[J].地礦測(cè)繪,2000(1): 1-3.
[2]楊元喜.參數(shù)M估計(jì)及驗(yàn)后精度綜述[J].測(cè)繪通報(bào), 1991(6):6-10.
[3]劉大杰 ,陶本藻.實(shí)用測(cè)量數(shù)據(jù)處理方法[M].北京:測(cè)繪出版社,2000:52-58.
[4]吳富梅.多種權(quán)函數(shù)固定臨界值與可變臨界值抗差估計(jì)的比較[J].測(cè)繪工程,2006,15(3):19-22.
[5]李浩軍,唐詩(shī)華,黃杰.抗差估計(jì)中幾種選權(quán)迭代法常數(shù)選取的探討[J].測(cè)繪科學(xué),2006,31(6):70-72.
[6]周江文.經(jīng)典誤差理論與抗差估計(jì)[A].抗差估計(jì)論文集[C].北京:測(cè)繪出版社,1992:1-6.
[7]姚宜斌.基于等價(jià)分析法的穩(wěn)健估計(jì)權(quán)函數(shù)設(shè)計(jì)[J].測(cè)繪工程,2001,10(2):29-31.
[8]楊元喜,宋力杰,徐天河.大地測(cè)量相關(guān)觀測(cè)抗差估計(jì)理論[J].測(cè)繪學(xué)報(bào),2002,31(2):95-99.
Analysisand comparison of the selecting weight iteration method in resistance robust estimation
CHEN Xi-qiang,HUANG Zhang-yu
(Department of Survey Science and Engineering,Hohai University,Nanjing 210098,China)
In the robust estimation,selecting weight iteration method is the most w idely understood,more easily and simp le calculation of M estimation.Based on the basic theory of M estimation method,this paper deep ly analyzes three common selecting w eight iteration methodsw hich are Huber、Hampel、IGGmethods,and analyzes the app licable scope and co rresponding poo r effect on the three commonly selecting w eight iteration methods by using the data of the netwo rk level.It show s that the exco rresponding poo r effect of the IGG is better than other two methods,and easy to achieve results.
resistance robust estimation;selecting weight iteration method;Hubermethod;Hampelmethod;IGGmethod.
P207
A
1006-7949(2010)04-0008-04
2009-09-03
陳西強(qiáng)(1986-),男,碩士研究生.
[責(zé)任編輯:劉文霞]