鄭 磊,陳宏玉,張啟斌,史永江
(1.天津市市政工程設(shè)計(jì)研究院,天津 300051;2.江蘇省工程物理勘察院,江蘇 南京 210008)
改進(jìn)了系統(tǒng)差附加條件的半?yún)?shù)回歸與模型精化
鄭 磊1,陳宏玉2,張啟斌1,史永江1
(1.天津市市政工程設(shè)計(jì)研究院,天津 300051;2.江蘇省工程物理勘察院,江蘇 南京 210008)
系統(tǒng)差之和 ∑si≠0時(shí),利用附加系統(tǒng)差之和 ∑si=0的半?yún)?shù)模型往往得不到較好的數(shù)據(jù)處理結(jié)果,文中從理論上對(duì)系統(tǒng)差附加條件進(jìn)行了改進(jìn),并基于改進(jìn)前、改進(jìn)后的半?yún)?shù)模型以及經(jīng)典最小二乘平差模型對(duì)系統(tǒng)差之和 ∑si≠0時(shí)的算例進(jìn)行處理。結(jié)果表明,改進(jìn)后的半?yún)?shù)模型大大提高了數(shù)據(jù)處理精度。
系統(tǒng)差;半?yún)?shù)回歸;模型精化
半?yún)?shù)回歸模型是20世紀(jì)80年代統(tǒng)計(jì)學(xué)界為了處理系統(tǒng)偏差而提出來(lái)的,它主要是將信號(hào)視為非隨機(jī)參數(shù),采用補(bǔ)償最小二乘法,得到參數(shù)與信號(hào)的估值。Fischer[1-2]、Hansen[3-4]、孫海燕[5]、丁士俊[6]、王振杰[7]等國(guó)內(nèi)外學(xué)者對(duì)半?yún)?shù)模型、正則矩陣R的選取、平滑因子的確定等問(wèn)題進(jìn)行了研究并給出了一些有益的結(jié)論。其中,孫海燕等在系統(tǒng)差之和滿足 ∑si=0的條件下,推導(dǎo)了相應(yīng)的半?yún)?shù)模型計(jì)算公式[6];劉忠等在正則矩陣為 R=GTG、系統(tǒng)差之和滿足 ∑si=0的條件下對(duì)GPS絕對(duì)定位中的系統(tǒng)偏差進(jìn)行了分離研究[8]。但是,關(guān)于電離層延遲、對(duì)流層延遲等系統(tǒng)差條件的半?yún)?shù)回歸與模型精化的研究還很少。為此,文中在選取正則矩陣 R=GTG,利用L-曲線法確定平滑因子的前提下,對(duì)系統(tǒng)差之和 ∑si≠0條件下的半?yún)?shù)回歸進(jìn)行了理論上的推導(dǎo),并對(duì)改正后模型的數(shù)據(jù)處理效果進(jìn)行了驗(yàn)證。
半?yún)?shù)模型、誤差方程、估計(jì)準(zhǔn)則分別為
式中:L為n維觀測(cè)向量;X為t維參數(shù)向量;B為列滿秩設(shè)計(jì)矩陣;Δ為n維觀測(cè)誤差向量;V為n維殘差向量;S為描述模型誤差或系統(tǒng)誤差的n維向量;P為對(duì)稱正定方陣,觀測(cè)值L的權(quán);R為正則矩陣;α為平滑因子。
由于rank(R)=n-1<n,即 R秩虧,還需再增加一個(gè)約束條件。本文將系統(tǒng)差之和表示為
式中:n為數(shù)據(jù)個(gè)數(shù);C為系統(tǒng)差均值(C=0只是其中的一個(gè)特例)。
平滑因子α可以通過(guò)L-曲線法確定[7],這里不再過(guò)多介紹。
這樣就把平差問(wèn)題歸結(jié)為一個(gè)條件極值問(wèn)題,由拉格朗日乘數(shù)法,構(gòu)造函數(shù)
構(gòu)造一個(gè)模擬的平差問(wèn)題,分別利用經(jīng)典最小二乘法、改進(jìn)前半?yún)?shù)模型、改進(jìn)后半?yún)?shù)模型進(jìn)行平差求解,以更好地說(shuō)明改正后的半?yún)?shù)平差模型的數(shù)據(jù)處理效果。
假設(shè)有線性模型 Y1=B X,并取 X=[3,3]T。B(bi,j)為100×2階矩陣,ti=2*pi*(i-1)/100,i=1,2,3,…,n;bi,1=ti;bi,2=(ti/2)2;K=3為系統(tǒng)誤差均值,系統(tǒng)誤差 Y2=[y1y2…… y100],yi=K+5sin(2*ti);觀測(cè)值的真值 L^=Y1+Y2;觀測(cè)誤差Δ是由100個(gè)服從 N(0,1)分布的正態(tài)隨機(jī)數(shù)組成的列向量;觀測(cè)值L=Y1+Y2+Δ。
由于系統(tǒng)差之和 ∑si=0,只是本文平差模型的一個(gè)特例,因此,可以將系統(tǒng)差均值 C分別設(shè)置為0和3,利用上述平差公式分別進(jìn)行平差,即可對(duì)本文改進(jìn)后的半?yún)?shù)模型數(shù)據(jù)處理效果進(jìn)行驗(yàn)證。
經(jīng)典最小二乘法參數(shù)平差結(jié)果(X jd)、∑si=0時(shí)的半?yún)?shù)模型參數(shù)平差結(jié)果(Xbc0)、∑si=100*3時(shí)的半?yún)?shù)模型參數(shù)平差結(jié)果(Xbc1)與參數(shù)真值(X)如表格1所示。從表格1給出的數(shù)據(jù)可以看出,在系統(tǒng)誤差相對(duì)偶然誤差較大時(shí),經(jīng)典最小二乘平差法得到的參數(shù)結(jié)果嚴(yán)重偏離了真值,證明半?yún)?shù)平差模型有效性;但是,當(dāng)系統(tǒng)差 ∑si≠0時(shí),如果還按照 ∑si=0附加條件的半?yún)?shù)模型平差,那么,參數(shù)平差結(jié)果也將與參數(shù)真值出現(xiàn)較大的偏差;而按照本文給出的系統(tǒng)差附加 ∑si=100*3的半?yún)?shù)模型進(jìn)行平差則得到了較好的結(jié)果。表格1的數(shù)據(jù)表明,本文給出的半?yún)?shù)數(shù)據(jù)處理模型對(duì)于系統(tǒng)均值不為0時(shí)的情況具有很好的處理效果。
表1 3種方案計(jì)算的 X估值的比較
系統(tǒng)差真值(s)、∑si=0時(shí)的半?yún)?shù)模型系統(tǒng)差估值(sbc0)、∑si=100*3時(shí)的半?yún)?shù)模型系統(tǒng)差估值(sbc1)的對(duì)比曲線如圖1所示。從圖1可以看出,利用 ∑si=0時(shí)的半?yún)?shù)模型解算得到的系統(tǒng)差估值明顯偏離了系統(tǒng)差真值,而且這種偏離具有斜向下逐步增大的趨勢(shì);而利用 ∑si=100*3時(shí)的半?yún)?shù)模型解算得到的系統(tǒng)差估值則與系統(tǒng)差真值具有良好的一致性。圖1系統(tǒng)差對(duì)比曲線表明,充分考慮系統(tǒng)差均值不為0之后的半?yún)?shù)模型的系統(tǒng)差分離效果得到了很大提高。
圖1 兩種方案計(jì)算的信號(hào)估值與信號(hào)真值的比較
觀測(cè)值(Lobj)、經(jīng)典最小二乘法擬合觀測(cè)值(L jd)、∑si=0時(shí)的半?yún)?shù)模型擬合觀測(cè)值(Lbc0)、∑si=100*3時(shí)的半?yún)?shù)模型擬合觀測(cè)值(Lbc1)的對(duì)比曲線如圖2所示。從圖2可以看出,L jd曲線近似一條直線且均勻分布在觀測(cè)值的中間。L jd曲線的這種特點(diǎn)可能主要與經(jīng)典最小二乘法模型本身即為線性模型且殘差平方和最小有關(guān)。Lbc0曲線與Lobj曲線存在明顯的偏離,且這種偏離是逐步擴(kuò)大的;而Lbc1曲線則與Lobj曲線具有很好地一致性。Lbc0曲線的這種現(xiàn)象進(jìn)一步說(shuō)明在 ∑si≠0時(shí),如果還按照 ∑si=0時(shí)的半?yún)?shù)模型進(jìn)行平差,那么,擬合觀測(cè)值將存在較大的模型誤差。
圖2 3種方案計(jì)算的觀測(cè)值估值與觀測(cè)值真值的比較
經(jīng)典最小二乘法觀測(cè)值殘差(V jd)、∑si=0時(shí)的半?yún)?shù)模型觀測(cè)值殘差(Vbc0)、∑si=100*3時(shí)的半?yún)?shù)模型觀測(cè)值殘差(Vbc1)的對(duì)比曲線如圖3所示。V jd、Vbc0、Vbc1曲線變化趨勢(shì)從殘差方面進(jìn)一步驗(yàn)證了本文改進(jìn)系統(tǒng)差附加條件后半?yún)?shù)模型數(shù)據(jù)處理效果的有效性。
圖3 3種方案計(jì)算的觀測(cè)值殘差的比較
本文從理論上對(duì)半?yún)?shù)模型系統(tǒng)差附加條件進(jìn)行了改進(jìn)和公式推導(dǎo),通過(guò)模擬算例驗(yàn)證了改進(jìn)后半?yún)?shù)模型數(shù)據(jù)處理的有效性,并在一定程度上拓寬了該模型數(shù)據(jù)處理的有效范圍。
然而,本文給出的只是模擬算例的數(shù)據(jù)處理結(jié)果。如何將本文給出的模型用在消除諸如電離層、對(duì)流層延遲等實(shí)際問(wèn)題當(dāng)中以及在實(shí)際數(shù)據(jù)處理過(guò)程中如何精確確定諸如電離層、對(duì)流層等系統(tǒng)差均值等問(wèn)題還需要進(jìn)一步的研究和探討。
[1]FISCHER B.Collocation,Filtering and Nonparametric Regression(Part I).ZfV,1999,1(1):17-24.
[2]FISCHER B.Collocation,Filtering and Nonparametric Regression(Part II).ZfV,1999,1(2):46-52.
[3]HANSEN PC.Analysis of Distance Ill-posed Prolem s by meansof the L-curve.SIAM Rev.,1992,34(4):561-580.
[4]HANSEN PC,O’LEARY D P.The Use of the Lcurve in the Regularization of Discrete Ill-posed Prolems.SIAM J.Sci.Comp.,1993,14(6):1487-1503.
[5]孫海燕,吳云.半?yún)?shù)回歸與模型精化[J].武漢大學(xué)學(xué)報(bào):自然科學(xué)版,2002,27(2):172-174.
[6]丁士俊,陶本藻.自然樣條半?yún)?shù)模型與系統(tǒng)誤差估計(jì)[J].武漢大學(xué)學(xué)報(bào):自然科學(xué)版,2004,29(11):964-967.
[7]王振杰,歐吉坤.用L-曲線法確定半?yún)?shù)模型中的平滑因子[J].武漢大學(xué)學(xué)報(bào):自然科學(xué)版,2004,29(7):651-652.
[8]劉忠,瞿偉.利用半?yún)?shù)模型精化 GPS絕對(duì)定位中殘余的系統(tǒng)偏差[J].測(cè)繪工程,2007,16(5):28-30
Sem i-parametric regression and model refin ing using modified additional conditions of systematic error
ZHENG Lei1,CHEN Hong-yu2,ZHANG Qi-bin1,SH I Yong-jiang1
(1.Tianjin M unicipal Engineering Design&Research Institute,Tianjin 300051,China;2.Engineering Geophysical Exploration Institute of Jiangsu Provience,Nanjing 210008,China)
The accuracy of the estimated value of the parameters acquired using semi-parametric model w ith the additional condition of the sum of the estimated value of systematic error∑si≠0,w hile the sum of the estimated value of systematic error∑si=0 in fact,was always not good.So the additional condition of the sum of the estimated value of systematic erro r w asmodified theo retically in this paper and the effective of themodified modelw as p roved using the data w hich the sum of the estimated value of systematic error∑si≠0.The result of the data p rocessed show s that the accuracy of the estimated value of the parameters was imp roved effectively.
systematic error;semi-parametric regression;model refine
P228
A
1006-7949(2011)02-0015-03
2010-07-28
國(guó)家863計(jì)劃資助項(xiàng)目(2009AA 12Z301)
鄭 磊(1983-),男,碩士研究生.
[責(zé)任編輯張德福]