丁士俊,姜衛(wèi)平,楊顏梅
(1.武漢大學(xué)測(cè)繪學(xué)院,湖北武漢430079;2.國家測(cè)繪地理信息局精密工程測(cè)量與工業(yè)測(cè)量重點(diǎn)實(shí)驗(yàn)室,湖北武漢430079;3.武漢大學(xué)衛(wèi)星導(dǎo)航定位系統(tǒng)技術(shù)研究中心,湖北武漢430079;4.陜西測(cè)繪地理信息局,陜西西安710000)
整體最小二乘問題首先由G.H.Golub和L.C.F.Van 提出[1],十多年來,人們對(duì)整體最小二乘TLS(total least squares)的算法、解的條件,以及整體最小二乘與最小二乘之間的關(guān)系作了許多理論研究[2]。對(duì)于一些實(shí)際應(yīng)用問題而言,如信號(hào)處理、統(tǒng)計(jì)計(jì)算、回歸分析等都可以歸結(jié)為對(duì)整體最小二乘問題的處理。在勘察測(cè)繪科學(xué)技術(shù)領(lǐng)域中,回歸分析方法是一種處理測(cè)量數(shù)據(jù)常用的方法,回歸分析模型的傳統(tǒng)解法是認(rèn)為自變量x沒有誤差,因變量y為具有偶然誤差的觀測(cè)量,應(yīng)用最小二乘原理,得到回歸參數(shù)的最佳估值[3]。對(duì)于一組測(cè)量數(shù)據(jù)(xi,yi),i=1,2,…,n,如果在同時(shí)考慮觀測(cè)數(shù)據(jù) xi與yi的誤差的前提下,求解回歸參數(shù)的方法屬于整體最小二乘回歸分析問題。文獻(xiàn)[4-8]對(duì)該問題進(jìn)行一些相應(yīng)的研究;文獻(xiàn)[4]與文獻(xiàn)[5]分別從兩種不同的平差方法進(jìn)行了討論;文獻(xiàn)[7]對(duì)文獻(xiàn)[4-5]存在問題進(jìn)行了分析比較,但對(duì)文獻(xiàn)[4-5]中存在的問題沒有給出合理的解釋,得出結(jié)論有點(diǎn)偏頗;文獻(xiàn)[8]證明了整體最小二乘線性回歸條件平差法與間接平差法解的等價(jià)性問題,沒有就精度估計(jì)等價(jià)性給出理論上的證明??紤]到上述這些因素,本文采用測(cè)量平差中處理數(shù)據(jù)建模的方法,對(duì)整體最小二乘線性回歸參數(shù)的求解進(jìn)行較為深入的研究,旨在為整體最小二乘理論在測(cè)量數(shù)據(jù)處理中的應(yīng)用奠定研究基礎(chǔ)。
為了討論問題方便起見,以一元線性回歸為例,設(shè)觀測(cè)點(diǎn)坐標(biāo)為(xi,yi),則一元線性回歸模型為
式中,a、b為回歸參數(shù);Δi為觀測(cè)量yi的真誤差。
如果自變量xi沒有誤差,設(shè)未知參數(shù)a、b的近似值為a0、b0,其改正數(shù)為 d a,d b。按間接平差求解,其誤差方程式為
假設(shè) Pyy為觀測(cè)量 y的權(quán)陣,在最小二乘準(zhǔn)則VTPyyV=min下,則回歸參數(shù)改正數(shù)的估值為
如果考慮自變量x誤差,并假設(shè)x與y相互獨(dú)立,則其回歸模型觀測(cè)方程為
式中,vxi、vyi為觀測(cè)量的改正數(shù)。式(5)是含參數(shù)與觀測(cè)量改正數(shù)的二次項(xiàng),將未知參數(shù)a、b的近似值a0、b0代入式(5),線性化后約去參數(shù)與觀測(cè)量改正數(shù)的二次項(xiàng),則觀測(cè)方程可表示為
其矩陣表達(dá)式為
式(7)表示包含殘差及未知參數(shù)改正數(shù)組成的約束方程,每一個(gè)觀測(cè)數(shù)據(jù)點(diǎn)組成一個(gè)方程,共n個(gè)方程,式中待定量共2n+2個(gè)(其中,包括兩個(gè)參數(shù),2n個(gè)Vx與Vy),故需最小二乘準(zhǔn)則進(jìn)行解算。
考慮到自變量x與因變量y的獨(dú)立性且不等精度,其隨機(jī)模型為
由最小二乘估計(jì)準(zhǔn)則VTPV=min,構(gòu)造極值函數(shù)φ=VTPV-2KT(EV+A d B-L),K為聯(lián)系數(shù)向量矩陣。由極值函數(shù)對(duì)V、d B分別求偏導(dǎo)數(shù),可得
聯(lián)立式(7)、式(9)、式(10)可得到 K、V、d B 的唯一解
則回歸參數(shù)的估值為
取xi0=xi,將未知數(shù)的近似值代入上述平差方程,將觀測(cè)方程線性化,約去參數(shù)改正數(shù)的二次項(xiàng),則誤差方程為
其矩陣表達(dá)式為
式中
按間接平差原理,組成法方程可得
由式(18)第一個(gè)方程可得
將式(19)代入式(18)第二式可得
為了證明上述兩種平差方法的等價(jià)性,比較式(20)與式(14),只需證明式(21)成立
將式(22)代入下式整理得
即式(21)得證,由此可見參數(shù)的解式(14)與式(20)等價(jià)。
同樣可以證明兩種平差方法所得到的觀測(cè)量改正數(shù)相等的結(jié)論,將式(19)代入式(17)得到
對(duì)式(23)進(jìn)一步整理得
由矩陣的恒等性質(zhì)可知,如果矩陣A與B是正則方陣,則矩陣恒等式成立,利用該矩陣恒等性質(zhì),則式(24)中矩陣的第一式改化為
由矩陣的反演公式,將式(25)中矩陣的第二式改為
將式(25)和式(26)代入式(24)整理得
比較式(27)與式(14),即結(jié)論成立。
觀測(cè)量的標(biāo)準(zhǔn)差按下式估計(jì)
式中,n為觀量數(shù)據(jù)點(diǎn)數(shù);t為回歸參數(shù)的個(gè)數(shù),對(duì)于一元線性回歸而言t=2。
就參數(shù)的方差與協(xié)方差的計(jì)算,按方差傳播定律,由式(20)可得到參數(shù)的方差為
式中,DL為L(zhǎng)的方差。由于其向量形式為
式中e=[1 1 …1]T。由式(30)可得L的方差陣為
將式(31)代入式(29)得
回歸分析方法是一種處理測(cè)量數(shù)據(jù)常用的方法,本文在同時(shí)考慮觀測(cè)數(shù)據(jù)xi與yi的誤差的前提下,應(yīng)用整體最小二乘原理,導(dǎo)出了整體最小二乘線性回歸模型的解。按照間接平差與條件平差的原理,證明了整體最小二乘線性回歸模型參數(shù)的解以及標(biāo)準(zhǔn)差的等價(jià)性。
[1]GOLUBG H,VAN L C F.An Anlysis of the Total Least Squares Problem[J].SIAM J.Nuner.Anal,1980,17:883-893.
[2]愈錦成.關(guān)于整體最小二乘問題的可解性[J].南京師大學(xué)報(bào):自然科學(xué)版,1996(1):12-16.
[3]武漢大學(xué)測(cè)繪學(xué)院測(cè)量平差學(xué)科組.誤差理論與測(cè)量平差基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2003.
[4]劉大杰,史文中,童小華,等.GIS空間數(shù)據(jù)處理的精度分析與控制[M].上海:上??茖W(xué)技術(shù)文獻(xiàn)出版社,1999.
[5]王安怡,陶本藻.顧及自變量誤差的回歸分析理論和方法[J].勘察科學(xué)技術(shù),2005(3):29-32.
[6]李雄軍.對(duì) X和 Y方向最小二乘線性回歸的討論[J].計(jì)量技術(shù),2005(1):50-52.
[7]魯鐵定,陶本藻,周世鍵.基于整體最小二乘法的線性回歸建模和解法[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2008(5):504-507.
[8]周世鍵,魯鐵定.雙變量線性回歸解算方法的等價(jià)性[J].江西科學(xué),2009(6):867-870.
[9]孔建,姚宜斌,許雙安.整體最小二乘求取坐標(biāo)轉(zhuǎn)換參數(shù)[J].大地測(cè)量與地球動(dòng)力學(xué),2010(3):74-78.