陳西江 花向紅 魯鐵定 翟高鵬 楊燕景
(1)武漢大學(xué)測(cè)繪學(xué)院,武漢 430079 2)武漢大學(xué)災(zāi)害監(jiān)測(cè)與防治研究中心,武漢 430079 3)東華理工大學(xué)測(cè)繪工程學(xué)院,撫州 344000 4)河北省測(cè)繪產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)站,石家莊050000)
殘差自適應(yīng)回歸TLS*
陳西江1,2)花向紅1,2)魯鐵定3)翟高鵬4)楊燕景3)
(1)武漢大學(xué)測(cè)繪學(xué)院,武漢 430079 2)武漢大學(xué)災(zāi)害監(jiān)測(cè)與防治研究中心,武漢 430079 3)東華理工大學(xué)測(cè)繪工程學(xué)院,撫州 344000 4)河北省測(cè)繪產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)站,石家莊050000)
TLS在擬合及推估過程中,其擬合和推估的殘差會(huì)隨著觀測(cè)數(shù)據(jù)量的增加而呈現(xiàn)上揚(yáng)的趨勢(shì),為了抑制殘差的上揚(yáng),將自適應(yīng)回歸模型引入到TLS的擬合及推估中,采用適宜的回歸模型對(duì)經(jīng)過灰色數(shù)據(jù)處理的殘差進(jìn)行分析,將分析的結(jié)果與TLS的擬合和推估結(jié)果進(jìn)行組合以減弱殘差的影響,從而對(duì)整體的殘差起到了抑制的作用。經(jīng)過實(shí)例分析,驗(yàn)證了該方法的可行性。
TLS;殘差;自適應(yīng)回歸;擬合;回歸模型
總體最小二乘是在最小二乘基礎(chǔ)上發(fā)展起來的同時(shí)考慮自變量和因變量誤差的模型,眾多學(xué)者對(duì)其進(jìn)行了深入的研究,文獻(xiàn)[1]推導(dǎo)了正交TLS模型,Schaffrin[2,3]等人研究了帶權(quán)情況下的 WTLS,Van Huffel和 Vandewalle[4]給出了混合 LS-TLS模型,該模型對(duì)于整體誤差起到了平滑作用。但并沒有起到抑制殘差的作用,在利用擬合確定參數(shù)后的TLS模型進(jìn)行推估的時(shí)候仍將帶有誤差的原始觀測(cè)數(shù)據(jù)x、y作為自變量,這樣推估的結(jié)果不僅具有本身的誤差vz,還將自變量的誤差vx、vy轉(zhuǎn)嫁到所需推估的變量上,其推估的精度就會(huì)降低,從而造成了推估殘差的凸凹現(xiàn)象,為了平滑推估殘差的凸凹及抑制殘差上揚(yáng)的趨勢(shì),本文將自適應(yīng)回歸模型引入到TLS模型中,對(duì)TLS的初始擬合殘差進(jìn)行分析,確定適宜的殘差回歸模型來對(duì)殘差進(jìn)行推估,從而可以抵消TLS推估殘差的凸凹及上揚(yáng),提高了TLS擬合及推估的精度。
總體最小二乘的基本數(shù)學(xué)模型為
文獻(xiàn)[5]提出了同時(shí)顧及x和y相互影響的TLS模型:
本文考慮到對(duì)TLS解算結(jié)果的穩(wěn)定性,采用文獻(xiàn)[1]提出的正交TLS模型:
將式(3)一元正交TLS模型延伸到多元,則:
殘差自適應(yīng)回歸TLS的基礎(chǔ)是對(duì)TLS模型的殘差進(jìn)行分析,根據(jù)原始觀測(cè)數(shù)據(jù),利用正交TLS的性質(zhì),可以解得參數(shù)a、b、c的值,根據(jù)公式(6)得到因變量的擬合值[…],并利用公式(7)將擬合值與真值[z1z2… zn]進(jìn)行殘差處理得到殘差vi:
由于擬合殘差較小或者可能存在負(fù)值,利用公式(8)適當(dāng)加一常數(shù)b把vi序列變?yōu)榉秦?fù)Vi,即
根據(jù)灰色理論的數(shù)據(jù)預(yù)處理,為了較為準(zhǔn)確地對(duì)殘差序列Vi進(jìn)行趨勢(shì)分析,需要對(duì)Vi做一次累加以凸顯其規(guī)律性,得出生成序列,即:
式中
其中i為時(shí)間序列,an、a、b、c為待定系數(shù)。
根據(jù)處理之后的殘差數(shù)據(jù),利用最小二乘對(duì)式(11)、(12)、(13)中的未知參數(shù)an、a,b,c進(jìn)行解算,最終可確定多項(xiàng)式、冥函數(shù)、指數(shù)曲線方程,根據(jù)前n序列的已有擬合殘差信息,利用曲線回歸方程對(duì)殘差信息進(jìn)行擬合,并進(jìn)行擬合結(jié)果誤差的解算,從而得到多項(xiàng)式曲線擬合中誤差、冥函數(shù)曲線擬合中誤差、指數(shù)曲線擬合中誤差,其中,對(duì)于多項(xiàng)式曲線擬合回歸方程,如果項(xiàng)數(shù)太多,就會(huì)陷入過擬合現(xiàn)象,因此本文選用常用的二項(xiàng)式、三項(xiàng)式、四項(xiàng)式曲線回歸方程。根據(jù)擬合結(jié)果圖,剔除偏離殘差離散點(diǎn)最大的曲線回歸方程,對(duì)剩余的曲線擬合中誤差進(jìn)行對(duì)比分析,為了同時(shí)能夠顧及到擬合精度及過度擬合的情況下,將擬合精度最低和擬合精度最高的曲線回歸方程排除,再對(duì)剩余的曲線擬合中誤差進(jìn)行對(duì)比分析,最終將擬合精度較高的回歸方程f (i)作為的推估方程,利用f(i)計(jì)算n+i時(shí)刻的推估值,對(duì)進(jìn)行累減得出殘差Vi的推估值,再將所加入的常數(shù)b消去,便得到TLS擬合殘差vi的推估值。最終利用式(6)對(duì)推估樣本進(jìn)行推估,得到初始推估值,將初始推估值與殘差推估值進(jìn)行結(jié)合,形成最終的TLS推估值z(mì)i:
以文獻(xiàn)[6]中例5.4的數(shù)據(jù)作為樣本(表1),將溫度、壓力作為自變量,變形值作為因變量,將20組觀測(cè)數(shù)據(jù)分為兩部分,前15組數(shù)據(jù)作為擬合樣本,后5組數(shù)據(jù)作為推估樣本,利用公式(5)對(duì)擬合樣本進(jìn)行擬合得到總體最小二乘的參數(shù)為a= 0.397 1,b=-0.055,c=0.916 1,根據(jù)所求的參數(shù)利用公式(6)對(duì)變形值進(jìn)行擬合,并將擬合結(jié)果與原始數(shù)據(jù)相減得到擬合殘差。
表1 觀測(cè)數(shù)據(jù)Tab.1 Observations
通過公式(8)、(9)對(duì)擬合殘差進(jìn)行處理,利用幾種常用的曲線回歸方程對(duì)處理結(jié)果的V1i進(jìn)行擬合(圖1)。
圖1 曲線擬合Fig.1 Curve fitting
通過圖1可直觀判定能夠較為準(zhǔn)確擬合V1i的曲線方程為多項(xiàng)式或冥函數(shù)回歸方程,根據(jù)最小二乘解算原則,確定這兩種曲線回歸方程為:
從表2可知二項(xiàng)式曲線回歸方程擬合精度最低、四項(xiàng)式曲線回歸方程擬合精度最高,在綜合考慮擬合精度及過擬合現(xiàn)象的情況下,將二項(xiàng)式、四項(xiàng)式曲線擬合方程去除,對(duì)于三項(xiàng)式及冥函數(shù)曲線擬合方程,確定精度較高的三項(xiàng)式曲線擬合方程為V1i的回歸模型。利用式(16)與(6)組成的殘差自適應(yīng)回歸TLS對(duì)原始觀測(cè)數(shù)據(jù)進(jìn)行模擬及推估,并將模擬,推估結(jié)果與最小二乘、TLS進(jìn)行對(duì)比分析,結(jié)果如表3、4所示。從表3可知,TLS、最小二乘模擬精度相當(dāng),而殘差自適應(yīng)回歸TLS模擬精度要優(yōu)于其他兩種方法;從表4可明顯看出殘差自適應(yīng)回歸TLS推估精度較優(yōu)于其他兩種方法,同時(shí)從推估殘差可看出,其殘差分布較為平滑,不會(huì)出現(xiàn)太大的凸凹,從而抑制了殘差的上揚(yáng)趨勢(shì),增強(qiáng)了模型的穩(wěn)定度,提高了擬合精度。
表2 曲線擬合誤差對(duì)比分析Tab.2 Comparison of curve fitting error
表3 三種模型的模擬值對(duì)比分析Tab.3 Comparison among the simulation values with three models
表4 三種模型的推估值對(duì)比分析Tab.4 Comparison among the estimation values with three models
本文對(duì)擬合后的數(shù)據(jù)進(jìn)行了分析,將幾種常用的回歸模型引入到擬合殘差中,對(duì)不同回歸模型的擬合精度進(jìn)行了評(píng)價(jià)分析,選取最佳的回歸模型作為擬合殘差的推估模型并對(duì)擬合殘差進(jìn)行模擬及推估,實(shí)現(xiàn)了殘差的推估,同時(shí)隨著序列號(hào)的增加,其模型推估的殘差也呈現(xiàn)出上揚(yáng)趨勢(shì),因此對(duì)殘差進(jìn)行分析并將殘差推估結(jié)果與觀測(cè)數(shù)據(jù)的TLS推估結(jié)果進(jìn)行結(jié)合,實(shí)現(xiàn)了殘差的平滑處理,提高了推估精度。
由于對(duì)殘差序列的分析采用的是幾種常用的回歸模型,而這幾種回歸模型是否適用于所有變形體擬合后的殘差序列,對(duì)多項(xiàng)式曲線擬合過程中,次數(shù)越高,模擬精度越高,但推估的精度可能會(huì)降低,怎樣平衡殘差的擬合精度與推估精度及怎樣選用最佳回歸方程將有待進(jìn)一步探討。
1 張賢達(dá).矩陣分析與應(yīng)用[M],北京:清華大學(xué)出版社,2004.(Zhang Xianda.Matrix analysis and applications[M].Beijing:Tsinghua University Press,2004)
2 Schaffrin B and Felus Y A.On total least squares adjustment with constraints[J].A Windows on the Future of Geodesy,2005,128(4):417-421.
3 Felus Y and Schaffrin B.Performing similarity transformations using the Errors-In-Variables Model[R].American Society for Photogrammetry and Remote Sensing(ASPRS) Annual Meeting,2005.
4 Huffel S Van and Vandewalle J.The least square problem: Computational aspects and analysis,F(xiàn)rontiers in Appl[R].Math.SIAM,Philadelphia,1991.
5 魯鐵定,陶本藻,周世健.基于總體最小二乘法的線性回歸建模和解法[J],武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2008,33(5):504-507.(Lu Tieding,Tao Benzao and Zhou Shijian.Modeling and algorithm of linear regression based on total Least squares[J].Geomatics and Information Science of Wuhan University,2008,33(5):504-507)
6 邱衛(wèi)寧,等.測(cè)量數(shù)據(jù)處理理論與方法[M].武漢:武漢大學(xué)出版社,2008.(Qiu Weining,et al.The theory and method of surveying data processing[M].Wuhan:Wuhan University Press,2008)
RESIDUALS ADAPTIVE REGRESSION TLS
Chen Xijiang1,2),Hua Xianghong1,2),Lu Tieding3),Zhai Gaopeng4)and Yang Yanjing3)
(1)Institute of Surveying and Mapping,Wuhan University,Wuhan 430079 2)Hazard monitoringamp;prevention Research Center,Wuhan University,Wuhan 430079 3)Institute of Surveying and Mapping,East China Institute of Technology,F(xiàn)uzhou 344000 4)The Station of Quality Supervision and Inspection about Surveying and Mapping Products,Shijiazhuang050000)
The TLS fitting and estimation residuals will be upward with the increasing in the amount of observed data in the process of TLS fitting and estimation.In order to curb the trend,the adaptive regression is introduced to the TLS fitting and estimation.The appropriate regression model is used to analyze the residuals handled by gray method.The results of residual analysis is combined to the results of TLS fitting and estimation to weaken the impact of residuals.The experimental results confirm the feasibility of the method.
TLS;residual;adaptive regression;fitting;regression model
1671-5942(2012)03-0090-04
2011-12-26
國(guó)家自然科學(xué)基金(41174010,41074025);精密工程與工業(yè)測(cè)量國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室開放基金(PF2011-17)
陳西江,男,1985年生,博士研究生,主要從事三維激光點(diǎn)云數(shù)據(jù)處理研究工作.E-mail:cxj_0421@163.com
P207
A