范玉茹,師 巖,張幼群,徐 棟
(1.61206 部隊, 北京 100042)
不規(guī)則曲線擬合質(zhì)量評定方法的改進
范玉茹1,師 巖1,張幼群1,徐 棟1
(1.61206 部隊, 北京 100042)
不規(guī)則曲線擬合時,需要按最優(yōu)原則依據(jù)曲線的形狀來選擇擬合函數(shù),構(gòu)造函數(shù)模型。給定數(shù)據(jù)點的多少以及數(shù)據(jù)的擬合方向?qū)η€擬合也會產(chǎn)生影響,因此需要對曲線進行最佳的擬合。衡量曲線擬合模型誤差的精度時,要求觀測數(shù)據(jù)的方差相同且觀測數(shù)據(jù)的協(xié)方差為零,這與一般的實際情況不符。因此,在曲線最佳擬合的基礎(chǔ)上,對評定曲線擬合精度的質(zhì)量標準方法進行了改進,從不規(guī)則曲線擬合的精度及形狀2個方面進行了評價。
不規(guī)則曲線;質(zhì)量評定;協(xié)方差;最佳擬合
矢量地圖數(shù)據(jù)采集無論直接方法還是間接方法,都面臨曲線的處理。常見的有等高線、水系、曲線道路等不規(guī)則形狀的表示。由于直接方法或間接方法所采集的數(shù)據(jù)都只能是曲線的有限點,因此,對曲線的處理有插值和擬合2種方法,前者是將采集數(shù)據(jù)當作無誤差處理,后者則是將采集的數(shù)據(jù)看作含有誤差。對于測量工作而言,只要是數(shù)據(jù)測量,就一定存在誤差,因此,對曲線數(shù)據(jù)的處理常采用擬合的方法。在曲線擬合時,選擇函數(shù)模型比較關(guān)鍵。選用擬合函數(shù)不同,會產(chǎn)生不同的擬合效果,因此需要按最優(yōu)原則依據(jù)曲線的形狀來選擇擬合函數(shù),構(gòu)造函數(shù)模型。除此之外,給定數(shù)據(jù)點的多少對曲線擬合也會產(chǎn)生影響。曲線擬合的誤差分為曲線模型誤差和曲線擬合的偶然誤差2個部分。對曲線進行最佳擬合的原則是綜合考慮系統(tǒng)誤差和偶然誤差的聯(lián)合影響,將模型誤差和數(shù)據(jù)誤差對曲線擬合的影響減小到最小。對矢量地圖數(shù)據(jù)擬合曲線的精度評定,不僅要考慮已知數(shù)據(jù)的偶然誤差,而且要考慮擬合曲線的模型誤差,應(yīng)該將兩者結(jié)合起來完整地去評價擬合曲線的質(zhì)量。在文獻[1]中,藍悅明采用最小二乘擬合曲線,綜合考慮曲線擬合的兩種誤差影響,采用均方誤差MSE(δ)來衡量曲線擬合模型的精度,對各擬合方程的均方誤差進行比較,MSE(δ)最小的即為最佳曲線擬合方程。
式中,X、Y為擬合曲線的縱橫坐標;β為擬合曲線參數(shù);ε為擬合的模型誤差;Δ為擬合數(shù)據(jù)Y的偶然誤差,且E(Δ)=0;n為擬合曲線的觀測個數(shù);t為擬合曲線的參數(shù)個數(shù);σ2為觀測數(shù)據(jù)方差;I為單位矩陣。
但是,使用MSE(δ)來衡量曲線擬合模型誤差的精度時,要求觀測數(shù)據(jù)的方差相同且觀測數(shù)據(jù)的協(xié)方差為零,這與一般的實際情況不符。因此,需要對評定曲線擬合精度的質(zhì)量標準進行探討。
由于最小二乘估計具有無偏性、一致性和有效性,目前曲線擬合的方法多采用最小二乘擬合法,擬合方向一般選用X方向,將Y方向作為真值,使殘差的平方和最小,即
式中,X、Y為觀測點的值;a為曲線待定參數(shù)。
實際上,無論是x坐標還是y坐標都為觀測值,均含有偶然誤差,當采集的數(shù)據(jù)在擬合方向發(fā)生劇烈變化時如圖1第4、5、6點,在選用的某一定方向擬合是值得探討的[2,3]。
圖 1 2種方式的曲線擬合
最佳地擬合各觀測點的估計曲線,應(yīng)使各觀測點到估計曲線的正交距離殘差平方和最小,如圖1b所示,用式子表示即
取坐標xi和待求參數(shù)a為未知數(shù),令
則:
方程中的觀測個數(shù)為2m,未知數(shù)個數(shù)為m+n+1,其矩陣表達式為:
式(8)中,I為單位矩陣,B為m階對角矩陣,表示為:
按式(4),采用參數(shù)平差得:
單位權(quán)中誤差為:
由已知點數(shù)據(jù)來擬合曲線其形狀位置是不確定的,如圖2所示。給定點本身的位置誤差可以根據(jù)點的方差-協(xié)方差來定量地描述,但是,對于曲線模型的不確定性,通常難以定量化描述,因為根據(jù)已知點能構(gòu)成的曲線很多,只能在一定的范圍內(nèi)給其不確定性[4,5]。
圖 2 數(shù)據(jù)擬合的不確定性
在曲線擬合時,對于給定的2點間最大偏差h,可以由給定的2點間長度S和擬合曲線方程來確定,如圖3所示。當選擇不同的擬合函數(shù)模型時,將會得到不同的值。
圖 3 曲線擬合2點間長度s和最大偏差h
對于曲線擬合的原始離散點,它們均含有一定的測量誤差,如圖4所示。實線為真實曲線,虛線為擬合曲線,顯然h1為離散點擬合曲線的最大誤差。對于原始曲線,h1是固定的,可以采用不同的擬合模型來擬合曲線,擬合后的h^1與原始曲線的h1存在偏差通過多次擬合試驗可得,Δ h1可反映出點M1的擬合誤差,依次可以采用整條曲線的來衡量擬合曲線的精度。
圖 4 曲線擬合誤差
由于擬合曲線時,是采用曲線上的特征點來擬合的,特征點在一定程度上代表了曲線的形狀,也是曲線精簡的過程。特征點的提取可參見文獻[6],在上一級特征點提取后,兩相鄰特征點之間的曲線段上距這2個相鄰特征點間直線偏差最大的點,如圖5所示,由此可通過計算特征點的h值來替代真實曲線上的h值。圖5中點(xi,yi)到點(xi-1,yi-1)和點(xi+1,yi+1)所連直線的垂直距離為[6]:
圖 5 除端點外的離散數(shù)據(jù)h值
采用文獻[1]的擬合數(shù)據(jù),同一幅圖上取一組數(shù)字化點,其數(shù)字化精度為σ=0.3 mm,數(shù)據(jù)見表1。分別按式(12)~(14)擬合,擬合結(jié)果如圖6所示,擬合精度見表2。
表 1 數(shù)字化的X、Y坐標值/mm
表 2 數(shù)據(jù)擬合比較
由表2可以看出,對于第二組數(shù)據(jù)不管采用哪種方法,四次多項式擬合的效果比較好。采用正交最小二乘,在擬合精度和擬合效果上都優(yōu)于在y方向的最小二乘擬合。
圖 6 數(shù)據(jù)擬合效果圖
1)自變量誤差較小時,可以忽略自變量誤差,對擬合參數(shù)的影響較小,采用普通最小二乘法計算簡單實用。如果自變量誤差較大,忽略自變量的誤差就會影響參數(shù)的大小,此時應(yīng)該顧及自變量的誤差。
2)正交距離曲線擬合,同時顧及了因變量和自變量的誤差,以正交距離的殘差平方和最小為原則,擬合結(jié)果從整體意義上保持最佳,從幾何意義上,其曲線擬合更合理,改進了普通最小二乘使擬合曲線沿一個方向與實際曲線逼近的效果。
( )參考文獻
[1] 藍悅明.空間位置數(shù)據(jù)不確定性問題的若干理論研究[D].武漢: 武漢大學, 2003
[2] CLesort N C.Statistical Efficiency of Curve Fitting Algorithoms [J].Computational Statistics&Data Analysis,2004 (47):713-728
[3] 丁克良,鷗吉坤,趙春梅.正交最小二乘曲線擬合法[J].測繪科學,2007(5):18-20
[4] 許谷聲.地理信息系統(tǒng)(GIS)中不規(guī)則曲線的不確定性和精度分析[D].上海:同濟大學,1999
[5] 許谷聲,童小華.一種GIS中不規(guī)則曲線數(shù)字化的精度評定方法[J].同濟大學學報,2002(11) :1 361-1 364
[6] Reynders E,Pintelon R,Roeck G.Uncertainty Bounds on Modal Parameters Obtained from Stochastic Subspace Identification[J].Mechanical Systems and Signal Processing, 2008(22):948-969
[7] Liu W,Yang W.Estimating Coordinates of a 2D—Point from Multiple Observations[J].Computers&Geosciences, 2006(32): 1 235-1 246
[8] Ewen J,Donnell G,Burton A,et al.Errors and Uncertainty in Physically—Based Rainfall一 Runoff Modelling of Catchment Change Effects[J].Journal of Hydrology ,2006(330):641-650
[9] Liu Y,Wu L,Mao T.A Direct Error Measure Method for Linear Features Occurred in Digitalization Processes in GIS,2003
P208
B
1672-4623(2015)02-0134-03
10.3969/j.issn.1672-4623.2015.02.047
范玉茹,博士,工程師,主要研究方向為GIS數(shù)據(jù)質(zhì)量控制與評價。
2014-04-17。
項目來源:國家自然科學基金資助項目(41274016)。