范玉茹,師 巖,張幼群,徐 棟
(1.61206 部隊(duì), 北京 100042)
不規(guī)則曲線擬合質(zhì)量評(píng)定方法的改進(jìn)
范玉茹1,師 巖1,張幼群1,徐 棟1
(1.61206 部隊(duì), 北京 100042)
不規(guī)則曲線擬合時(shí),需要按最優(yōu)原則依據(jù)曲線的形狀來選擇擬合函數(shù),構(gòu)造函數(shù)模型。給定數(shù)據(jù)點(diǎn)的多少以及數(shù)據(jù)的擬合方向?qū)η€擬合也會(huì)產(chǎn)生影響,因此需要對(duì)曲線進(jìn)行最佳的擬合。衡量曲線擬合模型誤差的精度時(shí),要求觀測(cè)數(shù)據(jù)的方差相同且觀測(cè)數(shù)據(jù)的協(xié)方差為零,這與一般的實(shí)際情況不符。因此,在曲線最佳擬合的基礎(chǔ)上,對(duì)評(píng)定曲線擬合精度的質(zhì)量標(biāo)準(zhǔn)方法進(jìn)行了改進(jìn),從不規(guī)則曲線擬合的精度及形狀2個(gè)方面進(jìn)行了評(píng)價(jià)。
不規(guī)則曲線;質(zhì)量評(píng)定;協(xié)方差;最佳擬合
矢量地圖數(shù)據(jù)采集無論直接方法還是間接方法,都面臨曲線的處理。常見的有等高線、水系、曲線道路等不規(guī)則形狀的表示。由于直接方法或間接方法所采集的數(shù)據(jù)都只能是曲線的有限點(diǎn),因此,對(duì)曲線的處理有插值和擬合2種方法,前者是將采集數(shù)據(jù)當(dāng)作無誤差處理,后者則是將采集的數(shù)據(jù)看作含有誤差。對(duì)于測(cè)量工作而言,只要是數(shù)據(jù)測(cè)量,就一定存在誤差,因此,對(duì)曲線數(shù)據(jù)的處理常采用擬合的方法。在曲線擬合時(shí),選擇函數(shù)模型比較關(guān)鍵。選用擬合函數(shù)不同,會(huì)產(chǎn)生不同的擬合效果,因此需要按最優(yōu)原則依據(jù)曲線的形狀來選擇擬合函數(shù),構(gòu)造函數(shù)模型。除此之外,給定數(shù)據(jù)點(diǎn)的多少對(duì)曲線擬合也會(huì)產(chǎn)生影響。曲線擬合的誤差分為曲線模型誤差和曲線擬合的偶然誤差2個(gè)部分。對(duì)曲線進(jìn)行最佳擬合的原則是綜合考慮系統(tǒng)誤差和偶然誤差的聯(lián)合影響,將模型誤差和數(shù)據(jù)誤差對(duì)曲線擬合的影響減小到最小。對(duì)矢量地圖數(shù)據(jù)擬合曲線的精度評(píng)定,不僅要考慮已知數(shù)據(jù)的偶然誤差,而且要考慮擬合曲線的模型誤差,應(yīng)該將兩者結(jié)合起來完整地去評(píng)價(jià)擬合曲線的質(zhì)量。在文獻(xiàn)[1]中,藍(lán)悅明采用最小二乘擬合曲線,綜合考慮曲線擬合的兩種誤差影響,采用均方誤差MSE(δ)來衡量曲線擬合模型的精度,對(duì)各擬合方程的均方誤差進(jìn)行比較,MSE(δ)最小的即為最佳曲線擬合方程。
式中,X、Y為擬合曲線的縱橫坐標(biāo);β為擬合曲線參數(shù);ε為擬合的模型誤差;Δ為擬合數(shù)據(jù)Y的偶然誤差,且E(Δ)=0;n為擬合曲線的觀測(cè)個(gè)數(shù);t為擬合曲線的參數(shù)個(gè)數(shù);σ2為觀測(cè)數(shù)據(jù)方差;I為單位矩陣。
但是,使用MSE(δ)來衡量曲線擬合模型誤差的精度時(shí),要求觀測(cè)數(shù)據(jù)的方差相同且觀測(cè)數(shù)據(jù)的協(xié)方差為零,這與一般的實(shí)際情況不符。因此,需要對(duì)評(píng)定曲線擬合精度的質(zhì)量標(biāo)準(zhǔn)進(jìn)行探討。
由于最小二乘估計(jì)具有無偏性、一致性和有效性,目前曲線擬合的方法多采用最小二乘擬合法,擬合方向一般選用X方向,將Y方向作為真值,使殘差的平方和最小,即
式中,X、Y為觀測(cè)點(diǎn)的值;a為曲線待定參數(shù)。
實(shí)際上,無論是x坐標(biāo)還是y坐標(biāo)都為觀測(cè)值,均含有偶然誤差,當(dāng)采集的數(shù)據(jù)在擬合方向發(fā)生劇烈變化時(shí)如圖1第4、5、6點(diǎn),在選用的某一定方向擬合是值得探討的[2,3]。
圖 1 2種方式的曲線擬合
最佳地?cái)M合各觀測(cè)點(diǎn)的估計(jì)曲線,應(yīng)使各觀測(cè)點(diǎn)到估計(jì)曲線的正交距離殘差平方和最小,如圖1b所示,用式子表示即
取坐標(biāo)xi和待求參數(shù)a為未知數(shù),令
則:
方程中的觀測(cè)個(gè)數(shù)為2m,未知數(shù)個(gè)數(shù)為m+n+1,其矩陣表達(dá)式為:
式(8)中,I為單位矩陣,B為m階對(duì)角矩陣,表示為:
按式(4),采用參數(shù)平差得:
單位權(quán)中誤差為:
由已知點(diǎn)數(shù)據(jù)來擬合曲線其形狀位置是不確定的,如圖2所示。給定點(diǎn)本身的位置誤差可以根據(jù)點(diǎn)的方差-協(xié)方差來定量地描述,但是,對(duì)于曲線模型的不確定性,通常難以定量化描述,因?yàn)楦鶕?jù)已知點(diǎn)能構(gòu)成的曲線很多,只能在一定的范圍內(nèi)給其不確定性[4,5]。
圖 2 數(shù)據(jù)擬合的不確定性
在曲線擬合時(shí),對(duì)于給定的2點(diǎn)間最大偏差h,可以由給定的2點(diǎn)間長(zhǎng)度S和擬合曲線方程來確定,如圖3所示。當(dāng)選擇不同的擬合函數(shù)模型時(shí),將會(huì)得到不同的值。
圖 3 曲線擬合2點(diǎn)間長(zhǎng)度s和最大偏差h
對(duì)于曲線擬合的原始離散點(diǎn),它們均含有一定的測(cè)量誤差,如圖4所示。實(shí)線為真實(shí)曲線,虛線為擬合曲線,顯然h1為離散點(diǎn)擬合曲線的最大誤差。對(duì)于原始曲線,h1是固定的,可以采用不同的擬合模型來擬合曲線,擬合后的h^1與原始曲線的h1存在偏差通過多次擬合試驗(yàn)可得,Δ h1可反映出點(diǎn)M1的擬合誤差,依次可以采用整條曲線的來衡量擬合曲線的精度。
圖 4 曲線擬合誤差
由于擬合曲線時(shí),是采用曲線上的特征點(diǎn)來擬合的,特征點(diǎn)在一定程度上代表了曲線的形狀,也是曲線精簡(jiǎn)的過程。特征點(diǎn)的提取可參見文獻(xiàn)[6],在上一級(jí)特征點(diǎn)提取后,兩相鄰特征點(diǎn)之間的曲線段上距這2個(gè)相鄰特征點(diǎn)間直線偏差最大的點(diǎn),如圖5所示,由此可通過計(jì)算特征點(diǎn)的h值來替代真實(shí)曲線上的h值。圖5中點(diǎn)(xi,yi)到點(diǎn)(xi-1,yi-1)和點(diǎn)(xi+1,yi+1)所連直線的垂直距離為[6]:
圖 5 除端點(diǎn)外的離散數(shù)據(jù)h值
采用文獻(xiàn)[1]的擬合數(shù)據(jù),同一幅圖上取一組數(shù)字化點(diǎn),其數(shù)字化精度為σ=0.3 mm,數(shù)據(jù)見表1。分別按式(12)~(14)擬合,擬合結(jié)果如圖6所示,擬合精度見表2。
表 1 數(shù)字化的X、Y坐標(biāo)值/mm
表 2 數(shù)據(jù)擬合比較
由表2可以看出,對(duì)于第二組數(shù)據(jù)不管采用哪種方法,四次多項(xiàng)式擬合的效果比較好。采用正交最小二乘,在擬合精度和擬合效果上都優(yōu)于在y方向的最小二乘擬合。
圖 6 數(shù)據(jù)擬合效果圖
1)自變量誤差較小時(shí),可以忽略自變量誤差,對(duì)擬合參數(shù)的影響較小,采用普通最小二乘法計(jì)算簡(jiǎn)單實(shí)用。如果自變量誤差較大,忽略自變量的誤差就會(huì)影響參數(shù)的大小,此時(shí)應(yīng)該顧及自變量的誤差。
2)正交距離曲線擬合,同時(shí)顧及了因變量和自變量的誤差,以正交距離的殘差平方和最小為原則,擬合結(jié)果從整體意義上保持最佳,從幾何意義上,其曲線擬合更合理,改進(jìn)了普通最小二乘使擬合曲線沿一個(gè)方向與實(shí)際曲線逼近的效果。
( )參考文獻(xiàn)
[1] 藍(lán)悅明.空間位置數(shù)據(jù)不確定性問題的若干理論研究[D].武漢: 武漢大學(xué), 2003
[2] CLesort N C.Statistical Efficiency of Curve Fitting Algorithoms [J].Computational Statistics&Data Analysis,2004 (47):713-728
[3] 丁克良,鷗吉坤,趙春梅.正交最小二乘曲線擬合法[J].測(cè)繪科學(xué),2007(5):18-20
[4] 許谷聲.地理信息系統(tǒng)(GIS)中不規(guī)則曲線的不確定性和精度分析[D].上海:同濟(jì)大學(xué),1999
[5] 許谷聲,童小華.一種GIS中不規(guī)則曲線數(shù)字化的精度評(píng)定方法[J].同濟(jì)大學(xué)學(xué)報(bào),2002(11) :1 361-1 364
[6] Reynders E,Pintelon R,Roeck G.Uncertainty Bounds on Modal Parameters Obtained from Stochastic Subspace Identification[J].Mechanical Systems and Signal Processing, 2008(22):948-969
[7] Liu W,Yang W.Estimating Coordinates of a 2D—Point from Multiple Observations[J].Computers&Geosciences, 2006(32): 1 235-1 246
[8] Ewen J,Donnell G,Burton A,et al.Errors and Uncertainty in Physically—Based Rainfall一 Runoff Modelling of Catchment Change Effects[J].Journal of Hydrology ,2006(330):641-650
[9] Liu Y,Wu L,Mao T.A Direct Error Measure Method for Linear Features Occurred in Digitalization Processes in GIS,2003
P208
B
1672-4623(2015)02-0134-03
10.3969/j.issn.1672-4623.2015.02.047
范玉茹,博士,工程師,主要研究方向?yàn)镚IS數(shù)據(jù)質(zhì)量控制與評(píng)價(jià)。
2014-04-17。
項(xiàng)目來源:國(guó)家自然科學(xué)基金資助項(xiàng)目(41274016)。