朱曉東, 魯鐵定, 陳西江
(東華理工大學(xué)測繪工程學(xué)院,江西撫州 344000)
正交多項(xiàng)式曲線擬合
朱曉東, 魯鐵定, 陳西江
(東華理工大學(xué)測繪工程學(xué)院,江西撫州 344000)
介紹最小二乘法擬合曲線的原理并且找出這種擬合方法的不足,針對這種不足提出另外一種新的擬合方法正交多項(xiàng)式擬合。這種方法能彌補(bǔ)最小二乘擬合中的x擬合y和y擬合x出現(xiàn)的曲線不一樣的現(xiàn)象。這種方法經(jīng)過數(shù)據(jù)實(shí)驗(yàn)精度比最小二乘法擬合更高,而且這種方法中的多項(xiàng)式系數(shù) a可以根據(jù)自己的精度需要來自主選擇迭代的次數(shù),使得結(jié)果更加精確。
最小二乘擬合;正交多項(xiàng)式;隨機(jī)誤差;殘差
在曲線擬合中一般都是以 x或 y為因變量,以y或 x為自變量應(yīng)用最小二乘法來處理。但是用這種方法來處理有一個(gè)前提,自變量和因變量兩者中必須有一個(gè)量是沒有誤差的精確值。在工程測量中所得的測量數(shù)據(jù)是不可能絕對準(zhǔn)確、沒有誤差的,顯然與這種情況不符,自變量的誤差常常被忽略。當(dāng)自變量的誤差較大時(shí),在曲線擬合中就應(yīng)該加以考慮。筆者利用MATLAB設(shè)計(jì)正交最小二乘法擬合的程序來驗(yàn)證,運(yùn)用間接平差原理來詳細(xì)推導(dǎo)了相關(guān)模型和公式 (魯鐵定等,2009)。實(shí)例計(jì)算結(jié)果顯示正交最小二乘法擬合曲線的效果優(yōu)于普通最小二乘擬合法。
在科研計(jì)算和統(tǒng)計(jì)研究中,往往要從大量的實(shí)驗(yàn)數(shù)據(jù) (xi,yi)(i=0,1,…,m)中尋找其函數(shù)關(guān)系y=f(x)的近似表達(dá)式 y=P(x)。但由于實(shí)驗(yàn)數(shù)據(jù)存在誤差,所以只能用連續(xù)的曲線近似地描述平面或空間中的離散點(diǎn)組所表示的坐標(biāo)之間的函數(shù)關(guān)系,其目的是根據(jù)實(shí)驗(yàn)建立因變量與自變量之間有效的經(jīng)驗(yàn)函數(shù)關(guān)系。它包括擬合曲線模型的選取及擬合標(biāo)準(zhǔn)兩個(gè)方面的問題。給定一系列的測點(diǎn) (xi,yi),要求在給定的函數(shù)類φ中尋求一個(gè)最佳的函數(shù),近似代替函數(shù)擬合函數(shù) y=f(x),ri=yiφ(xi)為 i點(diǎn)的擬合殘差 (陳基偉,2007)。擬合的最終目標(biāo)是使得擬合的曲線最大限度逼近,并且使得擬合后的曲線與實(shí)際點(diǎn)的擬合殘差總體上盡可能小,這種方法稱為最小二乘法擬合曲線 (文世鵬,2005;張可村,2003),這里不再詳細(xì)介紹。但是用這種方法來擬合的曲線經(jīng)過實(shí)際數(shù)據(jù)驗(yàn)證發(fā)現(xiàn)用 x擬合 y和用 y擬合 x兩個(gè)曲線相差很大并且精度也相差很多,出現(xiàn)這種情況的原因是因?yàn)閿M合時(shí)這兩種方法都是按照 x或者 y方向來處理的 (圖 1),只是保證了在這一個(gè)方向上殘差最小,并沒有保證是該點(diǎn)到曲線的正交距離最小。因此需用另外一種方法來擬合 ——正交多項(xiàng)式擬合 (潘國榮等,2008)。
圖 1 x擬合 y和 y擬合 x的曲線圖Fig.1 The curve of x fitting y and y fitting x
在實(shí)際測量工作中所測得的一系列坐標(biāo)點(diǎn) x,y必然都存在隨機(jī)誤差,如果只用普通的多項(xiàng)式最小二乘法來擬合顯然就有較大誤差了。對于給定的點(diǎn)組,假設(shè) xi,yi的隨機(jī)誤差分別為σi,γi,考慮到自變量的誤差,擬合的函數(shù)模型可以表示為
其實(shí)殘差 ri是到過曲線某點(diǎn)切線的垂直距離,擬合的準(zhǔn)則為所有坐標(biāo)點(diǎn)到擬合曲線的正交距離平方和最小。因此這種擬合方法稱為正交距離回歸 (丁克良,2010)(圖 2),又稱正交多項(xiàng)式最小二乘擬合法。擬合曲線的觀測方程可以表示為
圖 2 點(diǎn)到曲線的正交距離Fig.2 Po int to the curve of the o rthogona l distance
根據(jù)測量平差原理的間接平差方法對上述誤差方程進(jìn)行求解得
本算例的目的在于比較驗(yàn)證筆者介紹的這種方法來擬合曲線與普通最小二乘法擬合曲線的精度。
表 1 離散點(diǎn)的坐標(biāo)Tab.1 The coo rdina te s of discre te po ints
由表 1中給出的數(shù)據(jù)分別用兩種方法進(jìn)行擬合并且比較兩種擬合方法的精度,使用的兩種方法都是擬合二次曲線。
表 2 普通最小二乘擬合與正交多項(xiàng)式最小二乘擬合Tab.2 O rdina ry lea st squa re s and o rthogonal lea st squa re s po lynom ia l fittin
表 2中普通最小二乘擬合與正交多項(xiàng)式最小二乘擬合的擬合結(jié)果和精度顯示:
(1)本算例共取了十個(gè)點(diǎn),分別采用普通最小二乘法和正交最小二乘擬合選取兩次的多項(xiàng)式模型來擬合曲線,分別計(jì)算出多項(xiàng)式的系數(shù)和中誤差來比較。普通最小二乘法是使擬合的曲線在 x方向上的殘差的平方和最小。但從兩種擬合方式的多項(xiàng)式系數(shù)來看,兩者的擬合參數(shù)有明顯的差別,就精度而言,正交最小二乘法綜合考慮了自變量和因變量的誤差 (劉海香,2004)。
(2)這兩種結(jié)果顯示后者的精度更高一些。但是擬合一個(gè)曲線并不是次數(shù)越高越好,因?yàn)榇螖?shù)越高曲線的振蕩性特別大,因此在實(shí)際的操作中要根據(jù)所選的次數(shù)和所得曲線的中誤差σ0來比較選擇一種最合適的。
(3)在正交多項(xiàng)式擬合中,從式子中可以看出多項(xiàng)式系數(shù)可以任意給出,賦予一定的值,在計(jì)算過程中可以得到多項(xiàng)式系數(shù)的改正數(shù)。因此還可以采用多次迭代的方式來求得方程的系數(shù)αk。
從上述的實(shí)例分析可以看出,正交多項(xiàng)式最小二乘擬合的精度優(yōu)于普通最小二乘擬合,因此在曲線擬合中這種方法更有適用性。
(1)在實(shí)際工作中觀測量的誤差很小可以忽略時(shí),還是應(yīng)該采用普通最小二乘法來擬合曲線,這種方法簡單實(shí)用計(jì)算量比較小,因而應(yīng)用比較廣泛。
(2)在正交多項(xiàng)式最小二乘擬合中可以看出這種方法顧及了自變量和因變量的誤差,從理論上來講這種方法擬合的曲線更合理。但是這種方法在具體計(jì)算中怎樣批量的導(dǎo)入數(shù)據(jù)并且計(jì)算出結(jié)果來還需要編一個(gè)程序來計(jì)算。
陳基偉.2007.工程測量中一類參數(shù)曲線的擬合[J].大地測量與地球動力學(xué),27(1):100-103.
丁克良.2010.整體最小二乘法直線擬合[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版,29(1):44-47.
劉海香.2004.平面上散亂數(shù)據(jù)點(diǎn)的二次曲線擬合[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),6(11):1594-1598.
魯鐵定,周世健,朱煜峰,等.2009.間接平差與矩陣 QR分解[J].東華理工大學(xué)報(bào):自然科學(xué)版,32(2):381-384.
潘國榮,陳曉龍.2008.空間圓形物體數(shù)據(jù)擬合新方法[J].大地測量與地球動力學(xué),28(2):92-94.
文世鵬,張明.2005.應(yīng)用數(shù)值分析[M].北京:石油工業(yè)出版社.
武漢大學(xué)測繪學(xué)院測量平差學(xué)科組.2006.誤差理論與測量平差基礎(chǔ)[M].武漢:武漢大學(xué)出版社.
張可村,趙英良.2003.數(shù)值計(jì)算的算法與分析[M].北京:科學(xué)出版社.
Orthogonal Polynom ial Curve Fitting
ZHU Xiao-dong, LU Tie-ding, CHEN Xi-jiang
(Faculty of Geomatics,East China Institute of Technology,Fuzhou,JX 344000,China)
This paper introduces principle of least-squares fitting curve and finds their shortages.In view of these shortages,putting in a new least squares fitting of orthogonal polynomial.Thisway can compensate a phenomenon that the consequence is different in least-squares fitting curve while x fitting y or y fitting x.This degree of precision ismore higher than least-squares fitting curve,and this method of polynomial coefficients according to their accuracy can independently choose the iteration times,make more accurate results.
least-squares fitting orthogonal polynomial random error residual
O241
:A
:1674-3504(2010)04-398-03
10.3969/j.issn.1674-3504.2010.04.017
2010-06-25
東華理工大學(xué)研究生創(chuàng)新項(xiàng)目“基于 3S技術(shù)在水土流失評價(jià)中的應(yīng)用——以撫州為例”(DYCA10007)
朱曉東 (1987—),男,碩士生,大地測量學(xué)與測量工程專業(yè),研究方向:數(shù)據(jù)處理理論。