王紅平,史 明
(長(zhǎng)春理工大學(xué)機(jī)電工程學(xué)院機(jī)電一體化實(shí)驗(yàn)室,長(zhǎng)春 130022)
最小二乘(LS)方法在數(shù)據(jù)擬合中的應(yīng)用最為廣泛,其常用的基函數(shù)是多項(xiàng)式[1]、有理函數(shù)[2]、曲線擬合中的高斯樣條、指數(shù)樣條、平滑樣條、B樣條、非均勻有理B樣條、Bezier曲面和曲面構(gòu)造中的徑向基函數(shù)。同時(shí),LS的變形為遞歸最小二乘(RLS)、總最小二乘(TLS)、偏最小二乘(PLS)、加權(quán)最小二乘 (WLS)、廣義最小二乘(GLS)[3]、等式約束最小二乘(LSE)。然而,所有基于LS的方法全部是全局逼近格式,不適用于數(shù)據(jù)量大、分布不規(guī)則和分布分散的情況。因此,在測(cè)量數(shù)據(jù)處理中,提出了一種局部逼近的移動(dòng)最小二乘(MLS)方法。
Shepard在最低階情形下引入移動(dòng)最小二乘(MLS)作為逼近方法[4],Lancaster和Salkauskas將其推廣到更高的程度[5]。目前,移動(dòng)最小二乘(MLS)逼近應(yīng)用越來越廣泛,已用于幾何模型的生成[6]、粒子電場(chǎng)的重構(gòu)[7]和正則化回歸中的學(xué)習(xí)性能[8]。MLS近似在文獻(xiàn)中已有大量記載,并被許多學(xué)者用于工程實(shí)際問題的優(yōu)化,如:Fu Fangyan等采用最小二乘粒子流體力學(xué)(MLSPH)方法求解Burgers方程[9],Hosseininia M等提出一種基于移動(dòng)最小二乘(MLS)形狀函數(shù)無網(wǎng)格方法提高了求解模型的精度[10]。MLS逼近不只應(yīng)用于工程問題,在圖像處理中也得到了大量應(yīng)用。Hwang Y等提出一種具有空間約束的概率移動(dòng)最小二乘法,用于圖像之間的非線性顏色轉(zhuǎn)移[11]。Yu Chong等基于運(yùn)動(dòng)積分最小二乘法進(jìn)行輪廓圖像的變形[12],在圖形處理器上利用移動(dòng)最小二乘法加速多維插值等[13]。
雖然MLS得到了大量的應(yīng)用但仍有很大的提升空間,Bayona Victor進(jìn)行了移動(dòng)最小二乘法(MLS)與RBF+poly法兩種無網(wǎng)格法對(duì)插值與導(dǎo)數(shù)逼近的比較,證明MLS在擬合高階多項(xiàng)式時(shí)的局限[14]。Zhang L等針對(duì)移動(dòng)最小二乘未考慮全局變量的缺陷,將基于奇異值分解的參數(shù)λ引入局部逼近,提出了一種MLS的優(yōu)化方法用于生成測(cè)量數(shù)據(jù)的曲線和曲面[15]。但上述方法均未對(duì)加權(quán)函數(shù)進(jìn)行研究,也未對(duì)其中影響參數(shù)進(jìn)行分析。
本文基于MLS通過對(duì)加權(quán)函數(shù)的分析與對(duì)比,提出了改進(jìn)的移動(dòng)最小二乘法(IMLS)。對(duì)移動(dòng)最小二乘的缺陷進(jìn)行了改進(jìn),提升了移動(dòng)最小二乘的擬合性能,增強(qiáng)了其實(shí)用性。
在MLS近似下,試驗(yàn)函數(shù)可以表示為[16]:
(1)
其中,pi(x),i=1,2,…,m,是單項(xiàng)基函數(shù),m是基函數(shù)中的項(xiàng)數(shù),而ai(x)是基函數(shù)的系數(shù)。一般而言基函數(shù)pT(x)=[p1(x),p2(x),…pm(x)]可以是多項(xiàng)式,切比雪夫多項(xiàng)式,勒讓德多項(xiàng)式,三角函數(shù),徑向基函數(shù)等。
通常,基函數(shù)有以下形式:
線性基:
一維:pT=(1,x1)m=2
(2)
二維:pT=(1,x1,x2)m=3
(3)
二次基:
(4)
(5)
由蘭卡斯特和薩爾考斯卡斯定義的局部近似為:
(6)
對(duì)于函數(shù)u(x)的精確局部逼近,必須通過加權(quán)最小二乘法使局部逼近uh(x)和函數(shù)u(x)之間的差值達(dá)到最小化。
定義函數(shù):
(7)
其中,u(xI),I=1,2,…,N,是給定的均勻分布的函數(shù)結(jié)點(diǎn)。w(x-xI)是一個(gè)具有緊湊支持的加權(quán)函數(shù),并且xI,I=1,2,…,n,是點(diǎn)x影響域中的離散點(diǎn),下標(biāo)“I”意味著加權(quán)函數(shù)的中心位于xI處。圖1顯示了MLS中加權(quán)方案的示意圖[17],權(quán)值施加在擬合值與給定值之間的平方誤差上,通過調(diào)節(jié)節(jié)點(diǎn)的權(quán)重值達(dá)到擬合的最優(yōu)化。
圖1 加權(quán)方案示意圖
式(7)的矩陣形式可以表示為:
(8)
(9)
(10)
(11)
a=(a(x),a(x),...,a(x))T
(12)
對(duì)于式(8)關(guān)于系數(shù)a(x)求偏導(dǎo)數(shù),可以得到以下表達(dá)式:
A(x)=pTwp,B(x)=pTw
因此系數(shù)a(x)為:
a(x)=A-1(x)B(x)
(13)
uh(x)=PT(x)a(x)=PT(x)A-1(x)B(x)u=Φ(x)u
(14)
這里的Φ(x)被稱為MLS中的形狀函數(shù)。
1.2.1 總體最小二問題
求解線性系統(tǒng)AX=B中設(shè)矩陣A的誤差矩陣為E,向量b的誤差向量為e,則表達(dá)式等價(jià)于
(A+E)·X=(B+e)
與最小二乘法僅關(guān)注測(cè)量向量誤差e不同,總體最小二乘法綜合考慮了系數(shù)矩陣E和觀測(cè)向量e的誤差,具有較高的計(jì)算精度和可靠性。與遞推最小二乘法相比,該方法無需設(shè)定初值和迭代運(yùn)算,計(jì)算簡(jiǎn)單且便于實(shí)現(xiàn),不需要大量的樣本數(shù)據(jù)。總體最小二乘法的基本思想是使誤差E和e小化,即令矩陣[E?e]的F范數(shù)最小化,可采用奇異值分解法來解算。
構(gòu)造增廣矩陣C,并進(jìn)行奇異值分解為:
C=[AB]=UΣVH
(15)
其中,Σ=diag(σ1,σ2,…,σn+d),設(shè)C的奇異值σ1≥σ2≥…≥σn+d,并進(jìn)行分塊
(16)
當(dāng)且僅當(dāng)V22是非奇異矩陣時(shí)且σn≠σn+1,TLS問題有解,TLS解為:
(17)
其中,V12為k階矩陣,k為待求解維數(shù)。
1.2.2 移動(dòng)最小二乘優(yōu)化
到所有變量的誤差,將在A和B之間設(shè)置參數(shù)λ的TLS方法引入移動(dòng)最小二乘法的局部逼近中,對(duì)移動(dòng)最小二乘(MLS)法進(jìn)行優(yōu)化[16]。
在移動(dòng)最小二乘法的優(yōu)化中,為x處的局部近似值定義Cx:
Cx:=Wx[DAxTBx]=UxΣxVxT
(18)
其中,
Wx=diag(w(x-xI),…,w(x-xn))
D=diag(λ,…,λ)n×n、
T=diag(1-λ,…,1-λ)n×n
在x的影響域中,局部系數(shù)近似值由以下關(guān)系式解出
a(x)=[a1(x),a2(x),…,am(x)]=-Vx12Vx22
(19)
其中,Vx12為P階矩陣:P=m。
根據(jù)文獻(xiàn)[16]所述方法確定參數(shù)λ:為了節(jié)省計(jì)算量和防止導(dǎo)致病態(tài)方程,經(jīng)大量數(shù)值實(shí)驗(yàn)將λ定為定值λ=0.5。
在MLS方法中,選擇擬合性能較好的高斯函數(shù)作為加權(quán)函數(shù),但對(duì)加權(quán)函數(shù)沒有深入研究。本節(jié)對(duì)權(quán)函數(shù)進(jìn)行了詳細(xì)的分析,通過對(duì)正態(tài)權(quán)函數(shù)和兩種典型權(quán)函數(shù)(高斯權(quán)函數(shù)和四次樣條函數(shù))的數(shù)值例子比較,證明了正態(tài)權(quán)函數(shù)在加權(quán)方面的優(yōu)越性,并著重研究了正態(tài)權(quán)函數(shù)及其參數(shù),實(shí)現(xiàn)了MLS方法的改進(jìn)。
權(quán)函數(shù)的選取在MLS 近似中具有重要的作用,對(duì)計(jì)算結(jié)果影響很大,它的選取一般應(yīng)該滿足 4 個(gè)條件:非負(fù)性、緊支性、單調(diào)遞減性,光滑性。目前常見的權(quán)函數(shù)有:高斯型、指數(shù)型、樣條型以及徑向基函數(shù)等。在第3節(jié)中,當(dāng)選擇特定的基函數(shù)時(shí),基函數(shù)矩陣A(x)和觀測(cè)值矩陣B(x)就被確定了,所以它們都與未知點(diǎn)無關(guān),它們只是形成形狀函數(shù)的常數(shù)。因此,只有矩陣w定義在x上,并且形狀函數(shù)主要由加權(quán)函數(shù)決定。
加權(quán)函數(shù)的基本要求是緊支撐、非負(fù)定的、連續(xù)的、具有較高導(dǎo)數(shù)的,以保證系數(shù)的唯一性。緊湊的支撐特性是MLS的本質(zhì),而加權(quán)函數(shù)的緊湊性是由支撐半徑dmi決定的,從圖1可以明顯看出,相對(duì)較大的支持域意味著在計(jì)算中涉及更多的節(jié)點(diǎn),各節(jié)點(diǎn)的權(quán)函數(shù)都是緊支函數(shù),因而在某計(jì)算點(diǎn)x處的MLS近似只需利用對(duì)x有影響的節(jié)點(diǎn)xI(I=1,2,…,N)(節(jié)點(diǎn)xI的權(quán)函數(shù)在x點(diǎn)處不等于零或者說該節(jié)點(diǎn)的支撐域半徑大于它到x點(diǎn)之間的距離)來構(gòu)造。節(jié)點(diǎn)xI的支撐域一般為半徑dmi的圓形區(qū)域(二維問題)如圖2所示或球形區(qū)域(三維問題)。如何選擇合適的支承半徑取決于擬合誤差、平滑度和問題本身的特點(diǎn)。
圖2 二維平面支撐域示意圖
(1)正態(tài)加權(quán)函數(shù):
(20)
σ為參數(shù)。
其中,r=|x-xI|/dmi是相對(duì)距離,dmi是影響域半徑,σ是形狀參數(shù),根據(jù)影響域與支撐域的性質(zhì)及加權(quán)函數(shù)僅在影響域中定義,所以加權(quán)函數(shù)是一個(gè)緊湊的支持函數(shù)。正態(tài)加權(quán)函數(shù)如圖3所示。此外,擬合的平方誤差被加權(quán),只是作為一個(gè)移動(dòng)窗口,簡(jiǎn)單來說就是對(duì)每個(gè)樣本點(diǎn)計(jì)算一次加權(quán)最小二乘法,然后對(duì)該樣本的自變量xi求函數(shù)值f(xi),算出來的(xi,f(xi))就是平滑的結(jié)果,所以MLS與IMLS可以看做是WLS與SLS的結(jié)合。此外|x-xI|為想要求自變量x到附近樣本自變量的歐幾里德距離:
圖3 正態(tài)加權(quán)函數(shù)圖
(2)高斯加權(quán)函數(shù)為:
(21)
β為參數(shù)。
在高斯加權(quán)函數(shù)中,β是形狀參數(shù),r=|x-xI|/dmi是相對(duì)距離,dmi是影響域半徑。
(3)四次樣條函數(shù):
(22)
可以看出在正態(tài)加權(quán)函數(shù)與高斯加權(quán)函數(shù)中有兩個(gè)調(diào)節(jié)參數(shù),分別為dmi,σ和dmi,β,而在四次樣條加權(quán)函數(shù)中只有dmi一個(gè)調(diào)節(jié)參數(shù),圖4顯示了高斯樣條函數(shù)和四次樣條函數(shù),數(shù)值試驗(yàn)表明,β=1.9時(shí),高斯函數(shù)與四次樣條相似甚至近乎一致。相應(yīng)地,正態(tài)加權(quán)函數(shù)和高斯加權(quán)函數(shù)對(duì)于IMLS是非常靈活的,都可對(duì)形狀參數(shù)β和σ進(jìn)行調(diào)節(jié)從而調(diào)節(jié)局部逼近效果,但哪一個(gè)更適用于IMLS,我們將在下面的具體數(shù)值算列中進(jìn)行分析。
圖4 四次樣條與高斯加權(quán)函數(shù)
在這部分給出了兩個(gè)例子來分析權(quán)函數(shù)的選擇。
示例1:選擇函數(shù)
y1=sin(x)·cos(3x)
(23)
利用該函數(shù)選擇均勻分布的節(jié)點(diǎn)(xi,yi),i=1,2,…,n。將正態(tài)分布的均值為零的隨機(jī)誤差σx和σy分別加到xi和yi中,形成一組測(cè)量點(diǎn),基函數(shù)pT(x)=[1,x,x2]。IMLS方法中總體最小二乘參數(shù)λ由上述方法確定。采用正態(tài)加權(quán)函數(shù)和高斯加權(quán)函數(shù)兩種加權(quán)方法對(duì)被測(cè)點(diǎn)進(jìn)行擬合,根據(jù)圖5所示,顯示正態(tài)加權(quán)函數(shù)在擬合性能上優(yōu)于高斯加權(quán)函數(shù),但還需進(jìn)一步驗(yàn)證。
圖5 函數(shù)y1=sin(x)·cos(3x)的兩種加權(quán)的IMLS擬合
示例2:選擇函數(shù)
(24)
測(cè)量點(diǎn)按與示例1相同的方式生成,基函數(shù)pT=[1,x]分別用正態(tài)加權(quán)和高斯加權(quán)進(jìn)行擬合,擬合效果如圖6所示。
圖6 函數(shù)的兩種加權(quán)的IMLS擬合
從數(shù)值實(shí)例中可以看出,正態(tài)加權(quán)擬合性能更好一些。所以在以下的IMLS擬合數(shù)值例子中均采用正態(tài)加權(quán)函數(shù)進(jìn)行加權(quán)。
因此,我們可以在IMLS中得出以下結(jié)論:
(1)對(duì)于基函數(shù)的選擇,線性基、二次基或高階多項(xiàng)式都可以作為候選。雖然隨著多項(xiàng)式階數(shù)的增加,得到了較好的光滑擬合,但是計(jì)算成本會(huì)大幅度增加,甚至?xí)?dǎo)致病態(tài)方程。因此,在二維或三維情況下,只選擇低階多項(xiàng)式。
(2)形狀函數(shù)主要由加權(quán)函數(shù)決定,對(duì)于正態(tài)加權(quán)函數(shù)中的參數(shù)設(shè)置,影響半徑dmi是關(guān)鍵問題。影響半徑越大,支撐域越大,擬合光滑性越好,但是計(jì)算量越大。減小支撐域,局部性增強(qiáng),但平滑度下降。從圖3可以看出,正態(tài)加權(quán)函數(shù)中的形狀參數(shù)σ越小,跟蹤快速變化能力越強(qiáng),使局部性擬合效果增強(qiáng),但平滑度下降,如何選擇合適的dmi與σ,取決于擬合誤差、平滑度和問題本身特點(diǎn)。
通過三個(gè)數(shù)值算例對(duì)IMLS的擬合性能進(jìn)行了研究,前兩個(gè)是周期函數(shù),另一個(gè)是三維圖形函數(shù),測(cè)量點(diǎn)按上一節(jié)的方式生成,在實(shí)例中還應(yīng)用了MLS方法進(jìn)行了比較。他們的公式是:
(25)
(26)
z=x*e-x2-y2
(27)
參數(shù)設(shè)置:
(1)y1,y2中基函數(shù)pT(x)=[1,x,x2],m=3。z中基函數(shù)pT(x)=[1,x,y,x2,xy,y2],m=6。
(2)函數(shù)y1,y2中步長(zhǎng)h=0.01,z中步長(zhǎng)h=0.08。
(3)λ=0.5。
從數(shù)值圖像中可以看出IMLS的擬合效果要優(yōu)于MLS。為了更好的表達(dá)擬合優(yōu)化的效果,列出了誤差表1、2和3,誤差用均方根誤差(RMSE)表示。
(28)
實(shí)例1的擬合曲線如圖7所示,實(shí)例2的擬合曲線如圖8所示,實(shí)例3的擬合曲面如圖9所示。
圖7 函數(shù)y1=sin(2x)+e-x/3(1+cos(3x))的MLS與IMLS擬合
表1 函數(shù)y1=sin(2x)+e-x/3(1+cos(3x))兩種擬合方法的RMSE
圖8 函數(shù)的MLS與IMLS擬合
表2 函數(shù)兩種擬合方法的RMSE
圖9 函數(shù)z=x*e-x2-y2的IMLS擬合
表3 函數(shù)z=x*e-x2-y2兩種擬合方法的RMSE
從上述例子可以看出,IMLS的擬合結(jié)果要優(yōu)于MLS方法。圖10顯示了上述三個(gè)例子IMLS方法的RMSE隨影響參數(shù)線性比的變化情況。從圖中可以看出在一定范圍內(nèi)當(dāng)dmi/σ=0.9~1.1時(shí),誤差值最小。所以在合理的范圍內(nèi)在選取d與σ時(shí),應(yīng)盡量使dmi/σ接近于0.9~1.1,使擬合效果達(dá)到最優(yōu)化,同時(shí)節(jié)省試算時(shí)間。
圖10 均方根誤差RMSE隨dmi/σ的變化走勢(shì)圖
MLS優(yōu)化考慮了所有變量的誤差,將基于奇異值分解的參數(shù)λ引入到局部逼近中,但MLS優(yōu)化沒有對(duì)加權(quán)函數(shù)進(jìn)行深入研究,因此,本文提出了一種MLS近似的改進(jìn)方法。數(shù)值算例和實(shí)測(cè)數(shù)據(jù)擬合表明了IMLS優(yōu)越的擬合性能,可以得出以下結(jié)論:
(1)數(shù)值算例表明在相同條件下,正態(tài)加權(quán)的擬合靈活性不輸于高斯加權(quán),且正態(tài)加權(quán)的擬合性能優(yōu)于高斯加權(quán),所以選擇正態(tài)加權(quán)作為IMLS的加權(quán)函數(shù)是一種合理的優(yōu)化方式。
(2)正態(tài)加權(quán)函數(shù)中的影響域半徑dmi越大,支撐域越大,擬合光滑性越好,但是計(jì)算量越大,減小支撐域,局部性增強(qiáng),但平滑度下降。形狀參數(shù)σ越小跟蹤快速變化能力越強(qiáng),使局部性擬合效果增強(qiáng),但平滑度下降。所以與IMLS方法相比MLS方法具有更大的靈活性。
(3)相同條件下IMLS法與MLS法對(duì)離散數(shù)據(jù)的曲線和曲面擬合結(jié)果表明,IMLS方法比MLS方法具有更好的擬合性能,驗(yàn)證了本文提出的IMLS方法的有效性。因此,IMLS是一種有效的數(shù)據(jù)處理方法。