尚 彧,張 燕
(遼寧石油化工大學(xué) 計(jì)算機(jī)與通信工程學(xué)院,遼寧 撫順113001)
曲線擬合是一種用于對(duì)多維度數(shù)據(jù)進(jìn)行處理和顯示的方法,廣泛的應(yīng)用于計(jì)算機(jī)輔助設(shè)計(jì)、實(shí)驗(yàn)分析以及圖形圖像顯示等方面。和大部分?jǐn)M合課題一樣,曲線或曲面擬合課題的核心在于選擇目標(biāo)函數(shù),目標(biāo)函數(shù)的好壞直接決定到曲線或曲面參數(shù)的準(zhǔn)確性、結(jié)果的精確度和計(jì)算過程的復(fù)雜度[1]。
曲線擬合的信息點(diǎn)在采集過程中有著隨機(jī)性和模糊性等特點(diǎn)。云理論擁有綜合分析隨機(jī)性、模糊性以及相互間關(guān)聯(lián)性的優(yōu)點(diǎn)。本文以云理論特點(diǎn)的基礎(chǔ)上,提出了一種優(yōu)化的曲線擬合方法,即基于云理論曲線擬合。
云是使用語言值來表示某個(gè)定性概念與其定量表示之間的不確定性轉(zhuǎn)換理論模型。它主要用于反映客觀世界中事物或人類知識(shí)中概念的兩種不確定性因素:隨機(jī)性、模糊性,并將二者有效的集成在一起,構(gòu)成定性和定量的映射。在數(shù)域空間中,云是一朵可伸縮、無邊沿、有彈性、近視無邊、遠(yuǎn)觀象云的一對(duì)多的數(shù)學(xué)映射圖象,與自然現(xiàn)象中的云有著相似的不確定性質(zhì),所以借用“云”來命名這個(gè)理論[2]。
設(shè)U是一個(gè)用精確數(shù)值表示的定量論域,X?U,T是U空間上的定性概念,若元素x(x?X)對(duì)T的隸屬的確定度:CT(x)∈[0,1]是一有穩(wěn)定傾向的隨機(jī)數(shù),則概念T從論域U到區(qū)間[0,1]的映射在數(shù)域空間的分布,稱為云(cloud)。
云理論主要研究自然語言中的最基本的語言值所蘊(yùn)含的不確定性的普遍規(guī)律,使得有可能從語言值表達(dá)定性信息中獲得定量數(shù)據(jù)的范圍和分布規(guī)律,也有可能把精確數(shù)值有效轉(zhuǎn)換為恰當(dāng)?shù)亩ㄐ哉Z言值,從而將隨機(jī)性和模糊性有效的集成起來。
云的數(shù)學(xué)特征是對(duì)定性概念的定量特性進(jìn)行的表征,它云模型、虛擬云、云運(yùn)算和云轉(zhuǎn)換的數(shù)值依據(jù),主要由期望(Ex)、熵(En)和超熵(He)組成[3]。
1)期望(Ex)是某個(gè)定性概念在論域中的中心值,代表了該概念在數(shù)域空間中的點(diǎn)值,一般用是云中心對(duì)應(yīng)的x值來表征。
2)熵(En)在云模型中用于定性概念的模糊度和概率進(jìn)行綜合表征,對(duì)隨機(jī)性和模糊性以及之間的關(guān)聯(lián)性進(jìn)行定義。
3)超熵(He)是熵的不確定度量,也稱為熵的熵,用于表征在數(shù)域空間代表該語言值的所有點(diǎn)的不確定度的凝聚性,即云滴的凝聚度。超熵的數(shù)值也間接地表征了云的離散程度和厚度,例如超熵的值越大,則云滴的離散度越大,云的“厚度”也越大。
使用上述3個(gè)特征數(shù)值就可以對(duì)云進(jìn)行描述,把定性概念的模糊性和隨機(jī)性有機(jī)地結(jié)合在一起,從而實(shí)現(xiàn)了定性語言值與定量數(shù)值之間的有效轉(zhuǎn)換。
云模型是進(jìn)行定性語言值與定量數(shù)值之間轉(zhuǎn)換的基礎(chǔ)和模型,也是云理論的核心。云模型的單位是基云,與之對(duì)應(yīng)的是自然語言中的基本單位語言原子。云模型能夠研究自然語言中的語言原子中所包含的不確定性的普遍規(guī)律,從而獲得定性信息中獲定量數(shù)據(jù)的范圍和分布規(guī)律,并進(jìn)一步把精確數(shù)值轉(zhuǎn)換為定性語言值。云模型具有宏觀精確可控,微觀模糊不可控的特點(diǎn),其本質(zhì)是云滴組成的概念云。云模型的這些優(yōu)點(diǎn)不但克服了概率統(tǒng)計(jì)論及粗集論的不足、解決了作為模糊集理論基石的隸屬函數(shù)的不徹底性,同時(shí)有效地反映語言值中蘊(yùn)涵的模糊性和隨機(jī)性,為解決空間數(shù)據(jù)挖掘中的不確定性問題提供了可靠方法[4]。
1)正態(tài)云模型
正態(tài)云模型一種基礎(chǔ)的云模型,它是一種用于有效表征語言原子的工具[5]。很大一部分社會(huì)和自然科學(xué)中定性知識(shí)的云的期望曲線都近似服從正態(tài)或半正態(tài)分布。從論域空間來看,正態(tài)云模型的某一點(diǎn)的分布規(guī)律符合統(tǒng)計(jì)學(xué)意義上的正態(tài)分布規(guī)律,由期望和熵的值能夠確定具有正態(tài)分布規(guī)律的云期望曲線方程
正態(tài)云模型分為完整云、左半云和右半云3種。完整云用于表征具有雙側(cè)特征的定性概念,半云模型用于表征具有單側(cè)特征的定性概念,如圖1所示。
圖1 正態(tài)云圖Fig.1 Diagram of normal clouds
正態(tài)云的生成算法如下:
①Xi=G(Ex,En),得到期望值 Ex,標(biāo)準(zhǔn)差 En的正態(tài)隨機(jī)數(shù)Xi;
②Eni=G(En,He),得到期望值 Ex,標(biāo)準(zhǔn)差 He的正態(tài)隨機(jī)數(shù)Eni;
通過該算法可以得到由無數(shù)個(gè)云滴組成的具有不均勻厚度的正態(tài)云,由于云的腰部、頂部、底部等并不需要明確的定義,使用期望(E x)、熵(E n)和超熵(H e)就能夠很好的描述云。
2)云模型的3En規(guī)則
在論域空間中,X軸上任一區(qū)間上的元素△x對(duì)定性概念T的貢獻(xiàn)度計(jì)算出論域空間中所有元素對(duì)概念T的總貢獻(xiàn)度因?yàn)樗哉撚蚩臻g中的定性概念T有貢獻(xiàn)的定量值主要分布在區(qū)間[Ex.3En,Ex+3En]。在設(shè)計(jì)基于云模型的算法和發(fā)生器時(shí)應(yīng)該以3En區(qū)間為重點(diǎn),位于3En區(qū)間之外的云滴元素為小概率事件,可以忽略不計(jì)[6]。
1)正向云發(fā)生器
正向云發(fā)生器是從定性到定量的確定性映射轉(zhuǎn)換模型,如圖2所示。它根據(jù)云的3個(gè)數(shù)字特征來得到云滴,并由云滴組成云。正向云發(fā)生器實(shí)現(xiàn)了從語言值表達(dá)的定性信息中獲得定量數(shù)據(jù)的范圍和分布規(guī)律,是一個(gè)前向的、直接的過程,其輸入為表示定性概念的期望值Ex、熵En和超熵He,云滴數(shù)量N,輸出是N個(gè)云滴在數(shù)域空間的定量位置及每個(gè)云滴代表該概念的確定度。
圖2 正向云發(fā)生器圖Fig.2 Diagram of forward cloud generator
2)逆向云發(fā)生器
逆向云發(fā)生器是是從定性到定量的不確定性映射轉(zhuǎn)換模型,如圖3所示。它將一定數(shù)量的精確數(shù)據(jù)有效轉(zhuǎn)換為以恰當(dāng)?shù)亩ㄐ哉Z言值{Ex,En,He}表示的概念,并據(jù)此代表這些精確數(shù)據(jù)所反映的云滴的整體。云滴對(duì)應(yīng)的精確數(shù)據(jù)的數(shù)量越多,反映的概念越確切。
圖3 逆向云發(fā)生器圖Fig.3 Diagram of backward cloud generator
逆向云發(fā)生器的傳統(tǒng)算法是基于數(shù)理統(tǒng)計(jì)規(guī)律的樣本均值和樣本方差的均值法。輸入的是N個(gè)云滴在數(shù)域空間的精確位置和每個(gè)云滴代表該概念的確定度,輸出的是這N個(gè)云滴表示的定性概念的期望Ex,熵En和超熵He。
云轉(zhuǎn)換是一種用于將定量數(shù)據(jù)轉(zhuǎn)換為定性概念的方法,其主要思想是從連續(xù)的數(shù)值區(qū)間到離散的概念的轉(zhuǎn)換。假設(shè)論域空間上某個(gè)數(shù)值X的頻率為f(x),根據(jù)X的頻率的分布情況生成若干個(gè)粒度不同的云C(Exi,Eni,Hei)的疊加,每個(gè)云代表一個(gè)離散的、定性的概念。其數(shù)學(xué)表達(dá)式為ai*C(Exi,Eni,Hei),ai為幅度系數(shù),n為變換后所生成的離散概念的個(gè)數(shù)。
云轉(zhuǎn)換的核心思想是利用云模型對(duì)空間數(shù)據(jù)分布的概率密度函數(shù)進(jìn)行擬合,它是在論域空間中將定量描述轉(zhuǎn)換為定性描述的過程,也是一個(gè)概念歸納學(xué)習(xí)的最優(yōu)化過程,曲線分布函數(shù)可以由分布情況生成若干個(gè)不同粒度的云,將得到的這些云進(jìn)行疊加就可以對(duì)曲線進(jìn)行擬合。
1)對(duì)分布的數(shù)據(jù)點(diǎn)進(jìn)行統(tǒng)計(jì),得到分布曲線f[i];
2)查找數(shù)據(jù)點(diǎn)中峰值的位置,將峰值定義為云的中心點(diǎn)(期望)Ex[i](i=0,...,m-1),然后計(jì)算用于擬合數(shù)據(jù)點(diǎn)的以Ex[i]為期望的云模型的熵Eni,得到云模型的數(shù)據(jù)分布函數(shù)fi(x);
3)在數(shù)據(jù)點(diǎn)f[i]中減去已知云模型的數(shù)據(jù)分布fi(x),得到新的數(shù)據(jù)分布 f’[i];
4)重復(fù)步驟2)和步驟3),得到多個(gè)基于云的數(shù)據(jù)分布函數(shù) fi(x);
1)確定峰值X的Ex;
2)在Ex左右兩邊隨機(jī)的各取n個(gè)點(diǎn)。以Ex的值為中心在區(qū)間(Ex-n,Ex)中找到第一個(gè)波谷的值和第一個(gè)波峰的值,并計(jì)算兩者之間的差是否大于設(shè)定的閾值P,如大于P則將其值記為x1,若小于P則繼續(xù)尋找下一個(gè)波峰的值,直至滿足條件為止,同理在波峰的右邊找到x2,比較Ex-x1與x2-Ex的大小,取兩者中的較小值,這里設(shè)為Ex-x1;
3)將區(qū)間[Ex-fabs(Ex-x1),Ex+fabs(Ex-x1)]中的數(shù)據(jù)點(diǎn)作為云滴,利用無確定性信息的逆向云發(fā)生器來得到En的初始值;
4)通過比較波峰左右兩邊的誤差值M1和M2來優(yōu)化En值,如果M1和M2的絕對(duì)值都小于P,則En不需要優(yōu)化;如果誤差絕對(duì)值的最大值所對(duì)應(yīng)的誤差值在兩邊都為正,則將En減去0.01;如果誤差絕對(duì)值的最大值所對(duì)應(yīng)的誤差值在兩邊都為負(fù)時(shí),則將En加上0.01;如果一邊的最大誤差絕對(duì)值小于P,而另外一邊的最大誤差絕對(duì)值大于P,并且所對(duì)應(yīng)的誤差值為正時(shí),讓En減去0.01。
通過上述介紹的曲線擬合方法及優(yōu)化En的方法,可以得到很好的曲線擬合效果,如圖4所示。
為了驗(yàn)證優(yōu)化方法的有效性,我們對(duì)En的優(yōu)化進(jìn)行了實(shí)驗(yàn)并取得了很好的效果,如圖5~圖7所示。
曲線擬合在圖形圖像處理、多媒體技術(shù)等領(lǐng)域具有廣泛的應(yīng)用。文中設(shè)計(jì)了一種基于云理論的曲線擬合優(yōu)化方法,以云模型為基礎(chǔ),詳細(xì)論述了把離散的數(shù)據(jù)點(diǎn)轉(zhuǎn)換為若干個(gè)云曲線并疊加進(jìn)行曲線擬合的關(guān)鍵技術(shù),并說明了對(duì)En的優(yōu)化來提高結(jié)果的精度的算法過程。通過實(shí)驗(yàn)表明,該優(yōu)化方法是是實(shí)現(xiàn)曲線擬合的實(shí)用工具。將該方法進(jìn)行軟件化是下一步的研究方向。
圖4 優(yōu)化后的曲線擬合圖Fig.4 Optimized diagram of curve fitting
圖5 實(shí)驗(yàn)一:誤差值在兩邊都為正Fig.5 Diagram of experiment 1
圖6 實(shí)驗(yàn)二:誤差值在兩邊都為負(fù)Fig.5 Diagram of experiment 2
圖7 實(shí)驗(yàn)三:誤差值在兩邊一整一負(fù)Fig.5 Diagram of experiment 3
[1]ZHANG Chun-ying,PAN Rong-jiang.Fitting open B-spline curve to planar point clouds based on principal curve[C].CSIAM Geometric Design&Computing,2007:165-169.
[2]張軍平,王玨.主曲線研究綜述[J].計(jì)算機(jī)學(xué)報(bào).2003,26(2):129-146.ZHANG Jun-Ping,WANG Jue.An overview of principal curves[J].Chinese Journal of Computers,2003,2(26):129-146.
[3]陳天華,數(shù)字圖像處理[M].北京:清華大學(xué)出版社,2007.
[4]龔聲蓉,劉純平,王強(qiáng).數(shù)字圖像處理與分析[M].北京:清華大學(xué)出版社,2006.
[5]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學(xué),2004,6(8):28-34.LI De-yi,LIU Chang-yu.Study on the Universality of the NormalCloud Model[J].Engineering Science,2004,8(6):28-34.
[6]劉丹.計(jì)算機(jī)圖像處理的數(shù)學(xué)和算法基礎(chǔ)[M].北京:國防工業(yè)出版社,2005.