邵周健, 王旭輝
(合肥工業(yè)大學(xué)數(shù)學(xué)學(xué)院,合肥 230601)
信息幾何主要研究概率分布族所具有的微分幾何結(jié)構(gòu),在研究流形和度量空間上的形狀分析時常常用高斯混合模型來表示形狀.參考文獻[1]中用地標點表示每個形狀,并將形狀建模為高斯分布的混合,高斯混合模型是由k個高斯模型組合而成.然而,高斯混合模型中的高斯函數(shù)是超越函數(shù),且不具有局部支撐性,當運用高斯混合模型進行形狀分析時,通常無法得到顯式表達式.參考文獻[2]提出了用熵度量計算信息矩陣的方法,并計算出其顯式表達式,但是由于高斯函數(shù)的性質(zhì),測地線距離的計算成本較高.參考文獻[3]中通過估計兩種密度函數(shù)之間的測地線距離,得到形狀之間的相似性度量.然而,該方法求出的距離顯式表達式僅僅適用于特殊的高斯混合模型.流形上測地線的構(gòu)造還可以使用射擊法[4-5],基于微分方程的梯度下降方法[1],基于變分函數(shù)的梯度下降方法[6-7].綜上可知,運用高斯混合模型進行形狀分析的兩個主要缺點為:(i)度量沒有顯式表達式;(ii)梯度的估計較復(fù)雜.
近期Strait等研究了彈性形狀分析和基于地標約束的彈性形狀分析,將形狀的整個輪廓納入計算,在處理復(fù)雜形狀時具有一定的優(yōu)勢[8-9].然而,要實現(xiàn)對平移、縮放、旋轉(zhuǎn)和重新參數(shù)化不變的形狀分析相對困難.例如,參考文獻[10]提出了用坐標下降法來解決再參數(shù)化問題.
針對高斯混合模型在形狀分析上的不足,本文擬建立一種基于B樣條函數(shù)的形狀表示模型.通過研究B樣條模型情形下的形狀度量,進而獲得不同形狀間的測地線及測地距離.由于B樣條函數(shù)是分段多項式且具有局部支撐性[11],使得測地線及其距離的計算數(shù)值較為穩(wěn)定.特別地,如果對B樣條模型的節(jié)點做恰當限制后,所得到的信息矩陣具有顯式表達式,使得計算更為高效.
高斯混合模型是由k個單高斯模型組合而成,令μ1,μ2,…,μk∈為形狀的k個地標點,所有的這些地標被視為一個單一向量θ=(μ1,μ2,…,μk),高斯混合模型為
(1)
其中σ2為方差.因此,具有k個地標點的形狀被表示為k個分量高斯混合模型.然而,當應(yīng)用高斯混合模型進行形狀分析時,信息矩陣一般不具有顯式表達式且計算成本高[1],因此希望尋找其他的函數(shù)代替高斯函數(shù).
B樣條在工業(yè)中廣泛應(yīng)用于構(gòu)造形狀曲面[12],1992年,Unser等人證明了當樣條n的階數(shù)趨于無窮時,B樣條收斂于Lp(),?p∈[2,+∞)中的高斯函數(shù).此外相關(guān)數(shù)值計算結(jié)果還表明,三次B樣條基函數(shù)可較好逼近高斯函數(shù)[13].
(2)
由(2)式知,N(x)具有局部支撐性(如圖1所示),即N(x)在區(qū)間上(u-σ0,u+σ1)是非零的.因此,可將N(x)記為N(x;σ0,σ1),其中σ0,σ1是控制非零區(qū)間大小的縮放參數(shù),圖2中展示了N(x;σ0,σ1)在不同參數(shù)下的情況.
圖1 三次B樣條基函數(shù)N(x;σ0,σ1) 圖2 不同參數(shù)下的三次B樣條基函數(shù)
基于N(x;σ0,σ1)可定義B樣條混合模型.給定k個地標點u1,u2,…,uk∈,其對應(yīng)的B樣條混合模型為
(3)
其中wi為第k個B樣條基函數(shù)的權(quán)重,用來平衡第k個地標點對模型的影響,σi0,σi1用于控制相鄰地標點之間的影響.該B樣條混合模型可以用來表示形狀分析,圖3為有五個地標點的B樣條混合模型,在圖3-1中取σi0=σi1=2,ui=i,再將各個地標點的權(quán)重分別取為w1=0.20,w2=0.27,w3=0.117,w4=0.002,w5=0.411,圖3-2中σi0=ui-ui-1,σi1=ui+1-ui,權(quán)重分別取為w1=0.17,w2=0.32,w3=0.22,w4=0.17,w5=0.12.
圖3-1 圖3-2
上節(jié)闡述了基于B樣條混合模型的形狀表示法,本節(jié)主要討論如何利用概率模型來度量形狀之間的差異.在信息幾何中,概率模型p(x;θ)可視為對應(yīng)黎曼流形上的一個點,而信息矩陣g(θ)被認為是參數(shù)空間上唯一的黎曼結(jié)構(gòu).參考文獻[14]中首次證明了Fisher信息矩陣滿足黎曼流形上度量,F(xiàn)isher信息矩陣的(i,j)項是由Fisher-Rao度量得到
(4)
因此,對于兩個具有有限個地標點的形狀,基于高斯混合模型的形狀表示能度量它們之間的差異,混合模型表示已被用于解決各種形狀分析問題[15-16].然而,F(xiàn)isher-Rao度量有一個基本的缺點:對混合模型來說度量沒有顯式表達式.因此,需要對(4)中的積分進行數(shù)值計算,這就導(dǎo)致了該模型在計算上的復(fù)雜性.為了解決這個問題,參考文獻[2]提出了一種熵度量:
(5)
且由黎曼度量(5)誘導(dǎo)出來的信息矩陣具有顯示表示式,所以在求測地線時使用熵度量提高了計算效率. 本文也采用熵度量來計算了基于B樣條基函數(shù)的信息矩陣,并且在計算時可采用高斯數(shù)值積分[17],該方法可加快計算速度且提高精度.特別地,取σi0=ui-ui-1,σi1=ui+1-ui時,可由相關(guān)符號計算軟件計算出度量矩陣gij的顯式表達式.
注 具體表達式見https:∥note.youdao.com/s/6EEfL8Hp.
設(shè)θ(t)=(θ1(t),θ2(t),…,θK(t)),t∈[0,1]是流形上的一條光滑路徑,則該路徑的長度為
(6)
定義θ(t)的能量泛函為
(7)
給定流形上兩點P和Q,對于流形上連接兩點的所有分段光滑路徑,式(6)具有與式(7)相同的最小值[18].因此,連接P和Q的黎曼流形上的測地線是該能量泛函的極值點,測地線距離就為由連接這兩點的所有分段光滑路徑的最小長度(即能量泛函的最小值).
(8)
設(shè)流形上的P點為形狀S0、Q點為形狀S1,連接兩點測地線上的每一點對應(yīng)了S0與S1之間的中間變形形狀.
關(guān)于測地距離的求法,許多文獻里都有所研究,在參考文獻[3]建立高斯模型后,在兩種特殊情況下將Fisher距離與龐加萊半平面距離做相似變換求得了距離的顯式解.對于混合模型,參考文獻[19]提出測地距離可用打靶法求出,該方法是用離散化數(shù)值步驟求出測地線微分方程邊值問題在離散點上的近似解.此方法要求求得邊界點對應(yīng)的參數(shù),但困難在于該參數(shù)是未知的.配置算法是求解帶邊界條件常微分方程的常用方法[20],通常比打靶法更穩(wěn)定,但可能需要更多的計算.此外,參考文獻[21]還研究了一類步數(shù)為2(k+1)的次黎曼流形上的測地線.
(9)
(10)
本節(jié)基于第3,4節(jié)中用B樣條模型來表示形狀的相關(guān)結(jié)果,用一些模擬采樣數(shù)據(jù)做數(shù)值實例.例1,2分別選取有不同數(shù)量的地標點形狀,用B樣條混合模型表示該形狀,求出初始形狀S0到目標形狀S1的測地線距離及變形過程,并與基于高斯混合模型的形狀變形過程進行了對比.
例1選取三個地標點u1,u2,u3用B樣條混合模型表示形狀,取
σi0=ui-ui-1,σi1=ui+1-ui,
地標點個數(shù)LN及權(quán)重wi選取的數(shù)據(jù)見表1,變形中間步驟為5,求得的測地線距離見表2,且由初始形狀向目標形狀的變化過程如圖4所示,該變形過程與基于高斯混合模型的形狀變形過程相似.
表1 地標點及權(quán)重數(shù)據(jù)(LN=3)
表2 測地線距離數(shù)值
圖4 變形圖 (LN=3)
例2給定五個地標點u1,u2,u3,u4,u5用B樣條混合模型來表示形狀,并取
σi0=ui-ui-1,σi1=ui+1-ui,
表3是地標點個數(shù)LN及權(quán)重wi數(shù)據(jù)的選取,變形中間步驟為5,求得測地線距離見表2,其由初始形狀向目標形狀的變化過程如圖5所示,該變形過程與基于高斯混合模型的形狀變形過程相似.
表3 地標點及權(quán)重數(shù)據(jù)(LN=5)
圖5 變形圖 (LN=5)
提出了一種計算流形上形狀之間距離的方法,它是基于B樣條混合模型的特殊的形狀表示.在明確了B樣條基函數(shù)與高斯函數(shù)的關(guān)系后,選擇好節(jié)點序列求得對應(yīng)的B樣條基函數(shù),并建立B樣條混合模型,利用熵度量導(dǎo)出了信息矩陣的顯式表達式.最后求得黎曼流形上兩點間測地線距離,即形狀之間的距離.另外,還應(yīng)用此模型做了形狀之間的變形,并與傳統(tǒng)高斯混合模型進行計算效率上的對比,展示了該模型的有效性.
盡管基于高斯混合模型表示的形狀分析已經(jīng)得到了廣泛的研究,但相應(yīng)的信息矩陣通常無法求得顯式表達式,在測地線計算上也需要較高的計算成本,且數(shù)值具有不穩(wěn)定性.通過用B樣條函數(shù)代替高斯函數(shù),本文提出了一個新的概率模型來表示形狀.由于B樣條函數(shù)是局部支撐的,運用B樣條模型表示形狀并計算形狀之間的測地線是成功有效的,也給出兩個計算測地線距離的數(shù)值實例來證明本文方法的有效性.與傳統(tǒng)的高斯模型表示相比,所提出的新模型表示顯著降低了計算成本.由于本文關(guān)注一維計算的可行性,二維情況的具體應(yīng)用將在未來進行研究.
致謝作者非常感謝相關(guān)文獻對本文的啟發(fā)以及審稿專家提出的寶貴意見.