摘 要:顏體在中國的書法界備受追崇,然而對顏體的研究多是停留在書法藝術(shù)及特點上。以形狀上下文的方法對顏體字從度量的角度進(jìn)行研究。用彎曲能量、仿射變換代價和形狀上下文代價等三個指標(biāo)來衡量顏體字的相似度。從兩個角度進(jìn)行比較研究。對兩塊《顏勤禮碑》上的“中”字進(jìn)行比較研究,發(fā)現(xiàn)相似度很高。與漢鼎繁顏體比較,發(fā)現(xiàn)差別要比前一次的比較要大。通過橫向與縱向的比較研究得出顏真卿所寫的碑帖已經(jīng)形成風(fēng)格,而在電腦上所用的漢鼎繁顏體只有顏體的行筆特點。
關(guān)鍵詞:彎曲能量;仿射變換代價;形狀上下文代價;形狀直方圖
1 引言
顏真卿為唐代著名書法家,他在繼承晉代二王書法的基礎(chǔ)上,充分吸收了秦漢諸碑的精髓,從而自成一家。顏體字凝練渾厚,縱橫跌宕,備受書法愛好者的青睞。遺憾的是保留下來的顏體數(shù)目有限,雖然將顏體字經(jīng)過拆分之后形成了一個完備的顏體字庫,可以用來形成新的顏體字,目前從這個角度進(jìn)行研究的很多,有基于數(shù)字圖像處理技術(shù)[1],基于編程方法[2],還有基于數(shù)學(xué)形態(tài)方法[3]。然而,采用部件拼接的方式必然容易失去顏體本來的面貌。由于形狀上下文[4]本身很好的魯棒性和緊致性,應(yīng)用于車牌識別[5]、人臉識別[6]、以及驗證碼識別[7]等方面。因此本文以形狀上下文的方法來研究顏體碑帖。以碑帖中的“中”字進(jìn)行相似度的研究,并與漢鼎繁顏體進(jìn)行比較。
2 形狀上下文算法
2.1 形狀描述
對碑帖中的文字進(jìn)行抽樣,可以表征文字的形狀信息。在圖像邊緣檢測的基礎(chǔ)上,可以得到邊界點集p={p1,p2,L,pn}, pi∈2。在得到的點集中,對每一個點pi,其余的n-1個點和該點可以構(gòu)成n-1個向量,這些向量可以用來表征該點在形狀中的位置,包括方向和距離。為了讓描述集的向量對距離更近的樣本敏感度更高,我們將圖像中的位置進(jìn)行對數(shù)極坐標(biāo)變換,上面的點集描述看做是在對數(shù)極坐標(biāo)下的描述。
2.2 形狀直方圖
為了有效表示這些向量以及他們的關(guān)系,以形狀直方圖的形式來表示這個n-1向量。同時便于量化處理,引入方向和距離兩個參數(shù)。其中方向參數(shù)表示將圓周分成的份數(shù),距離參數(shù)表示將向量長度分成的份數(shù)。形狀直方圖是用來描述方向和距離給定的前提下,各個方向和距離上分布向量的個數(shù)。
形狀直方圖的計算公式如下:
其中k∈{1,2,L,K},K為對數(shù)極坐標(biāo)下方向參數(shù)與距離參數(shù)的笛卡爾集。為了便于描述,我們將對數(shù)極坐標(biāo)系用 來表示,將 進(jìn)行12等分,將圖形中最大的距離點 進(jìn)行5等分,則將圖形空間分成12×5個bin。 表示對數(shù)極坐標(biāo)系下點q相對于pi的第k個bin中。
2.3 相似性度量
采用上面描述的方法可以得到圖形中每個點的形狀直方圖,接下來要比較兩個兩個圖形的相似度,只需要通過對兩個圖的每個點進(jìn)行形狀直方圖比較即可。計算兩個圖形的形狀直方圖匹配代價,我們采用x2分布進(jìn)行統(tǒng)計,公式如下:
其中,hi(k)為圖形點集p中的點pi的形狀直方圖,hj(k)為圖形點集q中點qi的形狀直方圖。
按照上式可以得到兩個圖形的匹配代價矩陣C,對矩陣C進(jìn)行點的匹配操作,這個操作過程是典型的雙向圖的匹配問題,我們想得到匹配的最小值也即形狀上下文代價
利用匈牙利算法,可以解決這個問題。
3 試驗結(jié)果與分析
為了驗證算法的性能,本文從兩塊《顏勤禮碑》中選出“中”字進(jìn)行計算,作為顏體成熟的一種形態(tài),從外觀上已經(jīng)很難看出這兩者之間的差別,下面就從算法的角度來進(jìn)行研究比較,尋找細(xì)微之處。
首先從這兩塊碑帖中選出兩個35×35大小的中字(圖三)和(圖四)
使用matlab編程去除背景并采樣,獲取圖形的輪廓信息(圖六)
計算(圖三)中的輪廓對(圖四)的彎曲能量數(shù)值,并將其中需要經(jīng)過仿射變換以后獲得(圖四)的部分,計算仿射變換代價,并繪制比較圖(圖七)
經(jīng)過形狀上下文變形后的圖形如(圖八) 可以看出將(圖三)上的“中”經(jīng)過形變以后,與(圖四)上的“中”字差別不大。
采用同樣的方式對(圖三)與(圖五)進(jìn)行比較如(圖九)
不難看出,(圖三)上的“中”字經(jīng)過變形以后得到的“中”字發(fā)生了很大的變化,這說明這兩個“中”字在風(fēng)格上已經(jīng)有了很大的變化,體現(xiàn)在數(shù)值上就是形狀上下文代價的值較大。
衡量指標(biāo)
4 結(jié)論與展望
顏體作為一門書法藝術(shù),深受廣大書法愛好者喜愛,尤其以《顏勤禮碑》最廣受推崇。以形式上下文的方法來研究顏體,可以看出顏體本身在字體風(fēng)格上已經(jīng)成熟,考察指標(biāo)彎曲能量、仿射代價以及形狀上下文代價值都很小,說明文字書寫本身已經(jīng)相當(dāng)穩(wěn)定。而目前在電腦上使用的漢鼎繁顏體,從這幾項指標(biāo)上來看還是差別比較大。這說明漢鼎繁顏體本身只是模仿顏體的書寫風(fēng)格,在構(gòu)字上與顏體之間還是有一定的差距。本文的意義在于給出一種風(fēng)格字體的衡量標(biāo)準(zhǔn),可以用來衡量字體的不同,也可以用來作為筆跡鑒定的一種方式。未來將對所有的顏體字進(jìn)行比較,找出顏體字的規(guī)律。
[參考文獻(xiàn)]
[1]丁華偉,汪曉鋒,李寶磊,等.基于部件拆分的顏體字合成[J].計算機應(yīng)用與軟件,2012,29(1):49-51.
[2]黃國良,孫鶴,施心陵,等.顏體部件合成造字的實現(xiàn)[J].信息技術(shù),2012,3:33-35.
[3]李寶磊,汪曉峰,丁華偉,等.基于數(shù)學(xué)形態(tài)學(xué)算法的顏體字合成[J].計算機工程,2011,37(15):195-196.
[4]Belongie S,Malik J,Puzicha J.Shape Context:A New Descriptor for Shape Matching and Object Recognition[D].Berkeley,CA,USA:University of California at Berkeley,2000.
[5]萬燕,李曉園,周增剛.基于形狀上下文的低質(zhì)量車牌字符識別方法[J].計算機應(yīng)用與軟件,2013,30(5):267-270.
[6]陳慧靜,夏小玲.基于形狀上下文的人臉匹配算法[J].計算機工程,2009,35(3):208-210.
[7]賀強,晏立.基于形狀上下文的復(fù)雜驗證碼識別算法[J].計算機工程,2011,37(2):200-202.