摘 "要: 中國國畫中的印章含有豐富的語義信息,如畫作作者或收藏者的姓名信息。提出一種基于多特征的中國古畫印章分割方法。首先,對輸入的古畫彩色圖像進(jìn)行雙邊濾波和顏色增強(qiáng)處理,糾正古畫的偏色情況,并增強(qiáng)圖像顏色的飽和度;然后計(jì)算紅色通道增強(qiáng)圖像,檢測印章可能出現(xiàn)的區(qū)域;再結(jié)合4種形狀特征,準(zhǔn)確定位印章區(qū)域。實(shí)驗(yàn)結(jié)果表明使用所提算法能夠有效定位方形和圓形印章。
關(guān)鍵詞: 中國古畫; 印章定位; 偏色校正; 物體檢測
中圖分類號: TN919?34; TP317.4 " " " " "文獻(xiàn)標(biāo)識碼: A " " " " " " " " " " " " " 文章編號: 1004?373X(2015)02?0096?04
Automatic positioning algorithm of ancient Chinese painting seal
MOU Jia?jun, WANG Jian, HE Yu?qing, PANG Yan?wei
(School of Electronic Information Engineering, Tianjin University, Tianjin 300072, China)
Abstract: Seals in Chinese ancient paintings are rich in semantic information, such as names of authors or collectors. A multi?feature based seal partition algorithm for Chinese ancient paintings is presented. The input ancient color painting image is enhanced by correcting background color cast first, and then the enhanced red image is calculated and potential seal regions are detected. Finally, four shape features are employed for verifying the locations of real seals. The experimental results show the proposed method is efficient for locating most square and round seals.
Keywords: Chinese ancient painting; seal localization; color cast correction; object detection
0 "引 "言
中國畫(簡稱國畫)是中華民族傳統(tǒng)的繪畫,它歷經(jīng)數(shù)千年的文化積累和發(fā)展,已成為中華民族獨(dú)特的文化瑰寶之一。國畫是用毛筆、墨在宣紙、絹帛上作畫,它講究筆墨,著眼于用筆墨造型。國畫門類多樣、異彩紛呈,從繪畫種類上分為山水畫、花鳥畫和人物畫。在畫面的構(gòu)成上,中國畫講究詩、書、畫、印交相輝映。古代璽印有官印和私印之分,其中古畫中的印章以私印為主,用來表現(xiàn)書畫作者或者收藏者姓名及別號等信息。因此,從國畫圖像中自動(dòng)分割并識別印章信息,對于實(shí)現(xiàn)基于內(nèi)容的國畫圖像檢索與分析是非常必要的。
國內(nèi)外有關(guān)印章處理的工作主要集中在商業(yè)票據(jù)或公文身份有效憑證等。Fan和Tsai較早的開展了印章自動(dòng)識別技術(shù)的研究[1],他們根據(jù)筆畫拓?fù)浣Y(jié)構(gòu)的相對穩(wěn)定性提出基于筆劃骨架匹配的決策方法,先將印章圖像做細(xì)化和旋轉(zhuǎn)處理,然后利用距離權(quán)相關(guān)算法計(jì)算預(yù)留印章與待識別印章的相似度,這種方法缺點(diǎn)是要求印章的邊框必須是直線且沒有間隙,不能鑒別圓形印章。在前一種方法的基礎(chǔ)上,Chen和Tsai采取廣義霍夫變換(GHT)獲取印章配準(zhǔn)的參數(shù)[2],該方法可以處理任意形狀的印章,但GHT的計(jì)算量太大,其時(shí)間復(fù)雜度很高。Chen提出了一種基于坐標(biāo)變換的印章識別方法[3],將二值化后的印章圖像由外向內(nèi)進(jìn)行掃描,找到4個(gè)切點(diǎn),從而確定包含印章區(qū)域的最小圓,計(jì)算出印章圖像的中心點(diǎn)。再將直角坐標(biāo)空間變換到極坐標(biāo)空間,確定預(yù)留印章中的像素點(diǎn)與進(jìn)行旋轉(zhuǎn)θ角后的匹配程度。匹配后將印章圖像沿著θ軸分為K塊,通過每個(gè)塊中相匹配的像素點(diǎn)來計(jì)算其匹配值。這種方法同樣受圖像質(zhì)量影響較大,僅適用于方章和圓章,計(jì)算量也很大。Soria等提出了一種基于色調(diào)特征的彩色文檔圖像中提取官方印章的方法[4],作者綜合利用色度、飽和度和亮度等信息?;趯€(gè)人提交的稅務(wù)表格數(shù)據(jù)的印章處理結(jié)果,驗(yàn)證了所提方法的有效性。Wang等提出了基于顏色信息的銀行票據(jù)文檔的印章提取方法[5],他們首先使用K均值算法從背景中分離印章區(qū)域,然后使用最近鄰分類器去除印刷文字,并借助后處理過程改進(jìn)分割結(jié)果。除上述外文文獻(xiàn)之外,還有一些中文文獻(xiàn)也討論了印章檢測與識別問題,如基于Fourier描述子的方法[6],基于極坐標(biāo)系和小波多尺度分解的方法[7],多特征支持向量機(jī)(SVM)[8],基于旋轉(zhuǎn)不變特性的方法[9],形態(tài)學(xué)top?hat變換[10]。
分析國內(nèi)外印章處理相關(guān)文獻(xiàn),總結(jié)出已有方法存在以下2個(gè)問題:一是沒有專門針對國畫圖像(特別是古畫圖像)印章區(qū)域分割與提取方法;二是現(xiàn)有方法都假定印章區(qū)域顏色保持一致,形狀完整,沒有考慮單個(gè)印章顏色特征存在差別,印章筆劃斷裂等不良情況,而這兩種情況在古畫圖像的印章區(qū)域經(jīng)常出現(xiàn)。受國畫顏色退化、印章雕刻方式、印泥材質(zhì)等不同情況的影響,古畫圖像中的印章保存完好程度不盡相同。本文提出了一種針對古畫圖像的紅色印章自動(dòng)定位算法,目的是從視覺質(zhì)量下降的古畫圖像中定位方形或圓形紅色印章區(qū)域,為后續(xù)的印章分割和識別做好準(zhǔn)備。
1 "所提方法
通過觀察古畫圖像中的各類印章,總結(jié)出下述印章區(qū)域具有的三類特征:
顏色特征:古畫所用印泥以朱砂印泥為主,呈現(xiàn)為高飽和度的鮮紅色。
形狀特征:古畫中的印章以方形(包括正方形和長方形)和圓形為主,少量的是特殊形狀(如葫蘆形等)。
邊緣特征:印章雕刻方法分為陽刻和陰刻兩種情況,古畫中這兩類印章的附近區(qū)域都含有豐富的邊緣特征。
所提算法綜合使用上述三類特征用于印章分割。圖1所示為所提方法的框圖,它包括偏色校正、印章檢測和印章驗(yàn)證三個(gè)步驟。首先針對古畫圖像普遍存在的偏色情況,通過分析背景區(qū)域的主顏色,對古畫進(jìn)行偏色校正;接下來根據(jù)印章的顏色特征,提取紅色增強(qiáng)分量圖,檢測潛在的印章區(qū)域;最后利用印章的形狀區(qū)域和邊緣特征,準(zhǔn)確定位印章。所提算法的詳細(xì)實(shí)現(xiàn)過程在以下各子節(jié)中介紹。
lt;E:\王芳\現(xiàn)代電子技術(shù)201502\Image\32t1.tifgt;
圖1 所提古畫印章分割算法框圖
1.1 "古畫圖像偏色校正
由于存放年代久遠(yuǎn),以及存放方式和環(huán)境的影響,古畫圖像普遍存在褪色、偏色等顏色退化情況。為了提高印章區(qū)域分割的性能,有必要對古畫圖像進(jìn)行偏色校正,盡量恢復(fù)印章區(qū)域原有的顏色特征。
所提方法在YCbCr顏色空間進(jìn)行偏色校正。首先使用下式將輸入圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間:
[YCbCr=16128128+0.2570.5640.098-0.148-0.2910.4390.439-0.368-0.071RGB] "(1)
在YCbCr空間中,Y表示亮度分量,Cb和Cr分別代表藍(lán)色和紅色偏移量。通過觀察發(fā)現(xiàn),前景與背景區(qū)域的Y值差別明顯。所提算法使用Y分量將古畫圖像劃分為前景和背景區(qū)域。具體的做法是:計(jì)算Y分量的直方圖,用H(Y)表示;采用經(jīng)典的Otsu方法,計(jì)算閾值T1;將Y值大于T1的點(diǎn)劃歸為背景區(qū)域,并用W表示背景區(qū)域。接下來,計(jì)算W內(nèi)各點(diǎn)Cb和Cr的平均值,分別用[Cb]和[Cr]表示,即有:
[Cb=1N(x,y)∈ΩCb(x,y), Cr=1N(x,y)∈ΩCr(x,y)] (2)
式中N表示W(wǎng)中像素?cái)?shù)的總數(shù)。
假定國畫背景區(qū)域是沒有顏色的,即滿足Cb=Cr=128。用(Cb′,Cr′)表示調(diào)整后的兩色度通道值,處理過程如下式所示:
[Cr′=128+Cr-Cr, Cb′=128+Cb-Cb] (3)
圖2所示為背景偏色校正過程示例。其中,圖2(a)為宋徽宗趙佶所畫《鸜鵒圖》的局部彩色截圖,圖中含有18枚印章,其中方形印章13枚,圓形印章5枚,各印章的尺寸差別明顯。圖2(b)是(a)對應(yīng)的背景區(qū)域二值圖,其中黑色代表背景區(qū)域。圖2(c)是使用式(3)對圖2(a)進(jìn)行偏色調(diào)整的結(jié)果,其中Y分量保持不變。
lt;E:\王芳\現(xiàn)代電子技術(shù)201502\Image\32t2.tifgt;
圖2 背景偏色校正過程示例
1.2 "印章區(qū)域初定位
所提算法使用顏色特征初步定位印章區(qū)域。首先,根據(jù)Cr和Cb分量,使用式(4)計(jì)算紅色分量增強(qiáng)圖像,用Er(x,y)表示,即有:
[Er(x,y)=log2Cr(x,y)Cb(x,y)] (4)
根據(jù)前面的分析,國畫中的印章筆劃呈現(xiàn)紅色,印章筆劃像素點(diǎn)的Cr取值較大,而Cb取值較小。根據(jù)式(4),印章像素點(diǎn)的Er值較大。所提方法采用無監(jiān)督K均值分類算法,使用Er作為特征量分為3類,將類心值最大的一類標(biāo)記為印章區(qū)域。圖3(a)所示為圖2(a)圖像對應(yīng)的印章區(qū)域初定位結(jié)果,其中白色區(qū)域?qū)?yīng)于印章區(qū)域。
1.3 "基于形狀區(qū)域的印章區(qū)域精確分割
受到印章顏色退化、圖像折痕等情況的影響,檢測到的印章筆畫可能存在斷裂或缺損情況,導(dǎo)致部分印章筆劃漏檢。另外,古畫中的紅色衣物或花瓣的顏色與印章顏色非常接近,這類對象常被誤檢為印章區(qū)域。考慮到古畫中的絕大部分印章區(qū)域是方形或者圓形,所提算法引入后處理過程,根據(jù)印章的邊緣和形狀特征,去除漏檢和誤檢,精確定位印章區(qū)域。
首先,所提算法使用形態(tài)學(xué)操作處理印章筆劃斷裂和缺損情況。具體的做法是:
(1) 使用半徑為2的“diamond”算子對初定位結(jié)果進(jìn)行膨脹處理;
(2) 填充膨脹結(jié)果中印章區(qū)域內(nèi)的空洞,處理結(jié)果用S表示。
接下來,所提算法使用形狀特征去除誤檢區(qū)域。共使用4種結(jié)構(gòu)特征,即面積、寬高比、矩形率和圓形率。用Wi表示S中某個(gè)印章區(qū)域,下標(biāo)i表示該區(qū)域的序號。各種結(jié)構(gòu)特征定義為:
基本特征:Wi的面積定義為Wi內(nèi)像素點(diǎn)的總數(shù),用AREAi表示。用TOPi和BOTi表示W(wǎng)i的上、下邊界,它們定義為Wi內(nèi)各像素點(diǎn)水平方向坐標(biāo)值xi(n)的最小值和最大值;用LETi和RGTi表示W(wǎng)i的左、右邊界,它們定義為Wi內(nèi)各像素點(diǎn)垂直方向坐標(biāo)值yi(n)的最小值和最大值。Wi的外接矩形定義為其上、下、左、右四個(gè)邊界所圍成的矩形區(qū)域。Wi的寬度定義為WIDi=|RGTi-LETi|,高度定義為HETi=|BOTi-TOPi|。用MXi和MYi表示區(qū)域Wi內(nèi)各點(diǎn)坐標(biāo)值xi(n)和yi(n)的平均值,定義Wi的中心為Ci=(MXi, MYi)。計(jì)算Wi內(nèi)各點(diǎn)到Ci的街區(qū)距離,Wi的半徑等于最大距離。定義Wi的周長Pi定義為其8連通約束下的外邊界所含的像素?cái)?shù)。
寬高比(Width and Height Ratio,WHR):Wi的寬高比定義為寬度和高度的比值,即WHRi=[WIDiHETi]。
矩形度(Rectangularity,RET)矩形度定義為區(qū)域的面積與其最小外接矩形面積的比值。矩形度反映了物體在最小外接矩形中的填充程度,矩形的矩形度為1,圓形的矩形度為[p4],三角形的矩形度為0.5。考慮到古畫圖像中印章區(qū)域都是按照垂直或者水平方向排列的,每個(gè)印章區(qū)域的最小外接矩形與其外接矩形相同。因此有RATi=AREAi/(HETiWIDi)圓形度(Circularity,縮寫為CIR)圓形度反映了物體接近于圓形的程度,它定義為4p倍的面積區(qū)域與周長的平方之比,即有CIRi=4pAREAi/Pi。圓的圓形度為1,正方形的圓形度為p/4。
使用上述結(jié)構(gòu)特征,制定下面4個(gè)約束條件。
(1) 條件1:AREAigt;T2;
(2) 條件2:T3lt;WHRilt;T4;
(3) 條件3:RATigt;T5;
(4) 條件4:CIRigt;T6。
條件1描述的是對印章區(qū)域面積的約束,用來去除面積過小的干擾區(qū)域,所提算法取T2=50。條件2描述了對Wi寬高比的約束。對于正方形和圓形情況的印章,其寬高比接近于1。但對于長方形印章情況,其款高于可能大于或者小于1。因此應(yīng)適當(dāng)放寬對寬高比的約束,所提方法選取T3=0.33,T4=3。條件3和條件4用來區(qū)分方形印章和圓形印章。
根據(jù)矩形度(RET)和圓形度(CIR)的定義,方形印章(包括正方形和長方形)的RET應(yīng)為1,圓形印章的CIR為1。但考慮到圖像掃描過程中產(chǎn)生的變形,圖像本身存在遮蔽或缺損等因素的影響,導(dǎo)致各印章區(qū)域RET或CIR小于1。為減少漏檢,閾值T5和T6的取值不能太大,所提方法取T5=T6=0.66。所提算法使用兩個(gè)步驟完成印章區(qū)域驗(yàn)證過程:(1)將不滿足條件1和條件2去除干擾區(qū)域;(2)將剩余的候選區(qū)域使用條件3和條件4進(jìn)一步進(jìn)行判別并區(qū)分印章類型,即如果滿足條件3,則判為方形印章;如果滿足條件4,則判為圓形印章。
圖3給出基于形狀特征的印章區(qū)域驗(yàn)證過程。其中,圖3(a)所示為圖2(a)所示圖像對應(yīng)的印章檢測區(qū)域二值圖。圖3(b)是形態(tài)學(xué)膨脹結(jié)果,圖3(c)所示為使用形狀特征進(jìn)行印章區(qū)域驗(yàn)證的結(jié)果,其中方形印章和圓形印章分別用“口”和“O”標(biāo)出。從實(shí)驗(yàn)結(jié)果來看,實(shí)驗(yàn)成功檢測并提取出了原圖像中不同尺寸18個(gè)印章中的17個(gè),而且能夠準(zhǔn)確區(qū)分方形印章和圓形印章。惟一一個(gè)沒有被正確檢測的是原圖中右下角的正方形印章。通過比對輸入圖像發(fā)現(xiàn),該印章的紅色特征退化情況嚴(yán)重,篆刻方式為陽刻,印章區(qū)域內(nèi)部的筆劃稀疏,導(dǎo)致在印章區(qū)域驗(yàn)證過程中,條件3和條件4都不滿足,最終導(dǎo)致該印章區(qū)域被漏檢。
2 "實(shí)驗(yàn)結(jié)果分析
本實(shí)驗(yàn)選用30幅古畫圖像作為實(shí)驗(yàn)素材,全部圖像從網(wǎng)絡(luò)下載得到,其中絹質(zhì)圖像18幅,紙質(zhì)圖像12幅。采用人工方式從古畫圖像中提取印章區(qū)域,共得到212個(gè)印章區(qū)域,其中包括各種尺寸的方形印章168枚,圓形印章37枚,其他形狀印章7枚。在全部印章212個(gè)印章中,陽刻印章133枚,陰刻印章79枚。采用所提算法檢測并分割各圖像中的印章,并與人工提取結(jié)果進(jìn)行比較,表1列出了檢測結(jié)果。
lt;E:\王芳\現(xiàn)代電子技術(shù)201502\Image\32t3.tifgt;
圖3 印章區(qū)域驗(yàn)證過程示例
表1 印章區(qū)域檢測結(jié)果
由表1可見,所提算法的總查全率為93.4%,其中方形印章的查全率最高,約為95.8%,圓形印章的查全率約為91.9%,其他形狀印章查全率較低,只有42.8%。
通過分析實(shí)驗(yàn)結(jié)果,總結(jié)導(dǎo)致印章漏檢的三種情況,一是印章顏色退化嚴(yán)重,部分區(qū)域被背景顏色掩蓋;二是受到畫面折痕,以及畫面其他內(nèi)容的遮蔽等情況,導(dǎo)致本來連續(xù)的印章區(qū)域被劃分為多個(gè)小區(qū)域;三是特殊形狀的印章,如葫蘆形。
圖4給出部分印章正檢和漏檢實(shí)例。為顯示方便,截取部分圖像區(qū)域顯示,圖4(a)中正確檢測到的方形和圓形印章區(qū)域分別用“口”和“O”標(biāo)出,其中右圖右下方有圖像部分區(qū)域被誤檢為圓形印章區(qū)域。
圖4(b)左圖中紅色圖中最下方的兩個(gè)方形印章沒有正確檢出,其中左側(cè)漏檢的印章是因?yàn)橛∧囝伾粔蝓r艷,與背景顏色接近,右側(cè)漏檢的印章受到畫中水墨顏色的影響,導(dǎo)致部分印章筆劃存在斷裂。右圖中右下方的葫蘆形印章屬于特殊形狀情況,未被正確檢出。
表2分別列出不同雕刻類型印章,以及不同材質(zhì)古畫圖像印章的檢測結(jié)果。結(jié)果顯示,陰刻印章的查全率比陽刻印章高出約5%,這是因?yàn)殛幙逃≌碌募t色區(qū)域占整個(gè)印章區(qū)域的比重更大,更不容易收斷裂、缺損等不良情況的影響。另外,所提算法對不同材質(zhì)古畫圖像的印章定位性能存在差別,紙質(zhì)材質(zhì)古畫的印章檢測結(jié)果略高于絹質(zhì)材質(zhì)古畫,這是因?yàn)榻佡|(zhì)古畫背景顏色偏色情況更嚴(yán)重,印章區(qū)域更容易和背景顏色混淆,導(dǎo)致更多的印章區(qū)域漏檢。
lt;E:\王芳\現(xiàn)代電子技術(shù)201502\Image\32t4.tifgt;
圖4 正確檢測和漏檢情況示例
表2 不同材質(zhì)古畫印章檢測結(jié)果
3 "結(jié) "論
提出一種基于多特征的中國古畫印章定位算法。該方法綜合利用了印章的顏色、形狀和邊緣特征,包括背景偏色校正、基于顏色特征的印章區(qū)域初定位、以及基于邊緣和形狀特征的印章區(qū)域驗(yàn)證等,實(shí)驗(yàn)結(jié)果驗(yàn)證了所提算法的有效性。未來的工作集中在如何提高印章區(qū)域的檢測精度,以及特殊形狀印章定位方面。
參考文獻(xiàn)
[1] FAN T J, TSAI W H. Automatic Chinese seal identification [J]. Computer Vision Graphics and Image Processing, 1984, 25(2): 311?330.
[2] CHENC M, TSAI W H. Automatic identification of Chinese seal imprint with arbitrary or partial shapes [J]. Computer Processing Chinese Oriental Languages, 1986, 22(6): 216?233.
[3] CHEN Y S. Automatic identification for a Chinese seal image [J]. Pattern Recognition, 1996, 29(11): 1807?1820.
[4] SORIA?FRISCH A. Color seal extraction from documents: robustness through soft data fusion [J]. EURASIP Journal on Applied Signal Processing, 2005, 13(8): 2146?2152.
[5] WANG C Y, CHEN Y B. Seal extraction based on clustering and local thresholding techniques [J]. Advanced Materials Research, 2014, 926/930: 3467?3470.
[6] 曾東武,劉重慶.Fourier描述符的印鑒識別方法[J].上海交通大學(xué)學(xué)報(bào),1998,32(9):43?45.
[7] 王新年,梁德群.基于極坐標(biāo)和小波的印章配準(zhǔn)方法[J].計(jì)算機(jī)工程與應(yīng)用,2005,42(24):218?221.
[8] 李晗,竇愛萍,解爭龍,等.基于多特征的支持向量機(jī)印鑒識別[J].航空計(jì)算技術(shù),2006,36(4):32?34.
[9] 代紅維,馬社祥.基于旋轉(zhuǎn)不變特性的印鑒識別方法研究[J].天津理工大學(xué)學(xué)報(bào),2009,25(4):1?3.
[10] 何瑾.金融印鑒真?zhèn)巫R別新方法研究[D].天津:天津大學(xué), 2010.
[11] Sonka.圖像處理分析與機(jī)器視覺[M].3版.艾海舟,譯.北京:清華大學(xué)出版社,2011.