許鵬飛
(西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
?
基于Guide-filter的中國(guó)書(shū)法作品中印章信息的提取*
許鵬飛
(西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
針對(duì)中國(guó)書(shū)法作品中存在的印章信息難以準(zhǔn)確提取的問(wèn)題,提出基于Guide-filter的中國(guó)書(shū)法作品中印章信息的提取算法。算法充分利用Guide-filter具有較好保持圖像邊緣信息的能力,以及最大限度逼近目標(biāo)信息的特性,以雙閾值法得到的二值圖像之間的殘差圖像作為Guide-filter的輸入圖像,以原始圖像作為Guide-filter的引導(dǎo)圖像,最終獲得較為準(zhǔn)確的印章信息。此外,利用邊緣密度的概念,通過(guò)計(jì)算提取印章區(qū)域的邊緣密度來(lái)對(duì)印章提取效果進(jìn)行客觀性評(píng)價(jià)。實(shí)驗(yàn)表明:提出算法能夠較好地提取出中國(guó)書(shū)法作品中的印章信息。
中國(guó)書(shū)法作品; 印章; Guide-filter; 邊緣密度
近年來(lái),已有眾多中國(guó)古代書(shū)法大家的大量書(shū)法作品進(jìn)行數(shù)字化,并獲得不同清晰程度的數(shù)字圖像數(shù)據(jù)[1~3],但對(duì)印章信息的研究較少。
針對(duì)書(shū)法作品中印章的研究,目前已有一些在其數(shù)字圖像中對(duì)印章信息進(jìn)行提取與分析的研究成果。例如:Roy等人[4]提出了一種基于廣義Hough變換(GHT)的文本圖像中印章信息的提取與識(shí)別算法,該算法結(jié)合光學(xué)字符識(shí)別(OCR)技術(shù)對(duì)印章中的文本信息進(jìn)行識(shí)別,進(jìn)而利用GHT檢測(cè)圖像中存在的印章信息。婁海濤[5]為進(jìn)行書(shū)畫(huà)作品的檢索,提出了一種利用圖像的低層視覺(jué)特征自動(dòng)提取書(shū)畫(huà)作品中印章圖像的方法。張曉東等人[6]提出了一種基于非線性回歸原理的印章自適應(yīng)特征提取算法,通過(guò)相關(guān)分析和顯著性檢驗(yàn),給出了相應(yīng)的特征描述。而針對(duì)背景較為復(fù)雜的圖像,宋永紅等人[7]提出了一種基于背景密度估計(jì)的印章圖像提取算法。曾銳[8]在進(jìn)行印章圖像矯正的研究中,利用LOG算子檢測(cè)出圖像中的印章信息。此外,還有基于Radon變換[9]、圖像分割[10]、圖像語(yǔ)義[11]等方法和理論的印章提取算法。
由于古代書(shū)法作品年代久遠(yuǎn),印章存在一定程度的模糊,且圖像背景復(fù)雜,導(dǎo)致傳統(tǒng)算法難以準(zhǔn)確提取其印章信息。為此,本文提出一種提出基于Guide-filter的中國(guó)書(shū)法作品中印章信息的提取算法。算法充分利用Guide-filter具有較好保持圖像邊緣信息的能力,以不同閾值得到的二值圖像之間的殘差圖像作為Guide-filter的輸入圖像,而以原始圖像作為Guide-filter的引導(dǎo)圖像,最終獲得較為準(zhǔn)確的印章信息。此外,為更準(zhǔn)確地評(píng)價(jià)不同印章提取算法的性能,本文利用邊緣密度的概念,通過(guò)計(jì)算提取印章區(qū)域的邊緣密度來(lái)對(duì)印章提取效果進(jìn)行客觀性評(píng)價(jià)。
Guide-filter又稱(chēng)導(dǎo)向?yàn)V波器,它的濾波結(jié)果與引導(dǎo)圖像的內(nèi)容密切相關(guān)。由于引導(dǎo)濾波器具有雙邊濾波器保持邊緣平滑的特點(diǎn),具有較好的圖像邊緣保持能力。因此,基于Guide-filter的印章提取算法能夠更準(zhǔn)確,更完整地提取書(shū)法作品中的印章信息。
實(shí)質(zhì)上,Guide-filter的處理過(guò)程是依據(jù)輸入圖像對(duì)引導(dǎo)圖像進(jìn)行的一種線性變換。例如,輸入圖像Ii,引導(dǎo)圖Ig,按式(1)進(jìn)行計(jì)算
IO(x,y)=akIg(x,y)+bk,?(x,y)∈wk
(1)
式中IO為輸出圖像,ak和bk為線性系數(shù),wk為一個(gè)局部窗口,它以像素點(diǎn) (x,y)為中心,以r為半徑。如果使式(2)的值達(dá)到最小,即能使得輸入圖像和輸出結(jié)果之間的差異最小,所以對(duì)式(2)進(jìn)行最小化處理如下
(2)
式中 E為輸出圖像IO與輸入圖像Ii之間的差異值,正則化參數(shù)ε是為防止ak的值過(guò)大。當(dāng)系數(shù)ak和bk分別由式(3)計(jì)算得到的數(shù)值時(shí),E的值將達(dá)到最小
(3)
(4)
對(duì)于除氧器的暫態(tài)過(guò)程分析,一個(gè)很重要的參數(shù)就是進(jìn)入除氧器的凝結(jié)水焓ic。為更加接近真實(shí)的物理過(guò)程,應(yīng)將凝結(jié)水管路分段模擬,同時(shí)考慮金屬蓄熱對(duì)凝結(jié)水焓值的影響,每段管路都按照凝結(jié)水的實(shí)際焓值計(jì)算。以下基于低壓加熱器出口溫度逐漸降為熱井水溫,作為整個(gè)暫態(tài)過(guò)程進(jìn)入除氧器的凝結(jié)水溫來(lái)推導(dǎo):
從Guide-filter的基本理論可以看出,輸入圖像在較大程度上影響濾波的輸出結(jié)果。依據(jù)書(shū)法作品中書(shū)法字與印章在色彩深淺之間的差異,本文利用雙閾值法提取印章的模板圖像,并將其作為Guide-filter的輸入圖像。較大閾值下得到的二值圖中含有書(shū)法字和印章的輪廓,而較小閾值下得到的二值圖中主要含有書(shū)法字,二者的差異圖中就含有印章的基本信息,則可以將該差異圖作為Guide-filter的輸入圖像。然后以原始圖像的灰度圖作為Guide-filter的引導(dǎo)圖像,經(jīng)過(guò)濾波處理后可以獲得較為完整的印章提取圖。
目前,已有較多的算法可應(yīng)用于印章信息的提取,但是針對(duì)不同算法提取結(jié)果的評(píng)價(jià)主要還是基于視覺(jué)觀察,沒(méi)有利用或提出相應(yīng)的方法來(lái)對(duì)不同算法的性能做出客觀評(píng)價(jià)。為此,本文提出利用邊緣密度的概念來(lái)對(duì)不同算法提取的印章圖像質(zhì)量進(jìn)行客觀評(píng)價(jià)。邊緣密度是一種用以表征圖像中邊緣信息的復(fù)雜程度的度量,能夠在一定程度上反映圖像中各區(qū)域邊緣信息的復(fù)雜度和密集程度。對(duì)于提取的印章圖像,如果其區(qū)域邊緣密度較大,表明該提取的印章不連續(xù);如果區(qū)域邊緣密度較小,則表明提取的印章較為完整。
區(qū)域邊緣密度:區(qū)域內(nèi)邊緣像素點(diǎn)的總個(gè)數(shù)與該區(qū)域像素點(diǎn)總個(gè)數(shù)之比,邊緣密度ρ可定義為
(5)
式中 pij為邊緣圖像中邊緣像素點(diǎn)的像素值,邊緣點(diǎn)pij=1,非邊緣點(diǎn)pij=0,M×N為區(qū)域大小。
對(duì)于提取的印章圖像,可利用Canny邊緣檢測(cè)算子對(duì)其進(jìn)行邊緣檢測(cè)[13],并將檢測(cè)出的邊緣信息再通過(guò)上述邊緣密度的定義,對(duì)其進(jìn)行計(jì)算,得到各區(qū)域的邊緣密度。然后可根據(jù)計(jì)算得到的邊緣密度信息對(duì)不同算法下提取出的結(jié)果進(jìn)行對(duì)比分析。
為驗(yàn)證本文算法的有效性,利用一副大小為1 951×1 420的中國(guó)古代書(shū)法作品圖像作為測(cè)試圖像,如圖1所示。圖像中書(shū)法字較為清晰,與背景之間差異較大,利用一般的閾值二值化方法或者圖像分割算法即可準(zhǔn)確提取;而其中含有的印章信息相對(duì)較為模糊,特別是印章的邊緣區(qū)域與背景差異較小,導(dǎo)致傳統(tǒng)算法難以準(zhǔn)確提取。
圖1 原始中國(guó)書(shū)法作品圖像Fig 1 The original image of Chinese calligraphy work
圖2 FCM提取的印章圖及其局部放大圖Fig 2 Seals extracted by FCM and their detailed images
圖3 利用雙閾值法獲得Guide-filter的輸入圖像Fig 3 Input image of Guide-filter obtained by double threshold values method
圖4 基于Guide-filter提取的印章圖及其局部放大圖Fig 4 Seals extracted by Guide-filter and their detailed images
為進(jìn)一步客觀地評(píng)價(jià)兩種算法在提取印章信息方面的優(yōu)劣,利用區(qū)域像素?cái)?shù)和區(qū)域邊緣密度來(lái)做具體的分析。首先對(duì)提取印章圖像進(jìn)行二值化處理,得到印章的二值圖像,并計(jì)算各區(qū)域的像素?cái)?shù);然后,利用Canny邊緣檢測(cè)算子檢測(cè)出提取印章圖像的邊緣信息,并計(jì)算印章區(qū)域的邊緣密度。
印章圖像區(qū)域像素統(tǒng)計(jì)曲線圖如圖5所示,較細(xì)虛線表示本文算法提取印章的區(qū)域像素點(diǎn)統(tǒng)計(jì)結(jié)果(區(qū)域大小為100×100),較粗實(shí)線表示FCM提取印章的區(qū)域像素點(diǎn)統(tǒng)計(jì)結(jié)果??梢?jiàn)本文算法提取的印章區(qū)域像素都高于FCM提取的結(jié)果,這是由于本文算法獲得的印章信息更完整,邊緣信息更為豐富,所以,印章區(qū)域的像素點(diǎn)相對(duì)FCM的結(jié)果更多。
印章圖像區(qū)域邊緣密度統(tǒng)計(jì)曲線如圖6所示, Guide-filter提取的印章線劃更連續(xù),因此, Guide-filter提取的印章區(qū)域的邊緣密度理論上應(yīng)該相對(duì)較小,但從圖6中可以看出,在大部分區(qū)域兩者的邊緣密度大致相同。但由于印章圖像的右上方和右下方的印章提取的效果差異較大,F(xiàn)CM提取的結(jié)果中該區(qū)域含有很少的印章像素,導(dǎo)致某些區(qū)域幾乎不含有邊緣,因此,Guide-filter提取的結(jié)果在這些區(qū)域偏高(圖中標(biāo)記部分),即曲線的起始部分和結(jié)尾部分,較細(xì)虛線明顯高于較粗實(shí)線。這并不是表明FCM的提取結(jié)果勝于Guide-filter的提取結(jié)果,而是因?yàn)镕CM提取的印章在該區(qū)域丟失過(guò)多信息。
圖5 區(qū)域像素統(tǒng)計(jì)對(duì)比Fig 5 Comparison of statistics of pixels in areas
圖6 區(qū)域邊緣密度對(duì)比Fig 6 Comparison of edge density in areas
本文針對(duì)中國(guó)書(shū)法作品中的印章信息,提出基于Guide-filter的中國(guó)書(shū)法作品中印章信息的提取算法。該算法能夠較準(zhǔn)確地提取書(shū)法圖像中的印章信息,提取的印章信息更完整,線劃更連續(xù)。利用邊緣密度的概念對(duì)不同的印章提取算法的性能進(jìn)行客觀評(píng)價(jià),以避免基于視覺(jué)評(píng)價(jià)的主觀性。通過(guò)仿真實(shí)驗(yàn)與分析,表明本文提出算法具有更好的性能。
[1] Yao C,Bai X,Shi B,et al.Strokelets:A learned multi-scale representation for scene text recognition[C]∥2014 IEEE Confe-rence on Computer Vision and Pattern Recognition(CVPR),IEEE,2014:4042-4049.
[2] Yi C,Tian Y.Scene text recognition in mobile applications by character descriptor and structure configuration[J].IEEE Tran-sactions on Image Processing,2014,23(7):2972-2982.
[3] 安計(jì)勇,高貴閣,史志強(qiáng),等.一種改進(jìn)的K均值文本聚類(lèi)算法[J].傳感器與微系統(tǒng),2015,34(5):130-133.
[4] Roy P P,Pal U,Lladós J.Document seal detection using GHT
and character proximity graphs[J].Pattern Recognition,2011,44(6):1282-1295.
[5] 婁海濤.中國(guó)書(shū)畫(huà)印章圖像的提取與識(shí)別[D].北京:北京郵電大學(xué),2008.
[6] 張曉東,陳 鋒,杜 凱.一種印章圖像的自適應(yīng)特征提取算法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2004,36(8):1065-1067.
[7] 宋永紅,龔 晨,張?jiān)?基于背景密度估計(jì)的印章圖像提取方法:中國(guó),CN104408721A[P].2015.
[8] 曾 銳.印章特征提取算法研究[D].杭州:浙江大學(xué),2007.
[9] 陳至坤,潘曉娣,王福斌,等.基于Radon變換的圖像輪廓提取方法研究[J].傳感器與微系統(tǒng),2010,29(2):63-65.
[10] 陳 英,楊豐玉,符 祥.基于支持向量機(jī)和灰度共生矩陣的紋理圖像分割方法[J].傳感器與微系統(tǒng),2012,31(9):60-63.
[11] 鮑 泓,婁海濤.一種自動(dòng)提取中國(guó)書(shū)畫(huà)作品中印章圖像的方法[J].計(jì)算機(jī)科學(xué),2009,36(3):250-252.
[12] 胡佳林,劉波峰,何玉成.基于遺傳算法的Canny邊緣檢測(cè)算子在配藥機(jī)器人中的應(yīng)用[J].傳感器與微系統(tǒng),2013,32(7):141-143.
Extraction of seals from Chinese calligraphy works based on Guide-filter*
XU Peng-fei
(School of Information Science and Technology,Northwest University,Xi’an 710127,China)
In order to solve the problem that the seals are difficult to extract accurately from the Chinese calligraphy works,an algorithm for extraction of seals based on Guide-filter is proposed.This algorithm makes full use of advantage that Guide-filter can preserve the edges of the images,and can approximate the objects greatly.The residual image between binary images obtained by the double threshold values method is used as the input image of Guide-filter,and the original image as guiding image,finally,accurate seal image can be obtained.Besides,the edge density is used to evaluate the effect of seal extraction objectively.The experiment results show that the proposed algorithm can extract the seals information better.
Chinese calligraphy works; seal; guide-filter; edge density
10.13873/J.1000—9787(2016)12—0125—04
2016—09—19
國(guó)家自然科學(xué)基金青年基金資助項(xiàng)目(61502387);陜西省教育廳專(zhuān)項(xiàng)科研計(jì)劃資助項(xiàng)目(15JK1748);西北大學(xué)科學(xué)研究基金資助項(xiàng)目(14NW25,14NW27,14NW28)
TP 391
A
1000—9787(2016)12—0125—04
許鵬飛(1987-),男,安徽巢湖人,博士,講師,主要從事數(shù)字圖像處理工作。