王婷婷,董超俊
?
圖像增強(qiáng)技術(shù)在古籍圖書電子化中的應(yīng)用
王婷婷,董超俊
(五邑大學(xué) 信息工程學(xué)院,廣東 江門 529020)
為提高古籍圖書電子化的處理質(zhì)量,文章以帶插圖的書頁和具有背景干擾的書頁為處理對(duì)象,使用二值化法、直方圖均衡法和對(duì)比度拉伸法對(duì)書頁進(jìn)行圖像增強(qiáng)處理,并使用Visual Studio 2010軟件和OpenCV進(jìn)行實(shí)驗(yàn). 結(jié)果表明:帶插圖的古籍書頁適合采用對(duì)比度拉伸法處理,帶背景干擾的書頁適合采用二值化法處理.
古籍電子化;二值化;直方圖均衡;對(duì)比度拉伸
眾所周知,古籍圖書具有較高的經(jīng)濟(jì)價(jià)值和文化價(jià)值. 由于各種原因,古籍書頁很多都已經(jīng)受損,最明顯的問題就是字跡和插圖模糊,翻印之前必須把這些書頁進(jìn)行處理. 由于古籍書頁很薄,不能直接復(fù)印,要先掃描或者拍照后再進(jìn)行圖像處理. 目前已開發(fā)的處理古籍圖書的軟件,不能針對(duì)不同類型的受損書頁狀況進(jìn)行個(gè)性化處理[1-3]. 因此,文章針對(duì)帶插圖和帶背景干擾兩種類型的書頁,采用不同的增強(qiáng)方法并通過實(shí)驗(yàn)對(duì)比分析,以期找到適合這些類型書頁圖像增強(qiáng)的方法.
1 圖像增強(qiáng)技術(shù)簡介
圖像增強(qiáng)技術(shù)是指通過特定的技術(shù)手段對(duì)圖片進(jìn)行處理以提高圖片清晰度或突出圖片中重點(diǎn)關(guān)注區(qū)域圖像的一種方法,可分為頻域處理方法和空域處理方法[4,5]. 頻域方法是指把圖像轉(zhuǎn)換到變換域進(jìn)行處理,再反變換把結(jié)果返回到空間域. 而空域方法則是直接改變圖像的像素點(diǎn). 頻域方法有低通濾波、同態(tài)濾波等;空域方法有二值化、直方圖均衡化、對(duì)比度增強(qiáng)、模糊增強(qiáng)、小波變換等. 在實(shí)際應(yīng)用中,處理速度是一個(gè)重要的考量指標(biāo),空域方法不需要進(jìn)行域的變換,處理速度上具有明顯優(yōu)勢,且古籍多為灰度圖,因此本文采用空域方法對(duì)各類古籍進(jìn)行圖形增強(qiáng),具體的方法分別是二值化法、直方圖均衡化法和對(duì)比度拉伸法.
1.1 二值化法
;.
1.2 直方圖均衡化法
灰度直方圖是灰度級(jí)函數(shù),表示圖像中具有每種灰度級(jí)的像素的個(gè)數(shù),反映圖像中每種灰度出現(xiàn)的頻率. 而直方圖均衡化的原理是將原始圖片的灰度直方圖比較集中的某個(gè)灰度區(qū)域變成全部灰度范圍內(nèi)的均勻分布[7,8]. 一幅數(shù)字圖像中灰度級(jí)出現(xiàn)的概率近似為:
離散變換函數(shù)為
1.3 對(duì)比度拉伸法
對(duì)比度拉伸屬于分段線性變換,是通過擴(kuò)展圖像中重點(diǎn)關(guān)注區(qū)域的灰度范圍,抑制非重點(diǎn)區(qū)域灰度的圖像增強(qiáng)方法[9]. 設(shè)圖像的灰度范圍為,通過對(duì)比拉伸法得到的圖像的灰度范圍為.
拉伸的數(shù)學(xué)表達(dá)式如式(3)所示,坐標(biāo)如圖1所示:
2 3種方法處理結(jié)果分析
本文使用Visual Studio 2010軟件進(jìn)行圖像增強(qiáng)實(shí)驗(yàn),并調(diào)用OpenCV函數(shù)編程. 二值化采用OpenCV函數(shù)[10]void cvThreshold(const CvArr* src,CvArr* dst,double threshold,double max_value,int threshold_type),直方圖均衡采用void cvEqualizeHist(const CvArr* src,CvArr* dst)函數(shù),對(duì)比度拉伸則根據(jù)不同的圖片采用不同的拉伸參數(shù). 實(shí)驗(yàn)選取2組帶插圖樣本和2組帶背景干擾樣本,分別采用上述3種方法進(jìn)行圖像增強(qiáng)處理,處理結(jié)果如圖2-5所示.
a.原圖 b.二值化 c.直方圖均衡 d.對(duì)比度拉伸
a.原圖 b.二值化 c.直方圖均衡 d.對(duì)比度拉伸
a.原圖 b.二值化 c.直方圖均衡 d.對(duì)比度拉伸
a.原圖 b.二值化 c.直方圖均衡 d.對(duì)比度拉伸
從圖2、3可以看出,帶插圖的書頁采用二值化法會(huì)使文字顏色加深,但插圖的部分背景像素丟失,不能真實(shí)反映源圖像的信息,丟失背景的原因是插圖像素值比閾值大(處理時(shí)直接賦值255(白色));直方圖均衡法則使圖像細(xì)節(jié)變模糊,其原因是直方圖均衡的過程中灰度發(fā)生大量合并,使均衡后的圖像灰度級(jí)減少,造成細(xì)節(jié)丟失;對(duì)比度拉伸法增大了圖像的對(duì)比度,使書頁文字和插圖同時(shí)變清晰,效果較好.
從圖4、5可以看出,帶背景干擾的古籍書頁使用二值化法得到的圖像視覺效果最好,其原因是干擾背景的灰度值和前景目標(biāo)的灰度值差距較大,大津閾值法可準(zhǔn)確找到合適的閾值將前景保留,去除其他干擾;直方圖均衡則仍然具有干擾,當(dāng)圖片具有較多像素值相同時(shí),處理后這些像素被過分增強(qiáng),造成視覺效果不自然,同時(shí)直方圖均衡的過程中灰度的合并也使得圖像模糊;對(duì)比度拉伸法使書頁全部內(nèi)容變清晰,但多余的背景文字也同時(shí)被保留了.
根據(jù)實(shí)驗(yàn)結(jié)果可以看到:帶插圖的古籍書頁適合采用對(duì)比度拉伸法處理,能使插圖和文字同時(shí)變清晰;具有背景干擾的書頁適合采用二值化法,可保留有用信息去除干擾背景. 直方圖均衡法則由于會(huì)帶來更多的干擾而不適用于帶插圖的或者受其他頁背景干擾的古籍書頁,且原圖更模糊,容易造成背景噪點(diǎn)增和降低圖像中重點(diǎn)關(guān)注區(qū)域的對(duì)比度.
4 結(jié)論
傳統(tǒng)的古籍書頁電子化自動(dòng)化程度低,如閾值的選取需要人工調(diào)試,操作復(fù)雜,效率較低. 古籍書頁多種多樣,本文選取的帶插圖和帶背景干擾書頁是目前古籍電子化處理中的難點(diǎn),實(shí)驗(yàn)表明:采用空域方法能很好地達(dá)到實(shí)際應(yīng)用需求. 同時(shí),將書頁進(jìn)行分類并采用不同的方法處理,不僅可以得到較好的視覺效果,且速度較快,可實(shí)現(xiàn)古籍電子化的高效處理. 對(duì)其他類型如變形、殘缺等書頁的處理將是下一步研究的方向.
[1] MURAHIRA K, KAWAKAMI T, TAGUCHI A. A novel method for design of gray-level transformation functions for image contrast improvement based on the histogram equalization technique [J]. Electronics and Communications in Japan, 2013, 96 (7): 57-66.
[2] 藍(lán)永. 論古籍整理的新方式—古籍?dāng)?shù)字化[D]. 濟(jì)南:山東大學(xué),2007.
[3] CELIK.Two-dimensional histogram equalization and contrast enhancement [J]. Pattern Recognition,2012,45 (10):3810-3824.
[4] 高娟,劉家真. 中國大陸地區(qū)古籍?dāng)?shù)字化問題及對(duì)策[J]. 中國圖書館學(xué)報(bào),2013,39(206):110-119.
[5] GONZALEZ R C,WOODS R E. 數(shù)字圖像處理[M]. 3版. 阮積琦,阮宇智,譯. 北京:電子工業(yè)出版社,2011:64-85.
[6] 汪啟偉.圖像直方圖特征及其應(yīng)用研究[D]. 合肥:中國科技大學(xué),2014.
[7] 許欣.圖像增強(qiáng)若干理論方法與應(yīng)用研究[D]. 南京:南京理工大學(xué),2010.
[8] 盛道清. 圖像增強(qiáng)算法的研究[D]. 武漢:武漢科技大學(xué),2007.
[9] 梁愛民,陳荔京. 古籍?dāng)?shù)字化與共建共享[J]. 國家圖書館學(xué)刊,2012(5):108-112.
[10] BRADSKI G, KAEHLER A. 學(xué)習(xí)OpenCV[M]. 于仕琪,劉瑞禎,譯. 北京:清華大學(xué)出版社,2008:164-230.
[責(zé)任編輯:韋 韜]
Application of Image Enhancement in the Electronization of Ancient Books
WANGTing-ting, DONGChao-jun
(School of Information Engineering, Wuyi University, Jiangmen 529020, China)
In order to improve the quality of electronization of ancient books, this study, taking pages with illustrations and pages with background interference as treatment objects, attempts to apply image enhancement to the treatment of pages by adopting methods of binarization, histogram equalization and contrast stretching and experiments using the Visual Studio 2010 software and OpenCV are conducted. The results show that the contrast stretching method is suitable for illustrated pages of ancient books and binarization is suitable for treating pages with background interference.
electronization ancient books; binarization; histogram equalization; contrast stretching
1006-7302(2015)01-0026-04
TP391
A
2014-11-10
王婷婷(1988—),女,湖北荊門人,在讀碩士生,主要研究方向?yàn)閳D像處理及應(yīng)用;董超俊,教授,博士,碩士生導(dǎo)師,通信作者,主要研究方向?yàn)閳D像處理及應(yīng)用.