關(guān)鍵詞:圖像模式識(shí)別;數(shù)字圖書(shū)資料;局部二值化
摘要:圖像模式識(shí)別是一種新的數(shù)字圖書(shū)資料的自動(dòng)修復(fù)技術(shù),它以傳統(tǒng)的圖書(shū)資料修復(fù)方法為基礎(chǔ),主要運(yùn)用計(jì)算機(jī)完成。文章闡述了圖形模式識(shí)別技術(shù)在數(shù)字圖書(shū)資料修復(fù)中的應(yīng)用情況,即通過(guò)對(duì)圖書(shū)資料進(jìn)行掃描、二值化和圖像的重建等方法對(duì)不清晰的圖形進(jìn)行自動(dòng)修復(fù),最終實(shí)現(xiàn)數(shù)字圖書(shū)資料的數(shù)字化處理。
中圖分類(lèi)號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2014)08-0116-02
1背景
圖書(shū)內(nèi)容的電子化和網(wǎng)絡(luò)化發(fā)展就是圖書(shū)資料的數(shù)字化過(guò)程,圖書(shū)資料實(shí)現(xiàn)了數(shù)字化之后,就會(huì)存儲(chǔ)在專(zhuān)業(yè)的數(shù)據(jù)庫(kù)服務(wù)系統(tǒng)中,讀者只需要通過(guò)網(wǎng)絡(luò)就可以在線(xiàn)閱讀或者下載。網(wǎng)絡(luò)媒介和傳統(tǒng)的紙質(zhì)媒介所表達(dá)的文獻(xiàn)資料的內(nèi)容都是相同的,數(shù)字化的圖書(shū)資料經(jīng)過(guò)了數(shù)字化技術(shù)處理,能夠完整并真實(shí)地反映出紙質(zhì)圖書(shū)的所有內(nèi)容,只不過(guò)兩種媒介所表達(dá)的方式有所區(qū)別。在這個(gè)過(guò)程中,圖書(shū)的數(shù)字化處理技術(shù)發(fā)揮了關(guān)鍵作用。目前,清華同方和維普資訊等學(xué)術(shù)性的文獻(xiàn)數(shù)據(jù)庫(kù)已經(jīng)建立起來(lái)并得到了廣泛應(yīng)用。
2數(shù)字圖書(shū)資料修復(fù)存在的問(wèn)題
對(duì)圖書(shū)資料進(jìn)行數(shù)字化處理,首先要進(jìn)行數(shù)據(jù)收集,即將相關(guān)的數(shù)據(jù)輸入計(jì)算機(jī);而后,會(huì)顯示出一個(gè)長(zhǎng)方形方框;對(duì)這個(gè)長(zhǎng)方形方框進(jìn)行圖像預(yù)處理之后,就要對(duì)區(qū)域內(nèi)的圖像進(jìn)行模式識(shí)別。通過(guò)這種方法能將圖書(shū)資料中的文字清晰而又準(zhǔn)確地反映出來(lái),為圖書(shū)資料的修復(fù)提供參考意見(jiàn)。這一系列過(guò)程完成之后,就可以實(shí)現(xiàn)圖書(shū)和檔案的數(shù)字化。
目前,二值化方法是圖書(shū)數(shù)字化中使用最多的方法。因?yàn)樵跀?shù)字圖書(shū)資料的修復(fù)過(guò)程中,需要對(duì)大量的數(shù)據(jù)進(jìn)行處理,而使用二值化的方法就能滿(mǎn)足這種需求。二值化方法具有工作效率高的特點(diǎn),這也是其最大的優(yōu)勢(shì)。數(shù)字圖書(shū)資料經(jīng)過(guò)二值化的處理之后,所得到圖像的對(duì)比度會(huì)高于原有圖書(shū)資料中的圖像,給識(shí)別和閱讀提供方便的同時(shí)也會(huì)帶來(lái)一些新的問(wèn)題,例如:二值化處理會(huì)使原來(lái)圖像中本來(lái)就不清晰的部分字符變得更加模糊,不能進(jìn)行準(zhǔn)確識(shí)別。這個(gè)問(wèn)題不能解決,就會(huì)給圖書(shū)資料的數(shù)字化工作帶來(lái)巨大的負(fù)面影響。如果連數(shù)字化處理的基本要求都無(wú)法達(dá)到,就會(huì)迫使圖書(shū)管理人員放棄對(duì)這一部分資料進(jìn)行修復(fù)。此外,通過(guò)圖像采集系統(tǒng)攝入的圖像通常都會(huì)自動(dòng)生成BMP格式并存放在計(jì)算機(jī)中,但計(jì)算機(jī)顯示出來(lái)的卻是灰度圖像。在各種因素的影響下,圖像會(huì)出現(xiàn)模糊,筆畫(huà)斷開(kāi)、粗細(xì)不均衡等現(xiàn)象,而且圖像中大量孤立噪聲的存在,也會(huì)使提取字符的難度加大。
針對(duì)數(shù)字圖書(shū)資料修復(fù)中存在的這些問(wèn)題,筆者在傳統(tǒng)二值化處理的基礎(chǔ)上,引用了局部二值化的處理方法,主要是為了對(duì)不清晰的數(shù)字圖書(shū)資料進(jìn)行修復(fù),從而實(shí)現(xiàn)圖書(shū)資料的數(shù)字化。
3圖像模式識(shí)別技術(shù)的工作原理
3.1模式識(shí)別的定義
對(duì)表征事物和現(xiàn)象進(jìn)行數(shù)值、文字和邏輯關(guān)系等多種形式的信息進(jìn)行處理和分析,以便能對(duì)事物和現(xiàn)象進(jìn)行描述、辨認(rèn),并完成對(duì)它們的分類(lèi)和解釋?zhuān)@樣一個(gè)過(guò)程就是模式識(shí)別。模式識(shí)別的基礎(chǔ)就是大量的信息和數(shù)據(jù),采用的主要方法是計(jì)算機(jī)和數(shù)學(xué)推理,識(shí)別的主要對(duì)象是形狀、曲線(xiàn)、數(shù)字、字符格式和圖形等。目前,模式識(shí)別技術(shù)已經(jīng)被廣泛應(yīng)用于社會(huì)的各行各業(yè),包括天氣的預(yù)測(cè)、衛(wèi)星圖片和航空?qǐng)D片的解釋、工業(yè)產(chǎn)品的檢測(cè)、字符識(shí)別、語(yǔ)音識(shí)別、指紋識(shí)別和醫(yī)學(xué)影像分析等。值得一提的是,模式識(shí)別在圖像處理中運(yùn)用最典型的案例就是目前被廣泛使用的文字識(shí)別,這種方法在圖書(shū)信息的修復(fù)上有著廣闊的發(fā)展前景,能夠?yàn)閳D書(shū)資料的數(shù)字化提供相應(yīng)的技術(shù)支持。
3.2局部二值化的內(nèi)涵
以一張最普通的A4大小的圖像為例,它上面存在上千像素點(diǎn),這么大的一張圖像,即便能夠通過(guò)大律法進(jìn)行完美的掃描,單一閥值的方法也不能得到最好的二值化結(jié)果。所以對(duì)大圖像進(jìn)行閥值計(jì)算時(shí),最常見(jiàn)的方法就是:先對(duì)整個(gè)大圖像進(jìn)行分割,使之變成若干張大小相等的小圖像,然后利用二值化方法對(duì)這些小圖像進(jìn)行閥值計(jì)算,而后將經(jīng)過(guò)二值化之后的小點(diǎn)陣進(jìn)行整合,得到最后的結(jié)果,這種方法就是局部二值化。在對(duì)數(shù)字圖書(shū)資料中的圖像進(jìn)行二值化的過(guò)程中,需要先將圖像的局部切割成小塊,這樣就能將大圖像的二值化問(wèn)題轉(zhuǎn)換成為小圖像的二值化問(wèn)題。這樣一來(lái),即便數(shù)字圖像資料中色度分布不均、局部顏色透明度不高,在二值化的過(guò)程中也不會(huì)發(fā)生因?yàn)轭伾档鴣G失字符的問(wèn)題。
3.3圖像模式識(shí)別的原理
圖像模式識(shí)別的工作原理主要由兩部分構(gòu)成,即局部二值化的原理和圖像分塊的確定。下面就對(duì)這兩方面進(jìn)行具體分析。
3.3.1局部二值化原理。所謂的局部二值化就是將一張比較大的圖像分割成若干比較小的圖像,然后對(duì)這些比較小的圖像進(jìn)行二值化,經(jīng)過(guò)組合之后形成完整的二值化圖像。換句話(huà)說(shuō),只需要分割、塊二值化和合并三個(gè)步驟就能完成圖像的二值化處理。
3.3.2圖像分塊的確定。在對(duì)大圖像進(jìn)行分割時(shí),應(yīng)該將圖像的局部灰度平均值作為分割的依據(jù),這樣就可以使一些質(zhì)量較差圖像的局部二值化效果得到提高。從理論上講,對(duì)大圖像分割的小圖像數(shù)量越多,最后二值化的效果就會(huì)越好。但是在實(shí)際的操作過(guò)程中,這樣的分割方法會(huì)大大降低計(jì)算的速度。而且,圖像分割得越小,經(jīng)過(guò)局部的二值化之后,最后整合出來(lái)的二值化的噪音就會(huì)越多,這樣就會(huì)給后面的平滑處理帶來(lái)更多的問(wèn)題,增加后期處理的難度。
4數(shù)字圖書(shū)資料的修復(fù)方法
在進(jìn)行圖書(shū)資料數(shù)字化的過(guò)程中,圖形經(jīng)過(guò)掃描之后,還需要經(jīng)過(guò)圖像的預(yù)處理、提取圖像中的字符信息、對(duì)圖形進(jìn)行局部二值化的處理等過(guò)程,其中圖像的局部二值化處理是進(jìn)行圖書(shū)資料修復(fù)的核心步驟。下面筆者就對(duì)這三方面的工作內(nèi)容進(jìn)行詳細(xì)說(shuō)明。
4.1對(duì)圖像進(jìn)行預(yù)處理
柴森:基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用柴森:基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用一方面,受掃描系統(tǒng)的版本、光電轉(zhuǎn)換的不同位置以及工作環(huán)境中的光電等因素的影響,會(huì)使圖書(shū)或者是檔案資料在進(jìn)行數(shù)字化的過(guò)程中,出現(xiàn)圖像掃描不均勻、對(duì)比度差異較大等問(wèn)題,導(dǎo)致圖像的清晰度不夠,還原度和可視程度降低。另一方面,光電敏感元件中的載荷粒子會(huì)隨著機(jī)器的運(yùn)轉(zhuǎn)產(chǎn)生一定的噪音,或者是受到傳輸通道的干擾,灰度圖像在經(jīng)過(guò)數(shù)字化的處理之后,都會(huì)含有一定的噪聲。正是由于這兩方面的原因,在對(duì)圖書(shū)或者是檔案圖像進(jìn)行二值化的處理之前,都需要對(duì)圖像進(jìn)行預(yù)處理。endprint
目前,在圖書(shū)資料數(shù)字化的過(guò)程中,對(duì)圖像進(jìn)行預(yù)處理的辦法主要有兩種,即灰度變換和平滑濾波。其中灰度變換主要是指對(duì)圖像像素的灰度值進(jìn)行修正,讓圖像經(jīng)過(guò)處理之后顏色分布更加均勻,對(duì)比度更加飽滿(mǎn)。而平滑濾波主要就是指在圖像的處理過(guò)程中,在平滑的圖像中加入噪聲。
4.2提取圖像中的字符信息
對(duì)于亮度比較大的點(diǎn),可以將它的值假設(shè)為0;對(duì)于亮度較小的點(diǎn),可以假設(shè)它的值為1。像素的集合就是圖像的背景區(qū)域,如果將小于或者是等于閾值N的像素設(shè)置成黑色,那么像素的值就為1,通過(guò)這樣的方法就能得到只有黑白兩個(gè)等級(jí)的二值化圖像,圖像中字符信息就會(huì)顯示出來(lái)。通常情況下,數(shù)字圖書(shū)資料的背景色都很淺,而字符的顏色比較深。以紙質(zhì)圖書(shū)為例,它的背景色通常都是白色,而字符則是黑色。
4.3二值化圖像的二次處理
對(duì)圖像進(jìn)行局部二值化的處理之后,就能得到各個(gè)小塊圖像的值點(diǎn)。雖然這種方法能夠避免部分小塊顏色暗淡只是整體圖像沒(méi)有值點(diǎn)現(xiàn)象的產(chǎn)生,但會(huì)使圖像中包含很多的噪音。這些噪音在進(jìn)行圖像的重組之前必須去除,一般情況下,可以使用圖像重構(gòu)的方式進(jìn)行處理。采用圖像重構(gòu)法不僅能夠得到完整的原始圖像,還能夠構(gòu)造出BMP位圖文件,打印出比原來(lái)效果更好的圖書(shū)資料,達(dá)到修復(fù)圖書(shū)資料的目的。
5結(jié)語(yǔ)
本文從四個(gè)方面對(duì)圖像模式識(shí)別技術(shù)在數(shù)字圖書(shū)資料修復(fù)中的應(yīng)用進(jìn)行了探討,首先是數(shù)字圖書(shū)資料的概述,其次是數(shù)字圖書(shū)資料在修復(fù)過(guò)程中存在的問(wèn)題,再次是模式識(shí)別的工作原理,最后是模式識(shí)別技術(shù)的主要方法。
參考文獻(xiàn):
[1]代小紅.基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用[J].圖書(shū)情報(bào)工作,2009(3):111-114.
[2]康汶,鄒愛(ài)國(guó),鄒利明.數(shù)字圖書(shū)館統(tǒng)一身份認(rèn)證及綜合應(yīng)用研究[J].計(jì)算機(jī)與現(xiàn)代化,2010(12):79-84.
[3]賈昔玲.基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2010(10):75.
[4]李鵬.數(shù)字圖書(shū)館內(nèi)容管理開(kāi)源軟件應(yīng)用與評(píng)價(jià)研究[D].吉林大學(xué),2012.
[5]陸穎雋.虛擬現(xiàn)實(shí)技術(shù)在數(shù)字圖書(shū)館的應(yīng)用研究[D].武漢大學(xué),2013.
[6]李志華.中山市勞教管理學(xué)校的數(shù)字圖書(shū)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2012.
[7]徐寧.圖書(shū)館數(shù)字化資源管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2011.
[8]化明艷.高校數(shù)字圖書(shū)館信息服務(wù)能力評(píng)價(jià)模型研究[D].南京農(nóng)業(yè)大學(xué),2010.
(編校:周雪芹)endprint
目前,在圖書(shū)資料數(shù)字化的過(guò)程中,對(duì)圖像進(jìn)行預(yù)處理的辦法主要有兩種,即灰度變換和平滑濾波。其中灰度變換主要是指對(duì)圖像像素的灰度值進(jìn)行修正,讓圖像經(jīng)過(guò)處理之后顏色分布更加均勻,對(duì)比度更加飽滿(mǎn)。而平滑濾波主要就是指在圖像的處理過(guò)程中,在平滑的圖像中加入噪聲。
4.2提取圖像中的字符信息
對(duì)于亮度比較大的點(diǎn),可以將它的值假設(shè)為0;對(duì)于亮度較小的點(diǎn),可以假設(shè)它的值為1。像素的集合就是圖像的背景區(qū)域,如果將小于或者是等于閾值N的像素設(shè)置成黑色,那么像素的值就為1,通過(guò)這樣的方法就能得到只有黑白兩個(gè)等級(jí)的二值化圖像,圖像中字符信息就會(huì)顯示出來(lái)。通常情況下,數(shù)字圖書(shū)資料的背景色都很淺,而字符的顏色比較深。以紙質(zhì)圖書(shū)為例,它的背景色通常都是白色,而字符則是黑色。
4.3二值化圖像的二次處理
對(duì)圖像進(jìn)行局部二值化的處理之后,就能得到各個(gè)小塊圖像的值點(diǎn)。雖然這種方法能夠避免部分小塊顏色暗淡只是整體圖像沒(méi)有值點(diǎn)現(xiàn)象的產(chǎn)生,但會(huì)使圖像中包含很多的噪音。這些噪音在進(jìn)行圖像的重組之前必須去除,一般情況下,可以使用圖像重構(gòu)的方式進(jìn)行處理。采用圖像重構(gòu)法不僅能夠得到完整的原始圖像,還能夠構(gòu)造出BMP位圖文件,打印出比原來(lái)效果更好的圖書(shū)資料,達(dá)到修復(fù)圖書(shū)資料的目的。
5結(jié)語(yǔ)
本文從四個(gè)方面對(duì)圖像模式識(shí)別技術(shù)在數(shù)字圖書(shū)資料修復(fù)中的應(yīng)用進(jìn)行了探討,首先是數(shù)字圖書(shū)資料的概述,其次是數(shù)字圖書(shū)資料在修復(fù)過(guò)程中存在的問(wèn)題,再次是模式識(shí)別的工作原理,最后是模式識(shí)別技術(shù)的主要方法。
參考文獻(xiàn):
[1]代小紅.基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用[J].圖書(shū)情報(bào)工作,2009(3):111-114.
[2]康汶,鄒愛(ài)國(guó),鄒利明.數(shù)字圖書(shū)館統(tǒng)一身份認(rèn)證及綜合應(yīng)用研究[J].計(jì)算機(jī)與現(xiàn)代化,2010(12):79-84.
[3]賈昔玲.基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2010(10):75.
[4]李鵬.數(shù)字圖書(shū)館內(nèi)容管理開(kāi)源軟件應(yīng)用與評(píng)價(jià)研究[D].吉林大學(xué),2012.
[5]陸穎雋.虛擬現(xiàn)實(shí)技術(shù)在數(shù)字圖書(shū)館的應(yīng)用研究[D].武漢大學(xué),2013.
[6]李志華.中山市勞教管理學(xué)校的數(shù)字圖書(shū)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2012.
[7]徐寧.圖書(shū)館數(shù)字化資源管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2011.
[8]化明艷.高校數(shù)字圖書(shū)館信息服務(wù)能力評(píng)價(jià)模型研究[D].南京農(nóng)業(yè)大學(xué),2010.
(編校:周雪芹)endprint
目前,在圖書(shū)資料數(shù)字化的過(guò)程中,對(duì)圖像進(jìn)行預(yù)處理的辦法主要有兩種,即灰度變換和平滑濾波。其中灰度變換主要是指對(duì)圖像像素的灰度值進(jìn)行修正,讓圖像經(jīng)過(guò)處理之后顏色分布更加均勻,對(duì)比度更加飽滿(mǎn)。而平滑濾波主要就是指在圖像的處理過(guò)程中,在平滑的圖像中加入噪聲。
4.2提取圖像中的字符信息
對(duì)于亮度比較大的點(diǎn),可以將它的值假設(shè)為0;對(duì)于亮度較小的點(diǎn),可以假設(shè)它的值為1。像素的集合就是圖像的背景區(qū)域,如果將小于或者是等于閾值N的像素設(shè)置成黑色,那么像素的值就為1,通過(guò)這樣的方法就能得到只有黑白兩個(gè)等級(jí)的二值化圖像,圖像中字符信息就會(huì)顯示出來(lái)。通常情況下,數(shù)字圖書(shū)資料的背景色都很淺,而字符的顏色比較深。以紙質(zhì)圖書(shū)為例,它的背景色通常都是白色,而字符則是黑色。
4.3二值化圖像的二次處理
對(duì)圖像進(jìn)行局部二值化的處理之后,就能得到各個(gè)小塊圖像的值點(diǎn)。雖然這種方法能夠避免部分小塊顏色暗淡只是整體圖像沒(méi)有值點(diǎn)現(xiàn)象的產(chǎn)生,但會(huì)使圖像中包含很多的噪音。這些噪音在進(jìn)行圖像的重組之前必須去除,一般情況下,可以使用圖像重構(gòu)的方式進(jìn)行處理。采用圖像重構(gòu)法不僅能夠得到完整的原始圖像,還能夠構(gòu)造出BMP位圖文件,打印出比原來(lái)效果更好的圖書(shū)資料,達(dá)到修復(fù)圖書(shū)資料的目的。
5結(jié)語(yǔ)
本文從四個(gè)方面對(duì)圖像模式識(shí)別技術(shù)在數(shù)字圖書(shū)資料修復(fù)中的應(yīng)用進(jìn)行了探討,首先是數(shù)字圖書(shū)資料的概述,其次是數(shù)字圖書(shū)資料在修復(fù)過(guò)程中存在的問(wèn)題,再次是模式識(shí)別的工作原理,最后是模式識(shí)別技術(shù)的主要方法。
參考文獻(xiàn):
[1]代小紅.基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用[J].圖書(shū)情報(bào)工作,2009(3):111-114.
[2]康汶,鄒愛(ài)國(guó),鄒利明.數(shù)字圖書(shū)館統(tǒng)一身份認(rèn)證及綜合應(yīng)用研究[J].計(jì)算機(jī)與現(xiàn)代化,2010(12):79-84.
[3]賈昔玲.基于圖像模式識(shí)別的數(shù)字圖書(shū)資料修復(fù)及應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2010(10):75.
[4]李鵬.數(shù)字圖書(shū)館內(nèi)容管理開(kāi)源軟件應(yīng)用與評(píng)價(jià)研究[D].吉林大學(xué),2012.
[5]陸穎雋.虛擬現(xiàn)實(shí)技術(shù)在數(shù)字圖書(shū)館的應(yīng)用研究[D].武漢大學(xué),2013.
[6]李志華.中山市勞教管理學(xué)校的數(shù)字圖書(shū)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2012.
[7]徐寧.圖書(shū)館數(shù)字化資源管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2011.
[8]化明艷.高校數(shù)字圖書(shū)館信息服務(wù)能力評(píng)價(jià)模型研究[D].南京農(nóng)業(yè)大學(xué),2010.
(編校:周雪芹)endprint