楊澤昊,閆 宇,戰(zhàn)國(guó)棟
(大連民族大學(xué) a.計(jì)算機(jī)科學(xué)與工程學(xué)院;b.設(shè)計(jì)學(xué)院;c.大連市漢字計(jì)算機(jī)字庫(kù)設(shè)計(jì)技術(shù)創(chuàng)新中心,遼寧 大連116605)
水印嵌入到載體圖像后,圖像中的特殊信息以可見(jiàn)的形式顯示出來(lái),即稱(chēng)為可見(jiàn)水印,這主要應(yīng)用于版權(quán)維護(hù)和紀(jì)念留影[1]。 在某些場(chǎng)景下需要逆向恢復(fù)原圖像。
去除水印的前提是鎖定文本水印區(qū)域,文本作為語(yǔ)言的物理化身,是保存和交流信息的基本工具之一。傳統(tǒng)上,文本識(shí)別一直專(zhuān)注于文檔圖像,其中OCR技術(shù)非常適合數(shù)字化平面紙質(zhì)文檔。當(dāng)應(yīng)用于自然場(chǎng)景圖像時(shí),這些OCR技術(shù)效果會(huì)變差,甚至失敗,因?yàn)樗鼈儽徽{(diào)整為黑白色差、基于行的打印文檔環(huán)境。自然場(chǎng)景圖像中出現(xiàn)的文本在外觀和布局上變化很大,從大量字體與樣式中提取,受到不同光照、遮擋、方向、噪聲的影響。此外,背景對(duì)象的存在會(huì)導(dǎo)致虛假誤報(bào)檢測(cè),這使得自然圖像文本定位更具有挑戰(zhàn)性。
去除水印算法的相關(guān)研究中。Lin等[2]提出一種子采樣技術(shù)自適應(yīng)去除水印,維持圖像質(zhì)量。Zhang等[3]提出了一種加密圖像的可逆方案,此方案利用逐位異或運(yùn)算對(duì)原始圖像加密,并修改了對(duì)應(yīng)二進(jìn)制標(biāo)志的部分嵌入可見(jiàn)水印。Weng等[4]提出一種基于動(dòng)態(tài)圖像同時(shí)保持上下文聯(lián)系的水印方案,隱藏信息不同位置提取方法和恢復(fù)方式各不相同。Chen等[5]提出差分?jǐn)U展的可逆宿主圖像的水印方案。利用深度學(xué)習(xí)去除水印的方法主要利用信號(hào)重建去除水印圖像。Lehtinen等[6]提出一種無(wú)需損壞統(tǒng)計(jì)似然模型或圖像先驗(yàn)的模型,該模型從訓(xùn)練數(shù)據(jù)間接學(xué)習(xí)的方案。深度學(xué)習(xí)運(yùn)算周期長(zhǎng),需要大量標(biāo)注性數(shù)據(jù)集。
本文提出一種端到端的混雜文本型自然圖像可見(jiàn)水印去除方法,該方法依靠文字區(qū)域檢測(cè)結(jié)合色差值,鎖定水印確切位置,再利用快速推進(jìn)算法消除水印,達(dá)到在多樣本條件下的精細(xì)化去除。
本次數(shù)據(jù)集主要采自中國(guó)少數(shù)民族藝術(shù)平臺(tái)的文物圖像,共有22 379張圖像,劃分為17類(lèi),特征歸屬于自然圖像。它們不僅具備自然圖像背景復(fù)雜,顏色與布局差異大的特點(diǎn),還集中體現(xiàn)了水印文字與內(nèi)容文字混雜的特殊問(wèn)題。此類(lèi)圖文混雜的自然圖像,無(wú)論是傳統(tǒng)方法還是新興的深度學(xué)習(xí)方法,都很難有效處理非水印文字區(qū)域內(nèi)容,容易造成誤刪,去水印錯(cuò)誤示例如圖1。
a)水印圖像 b)錯(cuò)誤去除圖1 去水印錯(cuò)誤示例
為解決上述問(wèn)題,本文提出一種端到端的可見(jiàn)水印去除方法,過(guò)程如圖2。
Step 1:通過(guò)文字區(qū)域檢測(cè)內(nèi)容結(jié)合色差值定位水印區(qū)域;
Step 2:融合快速修補(bǔ)算法去除可見(jiàn)水??;
Step 3:輸出去除水印圖像。
圖2 去水印流程
尋找水印位置的工作可以視作文字區(qū)域定位,作為數(shù)據(jù)的藝術(shù)圖像多數(shù)是畫(huà)作或文物圖像,不僅水印文字是明顯的文本區(qū)域內(nèi)容,字畫(huà)書(shū)法、雕刻印章、文物刻字等同樣會(huì)作為干擾內(nèi)容。
本文融合基于RPM(region proposal mechani-sm)的文字區(qū)域檢測(cè)內(nèi)容[7]。利用首部分的region proposal,首先保證較高準(zhǔn)確度,盡量把所有可能的文字區(qū)域檢測(cè)出來(lái),然后經(jīng)過(guò)一個(gè)filtering階段,提升文字檢測(cè)的精度。
此步驟為泛化的文本區(qū)域檢測(cè),如果圖像只存在水印文字,則可以很好地定位文本區(qū)域。但由于部分藝術(shù)圖像存在文物文字及相關(guān)的圖形印章,如圖3a。文本區(qū)域定位掩圖a的目標(biāo)塊會(huì)出現(xiàn)錯(cuò)判現(xiàn)象,將其認(rèn)定為水印類(lèi)文本,從而導(dǎo)致刪除原有圖畫(huà)真跡,變?yōu)闆](méi)有文字的文物畫(huà)作。這明顯不是我們想要的去除效果,需要繼續(xù)處理掩圖數(shù)據(jù),讓掩圖只保留水印文字。
為進(jìn)一步鎖定水印區(qū)域范圍,我們根據(jù)可見(jiàn)水印的顏色特征進(jìn)行二值化處理,將RGB(120,120,120)至RGB(160,160,160)以外的顏色變成0,生成掩圖3b。最后將3a圖像的目標(biāo)區(qū)域與b圖像的白色區(qū)域進(jìn)行融合,形成掩碼圖像3c。
圖3 掩圖水印區(qū)域定位
根據(jù)本次數(shù)據(jù)集水印特征,去除水印算法需要提供大約為90×38像素寬高的文字掩碼塊。在區(qū)域位置進(jìn)行范圍限制,最終得到希望的文字掩碼圖像,利用此掩碼圖像可以準(zhǔn)確地定位水印文字,避免破壞自然圖像中的文本信息。
在獲得掩圖后,即可利用掩圖來(lái)去除水印內(nèi)容。關(guān)于去除水印的具體方法,本文融合了基于快速推進(jìn)法的圖像修復(fù)技術(shù)[8]。其主要考慮圖像中要修復(fù)的區(qū)域,算法從該區(qū)域的邊界開(kāi)始,然后進(jìn)入?yún)^(qū)域內(nèi),逐漸填充邊界中的所有內(nèi)容。它需要在鄰近像素周?chē)囊粋€(gè)小鄰域進(jìn)行修復(fù)。該像素由鄰近所有已知像素的歸一化加權(quán)和代替。
因此,選擇權(quán)重是一個(gè)重要的因素,對(duì)于靠近該點(diǎn)的像素,靠近邊界的法線(xiàn)和位于邊界輪廓上的像素,給予更多的權(quán)重,遠(yuǎn)離此點(diǎn)的則給予更小權(quán)重。一旦像素被修復(fù),它將使用快速行進(jìn)方法移動(dòng)到下一個(gè)最近的像素。算法確保那些靠近已知像素的糟糕部分首先被修復(fù),這就像一個(gè)輪替式啟發(fā)器,直到區(qū)域修復(fù)完成。
根據(jù)水印位置定位結(jié)果,獲取掩圖圖像如圖4b。將掩圖與原圖進(jìn)行融合,利用圖像修復(fù)技術(shù),進(jìn)行水印去除。其結(jié)果完美的保留了文物圖像原有的印章刻字,并且對(duì)水印文字進(jìn)行模糊化處理,周邊像素色彩幾乎沒(méi)有改變。
圖4 水印去除效果
由于水印區(qū)域在右下角,且文物圖像的背景顏色具有一致性,在模糊化進(jìn)程中不會(huì)有多余的色塊冗雜,修復(fù)區(qū)域能夠很好的與原背景色融合,看不出修改后的痕跡。在修補(bǔ)方面,快速推進(jìn)法的圖像修復(fù)技術(shù)可以很好的補(bǔ)充缺失,對(duì)邊界線(xiàn)上的像素填補(bǔ)給予更多權(quán)重,能夠?qū)⑺∥淖值臍埩艉圹E覆蓋,修復(fù)效果良好,且不會(huì)對(duì)圖像本身文字內(nèi)容錯(cuò)誤刪除。
本文采用的數(shù)據(jù)為藝術(shù)文物圖像,屬于混雜文本型自然圖像的典型,且樣本數(shù)量巨大。本文方法主要考慮解決去除水印的重復(fù)性工作,并處理水印文字區(qū)域精確定位問(wèn)題,消除水印后的圖像分類(lèi)導(dǎo)入至中國(guó)少數(shù)民族藝術(shù)平臺(tái)。
目前去除水印的算法有多種多樣,但效果最好的主要是Noise2Noise[6],利用深度學(xué)習(xí)來(lái)構(gòu)建網(wǎng)絡(luò)模型,本質(zhì)上還是去噪應(yīng)用,對(duì)于混雜文本型自然圖像,文字識(shí)別效果不佳,且容易將文物原刻字磨損去除。另外,深度學(xué)習(xí)的網(wǎng)絡(luò)模型側(cè)重于深度和寬度來(lái)加強(qiáng)網(wǎng)絡(luò),需要計(jì)算的樣本內(nèi)容極大,在缺乏大量標(biāo)注好的樣本時(shí),效果很不理想。對(duì)于文物圖像來(lái)說(shuō),幾乎沒(méi)有合適的數(shù)據(jù)集供網(wǎng)絡(luò)學(xué)習(xí),去除大量畫(huà)作水印成本太高。若單純使用RPM文本區(qū)域檢測(cè)并消除水印,可以有較好地去除效果,色塊融合也較為理想,但文字內(nèi)容處理方面不佳,容易將畫(huà)作原刻字消除,造成圖像信息丟失。特別是對(duì)于文物圖像,其最高優(yōu)先級(jí)應(yīng)該是保留原畫(huà)作的真實(shí)內(nèi)容。
從定性角度分析,選取各類(lèi)文物圖像對(duì)比去除水印效果如圖5。利用深度學(xué)習(xí)算法Noise2Noise[6]進(jìn)行水印去除,在100次標(biāo)準(zhǔn)化迭代后,仍有較明顯痕跡;單純使用RPM文本區(qū)域檢測(cè)并消除水印,雖然能夠很好的定位文本內(nèi)容,但會(huì)把不屬于水印的文本內(nèi)容消除;本文的端到端水印去除算法,可以針對(duì)文物文字復(fù)雜背景情況,得到較好效果。
a)Noise2Noise算法 b)RPM算法 c)本文算法 圖5 算法水印去除效果對(duì)比
本文主要對(duì)混雜文本型自然圖像進(jìn)行可見(jiàn)水印去除研究,實(shí)現(xiàn)對(duì)中國(guó)少數(shù)民族藝術(shù)平臺(tái)兩萬(wàn)余張文物圖像進(jìn)行去水印操作,從而擴(kuò)展到更具有普遍性的自然圖像。
首先,融合基于RPM的文字區(qū)域檢測(cè)內(nèi)容并進(jìn)行色差區(qū)域定位,確定水印文本掩圖,利用掩碼圖像配合基于快速推進(jìn)法的圖像修復(fù)算法進(jìn)行水印去除,形成一套端到端的可見(jiàn)水印去除流程。結(jié)果分析表明本文的方法具有極高穩(wěn)定性,準(zhǔn)確鎖定水印區(qū)域并進(jìn)行去除,避免誤刪自然圖像所包含的文本內(nèi)容,節(jié)省人工成本,有較好的應(yīng)用價(jià)值,提高了去除水印的效率。
最后,利用去除水印較好的結(jié)果圖,與原圖進(jìn)行一對(duì)一匹配,可以制作用于深度學(xué)習(xí)網(wǎng)絡(luò)使用的數(shù)據(jù)集,能夠?yàn)榛祀s文本型自然圖像的水印去除增添一份新的學(xué)習(xí)數(shù)據(jù)。雖然本文方法對(duì)于各位置水印可以很好識(shí)別,但也有部分不足之處。因?yàn)槔妙伾卣鬟M(jìn)行二值化處理,當(dāng)水印文本與周邊底色高度相似,則無(wú)法進(jìn)行高效區(qū)分,會(huì)產(chǎn)生模糊效應(yīng),減弱水印去除的效果。
大連民族大學(xué)學(xué)報(bào)2023年1期