董劍龍,王浩全
(1.太原工業(yè)學院 教務處,山西太原 030008;2.中北大學儀器科學與動態(tài)測試教育部重點實驗室&電子測試技術重點實驗室,山西太原030051)
如何有效消除影視劇制作過程中復雜圖片內的字幕,提高視頻影像的視覺效果是影視傳播領域關注的話題之一.基于TV模型[1,2]或與其他算法結合[3,4]使用能有效消除非紋理圖片中的文字.采用Criminisi算法[5]消除復雜圖片中的文字會呈現結構斷裂現象.而改進的Criminisi算法[6,7]主要是針對紋理圖片中塊狀目標的干擾消除.本文通過圖像分解將復雜圖片中的結構圖片與紋理圖片分離,結合TV模型和Criminisi算法的優(yōu)勢,快速有效地消除復雜圖片中的文字干擾.
圖1為Criminisi算法用于消除紋理圖片中文字干擾的示意圖.圖中I表示受文字干擾的圖片,φ表示未受文字干擾區(qū)域,?表示含有待消文字的區(qū)域,??表示φ與?的邊界,p為相對優(yōu)先權最高的像素,Ψp為以像素p為中心的矩形區(qū)域,?為p點等照度線,其大小與該點的梯度相等,方向與之垂直,np為與邊界正交的單位向量.具體實現過程如下.
圖1 Criminisi算法用于消除紋理圖片中文字干擾的示意圖Fig 1 Schematic diagram of Criminisi algorithm for eliminating text interference in texture images
在VC++環(huán)境中利用FillRegion變量對待處理區(qū)域進行標記,將受文字干擾的像素點 fillRegion置1,其他像素點置0,獲得標記矩陣,如圖2(a)所示.利用Laplacian算子(見圖2(b))找出受文字干擾區(qū)域的邊界(見圖2(c)).邊界位置確定后,掃描受文字干擾區(qū)域邊界上所有像素點,以邊界像素點為中心取9×9大小的像素區(qū)域作為待處理塊.
圖2 受干擾文字區(qū)域的邊界檢測示意圖Fig 2 Schematic diagram of boundary detection of interference text regions
圖片文字消除過程中為保證干擾文字消除后盡可能接近圖片原始狀態(tài),一般會考慮優(yōu)先消除具有較多已知信息和較強結構的目標塊.為此,引入置信度C(p):
其中,C(p)為衡量待處理塊中包含的已知信息,|Ψp|表示矩形區(qū)域Ψp的面積,即待處理像素塊中所包含像素的個數.
此外,引入數據項D(p)來描述待處理區(qū)域的結構信息[8]:
式中,Ix和Iy分別為待處理區(qū)域中像素點p在x和y方向上的偏導數.
為保證優(yōu)先消除包含較多已知信息且結構更強的待處理塊,引入優(yōu)先權:
通過式(4)計算邊界上所有待處理像素塊的優(yōu)先權,從中選出優(yōu)先權最高的像素塊作為目標塊Ψ先對其進行處理,然后在待處理圖片的樣本塊Ψq中尋找目標塊的最佳匹配塊Ψ,匹配準則:
即待處理圖片中完好區(qū)域與目標塊已知像素灰度差平方最小.
式中,I(p)為目標塊內的像素值,Iq(p)為樣本塊中的像素值.
由式(5)和式(6)找出最佳匹配塊后,對目標塊中對應的含干擾文字像素進行填充消除,這樣塊中像素點的歸屬發(fā)生變動,便需要對這些像素點的置信度進行如下更新:
重復1.1~1.4四個步驟直到待處理區(qū)域的干擾文字全部消除.
采用TV模型對非紋理圖片中文字的消除有較好效果[1?4],而利用Criminisi紋理合成算法更適用于處理紋理圖像中的干擾文字[5?7].這樣針對一幅既包含結構成分又包含紋理成分的圖片,可將這兩種成分分離,分別做相應處理后再合成即可.
改變TV模型的作用范圍,將其作用于整幅待處理圖片,并控制迭代次數在5~10次,即可提取待處理圖片中的結構成分.
將待處理圖片與所提取的結構成分相減,即可提取待處理圖片中的紋理成分.
根據以上理論,仿真結果如下.圖3(a)為256×256的lena原始圖片,圖3(b)為添加有多而小的干擾文字圖片.圖4是采用文獻[1]中的TV模型對圖3(b)進行干擾文字消除的結果.圖5是利用本文中Criminisi算法對圖3(b)中干擾文字消除的結果.由圖4和圖5可看出,采用Criminisi算法對文字的干擾消除留有殘余(見紅色圈內),效果不如使用TV模型好.
圖3 lena圖像及添加干擾文字后圖像Fig 3 Lena image before and after adding interference text
圖4 采用TV模型處理結果Fig 4 Results using the TV model
圖5 本文算法處理結果Fig 5 Results using by the algorithm presented in this paper
此外,我們對受相同文字干擾的紋理圖片采用TV模型和本文算法分別進行了處理,結果如圖6所示.從圖6(b)中可觀察到干擾文字的痕跡,圖6(c)中文字干擾幾乎不可見.可見,本文中Criminisi算法更善于處理紋理圖片中的文字干擾.
圖6 對紋理圖片中的干擾文字消除結果Fig 6 Results of interference text elimination in texture images
針對TV模型與Criminisi算法的優(yōu)勢,對復雜圖片(見圖7(a))進行圖像分解來改善效果.本文采用TV模型迭代8次獲得圖7(a)的結構成分,如圖7(b)所示,再用原圖減去結構成分,得到圖7(a)的紋理成分,如圖7(c)所示.對圖7(b)和圖7(c)分別采用TV模型和本文中Criminisi算法消除干擾文字后結果如圖8(a)和8(b)所示.從圖8(a)和8(b)可以觀察到文字干擾消除效果顯著,但圖8(a)中紋理部分有明顯受損痕跡,圖8(b)中結構部分具有明顯受損痕跡.可見,單獨使用一種算法對既包含豐富紋理信息,又包含豐富結構信息的文字干擾圖片進行消除并不能夠得到理想結果,但兩種方法結合使用,效果顯著,如圖8(c)所示.
圖7 復雜圖片中結構成分和紋理成分的提取Fig 7 Extraction of structural components and texture components in complex images
圖8 復雜圖片中的干擾文字消除結果Fig 8 Results of interference text elimination in complex images
Criminisi算法依據特定匹配原則在全局范圍內尋找最佳匹配塊對目標區(qū)域進行復制填充消除干擾文字,有效地解決了基于TV模型算法不適用于紋理圖片這一缺點,而TV模型算法對于非紋理圖片中文字干擾的消除效果相比Criminisi算法卻能達到效果更佳.文中對復雜圖片進行分解后充分利用基于TV模型算法和Criminisi紋理合成算法各自的優(yōu)點,對復雜圖片中的結構分量和紋理分量進行分別處理,結果表明相較于單一算法而言,本文中提出的算法具有更強的適用性,這也為今后的研究工作提供了新思路.