魏晗 郭志剛 唐永旺
摘 要:數字圖像處理課程是一門綜合性課程,培養(yǎng)學生在掌握數字圖像處理典型算法的基礎上具備一定的編程實踐能力。為此,本研究設計了一個需要靈活運用圖像增強去噪等預處理、圖像特征提取、圖像分割和識別等理論知識的綜合性實驗——新聞視頻中文字區(qū)域的提取。學生自主設計算法、編程實現(xiàn)并完成實驗報告。該實驗能夠激發(fā)學生的學習熱情,培養(yǎng)學生的創(chuàng)新能力,提高學生分析問題和解決問題的能力。
關鍵詞:數字圖像處理;綜合性實驗;視頻文字分割
數字圖像處理是現(xiàn)代信息處理技術的重要研究領域,其應用已經滲透到軍事、航空航天、工業(yè)、農業(yè)、生物、醫(yī)學、社會安全、生活娛樂等領域。隨著數字圖像處理重要性的提高,國內外許多高校的計算機應用、電子信息工程、遙感、生物醫(yī)學等多個專業(yè)陸續(xù)開設數字圖像處理課程作為專業(yè)基礎課。這是一門涉及多領域的交叉學科,具有很強的理論性和實踐性?;诖耍狙芯吭O計了數字圖像處理綜合性實驗——新聞視頻中文字區(qū)域的提取。該實驗綜合性強,包括了圖像增強去噪等預處理、圖像特征提取、圖像分割和識別等。通過對該實驗的編程實現(xiàn),教師可以加強學生對數字圖像處理原理的理解和掌握,培養(yǎng)學生的綜合實踐能力。
一、數字圖像處理課程綜合性實驗的設計
數字圖像處理課程的一個重要部分就是實驗教學。為了培養(yǎng)學生的綜合實踐能力,筆者設計了新聞視頻中文字區(qū)域的提取這一綜合性實驗,通過開放性的實驗設計,培養(yǎng)學生解決問題的能力和創(chuàng)新思維能力。該內容包括:對圖像進行預處理、進行新聞視頻中文字特征的提取、對新聞視頻中的字幕區(qū)域進行分割、對每個字符進行分割、對分割出來的字符進行識別。
(一)綜合性實驗選題背景的介紹
新聞視頻中的文字能夠提供很好的高層語義信息,有助于提高受眾對視頻內容的整體理解程度。因此,新聞視頻文字的提取和識別成為新聞視頻檢索技術中的重要內容。
新聞視頻文字一般包括兩類:場景文字和疊加文字。場景文字是指在圖像或視頻拍攝過程中原始畫面的一部分,如道路指示牌等;疊加文字是指在圖像或視頻后期制作過程中人工添加的文字,如字幕等。疊加文字主要有四個顯著特點:文字一般位于前景,文字和背景間具有較高的對比度;文字通常按固定的方向排列,一般呈水平排列,字符間距保持不變;文字存在一個最小尺度,一般沒有上限;同一行文字的字體和字號通常保持一致,且具有相同的顏色。正是這些特點的存在使得對疊加文字的提取和識別成為可能。
(二)綜合性實驗選題方法的介紹
在整個視頻文字的提取過程中,主要困難在于特征的提取和選擇,具體表現(xiàn)在以下幾個方面。文字的分辨率較低,一般文字只占畫面中很小的一部分,如在352×480的新聞視頻中,標題條文字的高度一般只有12個像素。文字疊加于背景上,而背景千變萬化,其顏色、紋理都十分豐富,難以描述其與文字的本質區(qū)別。文字的字體、顏色、風格和空間排列等屬性的多樣性變化,使得通用性的模板設計困難。
目前,文字檢測方法主要有三類:基于邊緣的文字檢測方法、基于紋理的文字檢測方法和基于區(qū)域的文字檢測方法。
在設計算法時,可以利用某一種特征,也可以綜合利用某兩種或全部特征來提高文字區(qū)域檢測的準確率。
二、數字圖像處理課程綜合性實驗的實踐
下面從實驗準備、實驗討論、算法實現(xiàn)和實驗總結四個方面來介紹筆者在實驗教學中所進行的探索、嘗試和成果。
(一)實驗準備
在實驗教學開始前,學生已經具備了數字圖像處理的基礎知識,如圖像增強、圖像分割、圖像特征提取、圖像形態(tài)學等,也已經具備簡單的圖像處理和分析能力,能夠對簡單圖像算法進行編碼實現(xiàn)。為進一步提高學生發(fā)現(xiàn)問題、提出問題、分析問題和解決問題的能力,筆者設計了新聞視頻中文字區(qū)域的提取這一綜合性實驗。
(二)實驗討論
教師給出原始圖像(如圖1所示),然后引導學生去思考文字區(qū)域和背景區(qū)域的不同,分組討論視頻文字的特征并引導學生設計盡可能多的算法,進行頭腦風暴,形成思維導圖。教師在課堂討論過程中要鼓勵學生提出不同看法和意見,并對討論中未涉及的知識點進行及時補充。
(三)算法實現(xiàn)
開放性的實驗能夠激發(fā)學生的興趣,因此,學生對該實驗實現(xiàn)的熱情很高。在教師的指導和啟發(fā)下,不同的學生就設計或選取了不同的算法來進行新聞視頻中文字區(qū)域的提取。
吳杰等學生實現(xiàn)了一種基于Sobel算子、最大梯度圖像及投影檢測的文字區(qū)域檢測算法,提出的設計步驟為:(1)取出RGB三個分量,對三個分量分別進行Sobel算子運算,并去除小面積對象;(2)取出最大梯度圖像,即取出經過Sobel算子處理過的RGB三個分量的最大值(如圖2所示);(3)對最大梯度圖像進行水平方差投影(如圖3所示),圖中豎線為自動閾值,設置自動設置閾值(Tv=max(Vv)*0.3+min(Vv)*0.7),從而得到水平方向上的字幕區(qū)域(如圖4所示);(4)對圖4得到的圖像區(qū)域進行垂直方差投影(如圖5所示),設置自動設置閾值,從而得到水平方向上的字幕區(qū)域,綜合水平與垂直方差投影得到的區(qū)域即為最終得到的字幕區(qū)域(如圖6所示);(5)對字幕區(qū)域求均值,大于均值置為1,小于均值置為0,可進行字符分割(如圖7所示)。
查雄等學生實現(xiàn)了一種利用邊緣檢測與角點檢測顏色信息綜合處理對新聞視頻中的文字區(qū)域進行提取,提出的設計步驟為:(1)對圖像進行預處理;(2)進行新聞視頻中文字特征的提取;(3)對新聞視頻中的字幕區(qū)域進行分割,提取出字幕區(qū)域后利用Harris角點進行二值化提取。查雄是所有學生中第一個提出嘗試利用角點進行文字的分割的學生。另外,在實驗總結時,教師應引導學生分析:(1)當定位的時候,結合一筆畫和紋理的優(yōu)勢,混合檢測效果是否更好;(2)最后進行形態(tài)學處理,運用“腐蝕膨脹”效果是否更好。
(四)實驗總結
每個學生在實驗中實現(xiàn)了自己的設計算法,并進行總結。實驗完成后,學生普遍反映完成這樣的綜合性實驗收獲很多。豐一偉等學生總結道:很簡單的一個想法,編程實現(xiàn)過程中卻需要考慮很多東西,而且循環(huán)中邏輯性的錯誤更是難以發(fā)現(xiàn),需要設定斷點一步一步地看數據變化來尋找邏輯問題,直到最終的結果呈現(xiàn),該實驗使自己的編程能力有了一個較大的提升,培養(yǎng)了自己的編程思維。
三、結語
數字圖像處理課程是一門實踐性很強的專業(yè)課程,筆者在實驗教學中設計了新聞視頻中文字區(qū)域的提取這樣一個源于實際需求且難易適中的綜合性實驗。該實驗內容包括了圖像處理的大部分理論知識點,如對圖像進行增強去噪等預處理、對圖像進行新聞視頻中文字特征的提取、對圖像中新聞視頻中的字幕區(qū)域進行分割等。在實驗過程中,學生嘗試利用角點、紋理、形態(tài)學、濾波等圖像專業(yè)知識提高文字分割準確度。學生對實驗非常感興趣,做實驗的熱情很高,實驗中遇到問題能夠在教師的引導下自己想辦法解決。該實驗充分發(fā)揮了學生的主觀能動性,激發(fā)了學生的創(chuàng)新能力。實踐表明,綜合性實驗的設計能夠激發(fā)學生的學習興趣,全面提高學生發(fā)現(xiàn)問題、提出問題、分析問題和解決問題的能力。
參考文獻:
[1]朱娟花,吳昂.MATLAB在數字圖像處理課程教學中的應用[J].實驗室科學,2011(1).
[2]滕升華,王芳,趙增順,等.IntelIPP在數字圖像處理綜合實驗中的應用[J].實驗室科學,2016(5).
[3]田破荒,彭天強,李弼程.基于文字穿越線和筆畫連通性的視頻文字提取方法[J].電子學報,2009(1).
[4]陳剛,郭志剛,魏晗.公開源情報分析中的案例式教學方法設計[J].教育教學論壇,2018(34).
責編:初 心