亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        通過圖像識(shí)別技術(shù)提取視頻中的字幕信息

        2012-09-23 13:17:56文丨顏
        中國(guó)傳媒科技 2012年4期
        關(guān)鍵詞:字幕算子灰度

        文丨顏 開

        (湖南株洲市廣播電視臺(tái),湖南株洲 412000)

        1 引言

        電視節(jié)目是人們獲取信息的重要途徑之一,而視頻中的標(biāo)題字幕往往囊括了該視頻的主要內(nèi)容。如果能把字幕提取出來,那么對(duì)于將視頻分類整理、快速搜索,都有很大的好處。國(guó)內(nèi)外有大量這方面的研究論文,很多學(xué)者都已經(jīng)搭建了視頻文字處理系統(tǒng),雖然處理方法上有所不同,但基本都分為視頻片段切割成幀、文字區(qū)域檢測(cè)、文字跟蹤和增強(qiáng)、文字區(qū)域的灰度化和二值化、文字識(shí)別五個(gè)部分。其中最重要的部分是文字區(qū)域檢測(cè)。當(dāng)前字幕檢測(cè)方法大致有連通區(qū)域分析法、紋理分析法、邊緣檢測(cè)法、時(shí)空分布特征分析法等等。而當(dāng)前存在的問題就是如何提高提取出的字幕信息的準(zhǔn)確率。

        筆者所要研究的內(nèi)容,首先是利用軟件將模擬信號(hào)視頻用幀內(nèi)壓縮編碼的方式轉(zhuǎn)換為數(shù)字視頻,然后再利用上述原理,編程將視頻中的標(biāo)注字幕提取出來保存為圖像文件。最后利用已經(jīng)成熟的OCR圖像轉(zhuǎn)文字技術(shù)將其轉(zhuǎn)化為.txt文本文件并同原視頻關(guān)聯(lián)。

        2 數(shù)字視頻轉(zhuǎn)換

        采用視頻采集卡和視頻采集軟件,把模擬視頻轉(zhuǎn)換為數(shù)字視頻。接著采用了Easy Realmedia Producer V1.94進(jìn)行幀內(nèi)壓縮編碼。最后通過Adobe Premiere Pro 2.0軟件提取出視頻中的幀。

        3 字幕圖像提取

        3.1 文字區(qū)域檢測(cè)及分割

        圖3.1 原始圖像

        筆者實(shí)現(xiàn)文字區(qū)域檢測(cè)的方法較為簡(jiǎn)易。

        首先,對(duì)圖像采用高斯濾波。圖像濾波的作用,是在盡量保留圖像細(xì)節(jié)特征的條件下對(duì)目標(biāo)像的噪聲進(jìn)行抑制,是圖像預(yù)處理中不可缺少的操作,其處理效果的好壞將直接響到后續(xù)圖像處理和分析的有效性和可靠性。濾波后的圖像如圖3.2:

        圖3.2 通過高斯濾波器后的圖像

        接下來,應(yīng)用Sobel算子對(duì)圖像進(jìn)行邊緣檢測(cè)。

        Sobel算子是一離散性差分算子,用來運(yùn)算圖像亮度函數(shù)的梯度之近似值。在圖像的任何一點(diǎn)使用此算子,將會(huì)產(chǎn)生對(duì)應(yīng)的梯度矢量或是其法矢量。該算子包含兩組3*3的矩陣,分別為橫向及縱向,將之與圖像作平面卷積,即可分別得出橫向及縱向的亮度差分近似值。如果以A代表原始圖像,Gx及Gy分別代表經(jīng)橫向及縱向邊緣檢測(cè)的圖像,其公式如下:

        圖像的每一個(gè)像素的橫向及縱向梯度近似值可用以下的公式結(jié)合,來計(jì)算梯度的大小。

        用下面的公式3.4來計(jì)算梯度的方向。

        上式中,角度θ等于0,代表圖像在該處擁有縱向邊緣,左方較右方暗。

        經(jīng)過邊緣檢測(cè),得到的圖像如圖3.3:

        圖3.3 邊緣檢測(cè)圖像

        字幕文字通常出現(xiàn)在視頻圖像的下部1/4處,為簡(jiǎn)化運(yùn)算,筆者在程序中只對(duì)圖片的下部約100像素高度的部分進(jìn)行檢測(cè)(RMVB格式的片源多數(shù)均在這個(gè)范圍左右),這樣避免了對(duì)全圖進(jìn)行檢測(cè),既提高了運(yùn)算速度,又避免了圖像上部有同樣顏色的區(qū)塊對(duì)檢測(cè)結(jié)果產(chǎn)生干擾。

        為了能較快地檢測(cè)出字幕,筆者檢測(cè)所有的白色像素點(diǎn),保留最左端白色像素點(diǎn)的橫坐標(biāo),此橫坐標(biāo)即為分割矩形框的左邊框,同理得到右邊框的橫坐標(biāo)以及上下邊框的縱坐標(biāo)。設(shè)定好邊框之后,用此窗口去截原本的灰度圖像,即得到下面的圖像3.4:

        圖3.4 提取出的文本框

        至此,字幕區(qū)域就從圖像中分割了出來。

        3.2 文字圖像灰度化、二值化

        在MATLAB中,利用語句rgb2gray可將文字圖像灰度化,本文中經(jīng)過高斯濾波器后已加入了生成灰度圖像的命令,如下圖3.5:

        圖3.5 灰度圖像

        利用im2bw語句可將圖像進(jìn)行二值化處理。如下面的圖像3.6:

        圖3.6 文本框二值化

        保存圖像為“.jpg”圖像格式。為便于識(shí)別,若原始圖像不是該格式文件,與原始圖像同名即可。若原始圖像也是該圖像格式文件,則在原始文件名后加入“sub”以區(qū)分。

        3.3 文字識(shí)別

        筆者采用漢王OCR 6.0軟件,導(dǎo)入圖像后其自動(dòng)識(shí)別出文字。如下面的圖像3.7:

        保存為文本文件時(shí)使用原始文件名,同原視頻保存在同一路徑。

        4 實(shí)驗(yàn)結(jié)果

        為了檢測(cè)設(shè)計(jì)出的系統(tǒng)性能,筆者采用了一些素材進(jìn)行檢測(cè)(前兩種素材為RMVB格式。高清的影片往往外掛字幕,在截取幀的時(shí)候并不會(huì)同時(shí)將字幕截出,故不予采用。第三種素材屬于內(nèi)嵌字幕的高清影片,可以采用)。表4.1為實(shí)驗(yàn)數(shù)據(jù)和結(jié)果。

        圖3.7 圖片識(shí)別結(jié)果

        表4.1 實(shí)驗(yàn)數(shù)據(jù)及結(jié)果

        5 總結(jié)

        由于視頻中的文字往往分辨率較低,而且經(jīng)常嵌在復(fù)雜背景中,因而無法直接使用OCR軟件進(jìn)行識(shí)別。如何對(duì)圖像進(jìn)行處理,使文字便于識(shí)別,是視頻文字提取系統(tǒng)中最重要的工作。筆者在參閱了大量文獻(xiàn)之后,提出了一種較為簡(jiǎn)易的方法,實(shí)現(xiàn)了視頻字幕文字的提取。利用Adobe Premiere Pro 2.0、Easy Realmedia Producer V1.94等軟件進(jìn)行前期的視頻轉(zhuǎn)換,提取視頻圖像幀,采用邊緣檢測(cè)的方法對(duì)圖像進(jìn)行處理,便于提取文字所在區(qū)域。利用MATLAB軟件實(shí)現(xiàn)了圖像濾波,邊緣檢測(cè),圖像分割,圖像灰度化及二值化等步驟。最后使用漢王OCR 6.0軟件識(shí)別出圖像中的字幕文字。

        [1]基于紋理的視頻鏡頭邊界檢測(cè)系統(tǒng)研究. 北京郵電大學(xué),2010(3).

        [2]張洋. 電視視頻字幕文字的提取方法研究.中國(guó)科技大學(xué),2009(7).

        [3]劉元春,凌堅(jiān),練益群. 電視新聞節(jié)目中標(biāo)題字幕的提取技術(shù)探索. 廣播與電視技術(shù),2008,35(11):91-94.

        [4]張首君,陳銀杰,安孝寬,張精通,張遠(yuǎn). 數(shù)字視頻信號(hào)的壓縮編碼原理.西北大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,37(3):379-383.

        猜你喜歡
        字幕算子灰度
        采用改進(jìn)導(dǎo)重法的拓?fù)浣Y(jié)構(gòu)灰度單元過濾技術(shù)
        Word和Excel聯(lián)手字幕添加更高效
        擬微分算子在Hp(ω)上的有界性
        基于灰度拉伸的圖像水位識(shí)別方法研究
        各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應(yīng)用
        一類Markov模算子半群與相應(yīng)的算子值Dirichlet型刻畫
        基于最大加權(quán)投影求解的彩色圖像灰度化對(duì)比度保留算法
        Roper-Suffridge延拓算子與Loewner鏈
        基于灰度線性建模的亞像素圖像抖動(dòng)量計(jì)算
        整合適應(yīng)選擇度下的動(dòng)畫電影字幕翻譯——以《冰河世紀(jì)》的字幕漢譯為例
        最新亚洲无码网站| 国产丝袜美女| 成年女人黄小视频| 国产又滑又嫩又白| 中国精品视频一区二区三区| 精品少妇人妻久久免费| 成年人视频在线观看麻豆| 麻豆精品国产专区在线观看| 色欲aⅴ亚洲情无码av| 亚洲av无码1区2区久久| 久久精品熟女不卡av高清| 91麻豆精品一区二区三区| 亚洲激情综合中文字幕| 亚洲国产美女精品久久久久∴| 搡老熟女中国老太| 老熟妇Av| 亚洲色图第一页在线观看视频| 久久精品中文字幕有码| 亚洲成人av在线播放不卡| 国产在线一区二区三区四区| 国产成人精品a视频| 亚洲精品无码久久久久sm| 国产又爽又黄又不遮挡视频| 亚洲国产精品成人一区二区在线| 巨爆中文字幕巨爆区爆乳| 少妇夜夜春夜夜爽试看视频| 国产97色在线 | 日韩| 国产免费久久精品99re丫y| 日本在线播放不卡免费一区二区| 青青草视频在线观看网| 国产美女做爰免费视频| 久久久久麻豆v国产精华液好用吗| 国产欧美日本亚洲精品一5区| 午夜影院免费观看小视频| 国产色视频一区二区三区qq号| 免费人成在线观看视频播放| 国产精品久久久久影视不卡| 在线亚洲精品一区二区三区| 中文字幕亚洲精品一区二区三区| 痉挛高潮喷水av无码免费| 成人不卡国产福利电影在线看|