劉 纓,尹 珩戴文娟
(1.北京市網(wǎng)信辦,北京 100062;2.北京理工大學(xué) 管理與經(jīng)濟(jì)學(xué)院,北京 100062;3.訊飛智元信息科技有限公司,安徽 合肥 230088)
基于臺(tái)標(biāo)識(shí)別的網(wǎng)絡(luò)視頻分類系統(tǒng)
劉 纓1,2,尹 珩1,戴文娟3
(1.北京市網(wǎng)信辦,北京 100062;2.北京理工大學(xué) 管理與經(jīng)濟(jì)學(xué)院,北京 100062;3.訊飛智元信息科技有限公司,安徽 合肥 230088)
為了快速準(zhǔn)確地清理互聯(lián)網(wǎng)平臺(tái)上的非法視頻,減少人力物力的投入,在研究非法視頻特征的基礎(chǔ)上,提出一套基于臺(tái)標(biāo)識(shí)別的網(wǎng)絡(luò)視頻分類系統(tǒng)。在分析不同來源非法視頻臺(tái)標(biāo)特性的基礎(chǔ)上,根據(jù)不同來源的非法視頻所攜帶的臺(tái)標(biāo)特性不同,系統(tǒng)采用基于模板匹配和特征識(shí)別相結(jié)合的方法進(jìn)行臺(tái)標(biāo)識(shí)別,以提升識(shí)別的準(zhǔn)確率。同時(shí)采用多種圖像增強(qiáng)技術(shù)降低分辨率、清晰度、背景等不確定因素對(duì)識(shí)別結(jié)果的影響,提升對(duì)非法視頻的召回率以及召回的準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)可通過篩選出確認(rèn)安全視頻和疑似非法視頻來有效減少非法視頻篩選中的人力投入。另外,采用FFMPEG解碼庫解碼視頻抽取關(guān)鍵幀,提高了系統(tǒng)處理效率,平均單個(gè)視頻處理時(shí)間縮短30%。
公共安全;網(wǎng)絡(luò)視頻;臺(tái)標(biāo)識(shí)別;模板匹配;ORB特征識(shí)別
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的視頻通過網(wǎng)絡(luò)傳播,其中充斥著大量危害公共安全的不健康視頻,而在海量的視頻庫中要將這些不安全視頻挑出需要耗費(fèi)大量的人力物力。而臺(tái)標(biāo)作為視頻的一個(gè)重要標(biāo)識(shí),包含了視頻來源、視頻類別和節(jié)目取向等重要信息,近年來臺(tái)標(biāo)識(shí)別在視頻檢索的研究中受到了越來越多的重視[1-5],也提出了一些針對(duì)視頻臺(tái)標(biāo)檢測(cè)的算法。將臺(tái)標(biāo)作為檢索依據(jù),根據(jù)視頻來源可將網(wǎng)絡(luò)視頻分為三類:帶有省市級(jí)衛(wèi)視臺(tái)臺(tái)標(biāo)的絕對(duì)安全的視頻、帶有非法組織電視臺(tái)臺(tái)標(biāo)的危險(xiǎn)視頻,以及不包含前兩種臺(tái)標(biāo)、需要采用其他方法進(jìn)一步判別的視頻。依據(jù)臺(tái)標(biāo)將網(wǎng)絡(luò)視頻分類可以極大減少在網(wǎng)絡(luò)視頻審查中的人力物力,保障互聯(lián)網(wǎng)視頻的健康、安全。
視頻臺(tái)標(biāo)通常由圖像、圖像型字母、字母、漢字組合而成,如圖1所示。就電視臺(tái)標(biāo)而言,很多臺(tái)標(biāo)具有很大的局部相似性,比如CCTV系列的所有臺(tái)標(biāo)、衛(wèi)視臺(tái)與對(duì)應(yīng)的二級(jí)電視臺(tái)臺(tái)標(biāo),而很多非法組織的標(biāo)識(shí)含有復(fù)雜圖像和字母,如圖1(b)。為了分析視頻來源,不僅要分辨出臺(tái)標(biāo)是否是合法的,還要準(zhǔn)確識(shí)別出具體臺(tái)標(biāo)的名稱。
圖1 常見臺(tái)標(biāo)
由于背景的影響,同一段視頻不同幀的清晰度也會(huì)有比較大的差距,如圖1所示。為了應(yīng)對(duì)實(shí)際應(yīng)用中的各種不理想情況,文中在結(jié)合圖像配準(zhǔn)和多種圖像增強(qiáng)方法[6-8](如方差法去背景、區(qū)域擴(kuò)展、多幅圖疊加等)降低背景的影響的基礎(chǔ)上,采用模板匹配和特征點(diǎn)匹配相結(jié)合的方法識(shí)別臺(tái)標(biāo),同時(shí)采用FFMPEG關(guān)鍵幀抽取技術(shù)降低系統(tǒng)的時(shí)間消耗。該系統(tǒng)在保證時(shí)間效率的基礎(chǔ)上可有效分離衛(wèi)視臺(tái)標(biāo)與二級(jí)子臺(tái)的臺(tái)標(biāo)、識(shí)別低分辨率視頻中的非健康臺(tái)標(biāo)。
根據(jù)目前的已有數(shù)據(jù)顯示,中國(guó)大陸電視臺(tái)的臺(tái)標(biāo)均位于屏幕的左上角,部分香港澳門的電視臺(tái)臺(tái)標(biāo)位于屏幕的右上角,而非法組織的標(biāo)志通常分布在視頻的四個(gè)角,根據(jù)已有視頻資源,統(tǒng)計(jì)各非法臺(tái)標(biāo)的分布規(guī)律,從而配置各個(gè)區(qū)域的需要識(shí)別的臺(tái)標(biāo)模板。
2.1 系統(tǒng)結(jié)構(gòu)
系統(tǒng)總體結(jié)構(gòu)如圖2所示。該系統(tǒng)包含模板資源制作、資源加載、臺(tái)標(biāo)識(shí)別與結(jié)果處理等模塊,系統(tǒng)功能除了將網(wǎng)絡(luò)視頻分為三類集合(即正常視頻集合、危險(xiǎn)視頻集合以及需要進(jìn)一步甄別的視頻集合)以外還承擔(dān)收集臺(tái)標(biāo)模板的功能。對(duì)于客戶端不能識(shí)別的臺(tái)標(biāo)將會(huì)上傳至云端,由后臺(tái)工作人員審核處理后,由云端更新資源。對(duì)于系統(tǒng)沒有召回的視頻,將繼續(xù)采用人臉檢索、視頻拷貝等視頻檢索的方法繼續(xù)識(shí)別。
2.2 資源制作
資源模板應(yīng)盡可能應(yīng)對(duì)由于視頻信號(hào)、清晰度、視頻比例等的差異導(dǎo)致的臺(tái)標(biāo)位置、形態(tài)偏差,同時(shí)降低非目標(biāo)臺(tái)標(biāo)帶來的干擾,因此需要收集目標(biāo)臺(tái)標(biāo)的各種版本以及干擾臺(tái)標(biāo)。該系統(tǒng)模板的獲取主要分兩個(gè)途徑:一個(gè)是在前期的臺(tái)標(biāo)模板通過選取清晰穩(wěn)定的視頻,將其縮放至指定尺寸后,截取臺(tái)標(biāo)所在區(qū)域,并將背景替換為純色,以減少背景對(duì)識(shí)別的影響;另一個(gè)是在后期系統(tǒng)上線后會(huì)傳回大量不能識(shí)別的圖片,經(jīng)后臺(tái)工作人員審核后加入到模板庫中。
圖2 系統(tǒng)總體設(shè)計(jì)圖
根據(jù)先驗(yàn)知識(shí),大陸地區(qū)省市級(jí)電視臺(tái)的臺(tái)標(biāo)均位于視頻的左上角,對(duì)樣本庫中的4 000余條非法視頻危險(xiǎn)臺(tái)標(biāo)進(jìn)行統(tǒng)計(jì),包含250余種非法臺(tái)標(biāo),視頻中非法臺(tái)標(biāo)的分布規(guī)律統(tǒng)計(jì)結(jié)果顯示,約60%的非法視頻臺(tái)標(biāo)位于右下角,29%的非法視頻臺(tái)標(biāo)位于右上角,另外分別有9%位于左上角和2%位于左下角。
統(tǒng)計(jì)電視臺(tái)標(biāo)和非法臺(tái)標(biāo)的分布規(guī)律,根據(jù)分布規(guī)律統(tǒng)計(jì)結(jié)果和各臺(tái)標(biāo)本身性質(zhì)配置各監(jiān)測(cè)區(qū)域以及識(shí)別算法對(duì)應(yīng)的模板特征。
根據(jù)模板特性制作臺(tái)標(biāo)的梯度模板、邊緣模板和特征資源庫,采用多種圖像切割算法[9]切割觀測(cè)視頻監(jiān)測(cè)區(qū)域圖像,計(jì)算其梯度模板、邊緣模板和特征點(diǎn)集合,與可信任電視臺(tái)標(biāo)、非法組織的復(fù)雜臺(tái)標(biāo)模板庫分別比對(duì),完成視頻的分類。
3.1 梯度直方圖法
由于臺(tái)標(biāo)背景變化大,通過提取臺(tái)標(biāo)位置的圖像特征時(shí),背景特征摻雜其中,容易造成分類器識(shí)別結(jié)果錯(cuò)誤。
為提高抗背景干擾能力,去除無關(guān)雜點(diǎn)的影響,該系統(tǒng)將傳統(tǒng)的統(tǒng)計(jì)區(qū)域內(nèi)梯度方向直方圖轉(zhuǎn)換為統(tǒng)計(jì)匹配點(diǎn)的梯度方向直方圖,并將傳統(tǒng)模板匹配的0-1匹配轉(zhuǎn)換為梯度方向的0-7匹配。抵抗背景干擾的同時(shí)增強(qiáng)子臺(tái)的可區(qū)分性,圖3為安徽衛(wèi)視及其各子臺(tái)臺(tái)標(biāo)的梯度方向圖。
圖3 臺(tái)標(biāo)梯度方向模板
(1)
圖4 梯度方向劃分
如果觀測(cè)圖與模板圖對(duì)應(yīng)的像素點(diǎn)梯度方向在同一個(gè)方向區(qū)域即標(biāo)注結(jié)果相同,則認(rèn)為該點(diǎn)匹配成功。
統(tǒng)計(jì)區(qū)域內(nèi)梯度方向匹配成功的像素點(diǎn)數(shù)得到匹配直方圖p,與之對(duì)應(yīng)的模板直方圖記為q,兩個(gè)直方圖的Bhattacharyya距離為:
(2)
選取最優(yōu)匹配作為結(jié)果,若識(shí)別得分低于閾值,則上傳視頻臺(tái)標(biāo)至云端,待后臺(tái)人員審核后上傳到待審圖片庫中的新臺(tái)標(biāo),加以標(biāo)注后加入到臺(tái)標(biāo)模板序列中。
3.2 邊緣模板匹配
圖像邊緣是指圖像局部強(qiáng)度變化顯著的部分,是圖像分割和形狀特征等圖像分析的重要基礎(chǔ),常用的檢測(cè)算子有Roberts算子、Sobel算子、Prewitt算子、Log算子等。Canny算子可有效抑制噪聲,采用雙閾值精確確定邊緣的位置,Canny邊緣計(jì)算流程為:
(1)像素點(diǎn)的梯度計(jì)算。
(3)
(2)邊緣點(diǎn)判定。
采用雙閾值,梯度大于高閾值的點(diǎn)確定為邊緣點(diǎn),梯度小于低閾值或者梯度取到極大值的點(diǎn)確定為非極值點(diǎn),介于高低閾值之前的點(diǎn)通過邊緣的連續(xù)性判斷是否是邊緣點(diǎn),得到邊緣二值圖,統(tǒng)計(jì)邊緣點(diǎn)數(shù)N1。
(4)
臺(tái)標(biāo)邊緣模板包含邊緣點(diǎn)個(gè)數(shù)N2,將觀測(cè)圖像的邊緣二值圖與臺(tái)標(biāo)邊緣模板做與運(yùn)算,設(shè)與運(yùn)算后得到邊緣點(diǎn)數(shù)為N。匹配得分為:
Score=0.5*(N/N1+N/N2)
(5)
選得分最高作為結(jié)果,若結(jié)果得分低于閾值,則上傳截圖至云端。
3.3 特征識(shí)別
非法視頻的清晰度、臺(tái)標(biāo)位置、臺(tái)標(biāo)形態(tài)等都非常不穩(wěn)定,部分非法視頻是由手機(jī)錄制后再二次編輯,分辨率很低,采用模板對(duì)臺(tái)標(biāo)位置與比例進(jìn)行暴力匹配非常耗時(shí),且效果也不理想。特征將圖像映射為局部特征向量集,將圖像的匹配轉(zhuǎn)化為特征點(diǎn)間的匹配,可以抵抗平移、縮放和旋轉(zhuǎn),對(duì)光照變化、仿射及投影變換也有一定不變性,而且提取特征點(diǎn)數(shù)量較多,以量取勝,可抵抗一定的背景變化。
常用特征識(shí)別算法包括Sift[10]、Surf[11]、Orb[12]等,其中Orb算法是最具效率的一個(gè),效率比Sift算法高兩個(gè)數(shù)量級(jí)。Orb算法實(shí)際是具有方向性的fast角點(diǎn)檢測(cè)[13]加上可旋轉(zhuǎn)的Brief特征點(diǎn)描述[14]的方法組合,以改進(jìn)Brief不具有旋轉(zhuǎn)不變性和不具有多尺度等特性。
FAST算法檢測(cè)關(guān)鍵點(diǎn),通過對(duì)比像素周圍的N個(gè)點(diǎn)的灰度值,如果有連續(xù)M個(gè)點(diǎn)的灰度值與之不同,則認(rèn)為該點(diǎn)是關(guān)鍵點(diǎn)。在原ORB的方案中是通過矩(moment)來計(jì)算特征點(diǎn)的主方向,而在該系統(tǒng)臺(tái)標(biāo)識(shí)別的應(yīng)用中,由于網(wǎng)絡(luò)視頻常見的變形時(shí)擠壓、拉伸和縮放,并不存在圖像旋轉(zhuǎn),并且在經(jīng)過實(shí)驗(yàn)對(duì)比后確認(rèn)忽略關(guān)鍵點(diǎn)的方向更有利于提高檢測(cè)效果。
在圖像上選擇一個(gè)局部區(qū)域,用p表示,它的大小是S*S像素,在p上面提取Brief特征。通過高斯分布選取點(diǎn)對(duì),并用特征點(diǎn)的主方向校正點(diǎn)對(duì)的坐標(biāo),定義tao測(cè)試:
(6)
得到的二進(jìn)制向量如下:
(7)
由于背景的影響,orb算法會(huì)有一些錯(cuò)配點(diǎn),在特征匹配前通過圖像增強(qiáng)降低背景的干擾至關(guān)重要。
4.1 解碼與抽幀策略
網(wǎng)絡(luò)視頻,特別是非法組織制定的非法視頻都經(jīng)常是在原有視頻的基礎(chǔ)上經(jīng)過多次編輯后的結(jié)果,經(jīng)過刪幀、插幀、轉(zhuǎn)碼等一系列操作之后,臺(tái)標(biāo)變得不穩(wěn)定,比如某些時(shí)間段不含有臺(tái)標(biāo)或者臺(tái)標(biāo)不夠清晰,部分幀背景嘈雜易被誤識(shí)為圖像臺(tái)標(biāo),另外對(duì)于電視視頻來說,不夠清晰的二級(jí)子臺(tái)會(huì)被誤識(shí)為衛(wèi)視臺(tái)召回。如果這種不夠質(zhì)量的幀被抽取作為測(cè)試樣本,會(huì)嚴(yán)重影響識(shí)別結(jié)果。
為了降低抽幀帶來的影響,該系統(tǒng)對(duì)視頻分段做多次識(shí)別,返回統(tǒng)計(jì)結(jié)果,可有效降低虛警發(fā)生的概率,且可以規(guī)避由于臺(tái)標(biāo)不穩(wěn)定而造成的漏警。系統(tǒng)同時(shí)會(huì)緩存多張圖片,多次檢測(cè)勢(shì)必會(huì)造成效率的負(fù)擔(dān),于是采用FFMPEG解碼庫對(duì)視頻解碼并按照設(shè)定的抽幀策略抽取關(guān)鍵幀,可極大提高視頻處理效率。
4.2 圖像增強(qiáng)
為了保證截取的圖像識(shí)別區(qū)域包含整個(gè)臺(tái)標(biāo),因此截取的區(qū)域遠(yuǎn)大于臺(tái)標(biāo)實(shí)際所占的面積,而這也帶來了新的問題:嘈雜的背景對(duì)于臺(tái)標(biāo)識(shí)別產(chǎn)生巨大的影響。為了對(duì)抗視頻背景的影響,系統(tǒng)采用一系列的圖像增強(qiáng)技術(shù),包括多張圖像疊加去背景、方差法去背景和區(qū)域擴(kuò)展等。
去背景的思想是基于同一段視頻中臺(tái)標(biāo)的位置是相對(duì)固定的,而背景是一直在變化這一前提。在視頻中以10 s為間隔抽取三幀圖像,截取臺(tái)標(biāo)區(qū)域位置,分別計(jì)算邊緣二值圖,邊緣圖疊加是多幅邊緣圖按照權(quán)重疊加,疊加過程如圖5所示,經(jīng)過疊加之后背景部分的強(qiáng)度明顯降低。
圖5 多幅圖權(quán)重疊加去背影效果展示
方差法去背景是依據(jù)視頻中臺(tái)標(biāo)具有時(shí)空不變性這一特點(diǎn),截取目標(biāo)區(qū)域,遍歷區(qū)域圖像中的每一個(gè)像素,計(jì)算每個(gè)像素點(diǎn)的方差,判斷當(dāng)前點(diǎn)是否屬于背景點(diǎn),另外在方差法去背景的基礎(chǔ)上進(jìn)一步采用區(qū)域擴(kuò)展等圖像增強(qiáng)方法去除背景的影響。
模板庫說明:模板庫中包含了CCTV1~CCTV15、各省級(jí)衛(wèi)視及二級(jí)子臺(tái)共174個(gè)電視臺(tái)臺(tái)標(biāo),加上232個(gè)非法組織的圖形臺(tái)標(biāo),模板庫中共434個(gè)梯度模板、103個(gè)邊緣模板和1 189個(gè)orb特征模板。
測(cè)試集說明:測(cè)試集合分為三部分,CCTV和省級(jí)電視臺(tái)的視頻、帶有非法臺(tái)標(biāo)的危險(xiǎn)視頻及本次測(cè)試的干擾集,其中負(fù)樣本包含了非省級(jí)電視臺(tái)的視頻、帶有視頻網(wǎng)站logo的視頻、不含有臺(tái)標(biāo)的網(wǎng)絡(luò)視頻共計(jì)16 596個(gè)。
測(cè)試機(jī)器配置CPU:Interl Xeon E5-2620 @2 GHz、64 GB內(nèi)存,采用單線程測(cè)試,16 596條視頻采用OpenCV解碼和FFMPEG解碼的耗時(shí)分別為77 337 s和53 938 s,平均單個(gè)視頻處理時(shí)間由4.66 s縮短至3.25 s,效率優(yōu)化30.26%。對(duì)FFMPEG解碼技術(shù)采用24線程測(cè)試上述集合,共耗時(shí)6 432 s,平均單個(gè)視頻耗時(shí)0.38 s,完全可以達(dá)到項(xiàng)目需求。
由于電視臺(tái)標(biāo)和非法電視臺(tái)臺(tái)標(biāo)所用識(shí)別算法不同,且互為干擾,分別統(tǒng)計(jì)算法優(yōu)化前和算法優(yōu)化后兩類臺(tái)標(biāo)識(shí)別的指標(biāo),如表1和表2所示。
表1 電視臺(tái)標(biāo)測(cè)試結(jié)果
表2 非法臺(tái)標(biāo)測(cè)試結(jié)果
由表1計(jì)算可得,優(yōu)化前召回率和正確率分別為82.15%和96.87%,而優(yōu)化后召回率和正確率分別為95.40%和98.94%;由表2計(jì)算可得,優(yōu)化前召回率和正確率分別為66.87%和94.82%,而優(yōu)化后召回率和正確率分別為86.78%和98.70%。
對(duì)于電視臺(tái)標(biāo),虛警主要來自于衛(wèi)視臺(tái)對(duì)應(yīng)的二級(jí)子臺(tái)的視頻,相似性比較大,導(dǎo)致虛警的產(chǎn)生。為了保證正確率,系統(tǒng)保持了比較高的閾值,代價(jià)是降低了召回率。對(duì)于非法臺(tái)標(biāo)來說,導(dǎo)致召回率不夠理想的原因是視頻樣本本身質(zhì)量和清晰度參差不齊,部分非法視頻的分辨率只有128*88,另外部分非法視頻使得剪切拼接嚴(yán)重,臺(tái)標(biāo)出現(xiàn)的位置以及時(shí)間很不穩(wěn)定,導(dǎo)致去背景的方法失效。
臺(tái)標(biāo)標(biāo)志著視頻的來源和類別屬性,是視頻分類的一個(gè)重要依據(jù),由于網(wǎng)絡(luò)視頻經(jīng)過了多次編輯,造成視頻臺(tái)標(biāo)與臺(tái)標(biāo)模板之間存在較大差異。文中在多種圖像增強(qiáng)技術(shù)去除嘈雜背景影響的基礎(chǔ)上,采用梯度、邊緣模板識(shí)別與特征匹配的方法檢測(cè)不同類別的臺(tái)標(biāo),實(shí)現(xiàn)衛(wèi)視臺(tái)標(biāo)與對(duì)應(yīng)二級(jí)臺(tái)標(biāo)的分離以及低分辨率條件下非法臺(tái)標(biāo)的識(shí)別,達(dá)到可觀的召回率和正確率。采用FFMPEG抽取關(guān)鍵幀縮短了視頻解碼抽幀的時(shí)間,使系統(tǒng)的效率滿足需求。在后續(xù)的工作中為了進(jìn)一步提高系統(tǒng)對(duì)低分辨率視頻、臺(tái)標(biāo)位置偏離及文字型臺(tái)標(biāo)的處理能力,將繼續(xù)擴(kuò)大系統(tǒng)檢測(cè)區(qū)域并降低背景對(duì)識(shí)別結(jié)果的影響。
[1] 包秀國(guó),張冬明,張曦珊,等.基于選擇性Gabor濾波器組的網(wǎng)絡(luò)視頻臺(tái)標(biāo)識(shí)別[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2014,26(2):248-257.
[2] 金 陽,程江華,任 通,等.一種基于二值圖角點(diǎn)匹配的臺(tái)標(biāo)識(shí)別方法[J].電視技術(shù),2012,36(17):15-19.
[3] Wang J Q,Duan L Y,Li Z L,et al.A robust method for TV logo tracking in video streams[C]//Proceedings of IEEE international conference on multimedia and expo.Los Alamitos:IEEE Computer Society Press,2006:1041-1044.
[4] Zhang L,Xia T,Zhang Y,et al.Hollow TV logo detection[C]//Proceedings of the 18th IEEE international conference on image processing.Los Alamitos:IEEE Computer Society Press,2011:3581-3584.
[5] 侯勝偉,滕奇志,高明亮,等.臺(tái)標(biāo)的自動(dòng)檢測(cè)與識(shí)別[J].四川大學(xué)學(xué)報(bào):自然科學(xué)版,2013,50(3):522-528.
[6] 汪文英,張冬明,張勇東,等.利用仿射變換的快速空間關(guān)系驗(yàn)證[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22(4):625-631.
[7] Lettner M,Kleber F,Sablatnig R,et al.Contrast enhancement in multispectral images by emphasizing text regions[C]//Proc of the eighth IAPR workshop on document analysis systems.[s.l.]:[s.n.],2008:225-231.
[8] Gorelick L,Boykov Y,Veksler O,et al.Submodularization for binary pairwise energies[C]//Proc of IEEE conference on computer vision and pattern recognition.[s.l.]:IEEE,2014:1-8.
[9] 張 偉,蔣 宏,任 章.自適應(yīng)多閾值圖像分割算法[J].自動(dòng)化技術(shù)與應(yīng)用,2007,26(8):71-73.
[10] Lowe D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.
[11] Bay H,Tuytelaars T,van Gool L.Surf:speeded up robust features[C]//Proc of European conference on computer vision.[s.l.]:[s.n.],2006.
[12] Rublee E,Rabaud V.ORB:an efficient alternative to SIFT or SURF[C]//Proc of IEEE international conference on computer vision.[s.l.]:IEEE,2011:2564-2571.
[13] Rosten E,Drummond T.Machine learning for high-speed corner detection[C]//Proc of European conference on computer vision.[s.l.]:[s.n.],2006.
[14] Calonder M,Lepetit V,Strecha C,et al.Brief:binary robust independent elementary features[C]//Proc of European conference on computer vision,[s.l.]:[s.n.],2010.
A Classification System for Internet Videos Based on TV Logo Recognition
LIU Ying1,2,YIN Hang1,DAI Wen-juan3
(1.Cyberspace Administration of Beijing,Beijing 100062,China; 2.School of Management and Economics,Beijing Institute of Technology,Beijing 100062,China; 3.Iflytek Intelligent System Co.,Ltd.,Hefei 230088,China)
In order to clean up the illegal videos on the internet rapidly and accurately and reduce the input of manpower and material resources,a video classification system based on TV logo recognition has been proposed.On the basis of analyzing illegal videos TV logo with different producer,the system adopts a method combined pattern matching and feature recognition for TV logo recognition to improve accuracy according to different TV logo feature of illegal video.At the same time,a variety of image enhancement techniques are adopted to decrease the influence of uncertain factors like resolution,definition and background on the identification results,improving the recall rate of illegal video and recall accuracy.Experimental results show that this system could effectively reduce the human input and material resource by screening out the security video and suspected illegal video.In addition,FFMPEG is used to decode and draw key frame,which can improve the efficiency at 30%
public safety;internet videos;TV logo recognition;template matching;ORB
2015-05-29
2015-09-17
時(shí)間:2016-09-18
北京市科委項(xiàng)目(Z141100006014002)
劉 纓(1973-),女,博士,研究方向?yàn)榭茖W(xué)與管理。
http://www.cnki.net/kcms/detail/61.1450.TP.20160918.1707.008.html
TP302
A
1673-629X(2016)10-0087-05
10.3969/j.issn.1673-629X.2016.10.019