摘 要:本文以網(wǎng)球視頻作為研究對象,對其場地幀和非場地幀進(jìn)行分類。首先通過計(jì)算圖像的直方圖提取出每幀圖像的主顏色,其次利用protégé進(jìn)行本體構(gòu)建,最后通過分析并提取主顏色的值用swrl規(guī)則寫出可以對視頻幀序列進(jìn)行場地幀與非場地幀分類的規(guī)則。實(shí)驗(yàn)證明該方法可以取得良好的實(shí)驗(yàn)結(jié)果。
關(guān)鍵詞:網(wǎng)球視頻;Ontology;主顏色
中圖分類號:TP391.41
每一種體育比賽有其特定的場地,場地特征提供了體育視頻類別的重要信息,研究網(wǎng)球視頻過程中發(fā)現(xiàn)網(wǎng)球比賽視頻是比賽幀與非比賽幀穿插播放的,所有的精彩片段都是發(fā)生在比賽鏡頭中,而且一組比賽幀序列總是由發(fā)球事件開始,因此對網(wǎng)球視頻幀進(jìn)行比賽幀與非比賽幀分類對發(fā)球動(dòng)作識別顯得尤為重要。本文中對網(wǎng)球視頻比賽場地幀與非比賽場地幀的分類通過對幀圖像的底層特征提取結(jié)合語義分析進(jìn)行分類。
1 底層特征提取
本文主要提取的底層特征為主顏色。對主顏色的提取首先將對圖像的顏色模型進(jìn)行轉(zhuǎn)換,即從RGB模型轉(zhuǎn)換到HSV模型。之后對HSV模型的三個(gè)分量分別進(jìn)行量化,再把三個(gè)顏色分量合成為一維特征矢量。通過對一維特征矢量統(tǒng)計(jì)計(jì)算出圖像的顏色直方圖,再通過顏色直方圖提取出圖像的主顏色。
1.1 RGB顏色模型轉(zhuǎn)換HSV顏色模型
最常用的顏色空間為RGB[1]顏色空間,大部分的數(shù)字圖像都是采用這種顏色空間表達(dá)的,然而RGB空間并不符合人們對顏色相似性的主觀判斷。在這里,根據(jù)文獻(xiàn)[2]給出的公式把RGB顏色空間轉(zhuǎn)換為HSV[3]顏色空間,它是直方圖最常用的顏色空間。
1.2 HSV顏色模型量化
將H、S、V三個(gè)分量按照人的顏色感知特性進(jìn)行非等間隔的量化。按照視覺分辨能力,把色調(diào)H空間分成16份,飽和度S分成4份,明度值V分成4份;根據(jù)色彩的不同范圍進(jìn)行非等間隔量化,量化后的色調(diào)、飽和度和明度值分別為H、S、V。
通過對H、S、V三個(gè)分量進(jìn)行非等間隔量化后,把三個(gè)顏色分量合成為一維特征矢量,即L=HQsQv+SQv+V。其中,和Qv分Qs別是S和V的量化級數(shù),Qs=4,Qv=4。對色調(diào)H取的權(quán)重為16,對飽和度S取的權(quán)重為4,對亮度V取的權(quán)重為1,這就大大減輕了圖像亮度V對檢索結(jié)果的影響,而且也減少了飽和度S對檢索結(jié)果的影響。同時(shí),根據(jù)式上式可知,L的取值范圍是[0,1,2,……,255],計(jì)算L獲得256柄的一維矢量,即可獲得圖像的顏色直方圖。
1.3 顏色直方圖獲取
直方圖[4]反映了圖像像素亮度在圖像中隨機(jī)分布情況的統(tǒng)計(jì)特性。這種統(tǒng)計(jì)特性可以用P概率分布函數(shù)來刻畫和描述?;叶戎狈綀D是灰度級的函數(shù),灰度直方圖表示數(shù)字圖像中每一灰度級與此灰度級對應(yīng)的圖像中的像素點(diǎn)數(shù)之間的統(tǒng)計(jì)關(guān)系。
計(jì)算顏色直方圖需要將顏色區(qū)間劃分成若干個(gè)小的顏色區(qū)間,每個(gè)區(qū)間成為直方圖的一個(gè)bin。這個(gè)過程稱為直方圖量化。然后,通過計(jì)算顏色落在每個(gè)小區(qū)間內(nèi)的像素?cái)?shù)量可以得到顏色直方圖。選擇合適的顏色小區(qū)間(即直方圖的bin)數(shù)目和顏色量化方法與具體應(yīng)用的性能和效率要求有關(guān)。本文中的bin數(shù)目為256。
1.4 主顏色提取
圖像的色彩極其豐富,但視覺系統(tǒng)能夠忽略次要的細(xì)節(jié),抓住起重要作用的主色。在本文中,主顏色提取描述如下:
(1)對于每幅圖片設(shè)置一個(gè)初值record1,初始化為0;每得到一個(gè)量化值L,通過比較賦值,將最大的量化值L賦值給record1。
(2)為了便于觀察提取結(jié)果,將每幅圖片的record1導(dǎo)回HSV空間,由于場地特征中,顏色特征最為明顯,因此在提取的H、S和V分量中后續(xù)只用到H分量。轉(zhuǎn)化方法如下:
H=record/16取整
(3)對導(dǎo)回的HSV空間再進(jìn)行量化,將H分量分為16個(gè)量化等級。
(4)通過以上步驟得到每幅圖片的主顏色。
2 基于Ontology的語義分析
視頻內(nèi)容分析領(lǐng)域的主要挑戰(zhàn)是如何建立視頻高層語義內(nèi)容和低層時(shí)空特征間的關(guān)聯(lián),即經(jīng)典的語義鴻溝問題。為解決這一問題,有必要應(yīng)用領(lǐng)域知識將視頻高層語義與自動(dòng)分析獲取視頻語義的技術(shù)集成到統(tǒng)一的框架中。恰恰本體[5]是領(lǐng)域知識確定的、形式化的規(guī)范描述,是一種有效的語義建模和知識表示工具。
2.1 本體的建立
本文中利用OWL語言[6]創(chuàng)建本體。OWL語言為描述概念之間的關(guān)系提供了豐富且實(shí)用的建模元素。OWL語言由類(Class)、屬性(Property)和個(gè)體(Individual)三部分組成。其中類是個(gè)抽象的概念,是由一些特征或?qū)傩韵嗨频膫€(gè)體組成的集合。個(gè)體是我們所感興趣的具體某個(gè)事物。屬性是反映個(gè)體之間的二元關(guān)系。
(1)類的建立。本文根據(jù)網(wǎng)球場地幀與非場地幀分類的需要,建立了6個(gè)類:TennisVideo(表示網(wǎng)球比賽視頻場地幀集)、PlayAction(表示網(wǎng)球比賽視頻場地幀集)、Break(表示網(wǎng)球比賽視頻非場地幀集)、RedClayCourt(表示場地幀集中紅土場地幀集)、RedClayCourt(表示場地幀集中紅土場地幀集)、GrassCourt(表示場地幀集中綠茵場地幀集)和HardCourt(表示場地幀集中硬地場地幀集)。在Protégé工具中建立的類,如圖1(a)所示。
(2)屬性的建立。本文定義了2個(gè)數(shù)據(jù)類型屬性,hasDcolor和hasNCourt。根據(jù)上一節(jié)提取出網(wǎng)球視頻幀的主顏色,經(jīng)過大量實(shí)驗(yàn),本文得出紅土場、綠茵場和硬地場的主顏色的經(jīng)驗(yàn)值,如紅土場的主顏色值一般為H=0或H=20;綠茵場的主顏色值一般為H=95或H=125;硬地場的主顏色值一般為H=205或H=235。因此,hasDcolor表示一個(gè)個(gè)體主顏色值;hasNCourt表示一個(gè)個(gè)體不含有場地特征。在Protégé工具中建立的屬性,如圖1(b)所示。
2.2 SWRL規(guī)則的制定
表示當(dāng)一幀圖像的主顏色(hasDColor)的值為0或20時(shí)把該幀歸為PlayAction類中的RedClayCourt子類中,同樣的道理,根據(jù)主顏色(hasDColor)的值把圖像歸類到PlayAction類中的GrassCourt子類和HardCout子類中。若一幅幀圖像其主顏色值并不等于這三種場地類型主顏色值時(shí),把該幀的hasNCourt屬性值設(shè)為1,并歸類到Break類中。Protégé中規(guī)則的建立如圖2所示。
(3)規(guī)則推導(dǎo)及展示。對于制定好的規(guī)則是需要加載到解析器才能推導(dǎo),本文使用的推導(dǎo)工具為Jess(Java Expert Systems Shell)推導(dǎo)引擎[7],是基于Java平臺(tái)上的規(guī)則引擎。
推導(dǎo)結(jié)果是由個(gè)體的移動(dòng)來展示的。例如,如果某幀圖像其主顏色值與紅土場的主顏色屬性值一樣,則把代表該幀的個(gè)體移動(dòng)到PlayAction類的子類RedClayCourt類中,圖3為移動(dòng)后的結(jié)果展示;如果某幀圖像主顏色值與任何一種場地的主顏色屬性值都不一致時(shí),把代表該幀的個(gè)體移動(dòng)到Break類當(dāng)中。
3 實(shí)驗(yàn)結(jié)果分析
由于網(wǎng)球視頻幀中網(wǎng)球場地占主導(dǎo)位置,而且往往出現(xiàn)在幀的中間部分,因此,為了提高算法效率和準(zhǔn)確度,對每幅幀圖像先進(jìn)行預(yù)處理即讀取幀的中間部分。具體做法為:讀一幅幀圖像的像素值時(shí)起始值設(shè)為0.2*寬*高,終值設(shè)為0.8*寬*高。這樣便把一幅幀圖像的上下兩端去掉只保留中間段。
比較常見的評價(jià)算法的方法有兩種:查全率和查準(zhǔn)率,本文使用該兩種方法評價(jià)網(wǎng)球場地幀分類的算法。
本文選取了三場網(wǎng)球比賽視頻(一場紅土場上比賽視頻、一場硬地場上比賽視頻和一場綠茵場上比賽視頻)作為實(shí)驗(yàn)素材進(jìn)行了實(shí)驗(yàn)。結(jié)果如表1所示。
實(shí)驗(yàn)結(jié)果表明本算法較正確的歸類了網(wǎng)球視頻幀場地幀與非場地幀。誤檢是由于比賽過程中球員或裁判員的衣服與場地的主顏色相一致而產(chǎn)生誤檢。漏檢是由于拍攝角度的原因球場并不出現(xiàn)在一幅幀圖像的中間部分而產(chǎn)生漏檢。
4 結(jié)束語
本體學(xué)習(xí)雖然是一個(gè)新興的研究領(lǐng)域,但是它的應(yīng)用前景是不容小覷的,此次應(yīng)用于本實(shí)驗(yàn)中也著實(shí)大材小用了。希望通過這次這個(gè)嘗試為以后的研究積累經(jīng)驗(yàn)。本實(shí)驗(yàn)中由于只利用主顏色這個(gè)特征對場地幀和非場地幀進(jìn)行分類,所以實(shí)驗(yàn)結(jié)果還有誤差,今后想通過使用更多特征和對本體優(yōu)勢的充分利用來提高實(shí)驗(yàn)結(jié)果。
參考文獻(xiàn):
[1]莊越挺,潘云鶴,吳飛.網(wǎng)上多媒體信息分析與檢索[M].北京:清華大學(xué)出版社,2002.
[2]趙志誠.故事視頻的語義分析與提取[D].北京:北京郵電大學(xué),2008.
[3]程珺.基于相關(guān)顏色的圖像檢索[D].武漢:華中科技大學(xué),2006.
[4]駱珊,徐勝榮.基于多分辨率直方圖的圖像檢索[J].江南大學(xué)學(xué)報(bào),2007(01):31-34.
[5]章勇,呂俊白.基于protégé的本體建模研究綜述[M].福建電腦,2011(01):43-45.
[6]紀(jì)兆輝,李存華.基于SWRL和Jess構(gòu)造語義及其web規(guī)則及其對策分析[M].淮海工學(xué)院學(xué)報(bào)(自然科學(xué)版),2009(04):26-29.
[7]龐偉正,金瑞琪等.一種規(guī)則引擎的實(shí)現(xiàn)方法[J],哈爾濱工程大學(xué)學(xué)報(bào),2008(32):59-62
作者簡介:海日漢(1989.06-),女,蒙古族人,研究生,研究方向:數(shù)字圖象處理。
作者單位:內(nèi)蒙古師范大學(xué)計(jì)算機(jī)與信息工程學(xué)院,呼和浩特 010022
基金項(xiàng)目:內(nèi)蒙古師范大學(xué)研究生科研創(chuàng)新基金項(xiàng)目(CXJJS12058)。