李莉
摘 要 隨著多媒體信息技術(shù)的快速發(fā)展,多媒體信息的數(shù)據(jù)庫(kù)信息含量越來(lái)越大,基于內(nèi)容的多媒體檢索技術(shù)的出現(xiàn),解決了怎樣快速?gòu)亩嗝襟w數(shù)據(jù)庫(kù)中檢索出自己所需的信息的難題。基于內(nèi)容的多媒體檢索技術(shù)主要包括圖像檢索技術(shù)、視頻檢索技術(shù)、音頻檢索技術(shù)。
關(guān)鍵詞 多媒體 檢索 計(jì)算機(jī)
中圖分類號(hào):TP37 文獻(xiàn)標(biāo)識(shí)碼:A
0 引言
隨著計(jì)算機(jī)應(yīng)用的普及以及信息技術(shù)的快速發(fā)展,多媒體數(shù)據(jù)廣泛應(yīng)用于各種企業(yè)的信息系統(tǒng)中,但是現(xiàn)有的采用結(jié)構(gòu)化查詢語(yǔ)言檢索信息數(shù)據(jù)庫(kù)的技術(shù),不能有效滿足對(duì)含有大量信息的多媒體信息的檢索。因此,基于內(nèi)容的多媒體檢索技術(shù)得以出現(xiàn)并且快速發(fā)展,該技術(shù)不但可以通過(guò)包含直接含義的文字進(jìn)行信息檢索,還可以通過(guò)對(duì)圖像、聲音、視頻信息進(jìn)行檢索存儲(chǔ)在數(shù)據(jù)庫(kù)中的信息。目前,基于內(nèi)容的多媒體檢索技術(shù)發(fā)展十分迅速,國(guó)內(nèi)外很多的研究機(jī)構(gòu)對(duì)這種新技術(shù)展開(kāi)了研究,并取得了豐碩的成果。由于基于內(nèi)容的多媒體檢索技術(shù)設(shè)計(jì)的具體技術(shù)比較多,本文只簡(jiǎn)單的介紹基于內(nèi)容的多媒體檢索的技術(shù)的原理及其特點(diǎn),并且闡述了基于多媒體圖像、視頻和聲頻的檢索方法,最后對(duì)基于內(nèi)容的多媒體檢索技術(shù)的發(fā)展趨勢(shì)進(jìn)行了分析。
1 基于內(nèi)容的多媒體檢索技術(shù)的原理與特點(diǎn)
基于內(nèi)容的檢索的近年來(lái)多媒體檢索技術(shù)研究的熱點(diǎn)問(wèn)題,它不同于傳統(tǒng)的單單依靠文本進(jìn)行檢索,該技術(shù)通過(guò)對(duì)多媒體的圖像、聲音、視頻內(nèi)容的分析,根據(jù)多媒體的內(nèi)容和語(yǔ)義環(huán)境,如圖像中的顏色、形狀,聲音中的音調(diào)、音色等,視頻中的鏡頭的運(yùn)動(dòng)、場(chǎng)景,然后建立相應(yīng)的檢索庫(kù),并進(jìn)行相應(yīng)的檢索?;趦?nèi)容的多媒體檢索技術(shù)只是信息檢索技術(shù)的一個(gè)分支,它主要通過(guò)圖像處理、計(jì)算機(jī)視覺(jué)等方法相互融合建立的,是多種技術(shù)合成的結(jié)果。
基于內(nèi)容的多媒體檢索技術(shù)與傳統(tǒng)的基于關(guān)鍵詞的數(shù)據(jù)庫(kù)檢索技術(shù)相比,它有自己的特點(diǎn):該技術(shù)可以通過(guò)對(duì)圖像、視頻、音頻進(jìn)行分析提取信息線索,從而進(jìn)行檢索;基于內(nèi)容的檢索結(jié)果一般與檢索條件具有一定的相似度,但是并不一定完全滿足,它采取近似匹配的方法和技術(shù)進(jìn)行檢索;基于內(nèi)容的多媒體檢索的系統(tǒng)信息量非常大,它包括媒體庫(kù)、特征庫(kù)和知識(shí)庫(kù),各個(gè)數(shù)據(jù)庫(kù)都包含有不同的信息,這樣就可以滿足不同的用戶的多層次的檢索要求。
2 基于內(nèi)容的多媒體檢索方法
基于內(nèi)容的多媒體檢索方法具體又分為基于內(nèi)容的圖像檢索、基于內(nèi)容的視頻檢索、基于內(nèi)容的音頻檢索等技術(shù)。
隨著計(jì)算機(jī)圖像數(shù)碼技術(shù)的發(fā)展,檢索數(shù)據(jù)庫(kù)中的圖像信息量越來(lái)越大,怎樣才能快速?gòu)膱D像數(shù)據(jù)庫(kù)中找出與檢索圖像相符的信息,這是決定檢索成敗的關(guān)鍵。通過(guò)對(duì)圖像的顏色、紋理、形狀等分析獲得圖像的客觀視覺(jué)內(nèi)容特征,判斷檢索圖像的相似性,這是基于內(nèi)容的圖像檢索技術(shù)的主流發(fā)展方向。該方法研究的主要內(nèi)容主要是在數(shù)字圖像處理的基礎(chǔ)上對(duì)圖像的視覺(jué)特征進(jìn)行提取,以及對(duì)多維索引和檢索系統(tǒng)進(jìn)行設(shè)計(jì)。根據(jù)圖像特征的作用區(qū)域可以把圖像檢索系統(tǒng)分為基于全局特征檢索和基于區(qū)域特征及其空間關(guān)系檢索兩種檢索。其中基于全局特征檢索主要依靠對(duì)全幅圖像的視覺(jué)特征進(jìn)行檢索,而基于區(qū)域特征及其空間關(guān)系的檢索主要是按照分割開(kāi)的圖像的特征相似性進(jìn)行檢索,但是它要顧及區(qū)域之間的相似性。
基于內(nèi)容的視頻檢索技術(shù)與圖像檢索技術(shù)有很多相似之處,因?yàn)橐曨l本身就是一組動(dòng)態(tài)圖像組成的,視頻是一組圖像按照時(shí)間連續(xù)的表現(xiàn)的。利用可視化特征視頻數(shù)據(jù)建立有效的索引是視頻檢索的前提,鏡頭、代表幀、運(yùn)動(dòng)特征等都是視頻特征,依靠這些建立視頻的索引,就可以利用關(guān)鍵幀的特征和鏡頭的時(shí)間特征進(jìn)行檢索。目前,常用的視頻檢索方法有三種,分別為基于關(guān)鍵幀的檢索、基于運(yùn)動(dòng)的檢索、瀏覽檢索?;谶\(yùn)動(dòng)的檢索,主要是基于鏡頭和視頻對(duì)象的時(shí)間特征進(jìn)行檢索,該方法可以查詢攝像機(jī)的操作和場(chǎng)景移動(dòng)等信息,還可以根據(jù)物體的運(yùn)動(dòng)方向和運(yùn)動(dòng)幅度等特征檢索運(yùn)動(dòng)中的物體?;陉P(guān)鍵幀的檢索,主要是對(duì)視頻鏡頭的關(guān)鍵幀進(jìn)行檢索,該方法快速方便,并且關(guān)鍵幀既可以當(dāng)做靜態(tài)圖像處理,也可以當(dāng)做視頻瀏覽。
多媒體的音頻數(shù)據(jù)具有物理和感知兩種特征。物理特征一般都是來(lái)自于音頻信號(hào)本身,主要包括頻率等;而感知特征主要是依賴于人的聽(tīng)覺(jué),主要包括音調(diào)、音高等。根據(jù)音頻數(shù)據(jù)的物理和感知特征進(jìn)行檢索,就能夠得到需求的音頻信息。
3 基于內(nèi)容的多媒體檢索技術(shù)的發(fā)展趨勢(shì)
基于內(nèi)容的多媒體檢索技術(shù)日益成熟,逐漸應(yīng)用于各種檢索數(shù)據(jù)庫(kù)中,它能夠方便人們快速的從海量的多媒體信息數(shù)據(jù)庫(kù)中檢索出自己所需要的信息。隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,人們可以通過(guò)網(wǎng)絡(luò)獲取世界各地的數(shù)據(jù)庫(kù)中的多媒體信息,基于內(nèi)容的多媒體檢索技術(shù)的應(yīng)用范圍會(huì)更加的廣泛。基于內(nèi)容的多媒體檢索技術(shù)是一種新的檢索手段,其研究周期還比較短,同時(shí)互聯(lián)網(wǎng)的發(fā)展使得數(shù)據(jù)檢索的對(duì)象和范圍更加復(fù)雜多樣,為了使該檢索技術(shù)應(yīng)用領(lǐng)域更廣泛,該技術(shù)還需要解決與其他多種檢索技術(shù)相互結(jié)合的問(wèn)題,提高檢索的效率。
參考文獻(xiàn)
[1] 陳芳,柳燕.基于內(nèi)容的多媒體檢索技術(shù)淺析[J].計(jì)算機(jī)與數(shù)字工程,2007,35(7).
[2] 鐘少君,陳新.基于內(nèi)容的多媒體信息檢索[J].山西電子技術(shù),2005(3).
[3] 王曙燕,周明全,耿國(guó)華.基于內(nèi)容的多媒體信息檢索技術(shù)研究[J].現(xiàn)代電子技術(shù),2005,193(2).
[4] 陳春穎,周雄偉,余以勝.基于內(nèi)容的多媒體檢索策略探析[J].情報(bào)雜志,2004(5).