李磊
湖北工程學(xué)院
基于數(shù)字圖像的檢索技術(shù)研究
李磊
湖北工程學(xué)院
近年來(lái),網(wǎng)絡(luò)和多媒體技術(shù)越來(lái)越發(fā)達(dá),網(wǎng)絡(luò)上的各類(lèi)資源日以豐富,人們?cè)絹?lái)越青睞于直觀生動(dòng)的多媒體技術(shù),數(shù)字圖像的存在感越來(lái)越強(qiáng),但它們并沒(méi)有被綜合整理分類(lèi),這樣想快速充分的利用這些有用信息,就需要用到圖像檢索技術(shù)。目前,網(wǎng)絡(luò)資源的日益豐富以及圖像檢索技術(shù)日益發(fā)展成熟,使得不斷擴(kuò)大圖像檢索技術(shù)的應(yīng)用領(lǐng)域,這就需要我們繼續(xù)研究完善圖像檢索技術(shù)。與此同時(shí),網(wǎng)絡(luò)傳送速度與計(jì)算機(jī)信息處理速度不斷提高,網(wǎng)頁(yè)中越來(lái)越普遍的使用多媒體信息,特別是圖像信息,成為了網(wǎng)頁(yè)內(nèi)容的重要組成部分。如何為用戶(hù)同時(shí)提供文本信息和圖像信息,是信息檢索中一個(gè)重要研究方向。于是各種基于Web的圖像檢索系統(tǒng)應(yīng)運(yùn)而生,極大地方便了用戶(hù)對(duì)網(wǎng)上圖像進(jìn)行檢索。本文將重點(diǎn)介紹各種圖像檢索技術(shù)的原理、現(xiàn)狀、發(fā)展趨勢(shì)。
圖像檢索 文本內(nèi)容 圖像內(nèi)容
圖像檢索引擎的檢索途徑主要有三種:
但是因?yàn)槭芸卦~匯本身的局限,易歧義,更新慢,所以不太容易應(yīng)對(duì)網(wǎng)絡(luò)上日新月異的各類(lèi)圖像,傳統(tǒng)的圖像檢索技術(shù)是通過(guò)精確匹配關(guān)鍵字檢索,用關(guān)鍵字標(biāo)識(shí)系統(tǒng)內(nèi)的圖像,標(biāo)識(shí)相一致的關(guān)鍵字就是檢索線索,即輸入是關(guān)鍵字,輸出是圖像。它又包括兩種途徑:①基于圖像外部信息進(jìn)行檢索。在找出圖像文件后,圖像檢索引擎通過(guò)查看文件名或路徑名確定文件內(nèi)容。②基于手工標(biāo)注的檢索。手工描述并分類(lèi)圖像的內(nèi)容,將其標(biāo)注為關(guān)鍵字,并建立索引。這種查詢(xún)方式的有點(diǎn)是比較準(zhǔn)確,有較好的查準(zhǔn)率,但勞動(dòng)強(qiáng)度大,圖像的標(biāo)注也缺乏統(tǒng)一標(biāo)準(zhǔn)。
通過(guò)圖像分析軟件自動(dòng)抽取圖像的顏色、形狀、紋理等特征進(jìn)行檢索,并建立特征索引庫(kù),輸入要查找的圖像的特征描述,通過(guò)檢索規(guī)則,輸出有著相近特征的圖像內(nèi)容,按相似規(guī)則排列,這種檢索方法的優(yōu)點(diǎn)是把在傳統(tǒng)圖像檢索技術(shù)中用戶(hù)描述或識(shí)別的圖像特征,交由系統(tǒng)去解決。這種檢索主要是基于圖像本身特征層次來(lái)完成的,適用于有明確的查詢(xún)要求的檢索目標(biāo),但目前這種檢索技術(shù)在圖像檢索引擎中應(yīng)用還有一定困難。盡管圖像檢索已經(jīng)出現(xiàn)了多種表征圖像特征的方法諸如直方圖、顏色矩、顏色集等,但是要實(shí)現(xiàn)更高語(yǔ)義上的檢索,實(shí)現(xiàn)難度大,進(jìn)展慢。
二者雖側(cè)重不同但卻互相補(bǔ)充,集合兩者的優(yōu)勢(shì),促進(jìn)高效、簡(jiǎn)單的圖像檢索方式。
這三種圖像引擎的檢索方式都是相互影響和相互促進(jìn)的,任何一種方法進(jìn)步,都會(huì)促進(jìn)圖像檢索技術(shù)的發(fā)展。
顏色特征提取。在傳統(tǒng)的圖像檢索算法中,最簡(jiǎn)單基本的一種計(jì)算方法是直方圖,該算法用于表達(dá)不同顏色所占的比例構(gòu)成數(shù)字圖像。一般用(Red-Green-Blue)顏色空間來(lái)描述在數(shù)字圖像中的一幅圖像,然而人們對(duì)(Red-Green-Blue)空間結(jié)構(gòu)不熟悉,以及人們對(duì)顏色相似性的認(rèn)識(shí)存誤差,尤其是在量化過(guò)程中。因此我們需要將(Red-Green-Blue)空間轉(zhuǎn)化成HSV空間,再來(lái)通過(guò)量化的方法來(lái)獲取我們需要的圖像顏色直方圖,顏色特征是一種全局特征,通過(guò)它我們能夠描述圖像或圖像區(qū)域的景物表面性質(zhì),一般顏色特征是基于像素點(diǎn)的特征。由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對(duì)象的局部特征。如果僅使用顏色特征查詢(xún),當(dāng)數(shù)據(jù)庫(kù)很大時(shí),常會(huì)檢索出許多不需要的圖像。但是在圖像檢索中應(yīng)用最為廣泛的視覺(jué)特征是顏色特征,主要是因?yàn)閳D像中所包含的物體或場(chǎng)景和顏色往往十分相關(guān)。此外,相比其他視覺(jué)特征,顏色特征對(duì)圖像本身的尺寸、方向、視角的依賴(lài)性較小,從而具有較高的穩(wěn)定性。
檢索中,為了正確地使用顏色,我們需要建立顏色模型。顏色特征是圖像最直觀而明顯的特征,一般采用直方圖來(lái)描述。顏色直方圖是表示圖像中顏色分布的一種方法,它的橫軸表示顏色等級(jí),縱軸表示在某一個(gè)顏色等級(jí)上具有該顏色的像素在整幅圖像中所占的比例,直方圖顏色空間中的每一個(gè)刻度表示了顏色空間中的一種顏色。在顏色布局描述符中,對(duì)分割好的8×8的圖像取每一塊圖像的顏色平均值,形成一個(gè)顏色平均值矩陣,然后對(duì)其用二維離散余弦進(jìn)行變換,取低頻分量作為顏色特征。
紋理特征提取。紋理是一種反映圖像中同質(zhì)現(xiàn)象的視覺(jué)特征,它體現(xiàn)的是物體表面的具有緩慢變化或者周期性變化的表面結(jié)構(gòu)組織排列屬性。紋理和灰度、顏色等圖像特征不同,它的原理是通過(guò)像素及其周?chē)臻g鄰域的灰度分布來(lái)表現(xiàn),即:局部紋理信息。而圖像可以看成是不同紋理區(qū)域的組合。紋理特征可用來(lái)對(duì)圖像中的空間信息進(jìn)行一定程度的定量描述,這彌補(bǔ)了顏色特征的缺陷。邊緣直方圖是基于圖像邊緣的統(tǒng)計(jì)特征,目標(biāo)的邊緣和紋理特征能較好地被反映,且運(yùn)算速度較高。
本文分析了圖像檢索技術(shù)的幾種類(lèi)型,并分析研究了其中幾個(gè)算法,以及顏色、紋理特征提取。但隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展檢索效率和精度需要不斷提高,這就需要我們?cè)诂F(xiàn)有圖像檢索技術(shù)的基礎(chǔ)上加強(qiáng)對(duì)基于內(nèi)容的圖像檢索技術(shù)進(jìn)行研究,最終實(shí)現(xiàn)更高語(yǔ)義上的精準(zhǔn)檢索。