巫青山 向宇靜 牛光學
摘 要:本文深入研究了唐卡圖像的特征,并研究了適合唐卡的顏色、紋理、形狀及多種特征融合的提取方法,并設計了基于特征融合的唐卡圖像檢索系統(tǒng),最后得出結(jié)論:將唐卡圖像的多特征融合后檢索系統(tǒng)的準確性有一定了提高。
關鍵詞:圖像檢索;特征提取;特征匹配;特征融合
“唐卡”,系藏文音譯,用彩緞裝裱后懸掛供奉的宗教卷軸畫。唐卡藝術品種繁多,取材廣泛涉及到宗教畫、傳記畫、歷史畫、反映生活習俗的風俗畫等,其特點圖像人物畫法復雜、顏色豐富、色彩分布相對勻稱。唐卡藝術是千百年來藏民族在文化、歷史發(fā)展中積累的重要遺產(chǎn),具有獨特的藝術風格和濃厚的宗教色彩,在經(jīng)濟、文化、宗教和社會各方面發(fā)揮著越來越大的作用[1]。越來越多的唐卡圖像以電子的方式來存儲、管理和傳播,以滿足人們對唐卡藝術的欣賞和查詢。研究如何從唐卡圖像庫中快速并且準確地檢索出用戶所需要的唐卡圖像具有重要意義。文獻[2]已經(jīng)實現(xiàn)基于內(nèi)容的唐卡圖像檢索,沒有考慮唐卡圖像的紋理特征,只是將顏色特征和形狀特征融合。本文在基于內(nèi)容的圖像檢索技術基礎之上,深入研究了唐卡圖像的特征,并研究了適合唐卡的顏色、紋理、形狀及多種特征融合的提取方法,設計了基于特征融合的唐卡圖像檢索系統(tǒng)。
1 唐卡圖像顏色特征提取
顏色特征是人們識別事物的主要感知特征之一,是用于區(qū)別不同事物的最簡單、最有效的方法。提取唐卡圖像的顏色特征要考慮以下問題:顏色空間模型的選擇、顏色特征的描述、顏色特征匹配等問題。
1.1 RGB顏色模型
RGB顏色模型是最常用的顏色模型,用由R(紅)、G(綠)、B(藍)三個分量組成的三維空間[3]中的點來表示一種顏色,所有顏色都可以由R、G、B三個變量組合而成,三個分量取值范圍為0~1。原點(0,0,0)代表黑色,點(1,1,1)代表白色,從黑色到白色的對角線是圖像的一條灰色線。
1.2 顏色特征描述
由于對圖像進行旋轉(zhuǎn)、放大或縮小等操作時顏色直方圖具有不變性,因而顏色直方圖是對顏色特征進行描述的最常用的一種方法。顏色直方圖公式[3]:
其中L表示特征可取值的個數(shù),k表示圖像特征取值,N表示圖像像素的總數(shù),nk表示圖像中具有特征值為k的像素的個數(shù)。
在利用直方圖對顏色特征進行描述前,先要對顏色進行量化[4]。在本文中,我們首先將圖像的顏色空間劃分為13小個顏色區(qū)間的,然后再統(tǒng)計圖像顏色落在每個小區(qū)間的像素數(shù)量,從而得到R、G、B三分量的顏色直方圖。
1.3 顏色特征匹配
常見顏色特征匹配算法:直方圖匹配法、直方圖相交法、距離法、中心矩法等。根據(jù)1.2中提取的顏色直方圖,本文采用直方圖匹配法對顏色特征進行匹配,計算公式[3]如下:
其中Q(i)表示待檢測圖像的顏色直方圖中第i個柱的值,K(i)表示提取圖像庫中圖像的顏色直方圖中第i個顏色柱的值,L柱的個數(shù),W(i)表示權重。
2 唐卡圖像紋理特征
紋理指從整體上看表面呈現(xiàn)出某種規(guī)律,可以看成相同的表面組成,但從局部上看表面呈現(xiàn)出雜亂無序。紋理也可理解為圖像灰度在空間上的變化和反復[5],是人們視覺系統(tǒng)對物體表面現(xiàn)象的感知。
2.1 Tamura紋理特征
Tamura紋理特征[7]是由Tamura等人提出,該算法的基礎是人類視覺系統(tǒng)對紋理的感知,所有的紋理在視覺系統(tǒng)上都有意義,主要用粗糙度、對比度、方向度來描述圖像的紋理特征。
(1)粗糙度:最基本的紋理特性,反映圖像的紋理粒度的特性。計算粗糙度的步驟如下:
第一步:計算大小為2k×2k的圖像中活動窗口中像素的平均強度值,計算公式[6]如下:
其中k=0、1、2、3、4、5,f(i,j)表示點(i,j)處的像素灰度值。
第二步:計算每個像素在水平方向上和垂直方向互不重疊的窗口之間的平均強度差,計算公式[6]如下:
第三步:取水平方向上和垂直方向上平均強度差值最大者,并作為當前像素的領域均值差值。
第四步:從多領域尺寸中設置一個最佳尺寸,并在L(代表領域尺寸個數(shù))個領域均值差值中求得最大值,計算公式[6]如下:
第五步:計算整幅圖像的灰度圖像的紋理粗糙度F,其中m、n分別表示圖像的寬和高,計算公式[6]如下:
(2)方向度:描述紋理的散布或集中方向,對圖像紋理的全局描述。方向度在像素梯度的基礎上求得的,其計算步驟如下:
第一:計算像素梯度,計算公式[6]如下:
其中Vh、Vv分別是通過圖像卷積 所得的水平和垂直方向上的變化量。
第二步:設定域值D,先對θ進行離散化,統(tǒng)計域值D小于 —G—的像素數(shù)量并構造方向角局部邊緣概率直方圖。
第三步:采用二階矩累積方法計算方向度,計算公式[6]如下:
其中δ表示直方圖歸一化系數(shù),np為直方圖中峰波的個數(shù),p為峰波的值,ωp為峰波兩側(cè)之間距離,βp表示為峰波中心位置,H為直方圖,β為量化后的方向角。
(3)對比度:用于統(tǒng)計像素亮度的分布,其大小由灰度級動態(tài)范圍、直方圖上黑白兩部分兩極化的程度、邊緣銳化、重復模式的周期決定。對比度計算公式[6]如下: ,其中b=A/a2,A為四次矩,a為方差,n取8、4、2、1、1/2、1/4、1/8。
(4)在設定不同的閾值情況下,利用Tamura紋理特征提取唐卡示例圖1的紋理值如下表1。
2.2 紋理特征匹配
依據(jù)2.1中利用Tamura算法提取唐卡圖像在紋理特征上的粗糙度F、方向度M和對比度N三個分量,本文采用以下公式描述待檢測圖像的F、M、N三個分量與特征庫中圖像的F、M、N之間的關系。
其中(DF,DM,DN)、(KF,KM,KN)分別表示待檢測圖像和特征庫中圖像的紋理特征在粗糙度F、方向度M和對比度N上的值。α、β、γ分別表示在粗糙度F、方向度M和對比度N三個分量上的權重因子,表示所提取的紋理特征側(cè)重與某一分量。Dist(F,M,N)的值表示兩幅圖像的紋理特征之間的差距。
3 唐卡圖像形狀特征
形狀特征描述圖像中目標形狀的特點以及空間區(qū)域特點,并且不會因為外界因素的改變而變化。目前為止,形狀特征還沒有確切的定義[7]。本文采用邊緣直方圖描述唐卡圖像的形狀特征。
3.1 邊緣直方圖算法
⑴Canny算子思想.提取圖像中目標的邊緣特征采用Canny算子[8]。Canny算子通過設定的兩個閾值來檢測強邊緣和弱邊緣。設定高閾值為T1,低閾值為T2,圖像中目標邊緣上的任一點(x,y)的梯度幅值為M(x,y)。若M(x,y)>T1,則表明點(x,y)一定在圖像中的目標邊緣上;若M(x,y) ⑵邊緣直方圖算法。第一步:先將圖像轉(zhuǎn)化成灰度圖像,再利用二維高斯函數(shù)對圖像進行降噪。二維高斯函數(shù)公式[9]如下: 其中δ是信噪比參數(shù),f?(x,y)表示待降噪的圖像,f(x,y)代表降噪后的圖像。 第二步:計算圖像中各點處的梯度幅度和梯度方向。計算公式[9]如下: 第三步:將邊緣梯度方向值進行量化成36份,即從-1800~1800量化到0~36,得到唐卡圖像的邊緣直方圖2。 3.2 形狀特征匹配 基于上述3.1中提取圖像的邊緣直方圖,本文采用1.3中顏色特征匹配的方法對形狀特征進行匹配。 本文通過基于特征融合的唐卡圖像檢索實驗系統(tǒng),并得出結(jié)論:唐卡圖像的多特征融合后檢索系統(tǒng)的準確性有一定了提高,同時增加了檢索時間;若只針對唐卡圖像的單一特征檢索實驗,在顏色特征、形狀特征、紋理特征之中,顏色特征作為檢索條件的準確性最高;分析只融合兩種特征的實驗結(jié)果發(fā)現(xiàn):顏色特征作為檢索條件的準確性最高,紋理特征其次,形狀特征最低,這可能與提取特征的算法和參數(shù)設定有關。要想大幅度的提高唐卡圖像檢索系統(tǒng)的效率和準確性,今后研究需要建立一個與人感知更為貼近的唐卡圖像特征模型,探索出一種更能表達和描述唐卡圖像特征的方法,并且將唐卡圖像的低層特征與高層特征相結(jié)合起來。 [參考文獻] [1]王維蘭,唐仕喜,錢建軍,粱弼.基于內(nèi)容的唐卡圖像數(shù)據(jù)庫檢索系統(tǒng)[J].湛江師范學院學報,2008,03:91-95. [2]李曉杰.基于內(nèi)容的唐卡圖像檢索技術研究[D].西北民族大學,2011. [3]章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學出版社,2003.