(桂林師范高等專科學校網絡與教育技術中心,廣西桂林541199)
近幾十年來,隨著科技水平的發(fā)展,人們通過相機、手機以及其他圖像獲取設備和圖像處理設備,每天都可以獲取大量的圖像數據。伴隨著互聯(lián)網技術的快速發(fā)展,為了更加快速、精確地管理圖像,減少人工參與的成本,計算機能自動識別圖像信息并分門別類進行管理。圖像分類技術通過使用特定的算法提取能夠描述圖像的特征,然后通過特征實現分類。圖像分類的實現主要包括特征提取和分類算法。圖像特征提取是圖像分類的基礎工作,選擇不同的圖像特征進行圖像分類,分類效果也會不同。圖像特征分為底層特征和高級語義特征,目前底層特征技術日趨成熟。圖像的底層圖像特征包括顏色特征、形狀特征、紋理特征和空間關系特征??梢詥为毷褂靡环N特征來進行圖像分類,也可以考慮多種特征融合來進行分類[1]。本文研究基于多特征融合的分類算法,對于提高分類效果具有重要的現實意義。
圖像單一特征僅可以部分描述圖像屬性,比較片面,不能夠完全區(qū)分圖像,在圖像有較大變化(如尺度或方向)的場合分類效果通常較差。因此,應當考慮多種特征融合提高分類準確率。李志欣等人將SIFT特征用稀疏向量表示后與Gist和PHOG特征有機融合,提出了一種多特征的圖像分類方法[2]。文獻[3]將顏色直方圖特征、灰度共生矩陣,以及Hu不變矩特征進行融合,運用Adaboost算法進行分類。文獻[4]提出了一種基于Contourlet變換和Hu不變矩的圖像檢索算法,有效地融合了圖像的紋理特征與低頻子帶的形狀特征,較好地實現了基于內容的圖像檢索。文獻[5]提出了基于Gist特征與PHOG特征融合的場景分類方法,將兩種特征融合,使用SVM分類器進行分類。文獻[6]將Gist特征與HOG特征進行組合實現圖像的場景分類。文獻[7]針對詞袋算法忽略局部特征空間關系的弱點,利用局部特征的空間共生統(tǒng)計代替直方圖統(tǒng)計,使描述符帶有空間信息,提高了分類性能。文獻[8]提出了一種綜合顏色空間特征和紋理特征的圖像檢索方法,通過中心塊圖像分形編碼方法得到分形編碼參數,以其為紋理特征與顏色特征相結合,然后利用人工魚群算法進行檢索。鄧江洪等人[9]提出了一種多特征篩選與支持向量機相融合的圖像分類模型,首先提取顏色特征和紋理特征,然后根據平均影響值,篩選出重要特征向量,最后使用SVM構建圖像的多分類器[10]。
基于上述研究,本文將不同特征進行融合,確定出其中最優(yōu)的分類組合。發(fā)現Gist特征和顏色矩特征相融合,使用libSVM對圖像進行分類[11],該方法具有較好的分類效果。
Gist特征是一種全局特征,主要由圖像的自然度、開放度、膨脹度等五個方面信息構成。其主要是使用Gabor濾波器組對圖像進行濾波處理,然后劃分成NXN的網格,再提取圖像的輪廓信息。
不變矩是指物體圖像經過平移、旋轉以及尺度變換仍然保持不變的矩特征量。Hu不變矩是基于區(qū)域的圖像形狀描述方法。
在Hu不變矩的構造過程中,通過使用中心矩消除圖像平移影響,規(guī)格化處理消除圖像縮放影響,構造多項式實現旋轉的不變特性[12]。
不同階矩反映不同的目標特性,低階反映了目標的基本形狀,高階則反映了物體的細節(jié)和復雜性。另外Hu不變矩具有一定的信息冗余性,對噪聲敏感。
顏色矩是一種簡單有效的顏色特征表示方法,有一階矩(均值,mean)、二階矩(方差,viarance)和三階矩(斜度,skewness)等,計算比較簡單方便。由于顏色信息主要分布于低階矩中,所以用一階矩,二階矩和三階矩足以表達圖像的顏色分布,顏色矩已證明可有效地表示圖像中的顏色分布。
圖像的顏色矩特征描述了圖像的宏觀概率統(tǒng)計特征,不需要量化圖像特征。圖像像素具有三個顏色通道,顏色矩維度小,只有9個分量,提取速度快。顏色矩特征還具有平移不變性、旋轉不變性以及縮放不變性。
特征融合是指將兩個或多個特征向量按照某種規(guī)則組合成新的特征向量。特征融合方法中最簡單有效的方法是串聯(lián)和并聯(lián)方法[13]。
由上式可知,若α為m維,β為n維,則γ為(m+n)維向量。
本文選取了Gist特征,顏色矩特征,Hu不變矩特征進行融合。其中顏色特征是最早被用于圖像分類的特征之一,能夠直觀描述圖像的內容。顏色矩維數低,提取方便,但單獨的顏色特征缺乏空間分布信息,所以考慮結合其他特征進行圖像分類。相對于顏色特征,形狀特征可能包含了一定的語意信息,在某種程度上描述了人對物體的視覺感知。Hu不變矩計算效率高且存儲開銷小,選擇它作為融合特征之一。Gist特征考慮了圖像的空間結構關系,對場景類圖像具有很好的分類效果。選擇這三種特征具有一定的互補優(yōu)勢,能夠更準確描述圖像屬性,提高圖像分類效果。
分別提取圖像的三種特征,這三種特征的維數如表1所示:
表1 選取的特征及維數
按照文獻[5]方法提取圖像的Gist特征,將圖像劃分為4×4的網格,用四個尺度八個方向的Gabor濾波器組處理得到Gist特征,則整幅圖像的Gist特征維數為 4×4×32=512 維。
顏色的HSV空間各軸在視覺上彼此沒有關系,空間距離適合人眼視覺感知,同時從RGB到HSV的轉換是一個簡捷、有效的非線性變換,因此,本文選擇在HSV空間提取圖像顏色矩特征。
在對Hu不變矩特征[12]進行提取時,七個不變矩的變化范圍很大,在圖像處理的過程中會造成很大的數據偏差。為了便于比較,并縮小數據偏差,本文采用對數的操作方法[4]對Hu不變矩進行數據壓縮。
選擇串聯(lián)方式對Gist特征,顏色矩特征,Hu不變矩特征進行特征融合有四種情況:Gist特征與Hu不變矩特征融合,顏色矩與不變矩特征融合,Gist特征與顏色矩特征融合,以及這三種特征融合。在特征融合時,需對Hu不變矩進行數據標準化處理。原始數據經過數據標準化處理后,各指標處于同一數量級,適合進行綜合對比評價。兩種常用的歸一化方法為min—max標準化和Z—score標準化方法,本文采用第一種方法進行處理,融合之前將特征值調整到[0,1]之間。融合后的特征及維數如表2所示:
表2 融合后的特征及維數
本文采用libSVM分類法對圖像進行分類。分別將四種融合特征進行圖像分類,并選出分類效果最好的融合特征。
本文的試驗環(huán)境為win7下matlab2011a,內存8G。為了測試本文方法的準確率,試驗中下載的圖像來自COREL圖像庫,從中選取了恐龍、花朵、建筑物等10類圖像各50幅,設訓練圖像個數為t,在每類圖像中分別隨機選取t=10幅、20幅、30幅、40幅作為訓練數據,剩下的作為測試數據。以平均分類準確率為最終準確分類率。
對選取的三種特征分別直接進行分類,分類結果如表3所示:
表3 單獨特征分類結果
對融合后的特征進行分類,實驗結果如表4所示:
表4 融合特征分類效果
從表3,4可以看出將不同特征進行融合可以提高分類效果。顏色矩與Gist特征融合后,分類平均準確率為94.55%;將顏色矩、Gist以及Hu不變矩三種特征串聯(lián)后,平均準確率為93.86%,因此并非融合的特征越多,分類效果就越好。通過實驗可以看出顏色矩特征與Gist特征相融合,分類效果最好。
本文分類方法的步驟:
(1)分別提取圖像Gist特征,Hu不變矩特征,顏色矩特征;
(2)對特征數據進行歸一化處理,然后將三種特征進行串聯(lián)融合;
(3)用libSVM分類器進行訓練和分類,選擇出分類效果最好的特征。
本文分類方法流程如圖1所示:
圖1 分類方法流程示意圖
將本文方法與文獻[2][4][5][9]進行對比,實驗結果如表5所示:
表5 分類對比結果
實驗結果表明本文方法的分類效果明顯優(yōu)于文獻[2][4]以及[5]的方法,在圖像分類準確率方面有顯著的提高。與文獻[9]相比,也略有提高。
將本文方法應用于車輛圖像分類,實驗采用貨車、大巴、汽車三類圖片,每類各20幅。如圖所示(每類選兩幅):
圖2 貨車圖片
圖3 大巴圖片
圖4 汽車圖片
對所拍攝的車輛圖片進行顏色矩特征和Gist特征融合方法進行分類,在每類圖像中分別隨機選取t=6幅、8幅、10幅、12幅作為訓練數據,剩下的作為測試數據。實驗結果如表6所示。實驗結果表明對車輛圖像進行分類,該方法具有不錯的效果。
表6 車輛圖像分類結果
本文介紹了圖像顏色矩特征、Gist特征以及Hu不變矩特征提取方法,闡述了這幾種特征提取方法的步驟及特點。在研究圖像顏色矩特征、Gist特征以及Hu不變矩特征相互融合的基礎上,提出了一種基于顏色矩與Gist特征的圖像分類方法。該分類方法將兩種特征串聯(lián)方式進行融合,再使用libSVM分類器進行分類,提高了分類準確率。將該方法應用到車輛圖像分類方面上,取得了不錯的分類效果。