吳雪
摘 要: 為了提高圖像分類的效果,考慮當前方法準確實現(xiàn)圖像分類的難題,提出粒子群優(yōu)化算法選擇特征的運動圖像分類方法。對當前運動圖像分類方法的研究現(xiàn)狀進行分析,提取不同類型的圖像,并采用粒子群優(yōu)化算法選擇最優(yōu)特征,組成特征向量,將特征向量機作為神經網絡的輸入,實現(xiàn)運動圖像的分類。采用具體圖像分類實驗進行驗證,結果表明,該方法可以描述不同運動圖像的類別信息,縮小圖像的分類誤差,避免其他圖像分類方法的缺陷,提高了圖像的整體分類正確率。
關鍵詞: 運動圖像; 特征選擇; 粒子群算法; 圖像分類
中圖分類號: TN911.73?34; TP317.4 文獻標識碼: A 文章編號: 1004?373X(2017)17?0047?04
Moving image classification based on particle swarm optimization
algorithm selecting features
WU Xue
(Wuhan Institute of Technology, Wuhan 430205, China)
Abstract: In order to improve the effect of image classification and realize the accurate image classification, a moving image classification method based on particle swarm optimization algorithm selecting features is proposed. The current research status of the moving image classification methods is analyzed to extract the images of different types. The particle swarm optimization algorithm is used to select the optimal feature to compose the feature vector. The feature vector machine is taken as the input of neural network to classify the moving images. The classification experiments of specific images were adopted to make verification. The experimental results show that the method can describe the categories information of different moving images, reduce the classification error of the images, avoid the defects of other image classification methods, and improve the overall image classification accuracy.
Keywords: moving image; feature selection; particle swarm optimization algorithm; image classification
0 引 言
隨著計算機圖像處理技術和數(shù)碼技術的不斷發(fā)展,在現(xiàn)實生活中產生了大量的運動圖像[1]。對運動圖像進行快速檢索可以便于圖像管理,而圖像分類是圖像管理的基礎,建立性能良好的運動圖像分類方法具有十分重要和現(xiàn)實的意義,因此圖像分類問題引起了人們的高度關注[2?3]。
最原始的運動圖像分類主要通過手工方式進行,當圖像數(shù)量比較少時,該方法可以獲得比較理想的圖像分類效果,當圖像數(shù)量比較大時,分類速度慢、費時,給海量圖像管理帶來了困難[4]。隨著自動化技術的不斷發(fā)展,人們開始采用計算機進行運動圖像自動分類,節(jié)省了大量的人力,分類速度明顯加快[5]。運動圖像自動分類首先要提取一定數(shù)量、能夠描述圖像內容的特征,然后根據(jù)特征對圖像樣本進行處理,采用一定的方法建立運動圖像分類器,實現(xiàn)運動圖像的分類,因此特征直接影響著圖像分類結果的好壞。當前運動圖像特征主要有紋理、顏色、邊緣等特征,每一種特征對每一類圖像的分類結果作用是不相同的,它們之間的差異明顯[6?7]。單一特征提供的圖像內容信息十分有限,為了更好地實現(xiàn)運動圖像分類,人們盡可能多的提取運動圖像特征,然而特征之間具有一定的相關性,即經常所說的信息冗余,信息冗余對圖像分類速度產生不利影響,有時對圖像分類的正確率也會產生負面影響,影響圖像分類的整體性能[8?9]。有學者提出對圖像特征進行降維處理的思想,如主成分分析、判別分析,有效降低了圖像特征的維數(shù),加快了圖像的分類速度,但只是對圖像進行融合,特征對圖像分類結果的貢獻沒有很好的表示出來,有學者采用遺傳算法、粒子群算法對運動圖像特征進行選擇,它們沒有破壞圖像特征的原始意義,圖像分類結果的可解釋性好,然而它們也存在一定的不足,運動圖像分類結果有待改善[10?12]。
為了提高圖像分類的效果,考慮當前方法無法準確實現(xiàn)圖像分類的難題,提出粒子群優(yōu)化算法(PSO)選擇特征的運動圖像分類方法,結果表明,該方法減少了圖像的分類誤差,提高了圖像的整體分類正確率,可以滿足運動圖像自動管理的需要。
1 粒子群優(yōu)化算法選擇特征的運動圖像分類原理
基于PSO算法的運動圖像分類原理為:首先采集運動圖像,并提取不同類型的特征;然后采用粒子群算法對最重要的特征進行搜索,選擇最重要的特征組成特征向量;最后采用神經網絡建立圖像分類器進行圖像分類,如圖1所示。endprint
2 粒子群優(yōu)化算法選擇特征的運動圖像分類方法
2.1 提取圖像特征
要進行圖像分類建模,首先要提取有效圖像特征,當前特征主要有顏色、紋理和邊緣,不同特征提取方法可以獲得不同的特征向量和特征維數(shù),而且可以產生不同的圖像分類結果。
2.1.1 提取顏色矩特征
當前顏色特征有很多,如顏色集、顏色聚合向量等,它們均需要對圖像進行量化處理,使圖像分類的錯誤率相當高,而且忽略了圖像像素間的內在聯(lián)系。顏色矩(color moments)將圖像顏色分布用矩來描述,重要信息常存于低階矩中,可以通過一階矩、二階矩描述顏色分布。不同運動圖像的顏色矩特征如表1所示。
2.1.2 提取紋理特征
紋理特征是圖像中最常見的一種特征,Gabor濾波具有良好的選擇性,能夠描述圖像的空間特征,為此采用Gabor變換提取圖像的紋理特征。Gabor濾波器的函數(shù)表示為:
(1)
式中:和為Gabor濾波器的方向和尺度;為高斯窗的寬度率;為最大采樣頻率;為采樣步長;為圖像位置;表示求二范數(shù)。
將運動圖像和濾波器進行卷積操作,可以產生不同尺度和不同的濾波結果,圖像特征可以描述為:
(2)
運動圖像經過Gabor處理后,每個像素點產生40個幅值,它們組成一個向量,即運動圖像的紋理特征向量。
提取運動圖像的顏色、紋理特征后,為運動圖像自動分類提供了基礎,然而運動圖像特征數(shù)量大,而且具有一定的冗余信息,因此選擇粒子群算法對運動圖像進行選擇。
2.2 粒子群優(yōu)化算法的特征選擇
粒子群優(yōu)化算法是模擬鳥群覓食的智能優(yōu)化算法,每個粒子空間中不斷調整位置,移動方式如圖2所示。
粒子飛行過程中,利用下式估計下次飛行的向量值:
(3)
(4)
式中:為粒子;為的速度;為的當前最優(yōu)解;為粒子種群的最優(yōu)解;為隨機數(shù);為加權系數(shù)。
通過粒子群算法對運動圖像特征進行搜索和選擇,找到最優(yōu)的運動圖像特征,減少分類器的特征向量維數(shù)。
2.3 神經網絡的圖像分類器
BP神經網絡是一種誤差反向傳播的神經網絡,函數(shù)逼近能力非常強大,基本結構如圖3所示。
BP神經網絡的運動圖像分類步驟如下:
(1) 采集運動圖像樣本數(shù)據(jù),并進行相應的預處理,如去噪等。
(2) 顏色特征和紋理特征的量綱和類型不同,為了避免量綱對運動圖像的干擾,具體進行如下操作:
(5)
(3) 將運動圖像特征選擇轉化為一個優(yōu)化問題,并建立相應的數(shù)學模型,采用粒子群算法求解該數(shù)學模型的解,即運動圖像特征的最佳子特征。
(4) 根據(jù)最佳子特征確定BP神經網絡的結構,通過BP神經網絡訓練,建立運動圖像分類器,對運動圖像進行分類并輸出分類結果。
3 運動圖像分類實驗及結果分析
為了分析粒子群算法選擇特征的運動圖像分類性能,選擇網球、足球、排球、乒乓球、羽毛球共5類運動圖像,它們的樣本數(shù)如表2所示。
選擇PCA選擇特征、原始特征、遺傳算法選擇特征(GA)的圖像分類方法進行對比實驗,以選擇分類正確率(%)、平均訓練時間(s)進行評價。運動圖像的分類正確率和訓練時間如圖4,圖5所示。
對圖4,圖5的運動圖像分類結果進行分析,可知:
(1) 在所有方法中,原始特征的運動圖像分類方法的分類效果最差,這是因為顏色和紋理特征簡單組合在一起,特征的維數(shù)相當高,分類器的結構復雜,訓練時間增加,而且特征之間有一定的相關性,使得特征對圖像分類結果產生干擾,運動圖像分類的誤分率增加,運動圖像的分類速度慢,無法滿足運動圖像管理的實際應用要求。
(2) 相對PCA方法,基于PSO算法的運動圖像分類正確率得到提高,這是因為PSO算法對圖像特征進行搜索和選擇,可以獲得更優(yōu)的運動圖像特征,而PCA只能選擇運動圖像的線性特征,會丟失對運動圖像分類結果十分重要的非線性特征,構建的運動圖像分類器效果不太理想,雖然圖像分類的速度得到了改善,但實際應用價值低。
(3) 相對于GA的運動圖像分類方法,PSO算法的運動圖像分類結果的誤分率減少,得到了更高的運動圖像分類正確率,這是因為PSO算法的搜索能力要強于GA,得到了更優(yōu)的特征,可以更加有效地描述圖像內容信息,建立了整體更優(yōu)的圖像分類器,而且圖像分類的訓練時間更少,提高了圖像分類效率。
4 結 語
圖像分類廣泛應用于圖像管理中,對圖像進行準確分類,可以提高圖像管理效率,獲得更優(yōu)的實際應用價值。為了解決當前圖像分類方法的局限性,本文提出粒子群優(yōu)化算法選擇特征的運動圖像分類方法,該方法不僅獲得了更高的正確率,同時加快了運動圖像的分類速度,更好地滿足了運動圖像的實際應用需要。
參考文獻
[1] LU D, WENG Q. A survey of image classification methods and techniques for improving classification performance [J]. International journal of remote sensing, 2007, 28(5): 823?870.
[2] CHEN Y X, WANG J Z. Image categorization by learning and reasoning with regions [J]. Journal of machine learning research, 2004, 5(8): 913?939.endprint
[3] ZHAO G, PIETIKAINEN M. Dynamic texture recognition using local binary patterns with an application to facial expressions [J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 27(6): 915?928.
[4] ZHANG B C, GAO Y S, ZHAO S Q, et al. Local derivative pattern versus local binary pattern: face recognition with high?order local pattern descriptor [J]. IEEE transactions on image processing, 2010, 19(2): 533?544
[5] JIANG Shuhong, CHEN Bingfa. Method of image retrieval based on integrating low level feature with relevance feedback [J]. Machine building and automation, 2009, 38(3): 51?53.
[6] 戴修斌,張輝,舒華忠,等.基于正交矩模糊和仿射混合不變量的圖像識別算法[J].東南大學學報(自然科學版),2011,41(1):52?57.
[7] 張剛,馬宗民.一種采用Gabor小波的紋理特征提取方法[J].中國圖象圖形學報,2010,15(2):247?254.
[8] 祝軍,趙杰煜,董振宇.融合顯著信息的層次特征學習圖像分類[J].計算機研究與發(fā)展,2014,51(9):1919?1928.
[9] 倪鵬,黃蔚,呂巍,等.基于Zernike矩特征的FCM?RBF神經網絡圖像分類器[J].吉林大學學報(理學版),2014,52(6):1284?1288.
[10] 謝文蘭,石躍祥,肖平.應用BP神經網絡對自然圖像分類[J].計算機工程與應用,2010,46(2):163?166.
[11] 付巖,王耀威,王偉強,等.SVM用于基于內容的自然圖像分類和檢索[J].計算機學報,2003,26(10):1261?1265.
[12] 朱飛,王興起.基于SIFT 算法的體育類圖像分類與應用研究[J].計算機應用與軟件,2011,28(10):231?234.endprint