姬曉飛,秦寧麗,劉洋
(1.沈陽航空航天大學 自動化學院,遼寧 沈陽 110136; 2.北京國電通網(wǎng)絡技術有限公司,北京 100070)
?
多特征的光學遙感圖像多目標識別算法
姬曉飛1,秦寧麗2,劉洋1
(1.沈陽航空航天大學 自動化學院,遼寧 沈陽 110136; 2.北京國電通網(wǎng)絡技術有限公司,北京 100070)
基于單一特征的光學遙感圖像多目標分類識別存在準確性較差的問題,提出一種新的基于多特征決策級融合的多目標分類識別算法。首先對光學遙感圖像目標提取3種能夠同時滿足平移、旋轉和尺度不變性的特征:可以描述局部和全局分布特性的分層BoF-SIFT特征,描述目標邊緣輪廓點信息的改進后的SC形狀特征,對圖像中較大目標識別較好的Hu不變矩特征;其次采用基于徑向基核函數(shù)的一對一支持向量機算法分別獲得3種特征的目標識別概率,并設計了一種多特征決策級加權融合的策略實現(xiàn)對多目標的分類。經多次實驗驗證該算法對光學遙感圖像多目標具有較好的分類識別性能,達到了93.52%的正確識別率。
光學遙感圖像;多特征的決策級融合;分層的BoF-SIFT特征;SC形狀特征;Hu不變矩特征;支持向量機
隨著遙感技術和模式識別技術的不斷發(fā)展,遙感圖像目標分類識別,尤其是光學遙感圖像中的目標分類識別,已經成為了遙感圖像處理和分析領域備受關注的重要方向[1]。
光學遙感圖像目標識別算法的準確性很大程度上取決于所提取特征的適應性。文獻[2]提出了基于自組織特征映射(self-organizing feature map,SOFM)網(wǎng)絡模型的紋理分類算法,該算法僅對飛機目標得到了較好的識別效果;文獻[3]提出了一種能同時檢測多個半徑不一的圓形目標的Hough改進算法;文獻[4]采用模板匹配方法對提取了邊緣特征的目標進行粗檢測,然后利用形狀模型完成細匹配進行飛機的識別,這一過程中采用PCA(principal component analysis)降維方法增強樣本空間的可描述性,但耗時較長,通用性不強。以上研究表明:單一特征的識別性能有限,將單一特征應用在多類目標分類識別上容易造成某一類目標的顯著特征丟失而降低識別的準確性。因此多特征融合是提高多目標分類識別性能的一個有效方案。
在多特征融合領域包含特征級和決策級融合2個方面,特征級融合保留了目標的有效信息且分類精度較高,但該類方法不宜實現(xiàn)多種異構特征的融合;決策級融合整體上降低了誤判率,計算復雜度低且易于實現(xiàn)異構特征的融合。文獻[5]對高分辨率遙感圖像多個場景分別提取圖像的視覺詞袋局部特征、顏色直方圖特征以及Gabor紋理特征,并對SVM(support vector machine)分類結果進行自適應加權綜合獲得了較高的識別率。該算法在決策級融合過程中較合理地解決了不同目標的顯著特征差異性問題,但所選擇的數(shù)據(jù)庫存在一定的偶然因素;文獻[6]采用多核學習的決策級融合算法實現(xiàn)對飛機、油罐和艦船的分類。該方法融合了目標的形狀核、點核以及外觀核,得到了較理想的識別結果,然而耗時較長,分析其所用數(shù)據(jù)庫可知目標的旋轉差異性小,特征適應性不強。盡管多特征決策級融合在解決分類問題上表現(xiàn)出了一定的優(yōu)勢,但計算復雜度較高是該類方法發(fā)展的最大瓶頸。
綜上所述,本文提出了一種新的多特征決策級融合的多類目標識別算法,在特征提取階段提出了一種對目標的全局和局部特性描述充分的分層的BoF-SIFT(bag of feature-scale invariant feature transform)特征,并對傳統(tǒng)的形狀SC(shape context)特征做了多方面的改進使其具有較強旋轉適應性,在分類識別階段設計了多特征決策級融合策略,該融合方法易于實現(xiàn),最終取得令人滿意的識別結果。
本文算法的整體框架如圖1所示。
算法大致分為4個步驟。
1)特征提?。簩⒐鈱W遙感圖像中的4類目標分為訓練集和測試集,分別提取分層的BoF-SIFT特征、改進的SC特征和Hu不變矩特征,以上選取的3種特征共性是都能滿足目標的平移、縮放和旋轉不變性;
圖1 算法的整體框架
2)分類器的訓練:利用3種特征,采用交叉驗證的方法訓練基于徑向基核函數(shù)的一對一支持向量機,得到多個一對一的支持向量機分類器;
3)根據(jù)所設計的決策級概率融合策略,確定最優(yōu)的概率融合權值;
4)將測試集特征分別送入已訓練好的相對應的支持向量機分類器得到單一特征的輸出概率,在最優(yōu)權值組合的基礎上得到決策級融合結果。
特征提取是目標分類識別中至關重要的一步,本文選取了能夠適應光學遙感圖像平移、縮放和旋轉差異性的分層的BoF-SIFT特征、改進的SC特征和Hu不變矩特征。
2.1 分層的BoF-SIFT特征
鑒于遙感圖像目標在尺度、縮放和旋轉等方面均具有較大的差異性,且在外界環(huán)境中受到光照強度、背景復雜及陰影的干擾,對目標的準確分類識別帶來了極大的難度。由于SIFT(scale invariant feature transform)特征在多種特征描述算子中擁有較優(yōu)的魯棒性,廣泛應用在各個領域,因此本文在傳統(tǒng)的SIFT特征基礎上提出了一種分層的BoF-SIFT特征對遙感圖像進行表示。
首先針對每個目標所能檢測到的特征點數(shù)量和位置不同,導致SIFT特征維數(shù)不唯一的問題,本文采用固定目標的特征點數(shù)及位置的方法給予處理;其次BoF思想能直觀地表示目標的特征,既能體現(xiàn)同一目標的相似度,又能體現(xiàn)不同目標的差異性;圖像金字塔思想能更細致地表示目標特征的分布特性,以上3點結合就得到了分層的BoF-SIFT特征表示。
生成分層的BoF-SIFT特征的過程如圖2所示。
1)生成SIFT描述子:樣本總數(shù)為m,目標的像素大小為100×100,為了能充分表示目標的局部特征及統(tǒng)一特征維數(shù),除去邊緣2個像素的邊緣效應將剩余區(qū)域均勻劃分為11×11=121個特征點,每兩個特征點相隔8個像素,然后以特征點為中心的16×16鄰域窗口采樣,之后將其劃分為4×4的子區(qū)域,對16個子區(qū)域進行平滑處理,在每個子區(qū)域內提取8個方向的幅值和梯度信息,即每個特征點的SIFT描述子由4×4×8=128維的特征進行表示,最終得到所有樣本中m×121個特征點的SIFT描述子;
2)生成BoF-SIFT[7]特征:將所有樣本中提取的m×121個特征點的SIFT描述進行K-means++聚類[8],該聚類方法彌補了傳統(tǒng)的K-means聚類種子點隨機選取的不足,圖3和圖4分別為不同目標的BoF-SIFT描述子和同一目標在不同旋轉角度下的BoF-SIFT特征表示,顯然不同目標之間呈現(xiàn)了一定的差異性及同一目標之間具有一定的相似性,表明BoF-SIFT具有較好的旋轉魯棒性;
圖2 分層的BoF-SIFT特征提取算法示意圖
圖3 不同目標的BoF-SIFT描述子
圖4 同一目標的在不同旋轉角度下的BoF-SIFT特征表示
3)構造圖像金字塔[9]:將樣本分成3層,第3層為整個樣本,第2層劃分為2×2個子塊,第3層劃分為4×4個子塊,共有21個子塊;
4)生成分層的BoF-SIFT特征:將金字塔中21個子塊的特征分別向K個聚類中心投影,得到21個K維特征向量直方圖。
2.2 改進的SC特征
SC特征[10]又稱為形狀上下文,它是一種直觀的特征表示,描述了所提取特征點到所有特征點的矢量關系。對于具有目標大小和角度差異性的遙感圖像,SC特征是不能很好地完成分類識別的本文在傳統(tǒng)SC特征算法基礎上做了以下4點改進:
1)本文僅對采樣點的中心生成描述符,這樣能夠很好地去除大量冗余信息,也能節(jié)省運行時間;
2)對半徑均勻劃分,減弱傳統(tǒng)對數(shù)極坐標半徑的不均勻劃分對采樣點的密集度帶來的影響;
3)統(tǒng)計所有采樣點到中心點的距離,自動從中選取最大的距離為極坐標的最大圓環(huán)半徑,克服了SC特征不具有縮放不變性的不足;
4) 通過采樣點到中心的距離找到目標的對稱軸,并統(tǒng)一將其旋轉到豎直方向,這一改進使提出的SC特征具備了旋轉適應性。圖5為改進的SC特征與傳統(tǒng)的SC特征表示對比。從圖5分析表明對原圖預處理后提取改進的SC特征,信息分布克服了大量冗余信息的存在,縮短了運行時間,對于光學遙感圖像的目標識別具備了較好的平移、旋轉和縮放不變性。
圖5 改進前后的SC特征對比
2.3 Hu不變矩特征
Hu不變矩[11]是通過計算圖像的低階(二階和三階)歸一化中心矩進行非線性組合得到7個量值,該特征滿足平移、縮放和旋轉不變性、計算速度快、對圖像中較大目標識別較好。表1為本文4類遙感圖像提取的Hu不變矩特征部分特征值表示。
本文算法選取的3個特征在具有平移、縮放和旋轉不變性這一共同的性質下利用各自的優(yōu)勢彌補了互相的不足,分層的BoF-SIFT特征相比后2種對圖像背景的適應性強,不依賴于圖像的預處理,并且對細節(jié)分布描述充分,改進之后的SC特征對形狀的描述體現(xiàn)了一定的優(yōu)勢,Hu不變矩特征提取簡單且快速。
表1 Hu不變矩特征部分表示
支持向量機(support vector machine, SVM)[12]在解決小樣本、非線性及高維模式識別中表現(xiàn)出了許多特有的優(yōu)勢,具有通用性、魯棒性、有效性、計算簡單和理論完善等優(yōu)點。
3.1 多類支持向量機分類算法
支持向量機本身是個兩類問題的判別方法,本文采用最常用的一對一分類法[13],該方法是在每兩類間訓練一個分類器,即將訓練集(k個不同類別)構造為P=k(k-1)/2個分類器,分別對每一個組合采用求解兩類問題的SVM進行分類,最終求得P個判別函數(shù),當對測試集中的未知樣本進行分類時,每個分類器都會根據(jù)判別函數(shù)對其類別進行判斷,并為相應的類別投上一票,最后得票最多的類別即作為該未知樣本的類別,當兩個類別具有同樣多的票數(shù)時則選擇類別標簽較小的一類作為樣本的類別,這種策略稱為“投票法”。
圖6 一對一分類法結構示意圖
圖6為4類樣本情況下一對一分類法的結構示意圖,4類樣本可以構造6個分類器,同時獲得6個判別函數(shù),當對未知樣本測試時,每一個判別函數(shù)會給出一個結果,將6個結果投票,投票最多的即為該未知樣本的測試類別。
3.2 決策級融合
由于本文所提取的3種特征的維數(shù)相差較大,不利于在特征級進行融合。為了解決異構特征的融合問題,提出了一種新的多特征決策級融合策略(本文數(shù)據(jù)庫中含有4類樣本),該策略通過對訓練集樣本的分類準確率交叉驗證可以訓練得到每種特征對應的6個基于徑向基核函數(shù)的一對一SVM分類器。 通過上述的投票法可以分別獲得3種特征對于訓練樣本的目標識別概率。以一定步長遍歷所有可能選擇的權值,使訓練樣本的識別準確率最高來確定最優(yōu)融合權值。該識別方法實現(xiàn)簡單,識別率較單一特征有了較大的提高,達到了預期效果。其中決策級融合及最優(yōu)權值確定過程如圖7所示。
其中i=1,2,3,4表示4類目標,每一類目標含有k個樣本;j=1,2,3表示3種特征,決策級融合及最優(yōu)權值的確定由以下3步實現(xiàn):
1)對所有訓練樣本分別計算3種特征對應的Pij、Pij表示每一個樣本提取第j個特征后屬于第i類目標的概率;
重復2)、3),遍歷所有可能的αj組合,得到對應不同權值時的訓練樣本的總識別率。選取訓練樣本識別率最高時的權值組合作為最優(yōu)權值,用于對測試樣本的最終加權融合識別。
圖7 決策級融合實現(xiàn)過程
本文在自行建立的遙感圖像庫對提出算法進行了測試。數(shù)據(jù)庫包含艦船、飛機、汽車和油罐,數(shù)據(jù)庫總共包含74×4幅圖像,部分圖例如圖8所示。
圖8 數(shù)據(jù)庫的部分目標樣本圖像
4.1 最優(yōu)參數(shù)下的特征測試結果
多次實驗表明特征提取時的最優(yōu)參數(shù)為:訓練樣本數(shù)為47×4=188幅圖像,測試樣本數(shù)為27×4=108幅圖像。提取分層的BoF-SIFT特征時聚類中心數(shù)為20類,圖像金字塔層數(shù)為3層;提取改進的SC特征時將對數(shù)極坐標劃分為5個不同半徑,12個不同角度即5×12=60個小區(qū)域,采樣點數(shù)為50個點。3種特征對應的識別結果如表2所示。
表2 識別結果
表2表明分層的BoF-SIFT特征性能遠遠好于其余2種特征,原因在于后面2種特征不能很好地處理復雜背景,預處理的好壞對結果的影響很大,由于特征維數(shù)依次減少運行速度相應提高。
4.2 多特征決策級融合結果
最優(yōu)權值的選取及測試集實驗結果如圖9所示。圖9實線表示訓練集不同權值組合下的分類準確率,觀察可知在最后10個權值組合下分類準確率達到了100%,是在分層的BoF-SIFT特征比例遠大于其余兩種特征比例的情況下取得的,圖9虛線為測試集樣本在決策級融合得出的10個權值組合下的識別結果,總體均高于單特征的識別結果,在第10組權值組合即5:4:1下,測試集的分類準確率達到了93.52%,其中分層的BoF-SIFT特征對目標的分布信息描述詳細,因此比例最大;改進的SC特征對目標的形狀信息表示充分,因此比例次之;Hu不變矩描述目標的7維矩特征相比之下對決策級融合起到了輔助作用,因此比例最小。綜上所述93.52%的識別率達到了預期效果,而且每一個測試樣本的識別時間為0.005 432s,在時間上體現(xiàn)了一定的優(yōu)越性,驗證了本文所提算法的高效性和有效性。
圖9 不同權值組合下的分類準確率
圖10為最優(yōu)權值組合5:4:1下的決策級融合識別結果。
圖10 5:4:1組合下的縱向決策級融合結果
圖10中混淆矩陣中的數(shù)字表示該位置縱向目標被識別為橫向目標的概率,且每個概率通過不同程度的漸變灰色形象地表示在混淆矩陣中。圖10的多特征決策級融合結果表明汽車和油罐的識別結果較艦船和飛機好,艦船和飛機都和汽車容易混淆,原因可能是艦船的形狀與汽車相似度高,飛機背景在4類目標中相對復雜,由于陰影的干擾導致錯誤識別為汽車。
本文提出了一種基于多特征決策級融合的光學遙感圖像多目標識別算法,特征提取中選取了各有優(yōu)缺點的分層的BoF-SIFT特征、改進的SC特征和Hu不變矩特征,然后采用一對一支持向量機算法在最優(yōu)參數(shù)下對每一種特征進行識別,最后提出一種決策級融合策略,實驗表明決策級融合算法實現(xiàn)簡單,結果優(yōu)于單特征識別結果。下一步的工作將考慮針對不同特征的特點選擇不同類型的分類器進行識別,并嘗試研究不同類型分類器決策級融合的策略來進一步提高識別的準確性。
[1]姬曉飛,秦寧麗. 基于光學遙感圖像的目標檢測與分類識別方法[J]. 沈陽航空航天大學學報, 2015, 32(1): 23-31. JI Xiaofei, QIN Ningli. Target detection and classified recognition method based on optical remote sensing image[J]. Journal of Shenyang aerospace university, 2015, 32(1): 23-31.
[2]楊斌, 趙紅漫, 趙宗濤, 等. 一個改進的遙感圖像目標紋理分類識別算法[J]. 微電子學與計算機, 2004, 21(9): 111-113. YANG Bin, ZHAO Hongman, ZHAO Zongtao, et al. A removed texture classification and distinction algorithm of remoted sensing martial object[J]. Microelectronics & computer, 2004, 21(9): 111-113.
[3]CHEN Zhong, LIU Jianguo, WANG Guoyou. A new circle targets extraction method from high resolution remote sensing imagery[C]//Proceedings of the 2011 Fourth International Workshop on Advanced Computational Intelligence. Wuhan, 2011: 529-533.
[4]LIU Ge, SUN Xian, FU Kun, et al. Aircraft recognition in high-resolution satellite images using coarse-to-fine shape prior[J]. IEEE geoscience and remote sensing letters, 2013, 10(3): 573-577.
[5]劉帥, 李士進, 馮鈞. 多特征融合的遙感圖像分類[J]. 數(shù)據(jù)采集與處理, 2014, 29(1): 108-115. LIU Shuai, LI Shijin, FENG Jun. Remote sensing image classification based on adaptive fusion of multiple features[J]. Journal of data acquisition and processing, 2014, 29(1): 108-115.
[6]LI Xiangjuan, SUN Xian, SUN Hao, et al. Generalized multiple kernel framework for multiclass geospatial objects detection in high-resolution remote sensing images[J]. Optical engineering, 2012, 51(1):1-10.
[7]SHARMA G, CHAUDHURY S, SRIVASTAVA J B. Bag-of-features kernel eigen spaces for classification[C]//Proceedings of the 19th International Conference on Pattern Recognition. Tampa, FL, 2008: 1-4.
[8]ARTHUR D, VASSILVITSKII S. K-means++: the advantages of careful seeding[C]//Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms. Philadelphia, PA, 2007: 1027-1035.
[9]LAZEBNIK S, SCHMID C, PONCE J. Beyond bags of features: spatial pyramid matching for recognizing natural scene categories[C]//Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. New York, NY, USA, 2006: 2169-2178.
[10]BELONGIE S, MALIK J, PUZICHA J. Matching shapes[C]//Proceedings of the Eighth International Conference on Computer Vision. Vancouver, BC, 2001, 1: 454-461.
[11]張儒良, 席泓, 王林. 一種基于Hu不變矩的匹配演化算法[J]. 西南師范大學學報: 自然科學版, 2012, 37(5): 11-15.
ZHANG Ruliang, XI Hong, WANG Lin. An image matching evolutionary algorithm based on Hu invariant moments[J]. Journal of southwest China normal university: natural science edition, 2012, 37(5): 11-15.
[12]HUANG Qirui, WU Guangmin, CHEN Jianming, et al. Automated remote sensing image classification method based on FCM and SVM[C]//Proceedings of the 2012 2nd International Conference on Remote Sensing, Environment and Transportation Engineering. Nanjing, 2012: 1-4.
[13]薛寧靜. 多類支持向量機分類器對比研究[J]. 計算機工程與設計, 2011, 32(5): 1792-1795. XUE Ningjing. Comparison of multi-class support vector machines[J]. Computer engineering and design, 2011, 32(5): 1792-1795.
姬曉飛,女,1978年生,副教授,博士,主要研究方向為視頻分析與處理、模式識別。承擔國家自然科學基金、教育部留學回國啟動基金等多項課題研究。發(fā)表學術論文40余篇,被SCI、EI檢索20余篇。參與編著英文專著1部。
秦寧麗,女,1991年生,碩士研究生,主要研究方向為遙感圖像處理與分析。發(fā)表學術論文1篇。
劉洋,1977年生,副教授,博士,主要研究方向為圖像處理、模式識別。
Research on multi-feature based multi-target recognition algorithm for optical remote sensing image
JI Xiaofei1, QIN Ningli2, LIU Yang1
(1.School of Automation, Shenyang Aerospace University, Shenyang 110136, China; 2.Beijing GuoDianTong Network Technology Co. Ltd, Beijing 100070, China)
A novel multi-feature decision level fusion recognition algorithm is proposed to solve the problem of poor levels of accuracy with single feature based multi-target classification of optical remote sensing images. Firstly, three kinds of features which can not only meet translation, rotation, and scale invariance are extracted. One is the hierarchical BoF-SIFT feature which can simultaneously describe local and global distributions. Another is the improved shape context feature which is used to describe the target edge contour point information. The other one is Hu moment invariants which gives better levels of recognition performance for large targets. Secondly, the recognition probabilities of these features are obtained using a one versus one support vector machine based on a radial basis function. Thirdly a strategy for multi-feature decision level fusion is designed. A large number of experiments show that the algorithm for multi-target classification of optical remote sensing images performs better with the recognition rate of targets reaching 93.52%.
optical remote sensing image; multi-features decision level fusion; hierarchical BoF-SIFT feature; shape context feature; Hu moment invariants; support vector machine
2015-11-10.
日期:2016-08-24.
國家自然科學基金項目(61103123);遼寧省高等學校優(yōu)秀人才支持計劃項目(LJQ214018);遼寧省自然科學基金項目(2015020101).
姬曉飛. E-mail:jixiaofei7804@126.com.
TP751.1
A
1673-4785(2016)05-0655-08
10.11992/tis.201511011
http://www.cnki.net/kcms/detail/23.1538.TP.20160824.0929.012.html
姬曉飛,秦寧麗,劉洋.多特征的光學遙感圖像多目標識別算法研究[J]. 智能系統(tǒng)學報, 2016, 11(5): 655-662.
英文引用格式:JI Xiaofei, QIN Ningli, LIU Yang.Research on multi-feature based multi-target recognition algorithm for optical remote sensing image[J]. CAAI transactions on intelligent systems, 2016,11(5):655-662.