范雪婷,史照良,劉 波
(1.江蘇省基礎地理信息中心,江蘇 南京 210013;2.江蘇省測繪地理信息局,江蘇 南京210013)
基于SVM的資源三號測繪衛(wèi)星影像多特征分類
范雪婷1,史照良2,劉 波1
(1.江蘇省基礎地理信息中心,江蘇 南京 210013;2.江蘇省測繪地理信息局,江蘇 南京210013)
針對傳統(tǒng)分類方法精度不高、感興趣目標分類不理想等缺陷,采用多特征組合的支持向量機影像分類方法,利用顏色矩、顏色集和灰度共生矩陣進行特征提取,總體精度、Kappa系數(shù)和混淆矩陣作為評價指標對單一特征、組合特征的不同分類結果進行分析。實驗結果表明,該方法有效地解決了單數(shù)據(jù)源分類不完整、精度低等問題,對高維輸入向量具有較高的推廣力。
支持向量機;多特征;資源三號;分類
遙感數(shù)字圖像計算機識別與分類是遙感圖像處理中的一個重要課題[1]。隨著遙感技術發(fā)展,遙感圖像數(shù)據(jù)日益增多,人工目視解譯方法已無法滿足遙感圖像的分類要求,計算機自動識別、分類提供了更加準確有效的分類結果[2]。2010年12月,李克強副總理作出“深入貫徹落實科學發(fā)展觀,加強基礎測繪和地理國情監(jiān)測”重要批示,加之我國第一顆自主的民用高分辨率立體測繪衛(wèi)星資源三號(ZY-3)發(fā)射成功[3],因此如何借助ZY-3測繪衛(wèi)星影像獲取地理國情監(jiān)測對象,盡可能減少多種干擾因素對其分類產(chǎn)生的負面影響,不斷提高分類的精度和智能化水平[4,5],是地理國情監(jiān)測遇到的技術難題,同時也是遙感影像識別與分類中一個重要課題。支持向量機(SVM)由Bosoer、Guyon和Vapnik等提出[6],作為一種最新的也是最有效的統(tǒng)計學習方法,已成為模式識別與機器學習領域一個新的研究熱點。SVM適用于解決小樣本、非線性、高維數(shù)據(jù)和局部極小等實際問題,因其學習效率高、穩(wěn)定和具有相對較高的精度而得到廣泛應用,較最小距離和最大似然等傳統(tǒng)經(jīng)典方法具有一定的優(yōu)勢,例如,基于SVM進行遙感影像分類[7],利用SVM提取空間特征進行遙感影像分類[8]。目前已提出的分類方法中,大多采用逐點分類方法且只利用單一特征。大量文獻指出,單一特征在某些應用中不如多特征組合提取的圖像信息完整,在特征提取上,不同算法得到的圖像信息具有一定的互補性,通過特征組合形成的分類器能獲得好的分類效果。因此,提出了基于SVM多特征組合的遙感影像分類方法。
1.1 顏色矩
顏色矩是一種非常簡單而有效的顏色特征,由Stricker和Orengo提出[9]。該方法利用線性代數(shù)中矩的概念,將圖像中的顏色分布用矩表示。由于顏色信息主要集中在低階矩中,因此僅采用一階矩(Mean)、二階矩(Variance)和三階矩(Skewness)就足以表達圖像的顏色分布。與顏色直方圖不同,利用顏色矩進行圖像描述無需量化圖像特征。顏色的3個低次矩的數(shù)學定義如下:
式中,Ei、σi和si分別表示圖像第i顏色通道一階矩、二階矩和三階矩;pij表示圖像第i顏色通道分量中第j 個像素的灰度值;N表示圖像總像素個數(shù)。
這樣,圖像就可以用顏色矩特征向量,一個9維直方圖向量來表征,即圖像的顏色矩可表示為{ER,σR,sR,EG,σG,sG,EB,σB,sB}。
1.2 顏色集
HSV顏色空間直接對應于人眼視覺特性3要素:色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(Value),比RGB空間更直觀,更符合人的視覺特性。
顏色直方圖計算簡單、快速,是較為常用的一種顏色特征,然而直接在顏色三維空間中進行計算,無論是計算時間還是存儲空間,成本都非常高。Smith和Chang提出用顏色集作為顏色直方圖的一種近似[10],首先將圖像RGB顏色空間轉化為HSV空間,在HSV空間中進行特征提取,由于人眼對H值較敏感,對S、V值的感知較弱,因此將HSV 3個分量按照人的顏色感知進行非等間隔的量化,將圖像量化為一個72階的直方圖。
按照人的視覺分辨能力,把色調(diào)H空間量化為8份,飽和度S和亮度V空間各量化為3份,具體非等間隔量化模型為:
依據(jù)量化級,將3個顏色分量轉化為一維特征矢量:
式中,Hij、Sij、Vij分別表示圖像像素點(i,j)的H、S、V值;G的取值范圍為0~71。
1.3 灰度共生矩陣
灰度共生矩陣反映圖像中任意兩點之間灰度的空間相關性,是一種有效的紋理描述方法,是分析圖像局部模式和排列規(guī)則的基礎[11]。1973年Haralick研究了圖像紋理中灰度級的空間依賴關系,提出灰度共生矩陣的紋理描述方法,其實質是從圖像中灰度為i的像素(其位置為(i,j))出發(fā),統(tǒng)計與其距離為d、灰度為j的像素(x+Δx,y+Δy)同時出現(xiàn)的次數(shù)p(x,i,d,θ),數(shù)學表達式為:
式(6)中,x, y=0,1,2,…,N-1表示圖像中的像素坐標;i, j=0,1,2,…,k-1表示灰度級;Δx,Δy表示位置偏移量;d為灰度共生矩陣步長;θ為生成方向,取0°、45°、90°、135° 四個方向,從而生成4個不同方向的灰度共生矩陣。實驗中d的取值為5,k的取值為16。
Haralick等人由灰度共生矩陣提取了14種特征,其中最常用的有角度方向二階矩ASM(angular second moment)、主對角線慣性矩CON(contrast)、逆差矩IDM(inverse different moment)、熵ENT(entropy)以及自相關COR(correlation)5種二階統(tǒng)計量,計算公式分別為:
式(11)中,
2.1 SVM理論基礎
SVM的原理是用分離超平面作為分離訓練數(shù)據(jù)的線性函數(shù),解決非線性分類問題。其最優(yōu)分類形式為尋找一個分類超平面,使兩類無錯誤地分開,且分類間隔最大。數(shù)學描述為:在條件約束下,求函數(shù)的極小值。
通過求對偶問題,將其歸結為一個二次函數(shù)極值問題,即在約束條件下,求解函數(shù)的最大值。
得到的最優(yōu)分類判別函數(shù)為:
式中,K(xi· xj)為核函數(shù),有線性核、多項式核、RBF核(Gaussian徑向基核)等多種形式。
2.2 SVM多類分類器
SVM是一個二分類器,如何將SVM應用于多分類問題,現(xiàn)主要有以下兩種方法:①一對多分類器,即對于n類問題,構造n個2類SVM分類器。將多個分類面的參數(shù)求解合并到一個最優(yōu)化問題中,通過一次求解該最優(yōu)化問題實現(xiàn)多類分類。②一對一分類器,即對于n類問題,構造n個2類SVM分類器。每個分類器只用于識別其中2個類別,并將它們的判別結果以投票方式組合起來,得票最多的類為樣本所屬的類。對于這兩種方法,第一種方法在求解最優(yōu)化問題過程中所需變量遠多于第二種,且訓練速度較慢,分類精度也比較差。本文采用一對一分類器進行影像分類。
2.3 SVM分類器參數(shù)選擇
不同形式的核函數(shù),生成不同形式的SVM,同時對應著不同的分類最優(yōu)超平面。Vapnik等人的研究表明,SVM的性能與所選用的核函數(shù)的類型關系不大,核函數(shù)的參數(shù)和誤差懲罰因子C是影響SVM性能的主要因素。RBF核在低維、高維、小樣本、大樣本等情況下均表現(xiàn)出較好的學習能力,因此這里選用RBF核作為本實驗的核函數(shù)。懲罰系數(shù)參數(shù)C和間隔γ的取值直接影響分類精度。本文采用一種基于交叉驗證的網(wǎng)格搜尋的方法來確定C和γ的值。
3.1 實驗數(shù)據(jù)
實驗數(shù)據(jù)采用2012-03-24安徽省滁州市的資源三號測繪衛(wèi)星影像,截取其中涵蓋地物類別較為全面且適中的1幅影像進行分析(圖1),其大小為824行×971列,分辨率為5.8 m。采用交叉比對算法確定SVM模型最佳參數(shù)為C=2、γ=0.5。
3.2 樣本選擇
圖1 原始影像圖
樣本選擇充分考慮了各類別的光譜、紋理特征、邊界特性及分布均勻性等原則,實驗中,樣本選擇類別及數(shù)量分別為:建筑物C1=33;植被C2=40;道路C3=73;水體C4=29,占實驗區(qū)數(shù)據(jù)樣本總量的7.3%。
3.3 實驗結果與分析
在Microsoft Windows7操作系統(tǒng)下,基于VS2008和LibSVM3.7集成開發(fā)環(huán)境編寫了算法實驗程序。實驗中用于訓練和測試的樣本數(shù)據(jù)集在輸入SVM 前,先進行歸一化處理,統(tǒng)一縮放到[-1, 1]之間,以避免大特征值淹沒小特征值對分類的貢獻;然后將歸一化處理的單一特征或組合多特征作為輸入數(shù)據(jù)進行學習和訓練,形成不同的SVM預測模型;再利用SVM 模型對測試樣本進行分類。分類結果精度評價,采用最常用的混淆矩陣,結合總體精度和Kappa系數(shù)指標進行評價。
為了驗證多特征組合的SVM遙感影像分類的有效性,分別從單一顏色矩特征、單一顏色集特征、單一GLCM特征、顏色矩和GLCM組合特征、顏色集和GLCM組合特征與顏色矩、顏色集和GLCM組合特征等方面進行實驗。相關實驗結果為:①表1列出了不同特征組合的SVM分類結果,從總體精度和Kappa系數(shù)可以直觀看出不同特征數(shù)組組合的分類結果;②圖 2給出了顏色矩、顏色集與GLCM特征組合的遙感影像分類結果;③為進一步說明各類別的分類精度,表2列出了顏色矩、顏色集與GLCM特征組合的SVM分類結果混淆矩陣。
表1 不同特征組合的遙感影像分類結果
表2 顏色矩、顏色集與GLCM組合特征分類結果混淆矩陣
綜合上述實驗結果分析如下:
1)基于SVM利用單一光譜、紋理特征進行分類,分類精度都達到了80%以上,顯示出SVM在小樣本分類中的優(yōu)越性。顏色和紋理特征組合描述更多的遙感圖像信息,分類準確率高于單一特征,分類精度基本在90%以上。
2)從圖像定性分析和精度結果表的定量分析來看,結合光譜和紋理的SVM分類方法對復雜、高維輸入向量具有更高的推廣能力。
3)對于單一地物,紋理特征在豐富紋理結構地物上具有顯著影響,如建筑區(qū)等;而光譜特征在亮度、顏色較為豐富的地物上表現(xiàn)出一定的優(yōu)勢。小范圍水域由于水面光譜差異大,且基本無紋理結構,準確分類較為困難。
圖2 顏色矩、顏色集與GLCM組合特征分類結果
通過光譜、紋理特征的提取,研究了基于單一特征和多種特征組合的SVM分類方法在資源三號測繪衛(wèi)星影像分類中的應用,并利用總體精度、Kappa系數(shù)和混淆矩陣比較了各種基于不同特征的SVM 算法的分類效果。從實驗結果的定性和定量分析,利用多特征組合的SVM分類方法較單一特征具有較高的分類精度,滿足資源三號測繪衛(wèi)星影像的地物分類調(diào)查要求,具有很高的實用和推廣價值。
[1] 梅安新, 彭望祿, 秦其明, 等.遙感導論[M].北京:高等教育出版社,2001
[2] 湯國安, 張友順, 劉詠梅,等.遙感數(shù)字圖像處理[M].北京:科學出版社,2004
[3] 唐新明, 張過, 祝小勇,等.資源三號測繪衛(wèi)星三線陣成像幾何模型構建與精度初步驗證[J].測繪學報,2012,41(2) : 191-198
[4] 蘇偉, 李京, 陳云浩,等.基于多尺度影像分割的面向對象城市土地覆被分類研究——以馬來西亞吉隆坡市城市中心區(qū)為例[J].遙感學報, 2007, 11(4):521-530
[5] 陳杰, 鄧敏, 肖鵬峰,等.基于分水嶺變換與空間聚類的高分辨率遙感影像面向對象分類[J].遙感技術與應, 2010, 25(5):597-603
[6] Vapnik V N. The Nature of Statistical Learning Theory[M].Beijing: Tsinghua University Press, 2000
[7] 胡自申, 張遷.基于SVM的遙感影像的分類[J].遙感信息, 2003(2): 14-18
[8] 駱劍承, 周成虎, 梁怡, 等.支撐向量機及其遙感影像空間特征提取和分類的應用研究[J].遙感學報, 2002,6(1):50-55
[9] Stricker M,Orengo M.Similarity of Color Images[A].Niblack W, Jain R C. Storage and Retrieval for Image and Video Databases Ⅲ[C].SPIE,1995
[10] Smith J R,Chang S F.Tools and Techniques for Color Image Retrieval[A]. Sethi I K, Jain R C. Storage and Retrieval for StillImage and Video DataBase Ⅳ[C]. SPIE,1996
[11] Tuceryan M, Jain A K. Texture Analysis, Handbook Pattern Recognition and Computer Vision[M]. Singapore: World Scientific, 1993
P237.4
B
1672-4623(2015)04-0023-04
10.3969/j.issn.1672-4623.2015.04.009
范雪婷,碩士,研究方向為地理國情監(jiān)測及InSAR。
2014-07-21。
項目來源:精密工程與工業(yè)測量國家測繪地理信息局重點實驗室開放基金資助項目(PF2012-9);江蘇省科技基礎設施建設計劃—科技公共服務平臺項目(BM2013066)。