紀(jì) 凱,韓 棟
(1.安徽交通職業(yè)技術(shù)學(xué)院,安徽 合肥 230051;2.法國(guó)格勒諾布爾計(jì)算機(jī)實(shí)驗(yàn)室,伊澤爾省格勒諾布爾市 38000)
SVM支持向量機(jī)在遙感圖像中的應(yīng)用研究
紀(jì) 凱1,韓 棟2
(1.安徽交通職業(yè)技術(shù)學(xué)院,安徽 合肥 230051;2.法國(guó)格勒諾布爾計(jì)算機(jī)實(shí)驗(yàn)室,伊澤爾省格勒諾布爾市 38000)
遙感圖像分類是遙感圖像處理領(lǐng)域中的一個(gè)重要的研究方向,隨著傳感器質(zhì)量的不斷提高,越來越多高質(zhì)量的遙感圖像需要新的監(jiān)督分類方法進(jìn)行處理。常用的將svm二元分類器改進(jìn)成為多級(jí)分類器的方法有“一對(duì)一”(one against one,1-v-1)和“一對(duì)多”(one against all,1-v-all)。本文將使用這兩種方法進(jìn)行遙感圖像分類研究,進(jìn)行對(duì)比評(píng)價(jià)。結(jié)果發(fā)現(xiàn)在大多數(shù)情況下,第一種方法“一對(duì)一”在計(jì)算速度和分類精度方面要優(yōu)于第二種方法“一對(duì)多”。但是這種差別并不太顯著,具體選擇哪種方法也取決于實(shí)際情況。
圖像分類;傳感器;二元分類器
隨著衛(wèi)星技術(shù)的提高,大量遙感圖像可以實(shí)時(shí)實(shí)地獲取。90年代衛(wèi)星遙感在全球和區(qū)域尺度土地覆蓋研究與應(yīng)用方面取得了突破性進(jìn)展,土地利用覆蓋遙感研究的新方法不斷出現(xiàn)[1]。遙感數(shù)據(jù)在土地資源分析和應(yīng)用中的第一步是遙感圖像分類,在滿足一定精度的要求下,如何解決多類別圖像的識(shí)別是遙感圖像研究中的一個(gè)關(guān)鍵問題[2]。支持向量機(jī)(Support Vector Mqchine,SVM)作為一種新的高效學(xué)習(xí)方法,是近十幾年來發(fā)展起來的一種統(tǒng)計(jì)學(xué)習(xí)理論,反映了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,在遙感圖像分類領(lǐng)域應(yīng)用越廣。相比傳統(tǒng)的遙感圖像分類方法計(jì)算速度慢,分類精度低,SVM具有小樣本學(xué)習(xí),穩(wěn)定,準(zhǔn)確和高效等特點(diǎn),成為遙感圖像分類研究的熱點(diǎn)。本文結(jié)合實(shí)際例子,使用SVM進(jìn)行遙感圖像分類,并對(duì)結(jié)果對(duì)比評(píng)價(jià)。
1.1 支持向量機(jī)
機(jī)器學(xué)習(xí)是為了使期望風(fēng)險(xiǎn)最小,因?yàn)榭衫玫男畔⒅皇怯邢迾颖?,傳統(tǒng)學(xué)習(xí)方法中運(yùn)用了經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(ERM)準(zhǔn)則。而根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論的研究 ,不但經(jīng)驗(yàn)風(fēng)險(xiǎn)要最小,VC維也要盡量小,為了縮小置信范圍,實(shí)際風(fēng)險(xiǎn)才能取得較小。SVM正是根據(jù) SRM理論在線性可分的基礎(chǔ)上的最優(yōu)分類面發(fā)展出來的。
支持向量機(jī)的基本思想是對(duì)于一組數(shù)據(jù)樣本,如果其屬于一個(gè)或兩個(gè)類,通過一個(gè)盡可能寬的分界區(qū)間,發(fā)現(xiàn)一個(gè)可完美分離d維數(shù)據(jù)的超平面,且最大化這兩個(gè)類與超平面的距離。SVM把“內(nèi)核誘導(dǎo)特征空間”的概念引入,通過內(nèi)核函數(shù)把數(shù)據(jù)映射到一個(gè)可分離的高維空間。內(nèi)核函數(shù)通過樣品的相似性,提供了比給定類的描述符合本身更多的信息。
對(duì)于一個(gè)二元分類問題,給定一個(gè)大小為n的訓(xùn)練集T:
xi,yi分別是訓(xùn)練矢量和目標(biāo)值T中的第i個(gè)樣本,且i=1,...,N。則分類超平面的定義是:
(.)是從數(shù)據(jù)集d映射到更高維的Hilbert希爾伯特空間H,.,.是在H超平面的點(diǎn)積,決定函數(shù)f(x)是:
找到一個(gè)最佳超平面和兩個(gè)預(yù)定義的類之間的最大間隔是支持向量機(jī)的目標(biāo)。可轉(zhuǎn)化為求解下面的二次優(yōu)化問題來實(shí)現(xiàn):
定義一個(gè)映射z= (x)的變換將d維輸入向量x映射到一般較高的d維向量z。選擇一個(gè) (),則新的訓(xùn)練數(shù)據(jù){ (xi),yi}是一個(gè)可分的超平面是其目標(biāo)。注意 (xi)是和其他 (xj)的點(diǎn)積。即公式(內(nèi)核)如果知道,則用在高維特征空間中的點(diǎn)積:
可不需直接處理映射z= (xi)。
1.2 核函數(shù)
核函數(shù)的選擇是構(gòu)造出一個(gè)具有良好性能的SVM的關(guān)鍵。核函數(shù)類型的選擇與類型確定后相關(guān)參數(shù)的選擇是核函數(shù)的選擇的兩個(gè)工作。依據(jù)泛函的相關(guān)理論,如果有一種函數(shù)K(xi,xj)滿足默瑟條件(正定的特征值),其就對(duì)應(yīng)某一變換空間的內(nèi)積。對(duì)于判斷哪些函數(shù)是核函數(shù)到目前為止也取得了重要的突破,得到默瑟條件和以下常用的核函數(shù)類型:
(1)線性核函數(shù):
(2)多項(xiàng)式核
(3)徑向基函數(shù),也被稱為高斯核函數(shù)是最流行的內(nèi)核,即:
(4)傅里葉核
(5)樣條核
(6)Sigmoid核函數(shù)
如何選取核函數(shù)解決實(shí)際問題,一般是利用專家的先驗(yàn)知識(shí)預(yù)先選定核函數(shù)或是采用Cross-Validation方法,即在選取核函數(shù)時(shí),通過試用不同的核函數(shù),最好的核函數(shù)是歸納誤差最小的核函數(shù)。
1.3 SVM多類分類器
如前所述,SVM分類本質(zhì)上是一個(gè)適用于兩種類別的兩類分類技術(shù),因此必須加以修改以適用于處理多類信息,比如遙感圖像多種地物分類。SVM多級(jí)分類器實(shí)現(xiàn)的基本思想是將多級(jí)分類問題簡(jiǎn)化為兩類分類問題,這樣就可以使用SVM方法。通常有兩種方法實(shí)現(xiàn):一種是one agaist one(1-v-1),該方法代表了最早和最常見的SVM方法,即通過一系列兩類SVM分類器的構(gòu)造,把每個(gè)分類器識(shí)別兩個(gè)類別,再把結(jié)果以某種方式的組合實(shí)現(xiàn)多級(jí)分類。比如在一幅遙感圖像上,感興趣的類別有水,植被和建筑物,首先用SVM分類為水體區(qū)和非水體區(qū)(植被和建筑物)或植被區(qū)和非植被區(qū)(水和建筑物),然后在非水體區(qū)或非植被區(qū)再次使用SVM進(jìn)行分類。另外一種方法是one agaist all(1-v-all),即合并多個(gè)分類面的參數(shù)求解到一個(gè)最優(yōu)化問題中,求解該最優(yōu)化問題一次性實(shí)現(xiàn)多級(jí)分類。第二種方法雖然貌似可以一次性實(shí)現(xiàn)多級(jí)分類,但是求解最優(yōu)化問題的過程無論是復(fù)雜度還是計(jì)算時(shí)間都遠(yuǎn)遠(yuǎn)大于第一種1-v-1方法,而且計(jì)算量的加大也會(huì)影響分類精度。本文將分別使用以上兩種方法進(jìn)行衛(wèi)星圖像的土地覆蓋信息的提取分類,將這兩種技術(shù)的性能進(jìn)行比較和評(píng)價(jià)。
如圖1所示,研究區(qū)是2003年5月Quickbird衛(wèi)星獲取的位于芬蘭北部的一幅圖像,圖像中主要有四種地物,分別是樹,地面植被,道路和建筑物,使用Matlab 7中的SVM函數(shù)進(jìn)行處理,使用到的SVM核函數(shù)主要有線性核函數(shù),多項(xiàng)式核函數(shù),和徑向基核函數(shù)。分別使用1-v-1和1-v-all方法進(jìn)行分類比較,然后導(dǎo)入相關(guān)地理信息進(jìn)行分類精度評(píng)估,主要分類精度參數(shù)是未分類像素?cái)?shù),混合像元數(shù),最終精度評(píng)估和kappa系數(shù)。
圖1 研究區(qū)域
下面幾組圖是使用不同核函數(shù)的1-v-1分類器(一對(duì)一分類器)和1-v-all分類器(一對(duì)一分類器)對(duì)研究區(qū)圖像分類的結(jié)果。紅色的代表地表建筑物,深綠色代表樹木,淺綠色代表地表植被,灰色是地面道路,黑色是未分類像素,黃色是混合像素。左邊的圖2-1,圖3-1和圖4-1是使用1-v-1分類器,我們可以發(fā)現(xiàn)分類結(jié)果中幾乎沒有混合像素的情況,只有一些黑色的未分類像素。而右邊的圖2-2,圖3-2和圖4-2是使用1-v-all分類器的結(jié)果,顯而易見,分類結(jié)果除了有黑色的未分類像素,還有一些黃色的混合像素。
圖2-1:線性1-v-1分類
圖2-2:線性1-v-all分類
圖3-1:多項(xiàng)式1-v-1分類
圖3-2:多項(xiàng)式1-v-all分類
圖4-1:徑向基1-v-1分類
圖4-2:徑向基1-v-all分類
通過表1,可以明顯看出兩種SVM分類器分類方法結(jié)果對(duì)比,1-v-1分類器沒有混合像素,而1-v-all分類器不僅會(huì)出現(xiàn)未分類像素,還會(huì)出現(xiàn)混合像素,影響最后的分類精度。
表1 兩種SVM分類器分類方法比較
混合像素 0 95未分類像素 20 187多項(xiàng)式核函數(shù) 混合像素 0 64未分類像素 18 104徑向基核函數(shù) 混合像素 0 38
三種核函數(shù)的分類結(jié)果可以通過 95%的置信區(qū)間的一致性kappa系數(shù)進(jìn)行對(duì)比分析,表2給出了比較結(jié)果。
表2 兩種SVM分類器分類方法kappa系數(shù)
從表2可以看出,使用線性核函數(shù)和徑向基核函數(shù)的時(shí)候,v1-v-1分類器分類精度優(yōu)于1-v-all分類器線分類精度,但是總體結(jié)果來說差異不顯著。在使用多項(xiàng)式核函數(shù)的時(shí)候,兩種SVM分類器分類結(jié)果沒有區(qū)別。由此可以看出,總體來說,1-v-1分類器的結(jié)果要優(yōu)于1-v-all分類器,但是具體選擇那種核函數(shù),要根據(jù)實(shí)際情況具體分析。
[1]Kramer J.H.,2002.Observation of the earth and its environment:Survey of missions and sensors (4th Edition).(Berlin:Springer).
[2]賈永紅,張春森,王愛平.基于 BP 神經(jīng)網(wǎng)絡(luò)的多源遙感影像分類[J].西安科技學(xué)院學(xué)報(bào),2001,21(1):58-60.
A Study of Remote sensing image classification based on Support Vector Machine
JI Kai1,HAN Dong2
(1.Civil Engineering Department,Anhui Communications Vocational &Technical College ,Hefei Anhui 230051,China; 2 French Grenoble Computer laboratory,Grenoble Isere 38000,France)
Remote sensing image classification is an important research topic.More high-quality satellite images can be obtained with the improvement of sensor quality.Two of the common methods to enable this adaptation include the "one against one" (1-v-1)and "one against all" (1-v-all).This paper will use these two methods for satellite image classification.It is found that in most cases,the first method,"one against one" is better than the second method "one against all".But there are no much differences so the choice of technique adopted boils down to the actually conditions.
Image Classification; sensor ; Binary Classifier
P237
:A
10.3969/j.issn.1672-7304.2016.01.062
1672–7304(2016)01–0133–02
(責(zé)任編輯:廖建勇)
紀(jì)凱(1979-),男,安徽六安人,副教授,研究方向:工程測(cè)量和遙感數(shù)據(jù)處理。