孫彥花 梁懷翔
(1.山東省煤田地質(zhì)局物探測(cè)量隊(duì),山東 泰安271000;2.北京望神州科技有限公司,中國 北京100085)
遙感技術(shù)作為人類研究地球資源環(huán)境的一種技術(shù)手段,遙感圖像計(jì)算機(jī)分類是遙感技術(shù)應(yīng)用的重要組成部分[1]遙感數(shù)字圖像的處理就是將遙感圖像的模擬或數(shù)字形式的信息輸入計(jì)算機(jī)中,利用某種遙感圖像處理軟件,按照一定的數(shù)學(xué)模型,進(jìn)行變換、加工產(chǎn)生可為專業(yè)人員判讀的圖像或者資料[2]。20世紀(jì)70年代之后,圖像分類成為遙感領(lǐng)域研究的熱點(diǎn)問題,在諸多領(lǐng)域中應(yīng)用越來越廣泛,如測(cè)繪行業(yè)中地理國情監(jiān)測(cè),鐵路行業(yè)中用圖像分類進(jìn)行環(huán)境監(jiān)測(cè),水利部門用圖像分類技術(shù)監(jiān)測(cè)河道或者湖泊周圍的自然環(huán)境。近年來許多學(xué)者對(duì)圖像分類進(jìn)行了大量的研究和探索,并提出了多種方案。如Huang等人[3]通過獲取圖像顏色的空間相關(guān)性等信息,通過用分類樹來對(duì)圖像進(jìn)行分類。
目前常用的圖像分類方法是最大似然法,它是以貝葉斯的主觀理論為代表的,運(yùn)用最大似然法前提條件是圖像數(shù)據(jù)呈正態(tài)分布,而且主要存在的問題是反映不出對(duì)知識(shí)的不知道信息[4]。
采用傳統(tǒng)的分類方法,會(huì)出現(xiàn)很多錯(cuò)分,漏分的情況,且分類精度也比較低。在此種情況下,許多人找尋新的分類方法,支持向量機(jī)的分類方法應(yīng)運(yùn)而生。近些年來,支持向量機(jī)被應(yīng)用到了很多領(lǐng)域,支持向量機(jī)的研究已經(jīng)被越來越多的學(xué)者所重視,這種技術(shù)在人臉特征檢測(cè)、文字體識(shí)別、圖像處理以及其他領(lǐng)域都取得了大量的研究成果。圖像分類結(jié)果是將圖像空間劃分為若干個(gè)子區(qū)域,每個(gè)區(qū)域代表一類地物[5]。
圖1 最優(yōu)分類面示意圖Fig.1 Schematic diagram of optimal classification face
因?yàn)閒(x)是單調(diào)遞增函數(shù),h隨著△2的遞增而遞減。因此如果訓(xùn)練樣本數(shù)固定后,兩類訓(xùn)練樣本之間的分類間隔越大,則與之對(duì)應(yīng)的VC維就會(huì)越小。
分類超平面方程為wTx+b=0,如果線性可分,則樣本集(xi,yi),其中i=1,2,…,n,x∈Rd,y∈{-1,1},滿足:
最優(yōu)超平面問題在線性可分情況下,可以表示為下面的約束優(yōu)化問題,在條件的約束下,求下列函數(shù)的最小值
在前面介紹SVM算法的基礎(chǔ)上,本文采用了臺(tái)灣林志仁老師開發(fā)的一個(gè)基于C和C++的LIBSVM開源代碼,并在其上添加許多新的特性。本次設(shè)計(jì)利用SVM進(jìn)行圖像分類的流程是:添加數(shù)據(jù),新建訓(xùn)練樣本,圖像分類,分類后處理。本軟件設(shè)計(jì)程序主要包括以下幾個(gè)模塊:樣本采集模塊,樣本訓(xùn)練模塊,算法分類模塊,圖像顯示模塊。在設(shè)計(jì)時(shí)結(jié)合Windows系統(tǒng)下特有圖形設(shè)備接口,實(shí)現(xiàn)圖像顯示,分析功能,并可以將分類后的結(jié)果以一種直觀的形式呈現(xiàn)在用戶面前。
利用別的商業(yè)軟件對(duì)測(cè)區(qū)的遙感影像進(jìn)行預(yù)處理,如;幾何校正,影像鑲嵌,影像裁切等,然后將預(yù)處理后的數(shù)據(jù)加載到樣本采集模塊中。用戶可在此模塊中對(duì)此影像中設(shè)計(jì)不同的波段組合顯示,同時(shí)需要在此設(shè)計(jì)不同的訓(xùn)練樣本,并確定分類地物的類別。
支持向量機(jī)的基本思想如(圖1)所示。在圖中直線附近不同的圖形代表不同的訓(xùn)練樣本,H為把兩類訓(xùn)練樣本沒有錯(cuò)誤分開的分類面,H1和H2表示超平面,H1和H2之間的距離△被稱為分類間隔(margin)。
如果給定分類間隔△的值,可以確定相應(yīng)的分類超平面,當(dāng)分類面變化時(shí),分類間隔△也隨之發(fā)生變化。在分類間隔△存在下,超平面幾何的VC維h滿足下面關(guān)系:
本軟件設(shè)計(jì)的最核心,最復(fù)雜的本分就是算法模塊。該算法模塊需要先輸入待處理的文件,輸出的文件路徑,以及先前做的訓(xùn)練樣本文件。見圖2。
圖2 樣本算法模塊的界面Fig.2 Sample algorithm module interface
分類模塊實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類,在分類時(shí)需設(shè)置需要分類的影像,訓(xùn)練樣本以及輸出的文件。經(jīng)過分類后即可將影像分成多個(gè)類別。分類模塊如圖3所示。
圖3 樣本分類模塊的界面Fig.3 Sample classification module interface
在這次試驗(yàn)中,分別采用多項(xiàng)式核函數(shù)、線性核函數(shù)、徑向基核函數(shù),Sigmoid核函數(shù)對(duì)測(cè)區(qū)數(shù)據(jù)進(jìn)行分類。然后將分類后的數(shù)據(jù)利用分類誤差矩陣和Kappa系數(shù)來測(cè)試分類的精度,并與真實(shí)材料比對(duì)查看分類的精度。
此次選擇了一景空間分辨率為1.25米的Resurs DK1數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),影像成像時(shí)間為2009年11月。首先利用ERDAS軟件對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)處理操作,圖4是經(jīng)過ERDAS預(yù)處理之后,真彩色合成圖。
圖4 原圖像Fig.4 The original image
本次實(shí)驗(yàn)針對(duì)測(cè)試數(shù)據(jù)利用核函數(shù)的四種不同函數(shù)對(duì)圖像進(jìn)行分類,將測(cè)區(qū)數(shù)據(jù)分為房屋、主干道、植被,小路、草地,水池六類地物,下圖是利用SVM的不同核函數(shù)對(duì)影像進(jìn)行分類的效果圖。
圖5 四種核函數(shù)的分類結(jié)果比較Fig.5 Comparison of classification results of four kinds of kernel function
從上面幾幅圖用肉眼可以看出,對(duì)于SVM的四種核函數(shù)都可以實(shí)現(xiàn)對(duì)影像的正確分類,為了更好的區(qū)分各種不同核函數(shù)的分類效果,采用誤差矩陣和Kappa系數(shù)對(duì)四種分類效果進(jìn)行量化評(píng)價(jià),表1和表2是利用分類結(jié)果誤差(Error matrix of classification)矩陣和Kappa系數(shù)對(duì)以上各種分類效果精度評(píng)價(jià)。
表1 核函數(shù)為多項(xiàng)式的圖像分類評(píng)價(jià)Tab.1 Kernel function evaluation for polynomial image classification
表2 核函數(shù)為線性的圖像分類評(píng)價(jià)Tab.2 Kernel function evaluation for linear image classification
通過以上各個(gè)核函數(shù)的分類結(jié)果評(píng)價(jià)分析可以看出,徑向基核函數(shù)的分類精度略高于多項(xiàng)式核函數(shù)、線性核函數(shù)和Sigmoid核函數(shù)的分類精度。
表3 核函數(shù)為徑向基的圖像分類評(píng)價(jià)Tab.3 kernel function evaluation for radial basis mage classification
表4 核函數(shù)為Sigmoid的圖像分類評(píng)價(jià)Tab.4 kernel function evaluation for Sigmoid image classification
本次對(duì)SVM在遙感影像上的圖像分類做了深入的研究,并在此基礎(chǔ)上編制了圖像分類軟件。通過實(shí)驗(yàn)發(fā)現(xiàn),利用SVM對(duì)影像進(jìn)行分類,分類的精度比較高。
論文主要對(duì)SVM算法進(jìn)行了深入的研究,并將SVM算法應(yīng)用到圖像分類中并進(jìn)行編程實(shí)現(xiàn)。且對(duì)支持向量機(jī)在圖像分類中的若干問題作了研究,通過實(shí)驗(yàn)證明不同的核函數(shù)會(huì)產(chǎn)生不同的分類效果,針對(duì)傳統(tǒng)遙感圖像分類方法的缺點(diǎn),在分析SVM分類方法的基礎(chǔ)上,對(duì)SVM算法表達(dá)式的核函數(shù)進(jìn)行了分析,而且針對(duì)小樣本的學(xué)習(xí),構(gòu)建了基于支持向量機(jī)的圖像分類模型。根結(jié)實(shí)驗(yàn)結(jié)果通過分類效果圖以及混淆矩陣和Kappa系數(shù)表明了采用支持向量機(jī)算法建立的模型有很高的分類精度,與最小距離法和最大似然法相比,是一種更加有效的遙感圖像分類方法。
[1]孫家檳.遙感原理與方法[M].武漢:武漢大學(xué)出版社,2003.
[2]袁金國.遙感圖像數(shù)字處理[M].北京:中國環(huán)境科學(xué)出版社,2006.
[3]Vapnik V N.The Nature of Statistical Learning Theory[M].New York Spring-Verlag,1995.
[4]Richards A.Remote sensing digital image analysis:an introduction[M].2nd ed.Berlin:Springer-Verlag,1993.
[5]楊昕,湯國安,鄧鳳東,呂恒.ERDAS遙感數(shù)字圖像處理實(shí)驗(yàn)教程[M].北京:科學(xué)出版社,2009:113.