呂京國
(1. 北京建筑大學(xué) 測繪與城市空間信息學(xué)院,北京 100044;2. 現(xiàn)代城市測繪國家測繪地理信息局重點(diǎn)實(shí)驗(yàn)室,北京 100044)
隨著遙感信息廣泛地應(yīng)用于農(nóng)業(yè)生產(chǎn)、災(zāi)害評估與資源探測等領(lǐng)域,分類技術(shù)也成為遙感影像信息分析中的重要研究方向。面向高分辨率影像信息的分類技術(shù)層出不窮,不僅體現(xiàn)在以最小距離分類為代表的監(jiān)督分類技術(shù),以ISODATA分類法為代表的非監(jiān)督分類技術(shù),還包括逐漸成熟的神經(jīng)網(wǎng)絡(luò)技術(shù),也在遙感領(lǐng)域中得到全面應(yīng)用。
遙感影像分類本身作為一種非線性問題的求解,滿足其解的方法在人工智能領(lǐng)域得到了驗(yàn)證。神經(jīng)網(wǎng)絡(luò)作為人工智能領(lǐng)域的一種從低維空間到高維空間映射的方法,它以一定的數(shù)學(xué)模型描述生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),以一定的算法模擬生物的行為,解決了傳統(tǒng)算法所面臨的智能信息處理問題。BP、RBF和Hopfield等神經(jīng)網(wǎng)絡(luò)應(yīng)用于遙感影像分類中,體現(xiàn)了神經(jīng)網(wǎng)絡(luò)分布式存儲、并行處理和自學(xué)習(xí)與自組織等功能。
針對特定的遙感影像,不同類型的神經(jīng)網(wǎng)絡(luò)分類器精度不同,而且同一個(gè)神經(jīng)網(wǎng)絡(luò)分類器對不同類別的分類精度也不同。一些神經(jīng)網(wǎng)絡(luò)分類器對一部分類別的分類精度高,而另一些神經(jīng)網(wǎng)絡(luò)分類器只對另一部分類別的分類精度高,從而不同的神經(jīng)網(wǎng)絡(luò)分類器之間可能有一定的互補(bǔ)性。因此,利用這種特性集成的神經(jīng)網(wǎng)絡(luò)便有可能提高遙感影像的分類精度。本文分別研究了BP、RBF和Hopfield神經(jīng)網(wǎng)絡(luò)的特性,構(gòu)造異構(gòu)網(wǎng)絡(luò)參與影像信息的分類,并以生成個(gè)體網(wǎng)絡(luò)的Bagging和Boosting算法作為集成方式,投票來決定最終的分類結(jié)果。
為了提供分類所需要的影像信息類型,影像分析以特征提取與特征選擇作為基礎(chǔ)。影像的灰度值代表地表信息的輻射值,高分辨率影像反映了更加精細(xì)的地表信息。應(yīng)用于地物分類的影像含有不同類型的地物,需要選擇一定的特征代表不同類型的地物,并以一定的方法將特征所對應(yīng)的空間劃分為不同的子空間,以使影像中代表各類地物的像元?dú)w為相對應(yīng)的子空間。
針對高分辨率影像結(jié)構(gòu)信息豐富的特點(diǎn),進(jìn)行遙感影像分類時(shí),既要考慮影像的灰度信息,也要顧及影像的結(jié)構(gòu)信息,應(yīng)選擇不同的特征反映以上要求。目前,常用的特征包含均值、方差、能量、對比度、熵、相關(guān)性和均質(zhì)度等[1]。采用光譜信息與結(jié)構(gòu)信息等多種特征相結(jié)合的方法,可以充分地利用影像灰度分布的信息,改善影像分類的效果。
遙感影像分類作為人工智能領(lǐng)域中模式識別的一種應(yīng)用方向,其問題的解決需要利用以人類思維方式為基礎(chǔ)的信息處理技術(shù)。而作為具有大規(guī)模并行處理、容錯(cuò)性自組織和自適應(yīng)能力等特點(diǎn)的人工神經(jīng)網(wǎng)絡(luò),已成為解決遙感影像分類問題的有力工具。
神經(jīng)網(wǎng)絡(luò)作為一種并行處理連接網(wǎng)絡(luò),以多個(gè)互聯(lián)的神經(jīng)元為基本處理單元,構(gòu)建了具備信息存儲與信息計(jì)算能力的數(shù)學(xué)模型,抽象地模擬人腦智能行為[2]。目前,應(yīng)用于遙感影像分類的神經(jīng)網(wǎng)絡(luò)模型有BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)和SOM自組織特征映射模型。BP網(wǎng)絡(luò)是一種多層前向型神經(jīng)網(wǎng)絡(luò),采用最小均方差的學(xué)習(xí)方式,其神經(jīng)元的傳遞是S型函數(shù),輸出量為0~1的連續(xù)量,權(quán)值的調(diào)整采用反向傳播算法,它可以實(shí)現(xiàn)從輸入到輸出的任意非線性映射[3]。RBF網(wǎng)絡(luò)也是一種三層前向型網(wǎng)絡(luò),采用多種學(xué)習(xí)方法,如最小正交二乘學(xué)習(xí)算法和K均值學(xué)習(xí)算法等,其神經(jīng)元的傳遞為高斯函數(shù),確定中心和寬度后,其輸出權(quán)值可經(jīng)解線性方程組得出,它可以實(shí)現(xiàn)學(xué)習(xí)速度的加快,以及可以避免局部極小值。Hopfield是一種由非線性元件構(gòu)成的全連接單層反饋系統(tǒng),輸入層接收數(shù)據(jù),網(wǎng)絡(luò)產(chǎn)生不斷的變化,輸出反饋到輸入從而產(chǎn)生新的輸出,達(dá)到一個(gè)能收斂的穩(wěn)定網(wǎng)絡(luò)[4]。以上3種網(wǎng)絡(luò)的神經(jīng)元模型分別如圖1(a)—圖1(c)所示。
圖1 3種神經(jīng)網(wǎng)絡(luò)的神經(jīng)元模型
為了使不同的神經(jīng)網(wǎng)絡(luò)應(yīng)用于遙感影像的分類,以達(dá)到提高分類精度的目的,因此考慮采用神經(jīng)網(wǎng)絡(luò)集成的方法。這種具有誤差互不相關(guān)的神經(jīng)網(wǎng)絡(luò)集成方法,一方面可以提高分類精度,另一方面也具有較強(qiáng)的泛化能力[5]。
面對遙感影像分類問題,將訓(xùn)練樣本操作的整個(gè)問題域劃分為子問題,每一個(gè)子問題采用Bagging或Boosting算法技術(shù)的集成實(shí)現(xiàn)。針對不同分類器所求解子問題域的輸出,則采用投票或決策融合的方式集成求解[6]。
在神經(jīng)網(wǎng)絡(luò)集成中,當(dāng)確定了構(gòu)成集成的個(gè)體神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和輸出合成的方法后,便需要應(yīng)用一定的個(gè)體網(wǎng)絡(luò)構(gòu)建方法訓(xùn)練多個(gè)神經(jīng)網(wǎng)絡(luò)。Bagging和Boosting算法為個(gè)體網(wǎng)絡(luò)生成中最重要的技術(shù)[7],Bagging算法思想是對訓(xùn)練集采用獨(dú)立、隨機(jī)和有放回地抽取訓(xùn)練樣本,為每一個(gè)基分類器都構(gòu)造出一個(gè)與訓(xùn)練集同樣大小但內(nèi)容不同的訓(xùn)練集,以訓(xùn)練出不同的基分類器,從而得到一個(gè)性能改進(jìn)的組合分類器。Boosting算法思想是學(xué)習(xí)一系列分類器,每一個(gè)訓(xùn)練樣本被賦予一個(gè)權(quán)值,每學(xué)習(xí)完一個(gè)分類器,就增加被分類器錯(cuò)誤分類的訓(xùn)練樣本的權(quán)重,當(dāng)所有的分類器學(xué)習(xí)完并且達(dá)到迭代次數(shù),便可綜合得出一系列分類器。
本文采用江蘇常州市地區(qū)的航空高分辨率影像,經(jīng)過大氣校正處理,研究區(qū)域選取500像素×500像素大小,試驗(yàn)數(shù)據(jù)為紅綠藍(lán)3個(gè)波段,并提取灰度特征與紋理特征作為分類特征空間,通過目視判讀將影像中的地表類型分為水體、農(nóng)地、林地與建筑物。
分類的精度提高,受各分類器分類誤差不相關(guān)性影響較大。不同的波段對分類結(jié)果的影響不同,不同的特征選擇也影響分類的效果,它們同時(shí)制約著分類器分類的誤差相關(guān)性。試驗(yàn)中所采用的特征為紅綠藍(lán)3個(gè)波段,以及任選波段的均值、方差、能量、對比度、熵、相關(guān)性和均質(zhì)度。分類精度評價(jià)指標(biāo)包含總體精度、用戶精度、生產(chǎn)者精度、Kappa系數(shù)。原始圖像區(qū)域如圖2所示。
圖2 原始圖像區(qū)域
(1)單分類器試驗(yàn)
面向多個(gè)神經(jīng)網(wǎng)絡(luò)分類器,分別選取一定數(shù)量的訓(xùn)練樣本與測試樣本進(jìn)行影像分類,利用精度評價(jià)指標(biāo)分析不同特征選擇下每一個(gè)分類器對不同類別的分類精度,為集成分類器的精度評價(jià)提供參考。
為了驗(yàn)證不同類型特征下不同分類器對不同分類類別的影響,試驗(yàn)分為兩種情況,第一種情況采用3個(gè)波段及任選波段的均值與方差,分別進(jìn)行BP、RBF和Hopfield分類器分類的試驗(yàn)(如圖3所示);第二種情況采用3個(gè)波段及任選波段的均值、方差、能量、對比度、熵、相關(guān)性和均質(zhì)度,也分別進(jìn)行與第一種情況相似的分類試驗(yàn)(如圖4所示),表1為單分類器分類結(jié)果精度評價(jià)。
圖3 第一種情況單分類器分類結(jié)果(5個(gè)特征)
從分類結(jié)果圖和分類結(jié)果精度評價(jià)表可以看出,第二種情況的總體分類精度稍微高于第一種情況的總體分類精度,表明增加特征能更加合理地表達(dá)圖像類別信息。每一種情況內(nèi)部不同分類器的總體分類精度差別不大,說明不同的神經(jīng)網(wǎng)絡(luò)分類器在特征相同的情況下,對于總體分類精度的影響并不顯著。針對同一種分類器,一種試驗(yàn)情況內(nèi)不同類別的分類精度存在較大差別,體現(xiàn)了不同的地物類別所受分類器的影響顯著。
(2) 集成的分類器試驗(yàn)
單分類器分類表明分類特征影響同類分類器分類的精度,不同的分類器精度也略有差別??梢詮奶卣髋c分類器的選擇角度,對于特征的獨(dú)立性與分類器的差異性特點(diǎn),以集成的方式去構(gòu)建分類器來提高分類的精度。試驗(yàn)數(shù)據(jù)選擇單分類器試驗(yàn)所給定的訓(xùn)練樣本,采用Bagging和Boosting算法構(gòu)造不同的訓(xùn)練特征集,進(jìn)一步構(gòu)造參與分類的特征空間,并選擇BP、RBF和Hopfield的神經(jīng)網(wǎng)絡(luò)參與個(gè)體網(wǎng)絡(luò)的生成,對于網(wǎng)絡(luò)輸出以投票的方式?jīng)Q定最后分類的結(jié)果。神經(jīng)網(wǎng)絡(luò)集成采用如圖5所示的集成方式。試驗(yàn)結(jié)果如圖6所示,精度評價(jià)如表2所示。
圖4 第二種情況單分類器分類結(jié)果(9個(gè)特征)
表1 單分類器分類結(jié)果精度評價(jià)表 (a)兩種試驗(yàn)情況下,不同分類器下不同類別的生產(chǎn)者和用戶精度 (%)
(b)兩種試驗(yàn)情況下,不同分類器的總體分類精度評價(jià)
圖5 神經(jīng)網(wǎng)絡(luò)集成示意圖
圖6 神經(jīng)網(wǎng)絡(luò)集成分類結(jié)果圖
表2 神經(jīng)網(wǎng)絡(luò)集成分類結(jié)果精度評價(jià)表 (%)
根據(jù)試驗(yàn)結(jié)果,并將集成的分類結(jié)果與單分類器分類結(jié)果作對比,可以看出神經(jīng)網(wǎng)絡(luò)集成的分類器總體分類精度高于單個(gè)分類器的分類精度。神經(jīng)網(wǎng)絡(luò)集成中采用Hopfield算法的分類精度顯著提高了整體分類精度。采用Boosting算法集成的分類器分類精度優(yōu)于Bagging算法集成的分類器分類精度。
面向高分辨率遙感影像分類的應(yīng)用研究,神經(jīng)網(wǎng)絡(luò)集成建模分析主要以數(shù)據(jù)的預(yù)處理、網(wǎng)絡(luò)模型的構(gòu)建等方面為基本內(nèi)容。
為了消除不同量綱網(wǎng)絡(luò)輸入對分類精度的影響,可采用比例壓縮法對網(wǎng)絡(luò)輸入的特征空間進(jìn)行歸一化處理,并對網(wǎng)絡(luò)訓(xùn)練后輸出的數(shù)據(jù),進(jìn)行反方向的處理。
BP和RBF網(wǎng)絡(luò)隱含層神經(jīng)元的數(shù)目,采用直方圖分析法確定,輸入層神經(jīng)元的數(shù)目為9,輸出神經(jīng)元的數(shù)目即為所要分類的數(shù)目4。BP網(wǎng)絡(luò)的訓(xùn)練次數(shù)人工設(shè)為500,訓(xùn)練目標(biāo)為0.001,隱含層函數(shù)采用S型正切函數(shù),輸出層采用Sigomoid函數(shù)。RBF網(wǎng)絡(luò)的訓(xùn)練目標(biāo)為0.001,其寬度采用固定法確定。Hopfield網(wǎng)絡(luò)的訓(xùn)練次數(shù)人工設(shè)為200,訓(xùn)練目標(biāo)為0.001,輸入層的神經(jīng)元數(shù)目為9,輸出層神經(jīng)元數(shù)目為10×4。Bagging算法和Boosting算法分別按照其流程進(jìn)行以上3個(gè)分類器的集成,所集成的神經(jīng)分類器特點(diǎn)為復(fù)雜度高。
本文將神經(jīng)網(wǎng)絡(luò)集成技術(shù)應(yīng)用于高分辨率影像信息分析與建模,以航空遙感影像作為研究對象,分別進(jìn)行了神經(jīng)網(wǎng)絡(luò)單分類器分類試驗(yàn)、神經(jīng)網(wǎng)絡(luò)集成的分類器分類試驗(yàn),并比較了神經(jīng)網(wǎng)絡(luò)單分類器分類精度與神經(jīng)網(wǎng)絡(luò)集成的分類精度。通過研究可以發(fā)現(xiàn),針對神經(jīng)網(wǎng)絡(luò)單分類器應(yīng)該選擇更全面地表達(dá)影像信息的特征集合,以提高遙感影像的分類精度,進(jìn)一步研究表明神經(jīng)網(wǎng)絡(luò)集成分類器的精度優(yōu)于神經(jīng)網(wǎng)絡(luò)單分類器。
研究結(jié)果表明,選取具有代表性樣本的前提下,選擇多個(gè)神經(jīng)網(wǎng)絡(luò)分類器,并采用Bagging算法和Boosting算法應(yīng)用于高分辨率影像分類,就可以在一定程度上提高影像分類的精度,對于實(shí)用化高分辨率影像分類具有較強(qiáng)的推廣性。
參考文獻(xiàn):
[1] 賈永紅. 數(shù)字圖像處理[M].武漢:武漢大學(xué)出版社, 2003.
[2] 鐘珞,饒文碧,鄒承明. 人工神經(jīng)網(wǎng)絡(luò)及其融合應(yīng)用技術(shù)[M].北京:科學(xué)出版社, 2007.
[3] 陳紹杰,逄云鋒. Boosting和Bagging算法的高分辨率遙感影像分類探討[J]. 測繪科學(xué),2010,35(5):169-172.
[4] 董廣軍,張杰,徐銘杰,等. 基于Hopfield 神經(jīng)網(wǎng)絡(luò)模型的遙感影像分類算法[J]. 測繪學(xué)院學(xué)報(bào), 2003,20(4):267-270.
[5] 傅強(qiáng). 選擇性神經(jīng)網(wǎng)絡(luò)集成算法研究[D].杭州:浙江大學(xué), 2007.
[6] 柏延臣,王勁峰. 結(jié)合多分類器的遙感數(shù)據(jù)專題分類方法研究[J]. 遙感學(xué)報(bào), 2005,9(5):555-563.
[7] 史忠植. 神經(jīng)網(wǎng)絡(luò)[M].北京:高等教育出版社, 2009.