董朋欣
(長安大學(xué)理學(xué)院 陜西·西安 710064)
遙感是根據(jù)電磁波理論,在光譜和空間兩個方向維度對目標地物進行立體成像的綜合性探測技術(shù)。高光譜遙感則是利用成像光譜儀在可見光到短波紅外范圍內(nèi)對地物進行持續(xù)遙感成像,獲取地物空間信息和光譜信息的遙感技術(shù),其波段通道狹窄且連續(xù),高分辨率特性明顯,在農(nóng)作物、濕地環(huán)境、地球礦物、城市地物、軍事偽裝等領(lǐng)域得到廣泛應(yīng)用。2019年11月3日,我國高分七號對地觀測衛(wèi)星在太原衛(wèi)星發(fā)射中心成功發(fā)射,并表示2020年8月20日正式投入使用,其衛(wèi)星測繪相機分辨率達到亞米級,這標志著高空間、高時間、高光譜分辨率的時代正在到來。
高光譜遙感圖像的分類一直以來都是遙感科學(xué)領(lǐng)域的研究重點,但高維度的數(shù)據(jù)和相鄰波段的高度冗余,對高光譜圖像的分類提出挑戰(zhàn)。不同地表物都有自己獨特的特性,如何快速精確的對地物進行分類,關(guān)鍵就是如何有效提取出能代表地物信息的判別性特征,這是高光譜圖像分類的關(guān)鍵,也是遙感信息技術(shù)研究的重點。
特征提取是指利用線性或非線性變換,將原始高維數(shù)據(jù)特征轉(zhuǎn)換為更能反映原始數(shù)據(jù)本質(zhì)或進行數(shù)據(jù)區(qū)分的低維數(shù)據(jù)特征,是一種改變光譜物理意義或統(tǒng)計意義的降維技術(shù)。高光譜圖像的特征提取方法按照是否線性空間,分為線性特征提取和非線性特征提取。
線性特征提取又稱子空間學(xué)習(xí),旨在根據(jù)一定的性能目標,將原始空間數(shù)據(jù)通過線性變換投影到低維子空間的過程,該類算法使數(shù)據(jù)的潛在分布更加凸顯,使用簡單,有效減少數(shù)據(jù)存儲和數(shù)據(jù)冗余。主要代表算法有主成分分析(PCA)、線性判別分析(LDA)和獨立成分分析(ICA)。
主成分分析(PCA)又稱主分量分析,是一種尋找數(shù)據(jù)分布最優(yōu)子空間的降維統(tǒng)計方法?;驹硎抢谜蛔儞Q設(shè)法將一組分量相關(guān)的初始數(shù)據(jù)作某種線性組合,重新轉(zhuǎn)換成一組線性不相關(guān)的低維新數(shù)據(jù),其中在所有變換中,選取方差最大(方差越大包含的信息越多)的線性組合變量,即稱為第一主成分,如第一主成分未能表示初始數(shù)據(jù)的全部信息,然后再選取方差次大的線性組合變量,即為第二主成分,依次類推。由于前面主成分所含的方差較多,只有幾乎為零的少量方差含在后幾個主成分中,于是忽略貢獻幾乎為零的高階主成分特征,只保留貢獻較大的前幾個低階主成分,實現(xiàn)對數(shù)據(jù)特征的降維處理。
線性判別分析(LDA)要求數(shù)據(jù)符合高斯分布,是一種可以利用物體類別先驗知識進行有監(jiān)督學(xué)習(xí)的降維技巧。主要思想是將高維原始空間在低維空間上進行映射,使映射后各類別的類間散度最大、類內(nèi)散度最小,即映射后不同類別的數(shù)據(jù)盡可能相距較大,而相同類別的數(shù)據(jù)盡可能聚在一起。與無監(jiān)督降維方式的PCA算法不同,LDA是使變換后的數(shù)據(jù)獲取最好的分類性,而PCA是獲取最大的發(fā)散性,但兩者都在尋找最佳解釋數(shù)據(jù)的變量線性組合。
獨立成分分析(ICA)又稱盲源分離,起初被應(yīng)用于“雞尾酒會”場景。ICA模型認為混合觀測數(shù)據(jù)可以由多個相互獨立的源數(shù)據(jù)線性組合而成,即n維觀測數(shù)據(jù)X服從模型X=AS,其中A為混合矩陣,S為相互獨立的m維(mn)源信號(源信號為非高斯或者只有一個成分是高斯分布)。ICA核心就是要解混,找到一個解混矩陣W(A的逆矩陣)對觀測信號X進行線性變換,獲得相互獨立的源信號S,即S=A1X=WX。
非線性特征提取是將高維數(shù)據(jù)在低維空間上進行非線性變換映射,該類算法能更好的提取數(shù)據(jù)分布特征,但計算復(fù)雜度大。主要代表算法有核主成分分析(KPCA)、等距映射(ISOMAP)、棧式自編碼(SAE)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。
核主成分分析(KPCA)是對PCA算法的非線性推廣,用于處理線性不可分的樣本集。通過引入核函數(shù),把線性不可分的原始空間投影至高維的特征空間,從而達到線性可分的情況,再采用PCA算法對特征空間處理降維,這是一個先升維后降維的過程,核方法解決了不可分問題,提取到了數(shù)據(jù)潛在的非線性分布特征。其中常見的核包括Sigmoid核、雙曲正切核、多項式核等。
等距映射(ISOMAP)是流形學(xué)習(xí)中非線性降維方法的一種,它的核心是將原始數(shù)據(jù)映射到低維空間之后依舊保留流形上點對之間的測地線距離(即相對距離關(guān)系),換句話說投影前后,距離近的點還要是近,距離遠的點還要是遠。等距映射是基于圖論中測地線的理論,把帶權(quán)圖的測地距離作為流形映射的幾何描述,希望得到一個保持流形結(jié)構(gòu)的低維嵌入,保留非線性樣本的本質(zhì)幾何結(jié)構(gòu),是一種無監(jiān)督學(xué)習(xí)方法。
棧式自編碼(SAE)是由多層自編碼器堆棧形成的網(wǎng)絡(luò)模型。傳統(tǒng)自編碼由輸入層、隱藏層和輸出層組成,分為編碼和解碼兩個部分,其中輸入層到隱藏層為編碼,隱藏層到輸出層為解碼。棧式自編碼就是將原始數(shù)據(jù)作為輸入訓(xùn)練自編碼器,并去除其解碼過程,然后把前一層自編碼的輸出(即隱藏層特征)作為下一層自編碼的輸入,依次類推。本質(zhì)上就是利用逐層貪婪訓(xùn)練的思想,對數(shù)據(jù)做非線性轉(zhuǎn)換,進行無監(jiān)督訓(xùn)練。
表1:Indian Pines地區(qū)各方法分類精度
圖1:Indian Pines地區(qū)各方法分類結(jié)果。(a)原圖;(b)實際地物;(c)SVM;(d)PCA-SVM;(e)ICA-SVM;(f)SAE-SVM;(g)Resnet-SVM;(h)3D-CNN
表2:University of Pavia地區(qū)各方法分類精度
圖2:University of Pavia地區(qū)各方法分類結(jié)果。(a)原圖;(b)實際地物;(c)SVM;(d)PCA-SVM;(e)ICA-SVM;(f)SAE-SVM;(g)Resnet-SVM;(h)3D-CNN
卷積神經(jīng)網(wǎng)絡(luò)(CNN)類似于人工神經(jīng)網(wǎng)絡(luò)的多層感知器,是一種前潰式監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),常用來分析視覺圖像。其本質(zhì)上是一種輸入到輸出的映射,網(wǎng)絡(luò)結(jié)構(gòu)主要包括數(shù)據(jù)輸入層、卷積層、ReLU激勵層、池化層、全鏈接層。CNN通過采用局部連接、參數(shù)共享和降采樣等方法優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),解決了感知器全連接和梯度發(fā)散的問題,使其適應(yīng)性更強,可處理高維數(shù)據(jù)圖像,并且可以挖掘出數(shù)據(jù)的局部特征和全局特征,可以識別位移、縮放及扭曲不變性的圖像。其代表性網(wǎng)絡(luò)有Alex-Net、VGG、Resnet等。
為了對各方法進行有效驗證,選用IndianPines和University of Pavia兩組遙感圖像數(shù)據(jù)進行分類實驗,并利用線性方法(PCA、ICA)和非線性方法(SAE、Resnet、3D-CNN)對高光譜圖像進行特征提取,同時輸入支持向量機(SVM)分類器實現(xiàn)不同地物間的分類。本文還采用兩個評估指標(整體分類精度OA、Kappa系數(shù))進行對比分析。
實驗一在Indian Pines數(shù)據(jù)集上進行驗證,共16類地物(如草地、農(nóng)田等),由波長為0.4-2.5,大小為145pixel×145pixel的像素點組成,去除受水汽等干擾因素的20個波段,用剩余的200個光譜波段進行實驗。實驗隨機選取每類標記樣本的10%作為訓(xùn)練樣本,其余樣本用作測試。表1列出各類樣本在6種算法下的分類精度,圖1為各類樣本在6種算法下的分類結(jié)果圖。
圖3:訓(xùn)練樣本數(shù)量對各分類方法的影響。(a)Indian Pines;(b)University of Pavia
實驗二驗證的是University of Pavia地區(qū)的數(shù)據(jù)集,該數(shù)據(jù)由空間分辨率為1.3m,大小為610pixel×340pixel的像素點組成,波長在0.43-0.86 m之間,共9種地物(如樹、瀝青道路、牧場等),包含103個光譜波段(除去受噪聲影響的12個波段)。實驗隨機抽取每類200個樣本作為訓(xùn)練樣本,其余樣本用作測試。表2列出各類樣本在6種算法下的分類精度,圖2為各類樣本在6種算法下的分類結(jié)果圖。
實驗結(jié)果表明,僅利用光譜信息對地物進行分類,所得整體分類精度較低、分錯的離散點較多;將線性方法(PCA、ICA)提取出的特征進行分類,分類結(jié)果得到改善;SAE、Resnet和3D-CNN算法通過非線性方式提取特征,極大提高了整體分類精度,邊界區(qū)分效果明顯改善,且3D-CNN的分類精度均優(yōu)于其它方法,邊界點區(qū)分效果最為明顯。實驗一,通過組合線性方式的PCA-SVM算法比僅考慮光譜信息的SVM,分類精度提高了6.5%,融合非線性特征的Resnet-SVM比SVM提高18%,3D-CNN算法比線性方法(PCA、ICA)的分類精度大約提高15%,比SAE-SVM高。實驗二,PCA-SVM分類精度比SVM提高4%,Resnet-SVM比SVM提升5.38%,3D-CNN算法比PCA-SVM、ICA-SVM的整體分類精度提高約9%,高于SAE-SVM和Resnet-SVM算法,且3D-CNN算法中各目標類分類精度均達到95%以上。綜上所述,僅考慮光譜特征進行分類的方法弱于線性特征方法,非線性方法優(yōu)于線性方法,非線性算法所提取的地物特征具有較強的判別性,極大改善了分類結(jié)果。
為了驗證各方法的有效性,圖3分別展示了不同訓(xùn)練樣本數(shù)量對各類方法分類精度的影響。結(jié)果顯示,訓(xùn)練樣本數(shù)量與分類樣本整體呈現(xiàn)逐步升高的曲線走勢,非線性特征提取優(yōu)于線性特征提取,更優(yōu)于僅考慮光譜特征的SVM算法。
線性特征提取和非線性特征提取區(qū)別在于將原始數(shù)據(jù)映射到低維空間的過程中,是選用線性方式進行變換還是非線性變換。線性特征提取復(fù)雜度較低,簡單可處理,容易理解,但所提特征有些欠缺;相比而言,非線性特征提取可以更好的對數(shù)據(jù)的特有屬性進行表征,不足的是算法參數(shù)缺乏理論性的調(diào)參技巧,但非線性提取方法為以后的研究提供了新思路。