佘海龍,解山娟,鄒靜潔
杭州師范大學(xué) 遙感與地球科學(xué)研究院,杭州 311121
高光譜遙感圖像包含著數(shù)百個(gè)豐富的空間和光譜信息的波段,可以為對(duì)感興趣的領(lǐng)域進(jìn)行分類提供依據(jù),因此在農(nóng)業(yè)[1]、醫(yī)學(xué)圖像[2-3]、土地管理[4]、生態(tài)監(jiān)測(cè)[5]和法醫(yī)學(xué)[6]等領(lǐng)域有著廣泛的應(yīng)用。隨著高光譜成像技術(shù)的發(fā)展,光譜分辨率大大提升,同時(shí)也增加了高光譜圖像的復(fù)雜度,容易造成所謂的Hughes 現(xiàn)象[7]。因此,在高光譜圖像處理過(guò)程中,去除數(shù)據(jù)冗余的過(guò)程必不可少。而降維可分為特征提取和特征選擇兩種方式。特征提取用于尋找合適的映射,將高維特征空間轉(zhuǎn)換為低維特征空間,如常見(jiàn)的主成分分析方法[8]、獨(dú)立成分分析方法[9]等。另一種是特征選擇方法,特征選擇是從原始集合中選擇最具代表性的特征子集,可以保留原始數(shù)據(jù)的物理意義,因此應(yīng)用最為廣泛。如Huang等人根據(jù)信息熵理論,量化了各波段的信息量,從而達(dá)到降維的目的[10]。
近年來(lái),深度學(xué)習(xí)已經(jīng)成功應(yīng)用到語(yǔ)音識(shí)別[11]、自然語(yǔ)言處理[12]和圖像識(shí)別[13]等領(lǐng)域并取得了顯著進(jìn)展。因此,將深度學(xué)習(xí)應(yīng)用于高光譜遙感圖像分類有著巨大的研究?jī)r(jià)值。國(guó)內(nèi)外也有越來(lái)越多的學(xué)者將深度學(xué)習(xí)的方法應(yīng)用于高光譜遙感圖像分類。如王立偉等人采用遷移學(xué)習(xí)策略和深度殘差網(wǎng)絡(luò)對(duì)高光譜影像進(jìn)行分類并取得較好的效果[14]。Hu等人在2015年首次利用深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型對(duì)高光譜遙感圖像進(jìn)行分類[15]。該方法利用CNN的局部感知、權(quán)值共享等特性,大大減少了模型參數(shù),降低了訓(xùn)練難度,進(jìn)一步提高了分類性能,但未能充分利用高光譜遙感圖像的空間信息。而后3D 卷積出現(xiàn),由于可以同時(shí)提取時(shí)間和空間維度的特征[16],使得各學(xué)者嘗試使用3D 卷積處理高光譜遙感圖像。2016年,Chen等人將3D卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于高光譜圖像分類,提取空間-光譜的深層特征,并且加入了虛擬樣本的方法解決樣本匱乏的問(wèn)題[17],但網(wǎng)絡(luò)卷積層參數(shù)較多,增加了模型的計(jì)算量。
基于以上問(wèn)題,本文提出了基于標(biāo)準(zhǔn)分?jǐn)?shù)的特征選擇方法,結(jié)合3D-CNN網(wǎng)絡(luò)提取高光譜遙感圖像的空間和光譜特征,對(duì)圖像進(jìn)行分類,并使用大步距卷積層替代池化層[18],以達(dá)到提升分類精度和減少計(jì)算量的目的。
高光譜圖像的異常檢測(cè)在沒(méi)有任何已知信息的情況下,逐一檢測(cè)圖像中的每一個(gè)像元,若待測(cè)像元與周圍的背景像元相差較多,則此像元被判定為異常像元,否則為背景像元,圖像中的任一像元只屬于此兩種情況中的一種[19]。
本文為了減少數(shù)據(jù)量以提升后續(xù)分類速度,且通過(guò)去除質(zhì)量較低的波段對(duì)分類精度的影響,引入基于統(tǒng)計(jì)方法的離群點(diǎn)檢測(cè)方法,對(duì)高光譜數(shù)據(jù)進(jìn)行預(yù)處理。統(tǒng)計(jì)方法中基于分布的方法,是假設(shè)給定的數(shù)據(jù)集符合某種概率分布模型,或利用給定的數(shù)據(jù)集自動(dòng)構(gòu)造其概率分布模型,然后根據(jù)分布模型采用不一致性檢驗(yàn)來(lái)確定離群點(diǎn),優(yōu)點(diǎn)是可以達(dá)到無(wú)監(jiān)督異常檢測(cè)且速度較快[20]。其中標(biāo)準(zhǔn)分?jǐn)?shù)是一種常見(jiàn)的一維或低維特征空間中基于統(tǒng)計(jì)概率原理的參數(shù)異常檢測(cè)方法[21]。該方法適合處理較大的無(wú)標(biāo)簽高光譜遙感數(shù)據(jù)集,并且方便后續(xù)指標(biāo)的建立。
標(biāo)準(zhǔn)分?jǐn)?shù)是一種不受原始測(cè)量單位影響的數(shù)值,其作用除了能夠表明原數(shù)據(jù)在其分布中的位置外,還能對(duì)未來(lái)不能直接比較的各種不同單位的數(shù)據(jù)進(jìn)行比較。標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式為式(1):
其中,z為標(biāo)準(zhǔn)分?jǐn)?shù),x為某一具體分?jǐn)?shù),μ為平均數(shù),σ為標(biāo)準(zhǔn)差。
本文定義了兩個(gè)指標(biāo)來(lái)衡量波段質(zhì)量,第一個(gè)是某一波段的樣本點(diǎn)的標(biāo)準(zhǔn)分之和,另一指標(biāo)是某一波段樣本點(diǎn)標(biāo)準(zhǔn)分?jǐn)?shù)絕對(duì)值大于3 的個(gè)數(shù)。原理是基于統(tǒng)計(jì)分布理論,在已知目標(biāo)概率分布模型的情況下,通過(guò)假設(shè)檢驗(yàn)原理可以進(jìn)行離群點(diǎn)檢測(cè)[22]。根據(jù)拉依達(dá)準(zhǔn)則,以3作為閾值,如圖1,即樣本中99.74%的數(shù)據(jù)區(qū)域的數(shù)據(jù)視為正常數(shù)據(jù),將超出此范圍的數(shù)據(jù)視為異常數(shù)據(jù)。
圖1 正態(tài)分布曲線和標(biāo)準(zhǔn)分之間的關(guān)系
設(shè)Cv為第v類樣本(v=1,2,…,C),Bk表示高光譜遙感圖像中第k個(gè)波段(k=1,2,…,B)。一個(gè)波段中,標(biāo)準(zhǔn)分之和越小,說(shuō)明該波段的反射率越趨于穩(wěn)定,各樣本的離群點(diǎn)個(gè)數(shù)總數(shù)越少,說(shuō)明該波段數(shù)據(jù)質(zhì)量更好。
根據(jù)上文中定義的兩個(gè)指標(biāo)對(duì)高光譜遙感圖像的每個(gè)波段進(jìn)行評(píng)價(jià),本文以標(biāo)準(zhǔn)分總和為主要參考指標(biāo),離群點(diǎn)個(gè)數(shù)作為次要指標(biāo),獲取質(zhì)量最好的前15個(gè)波段參加后文的分類。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種專門處理具有類似網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)最初受到視覺(jué)系統(tǒng)的神經(jīng)機(jī)制啟發(fā),是針對(duì)二維形狀的識(shí)別設(shè)計(jì)的一種生物物理模型,在平移情況下具有高度不變性,在縮放和傾斜情況下也具有一定的不變性。
但CNN 最初是針對(duì)二維形狀的識(shí)別而設(shè)計(jì)的,對(duì)三維數(shù)據(jù)進(jìn)行分析時(shí),存在一定的局限性。高光譜圖像不同于通常的二維圖像,在二維圖像空間信息的基礎(chǔ)上添加了光譜維,形成三維的數(shù)據(jù)立方體。針對(duì)二維卷積神經(jīng)網(wǎng)絡(luò)對(duì)三維高光譜數(shù)據(jù)的信息利用不足的問(wèn)題,本文采用三維卷積神經(jīng)網(wǎng)絡(luò)對(duì)降維后高光譜數(shù)據(jù)立方體進(jìn)行分析處理。三維卷積神經(jīng)網(wǎng)絡(luò)[16]最早被用于視頻分析,該方法通過(guò)三維卷積操作可以從不同幀間同時(shí)提取空間維和時(shí)間維特征,因此能更好地對(duì)視頻中的運(yùn)動(dòng)進(jìn)行分析。三維卷積神經(jīng)網(wǎng)絡(luò)(3D-CNN)與二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN)的網(wǎng)絡(luò)結(jié)構(gòu)較為類似,都是由卷積層和池化層組成。與2D-CNN不同的是,3D-CNN采用的是3D 卷積核來(lái)進(jìn)行卷積操作,這是兩種卷積運(yùn)算的關(guān)鍵區(qū)別。網(wǎng)絡(luò)的第l層第j個(gè)特征圖在位置(x,y,z)處的值的計(jì)算公式如式(4):
其中,Pl與Ql表示三維卷積核的長(zhǎng)度和寬度;Rl為三維卷積核在光譜維上的尺寸;m表示第l-1 層中與當(dāng)前特征圖相連的特征圖的個(gè)數(shù);表示與第l-1 層相連的第m個(gè)特征圖的權(quán)值;表示第l-1層中第m個(gè)特征圖在位置(x+p,y+q,z+r)處的值;blj為第l層第j個(gè)特征圖的偏置;f(·)為激活函數(shù)。
高光譜遙感圖像是典型的三維數(shù)據(jù)立方體,在應(yīng)用深層網(wǎng)絡(luò)對(duì)其分類時(shí),需要面臨高維度導(dǎo)致的“維數(shù)災(zāi)難”問(wèn)題,以及網(wǎng)絡(luò)參數(shù)過(guò)多導(dǎo)致的計(jì)算量過(guò)大問(wèn)題。在設(shè)計(jì)適用于高光譜遙感圖像分類的CNN 模型時(shí),實(shí)驗(yàn)研究表明,當(dāng)構(gòu)建一定層數(shù)的模型時(shí),進(jìn)一步增加CNN 模型的層數(shù),會(huì)出現(xiàn)分類精度沒(méi)有提高反而降低的情況,且還會(huì)花費(fèi)更多時(shí)間[23]。因此在構(gòu)建CNN 模型的過(guò)程中,需要重點(diǎn)考慮的因素主要為模型的深度(層數(shù))、濾波器的大小和濾波器的數(shù)量,其中模型的深度是影響分類精度的主要因素。
針對(duì)此問(wèn)題,本文構(gòu)建了三維卷積神經(jīng)網(wǎng)絡(luò)對(duì)降維后的高光譜遙感圖像進(jìn)行分類,網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。網(wǎng)絡(luò)由若干層的一維和三維卷積/池化的成對(duì)組合以及一層全連接層組成,并且使用大步距的卷積層替代池化層完成特征圖的降維操作,從而可以降低網(wǎng)絡(luò)的參數(shù)量,以達(dá)到降低計(jì)算量的目的。
本文卷積層均采用ReLU 激活函數(shù)進(jìn)行非線性映射。ReLU 激活函數(shù)比傳統(tǒng)的Sigmoid 函數(shù)和tanh 函數(shù)收斂速度更快。ReLU激活函數(shù)的形式如式(5):
本文算法分類步驟如下:
(1)構(gòu)建空譜數(shù)據(jù)
首先根據(jù)標(biāo)準(zhǔn)分對(duì)W×L×H的高光譜遙感數(shù)進(jìn)行降維,降維后的數(shù)據(jù)大小為W×L×15,以每個(gè)目標(biāo)像元為中心,提取鄰域大小為5×5×15 的高光譜數(shù)據(jù)立方體及其標(biāo)簽作為訓(xùn)練樣本,按照一定的比例隨機(jī)選取每類像元作為訓(xùn)練樣本。由于高光譜遙感圖像不同波段的數(shù)據(jù)范圍不一致,為了降低不同數(shù)據(jù)范圍對(duì)高光譜遙感圖像分類精度的影響,在訓(xùn)練CNN 模型之前需要對(duì)高光譜遙感圖像數(shù)據(jù)按波段分別進(jìn)行歸一化操作,才能作為網(wǎng)絡(luò)模型的標(biāo)準(zhǔn)輸入。
(2)提取空譜特征
將上一步驟提取到的高光譜圖像數(shù)據(jù)立方體作為網(wǎng)絡(luò)的輸入,首先經(jīng)過(guò)N層的K個(gè)三維卷積/池化層的操作,將輸出轉(zhuǎn)換為K個(gè)一維輸出,再將得到的一維輸出作為輸入,經(jīng)過(guò)M層的P個(gè)一維卷積/池化層操作后,得到P個(gè)一維特征圖,然后經(jīng)過(guò)全連接層,產(chǎn)生高光譜地物類別數(shù)量為n個(gè)的神經(jīng)元,并在全連接層采用Dropout方法隨機(jī)丟棄50%的隱藏層節(jié)點(diǎn)以控制過(guò)擬合的風(fēng)險(xiǎn)。
(3)分類
在輸出層使用Softmax 分類器,完成高光譜遙感圖像的多分類任務(wù)。n個(gè)標(biāo)定訓(xùn)練樣本(x(i),y(i))用于網(wǎng)絡(luò)的學(xué)習(xí),x(i)為第i個(gè)樣本,y(i)∈{1,2,…,k}為其期望輸出的標(biāo)簽。本文構(gòu)建的目標(biāo)函數(shù)如式(6):
圖2 本文3D卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
為驗(yàn)證網(wǎng)絡(luò)的有效性,本文提出的網(wǎng)絡(luò)算法分別和SVM、4 層的全連接神經(jīng)網(wǎng)絡(luò)(NN)、Hu 的1D-CNN[15]以及Chen的3D-CNN[17]在Pavia University和Pavia Centre兩個(gè)數(shù)據(jù)集上,采用總體分類精度(OA)、F1-score 和Kappa 系數(shù)進(jìn)行精度評(píng)價(jià)。實(shí)驗(yàn)運(yùn)行環(huán)境為GeForce GTX 1060(6 GB)的PC,Windows10系統(tǒng)。
Pavia Centre和Pavia University兩個(gè)數(shù)據(jù)集是2013年由德國(guó)機(jī)載反射光學(xué)光譜成像儀ROSIS 傳感器在意大利帕維亞的飛行活動(dòng)中獲得的。該光譜成像儀對(duì)波長(zhǎng)范圍為0.43~0.86 μm內(nèi)的115個(gè)波段連續(xù)成像,圖像分別共有1 096×715,610×340個(gè)像素,空間分辨率都為1.3 m。由于受到噪聲的影響,Pavia Centre數(shù)據(jù)集剔除了13個(gè)波段,Pavia University數(shù)據(jù)集剔除了12個(gè)波段,分別剩下102 個(gè)和103 個(gè)波段作為分類使用數(shù)據(jù),同時(shí)兩個(gè)圖像中都包含一些沒(méi)有信息的樣本點(diǎn),在使用之前已被剔除。兩個(gè)數(shù)據(jù)集都包含9 種地物類別。兩個(gè)數(shù)據(jù)集的偽彩色圖和真值圖如圖3、圖4所示。
使用標(biāo)準(zhǔn)分?jǐn)?shù)的方法對(duì)兩組測(cè)試數(shù)據(jù)集的統(tǒng)計(jì)結(jié)果如圖5、圖6,并以每個(gè)波段的標(biāo)準(zhǔn)分總和為主要考慮因素,每個(gè)波段的離群點(diǎn)個(gè)數(shù)為次要因素,對(duì)每個(gè)波段的質(zhì)量進(jìn)行評(píng)價(jià)和排序,并選取質(zhì)量最優(yōu)的15 個(gè)波段進(jìn)行分類,最終結(jié)果如表1。
圖3 Pavia Centre數(shù)據(jù)圖像
圖4 Pavia University數(shù)據(jù)圖像
表1 選取的最優(yōu)波段
圖5 Pavia University數(shù)據(jù)集的統(tǒng)計(jì)結(jié)果
圖6 Pavia Centre數(shù)據(jù)集的統(tǒng)計(jì)結(jié)果
本文按照7∶1∶2的比例將數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,網(wǎng)絡(luò)采取Xavier 初始化方法,偏置初始化為 0,Dropout 層的參數(shù)設(shè)置為 0.5,采用 SGD 優(yōu)化器對(duì)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練,學(xué)習(xí)率設(shè)置為0.01。參與結(jié)果對(duì)比的神經(jīng)網(wǎng)絡(luò)均將Batch size設(shè)置為100,Epoch為100,每次卷積操作之后都加入了BN層。為適應(yīng)本文降維后的數(shù)據(jù),將參與對(duì)比的Chen的3D-CNN[17]的卷積核尺寸由4×4×32調(diào)整為4×4×4大小,其余參數(shù)不做改變。本文的卷積核采用3×3×3大小,因經(jīng)過(guò)驗(yàn)證,3×3×3的小卷積核能夠很好地處理三維時(shí)空特征[13]。
本節(jié)主要比較了網(wǎng)絡(luò)深度和訓(xùn)練樣本的鄰域大小的選擇對(duì)網(wǎng)絡(luò)精度結(jié)果的影響,結(jié)果如表2、表3 所示,分別構(gòu)建了4層和6層的網(wǎng)絡(luò)模型對(duì)分類精度進(jìn)行對(duì)比,通過(guò)實(shí)驗(yàn)結(jié)果對(duì)比選擇適合降維后數(shù)據(jù)的最優(yōu)網(wǎng)絡(luò)。
其中3 層卷積的神經(jīng)網(wǎng)絡(luò)參考Hu 的1D-CNN 網(wǎng)絡(luò)模型[15],在實(shí)驗(yàn)中發(fā)現(xiàn)兩層全連接層對(duì)于分類精度影響不大,但是會(huì)增加大量網(wǎng)絡(luò)的參數(shù),因此只采用了一層全連接層。4 層和6 層的網(wǎng)絡(luò)參考了Hamida 的網(wǎng)絡(luò)模型[24],4 層的卷積神經(jīng)網(wǎng)絡(luò)采用了兩層的卷積-池化結(jié)構(gòu),并采用步距為2的小卷積核1×1×3代替了池化層,最后加入一層全連接層。由于大步距小卷積核的加入,使得在加深網(wǎng)絡(luò)深度的情況下,網(wǎng)絡(luò)整體的參數(shù)不會(huì)增加過(guò)多,因此嘗試構(gòu)建6 層的網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行分類,在原有4層的基礎(chǔ)上,增加一層卷積-池化層,以提取數(shù)據(jù)更深層次的特征。不同網(wǎng)絡(luò)的參數(shù)和對(duì)應(yīng)的分類精度如表2和表3所示。最后取10次預(yù)測(cè)結(jié)果的OA的平均值和總體方差作為評(píng)價(jià)指標(biāo)。從實(shí)驗(yàn)結(jié)果對(duì)比可以看出,6層的網(wǎng)絡(luò)模型和取鄰域大小為5的網(wǎng)絡(luò)模型對(duì)于兩個(gè)數(shù)據(jù)集的適應(yīng)性最好,精度最高。因此采用此模型參與對(duì)比,詳細(xì)的網(wǎng)絡(luò)模型參數(shù)及特征圖計(jì)算過(guò)程如圖7所示。
網(wǎng)絡(luò)的時(shí)間復(fù)雜度以FLOPS(Floating Point Operations Per Second)作為衡量標(biāo)準(zhǔn),即每秒執(zhí)行的浮點(diǎn)運(yùn)算數(shù)。卷積的時(shí)間和全連接層的復(fù)雜度計(jì)算公式如式(7)、(8):
表2 Pavia Centre數(shù)據(jù)集中各網(wǎng)絡(luò)的參數(shù)和分類精度
表3 Pavia University數(shù)據(jù)集中各網(wǎng)絡(luò)的參數(shù)和分類精度
圖7 網(wǎng)絡(luò)模型的參數(shù)結(jié)構(gòu)和特征圖大小計(jì)算過(guò)程
式(7)中,W、H、C分別代表特征圖的寬(Width)、長(zhǎng)(Height)、通道數(shù)(Channel),K為每個(gè)3D 卷積核的邊長(zhǎng),Cin為每個(gè)卷積核的輸入通道數(shù),Cout為本卷積層具有的卷積核個(gè)數(shù),即輸出通道數(shù)。式(8)中,O(·)代表時(shí)間復(fù)雜度函數(shù),I代表輸入的數(shù)量,O代表輸出的數(shù)量。
由于采用了大步距的小卷積核替代了池化層和小尺寸的卷積核,本文的網(wǎng)絡(luò)能在保持一定準(zhǔn)確率的前提下,極大地減少網(wǎng)絡(luò)的整體參數(shù)和時(shí)間復(fù)雜度。以本文第一個(gè)代替池化的卷積層為例,未加入之前根據(jù)式(8)網(wǎng)絡(luò)的計(jì)算量為(3×3×13)(3×3×3)(20×35)=2 211 300,加入替代池化層的卷積層后,計(jì)算量為(3×3×13)(1×1×3)(20×20)+(3×3×7)(3×3×3)(20×35)=1 331 100,使得時(shí)間復(fù)雜度下降了約40%。
本文所用到的神經(jīng)網(wǎng)絡(luò)的時(shí)間復(fù)雜度和實(shí)際訓(xùn)練所用時(shí)間見(jiàn)表4,對(duì)比4 層的1D-CNN,本文的6 層3DCNN 計(jì)算量增加并不明顯,對(duì)比3D-CNN,由于本文3D-CNN采用了小卷積核和卷積層替代池化層的策略,使得對(duì)比6層的3D-CNN,整體計(jì)算量減少明顯。
表4 網(wǎng)絡(luò)的時(shí)間復(fù)雜度分析
本文中的3D-CNN 和參與對(duì)比的分類方法對(duì)兩組數(shù)據(jù)進(jìn)行分類的結(jié)果見(jiàn)表5 和表6,整體精度主要采用了OA、Kappa 系數(shù)進(jìn)行評(píng)價(jià),單個(gè)地物種類精度采用F1-score進(jìn)行評(píng)價(jià)。
在Pavia Centre數(shù)據(jù)集中,由于數(shù)據(jù)樣本充足,各分類方法都得到了較好的分類精度,普遍高于95%,其中本文方法精度達(dá)到了99.01%。尤其可以注意到,同樣是將空間信息納入考慮范圍的3D-CNN 網(wǎng)絡(luò)和本文的3D-CNN 網(wǎng)絡(luò),在地物 4 中,即 Self-Blocking Bricks,其分類精度明顯高于未將光譜信息納入考慮范圍的SVM、NN、1D-CNN等方法,證明了3D卷積將空間關(guān)系之外的光譜信息納入特征學(xué)習(xí)范圍,可以有效提高分類的正確性。
表5 Pavia Centre數(shù)據(jù)集的分類精度
表6 Pavia University數(shù)據(jù)集的分類精度
在Pavia University 數(shù)據(jù)集中,本文方法與傳統(tǒng)的NN、1D-CNN 以及3D-CNN 對(duì)比,總體精度和大部分樣本的分類精度都優(yōu)于其他方法。3D-CNN 方法在驗(yàn)證集中,具有和本文方法差不多的分類精度水平,但是在測(cè)試集中,效果遠(yuǎn)不及驗(yàn)證集,如圖8。其主要原因是本數(shù)據(jù)集整體樣本點(diǎn)較少,且降維后的數(shù)據(jù)可能失去了一些次重要波段,加之網(wǎng)絡(luò)深度和參數(shù)過(guò)多的原因,無(wú)法較好地適應(yīng)降維后的數(shù)據(jù)集,發(fā)生了過(guò)擬合現(xiàn)象。而本文的3D-CNN網(wǎng)絡(luò),因?yàn)椴捎昧硕喾N方式減少網(wǎng)絡(luò)參數(shù),且具有防止過(guò)擬合現(xiàn)象的策略,能較好地適應(yīng)降維后的數(shù)據(jù),在降低網(wǎng)絡(luò)訓(xùn)練時(shí)間的同時(shí)對(duì)比其余網(wǎng)絡(luò)取得了更高的分類精度。
圖8 訓(xùn)練集誤差和驗(yàn)證集精度
本文以標(biāo)準(zhǔn)分?jǐn)?shù)的方法對(duì)高光譜數(shù)據(jù)進(jìn)行降維,并結(jié)合優(yōu)化后的3D-CNN 對(duì)數(shù)據(jù)進(jìn)行分類。本文方法可以提取出高光譜數(shù)據(jù)中數(shù)理統(tǒng)計(jì)角度的最優(yōu)波段,從而減少數(shù)據(jù)質(zhì)量較差的波段對(duì)分類精度的影響。同時(shí)3D-CNN和普通CNN比較,可以考慮到高光譜遙感圖像中每個(gè)地物像素的空間-光譜信息,對(duì)比只考慮光譜信息的模型能夠提取更多特征,因此可以提升分類效果。此外,由于數(shù)據(jù)集降維后數(shù)據(jù)量的減小,在構(gòu)建網(wǎng)絡(luò)時(shí)也要充分考慮到網(wǎng)絡(luò)模型深度、濾波器大小和整體網(wǎng)絡(luò)參數(shù)的問(wèn)題,因此本文盡量減小了網(wǎng)絡(luò)模型的參數(shù)量。實(shí)驗(yàn)結(jié)果表明,本文的網(wǎng)絡(luò)模型不僅可以很好地適應(yīng)降維后的數(shù)據(jù),同時(shí)也減少了網(wǎng)絡(luò)模型的訓(xùn)練時(shí)間。