李 達(dá),劉睬瑜,韓 睿,宋梅萍
(1.南方電網(wǎng)綜合能源股份有限公司 新能源事業(yè)部, 廣州 510075;2.大連海事大學(xué) 信息科學(xué)技術(shù)學(xué)院, 遼寧 大連 116026)
高光譜(hyperspectral,HSI)遙感數(shù)據(jù)包含豐富的輻射、空間和光譜數(shù)據(jù),是多種信息的綜合載體。其中,定量化的連續(xù)光譜曲線數(shù)據(jù)為圖像提供光譜信息,像元及周邊像元間的相互空間位置關(guān)系則為圖像提供空間信息[1]。高光譜分類(hyperspectral classification,HSIC)技術(shù)一直是高光譜圖像處理中的熱點(diǎn)研究內(nèi)容,其最終目標(biāo)是根據(jù)光譜特征和空間特征的相似性對圖像中的每個(gè)像元進(jìn)行類別的劃分,在農(nóng)業(yè)、林業(yè)識別、環(huán)境監(jiān)測、海洋目標(biāo)探測等領(lǐng)域有著越來越廣泛的應(yīng)用價(jià)值。近年來隨著機(jī)器學(xué)習(xí)技術(shù)的興起,出現(xiàn)了一系列基于流形學(xué)習(xí)、稀疏理論、深度學(xué)習(xí)等框架的HSIC方法[2-14],這些分類方法主要包括分類訓(xùn)練與特征提取2個(gè)部分,其基本框架是將提取到的分類特征進(jìn)行訓(xùn)練以得到分類模型。在分類訓(xùn)練方面,Du等[15]基于流形學(xué)習(xí)原理,利用面向類別優(yōu)化策略提出了一種稀疏多項(xiàng)式邏輯回歸分類器; Ma等[16]采用半監(jiān)督分類方式,利用樣本的局部類別標(biāo)簽和深度學(xué)習(xí)框架得到的全局類別標(biāo)簽,采用自學(xué)習(xí)方式進(jìn)行高光譜圖像分類;Paoletti等[17]提出了基于一種三維深度卷積神經(jīng)網(wǎng)絡(luò)的高光譜分類框架,利用空間和譜間2種信息作為訓(xùn)練特征,并在圖形處理器(graphic processing unit,GPU)上加以實(shí)現(xiàn)。在特征提取與增強(qiáng)方面,高光譜圖像可以利用的空間特征有形態(tài)學(xué)特征、差分形態(tài)輪廓、Gabor特征和灰度共生矩陣等紋理特征。其中,Benediktsson等[18]通過多種尺度的形態(tài)學(xué)分解方法提取空間特征,成功地應(yīng)用于城市遙感圖像分類;Chen等[19]利用稀疏表示高光譜圖像中的像元和鄰域像元間的區(qū)別,提出的空譜分類器獲得了局部平滑的分類效果,引發(fā)了基于稀疏理論表示的高光譜分類方法的研究浪潮;馬爾可夫隨機(jī)場模型能有效地模擬像元在空間上深層次相關(guān)性,在高光譜分類領(lǐng)域也有著大量的應(yīng)用,Cao等[20]利用高斯-馬爾可夫隨機(jī)場模型提取高光譜遙感影像的空間特征,取得了較好的分類效果;另外,也有學(xué)者利用頻域信號增強(qiáng)的方式提升高光譜數(shù)據(jù)的分類特征,例如Xie等[21]提出一種基于閉合式解摳圖模型空間光譜特征增強(qiáng)方法,該方法利用邊緣信息與預(yù)估的前景、背景信息線性組合以實(shí)現(xiàn)分類特征的增強(qiáng)。這些已有分類特征表示方法為高光譜分類的特征提取提供了大量理論支持與技術(shù)保障。在過去20年中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)能自動(dòng)提取具有分層架構(gòu)的深層特征,在計(jì)算機(jī)視覺等領(lǐng)域有著非常廣泛的應(yīng)用,例如圖像去噪、圖像檢測、目標(biāo)識別和分類?;贑NN框架的分類方法為高光譜分類任務(wù)提供了豐富的解決方案,研究者也對CNN的框架進(jìn)行了各種改進(jìn),現(xiàn)有的基于CNN的高光譜分類框架中存在3類卷積運(yùn)算,分別是一維(1D)卷積、二維(2D)卷積和三維(3D)卷積,目前來說這3種模式通常獨(dú)立執(zhí)行。一方面,采用單一的卷積計(jì)算模式成為譜空分類特征無法深度提取的主要原因;另一方面,也造成了譜空特征融合的單一性,缺少譜間特征與空間特征的深層融合,導(dǎo)致分類精度不高。同時(shí),高光譜圖像的高維性帶來的信息冗余也給分類增加了一定的困難,因此采用波段預(yù)處理的方式進(jìn)行降維也逐漸成為解決這一問題的主要途徑,目前特征提取和波段選擇是2種主要的降維方法,而前者通常算法復(fù)雜,計(jì)算量較大,后者能比較完整地保留信息,是當(dāng)前采用較多的波段處理方法。
針對以上問題,提出了一種基于顯著性波段選擇與密集譜-空特征融合的高光譜圖像分類網(wǎng)絡(luò)(HSIC CNN base on band selection and dense feature fusion,CNNBSDFF),如圖1所示。該方法首先構(gòu)建第一階段深度學(xué)習(xí)網(wǎng)絡(luò),分別構(gòu)建2D和3D Dense深度卷積模塊,用于提取高光譜圖像的空間特征及譜空一體化特征;接著將提取到的兩部分特征進(jìn)行疊加,得到深層融合特征,并且在這個(gè)階段中還采用了顯著性波段選擇(BS)技術(shù)來進(jìn)行數(shù)據(jù)壓縮,降低特征復(fù)雜度,提高HSIC的訓(xùn)練效率;第二階段利用深度學(xué)習(xí)原理,構(gòu)建含有卷積層、池化層和全連接層的深度卷積分類模塊,進(jìn)一步提取譜空融合數(shù)據(jù)的深層特征;最后采用反向傳播的方式進(jìn)行分類模型的訓(xùn)練,獲取分類結(jié)果。本文所提出的融合模型利用兩階段深度學(xué)習(xí)集成策略可以有效地提取深層地物特征,一方面采用空間特征和光譜特征集成融合的方法提取高光譜數(shù)據(jù)的空譜特征,另一方面以兩階段學(xué)習(xí)模式逐步提取深層分類特征,增加空譜信息融合之后的表達(dá)性,獲取更具有判別性的特征,提高網(wǎng)絡(luò)的性能。
圖1 CNNBSDFF方法的網(wǎng)絡(luò)結(jié)構(gòu)圖
高光譜圖像的主要特點(diǎn)是其數(shù)據(jù)由豐富的波段組成,包含了地物豐富的空間、輻射和光譜信息。實(shí)踐表明,結(jié)合空間與光譜信息的圖像分類方式比只利用單一的空間或者譜間信息有顯著優(yōu)勢,而波段間不可避免地會(huì)存在一定的冗余,在有效利用光譜信息的同時(shí)不得不對波段的冗余信息進(jìn)行處理,因此在高光譜數(shù)據(jù)處理應(yīng)用中需要進(jìn)行數(shù)據(jù)壓縮以降低冗余干擾并提高處理速度。目前來說,主要有數(shù)據(jù)降維與波段選擇2種壓縮模式,其中數(shù)據(jù)降維主要從抽取特征子集和通過線性或非線性的方式將原來高維空間變換到新的空間2個(gè)角度出發(fā),這在一定程度上忽略了數(shù)據(jù)本身的關(guān)聯(lián)性。基于波段選擇方法因?yàn)槲锤淖兏吖庾V數(shù)據(jù)的物理屬性而備受關(guān)注,有助于保持?jǐn)?shù)據(jù)類別之間和類別內(nèi)部的客觀聯(lián)系。本文中提出一種基于波段相關(guān)性的顯著性波段選擇方法,用于選擇信息量較大的波段組數(shù)據(jù)進(jìn)行樣本訓(xùn)練??紤]到最接近其他波段的波段蘊(yùn)含著顯著判別信息,構(gòu)建2層前饋全連接網(wǎng)絡(luò)來計(jì)算波段顯著性系數(shù),具體的波段選擇流程如圖2所示。其中,由Kullback-Leible(KL)散度計(jì)算出的初始波段相似度作為輸入,每個(gè)節(jié)點(diǎn)的輸出用于測量波段選擇策略。具體為,若已知bi和bj為高光譜的2個(gè)波段,則2個(gè)波段間的相關(guān)性系數(shù)可以表示為KL(i_j),其計(jì)算公式為:
(1)
式中:bik表示第i個(gè)波段的第k個(gè)像元;n表示高光譜圖像的像元總數(shù)。
全連接網(wǎng)絡(luò)中采用前向反饋結(jié)構(gòu),其中權(quán)重設(shè)置為1,偏置設(shè)置為0,輸出節(jié)點(diǎn)yi{1-L}表示第i個(gè)波段與其他波段的顯著相關(guān)性,將所有波段的顯著相關(guān)性進(jìn)行降序排序,根據(jù)波段數(shù)目選取算法選擇出顯著性波段子集。經(jīng)過波段選擇的預(yù)處理之后,一方面較好地保留了波段顯著數(shù)據(jù),在一定程度上減小數(shù)據(jù)冗余帶來的影響,保證分類精度;另一方面降低了數(shù)據(jù)冗余,可以減少CNN分類網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量,進(jìn)而提高模型的處理速度。
圖2 波段選擇流程圖
提出的融合模型利用兩階段深度學(xué)習(xí)集成策略可以有效地提取深層地物特征,首先采用稠密連接的空間和光譜特征集成融合的方法來聯(lián)合提取高光譜數(shù)據(jù)的空譜特征用于分類,而且充分利用深度學(xué)習(xí)原理,以兩階段學(xué)習(xí)模式進(jìn)一步提取深層特征,增加空譜信息融合之后的表達(dá)性,獲取更具有判別性的特征,增加了網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度,通過這2種方式有效提升特征表達(dá)質(zhì)量,提高分類精度,這將在真實(shí)高光譜圖像分類的實(shí)驗(yàn)中得以驗(yàn)證。
特征提取架構(gòu)采用CNN網(wǎng)絡(luò),避免了傳統(tǒng)復(fù)雜的特征提取過程,通過簡單的非線性模型從原始圖像中提取出更加抽象的特征。本文采用的網(wǎng)絡(luò)結(jié)構(gòu)流程如圖3所示,網(wǎng)絡(luò)主要包括2個(gè)階段,聯(lián)合特征提取階段和深層特征提取階段,在聯(lián)合特征提取階段首先采用波段選擇的方法對高光譜數(shù)據(jù)進(jìn)行壓縮。
圖3 CNNBSDFF方法流程框圖
CNN結(jié)構(gòu)對于圖像的多層次結(jié)構(gòu)、特征局部性、平移不變性具有良好的適應(yīng)性,通過增加網(wǎng)絡(luò)的深度可以在一定程度上提高分類效果,但也會(huì)增加數(shù)據(jù)處理的復(fù)雜度,增加訓(xùn)練的難度,尤其是對于復(fù)雜性較高的高光譜圖像。因此,在本文中,采用了2D和3D Dense CNN 2種結(jié)構(gòu)來分別提取空間特征和光譜特征,Dense CNN結(jié)構(gòu)可以有效增加特征的表達(dá),提高特征的可重用性,在保證網(wǎng)絡(luò)中層與層之間最大程度的信息傳遞的前提下,直接將所有層連接起來,為了保證前饋的特性,每一層將之前所有層的輸入進(jìn)行拼接,再將輸出的特征圖傳遞給之后的所有層,這可以有效避免梯度消失,并且將每層得到的特征圖進(jìn)行最大程度的利用,同時(shí)由于不需要重復(fù)學(xué)習(xí)特征,很大程度上減少了網(wǎng)絡(luò)的參數(shù)數(shù)量,起到緩解網(wǎng)絡(luò)過擬合的作用。由于在Dense網(wǎng)絡(luò)中需要對特征連接,因此不同層的輸出特征大小需要保持一致,采用Dense CNN網(wǎng)絡(luò)提取特征的過程如圖1所示。
2.1.12DDenseCNN模塊
(2)
式中:w2D和b2D表示二維卷積的權(quán)重與偏置參數(shù);符號Θ代表2D卷積操作;σ(·)表示ReLU激活函數(shù)。為了提升空間分類特征的判別性,本文構(gòu)建密集的2D CNN網(wǎng)絡(luò)將前序的特征進(jìn)行連接作為后續(xù)卷積層的輸入,采用了三層密集連接層提取空間特征,采用3×3卷積核大小,每一層的密集結(jié)構(gòu)中包含卷積層、最大池化層、ReLU激活函數(shù)。實(shí)驗(yàn)中的2D Dense網(wǎng)絡(luò)的超參數(shù)設(shè)置如表1所示,采用三層密集連接的CNN卷積神經(jīng)網(wǎng)絡(luò),卷積核的大小均為3*3,且連接最大池化層和ReLU激活層,每層的特征圖均保持一致。其網(wǎng)絡(luò)的密集特征連接方式定義如式(3)所示。
(3)
表1 超參數(shù)設(shè)置
2.1.23D Dense CNN模塊
(4)
式中:w3D和b3D分別為3D卷積的權(quán)重與偏置參數(shù);符號⊙表示3D卷積操作;N為3D卷積核個(gè)數(shù);σ(·)表示ReLU激活函數(shù)。
與空間特征增強(qiáng)的實(shí)現(xiàn)類似,在光譜特征提取階段,也利用密集連接方式,如圖1所示,采用了兩層密集網(wǎng)絡(luò)將所有先前層提取到的特征作為后續(xù)卷積層的輸入。此模塊的實(shí)驗(yàn)參數(shù)設(shè)置如表1所示,在兩層密集連接的CNN網(wǎng)絡(luò)中,采用卷積核的大小是1*1*3,且連接最大池化層和ReLU激活層。相應(yīng)地,對光譜信息的密集運(yùn)算為:
(5)
光譜和空間特征作為高光譜圖像分類的重要依據(jù),決定著分類性能的好壞,目前高光譜分類框架的關(guān)鍵是聯(lián)合光譜和空間特征共同進(jìn)行分類,以改善框架的性能,提高分類精度。本文提出的框架中,第二階段的CNN模塊主要用于實(shí)現(xiàn)空間特征和光譜特征的融合與特征深度優(yōu)化。
首先在特征融合方面,將第一階段采用Dense CNN模型提取的空間和光譜特征進(jìn)行組合以構(gòu)建融合特征。該過程如式(6)所示。
(6)
式中:“+”表示連接操作;L為卷積操作個(gè)數(shù)。
將融合的光譜和空間特征作為第二階段特深層征優(yōu)化網(wǎng)絡(luò)的輸入,如圖3所示,進(jìn)行2D卷積操作捕獲更加精細(xì)化的特征表達(dá)用于分類,網(wǎng)絡(luò)搭建方面,由1個(gè)卷積層、1個(gè)池化層和2個(gè)完全連接層組成。其中卷積層的核大小設(shè)置為3*3,采用的2層全連接層節(jié)點(diǎn)數(shù)大小分別為300和100。在這個(gè)階段中,對融合的空譜聯(lián)合特征進(jìn)行更進(jìn)一步的深入挖掘,對類別的特征描述更加精細(xì)。
對所提出的CNNBSDFF方法在廣泛使用的高光譜數(shù)據(jù)集Purdue和KSC上進(jìn)行了實(shí)驗(yàn),并和其他方法進(jìn)行了比較,對實(shí)驗(yàn)結(jié)果進(jìn)行了比較,分析了各個(gè)網(wǎng)絡(luò)的性能。
采用廣泛使用的高光譜數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),第一個(gè)數(shù)據(jù)集是Purdue數(shù)據(jù)集,該數(shù)據(jù)集是使用機(jī)載可見光AVIRIS成像光譜儀在印第安納州西北部的印度松樹測試場地收集的場景,圖像空間分辨率是20 m,共有220個(gè)波段,每個(gè)波段大小為145×145像素點(diǎn),波長范圍在0.4~2.5 μm。該場景主要包括農(nóng)業(yè)區(qū)和森林,還有一些建筑物以及道路,通用數(shù)據(jù)集選用其中16類用于分類應(yīng)用,圖4(a)和圖4(b)分別為Purdue圖像顯示和地物分布。
圖4 Purdue數(shù)據(jù)集
第2個(gè)數(shù)據(jù)集為肯尼迪航天中心(KSC)數(shù)據(jù),該數(shù)據(jù)是采集于佛羅里達(dá)州的肯尼迪航天中心的高光譜圖像,涉及的數(shù)據(jù)類別主要是13種沼澤類型。KSC場景去除噪聲和水波段外,共有176個(gè)波段,數(shù)據(jù)分辨率大小為512×614。圖5(a)和圖5(b)分別為KSC圖像顯示和地物分布。
圖5 KSC數(shù)據(jù)集
為了分析提出的波段選擇和密集卷積網(wǎng)絡(luò)的可行性,本文利用不同的CNN模型與CNNBSDFF模型進(jìn)行比較,其中將沒有波段選擇的CNNBSDFF模型表示為CNNDFF模型。所有用于比較的網(wǎng)絡(luò)都按照表1中列出的相同的超參數(shù)設(shè)置。此外,該模型的實(shí)現(xiàn)在TensorFlow平臺(tái)上完成,批量大小初始化為100,對所有網(wǎng)絡(luò)均進(jìn)行5 000次迭代訓(xùn)練,學(xué)習(xí)率設(shè)為0.001。其他比較的現(xiàn)有方法包括EPF[22]、MFASR[23]、CNNDH[24],所有網(wǎng)絡(luò)執(zhí)行重復(fù)5次,OA為計(jì)算結(jié)果的平均值。其中,EPF是一種典型的保持圖像邊緣信息的特征表示方法;MFASR中采用了多尺度空間卷積對高光譜數(shù)據(jù)進(jìn)行稀疏特征表示;CNNDH的模型由2個(gè)卷積層,1個(gè)反卷積層和1個(gè)嵌入的哈希語義特征提取模塊組成來提取圖像的特征。在實(shí)驗(yàn)中,各個(gè)模型均采用表1所示的超參數(shù)設(shè)置以便于更加準(zhǔn)確的比較各個(gè)模型的性能。
根據(jù)VD算法[25],所提出的模型從Purdue和KSC數(shù)據(jù)集中選擇的波段數(shù)目分別為18和21,選擇的波段序列和數(shù)據(jù)壓縮大小列于表2,其中Purdue的壓縮率達(dá)到了91.8%,KSC的壓縮率達(dá)到了88.1%。
表2 不同數(shù)據(jù)集波段選擇號與壓縮率
3.3.1Purdue結(jié)果對比分析
Purdue數(shù)據(jù)集實(shí)驗(yàn)的OA值實(shí)驗(yàn)結(jié)果如表3所示??梢钥闯鯟NNBSDFF模型獲得了最高的OA值,為99.37%。根據(jù)實(shí)驗(yàn)結(jié)果,一方面可以證實(shí)密集塊對網(wǎng)絡(luò)模型有一定的積極影響,另一方面通過CNNBSDFF模型的性能優(yōu)于CNNDFF模型也進(jìn)一步說明了提出的顯著性波段選擇方法的必要性,能夠緩和高光譜數(shù)據(jù)中的冗余信息帶來的干擾。
表3 Purdue數(shù)據(jù)集的分類結(jié)果
在對Purdue數(shù)據(jù)集的實(shí)驗(yàn)中,從原始數(shù)據(jù)常用的200個(gè)波段中采用基于波段相關(guān)性的顯著數(shù)據(jù)提取方式選擇出18個(gè)波段,隨機(jī)選擇10%的訓(xùn)練樣本,drop out的值設(shè)置為0.2,輸入數(shù)據(jù)塊大小為19×19×18。Purdue數(shù)據(jù)集實(shí)驗(yàn)的結(jié)果如圖6所示,可以明顯看出采用CNNBSDFF模型更接近真實(shí)地物分布,而采用EPF的網(wǎng)絡(luò)結(jié)構(gòu)得到的地物分布與圖4(b)所展示的真實(shí)地物分布圖相差最大。
圖6 Purdue實(shí)驗(yàn)結(jié)果圖
3.3.2KSC數(shù)據(jù)結(jié)果對比分析
從表4列出的KSC數(shù)據(jù)集分類結(jié)果中可以準(zhǔn)確地看出采用CNNBSDFF模型達(dá)到最高的OA值,且在很多類別上的準(zhǔn)確率都達(dá)到了100%,而CNNDFF的OA值只有94.54%,主要原因是KSC數(shù)據(jù)集相對稀疏的特征分布,對于傳統(tǒng)網(wǎng)絡(luò)通常在譜間和空間特征的表示上更困難。采用文中的顯著性波段選擇方法之后,CNNBSDFF模型獲得的OA為99.53%,比CNNDFF高出5%左右,進(jìn)一步表明,采用顯著性波段提取的方法對KSC數(shù)據(jù)集的訓(xùn)練效果有很大提高,這也進(jìn)一步驗(yàn)證了CNNBSDFF模型在樣本分布稀疏的數(shù)據(jù)集上更具有優(yōu)越性。
表4 KSC數(shù)據(jù)集的分類結(jié)果
在對KSC數(shù)據(jù)集的實(shí)驗(yàn)中,從原始數(shù)據(jù)常用的176個(gè)波段中采用基于波段相關(guān)性的顯著數(shù)據(jù)提取方式選擇出21個(gè)波段,訓(xùn)練樣本百分比依舊設(shè)置為10%,經(jīng)過顯著性波段選擇之后的數(shù)據(jù)樣本大小為19×19×21,將drop out的值固定為0.1。KSC數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如圖7所示,可以明顯看出采用CNNBSDFF模型得到的地物分布圖更接近圖5(b)所展示的KSC真實(shí)地物分布圖。
圖 7 KSC實(shí)驗(yàn)結(jié)果圖
3.3.3波段選擇結(jié)果分析
為了評估本文的BS方法,實(shí)驗(yàn)中與其他數(shù)據(jù)壓縮方法進(jìn)行了比較,比較的方法包括主成分分析(PCA)壓縮數(shù)據(jù)方法和均勻選擇波段方法。其中,PCA方法選取的主要成分的數(shù)目分別為3個(gè)和5個(gè),針對Purdue和KSC數(shù)據(jù)的均勻選擇方法的步長分別設(shè)為11和8。表5展示了不同方法對OA值的影響。
表5 不同波段壓縮方法的分類結(jié)果
由表5可以明顯看出,Purdue和KSC采用顯著性波段選擇方法的OA值比平均選擇方法分別提高了0.53%和6.35%,比PCA(5個(gè)主成分)改善了1.42%和30.53%。PCA的5個(gè)主成分結(jié)果較優(yōu)于3個(gè)主成分,這也說明了在進(jìn)行數(shù)據(jù)壓縮時(shí)來降低冗余度的同時(shí)也會(huì)丟失部分信息,使用平均選擇法的效果略高于PCA,但與本文所采用的顯著性波段選擇方法相比還存在一定的差距。
3.3.4實(shí)驗(yàn)參數(shù)分析
分析3個(gè)參數(shù)(包括drop out,圖像樣本大小和樣本訓(xùn)練比)對CNNBSDFF模型性能的影響(圖8)。Purdue數(shù)據(jù)和KSC數(shù)據(jù)訓(xùn)練樣本的大小和樣本訓(xùn)練比設(shè)為19×19和10%。
圖8 實(shí)驗(yàn)結(jié)果
圖8(a)展示了由所提出的網(wǎng)絡(luò)在2個(gè)數(shù)據(jù)集上由不同的drop out率所獲得的OA值,當(dāng)drop out為0.2時(shí),Purdue數(shù)據(jù)的最高OA值為99.37%,而KSC的最佳OA值為99.55%,drop out比率為0.1,由此可見,所提出的模型可以以較低的drop out率產(chǎn)生最佳性能。并且在drop out率為0.2,訓(xùn)練比為10%的情況下進(jìn)行了樣本大小影響的實(shí)驗(yàn)。改變樣本訓(xùn)練比的實(shí)驗(yàn)結(jié)果如圖8(b)所示,訓(xùn)練樣本的比例從1%到10%不等,可以看出,KSC的精度高于Purdue,并且2條曲線都反映了隨著百分比的增加而增加的趨勢,這也反映了神經(jīng)網(wǎng)絡(luò)需要足夠訓(xùn)練數(shù)據(jù)的事實(shí)。具體來說,OA獲得的最高值是99.37%,Purdue數(shù)據(jù)的比例為10%,最佳OA值是99.58%,比例為9%。當(dāng)百分比為1%時(shí),Purdue和KSC均達(dá)到最低的OA值,分別為96.61%和97.90%。圖8(c)顯示了數(shù)據(jù)集上具有不同樣本大小對應(yīng)的OA值??梢钥闯?,Purdue和KSC數(shù)據(jù)的最佳分類結(jié)果分別為99.57%和99.66%,此時(shí)樣本大小為19×19。在樣本大小為12×12的情況下,Purdue數(shù)據(jù)和KSC數(shù)據(jù)顯示的最低OA值分別為98.02%和98.70%。訓(xùn)練時(shí)間比較結(jié)果如圖8(d)所示。可以進(jìn)一步看出,在相同的參數(shù)設(shè)置下,所提出的CNNBSDFF結(jié)構(gòu)是最高效的模型。
提出了一種基于兩階段CNN的高光譜分類方法,首先通過使用顯著性波段選擇進(jìn)行數(shù)據(jù)壓縮以減少數(shù)據(jù)冗余度,減小計(jì)算復(fù)雜度,再通過兩階段CNN對高光譜圖像的空間和譜間分類信息進(jìn)行深度挖掘。提出的CNNBSDFF模型在第1階段CNN分別采用2D Dense及3D Dense嵌入模塊進(jìn)行空間和譜間的特征提??;在第2階段CNN對譜空特征進(jìn)行融合及進(jìn)一步挖掘,增強(qiáng)分類特征表達(dá)能力。在2個(gè)經(jīng)典高光譜數(shù)據(jù)集Purdue和KSC上的實(shí)驗(yàn)和分析表明,所提出的CNNBSDFF模型在準(zhǔn)確度和對公共數(shù)據(jù)集的計(jì)算方面均展示出優(yōu)越的性能。由于高光譜圖像標(biāo)記困難并且存在嚴(yán)重的樣本不平衡問題,而網(wǎng)絡(luò)通常需要大量的數(shù)據(jù)來學(xué)習(xí)更加精細(xì)的特征用于分類,在少量標(biāo)記樣本的情況下保持模型性能的優(yōu)越性對高光譜圖像分類方面的研究有重大意義,這也是下一步的研究方向。