張偉濤,王 敏,郭 交
(1.西安電子科技大學(xué)電子工程學(xué)院,陜西西安 710071;2.西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院,陜西楊凌 712100)
農(nóng)作物分類在農(nóng)業(yè)遙感監(jiān)測(cè)中起著重要的作用,是進(jìn)一步監(jiān)測(cè)農(nóng)作物生長(zhǎng)及產(chǎn)量的前提。因此,農(nóng)作物分類對(duì)于指導(dǎo)農(nóng)業(yè)生產(chǎn)、合理分配農(nóng)業(yè)資源、保障國(guó)家糧食安全具有重要意義。
隨著遙感技術(shù)及其理論的不斷進(jìn)步和發(fā)展,已廣泛應(yīng)用于農(nóng)作物普查、生長(zhǎng)監(jiān)測(cè)、產(chǎn)量預(yù)測(cè)和災(zāi)害評(píng)估等農(nóng)業(yè)領(lǐng)域。偏振合成孔徑雷達(dá)(Polarimatric Synthetic Aperture Radar,PolSAR)作為微波遙感系統(tǒng)中一種主動(dòng)遙感技術(shù),具有其他遙感技術(shù)無(wú)法比擬的優(yōu)勢(shì),其工作條件不受天氣和氣候限制。近年來(lái),農(nóng)作物分類研究大多采用單時(shí)相PolSAR 數(shù)據(jù),然而,由于不同農(nóng)作物間相同的長(zhǎng)勢(shì)狀況,單一時(shí)相的PolSAR 圖像很難識(shí)別出不同的農(nóng)作物類別,尤其是在播種時(shí)期。因此,有必要采集多時(shí)相PolSAR 數(shù)據(jù)用于農(nóng)作物分類,從而提高分類精度。
由于對(duì)多時(shí)相全極化PolSAR 數(shù)據(jù)進(jìn)行極化特征分解后的數(shù)據(jù)直接分類會(huì)出現(xiàn)所謂的“維數(shù)災(zāi)難”問(wèn)題,因此,對(duì)多時(shí)相數(shù)據(jù)極化分解后的特征進(jìn)行降維成為一項(xiàng)重要的工作。主成分分析法(Principle Component Analysis,PCA)和局部線性嵌入法(Locally Linear Embedded,LLE)是解決“維數(shù)災(zāi)難”問(wèn)題常用的特征壓縮方法。PCA 是一個(gè)線性的數(shù)據(jù)處理方法,但實(shí)際工程中大多數(shù)問(wèn)題都是非線性的;LLE 可以自動(dòng)從高維數(shù)據(jù)中提取非線性的低維特征,但對(duì)異常值非常敏感。近年來(lái),隨著深度學(xué)習(xí)的發(fā)展,出現(xiàn)了一些成熟的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(如自編碼器、稀疏自編碼器),在特征壓縮和圖像分類方面都具有良好的性能。然而,稀疏自編碼器的稀疏性在提取有效分類特征時(shí)并沒(méi)有得到充分的利用,并且常見(jiàn)的傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和支持向量機(jī)(Supper Vector Machine,SVM)分類器在分類時(shí)也不能獲取到壓縮特征的多尺度信息。基于上述缺點(diǎn),農(nóng)作物分類性能不能達(dá)到實(shí)際應(yīng)用水平。
為了利用多時(shí)相PolSAR 數(shù)據(jù)對(duì)農(nóng)作物進(jìn)行分類并且解決“維數(shù)災(zāi)難”的問(wèn)題,首先采用了一種非負(fù)性約束稀疏自編碼器(Sparse Auto-Encoder with Non-negativity Constraints,NC-SAE)網(wǎng)絡(luò)進(jìn)行特征降維,提取有效的極化特征信息。然后,構(gòu)建了一個(gè)多尺度特征分類網(wǎng)絡(luò)(Multi-scale Feature Classification Network,MSFCN)實(shí)現(xiàn)農(nóng)作物的分類識(shí)別,大幅提高了農(nóng)作物的分類精度。
全極化合成孔徑雷達(dá)用于接收目標(biāo)的后向散射信號(hào),以HH、HV、VH 和VV 這4 種組合方式測(cè)量幅值和相位,其中H 為水平模式,V 為垂直模式。采集的每個(gè)像素的散射信息用一個(gè)2×2 的復(fù)矩陣表示,這些復(fù)數(shù)關(guān)系到入射電場(chǎng)和散射電場(chǎng):
式中:為垂直發(fā)射和水平接收的極化散射因子,同理可定義式中其他參數(shù)。
通過(guò)對(duì)散射矩陣矢量化可以得到目標(biāo)特征向量,由于PolSAR 數(shù)據(jù)是復(fù)對(duì)稱數(shù)據(jù),符合后向散射互易定理,可以將近似等于,因此,偏振散射矩陣可以重寫(xiě)為L(zhǎng)exicographic 散射向量:
式中:上標(biāo)*為復(fù)數(shù)的共軛。
NC-SAE 是在自編碼器的基礎(chǔ)上發(fā)展而來(lái),是數(shù)據(jù)表征的無(wú)監(jiān)督學(xué)習(xí)算法,其目的是使輸出值盡可能接近輸入值。單層自編碼器網(wǎng)絡(luò)的基本結(jié)構(gòu)由3 部分組成:編碼器、激活層、解碼器。自編碼器網(wǎng)絡(luò)采用最速下降法進(jìn)行網(wǎng)絡(luò)訓(xùn)練,最終實(shí)現(xiàn)目標(biāo)函數(shù)的最小化,其目標(biāo)函數(shù)為輸入與輸出之間的重構(gòu)誤差,表示如下:
式中:為訓(xùn)練樣本數(shù);()為第個(gè)樣本的輸入數(shù)據(jù);()為第個(gè)樣本的重構(gòu)輸出。
NC-SAE 是在自編碼器的目標(biāo)函數(shù)上增加2 個(gè)約束項(xiàng)進(jìn)行實(shí)現(xiàn)。第一個(gè)約束項(xiàng)為稀疏約束:
該約束使網(wǎng)絡(luò)訓(xùn)練過(guò)程具有較快的收斂速度。稀疏約束項(xiàng)的目的是通過(guò)限制隱藏層的激活神經(jīng)元個(gè)數(shù)來(lái)增加網(wǎng)絡(luò)的稀疏性,通常使用KL(Kullback-Leibler)散度函數(shù)表示。
可以看出:當(dāng)(稀疏參數(shù))和ˉ(平均激活值)趨于相等時(shí),趨于0;當(dāng)兩者相差越大時(shí),較大。第2 個(gè)約束項(xiàng)為非負(fù)性約束,其有利于避免網(wǎng)絡(luò)訓(xùn)練過(guò)程中的過(guò)擬合現(xiàn)象,計(jì)算式如下:
式中:為權(quán)值;為層數(shù)。
綜上所述,NC-SAE 的目標(biāo)函數(shù)表示如下:
式中:為非負(fù)性約束項(xiàng)的系數(shù);為稀疏約束項(xiàng)的系數(shù)。
采用最速下降法更新式(8)目標(biāo)函數(shù)中的權(quán)重和偏置,計(jì)算式如下:
式中:為迭代次數(shù);為學(xué)習(xí)率。
采用誤差反向傳播算法計(jì)算式(9)中的偏導(dǎo)數(shù)。在解碼過(guò)程時(shí),目標(biāo)函數(shù)對(duì)權(quán)值的偏導(dǎo)數(shù)為
式中:(·)為(·)的偏導(dǎo)數(shù)。
(·)是一個(gè)sigmoid 函 數(shù),一般選 取logsig 函數(shù),如下所示:
此時(shí),式(10)可表示為
然后,對(duì)編碼過(guò)程的偏導(dǎo)數(shù)求解如下:
編碼過(guò)程和解碼過(guò)程目標(biāo)函數(shù)對(duì)偏置的導(dǎo)數(shù)計(jì)算如下:
提出的MSFCN 的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示,其主要包括3 個(gè)部分:多尺度特征提取、特征融合、分類。首先,利用卷積層中多個(gè)不同大小的卷積核提取不同尺度的特征信息;然后,將獲取的不同尺度的特征信息使用concat 層進(jìn)行融合作為分類層的輸入數(shù)據(jù);最后,采用softmax 層進(jìn)行分類。因此,MSFCN不僅利用卷積層中的不同卷積核提取多尺度特征信息,而且可以捕捉到特征圖之間的細(xì)微差別。
圖1 多尺度特征分類網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Architecture of MSFCN
使用的實(shí)驗(yàn)數(shù)據(jù)由歐洲航天局提供,主要用于評(píng)估所提方法的分類性能。實(shí)驗(yàn)區(qū)域位于加拿大薩斯克切溫省東南部的Indian Head 小鎮(zhèn),是一個(gè)約為14 km×19 km 的矩形區(qū)域。該區(qū)域共包含14 種不同類型的農(nóng)作物和一個(gè)“非農(nóng)作物”類別,“非農(nóng)作物”類別可能是城鎮(zhèn)、道路或天然植被區(qū)等非農(nóng)作物地物。實(shí)驗(yàn)區(qū)域各農(nóng)作物數(shù)據(jù)的具體信息見(jiàn)表1。
表1 研究區(qū)農(nóng)作物類型及其信息統(tǒng)計(jì)Tab.1 Information statistics of crops in the study area
實(shí)驗(yàn)所用的PolSAR 數(shù)據(jù)是利用歐空局發(fā)射的Radarsar-2 衛(wèi)星采集的真實(shí)數(shù)據(jù),通過(guò)模擬還未發(fā)射的Sentinel-1 系統(tǒng)參數(shù)而生成的仿真數(shù)據(jù)。數(shù)據(jù)采集時(shí)間分別是2009 年4 月21 日、5 月15 日、6 月8日、7 月2 日、7 月26 日、8 月19 日和9 月12 日,這7 個(gè)時(shí)間段的PolSAR 數(shù)據(jù)幾乎涵蓋了實(shí)驗(yàn)區(qū)域所有農(nóng)作物的從播種到收割的整個(gè)生長(zhǎng)周期。對(duì)單個(gè)時(shí)相的PolSAR 數(shù)據(jù)使用極化特征分解方法進(jìn)行特征分解,可以獲得36 維特征。因此,7 個(gè)時(shí)相的Pol-SAR 數(shù)據(jù)一共可以獲得252 維特征信息。
為了對(duì)分類結(jié)果進(jìn)行精確的評(píng)估與分析,使用整體分類精度(Overall Accuracy,OA)和Kappa 系數(shù)進(jìn)行結(jié)果對(duì)比。其中,整體分類精度OA 表示正確分類的樣本數(shù)與樣本總數(shù)之比,具體計(jì)算式如下:
式中:為分類正確的樣本數(shù);為所有樣本的總數(shù)。
Kappa 系數(shù):常見(jiàn)計(jì)算分類精度的算法,來(lái)源于一致性檢驗(yàn),用于評(píng)價(jià)分類算法的分類性能,它是衡量預(yù)測(cè)輸出與地面真實(shí)值一致性的標(biāo)準(zhǔn),有效避免了因某一類目標(biāo)地物分類精度高而導(dǎo)致整體分類精度高,進(jìn)而誤以為模型分類效果好的情況。整體分類精度僅涉及正確預(yù)測(cè)的樣本數(shù),與之不同的是,Kappa 系數(shù)考慮了位于混淆矩陣非對(duì)角線上的各種缺失和誤分類樣本,其計(jì)算式如下:
式中:為整體分類精度;為待分類目標(biāo)的樣本總數(shù);為待分類目標(biāo)的類別數(shù);為分類算法的混淆矩陣;Z為混淆矩陣第行所有列的值之和;為混淆矩陣第列所有行的值之和。
本文對(duì)提出的特征降維方法、分類網(wǎng)絡(luò)與傳統(tǒng)的降維方法和分類方法進(jìn)行了比較分析。首先利用所提的NC-SAE 以及傳統(tǒng)的LLE、PCA、S-SAE等特征降維方法,對(duì)極化分解后的252 維特征進(jìn)行降維,從而獲得9 維特征;然后將降維后的9 維特征分別輸入SVM、CNN 和MSFCN 分類器進(jìn)行分類,每個(gè)分類器的訓(xùn)練樣本選擇總樣本的1%。
不同分類器的分類結(jié)果和誤差如圖2 所示。對(duì)于CNN 和MSFCN 分類網(wǎng)絡(luò),其輸入樣本尺寸也會(huì)影響農(nóng)作物的分類性能,因此,對(duì)不同輸入樣本大小下的分類結(jié)果也進(jìn)行了比較,整個(gè)實(shí)驗(yàn)結(jié)果見(jiàn)表2。
結(jié)合圖2 和表2 中的分類結(jié)果,得出如下結(jié)論:
表2 不同方法的分類精度統(tǒng)計(jì)Tab.2 Classification accuracy of different methods
圖2 不同分類器的分類結(jié)果和誤差Fig.2 Classification results by different classifiers
1)與傳統(tǒng)的LLE、PCA 降維方法相比,使用NC-SAE 和S-SAE 降維方法獲取的特征信息進(jìn)行分類的農(nóng)作物總體分類精度提高了6% 以上,雖然NC-SAE 和S-SAE 的分類精度幾乎相同,但是這2個(gè)自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)不同。提出的NC-SAE 是一個(gè)單層網(wǎng)絡(luò),而S-SAE 是將3個(gè)自編碼器依次連接而成的三層網(wǎng)絡(luò),因此,NC-SAE 的計(jì)算復(fù)雜度更低。
2)比較不同分類器的分類性能,由圖2 可以清楚地看出MSFCN 的分類效果比其他分類網(wǎng)絡(luò)更好。同時(shí),由表2 可以得出,MSFCN 網(wǎng)絡(luò)的整體分類精度OA 比SVM 和CNN 分別高21%和12%。
3)CNN 和MSFCN 網(wǎng)絡(luò)的輸入大小對(duì)分類性能也有一定的影響,增大輸入大小可以顯著提高農(nóng)作物的分類精度。通過(guò)實(shí)驗(yàn)證明,建議在實(shí)際應(yīng)用中選擇中等大小尺寸35×35。
4)分析農(nóng)作物分類的整個(gè)實(shí)驗(yàn)過(guò)程,通過(guò)對(duì)比表2 中的結(jié)果可以得出,所提出的NC-SAE 與MSFCN 結(jié)合的方法可以獲得最好的分類性能。
本文構(gòu)建了一種新的MSFCN 用于完成對(duì)多時(shí)相PolSAR 數(shù)據(jù)的分類。為了解決維數(shù)災(zāi)難問(wèn)題,提出了一種改進(jìn)的自編碼器NC-SAE,用于對(duì)多時(shí)相PolSAR 數(shù)據(jù)的極化散射特征降維。與此同時(shí),利用歐空局提供的Sentinel-1 系統(tǒng)模擬多時(shí)相PolSAR 數(shù)據(jù)和實(shí)驗(yàn)區(qū)域的地面真實(shí)值對(duì)所提方法進(jìn)行分類性能評(píng)估。與傳統(tǒng)的分類方法SVM 和CNN 相比,最終分類結(jié)果表明:對(duì)于多時(shí)相PolSAR 數(shù)據(jù)的農(nóng)作物分類,所提方法MSFCN 網(wǎng)絡(luò)的分類性能最優(yōu)。
此外,對(duì)于提出的多時(shí)相PolSAR 數(shù)據(jù)農(nóng)作物分類方法,還可以進(jìn)行進(jìn)一步的研究。首先,對(duì)于NC-SAE 的超參數(shù),直接使用S-SAE 方法的經(jīng)驗(yàn)值,但不一定是NC-SAE 方法在特征降維時(shí)的最優(yōu)值,因此,NC-SAE 最優(yōu)值的選取值得后續(xù)繼續(xù)研究;其次,使用了2 個(gè)階段(特征壓縮和作物分類)實(shí)現(xiàn)對(duì)多時(shí)相農(nóng)作物數(shù)據(jù)的分類,對(duì)此也可以進(jìn)行優(yōu)化,研究出更簡(jiǎn)便的方法,即使用一個(gè)獨(dú)立網(wǎng)絡(luò)實(shí)現(xiàn)多時(shí)相PolSAR 數(shù)據(jù)的農(nóng)作物分類,將進(jìn)一步簡(jiǎn)化分類過(guò)程,減少計(jì)算量。