行敏鋒 ,林清梅,陳 林
(1.電子科技大學(xué) 資源與環(huán)境學(xué)院,四川 成都 611731;2.電子科技大學(xué) 長(zhǎng)三角研究院(湖州),浙江 湖州 313001;3.文山學(xué)院 人工智能學(xué)院,云南 文山 663099)
土壤水分是陸地表面和大氣層之間的水、能量和碳交換的關(guān)鍵環(huán)節(jié)[1]。地表和根區(qū)間的土壤水分控制著降水在地面徑流、蒸發(fā)和入滲之間的分配,控制著植被的蒸騰作用和對(duì)二氧化碳的吸收。因此,土壤濕度被認(rèn)為是一個(gè)重要的氣候變量,對(duì)人們了解水文過(guò)程對(duì)氣候變化的影響至關(guān)重要[2]。對(duì)于草原來(lái)說(shuō),土壤水分是草原植被生長(zhǎng)的基本條件,對(duì)植被狀況監(jiān)測(cè)、草原生物量預(yù)測(cè)、干旱監(jiān)測(cè)和水資源管理等很多方面都有重要的指示意義[3-4]。因此,及時(shí)、準(zhǔn)確地監(jiān)測(cè)草原土壤水分的時(shí)間和空間動(dòng)態(tài)變化對(duì)草原管理具有重要的科學(xué)意義和應(yīng)用價(jià)值。
傳統(tǒng)人工監(jiān)測(cè)草原土壤水分的方法,不僅費(fèi)時(shí)費(fèi)力,且無(wú)法進(jìn)行大范圍的監(jiān)測(cè)[5-6]。遙感技術(shù)的出現(xiàn),為及時(shí)、準(zhǔn)確、大范圍地反演土壤水分提供了技術(shù)手段。與光學(xué)遙感相比,合成孔徑雷達(dá)(Synthetic aperture radar(SAR))作為一種主動(dòng)微波遙感技術(shù),具有全天候、全天時(shí)、高空間分辨率等特點(diǎn)[7],具有穿透地表植被的能力[8]。土壤介電常數(shù)與土壤含水量成正比,SAR后向散射系數(shù)與土壤水分之間具有很高的相關(guān)性[9]。因此,利用SAR可以估算土壤水分含量。基于SAR反演土壤水分的方法主要有Oh方法[10],Dubois方法[11],和IEM方法[12]等,但這些方法主要應(yīng)用于裸土區(qū)域或植被覆蓋稀疏的區(qū)域。在草原上,由于SAR后向散射系數(shù)對(duì)植被覆蓋[13-14]和地表粗糙度[15]也很敏感,這使得利用SAR數(shù)據(jù)估算土壤水分更為復(fù)雜[16]。利用上述方法反演草原土壤水分,將會(huì)低估土壤水分或高估表面粗糙度[17]。
機(jī)器學(xué)習(xí)方法不受地面參數(shù)的限制,能夠避免復(fù)雜的物理關(guān)系,高效地解決非線性問(wèn)題,在土壤水分反演方面得到了廣泛應(yīng)用[18]。隨機(jī)森林方法是機(jī)器學(xué)習(xí)算法的一種,可用于分類和回歸。就預(yù)測(cè)精度而言,隨機(jī)森林是最有效的機(jī)器學(xué)習(xí)算法之一[19]。因此,本文基于隨機(jī)森林方法,實(shí)現(xiàn)草原土壤水分反演,并建立一個(gè)草原土壤水分反演應(yīng)用示范系統(tǒng),進(jìn)行草原旱情監(jiān)測(cè)與報(bào)告。
本文選用了2景RADARSAT-2 SAR數(shù)據(jù)進(jìn)行土壤水分反演,其拍攝時(shí)間分別為2013年8月4日和8月7日,極化方式為全極化(HH/HV/VH/VV)。SAR數(shù)據(jù)的預(yù)處理過(guò)程主要有:輻射定標(biāo)、極化矩陣生成、極化濾波、極化分解、地形校正與投影變換。為了驗(yàn)證反演算法的精度和有效性,在RADARSAT-2衛(wèi)星過(guò)境的時(shí)候,同步進(jìn)行地面土壤水分?jǐn)?shù)據(jù)的測(cè)量。
根據(jù)RADARSAT-2 SAR數(shù)據(jù)提取用來(lái)估算土壤水分的特征。本文中,提取的特征主要包括:(1)四種極化方式(HH/HV/VH/VV)的后向散射系數(shù);(2)相干矩陣 T3(T11、T22和T33);(3)Cloude 分解的極化特征參數(shù)(Cdbl、Cvol和Csurf);(4)Freeman-Durden 分解的極化特征參數(shù)(Fdbl、Fvol和Fsurf);(5)H-A-Alpha分解的極化特征參數(shù)(熵E、各向異性A和散射角Alpha);(6)Pauli分解的極化特征參數(shù)(Pr、Pg和Pb);(7)Touzi分解的極化特征參數(shù)(Tpsi、Ttau、Talpha和Tphi);(8)Van Zyl分解的極化特征參數(shù)(Vdbl、Vvol和Vsurf);(9)Yamaguchi分 解 的 極 化特征參數(shù)(Ydbl、Yvol、Ysurf和Yhlx)。
隨機(jī)森林是一種精細(xì)監(jiān)督分類方法,其基于“裝袋”和特征隨機(jī)選擇的組合構(gòu)建具有受控方差的決策樹(shù)集合[20]。目前,隨機(jī)森林已經(jīng)廣泛應(yīng)用于各個(gè)研究領(lǐng)域[21-22]。
如果經(jīng)過(guò)良好訓(xùn)練,隨機(jī)森林可以處理數(shù)千個(gè)特征的向量,并生成具有高分類精度的分類器。因此,本研究利用隨機(jī)森林方法進(jìn)行土壤水分反演。
特征選擇是隨機(jī)森林方法中非常重要的步驟,選擇的特征不同,最后得到的反演效果也不相同。為了比較不同的特征選擇結(jié)果,本文利用三種方法進(jìn)行特征選擇。
(1)相關(guān)系數(shù):利用相關(guān)系數(shù)(R)判斷兩個(gè)變量之間的是否存在線性關(guān)系,其取值范圍為-1到1。R的絕對(duì)值越接近1,說(shuō)明兩個(gè)變量之間的線性關(guān)系越強(qiáng)。相反,R的絕對(duì)值越接近0,說(shuō)明兩個(gè)變量之間的線性關(guān)系越弱。
(2)遞歸特征消除:使用基礎(chǔ)模型進(jìn)行多輪訓(xùn)練,在每一輪訓(xùn)練之后,去除一些不重要的特征,然后基于新的特征進(jìn)行下一輪的訓(xùn)練,直到剩余的特征數(shù)量達(dá)到所需的數(shù)量。
(3)隨機(jī)森林因子重要性:根據(jù)每個(gè)特征在隨機(jī)森林中每棵樹(shù)上的貢獻(xiàn),比較特征之間的貢獻(xiàn)大小。
為了構(gòu)建草原土壤水分反演應(yīng)用示范系統(tǒng),我們建立了基于瀏覽器,服務(wù)器的Web應(yīng)用系統(tǒng)。該系統(tǒng)主要包括用戶管理、土壤水分反演、自動(dòng)化旱情監(jiān)測(cè)和報(bào)告等功能。用戶管理主要對(duì)用戶進(jìn)行手機(jī)號(hào)碼驗(yàn)證,以及用戶的權(quán)限、個(gè)人信息等管理與維護(hù)。土壤水分反演采用模塊化實(shí)現(xiàn),主要包括重要因子排序、基于隨機(jī)森林的土壤水分反演、土壤水分制圖、旱情監(jiān)測(cè)報(bào)告等。旱情監(jiān)測(cè)和報(bào)告是基于估算的土壤水分結(jié)果,根據(jù)中國(guó)水利部2008年頒布的旱情等級(jí)標(biāo)準(zhǔn)(SL 424-2008)[23]進(jìn)行報(bào)告。
從原始RADARSAT-2 SAR數(shù)據(jù)中共獲取了30個(gè)特征變量。為了提高利用隨機(jī)森林方法反演土壤水分的性能,提高土壤水分反演的精度,我們利用三種特征選擇方法(相關(guān)系數(shù)、遞歸特征消除、隨機(jī)森林因子重要性)來(lái)減小特征的冗余性。
(1)相關(guān)系數(shù):計(jì)算了不同特征參數(shù)與測(cè)量的土壤水分支架的R,并根據(jù)單個(gè)參數(shù)與土壤水分之間的R的絕對(duì)值進(jìn)行排列(如圖1所示)。從圖1中可以看出,這些參數(shù)與土壤水分的R的絕對(duì)值小于0.3。
圖1 RADARSAT-2 SAR參數(shù)與土壤水分之間的相關(guān)系數(shù)
(2)遞歸特征消除:獲得的特征參數(shù)的重要性排序如表1所示。
表1 特征參數(shù)的重要性排序
(3)隨機(jī)森林因子重要性:使用隨機(jī)森林訓(xùn)練模型后,可以得到每個(gè)變量在模型構(gòu)建過(guò)程中的重要性得分。特征的重要性得分越高,則對(duì)預(yù)測(cè)結(jié)果的影響越大。特征重要性排序如圖2所示。
圖2 基于隨機(jī)森林的因子重要性排序
不同方法選擇的特征重要性排序是不同的。為了比較特征選擇方法在模型中的性能,將三種方法選擇的特征分別應(yīng)用于隨機(jī)森林算法。根據(jù)因子排序,首先使用重要性排序最高的特征構(gòu)建模型,然后使用前兩個(gè)特征構(gòu)建模型,以此類推,逐漸增加特征數(shù),直到所有特征都被使用?;陔S機(jī)森林方法的三種特征選擇的在驗(yàn)證集上估算結(jié)果如圖3所示。橫坐標(biāo)表示使用的特征數(shù)量,縱坐標(biāo)表示土壤水分測(cè)量值與估計(jì)值之間的相關(guān)系數(shù)。從圖3中可以看到,擬合精度先快速增加,然后趨于平穩(wěn)。
圖3 不同特征個(gè)數(shù)時(shí)隨機(jī)森林估算土壤水分精度
根據(jù)模型訓(xùn)練結(jié)果,基于隨機(jī)森林方法,分別結(jié)合三種因子選擇方法進(jìn)行土壤水分反演,驗(yàn)證集上估算精度最高時(shí)的結(jié)果如圖4(訓(xùn)練集)和圖5(驗(yàn)證集)所示。
圖4 土壤水分實(shí)測(cè)值與估算值之間的散點(diǎn)圖(訓(xùn)練集)
圖5 土壤水分實(shí)測(cè)值與估算值之間的散點(diǎn)圖(驗(yàn)證集)
從圖4中可以看出,利用隨機(jī)森林方法,結(jié)合三種特征選擇在訓(xùn)練集上均取得了令人滿意的效果。其中,基于隨機(jī)森林因子重要性獲得的土壤水分反演的精度最高(R2=0.897,RMSE=2.97 vol.%),且使用的特征個(gè)數(shù)最少(14個(gè))?;谙嚓P(guān)系數(shù)獲得的土壤水分反演的精度最低(R2=0.861,RMSE=3.11 vol.%),且使用的特征個(gè)數(shù)最多(30個(gè))。基于遞歸特征消除獲得的土壤水分反演的精度居中(R2=0.863,RMSE=3.26 vol.%),使用了24個(gè)特征個(gè)數(shù)??紤]驗(yàn)證集的結(jié)果(圖5),基于遞歸特征消除和基于隨機(jī)森林因子重要性的土壤水分反演精度相差不大,基于相關(guān)系數(shù)的土壤水分反演精度最低。
根據(jù)2.3的分析結(jié)果,我們利用隨機(jī)森林方法,結(jié)合隨機(jī)森林因子重要性排序進(jìn)行土壤水分反演,對(duì)若爾蓋草原實(shí)驗(yàn)區(qū)的土壤水分進(jìn)行制圖,獲得該區(qū)域土壤水分的空間分布(圖6)。
圖6 若爾蓋草原的土壤水分分布圖(2013年8月7日)
獲得土壤水分的空間分布后,根據(jù)旱情等級(jí)標(biāo)準(zhǔn)(SL 424-2008)進(jìn)行旱情監(jiān)測(cè)報(bào)告,將旱情分為未發(fā)生干旱、輕度干旱、中度干旱、嚴(yán)重干旱和特大干旱五類。對(duì)于8月7日的若爾蓋草原來(lái)說(shuō),旱情監(jiān)測(cè)報(bào)告如圖7所示。因此,我們構(gòu)建的草原土壤水分反演應(yīng)用示范系統(tǒng),能夠基于SAR數(shù)據(jù)進(jìn)行自動(dòng)化土壤水分反演,自動(dòng)進(jìn)行草原旱情監(jiān)測(cè)與報(bào)告,可為農(nóng)業(yè)部門(mén)在大面積草原的旱情監(jiān)測(cè)、風(fēng)險(xiǎn)評(píng)估和草原管理方面提供技術(shù)支持和數(shù)據(jù)支撐。
圖7 旱情監(jiān)測(cè)報(bào)告
本文評(píng)估了基于RADARSAT-2 SAR數(shù)據(jù),利用隨機(jī)森林反演草原土壤水分的潛力,比較了不同特征選擇方法進(jìn)行草原土壤水分反演的優(yōu)劣。根據(jù)土壤水分反演結(jié)果,可以得出如下結(jié)論。
(1)SAR數(shù)據(jù)的極化分解參數(shù)和后向散射系數(shù)可以應(yīng)用于草原土壤水分反演。
(2)利用隨機(jī)森林方法時(shí),隨機(jī)森林因子重要性排序的方法是有效的,僅需要少量的特征即可實(shí)現(xiàn)較好的土壤水分反演效果。
(3)建立了一套草原土壤水分反演應(yīng)用示范系統(tǒng),可以利用SAR數(shù)據(jù),自動(dòng)化完成土壤水分反演,自動(dòng)進(jìn)行草原旱情監(jiān)測(cè)與報(bào)告。