李 艷,張成才,恒衛(wèi)東
(1.河口生態(tài)安全與環(huán)境健康福建省高校重點(diǎn)實(shí)驗(yàn)室,福建 漳州 363000;2.廈門大學(xué)嘉庚學(xué)院 環(huán)境科學(xué)與工程學(xué)院,福建 漳州 363000;3.鄭州大學(xué)水利科學(xué)與工程學(xué)院,鄭州 450001)
準(zhǔn)確獲取土壤墑情,特別是糧食主產(chǎn)區(qū)的土壤墑情信息,對(duì)于保障農(nóng)作物健康生長(zhǎng)發(fā)育,估算農(nóng)作物需水情況,制定農(nóng)作物生長(zhǎng)灌溉用水計(jì)劃,指導(dǎo)農(nóng)業(yè)建設(shè)、防旱抗旱以及農(nóng)田生態(tài)環(huán)境修復(fù)都具有重要的科學(xué)意義和現(xiàn)實(shí)意義[1,2]。
遙感技術(shù)能夠快速、準(zhǔn)確、可持續(xù)地獲取大面積地表信息,是目前監(jiān)測(cè)和反演土壤墑情的主要手段之一。根據(jù)傳感器的不同,遙感可大致分為光學(xué)遙感和微波遙感。光學(xué)遙感是目前發(fā)展較為成熟的遙感手段,基于光學(xué)遙感發(fā)展了一大批土壤墑情反演方法[3-5]。但是,光學(xué)遙感受云層、太陽照射以及天氣條件的影響較大[6]。微波遙感不僅能夠全天時(shí)、全天候的對(duì)地物進(jìn)行探測(cè),還能夠穿透云霧和一定厚度的植被而直接獲取地表信息,有效彌補(bǔ)了光學(xué)遙感的不足[7,8]。以合成孔徑雷達(dá)(Synthetic Aperture Radar, SAR)為代表的主動(dòng)微波,其后向散射系數(shù)對(duì)地物的幾何特征如地表粗糙度、介電特性等非常敏感,為反演土壤墑情提供了可靠的數(shù)據(jù)支持[9]。受地表粗糙度、植被的衰減等因素影響,微波信號(hào)與土壤水分之間的關(guān)系很難用數(shù)學(xué)解析式精確表達(dá)[10]。
與傳統(tǒng)統(tǒng)計(jì)回歸方法相比,機(jī)器學(xué)習(xí)方法具有很強(qiáng)的自學(xué)習(xí)、自組織和自適應(yīng)等能力,非常適合解決這種非線性的復(fù)雜問題。因此,機(jī)器學(xué)習(xí)方法在土壤墑情反演研究中得到了廣泛的應(yīng)用。Paloscia 等[11]利用模擬的Sentinel-1 SAR 數(shù)據(jù),采用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)配置不同的訓(xùn)練數(shù)據(jù),在意大利、澳大利亞和西班牙等6個(gè)試驗(yàn)區(qū)對(duì)土壤墑情進(jìn)行反演。結(jié)果表明,在6 個(gè)實(shí)驗(yàn)區(qū)域中采用ANN得到的土壤墑情與實(shí)測(cè)值的均方根誤差(RMSE)介于1.67%和6.68%之間,且大部分區(qū)域小于4%。 Greifeneder 等[12]將Sentinel-1 SAR數(shù)據(jù)與Landsat-8的光學(xué)數(shù)據(jù)相結(jié)合,采用漸進(jìn)梯度決策樹(Gradient Boosting Decision Tree , GBDT)的機(jī)器學(xué)習(xí)方法,對(duì)全球的地表土壤墑情進(jìn)行了反演。結(jié)果顯示:不同的土壤類型反演結(jié)果略有差異,總體的RMSE和R2分別為0.04 m3/m3和0.81。蔣金豹等[13]首先利用MIMICS (Michigan Microwave Canopy Scattering) 模型和高級(jí)積分方程模型(Advanced Integral Equation Model, AIEM)模型建立后向散射系數(shù)數(shù)據(jù)庫(kù),然后分別采用BP 神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine, SVM)、 思維進(jìn)化算法(Mind Evolutionary Algorithm, MEA) 與BP 神經(jīng)網(wǎng)絡(luò)結(jié)合(MEABP)、最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LS-SVM)等方法建立模型,實(shí)現(xiàn)研究區(qū)麥田土壤墑情的反演。結(jié)果發(fā)現(xiàn),采用LS-SVM 模型反演結(jié)果精度最高,BP 神經(jīng)網(wǎng)絡(luò)的擬合結(jié)果精度最低。基于人工神經(jīng)網(wǎng)絡(luò),2006年由多倫多大學(xué)的Hinton 研究組提出“深度學(xué)習(xí)”的概念[14]。深度神經(jīng)網(wǎng)絡(luò)通過模擬生物神經(jīng)元對(duì)刺激的非線性響應(yīng)來對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),能夠表征更加抽象的數(shù)據(jù)特征和模式[15]。由多個(gè)層次或多個(gè)非線性信息處理模塊組成的深度學(xué)習(xí)不僅具備從大數(shù)據(jù)中學(xué)習(xí)的能力,并且能夠更好的表達(dá)變量與結(jié)果之間復(fù)雜的非線性關(guān)系,在計(jì)算機(jī)視覺、語音及圖像識(shí)別、信息檢索、圖像特征編碼等眾多領(lǐng)域都有出色的表現(xiàn)[16]。近幾年,利用深度學(xué)習(xí)的方法反演土壤墑情的研究也在不斷增加。Babaeian 等[17]基于高空間分辨率光學(xué)反射率無人機(jī)系統(tǒng)(UAS)和自動(dòng)機(jī)器學(xué)習(xí)(AutoML),反演地表、近地表和根區(qū)土壤墑情。Fang 等[18]利用SMAP 衛(wèi)星結(jié)合LSTM 架構(gòu)的深層遞歸神經(jīng)網(wǎng)絡(luò),對(duì)美國(guó)大陸的土壤含水量進(jìn)行了反演研究。
本研究選取河南省鶴壁市的麥田為研究對(duì)象,綜合光學(xué)和微波遙感的各自優(yōu)勢(shì),提取雷達(dá)后向散射系數(shù),計(jì)算植被含水量以及植被覆蓋度等信息,全連接深度學(xué)習(xí)的方法對(duì)研究區(qū)麥田土壤墑情進(jìn)行反演研究,以期為監(jiān)測(cè)麥田旱情提供決策信息。
鶴壁市位于河南省北部(113°59'E~114°45'E,35°26'N~36°02'N),南北長(zhǎng)67 km,東西寬69 km,總面積約2 182 km2,屬暖溫帶半濕潤(rùn)型季風(fēng)氣候,四季分明,冬春兩季降雨少,夏秋兩季降雨多,年平均氣溫14.2~15.5 ℃,年降水349.2~970.1 mm。 鶴壁市在2012年被農(nóng)業(yè)部確定為全國(guó)5 個(gè)整建制推進(jìn)高產(chǎn)創(chuàng)建試點(diǎn)市之一,農(nóng)業(yè)機(jī)械化、信息化和標(biāo)準(zhǔn)化水平位于全國(guó)前列,是河南省唯一基本實(shí)現(xiàn)農(nóng)業(yè)現(xiàn)代化的地區(qū)。截至2019年7月,優(yōu)質(zhì)專用小麥種植面積183.33 km2,較2018年增長(zhǎng)64.7%(https://www.hebi.gov.cn)。圖1 是研究區(qū)及試驗(yàn)點(diǎn)位置示意圖。
圖1 研究區(qū)地理位置及采樣點(diǎn)分布圖
1.2.1 Sentinel-1及預(yù)處理
Sentinel-1 衛(wèi)星是C 波段合成孔徑雷達(dá)(SAR),由Sentinel-1A 和 Sentinel-1B 兩顆衛(wèi)星組成。單個(gè)衛(wèi)星每12 天映射全球一次,雙星座重訪周期縮短至6 天。Sentinel-1 衛(wèi)星具有4 種成像模式(干涉寬幅模式(Interferometric Wide Swath,IW)、條帶模式(Strip Map,SM)、超幅寬模式(Extra Wide Swath,EW)和波模式(Wave Mode,WV))實(shí)現(xiàn)對(duì)地觀測(cè),具有全天時(shí)、全天候、大范圍、多模式、短重返周期等特點(diǎn)。Sentinel-1 數(shù)據(jù)產(chǎn)品分為L(zhǎng)evel-0,Level-1 和Level-2 三個(gè)級(jí)別,其中,Level-1 級(jí)數(shù)據(jù)產(chǎn)品包括:?jiǎn)我晱?fù)數(shù)影像(Single Look Complex,SLC) 和地距影像(Ground Range Detected,GRD)。
本研究從哥白尼開放獲取中心(https://scihub.copernicus.eu)獲取了2018年10月至2019年5月Sentinel-1A SAR IW 模式下Level-1 級(jí)別的SLC 產(chǎn)品共17 景,極化方式為VV 和VH。Sentinel-1A SAR 遙感數(shù)據(jù)采用歐空局提供的SNAP軟件對(duì)其進(jìn)行輻射定標(biāo)、去噪處理、圖像拼接以及地理編碼等處理,得出雷達(dá)影像圖。圖2 為經(jīng)過預(yù)處理得到VV 和VH 極化后向散射系數(shù),并采用Arcgis 軟件對(duì)后向散射系數(shù)進(jìn)行了色彩上的調(diào)整。
圖2 研究區(qū) VH/VV 極化的后向散射系數(shù)(2019年5月3日)
1.2.2 Sentinel-2及預(yù)處理
Sentinel-2 是一組高分辨率多光譜成像衛(wèi)星,由Sentinel-2A 和Sentinel-2B 兩顆衛(wèi)星組成。衛(wèi)星攜帶高分辨率多光譜成像裝置(Multi Spectral Imager,MSI),擁有從可見光到短波紅外的13 個(gè)光譜波段,其中,有4 個(gè)波段(Band2,Band3,Band4,Band8)的空間分辨率達(dá)到10 m。在多光譜遙感衛(wèi)星中,Sentinel-2 是唯一在紅邊范圍攜帶有3 個(gè)波段(Band5,Band6,Band7)的多光譜衛(wèi)星,其獨(dú)特的“紅邊”波段為區(qū)域植被生態(tài)環(huán)境特征信息的提取分析提供了全新的解決方案[19,20]。
與Sentinel-1 數(shù)據(jù)下載地址相同,本研究從哥白尼開放訪問中心下載了2018年10月-2019年5月的Sentinel-2 影像,取與雷達(dá)Sentinel-1 基本同步,且無云或少云干擾的Sentinel-2數(shù)據(jù)產(chǎn)品。Sentinel-2 MSI 產(chǎn)品級(jí)別分為L(zhǎng)evel-0、Level-1A/B/C 和Level-2。本研究使用的Sentinel-2 數(shù)據(jù)產(chǎn)品有兩種級(jí)別,分別為L(zhǎng)evel-1C級(jí)和Level-2級(jí)數(shù)據(jù)。Level-1級(jí)數(shù)據(jù)需要進(jìn)行輻射定標(biāo)和大氣校正;Level-2 級(jí)數(shù)據(jù)無需此過程,直接對(duì)數(shù)據(jù)進(jìn)行重采樣并轉(zhuǎn)換格式即可。本研究采用SNAP 軟件對(duì)Level-1C 級(jí)產(chǎn)品先進(jìn)行輻射定標(biāo)和大氣校正,然后將處理過的Level-1C級(jí)產(chǎn)品與Level-2級(jí)產(chǎn)品數(shù)據(jù)重采樣至10 m的分辨率,并裁剪出研究區(qū)域。圖3 為經(jīng)預(yù)處理后的Sentinel-2 影像圖。
圖3 Sentinel-2影像合成結(jié)果(8,4,3波段合成)
本研究基于全連接深度神經(jīng)網(wǎng)絡(luò)(Fully Connected Neural Network,F(xiàn)CNN)對(duì)研究區(qū)麥田土壤墑情進(jìn)行反演研究。深度學(xué)習(xí)網(wǎng)絡(luò)的輸入特征變量為提取的Sentinel-1 SAR 數(shù)據(jù)的VV和VH 極化雷達(dá)后向散射系數(shù)和根據(jù)Sentinel-2 數(shù)據(jù)計(jì)算植被參量(植被含水量和植被覆蓋度)。在試驗(yàn)過程中,首先把輸入樣本進(jìn)行分組,即訓(xùn)練樣本和檢驗(yàn)樣本;然后對(duì)輸入?yún)?shù)進(jìn)行歸一化預(yù)處理,并預(yù)設(shè)和格網(wǎng)搜索深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)隱含層的層數(shù)(H),隱含層節(jié)點(diǎn)數(shù)(N)和隱含層迭代次數(shù)(E),以期獲得高精度和高性能結(jié)果。在隱含層中,通過數(shù)據(jù)標(biāo)準(zhǔn)化、防數(shù)據(jù)過擬合處理以及優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)重和偏置,最后采用決定系數(shù)(Coefficient of Determination,R2)和均方誤差(Mean Squared Error,MSE)評(píng)估,使得代價(jià)函數(shù)收斂到最小。
Li[21]利用Sentinel-2 數(shù)據(jù),分別計(jì)算歸一化植被指數(shù)[22](NDVI)、兩種歸一化水分指數(shù)[23](Normalized Difference Water Index,NDWI),即NDWI1610、NDWI2190和歸一化紅邊指數(shù)[24](Normalized Difference Red Index,NDRI),并采用歸一化方法對(duì)多植被指數(shù)進(jìn)行耦合,得到植被含水量公式,即:
式中:mveg為植被含水量,x1,x2,x3和x4分別為NDVI,NDWI1610,NDWI2190和NDRI。
植被覆蓋度(Vegetation Fraction,VF)是一階離散植被模型的重要參數(shù)之一?;旌舷裨纸饽P蚚25]是計(jì)算植被覆蓋度常用的方法,該方法假設(shè)遙感影像的每個(gè)像元包含植被和土壤兩部分,即每個(gè)像元都包含植被覆蓋區(qū)域和裸土區(qū)域。通常采用歸一化植被指數(shù)NDVI表示像元內(nèi)這兩個(gè)區(qū)域的信息[26],即:
式中:NDVI為像元的歸一化植被指數(shù)值;NDVIveg為完全植被像元的植被指數(shù)值;NDVIsoil為完全土壤像元的植被指數(shù)值。
則植被覆蓋度的計(jì)算公式為:
式中:NDVI是從Sentinel-2 影像中提取并預(yù)處理得到的值;NDVIsoil理論上接近于0;NDVIveg理論上接近于1。本文以0.95和0.05 置信度截取NDVI的上下閾值來分別表示NDVIveg和NDVIsoil。
全連接深度神經(jīng)網(wǎng)絡(luò)(FCNN)是一種典型的前饋深度學(xué)習(xí)網(wǎng)絡(luò),含有一個(gè)輸入層,若干個(gè)非線性隱含層以及一個(gè)輸出層。在全連接神經(jīng)網(wǎng)絡(luò)中,每相鄰兩層之間的節(jié)點(diǎn)都有邊相連,因此會(huì)將每一層的全連接層中的節(jié)點(diǎn)組織成一列,這樣方便顯示連接結(jié)構(gòu)。輸入層由d個(gè)神經(jīng)元組成,用于輸入樣本的各個(gè)特征值;每層隱含層包含不同的隱藏神經(jīng)元,且每個(gè)隱含層的神經(jīng)元個(gè)數(shù)n也是不確定的;輸出層由l個(gè)神經(jīng)元組成,即需要分類的類別數(shù)。
對(duì)于多層的深度神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)從輸入層開始,上一層的輸出作為下一層的輸入,直到輸出最終的結(jié)果。即下一層的每個(gè)節(jié)點(diǎn)在進(jìn)行計(jì)算的時(shí)候,激活函數(shù)的輸入是上一層所有節(jié)點(diǎn)的加權(quán),不同的層激活函數(shù)可以不一樣,采用g[i](Z[i])表示第i層的激活函數(shù)。
在前向傳播中,前一層的輸出作為后一層的輸入,一層一層的計(jì)算直至輸出A[L],如圖4所示。
圖4 全連接深度神經(jīng)網(wǎng)絡(luò)前向傳播示意圖
在本研究中,深度學(xué)習(xí)隱含層訓(xùn)練過程采用效率更高的ReLU 函數(shù),而輸出層選擇sigmoid 激活函數(shù)將輸出值控制在(0,1)范圍內(nèi),并使用均方誤差MSE表示損失函數(shù),即損失函數(shù)可表示為:
式中:L(i)為第i個(gè)訓(xùn)練樣本的損失值;y(i)為第i個(gè)訓(xùn)練樣本計(jì)算預(yù)測(cè)的輸出變量值;為樣本的觀測(cè)值。
FCNN 的反向傳播與BP 神經(jīng)網(wǎng)絡(luò)類似,在每次迭代優(yōu)化過程中,根據(jù)每層的殘差動(dòng)態(tài)計(jì)算每層參數(shù)的梯度,直至模型收斂。
將VV 和VH 極化后向散射系數(shù),植被覆蓋度和植被含水量作為輸入自變量,實(shí)測(cè)土壤墑情作為輸入因變量構(gòu)建深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),即深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的輸入變量設(shè)置為:
輸出變量為:
由于各參數(shù)之間量綱不同,因此在建立深度學(xué)習(xí)回歸模型之前,需要對(duì)輸入數(shù)據(jù)進(jìn)行歸一化預(yù)處理,使得所有變量的數(shù)值范圍都比較均勻的分布在(0,1)區(qū)間內(nèi)。
研究表明[27],深度學(xué)習(xí)的隱含層越多,其預(yù)測(cè)結(jié)果的精度也會(huì)越高,但是隱含層越多網(wǎng)絡(luò)越復(fù)雜,網(wǎng)絡(luò)的訓(xùn)練時(shí)間增加,導(dǎo)致模型訓(xùn)練效率降低,而且還會(huì)出現(xiàn)過擬合的情況。此外,隱含層中的神經(jīng)元個(gè)數(shù)和練訓(xùn)樣本的迭代次數(shù)的選擇也影響到神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度。為構(gòu)建模型的最優(yōu)參數(shù),本研究設(shè)置隱含層層數(shù)(H)為3 到8,神經(jīng)元個(gè)數(shù)(N)為20到100;隱含層層數(shù)增長(zhǎng)為1,神經(jīng)元個(gè)數(shù)增長(zhǎng)步長(zhǎng)為20,迭代次數(shù)(E)增長(zhǎng)步長(zhǎng)為1,采用格網(wǎng)搜索算法使隱含層結(jié)構(gòu)(H,N,E) 的決定系數(shù)(R2) 穩(wěn)定趨向最大,均方誤差(MSE)穩(wěn)定趨向最小,見圖5。
圖5 經(jīng)過多次迭代的收斂誤差
由于深度神經(jīng)網(wǎng)絡(luò)每一層輸入數(shù)據(jù)的分布一直在發(fā)生變化,當(dāng)輸入特征值的范圍差異較大時(shí),與權(quán)重進(jìn)行矩陣相乘后,會(huì)產(chǎn)生一些偏離較大的差異值,這些差異值產(chǎn)生的微小變化都會(huì)影響到下一層,而且偏離越大表現(xiàn)越明顯,還會(huì)因此導(dǎo)致梯度發(fā)散[28]。為了降低特征值的范圍差異變化帶來的不確定性,采用Batch-Normalization(BN),通過計(jì)算每個(gè)minibatch的均值和方差,并將其拉回到均值為0方差為1的標(biāo)準(zhǔn)正態(tài)分布,可以有效改善模型的穩(wěn)定性和收斂速度。
BN 過程為:在隱含層的輸入先做標(biāo)準(zhǔn)化預(yù)處理,然后向整體數(shù)據(jù)的均值方差方向轉(zhuǎn)換,即:
(1)標(biāo)準(zhǔn)化:
式中:k為通道數(shù)。
(2)轉(zhuǎn)換式:
式中:?是為了防止方差為0 導(dǎo)致數(shù)值計(jì)算的不穩(wěn)定而添加的一個(gè)小數(shù)。
在深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過程中,通過Dropout 忽略一部分的特征檢測(cè)器,使一部分的隱含層節(jié)點(diǎn)值為0,可以明顯減少過擬合現(xiàn)象[29]。使用Dropout 之后,深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過程如下:
(1)隨機(jī)刪掉網(wǎng)絡(luò)中部分的隱藏神經(jīng)元,輸入輸出神經(jīng)元保持不變。
(2)把輸入x通過修改后的網(wǎng)絡(luò)前向傳播,然后把得到的損失結(jié)果通過修改的網(wǎng)絡(luò)反向傳播。一小批訓(xùn)練樣本執(zhí)行完這個(gè)過程后,沒有被刪除的神經(jīng)元按照優(yōu)化算法更新對(duì)應(yīng)的參數(shù)(W,b)。
(3)繼續(xù)重復(fù)這一過程。
本研究隱含層的Dropout 常數(shù)設(shè)置為0.3,即隱含層有30%的節(jié)點(diǎn)隨機(jī)失活。
通過實(shí)驗(yàn)發(fā)現(xiàn),將隱含層最后兩層的BN 層改為dropout層,可以進(jìn)一步提高模型的泛化性能。因此,在本研究中,隱含層的n-2層之前采用BN層,最后兩層采用dropout層。
本章采用Adam(Adaptive Moment Estimation)算法調(diào)整權(quán)重w和偏置b,使代價(jià)函數(shù)收斂到最小。Adam 算法[30]利用梯度的一階矩估計(jì)和二階矩估計(jì)動(dòng)態(tài)調(diào)整每個(gè)參數(shù)的學(xué)習(xí)率,還有自己的動(dòng)量,這樣在訓(xùn)練的過程中,對(duì)于每個(gè)參數(shù)都更加具有獨(dú)立性,能夠提升了模型訓(xùn)練速度和訓(xùn)練的穩(wěn)定性。
為了驗(yàn)證研究區(qū)土壤墑情反演方法并評(píng)價(jià)其精度,本研究在研究區(qū)布設(shè)了28個(gè)試驗(yàn)點(diǎn)[見圖1(c)],在小麥全生育期(2018年10月-2019年5月)期間,Sentinel-1衛(wèi)星過境同期對(duì)研究區(qū)的地表及植被參數(shù)進(jìn)行觀測(cè)和取樣。土壤含水量采用環(huán)刀法對(duì)每個(gè)實(shí)測(cè)點(diǎn)0~10 cm 的土樣進(jìn)行取土,取得的土樣及部分作物樣本帶回實(shí)驗(yàn)室,用烘干稱重法獲得土壤重量含水量和植被含水量數(shù)據(jù)。土壤重量含水量通過計(jì)算換算成體積含水量。共計(jì)576 組樣本數(shù)據(jù),去除異常數(shù)據(jù),選取561 個(gè)有效數(shù)據(jù)用于構(gòu)建和檢驗(yàn)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型。通過隨機(jī)樣本抽取法,選擇其中505組樣本數(shù)據(jù)作為訓(xùn)練樣本,余下的56組樣本數(shù)據(jù)作為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型檢驗(yàn)。經(jīng)過全連接深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,部分結(jié)果如表1所示。
表1 訓(xùn)練參數(shù)與反演結(jié)果
從表1 可以看出,當(dāng)模型隱含層為6,隱含層節(jié)點(diǎn)數(shù)為80,迭代次數(shù)為450時(shí),模型訓(xùn)練效果最佳。當(dāng)繼續(xù)增加隱含層節(jié)點(diǎn)數(shù),R2和MSE基本不變,當(dāng)繼續(xù)增加隱含層數(shù),R2降低,MSE增加。即當(dāng)隱含層大于6時(shí),訓(xùn)練結(jié)果與實(shí)測(cè)土壤墑情相關(guān)性反而降低,即構(gòu)建的6層隱含層已經(jīng)達(dá)到本研究深度神經(jīng)網(wǎng)絡(luò)上限。
采用余下的56 組樣本數(shù)據(jù)進(jìn)行模型檢驗(yàn),根據(jù)深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練結(jié)果,本文僅取其中(5,100,500),(6,60,450),(6,80,450)和(7,100,500)4 組模型的測(cè)試結(jié)果與實(shí)測(cè)數(shù)據(jù)驗(yàn)證和分析。如圖6所示。
當(dāng)隱含層為5,節(jié)點(diǎn)數(shù)為100,迭代次數(shù)為500 次時(shí)[圖6(a)],深度學(xué)習(xí)模型反演的土壤墑情與實(shí)測(cè)土壤墑情的相關(guān)關(guān)系較好,R2達(dá)到0.847 4,MSE為0.001 9。當(dāng)隱含層為6,迭代次數(shù)為450,節(jié)點(diǎn)數(shù)分別為60 和80 時(shí)[圖6(b)和6(c)],兩組模型都表現(xiàn)出良好的相關(guān)性和精度,即R2分別為0.908 1 和0.925 2,MSE分別為0.001 1 與0.000 8。反演的土壤墑情整體與實(shí)測(cè)值在1∶1 線附近。當(dāng)隱含層為7,節(jié)點(diǎn)數(shù)為100,迭代次數(shù)達(dá)到500 次時(shí)[圖6(d)],深度學(xué)習(xí)模型反演結(jié)果與實(shí)測(cè)值的相關(guān)性減弱(R2=0.785 2),反演精度也大幅度降低(MSE=0.002 5),即網(wǎng)絡(luò)的泛化能力降低。說明隱含層為6 時(shí),構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)效果最佳。
圖6 深度學(xué)習(xí)模型估算土壤墑情與實(shí)測(cè)土壤墑情對(duì)比散點(diǎn)圖
值得注意的是,當(dāng)土壤墑情實(shí)測(cè)值大于0.35 cm3/cm3時(shí),即土壤相對(duì)濕潤(rùn)時(shí),反演的土壤墑情多低于實(shí)測(cè)值。張鐘軍等[31]通過研究發(fā)現(xiàn),隨著土壤水分的增加,植被的散射和吸收特性也增強(qiáng),雷達(dá)后向散射系數(shù)變化不能完全表達(dá)土壤的水分信息。因此,消除植被對(duì)雷達(dá)后向散射的影響是非常必要的[32]。
本研究將深度學(xué)習(xí)的方法應(yīng)用于研究區(qū)麥田土壤墑情的反演研究。利用Sentinel-1 和Sentinel-2 數(shù)據(jù),結(jié)合地表實(shí)測(cè)數(shù)據(jù)構(gòu)建基于全連接深度神經(jīng)網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)模型。在模型訓(xùn)練過程中,通過控制隱含層個(gè)數(shù),神經(jīng)元數(shù)和迭代次數(shù)等基本參數(shù)對(duì)模型不斷調(diào)整,采用Adam 算法調(diào)整權(quán)重和偏置,實(shí)現(xiàn)模型的最優(yōu)設(shè)置。使用未參與模型訓(xùn)練的實(shí)測(cè)土壤墑情值對(duì)模型精度進(jìn)行評(píng)定,實(shí)驗(yàn)結(jié)果表明深度學(xué)習(xí)的方法不僅能夠高效地反演土壤墑情,而且對(duì)地表參數(shù)的依賴性較低,適合大規(guī)模的土壤墑情反演。
由于本研究訓(xùn)練數(shù)據(jù)的數(shù)量并不是很大,采用深度學(xué)習(xí)反演得到的土壤墑情結(jié)果與實(shí)測(cè)值的相關(guān)性較好,但是誤差結(jié)果還有待提高,后續(xù)的研究中將通過補(bǔ)充足夠的地面同步高精度訓(xùn)練數(shù)據(jù),進(jìn)一步提高模型的反演精度。