劉英,何雪,岳輝,魏嘉莉
(西安科技大學 測繪科學技術學院,西安 710054)
土壤濕度(soil moisture,SM)是表征地-氣間水分和熱量蒸發(fā)變化的重要變量之一,是作物生長發(fā)育的必要條件。傳統(tǒng)SM監(jiān)測方法有烘干法、電阻法和中子水分儀法等,這些方法準確率高,但無法在短時間內獲取大范圍SM空間分布[1]。遙感可獲取連續(xù)區(qū)域的SM分布情況,包括光學反演、熱紅外反演、微波反演。光學反演方法有反射率法、植被指數(shù)法等。光學遙感受云層、植被及氣象條件影響,地物穿透力差,多用于裸地或低植被地區(qū)。熱紅外反演方法有熱慣量法、溫度植被指數(shù)法等[2-3]。熱慣量法適合裸地或作物出苗期,在濕潤地區(qū)使用受限,溫度植被干旱指數(shù)法依賴于地表溫度反演精度,結果存在不確定性與局限性。微波穿透力強且不受云層和大氣影響,針對裸露地區(qū),常用的方法有Dubois模型[4]、Chen模型[5]、Shi模型[6]、Oh模型[7]等經(jīng)驗半經(jīng)驗模型及物理光學模型[8]、高級積分方程模型[9]、幾何光學模型[10]等理論模型。理論模型過于復雜,應用效率低,經(jīng)驗、半經(jīng)驗模型由特定地點數(shù)據(jù)建立,需大量實測數(shù)據(jù),成本高且魯棒性差。對植被覆蓋區(qū)常用的方法有水云模型[11]和密歇根微波冠層散射模型[12]等,這些方法受粗糙度和植被覆蓋的影響大,通常只適用于特定植被類型和植被生長期,對下墊面復雜的山區(qū)適用性較差。
機器學習具有黑箱特征,不指定回歸函數(shù)形式,可進行任意的線性或非線性回歸。國內外學者利用支持向量機(support vector machines,SVM)、隨機森林(random forests,RF)、徑向基神經(jīng)網(wǎng)絡(radial basis function neural network,RBF)、人工神經(jīng)網(wǎng)絡(artificial neural networks,ANN)等多種機器學習方法反演SM。上述淺層網(wǎng)絡對輸入數(shù)據(jù)經(jīng)過較少層的線性、非線性處理,往往造成網(wǎng)絡學習能力不足、局部最優(yōu)、過擬合等問題。深度神經(jīng)網(wǎng)絡包含多層隱含層且具有深層非線性的特點,較淺層神經(jīng)網(wǎng)絡更具優(yōu)勢,其中影響力較大的就是卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)。CNN此前多用于分類研究,近年來被用于SM反演。李奎等[13]利用多源遙感數(shù)據(jù)聯(lián)合CNN實現(xiàn)了廣域SM反演;韓穎娟等[14]利用一維卷積網(wǎng)絡結合FY-3D遙感影像對寧夏進行了SM監(jiān)測;Wang等[15]利用熱紅外波段反射率聯(lián)合CNN反演SM,該模型精度較深度神經(jīng)網(wǎng)絡高。CNN常將單點特征作為網(wǎng)絡輸入,實際上存在像元位置偏移以及鄰近地物反射輻射影響,利用單點特征反演SM并不合理。移動窗口常用于評價景觀格局分析中的區(qū)域差異,將區(qū)域作為基本單元引入到SM特征處理中可一定程度上減小上述因素帶來的影響。SM回歸模型普遍建立在特定條件約束下的區(qū)域,而遷移學習可解決重訓練中樣本少、成本高等問題[16]。Zhu等[17]融合殘差網(wǎng)絡、雙向長短期記憶網(wǎng)絡及多頭注意力模型構建預訓練模型監(jiān)測太湖溶解氧含量,通過模型微調將其應用到其他湖泊。Tariq等[18]基于殘差神經(jīng)網(wǎng)絡,利用轉移學習的方法對地鐵站內PM2.5的連續(xù)變化進行預測。遷移學習雖能應用在回歸預測的同類問題中,但對SM模型異地遷移的研究較少。
因此文章選擇與SM存在顯著非線性關系的變量,利用具有深度學習特點的CNN結合移動窗口對曼尼托巴農業(yè)區(qū)SM進行反演,與常用光學干旱指數(shù)方法做對比,并采用參數(shù)微調的方式將上述模型遷移到青藏高原那曲縣,為少樣本情況下SM監(jiān)測提供新思路。
曼尼托巴位于加拿大紅河流域,中心地理坐標為-98.23°W、47.78°N,面積約26×48 km2(圖1(a)),夏季炎熱且光照充足,地勢平坦開闊,適合作物生長。該地區(qū)主要發(fā)展混農經(jīng)濟,種植多為一年生作物,如油菜、大豆、小麥、玉米和燕麥等。那曲縣(圖1(b))位于青藏高原中部,平均海拔4 500 m以上,氣候寒冷且相對干燥,年均降水為455.1 mm,中西部地形遼闊平坦,多盆地湖泊;東部屬河谷地帶,多高山峽谷,并有少量森林和灌木,東部植被覆蓋好于西北部。
圖1 研究區(qū)位置及實測點分布圖
實測數(shù)據(jù)來源于SMAPVEX16數(shù)據(jù)集(soil moisture active passive validation experiment 2016)。文中用到的數(shù)據(jù)為實測SM。實測SM是利用Stevens Poke and Go裝置垂直插入土壤表面收集50個農田和兩個輻射計站點的真實介電常數(shù)數(shù)據(jù)并校準得到。每塊農田有16個采樣位置,每個采樣位置按照5、10、20 cm深度平行觀測三次,取不同深度測量均值作為SM實測值。
那曲縣SM實測資料來自荷蘭特溫特大學的青藏高原土壤溫濕度觀測數(shù)據(jù)集。統(tǒng)計38個實測站點2013—2016年間5、10、20 cm深處SM均值,剔除部分無效數(shù)據(jù),獲取SM實測數(shù)據(jù)91組。
在美國地質調查局下載曼尼托巴2016年7月18日和那曲縣2013—2016年間云量低于10%的Landsat 8 OLI/TIRS影像,空間分辨率為30 m。利用ENVI對數(shù)據(jù)進行輻射定標、大氣校正及波段合成等預處理工作。
由于曼尼托巴實測SM值對應日期的Landsat 8影像少(只有一幅),利用Sentinel-2數(shù)據(jù)作補充。Sentinel-2A Level-1C是經(jīng)正射校正和亞像元級幾何精校正的大氣上層表觀反射率產(chǎn)品,需進行大氣校正獲得各波段真實地表反射率。通過Sen2cor模型生成Level-2A數(shù)據(jù),在此基礎上調用SNAP軟件中的Sentinel-2工具箱模塊進行重采樣等操作,最終生成10 m、20 m空間分辨率地表真實反射率影像。表1為實測數(shù)據(jù)、遙感影像的詳細信息。
表1 實測數(shù)據(jù)和遙感數(shù)據(jù)信息
土壤水分不足會影響植被生長,間接引起植被指數(shù)發(fā)生變化;纓帽變換中的濕度指標一定程度上能反映土壤濕度信息[19];而地表反照率隨SM增加呈現(xiàn)指數(shù)遞減趨勢[20-21]?,F(xiàn)有的研究已經(jīng)證明上述指標和SM有一定聯(lián)系,因此本文將反射率及歸一化植被指數(shù)(normalized difference vegetation index,NDVI)、增強型植被指數(shù)(enhance vegetation index,EVI)、反照率(albedo)、濕度指標(wet)作為輸入特征。上述特征和實測SM按4∶1的比例隨機劃分訓練集和驗證集。那曲縣數(shù)據(jù)處理同上。實驗基于Tensorflow及Keras深度學習框架開發(fā)環(huán)境,使用GTX1050顯卡加速完成。
網(wǎng)絡構建過程如下:1)將NDVI、EVI、Albedo、wet、反射率組成一個三維SM特征變量輸入網(wǎng)絡中,經(jīng)過卷積-批歸一化(batch normalization,BN)-激活處理得到具有淺層語義信息的特征圖,使用一維卷積核可以保持樣本特征尺度不變的情況下增加非線性特征,實現(xiàn)通道間的信息交互。BN層是對卷積后的結果進行歸一化,減少數(shù)據(jù)偏移的影響。添加激活層(Relu)進行非線性映射,緩解梯度消失,加速收斂。將其作為下一層的輸入經(jīng)過新一輪卷積運算,逐層遞進得到最終特征,卷積核數(shù)量分別為64(2層)、128(2層)、256(3層)、128(1層)、64(1層)。2)將卷積提取到的特征展平(flatten)成為一個一維向量有序輸入到全連接網(wǎng)絡進行線性加權,采用閾值函數(shù)sigmoid將結果映射到輸出,限制SM值在0~1之間。3)添加L2正則項,限制神經(jīng)元中權重大小的同時最小化誤差,防止過擬合。采用均方誤差(mean square error,MSE)計算預測值與真實值之間的誤差,采用Adam算法進行網(wǎng)絡參數(shù)更新,卷積步長設為1,網(wǎng)絡迭代次數(shù)設為2 000。使用early stopping監(jiān)視器來監(jiān)測模型的內在狀態(tài),防止過擬合。并行運算通道數(shù)設置為36。網(wǎng)絡結構見圖2。
圖2 土壤濕度提取網(wǎng)絡結構
由于存在遙感像元的偏移(1~2個像元),利用單點數(shù)據(jù)模擬SM是不合理的,因此從景觀生態(tài)學中引入“尺度”概念[22]。文章構造N×N像元(N為奇數(shù))的移動窗口,將移動窗口按從左到右,從上到下的順序在EVI、NDVI、Albedo、wet、反射率特征圖像上滑動,將移動窗口內特征均值賦給中心像元,利用尺度化后的特征提取SM能一定程度上減小特征圖像元偏移給精度造成的影響,削弱鄰近地物反射光造成的輻射不均勻。新特征與SM的相關性較原始特征均有不同程度的提升。選取一系列不同大小的移動窗口對比發(fā)現(xiàn),窗口大小設為3×3時SM的提取精度較高。
為驗證所建立的SM監(jiān)測模型的有效性,選擇常見遙感干旱指數(shù):土壤濕度監(jiān)測指數(shù)(soil moisture monitoring index,SMMI)[23]、改進型土壤濕度監(jiān)測指數(shù)(modified soil moisture monitoring index,MSMMI)[24]、垂直干旱指數(shù)(perpendicular drought index,PDI)[25]及改進型垂直干旱指數(shù)(modified perpendicular drought index,MPDI)[26],分析典型干旱指數(shù)與SM實測值的相關性。上述指數(shù)均基于NIR-Red特征空間構造,土壤線斜率利用研究區(qū)2016年6月10日和2016年6月20日Sentinel-2影像上部分裸土點(FVC<0.3)的nir和red波段反射率線性擬合得到,取值為1.445。
目前,SM的研究主要集中在不同地區(qū)建立不同反演模型,若發(fā)生地區(qū)遷移,現(xiàn)有預訓練模型不能直接應用于另一個地區(qū),而重建訓練模型需要對模型全部權重隨機初始化及與模型參數(shù)量相匹配的數(shù)據(jù)集,會增加成本、降低效率。基于參數(shù)微調的遷移學習放寬了源任務和目標任務間數(shù)據(jù)獨立同分布的假設,將已訓練好的模型及參數(shù)通過簡單的調整實現(xiàn)目標任務和原任務相近時知識的遷移,解決了樣本少、訓練成本高的問題[27]。將曼尼托巴訓練得到的SM模型參數(shù)進行微調應用于那曲縣SM反演。首先,對那曲縣原始影像進行預處理,然后根據(jù)實測站點提取特征值,將特征值和濕度值一一對應并按4∶1隨機劃分訓練集、驗證集;其次,實例化基本模型,加載曼尼托巴地區(qū)預訓練模型及初始化參數(shù),該參數(shù)是通過曼尼托巴數(shù)據(jù)集學習得到,避免隨機初始化參數(shù)速度慢、目標數(shù)據(jù)集過小對精度造成的影響;然后,通過計算可知目標領域各特征值同實測SM相關性不高,需要對全連通層的參數(shù)進行重新初始化及更新,參數(shù)微調過程如圖3所示。
圖3 基于參數(shù)微調的遷移學習過程
采用平均絕對值誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)以及相關系數(shù)R共4個指標對模型預測的可靠性和準確性進行度量。其中MAE、RMSE、MAPE用來衡量觀測值與真實值間的偏差,可評估模型預測結果好壞,其值越小代表預測效果越好。R衡量模型擬合數(shù)據(jù)的能力,其值越接近于1,模型效果就越好。
隨著訓練次數(shù)不斷增加,損失值MSE由1.582下降到0.007。CNN_W收斂速度更快,當?shù)?00次時,MSE下降至0.005,且逐漸趨于平緩。由圖4(a)、圖4(c)可知,二者得到的SM分布空間大部分一致,將SM以0.05 cm3/cm3為間隔劃分成14個等級,SM范圍集中在0.2~0.5 cm3/cm3間,與SM實測值范圍一致。CNN_W得到的SM分布
圖4 曼尼托巴SM分布
變化平滑,與SM實際變化趨勢一致。SM較高地區(qū)集中在研究區(qū)東北部、中部和部分作物覆蓋區(qū),SM較低地區(qū)集中在西南部、裸地和部分植被覆蓋區(qū)。兩種方法在6月20日和7月18日SM分布存在部分差異,利用驗證集來進一步檢驗。由圖4(b)、圖4(d)可知,大部分實測和反演結果散點都分布在1∶1回歸線上及10%偏置范圍內,CNN_W反演精度比CNN高,異常點個數(shù)少。
比較不同方法在驗證集上的監(jiān)測效果。由圖5可知,反演方法按照精度從高到低排序依次是:CNN_W>CNN>光學。其中CNN_W精度最好(R=0.832,MAE=0.028 cm3/cm3);各干旱指數(shù)對復雜農用地SM監(jiān)測效果較差(RSMMI=0.338、RMSMMI=0.337、RPDI=0.308、RMPDI=0.097)。總體上,不依賴于復雜物理關系、僅依靠深層挖掘特征變量和目標變量間關系的深度學習方法相較遙感指數(shù)法具有明顯優(yōu)勢。
圖5 不同SM反演方法精度比較
加載初始特征和尺度化特征訓練得到的曼尼托巴SM模型,將上述模型參數(shù)作為遷移訓練初始參數(shù),對全連接層參數(shù)進行重新初始化和更新,比較不同模型的遷移效果。由圖6(a)、圖6(c)可知,那曲縣2013—2016年偏旱,反演結果集中在0~0.35 cm3/cm3,與SM實測值范圍一致,西北部高寒區(qū)干旱少雨,植被稀疏,干旱程度較東南更嚴重,東南部植被覆蓋整體好于西北部,故更加濕潤。且3月是寒冷的冬季,故干旱程度相較于5、7、8、9月更嚴重。利用驗證集進一步定量分析(圖6(b)、圖6(d)),大部分實測和反演值散點分布在1∶1回歸線上及10%偏置范圍內。基于尺度化特征的預訓練模型遷移精度略高,R為0.824,RMSE、MAE分別為0.045 cm3/cm3、0.036 cm3/cm3,基于原始特征的預訓練模型遷移精度不及前者,部分實測點濕度被過分高估或低估。
圖6 青藏帕里地區(qū)SM分布
文章使用一維卷積核構造CNN模型提取SM,CNN的一維卷積在不增加感受野情況下引入更多非線性特征,能有效模擬SM大小。為提升反演精度,本文考慮像元位置偏移及混合像元輻射給反演精度造成的影響,將移動窗口像元均值作為中心像元值,而大多數(shù)研究考慮的是網(wǎng)絡參數(shù)優(yōu)化、輸入因子的選擇。實驗結果表明,移動窗口處理后的特征與SM相關性更高,提取精度較原始特征提高。
光學遙感是監(jiān)測SM的主要手段,但本文發(fā)現(xiàn),光學遙感指數(shù)無法實現(xiàn)小范圍復雜農業(yè)地SM精準監(jiān)測?;诮t外-紅光構建的PDI、SMMI更適合裸地SM監(jiān)測;引入FVC的MPDI和MSMMI對SM變化敏感性較差,在本文研究區(qū)范圍內不適用;CNN方法在該地更適用。但目前該方法依靠大量實測樣本,在實際中難實現(xiàn),未來可嘗試利用半監(jiān)督或非監(jiān)督的方法實現(xiàn)少樣本或無樣本的學習。
目前多數(shù)研究缺乏對SM模型異地遷移的研究。文章對曼尼托巴地區(qū)SM模型參數(shù)微調并應用于那曲縣SM反演?;诔叨然卣髂P偷倪w移精度更高(R、MAE分別為0.824、0.036 cm3/cm3),實測值誤差在-0.1~0.07 cm3/cm3之間。預訓練模型在那曲縣的直接應用則效果較差。