王金鑫,姚 靜,李聰玲,陳曉麗
(1.鄭州大學地球科學與技術學院,鄭州450000;2.鄭州大學水利科學與工程學院,鄭州450000)
土壤墑情在農業(yè)生產活動中起著十分重要的作用[1],控制地表蒸發(fā),影響作物的生長發(fā)育,也是旱情監(jiān)測、農作物估產的重要參數[2]。目前在大區(qū)域土壤墑情的遙感監(jiān)測中,綜合多源遙感的方法已成為重要發(fā)展趨勢,尤以微波遙感和光學遙感的結合應用較多[3,4]。光學遙感方法利用土壤和植被反射光譜信息,通過光譜反射率構建植被指數實現(xiàn)土壤水分的快速估測。被動微波遙感法主要通過建立土壤介電常數與土壤微波輻射的關系,利用介電常數模型獲得土壤含水量[5];主動微波遙感法通過建立微波的后向散射系數與土壤水分的關系獲得土壤含水量[6]。土壤粗糙度是制約微波遙感土壤水分精度的最主要因素,如何降低地表粗糙度對土壤水分反演的影響一直是該領域的研究重點[7]。除野外實測外,基于微波遙感機理建立的經驗半經驗模型是解決該問題的傳統(tǒng)方法。如主動微波遙感適用于裸土的Dobson[8]、Oh[9]、Shi[10]等模型,適用于植被覆蓋的MIMICS 模型[11]、水云模型[12]、Karam[13]等;被動遙感適用于裸土的Q/H模型[14]、H/P模型[15]、Q/P 模型[16],適用于植被覆蓋的“ω-τ”模型[17]等。上述模型要么參數多、模型復雜,要么需要大量的實測先驗信息,參數要求苛刻,適用性受限[18]。為了提高模型的泛化能力,國內外學者將神經網絡、遺傳算法等智能算法引入微波遙感協(xié)調反演領域,并展開研究[19-21],Paloscia 等[22]和Hajj 等[23]利用模擬的全極化SAR 數據,結合歸一化植被指數(Normalized Difference Vegetation Index,NDVI)訓練了多個ANN,對比分析了各單極化SAR 數據反演土壤濕度的效果。余凡等[24]提出了基于神經網絡的主被動遙感數據協(xié)同反演土壤水分算法。關韻桐等[25]提出用遺傳算法優(yōu)化后的神經網絡輔以多源遙感數據的方法進行地表土壤水分反演。Alexakis 等[26]將Sentinel-1 SAR 的后向散射系數、入射角信息,與Landsat 8 數據的NDVI、熱紅外溫度TIR信息作為人工神經網絡模型的輸入參數,輸出為土壤水分含量,并將反演得到的土壤水分含量用于后續(xù)的水文模型。上述方法均取得了良好的效果。智能算法的引入,為遙感土壤墑情反演提供了新的思路,提高了反演的精度,是時空大數據時代遙感墑情監(jiān)測的重要發(fā)展趨勢。但涉及的參數、數據多,有一定的樣本依賴性和不確定性。
綜上所述,利用微波和光學遙感信息融合反演土壤墑情的方法是適用的,且智能算法的應用進一步提高了墑情監(jiān)測的精度。但大區(qū)域土壤粗糙度的估算無論是外業(yè)實測內插,還是基于模型反演,工作量大,參數多,不確定性大,依然是制約微波遙感法發(fā)展的一個瓶頸。本研究旨在探索一種簡單快捷的去除大區(qū)域土壤粗糙度影響的方法,提出粗糙度不變假設,即假設麥田的土壤粗糙度在小麥生長期內是不變的,將高植被覆蓋期和裸土期的后向散射系數求差,即可消除其對后向散射系數的影響。以河南省豫中東部為研究區(qū)域,以MODIS、Sentinel-1A 遙感影像和土壤含水量實測數據為數據源,將NDVI、NDWI(Normalized Difference Water Index,歸一化水指數)、后向散射系數及其差值作為輸入值,土壤水分實測數據作為輸出值參與BP 網絡模型的構建,最終利用遺傳算法提高神經網絡的穩(wěn)定性并對反演結果進行精度驗證,取得了預期的效果。
研究區(qū)域坐落于河南省黃淮海平原中東部,地理坐標介于東經112°51′~116°35′,北緯32°08′~36°21′,屬暖溫帶大陸性季風氣候,四季分明,雨量充沛,冬季溫差較大,降水夏秋多,冬季較少。該地區(qū)整體地勢平坦、土壤肥沃,多為黏土、壤土和沙土,適宜各類農作物種植,是華北平原的糧食主產區(qū)之一。研究區(qū)地理位置及36 個土壤水分實測站點分布圖如圖1所示。
圖1 研究區(qū)域位置示意圖
豫中東部的冬小麥生長周期一般為頭年10月至次年6月,其中冬小麥的播種時間為當年的10月上旬左右,為裸土時期;10月中下旬至次年3月中旬為低植被覆蓋時期;3月下旬至6月上旬為高植被覆蓋時期。
采用從河南省氣象局調研獲取的研究區(qū)內36 個土壤墑情測站點2015年10月至2016年6月每日0~10 cm、0~20 cm 土壤含水量實測數據,用于水分反演模型的構建和驗證。
光學遙感影像從NASA 網站下載,MOD13A2 是由1KM 分辨率的植被指數產品16 d 合成。MODIS 數據處理過程:利用MRT 從MOD13A2 提取出歸一化植被指數產品NDVI、中紅外波段反射率MIR和近紅外波段反射率NIR。通過MRT 對以上產品進行投影轉換后,利用IDL批量裁剪出研究區(qū)并根據測站點經緯度坐標提取出影像的DN值,依次讀取各產品的頭文件以獲取定標參數,最后輻射定標得NDVI、MIR、NIR值。本研究共獲取了7 景MOD13A2 影像,時間分別為2015年10月18日,2016年3月21日、4月6日、4月22日、5月8日、5月24日和6月9日。雷達遙感影像從歐空局(https://scihub.copernicus.eu/)獲取,包括2015年10月研究區(qū)裸土時期和2016年3-6月植被覆蓋時期的7 幅影像,影像時間與MOD13A2 影像一致。本研究選用ENVI5.3 來對Sentinel-1A 數據進行預處理,再利用IDL根據測站點的經緯度坐標提取各個站點的后向散射系數。對得到的結果去噪聲處理后,做投影轉換和坐標系定義,將該影像設置為和MODIS 影像相同的投影坐標系,即Albers投影、WGS84坐標系。
主動微波遙感通過建立微波的后向散射系數與土壤水分的關系獲得土壤含水量[27]。雷達后向散射系數(σ)主要受到土壤介電常數(主要取決于土壤水分)、地表粗糙度和植被覆蓋等因素的影響[28]。實際應用中,大面積準確獲取地表粗糙度十分困難。假定地表粗糙度在一定時間內保持不變(或者變化可以忽略),那么雷達后向散射系數的變化就只與植被覆蓋和土壤介電常數(土壤水分)的變化有關。將生長后期(植被較茂盛)與裸土(播種)時期的后向散射系數作差,即可消除地表粗糙度對后向散射系數的影響;其差值(Δσ)主要反映土壤水分與植被覆蓋的影響,它與土壤水分的相關關系應該更好。
豫中東部的冬小麥在3月下旬-6月中旬處于高植被覆蓋時期。為驗證上述假設的正確性,本研究通過提取Sentinel-1A 影像(2016年4月22日)的后向散射系數,再對后向散射系數和該日采樣點土壤含水量值進行歸一化處理后進行相關分析,結果如圖2 所示。同理,將2016年4月22日與2015年10月18日后向散射系數的差值與4月22日樣本點土壤含水量(0~10 cm)之間做相關分析,結果如圖3所示。
圖2 VV、VH極化對土壤含水量的相關分析
圖3 ΔVV、ΔVH極化對土壤含水量的相關分析
可以看出,對中原地區(qū)土壤墑情而言,VV 極化方式優(yōu)于VH 極化方式;但兩種極化方式的Δσ與土壤含水量的擬合優(yōu)度比σ都提高了0.2 以上,其對土壤含水量的敏感性更高。驗證了上述假設的正確性與可行性。
植物的生長過程是一個主動適應環(huán)境的、非線性的復雜過程。其生長狀況受多種生態(tài)環(huán)境因素的綜合影響,很難用一個確定的數學函數來表達。神經網絡模型在土壤墑情分析和預測中具有廣泛的適應性[29],遺傳算法作為仿生智能算法為描述復雜生命現(xiàn)象提供了得力工具[30]。根據數據實際情況,本文選擇后向散射系數(包括上述差值)和相關植被指數[包括NDVI和NDWI(與NDVI相比,它能更有效地提取植被冠層的水分含量;在植被冠層受水分脅迫時,該指數能夠及時響應[31])]等因子,通過神經網絡建立它們與土壤含水量W的關系,并通過遺傳算法對網絡進行優(yōu)化,從而實現(xiàn)土壤墑情的反演。
將NDVI、NDWI、σVV、σVH作為輸入數據,土壤含水量W作為輸出數據,建立BPσ神經網絡模型;同理,將NDVI、NDWI、VV 極化的后向散射系數差ΔσVV、VH 極化的后向散射系數差ΔσVH作為輸入數據,W作為輸出數據,利用Matlab 建立BPΔσ神經網絡模型。根據實驗,將兩個模型中單隱層節(jié)點數設置為8,“學習速率”設置為0.1,其他訓練參數采用系統(tǒng)默認值。從2016年3-6月共252 組數據中,選取231 組數據作為訓練樣本,余下的21 組數據作為檢驗樣本,驗證模型的準確性。
盡管BP 神經網絡具有很強的非線性映射能力,但極易出現(xiàn)網絡拓撲結構不穩(wěn)定、陷入局部極小值等問題。遺傳算法具有較高的全局搜索能力,更容易獲取全局最優(yōu)解[32]。因此,可通過遺傳算法優(yōu)化BP 神經網絡的權值和閾值,提前鎖定全局最優(yōu)[33,34],在加快網絡的收斂速度的同時還能提高預測精度。改進后的神經網絡模型稱為GA-BP 神經網絡[35]。算法原理如下:
(1)個體編碼及種群的初始化:個體是指BP 神經網絡中所有的權值和閾值。本文采用實數編碼的方式。編碼長度為:
式中:n為輸入層節(jié)點數;m為隱含層節(jié)點數;l為輸出層節(jié)點數。研究選擇初始種群規(guī)模為50。
(2)適應度函數的設定:
式中:SE為BP神經網絡預測值與實際值間誤差的平方和。BP神經網絡的預測誤差越小,其適應度函數越大,適應性就越強。
(3)個體的選擇:按照概率進行選擇,公式如下:
式中:fi為個體i的適應度值;k為種群的個體數。
(4)交叉操作和變異操作:最優(yōu)的個體直接復制到下一代,不參與交叉和變異操作。其他任意兩個個體通過交叉概率pc和變異概率pm進行交叉和變異操作,得到兩個新的個體。通過實驗,本文采用pc=0.37,pm=0.06,進化代數為120。
(5)循環(huán)操作:循環(huán)上述(2)~(4)3 個步驟,直到訓練目標滿足設置要求或迭代次數達到設定值為止。
基于遺傳算法優(yōu)化的BP神經網絡流程如圖4所示。
圖4 遺傳算法優(yōu)化BP神經網絡流程
冬小麥植被茂盛時期,將訓練好的3種模型應用到整個研究區(qū)域,0~10 cm 土壤墑情實測值與預測值對比如表1、圖5和圖6所示。
表1 3種神經網絡模型0~10cm土壤墑情預測結果與實測值分析 %
圖5 3種神經網絡模型0~10 cm土壤墑情預測值與實測值對比圖
由上可明顯看出,在土壤深度為0~10 cm 時,BPΔσ網絡模型預測精度優(yōu)于BPσ網絡模型,預測的土壤含水量與實測值的相對誤差主要集中在10%~30%,預測結果較為可靠。優(yōu)化BPΔσ神經網絡后的預測結果的相對誤差集中在10%~15%之間,故經遺傳算法優(yōu)化后的GA-BPΔσ神經網絡預測的相對誤差更小,預測的精度更高。由圖6 可以看出,第15 號站點是一個孤立點,每種方法在該點的預測精度都比較差,所以,該點的土壤水分實測值包含較大的粗差,應該是錯誤的(土壤水分是根據傳感器自動采集)。上述結果表明:在河南省中東部地區(qū)可行,地表粗糙度不變假設成立。河南省中東部地區(qū)地勢平坦,鮮少出現(xiàn)沙塵暴及泥石流等自然災害,地表粗糙度變化主要受風沙和雨雪影響,然而在植被覆蓋的情況下風沙和雨雪對地表的侵蝕作用不顯著,故可認為在冬小麥主要生長周期內研究區(qū)地表粗糙度不變。
圖6 3種神經網絡模型0~10 cm土壤墑情預測相對誤差對比圖
為分析不同深度墑情對遙感監(jiān)測的響應,并進一步驗證粗糙度不變假設,本文將0~20cm 土壤墑情實測值與預測值對比如表2、圖7和圖8所示。
表2 3種神經網絡模型0~20 cm土壤墑情預測結果與實測值分析 %
圖7 3種模型墑情預測值與實測值對比圖(0~20 cm)
圖8 3種神經網絡模型0~20 cm土壤墑情預測相對誤差對比圖
不同土壤深度下,3 種不同網絡模型的均方根誤差RMSE值如表3所示。
表3 不同深度3種神經網絡模型土壤墑情反演結果精度對比
從以上圖表可以得出:與0~10 cm 深度土壤墑情反演結果類似,在0~20 cm 深度,GA-BPΔσ神經網絡預測的相對誤差多集中在10%以下,預測精度最高,BPΔσ和BPσ的測相對誤差和精度依次遞減,再次印證了粗糙度不變假設的正確性與可行性;相同模型在不同土壤深度的墑情反演精度均為0~20 cm較高,其原因應該是一般農作物根系分布的土壤深度主要集中在地表下20 cm 左右[36],根部墑情是影響農作物生長狀態(tài)的重要因子,對主要反映地表覆蓋狀況的遙感監(jiān)測響應更為敏感。
針對土壤墑情遙感監(jiān)測精度優(yōu)化目標,本文以河南省中東部的冬小麥為研究對象,利用2016年冬小麥植被茂盛時期MODIS 和Sentinel-1A 遙感數據,結合實測的土壤水分數據,利用BP 神經網絡實現(xiàn)土壤含水量的監(jiān)測。并通過遺傳算法對網絡進行優(yōu)化,以提高神經網絡模型預測土壤含水量結果的準確性。主要研究結論如下。
(1)在河南省中東部平原地區(qū),集成多源遙感和智能算法的冬小麥土壤墑情監(jiān)測方法精度較高,尤其是用遺傳算法優(yōu)化BPΔσ神經網絡的GA-BPΔσ方法是一種可行的精準農業(yè)監(jiān)測手段。
(2)黃淮海平原地區(qū),地勢平坦,地質災害絕少發(fā)生。在冬小麥整個生育期內,將地表粗糙度視為一個常數,通過冬小麥茂盛期的后向散射系數與裸土時期的求差,可有效消除地表粗糙度對后向散射系數的影響,從而提高墑情遙感監(jiān)測的精度。本文研究假設具有一定的正確性和可行性。
(3)對比0~10 cm 和0~20 cm 不同深度的3 種BP 神經網絡模型,均為0~20 cm 深度范圍預測值與實測值相對誤差較小,預測精度較高,證明了根部墑情對遙感監(jiān)測更為敏感。