龍澤昊,秦其明, 2, 3*,張?zhí)碓?,許 偉
1. 北京大學(xué)地球與空間科學(xué)學(xué)院遙感與地理信息系統(tǒng)研究所,北京 100871 2. 地理信息基礎(chǔ)軟件與應(yīng)用工程技術(shù)研究中心,北京 100871 3. 空間信息集成與3S工程應(yīng)用北京市重點(diǎn)實(shí)驗(yàn)室,北京 100871
葉面積指數(shù)(leaf area index,LAI)是描述植被形態(tài)結(jié)構(gòu)的重要參數(shù),其定義為單位地表面積上單面葉片的總面積[1]。由于LAI與植被的光合作用、生物量積累等生理過程密切相關(guān),因而在農(nóng)業(yè)生產(chǎn)中常被用于評(píng)價(jià)作物長勢(shì)與估算作物產(chǎn)量[2-4]。預(yù)測(cè)作物未來LAI曲線變化情況,可以掌握作物未來的生長趨勢(shì),對(duì)于估計(jì)作物未來的長勢(shì)狀況、制定田間管理決策具有重要意義。
時(shí)序LAI數(shù)據(jù)可通過作物生長模型模擬以及遙感反演等方法獲得。WOFOST是以日為步長來動(dòng)態(tài)模擬作物生長過程的作物模型,通過輸入氣象、作物等參數(shù)可獲得作物逐日時(shí)序LAI數(shù)據(jù)以及其他生長參數(shù)。利用WOFOST可以對(duì)作物未來的LAI曲線進(jìn)行預(yù)測(cè),但需要以未來氣象數(shù)據(jù)作為支撐[5],而模型繁多的輸入?yún)?shù)且依賴于未來氣象數(shù)據(jù)等問題限制了其應(yīng)用。此外,利用現(xiàn)有遙感LAI產(chǎn)品也可對(duì)時(shí)序LAI數(shù)據(jù)進(jìn)行建模,但傳統(tǒng)建模方法可能會(huì)受到LAI數(shù)據(jù)時(shí)間或空間不連續(xù)性等問題而削弱了應(yīng)用的魯棒性,因此部分研究利用神經(jīng)網(wǎng)絡(luò)方法來對(duì)時(shí)序LAI建模,有研究將季節(jié)自回歸積分滑動(dòng)平均(SARIMA)方法與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合對(duì)時(shí)序MODIS LAI進(jìn)行預(yù)測(cè),結(jié)果顯示該組合方法的預(yù)測(cè)準(zhǔn)確性高于傳統(tǒng)的SARIMA方法;Xiao等[6]利用廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)來估算全球時(shí)序LAI,其建模精度優(yōu)于MODIS和CYCLOPES LAI產(chǎn)品;Chen等[7]建立了一個(gè)基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的非線性自回歸模型來預(yù)測(cè)橡膠種植林LAI,結(jié)果表明RNN在反演時(shí)序LAI上具有可行性。與普通神經(jīng)網(wǎng)絡(luò)相比,RNN通過在每層神經(jīng)元之間建立連接,從而能夠有效地挖掘時(shí)序數(shù)據(jù)中所包含的規(guī)律,而其變體長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)通過添加門控機(jī)制進(jìn)一步提高了時(shí)序數(shù)據(jù)預(yù)測(cè)精度[8-9], 但目前還未見研究利用LSTM對(duì)時(shí)序LAI建模。由于在冬小麥生長過程中LAI曲線變化具有規(guī)律性,因此LSTM具有對(duì)冬小麥未來LAI曲線進(jìn)行預(yù)測(cè)的潛力,但此方法需要大量樣本作為基礎(chǔ),而樣本的難獲取性也限制了其在作物L(fēng)AI時(shí)序預(yù)測(cè)方面的應(yīng)用。
研究區(qū)為京津冀地區(qū),位于36°21′—42°37′N,113°27′—119°51′E,該區(qū)域農(nóng)作物以冬小麥和玉米為主,其中冬小麥種植區(qū)域除河北省張家口和承德地區(qū)外均有種植。如圖1所示,研究區(qū)內(nèi)共有17個(gè)氣象站點(diǎn),本文下載了2003年9月至2017年7月共15年的逐日氣象數(shù)據(jù),數(shù)據(jù)來源于國家氣象信息中心的地面氣候資料日值數(shù)據(jù)集。實(shí)測(cè)數(shù)據(jù)為河北衡水市2017年3月30日(DOY:89)和2017年5月5日前后(DOY:125)兩個(gè)時(shí)期實(shí)測(cè)LAI。遙感數(shù)據(jù)使用4天周期、500 m分辨率的MODIS LAI(MCD15A3H)數(shù)據(jù),時(shí)間范圍為2003年—2017年的1月—6月,每年有45張時(shí)序影像(DOY:1~177)。
圖1 研究區(qū)以及氣象站點(diǎn)和采樣點(diǎn)分布
1.2.1 遙感數(shù)據(jù)預(yù)處理
MODIS LAI空間分辨率較低,像元中一般會(huì)混雜除冬小麥外的其他地物,造成LAI值偏低問題,因此需進(jìn)行校正。如圖2所示,首先對(duì)于各氣象站點(diǎn)和采樣點(diǎn),在點(diǎn)周圍100 km內(nèi)的MODIS LAI時(shí)序影像中進(jìn)行由里向外LAI曲線的提取,并依據(jù)LAI曲線特征形態(tài)以及對(duì)應(yīng)點(diǎn)的Google Earth影像來目視解譯是否為冬小麥像元,最終提取出2003年—2017年共247條符合要求的氣象站點(diǎn)LAI曲線和2017年采樣點(diǎn)LAI曲線。然后,利用Savitzky-Golay濾波對(duì)所有曲線進(jìn)行平滑處理,并對(duì)平滑后采樣點(diǎn)LAI曲線提取出DOY為88、124的LAI,并根據(jù)文獻(xiàn)[10]方法與實(shí)測(cè)LAI建立校正模型。最終,從247條氣象站點(diǎn)LAI曲線中提取DOY為120,140和160的MODIS LAI值,并用校正模型對(duì)其進(jìn)行校正。
1.2.2 遙感-WOFOST同化
WOFOST通過給定對(duì)應(yīng)作物和環(huán)境參數(shù)可對(duì)不同作物進(jìn)行生長模擬,利用京津冀地區(qū)冬小麥作物參數(shù),在潛在生產(chǎn)力水平下進(jìn)行冬小麥LAI模擬,并采用同化算法進(jìn)行參數(shù)優(yōu)化,從而生成該地區(qū)15年的冬小麥LAI數(shù)據(jù)集。
在優(yōu)化參數(shù)的選擇中,TSUM1和TSUM2參數(shù)代表有效積溫,需要依據(jù)氣溫?cái)?shù)據(jù)動(dòng)態(tài)計(jì)算獲得,由于獲取往年各個(gè)氣象站點(diǎn)附近冬小麥出苗、開花、成熟三個(gè)階段的準(zhǔn)確時(shí)間較困難,所以需要進(jìn)行優(yōu)化。此外,根據(jù)文獻(xiàn)[11]建議,TDWI和SPAN是WOFOST模型中重要的兩個(gè)參數(shù),也將其加入優(yōu)化(如表1)。
確定好優(yōu)化參數(shù)后,采用SCE優(yōu)化算法實(shí)現(xiàn)模擬LAI與遙感觀測(cè)LAI最小化,從而得到比未優(yōu)化之前更準(zhǔn)確的連續(xù)時(shí)序LAI數(shù)據(jù)。優(yōu)化算法的損失函數(shù)如式(1)所示。
Q=(x120-y120)2+(x140-y140)2+(x160-y160)2
(1)
其中:x120,x140和x160為利用WOFOST模擬的LAI曲線中DOY為120,140和160的LAI值,y120,y140和y160為校正后的MODIS LAI中DOY為120,140和160的LAI值。
結(jié)合圖6(b)和圖8可見,在限制膨脹過程中,吸水膨脹受體變約束,純膨潤土孔徑>1μm的孔隙被擠壓。當(dāng)限制膨脹約束卸除,回彈穩(wěn)定后,由于顆粒膨脹擠壓約束作用,純膨潤土孔隙分布范圍依然較窄。
通過所提取的247組校正后的MODIS LAI加入WOFOST進(jìn)行同化,并以每組所對(duì)應(yīng)的當(dāng)年站點(diǎn)氣象數(shù)據(jù)來驅(qū)動(dòng)模型,從而得到優(yōu)化后的LAI曲線數(shù)據(jù)。如圖3(a)所示,未同化生成的LAI曲線中LAI最高值達(dá)到8,最低值僅為2,部分曲線不符合冬小麥生長規(guī)律特征。如圖3(b)所示,同化后生成的LAI曲線中的均值線最大值為5且在輪廓線內(nèi)分布較均勻,更符合冬小麥LAI曲線變化規(guī)律。
圖2 遙感數(shù)據(jù)預(yù)處理流程圖
表1 需優(yōu)化參數(shù)的定義與校準(zhǔn)值范圍Table 1 Description and range of parameters to be optimized
圖3 未同化(a)與同化(b) WOFOST模型生成的247條LAI曲線
以生成的冬小麥LAI數(shù)據(jù)集為基礎(chǔ),采用LSTM網(wǎng)絡(luò)對(duì)冬小麥LAI時(shí)序曲線變化規(guī)律進(jìn)行學(xué)習(xí),實(shí)現(xiàn)對(duì)未來LAI曲線的預(yù)測(cè)。如圖4所示,LSTM通過添加門結(jié)構(gòu)使得信息有選擇性地影響模型中每個(gè)時(shí)刻的狀態(tài),主要由輸入門、輸出門、遺忘門組成[8]。
如式(2)—式(6)所示為t時(shí)刻的LSTM的計(jì)算公式
ft=σ(Wfxt+Ufht-1+bf)
(2)
it=σ(Wixt+Uiht-1+bi)
(3)
ot=σ(Woxt+Uoht-1+bo)
(4)
ct=ft°ct-1+it°tanh(Wcxt+Ucht-1+bc)
(5)
ht=ot°tanh(ct)
(6)
其中:°為點(diǎn)乘運(yùn)算,σ和tanh為激活函數(shù),xt∈Rd為t時(shí)刻輸入向量,ft,it,ot∈Rh分別為遺忘門、輸入門、輸出門激活向量,ht∈Rh為記憶單元輸出向量,ct∈Rh為記憶單元狀態(tài)向量,W∈Rh×d,U∈Rh×h和b∈Rh為權(quán)重矩陣和偏置向量。
圖4 LSTM單元結(jié)構(gòu)
圖5 基于LSTM的LAI預(yù)測(cè)模型
在最后時(shí)刻N(yùn)時(shí),通過3層LSTM結(jié)構(gòu)的輸出為hN∈R32,之后通過連接一個(gè)全連接層即可到預(yù)測(cè)結(jié)果y′,其計(jì)算公式如式(7)所示。
y′=WyhN+by
(7)
其中Wy∈R15×32為權(quán)重矩陣,by∈R15偏置向量。
在模型訓(xùn)練過程中,優(yōu)化算法采用Adam,損失函數(shù)采用平方損失函數(shù)L,如式(8)所示。
(8)
冬小麥在出苗到返青階段其LAI較低,直到返青后LAI才開始明顯變化。研究區(qū)域冬小麥大約三月份開始返青,故采用2003年—2016年冬小麥數(shù)據(jù)集中從3月1日到成熟階段共232條LAI曲線作為訓(xùn)練數(shù)據(jù),并利用2017年15條LAI數(shù)據(jù)進(jìn)行驗(yàn)證,通過取N=5,10,15,20,25和30共訓(xùn)練了6個(gè)LAI預(yù)測(cè)模型,并對(duì)不同的模型結(jié)果進(jìn)行對(duì)比分析。
如圖6所示,將驗(yàn)證數(shù)據(jù)切割為35 d的LAI曲線集合,其中前20 d作為輸入數(shù)據(jù),后15 d作為標(biāo)簽數(shù)據(jù),利用N=20的LAI預(yù)測(cè)模型進(jìn)行預(yù)測(cè)。結(jié)果顯示,模型預(yù)測(cè)LAI<2.5以及LAI>5.5的精度較高,預(yù)測(cè)值與標(biāo)簽值均在1∶1線附近。當(dāng)2.5≤LAI≤5.5時(shí),相比前兩種情況預(yù)測(cè)精度稍低,可能是因?yàn)椴煌L條件下冬小麥返青和開花時(shí)間不同,其對(duì)應(yīng)LAI上升和下降階段中LAI變化具有較大的差異。
圖6 N=20的LAI預(yù)測(cè)模型預(yù)測(cè)結(jié)果
如表2所示,對(duì)6個(gè)LAI預(yù)測(cè)模型的預(yù)測(cè)結(jié)果綜合進(jìn)行對(duì)比,其中N=20的預(yù)測(cè)模型的R2(0.986 5)最高、RMSE(0.183 6)最低,精度優(yōu)于其他預(yù)測(cè)模型,而N=5的預(yù)測(cè)模型精度最差。當(dāng)模型LAI輸入長度從5增加到20時(shí),其R2呈上升趨勢(shì),RMSE呈下降趨勢(shì),這是由于更多LAI信息輸入使得LAI預(yù)測(cè)精度提高。當(dāng)模型LAI輸入長度繼續(xù)增長時(shí),精度開始下降,可能是因?yàn)殡x預(yù)測(cè)日期太遠(yuǎn)的LAI對(duì)于預(yù)測(cè)LAI貢獻(xiàn)作用小,反而有可能引起數(shù)據(jù)干擾的效果。
表2 6個(gè)LAI預(yù)測(cè)模型預(yù)測(cè)結(jié)果精度對(duì)比Table 2 Comparison of experiment results from LAI prediction models
在冬小麥生長過程中,不同生育期的冬小麥LAI的變化存在區(qū)別,因此LAI預(yù)測(cè)模型對(duì)處于不同生育期的冬小麥預(yù)測(cè)精度存在差異。通過將冬小麥生長大致分為返青至拔節(jié)(3月1日—4月15日)、拔節(jié)至抽穗(4月16日—5月10日)、抽穗至成熟(5月11日—結(jié)束)三個(gè)階段,利用訓(xùn)練好的6個(gè)預(yù)測(cè)模型對(duì)這三個(gè)階段進(jìn)行精度分析。
如表3所示,在返青到拔節(jié)期,N=30的預(yù)測(cè)模型精度最高;在拔節(jié)至抽穗期,N=25的預(yù)測(cè)模型精度最高;在抽穗至成熟期,N=20的預(yù)測(cè)模型精度最高。由此可見,不同LAI輸入長度的預(yù)測(cè)模型對(duì)于不同生育階段的預(yù)測(cè)精度并不一致。在返青到拔節(jié)期,隨著N值的增大,LAI預(yù)測(cè)模型的精度不斷提高,在后兩個(gè)階段中,隨著N值增大,預(yù)測(cè)精度先提高后下降。
表3 不同生育階段中6個(gè)LAI預(yù)測(cè)模型預(yù)測(cè)結(jié)果精度對(duì)比Table 3 Comparison of experiment results from LAI prediction models in different stages
圖7 不同生育期中N=20的LAI預(yù)測(cè)模型預(yù)測(cè)結(jié)果(a): 返青至拔節(jié)期的標(biāo)簽與預(yù)測(cè)LAI曲線;(b): 拔節(jié)期至抽穗期的標(biāo)簽與預(yù)測(cè)LAI曲線;(c): 抽穗至成熟期標(biāo)簽與預(yù)測(cè)LAI曲線;(d): 返青至拔節(jié)期標(biāo)簽與預(yù)測(cè)LAI值對(duì)比;(e): 拔節(jié)至抽穗期的標(biāo)簽與預(yù)測(cè)的LAI值對(duì)比;(f): 抽穗至成熟期標(biāo)簽與預(yù)測(cè)LAI值對(duì)比
(a): Label and predicted LAI curves from returning green to jointing; (b): Label and predicted LAI curves from jointing to heading; (c): Label and predicted LAI curves from heading TO maturity; (d): Comparison of Lable and predicted LAI value from returing green to jointing; (e): Comparison of lable and predicted LAI value from jointing to heading; (f): Comparison of lable and predicted LAI value from heading to maturity
如圖7(a),(b)和(c)所示,在三個(gè)階段分別抽取5條差異較大的LAI曲線,截取DOY分別為70~89,90~109和120~139的LAI曲線作為模型輸入得到預(yù)測(cè)結(jié)果,可見模型預(yù)測(cè)結(jié)果與標(biāo)簽值吻合且趨勢(shì)一致。如圖7(d)所示,在返青至拔節(jié)期,低值LAI比高值LAI預(yù)測(cè)準(zhǔn)確度高,可能是因?yàn)閯偡登鄷r(shí)LAI的增長速率低,而返青后LAI增長速率變快,模型對(duì)其LAI快速變化的捕捉能力不足。如圖7(e)所示,在拔節(jié)至抽穗期,由于該階段冬小麥LAI變化較為平緩,預(yù)測(cè)結(jié)果基本處于1∶1線附近,模型對(duì)其模擬的精度高。如圖7(f)所示,在抽穗至成熟期,高值LAI比低值LAI預(yù)測(cè)準(zhǔn)確度高,可能是由于在抽穗至開花階段冬小麥LAI處于高值且變化平緩,在開花期后LAI迅速下降,而模型捕捉冬小麥開花時(shí)間節(jié)點(diǎn)的能力并不理想,預(yù)測(cè)精度出現(xiàn)下降。因此,LAI預(yù)測(cè)模型對(duì)于返青至開花階段預(yù)測(cè)精度較高,前期LAI曲線預(yù)測(cè)的高精度性對(duì)于冬小麥前期田間管理和生產(chǎn)具有重要作用。
采用的冬小麥LAI數(shù)據(jù)集是利用潛在生產(chǎn)力水平下的WOFOST模型模擬得到的,以該數(shù)據(jù)集為基礎(chǔ)構(gòu)建的預(yù)測(cè)模型對(duì)潛在生產(chǎn)力水平下的冬小麥具有較好的預(yù)測(cè)效果。然而,冬小麥的生長發(fā)育是一個(gè)多環(huán)境因子作用的復(fù)雜過程,干旱、病蟲害、養(yǎng)分脅迫等因素均會(huì)對(duì)冬小麥的生長發(fā)育造成影響。下一步研究需要結(jié)合冬小麥生長發(fā)育的影響因素,對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行擴(kuò)充,從而提高預(yù)測(cè)模型的普適性。
本研究利用了數(shù)據(jù)同化、作物模型與遙感等手段,構(gòu)建了京津冀地區(qū)近15年冬小麥LAI曲線數(shù)據(jù)集,為解決訓(xùn)練數(shù)據(jù)難以獲取這一難題提供了新的思路,對(duì)深度學(xué)習(xí)方法在類似問題中的實(shí)際應(yīng)用具有借鑒意義。此外,還驗(yàn)證了LSTM在預(yù)測(cè)農(nóng)作物L(fēng)AI時(shí)序曲線應(yīng)用潛力,對(duì)于利用現(xiàn)有熱門的深度學(xué)習(xí)方法解決冬小麥未來長勢(shì)預(yù)測(cè)、指導(dǎo)田間管理決策等傳統(tǒng)問題具有重要價(jià)值。