李淑君,鄭柯,唐娉,霍連志,袁媛
1.中國科學院空天信息創(chuàng)新研究院,北京 100094;
2.中國科學院大學,北京 100049;
3.南京郵電大學,南京 210042
森林火災是一種突發(fā)性強、破壞性高、處置困難的自然災害(Cao等,2020)。近年來,受全球氣候變化與人類活動的影響,森林防火行業(yè)面臨著愈發(fā)嚴峻的考驗,對森林火災識別技術(shù)提出了新的需求與挑戰(zhàn)(魏書精等,2020;王振師等,2019;孫紅斌等,2018)?;馃E地是描述森林燃燒最重要的信息之一,是經(jīng)火災燒毀后尚未長成新林的土地,能夠提供森林火災發(fā)生時間、頻度、位置、面積以及空間分布等重要信息(Ruiz等,2014),是火災形成機制不可或缺的研究對象(Chuvieco等,2016),也是影響森林資源保護、植被恢復、碳排放等至關(guān)重要的變量(Chuvieco等,2018),以及碳循環(huán)擾動和全球變化研究的重要參數(shù)(孫桂芬等,2019)。遙感技術(shù)具有觀測覆蓋范圍大、可動態(tài)觀測等優(yōu)勢,使其成為最為有效的森林監(jiān)測手段,如何利用時間序列遙感圖像提取森林變化信息是當前研究的熱點和難點問題(楊辰,2013)。
根據(jù)數(shù)學統(tǒng)計方法劃分,傳統(tǒng)的時間序列變化檢測算法可分為6大類,包括閾值法、差分法、分段法、軌跡分類法、統(tǒng)計邊界法和回歸法(Zhu,2017)。閾值法采用了一個預定的閾值確定時間序列中的森林,當與閾值存在顯著偏差時檢測到變化,Hilker等(2009)基于Landsat和Modis數(shù)據(jù)的NDVI指數(shù)利用融合模型對森林實現(xiàn)變化檢測,Huang等(2009)利用森林綜合指數(shù)完成率對美國西部森林區(qū)域動態(tài)變化的評定(IFZ);差分法通過比較不同時間獲取的影像,并且將變化很大的差異定義為變化區(qū)域,Bolton等(2015)使用差分法對火災后的殘留結(jié)構(gòu)和森林恢復進行分析;分段法將完整的歷史時間序列數(shù)據(jù)根據(jù)殘差或角度標準分為一系列直線段,檢測突變和漸變信息(Chance等,2016);軌跡分類方法從時間序列中提取某種變化(訓練目的)信息,用該信息對圖像中的每個時間序列進行分類,Kennedy等(2007)基于軌跡對森林動態(tài)特征進行自動匹配實現(xiàn)變化檢測;統(tǒng)計邊界法將明顯偏離邊界的檢測為變化,Zhu等(2016)利用Landsat數(shù)據(jù)對綠度趨勢分析土地覆蓋變化;回歸法假定預測變量和響應(yīng)變量之間存在線性關(guān)系,使用回歸獲得結(jié)果(Markham等,2012)。此外,還有一些其他常用的經(jīng)典時間序列變化檢測算法,如干擾和趨勢監(jiān)測(LandTrendr)方法(Kennedy等,2010)、植被追蹤算法(VCT)(Huang等,2010)、bfast算法(Verbesselt等,2012)、連續(xù)變化檢測和分類算法(CCDC)(Zhu和Woodcock,2014)等。
近年來,深度學習得以迅速發(fā)展,并越來越多地用于時間序列分析(L?ngkvist等,2014),在時間序列森林變化監(jiān)測方面的應(yīng)用也越來越廣泛,Reddy和Prasad(2018)將LSTM用于海島植被動態(tài)監(jiān)測,預測島上植被未來時間序列以獲取植被變化信息;Kong等(2018)基于LSTM模型對長時間序列森林火災進行監(jiān)測,檢測率高于傳統(tǒng)的bfast算法;Yuan等(2020)進一步在LSTM模型中加入Attention機制并用于森林火災監(jiān)測,檢測精度相比LSTM有很大提升。然而,LSTM模型主要是對圖像中單個像元的時間序列進行分析,沒有考慮像素的空間鄰域信息,而空間鄰域的相關(guān)性對于遙感圖像分析具有重要意義(Huo等,2015)。
為在時間序列預測中同時考慮空間信息,Shi等(2015)提出了ConvLSTM,將原來LSTM中的全連接改進為卷積連接,可以較好地刻畫時間序列的時空特征,并用于降雨預測。Stacked ConvLSTM堆疊多個ConvLSTM增加網(wǎng)絡(luò)的表達性能,提升了對時間序列數(shù)據(jù)時空結(jié)構(gòu)信息的提取能力,因此,Kim等(2017)用兩層ConvLSTM基于雷達數(shù)據(jù)進行降雨的多步預測,Zhao等(2019)基于三層的ConvLSTM對超聲波時間序列影像進行單幅影像預測。
由于Stacked ConvLSTM尚未用于森林火燒跡地檢測,其在森林火燒跡地檢測的有效性和效果有待驗證,本文提出將時空檢測方法Stacked ConvLSTM用于時間序列森林火燒跡地的檢測,實現(xiàn)端到端提取森林火燒跡地信息。由于火燒跡地在空間分布上具有連續(xù)性(武晉雯等,2020),因而在時間序列變化檢測中加入鄰域空間信息具有重要意義。一方面,能夠在一定程度上降低因數(shù)據(jù)缺失(云、陰影、地形遮擋等所致)造成的影響(Khan等,2017);另一方面,相比現(xiàn)有方法大多采用先分類再后處理抑制零散虛警信息的兩階段策略(張兆明等,2020),端到端數(shù)據(jù)驅(qū)動的方法能夠避免后處理方法選擇的主觀性。
兩個研究區(qū)域分布如圖1所示,研究區(qū)域Ⅰ是黑龍江沾河林業(yè)局伊南河林場,地理位置在48°39'N,128°14'E附近區(qū)域,于2009年4月27日發(fā)生草甸森林火災,過火總面積1557.562 km2,其中有林地1072.746 km2。
圖1 研究區(qū)域(研究區(qū)域Ⅰ:伊南河林場火災區(qū)域,研究區(qū)域Ⅱ:北大河林場火災區(qū)域)Fig.1 Study area(study areaⅠ:Yinanhe Forest Farm fire area,study areaⅡ:Beidahe Forest Farm fire area)
研究區(qū)域Ⅱ在內(nèi)蒙古自治區(qū)畢拉河林業(yè)局北大河林場,地理位置在49°31'N,123°06'E附近,2017年5月2日發(fā)生森林火災,過火面積115 km2,有林地占60%,受害森林面積達82.816 km2。
選擇這兩個研究區(qū)域的原因有以下幾點:(1)兩個研究區(qū)域的火災面積較大,在遙感影像上有明顯的過火區(qū)域輪廓,便于研究實驗的進行;(2)兩個區(qū)域的歷史時間序列都比較平穩(wěn),除了已知的火災外沒有受到其他明顯的森林干擾發(fā)生,便于模型算法的驗證;(3)兩個研究區(qū)分別包含草甸森林和森林區(qū)域,為在不同的森林覆蓋類型驗證模型的有效性提供了條件。
本文采用的研究數(shù)據(jù)是中分辨率成像儀(MODIS)陸地產(chǎn)品MOD13Q1。MOD13Q1空間分辨率250 m,是16 d合成產(chǎn)品,每年有23幅影像。分別獲取了研究區(qū)域Ⅰ的2001年—2009年以及研究區(qū)域Ⅱ的2001年—2017年間的時間序列數(shù)據(jù)。實驗剔除了序列中受云、雪影響大的春冬季影像,采用一年中季相變化比較明顯的14幅影像作為研究的時間窗口(DOY97—DOY305)。
MODIS數(shù)據(jù)的MOD13Q1產(chǎn)品中增強型植被指數(shù)(EVI)在植被監(jiān)測中具有時相多、覆蓋面廣、且不易產(chǎn)生過飽和等優(yōu)勢(Huete等,2002;王正興等,2003),被廣泛應(yīng)用于大區(qū)域尺度的植被物候變化監(jiān)測等研究領(lǐng)域(Peng等,2017;Zhang等,2003)。因此本文選用增強型植被指數(shù)EVI來研究其時間序列上的動態(tài)變化,EVI的計算公式可表示為
式中,ρR、ρB、ρNIR分別表示MODIS數(shù)據(jù)的紅、藍和近紅外波段的反射率。
選擇MODIS數(shù)據(jù)的原因主要有兩點:(1)MODIS數(shù)據(jù)的時間跨度長,可以提供足夠長的時間序列;(2)MODIS 16 d合成產(chǎn)品,時間間隔均勻,方便用于時間序列的統(tǒng)計建模。
時間序列數(shù)據(jù)預測是指學習過去的時間序列并預測未來的變化。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)無法解決隨時間軸變化的問題,隨之誕生了RNN(Recurrent Neural Network)(Jordan,1997);但由于經(jīng)典的RNN在提取較長時間序列信息的表現(xiàn)較差,提取的時序信息有限,Hochreiter和Schmidhuber(1997)提出了LSTM網(wǎng)絡(luò)模型,在經(jīng)典RNN中加入門(gates)的結(jié)構(gòu)來選擇性的增加和刪除過去的時序信息,即加入輸入門、輸出門和遺忘門,分別控制本單元(一個LSTM結(jié)構(gòu)為一個基本單元)數(shù)據(jù)的輸入、輸出以及上一步單元的輸出的信息增減。LSTM公式表示如下(Hochreiter和Schmidhuber,1997):
式中,I、F、O分別表示輸入門、遺忘門和輸出門,C和H分別表示細胞狀態(tài)(經(jīng)過門控輸出的信息)和隱藏狀態(tài)(每個時間點的輸出值),W表示對應(yīng)數(shù)據(jù)的權(quán)重,X表示輸入數(shù)據(jù),b表示偏置值,σ表示激活函數(shù),o表示哈達瑪積,下標t表示t時刻;下標i、f、out分別表示3個控制門對應(yīng)的權(quán)重和偏置值,下標c表示細胞狀態(tài)C對應(yīng)的權(quán)重和偏置;W的下標x表示對應(yīng)輸入數(shù)據(jù)X的權(quán)重,h表示對應(yīng)隱藏狀態(tài)H的權(quán)重。
ConvLSTM是在LSTM基礎(chǔ)上提出來的一種LSTM變體,將LSTM的輸入層到隱藏層和隱藏層到隱藏層之間的全連接狀態(tài)替換為卷積連接,對LSTM無法充分利用空間信息進行了改進。LSTM在處理圖像數(shù)據(jù)時需要將圖像數(shù)據(jù)轉(zhuǎn)為一維向量,無法處理原圖像數(shù)據(jù)的空間結(jié)構(gòu)信息。相比LSTM模型,ConvLSTM能夠更好地提取時間序列圖像中的時空結(jié)構(gòu)信息。ConvLSTM模型公式表示如下:
式(6)—(9)中字母表達含義和式(2)—(5)
相同,輸入變量的全連接換成了卷積操作,*表示卷積操作,由圖2的ConvLSTM內(nèi)部結(jié)構(gòu)可以看出,輸入門、輸出門和遺忘門對于輸入和隱藏層都進行了卷積操作;其中WcioCt-1、WcfoCt-1和WcoutoCt-1表示輸入門、遺忘門和輸出門與上一細胞狀態(tài)的peephole(Gers和Schmidhuber,2000)連接。如圖2所示,peephole連接在每個門都加入細胞狀態(tài)的信息,由于網(wǎng)絡(luò)單元可能會有門狀態(tài)為0的情況,導致缺乏重要信息,添加peephole操作可以改進這個缺點。
圖2 ConvLSTM內(nèi)部結(jié)構(gòu)Fig.2 Internal structure of ConvLSTM
本文的Stacked ConvLSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,Stacked ConvLSTM在ConvLSTM基礎(chǔ)上進行改進,由多個ConvLSTM堆疊而成。假設(shè)網(wǎng)絡(luò)輸入時間序列數(shù)據(jù)為(X1,X2,…,Xn),每次輸入一個Xi經(jīng)過n次數(shù)據(jù)輸入提取輸入的時序特征,經(jīng)過k層ConvLSTM網(wǎng)絡(luò)單元前向傳遞網(wǎng)絡(luò)學習到的時空信息,最后一層三維卷積層輸出最后結(jié)果(Xn+1,Xn+2,…,Xn+m),將輸出結(jié)果與目標序列計算損失函數(shù),并反向傳遞進行網(wǎng)絡(luò)訓練。
圖3 堆疊ConvLSTMFig.3 Stacked ConvLSTM
式中,Xi表示第i時間點目標序列值,表示第i時間點網(wǎng)絡(luò)模型的預測值。
混淆矩陣也稱作誤差矩陣,是表示分類精度的一個n×n矩陣(Liu等,2007)。在本文中火燒跡地和非火燒跡地屬于二分類問題,混淆矩陣如表1所示。
表1 火燒跡地檢測混淆矩陣Table 1 Confusion matrix of fire detection classification
基于混淆矩陣,進一步計算以下常用的結(jié)果評價指標,包括:精確度(P)、召回率(R)、準確度(Acc)、F1-score值(F1)。以上4個評估指標公式如下:
式中,TP表示正確分為火燒跡地的像素個數(shù),F(xiàn)P表示錯誤分為火燒跡地的像素個數(shù),TN表示正確分為非火燒跡地的像素個數(shù),F(xiàn)N表示錯誤分為非火燒跡地的像素個數(shù);P'是分為火燒跡地的總像元個數(shù),N'是分為非火燒跡地的總像元個數(shù);P是真實火燒跡地像元個數(shù),N是真實非火燒跡地像元個數(shù)。
基于深度學習框架Keras完成了Stacked ConvLSTM的構(gòu)建(Chollet等,2015),實驗設(shè)備環(huán)境是NVIDIA GeForce GTX1080 GPU。研究區(qū)域Ⅰ的MODIS時間序列數(shù)據(jù)集圖像像素區(qū)域大小為512×512,研究區(qū)域Ⅱ圖像像素區(qū)域大小為400×400。在這兩個研究區(qū)域,MODIS時間序列中觀測到森林火燒跡地信息的變化時間點分別為2009年和2017年的第126天,對應(yīng)本研究的時間序列中第3個時間點影像。如圖4是在兩個研究區(qū)分別取像素區(qū)域大小為10×10的平均值在時間軸的變化,發(fā)生火災的時間點在最后一年(圖4中紅色顯示),是需要進行預測的年份。
圖4 研究區(qū)域EVI在時間軸上變化Fig.4 EVI varies along the time axis in the study area
本文使用滑動窗口法(Cheng等,2016)將研究所用MODIS數(shù)據(jù)劃分為監(jiān)督訓練的輸入輸出集。在時間上,輸入序列長度為1年時序數(shù)據(jù)14幅影像,輸出序列長度為后1年時序數(shù)據(jù)14幅像,滑動的步長為一年即14幅影像。例如,2001年數(shù)據(jù)作為輸入,2002年數(shù)據(jù)作為輸出,下一個滑動窗口的輸入為2002年數(shù)據(jù),輸出為2003年數(shù)據(jù),依次類推至時序最后一年。最后一次滑動作為測試數(shù)據(jù),研究區(qū)域Ⅰ輸入2008年數(shù)據(jù)預測2009年,研究區(qū)域Ⅱ輸入2016年數(shù)據(jù)預測2017年。在空間上,將研究區(qū)域Ⅰ的像素區(qū)域大小512×512切分成像素區(qū)域大小64×64的子塊,研究區(qū)域Ⅱ的像素區(qū)域大小400×400分成像素區(qū)域大小50×50的子塊。對處理后的數(shù)據(jù)集,除了最后一年的數(shù)據(jù)作為測試數(shù)據(jù),剩下的數(shù)據(jù)按照8∶2劃分為訓練集和驗證集。
本文對Stacked ConvLSTM模型中的超參數(shù)設(shè)置了不同的值進行實驗,得到的最優(yōu)參數(shù)分別為卷積核大小3×3,Batch Size大小設(shè)置為16,采用的優(yōu)化器為RMSprop(Zhong等,2012),學習率大小設(shè)置為0.001,梯度衰減值為0.9,網(wǎng)絡(luò)的循環(huán)訓練次數(shù)為100次。
Stacked ConvLSTM的Stacked Layers及每層的單元個數(shù)對于網(wǎng)絡(luò)模型的學習能力影響很大,因此對不同的網(wǎng)絡(luò)結(jié)構(gòu)進行測試。網(wǎng)絡(luò)所測試的層數(shù)以及單元數(shù)是在Stacked ConvLSTM的應(yīng)用以及實驗中得出的經(jīng)驗值,根據(jù)預測精度取在本文數(shù)據(jù)表現(xiàn)最佳的網(wǎng)絡(luò)層數(shù)和單元數(shù),作為的森林火燒跡地檢測網(wǎng)絡(luò)結(jié)構(gòu)。
研究區(qū)域Ⅰ測試結(jié)果如表2所示,由平均絕對誤差MAE(Mean Absolute Error)和均方誤差MSE(Mean Squared Error)指標可以看出,研究區(qū)域Ⅰ的預測效果最好的是32-32-32-batch16結(jié)構(gòu);研究區(qū)域Ⅱ的結(jié)構(gòu)如表3所示,效果最好的結(jié)構(gòu)是64-32-batch16。
表2 研究區(qū)域Ⅰ預測精度Table 2 Predict precision of study areaⅠ
表3 研究區(qū)域Ⅱ預測精度Table 3 Predict precision of study areaⅡ
將兩個研究區(qū)域的Stacked ConvLSTM最佳網(wǎng)絡(luò)結(jié)構(gòu)用于MODIS數(shù)據(jù)的森林火燒跡地檢測。取預測的時間序列以及驗證的目標序列中像素區(qū)域大小10×10求平均值作圖結(jié)果如圖5所示,可以直觀地看出,未變化區(qū)域的預測值和目標序列值很接近,而變化區(qū)域在第3個時間點(MODIS時間序列的第126天)變化之后一段時間EVI值下降很大,與預測值相距懸殊,植被在后半年有所恢復,EVI值回升至和預測值相近。
圖5 未變化和變化區(qū)域時序擬合Fig.5 Unchanged and changed area fitting
對測試序列中每一個像元采用經(jīng)驗閾值的方法確定是否為變化像元(Kong等,2018)。根據(jù)檢測精度分別調(diào)整兩個研究區(qū)域的閾值,獲得最佳閾值為-0.05。如圖6所示,閾值分割線表示預測序列每個像素的EVI值減去0.05。并提取目標序列首次低于閾值分割線的像元作為變化像元,在測試時間序列的第3個時間點檢測到變化。
圖6 變化區(qū)域閾值Fig.6 Threshold of changed area
本文利用Stacked ConvLSTM、Stacked LSTM以及bfast算法在兩個區(qū)域的MODIS時間序列中提取森林火燒跡地,并將火燒跡地檢測結(jié)果與ESA發(fā)布的Fire_CCI 5.1火燒跡地產(chǎn)品進行了對比分析。地面真值數(shù)據(jù)分別由2009年5月23日Landsat-5 TM影像和2017年5月25日MODIS影像目視解譯生成。
火燒跡地檢測結(jié)果如圖7所示,從目視效果來看,在研究區(qū)域Ⅰ,Stacked ConvLSTM檢測的結(jié)果比Stacked LSTM和bfast算法錯誤檢測點少,并且在空間分布也保持較高連續(xù)性;在研究區(qū)域Ⅱ,Stacked ConvLSTM檢測到了較完整的火燒跡地區(qū)域。在研究區(qū)域Ⅰ,Stacked ConvLSTM檢測的結(jié)果相對Stacked LSTM以及bfast算法更少細碎的像素,錯誤檢測點少并且在空間分布也保持相對高的連續(xù)性,檢測的火燒跡地精度相對于另外兩種方法也更高,F(xiàn)ire_CCI 5.1的錯檢區(qū)域比Stacked ConvLSTM更大。在研究區(qū)域Ⅱ,Stacked ConvLSTM檢測到了較完整的火燒跡地區(qū)域,Stacked LSTM以及bfast算法的錯誤檢測像元相對更多,并且在空間連續(xù)性上表現(xiàn)更差,F(xiàn)ire_CCI 5.1相比Stacked ConvLSTM漏檢像元更多。
圖7 森林火燒跡地檢測結(jié)果圖Fig.7 Forest burned areas detection results
由表4和表5可以看出,在兩個研究區(qū)域Stacked ConvLSTM的檢測精度相比Stacked LSTM和bfast算法更好。在研究區(qū)域Ⅰ,Stacked ConvLSTM的精確度比Stacked LSTM和bfast算法分別高出0.120和0.405,并且召回率、準確度和F1-score也更高,F(xiàn)ire_CCI 5.1召回率雖更高,由于錯檢區(qū)域較大,其他精度指標遠低于Stacked ConvLSTM;在研究區(qū)域Ⅱ,Stacked ConvLSTM精確度達0.924,召回率、準確度和F1-score相比Stacked LSTM和bfast算法以及Fire_CCI 5.1更高。
表4 研究區(qū)域Ⅰ火燒跡地檢測精度表Table 4 Precision table of burned areas detection in study areaⅠ
表5 研究區(qū)域Ⅱ火燒跡地檢測精度表Table 5 Precision table of burned areas detection in study areaⅡ
將兩個區(qū)域的精度表繪制成柱狀統(tǒng)計圖,見圖8所示,可以更直觀地看出,在研究區(qū)域Ⅰ,Stacked ConvLSTM比Stacked LSTM的檢測精度要好,并遠高于bfast算法;在研究區(qū)域Ⅱ,Stacked ConvLSTM的召回率以及F1-score比另兩種方法高很多??傮w來看,Stacked ConvLSTM的檢測表現(xiàn)比Stacked LSTM和bfast算法表現(xiàn)更好。
圖8 森林火燒跡地檢測精度柱狀統(tǒng)計圖Fig.8 Precision of forest burned areas column chart
Stacked ConvLSTM在兩個區(qū)域檢測的火災發(fā)生的時間點分別在MODIS時間序列中的2009年和2017年的第126天,而實際發(fā)生的火災時間點分別在2009年的4月27日和2017年的5月2日,即第116天和第122天。以上3種方法在兩個區(qū)域的檢測時間點如表6和表7所示,Stacked ConvLSTM和Stacked LSTM比實際發(fā)生的時間點分別遲10天和4天,bfast算法的檢測時間點相對另兩種方法要遲一步。檢測時間點的推遲和MOD13Q1數(shù)據(jù)的時間分辨率有關(guān),MOD13Q1是16天合成產(chǎn)品,發(fā)生的火災點和獲取的數(shù)據(jù)點正好相差了一個時間周期,導致了檢測時間點的延遲。
表6 研究區(qū)域Ⅰ變化時間點Table 6 Change detected time of study areaⅠ
表7 研究區(qū)域Ⅱ變化時間點Table 7 Change detected time of study areaⅡ
本文提出將Stacked ConvLSTM用于時間序列森林火燒跡地檢測,利用Stacked ConvLSTM學習時空特征的優(yōu)勢,在保持結(jié)果具有較好空間連續(xù)性的基礎(chǔ)上避免了具有主觀性的后處理操作,實現(xiàn)端到端提取森林火燒跡地信息,提升了森林火燒跡地的提取精度?;趦蓚€發(fā)生過特大火災區(qū)域的MODIS時間序列數(shù)據(jù),定性和定量分析Stacked ConvLSTM、Stacked LSTM以及經(jīng)典的bfast算法火燒跡地提取結(jié)果,并將3種方法的火燒跡地提取結(jié)果與Fire_CCI 5.1火燒跡地產(chǎn)品進行了對比。研究結(jié)果表明,在檢測精度和空間分布的連續(xù)性上,Stacked ConvLSTM檢測的火燒跡地結(jié)果都有很大提高;此外,在火災發(fā)生時間點檢測效果上,由于MODIS時間分辨率(MOD13Q1數(shù)據(jù)為16 d合成數(shù)據(jù))為16 d,Stacked ConvLSTM和Stacked LSTM均落后真實火災時間點一步,但均比bfast算法的在時間上更準確一步。
Stacked ConvLSTM在森林火燒跡地檢測存在一些不足之處。首先,本文基于單個EVI指數(shù)開展Stacked ConvLSTM在森林火燒跡地檢測的有效性研究,更多植被相關(guān)指數(shù)及其組合的檢測效果值得進一步研究;其次,確定火燒跡地區(qū)域的方法是基于經(jīng)驗閾值,有待研究自動的閾值計算方法;再次,由于MODIS數(shù)據(jù)的分辨率屬于中低分辨率,Stacked ConvLSTM模型的卷積核設(shè)置太大反而會模糊空間信息,因此提取的空間信息有限,在更高空間分辨率和時間分辨率的影像數(shù)據(jù)上,Stacked ConvLSTM模型的時空預測表現(xiàn)可能會更好;最后,網(wǎng)絡(luò)模型訓練中是固定時間長度的輸入輸出,只能學習有限的時空序列信息,這大大限制了網(wǎng)絡(luò)在時空預測上的表現(xiàn)。因此,在后續(xù)的研究中,考慮在Stacked ConvLSTM基礎(chǔ)上加入一些可以輸入輸出不定長時序數(shù)據(jù)和更高效的措施如Encoder-Decoder結(jié)構(gòu)以及Attention機制等,提高網(wǎng)絡(luò)在時空序列上的預測效果。
志謝此次實驗過程中,在袁媛老師的幫助下獲取了本文的實驗數(shù)據(jù),在此表示由衷感謝!