李偉光, 侯美亭
(1.海南省氣候中心,???570203; 2.海南省南海氣象防災(zāi)減災(zāi)重點(diǎn)實(shí)驗(yàn)室,???570203; 3.中國氣象局氣象干部培訓(xùn)學(xué)院,北京 100081)
遙感生態(tài)監(jiān)測(cè)起步于20世紀(jì)70年代,從早期利用陸地衛(wèi)星(Landsat)、氣象衛(wèi)星(如AVHRR)監(jiān)測(cè)地表植被格局[1-2],到近年來新興的使用衛(wèi)星遙感太陽誘導(dǎo)葉綠素?zé)晒?solar-induced chlorophyll fluorescence,SIF)監(jiān)測(cè)植物光合作用和評(píng)估生產(chǎn)力[3]、利用無人機(jī)等新型平臺(tái)監(jiān)測(cè)地表生態(tài)狀況等,基于遙感監(jiān)測(cè)地表生態(tài)已經(jīng)發(fā)展成為地球生態(tài)系統(tǒng)監(jiān)測(cè)的重要組成部分。遙感具有基于現(xiàn)場(chǎng)原位生態(tài)觀測(cè)不可比擬的空間覆蓋優(yōu)勢(shì),遙感方法是在局地和全球尺度上對(duì)生態(tài)系統(tǒng)的短期和長期狀態(tài)、壓力、干擾和資源限制進(jìn)行及時(shí)、經(jīng)濟(jì)有效、可重復(fù)記錄和評(píng)估的唯一方法[4]。
衛(wèi)星時(shí)間序列數(shù)據(jù)已被證明對(duì)闡明生態(tài)系統(tǒng)動(dòng)態(tài)變化和驅(qū)動(dòng)因素特別有價(jià)值[5-6]。Cord等[7]匯總了衛(wèi)星遙感應(yīng)用于生態(tài)系統(tǒng)監(jiān)測(cè)的服務(wù)類別,指出食物供應(yīng)和氣候服務(wù)(溫室氣體調(diào)節(jié))是衛(wèi)星遙感應(yīng)用最為廣泛的2大生態(tài)服務(wù)領(lǐng)域,土地利用/土地覆蓋(land use and land cover,LULC)和歸一化植被指數(shù)(normalized difference vegetation index,NDVI)是最為常用的2類衛(wèi)星遙感產(chǎn)品。NDVI與綠葉密度、凈初級(jí)生產(chǎn)力和CO2通量高度相關(guān),是地表生物量在景觀水平上的一個(gè)代表[8]。盡管隨遙感技術(shù)的發(fā)展,空間、光譜和時(shí)間分辨率不斷增強(qiáng),對(duì)植被空間異質(zhì)性和連續(xù)性的理解不斷加深,但基于遙感對(duì)離散的植被單元進(jìn)行分類一直是LULC分類方法的重要基礎(chǔ)[9]。遙感反演的植被產(chǎn)品是遙感應(yīng)用于生態(tài)監(jiān)測(cè)領(lǐng)域重要的數(shù)據(jù)之一。
伴隨著遙感數(shù)據(jù)的不斷積累,植被遙感產(chǎn)品形成了完善的時(shí)間序列數(shù)據(jù),利用這些數(shù)據(jù)分析生態(tài)系統(tǒng)變化,例如評(píng)估生態(tài)系統(tǒng)過程中的擾動(dòng)、檢測(cè)植物物候?qū)W的時(shí)空變化、分析氣候變化對(duì)植被的影響、監(jiān)測(cè)LULC變化、植被時(shí)空異質(zhì)性評(píng)價(jià)等,基本上構(gòu)成了近幾十年來最為活躍的生態(tài)遙感研究主題。植被覆蓋和生產(chǎn)力的年際變化被認(rèn)為是理解全球氣候變化對(duì)生態(tài)系統(tǒng)動(dòng)力學(xué)影響的關(guān)鍵[10]。目前,研究者已經(jīng)開發(fā)出許多軟件或程序來處理遙感時(shí)間序列數(shù)據(jù),例如TIMESAT[11],BFAST[12],Timestats[13],SPIRITS[14],DBEST[15],phenor[16],F(xiàn)ORCE[17],BEAST[18]和DATimeS[19]等。
然而,云、氣溶膠和儀器誤差等因素往往造成植被遙感時(shí)間序列數(shù)據(jù)存在不同程度的缺失或質(zhì)量變差等情況。無論利用哪種軟件分析植被遙感時(shí)間序列數(shù)據(jù),確保所使用遙感時(shí)間序列數(shù)據(jù)完整、高質(zhì)量是至關(guān)重要的,高質(zhì)量的完整時(shí)間序列數(shù)據(jù)才能保證結(jié)果的可信度。對(duì)存在數(shù)據(jù)缺失的時(shí)間序列數(shù)據(jù)進(jìn)行時(shí)空重建是準(zhǔn)確提取時(shí)間序列變化特征的重要前提。盡管國內(nèi)外有許多研究對(duì)比了不同方法重建時(shí)間序列數(shù)據(jù)的優(yōu)劣[20-25],但新的研究成果不斷涌現(xiàn),本研究試圖對(duì)以往研究使用的時(shí)間序列重建方法進(jìn)行綜述,并側(cè)重于近年來的最新研究成果,通過一些示例,介紹有關(guān)新方法的適用性和潛在的應(yīng)用價(jià)值。
衛(wèi)星數(shù)據(jù)時(shí)間序列可以看作是一種3-D數(shù)組,對(duì)于這種時(shí)間序列,最常見的問題就是數(shù)據(jù)缺失,也可稱為數(shù)據(jù)異常。數(shù)據(jù)缺失問題是遙感數(shù)據(jù)預(yù)處理中面臨的最主要問題之一。缺失數(shù)據(jù)對(duì)定量遙感研究的影響會(huì)很嚴(yán)重,導(dǎo)致參數(shù)估計(jì)有偏差、信息丟失、可信度下降等。導(dǎo)致數(shù)據(jù)缺失/異常的原因可以歸納為氣象條件(云、雪、灰塵和氣溶膠)、儀器誤差/傳感器退化、數(shù)據(jù)傳輸過程中圖像數(shù)據(jù)丟失、時(shí)間分辨率低等。其中,傳感器退化引起的數(shù)據(jù)異常往往導(dǎo)致時(shí)間序列存在某種趨勢(shì),對(duì)于這種因素往往無法通過常見的數(shù)據(jù)重建方法進(jìn)行校正,需要數(shù)據(jù)生產(chǎn)方對(duì)傳感器進(jìn)行評(píng)估和校準(zhǔn),比如MODIS C6版本數(shù)據(jù)(較C5 版本)對(duì)Terra/MODIS退化的校正[26]。本研究中的數(shù)據(jù)重建方法主要針對(duì)傳感器退化因素以外引起的數(shù)據(jù)缺失和異常。
數(shù)據(jù)缺失/異常產(chǎn)生的噪聲包含了不真實(shí)的時(shí)間變異,對(duì)于這類噪聲,以往研究大致有以下2類處理方法: ①利用平滑方法,對(duì)包含噪聲的原始時(shí)間序列直接進(jìn)行平滑處理。例如,Mondal等[27]使用基于離散傅里葉變換(discrete Fourier transform,DFT)的平滑方法來處理原始的MOD13Q1數(shù)據(jù),減少NDVI時(shí)間序列中的噪聲,相比其他平滑技術(shù),DFT需要的模型參數(shù)更少。②只使用原始時(shí)間序列中的高質(zhì)量數(shù)據(jù),通過數(shù)據(jù)插值和平滑方法,重建時(shí)間序列。原始數(shù)據(jù)的質(zhì)量可基于質(zhì)量標(biāo)記產(chǎn)品來判定,或者基于相應(yīng)數(shù)據(jù)點(diǎn)的標(biāo)準(zhǔn)偏差σ,一般認(rèn)為位于平均值±3σ以外的數(shù)據(jù)點(diǎn)是低質(zhì)量的[28-30]。例如,Jeganathan等[29]將任一像元1 a內(nèi)特定時(shí)段的GIMMS NDVI值與其歷年相應(yīng)時(shí)段的多年平均值進(jìn)行比較,然后移除NDVI值在平均值±3σ以外的那些數(shù)據(jù)點(diǎn),經(jīng)過這些處理后,剩余的數(shù)據(jù)點(diǎn)可認(rèn)為是“高質(zhì)量”的,再進(jìn)一步利用插值方法來填補(bǔ)上述低質(zhì)量數(shù)據(jù)消除過程中產(chǎn)生的數(shù)據(jù)空白。與第一類方法相比,第二類方法在數(shù)據(jù)重建時(shí)首先直接去除了異常值,相對(duì)更為可靠。本研究將著重概述第二類方法有關(guān)的研究進(jìn)展。對(duì)于該類遙感時(shí)間序列數(shù)據(jù)重構(gòu)方法,簡(jiǎn)而言之,包括插值和平滑2步,即通過利用遙感數(shù)據(jù)的時(shí)空相關(guān)性對(duì)已有的存在數(shù)據(jù)缺失的高質(zhì)量數(shù)據(jù)序列進(jìn)行插值、平滑濾波,以達(dá)到重建時(shí)間序列的目的。
插值是指對(duì)存在數(shù)據(jù)缺失的時(shí)間序列進(jìn)行填補(bǔ)。一些平滑方法對(duì)于不等間距的序列可以自動(dòng)插值,如Whittaker方法[31]、傅里葉方法[19],這些方法兼顧了插值和平滑的功能。另一些平滑方法(如Savitzky-Golay)的前提就是時(shí)間序列必須連續(xù)、完整,因此在使用這些平滑方法前需進(jìn)行數(shù)據(jù)缺失的填補(bǔ)。插值方法大致可分為基于時(shí)間的插值方法和基于空間的插值方法2種類型。
基于時(shí)間的插值方法主要是考慮到所插值的數(shù)據(jù)是與生物過程時(shí)間動(dòng)態(tài)直接聯(lián)系在一起的[32],應(yīng)用尤為廣泛。比較簡(jiǎn)單的基于時(shí)間的數(shù)據(jù)填補(bǔ)方法,可以由數(shù)據(jù)缺失像元的歷史同期平均或最近的有效數(shù)據(jù)(特別是對(duì)于受到積雪影響的植被數(shù)據(jù))替代[33],或者使用2個(gè)相鄰有效值的移動(dòng)平均值替換可能由云和大氣氣溶膠等因素引起的局部不規(guī)則變化和短間隙[34-35]。更為常用的時(shí)間插值方法為線性插值[36]和樣條插值[37],其中,樣條法也可以用于空間插值[38]和數(shù)據(jù)序列平滑[39]。與線性插值方法相比,時(shí)間序列諧波分析(harmonic analysis of time series,HANTS)、奇異譜分析(singular spectrum analysis,SSA)是更為復(fù)雜的時(shí)間插值方法。HANTS算法是快速傅里葉變換(fast Fourier transform,F(xiàn)FT)的一種改進(jìn),采用基于諧波分量的最小二乘曲線擬合方法,在植被遙感時(shí)間序列插值中展示了良好的性能[40-41]。利用SSA進(jìn)行插值是一種近年來發(fā)展的數(shù)據(jù)插值方法,其原理在于使用迭代方法對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì),然后使用這些估計(jì)來計(jì)算滯后協(xié)方差矩陣及其經(jīng)驗(yàn)正交函數(shù)分解分量,再使用交叉驗(yàn)證來優(yōu)化窗口寬度和SSA主模態(tài)的數(shù)量,以填補(bǔ)數(shù)據(jù)空白。盡管SSA插值方法在植被遙感數(shù)據(jù)中應(yīng)用不多[42],但在海溫、降水和土壤呼吸等多種類型的地學(xué)數(shù)據(jù)插值中顯示了其價(jià)值[43-44]。然而,類似SSA和HANTS這樣的方法是基于數(shù)據(jù)序列周期性的,如果數(shù)據(jù)缺失持續(xù)的時(shí)間長,就不能成功識(shí)別周期及振蕩,從而導(dǎo)致利用這些方法得到的結(jié)果缺乏可信度[45]。
基于空間的插值方法主要是利用存在數(shù)據(jù)缺失的像元周邊的(不存在數(shù)據(jù)異常的)像元信息進(jìn)行插值,除樣條法以外,常用的方法還包括最鄰近插值、反距離加權(quán)插值、地統(tǒng)計(jì)方法(如克里格法)等。需要注意的是,數(shù)據(jù)缺失像元通常存在空間聚集的情況,在進(jìn)行空間插值時(shí),有必要評(píng)價(jià)空間自相關(guān)效應(yīng)[46]。而且,由于混合像素的存在,植被指數(shù)在短距離內(nèi)變化可能很大,導(dǎo)致基于空間的插值可能無法代表真實(shí)景觀的復(fù)雜性。
盡管目前有很多種時(shí)間和空間插值方法,但這2類方法都不能在所有情況下超越對(duì)方,而時(shí)間和空間信息相結(jié)合的插值方法正在顯現(xiàn)出更多的優(yōu)勢(shì)。Borak等[47]以MODIS LAI時(shí)間序列為例,對(duì)幾種時(shí)間和空間插值技術(shù)進(jìn)行了評(píng)估,發(fā)現(xiàn)插值技術(shù)的精度取決于下墊面覆蓋,時(shí)間插值在非森林覆蓋類型上執(zhí)行得更有效,空間插值在森林區(qū)域執(zhí)行得更好,而空間和時(shí)間方法的結(jié)合提供了比任何單一的時(shí)間和空間方法更好的插值能力。Pede等[38]發(fā)現(xiàn),對(duì)于受到云覆蓋影響的MODIS 8 d LST數(shù)據(jù),空間插值方法、空間和時(shí)間相結(jié)合的插值方法比時(shí)間插值方法顯示出了更大的優(yōu)勢(shì),而且空間和時(shí)間相結(jié)合的方法受地形、氣候等環(huán)境因素的影響更小。近年來更多研究使用來自鄰近像素的歷史數(shù)據(jù)和時(shí)間曲線來結(jié)合空間和時(shí)間信息進(jìn)行插值,也顯現(xiàn)出了比僅用時(shí)間或空間插值更大的優(yōu)勢(shì)[48-49]。Yan等[50]提出了一種應(yīng)用于高空間分辨率、低時(shí)間分辨率的Landsat數(shù)據(jù)進(jìn)行間隙填補(bǔ)的時(shí)空相似替代算法,通過合并空間和時(shí)間上相鄰的相似像素來分割圖像時(shí)間序列,然后將這些片段分組到不同的類中,需要填充的像素位置與屬于同一類的其他像素進(jìn)行比較,以識(shí)別替代像素,不過其算法不考慮地表變化趨勢(shì),因此較適用于在地表沒有發(fā)生變化期間獲取的圖像。
最近還涌現(xiàn)了一些基于機(jī)器學(xué)習(xí)的插值算法,如神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹等,這些方法不同于傳統(tǒng)的參數(shù)方法(如線性方法),信息來自于訓(xùn)練數(shù)據(jù),不需要假設(shè)它們的統(tǒng)計(jì)分布或變量之間的相互關(guān)系,但這些方法的效果如何,還有待深入評(píng)價(jià)[19]??傮w上,插值的效果不僅依賴于插值算法,更依賴于原始數(shù)據(jù)的質(zhì)量,當(dāng)原始數(shù)據(jù)序列具有較大的高質(zhì)量數(shù)據(jù)比例時(shí)(比如大于85%),普通的線性插值一般就可以滿足需要[51]。而且,對(duì)于常用的GIMMS NDVI數(shù)據(jù),Burrell等[52]認(rèn)為當(dāng)原始時(shí)間序列的有效值大于85%時(shí),質(zhì)量即滿足需求,可以直接使用原始序列。另外,在一些情形下(如物候特征提取),當(dāng)某像元缺值數(shù)據(jù)超過一定數(shù)量時(shí),比如連續(xù)缺值超過1個(gè)月,Pastor-Guzman等[53]選擇不使用相應(yīng)位置的數(shù)據(jù),而通過插值方法獲得相應(yīng)缺失的數(shù)據(jù)。
由于插值算法本身局限性以及原始時(shí)間序列數(shù)據(jù)缺失程度的影響,插值后的時(shí)間序列數(shù)據(jù)可能仍然包含噪聲,這時(shí)候需要進(jìn)行平滑,平滑的主要目的是降噪,以保證重建時(shí)間序列的質(zhì)量。
簡(jiǎn)單的平滑方法包括最大值合成(maximum value composite,MVC)方法、通過使用預(yù)定義的閾值移除異常值的最佳指數(shù)斜率提取算法(best index slope extraction,BISE)[54]、迭代插值方法(iterative interpolation for data reconstruction,IDR)[32]。Holben[55]是最早提出使用MVC在時(shí)間序列中抑制NDVI噪聲的研究之一,而且MVC產(chǎn)品還減少了NDVI時(shí)間序列中云污染像素造成的數(shù)據(jù)間隙。然而,即使在MVC過程之后,特別是當(dāng)云層覆蓋持續(xù)時(shí)間長于合成期(如在雨季)時(shí),一些殘留的噪聲可能仍然會(huì)出現(xiàn)在數(shù)據(jù)中。這時(shí)就需要使用更加穩(wěn)健的平滑方法對(duì)序列進(jìn)行降噪。
曲線擬合方法是目前使用較多的平滑方法[36],如SG(Savitzky-Golay)、TSGF(temporal smoothing and gaplling)、非對(duì)稱高斯函數(shù)(asymmetric Gaussian,AG)、雙邏輯函數(shù)(double logistic,DL)和傅里葉變換等應(yīng)用于局部時(shí)間窗口的曲線擬合方法[56],以及可應(yīng)用于整個(gè)時(shí)間序列的Whittaker濾波方法(一種樣條平滑方法)等。其中,AG,DL和SG方法被集成到時(shí)間序列分析軟件(TIMESAT)中,使得這3種方法更易于實(shí)現(xiàn)[57]。曲線擬合方法除了應(yīng)用于平滑降噪外,也被用于提取植被物候變化參數(shù),因?yàn)閿M合最主要的依據(jù)就是植被時(shí)間變化特征。特別是在局部窗口內(nèi)擬合衛(wèi)星數(shù)據(jù)時(shí)間序列,多采用高階諧波方法或更多參數(shù),能夠更好地捕捉植被動(dòng)態(tài),尤其適于不規(guī)則、不對(duì)稱的植被指數(shù)曲線,不過它們對(duì)局部波動(dòng)和數(shù)據(jù)噪聲也更為敏感,某些情況下,可以對(duì)經(jīng)過局部擬合的且仍然包含有不規(guī)則數(shù)據(jù)的序列,再應(yīng)用局部中值濾波去除局部不規(guī)則值[34]。相比基于整個(gè)時(shí)間序列或低階諧波的方法往往得到更平滑的曲線,但也可能偏離實(shí)際植被生長軌跡,導(dǎo)致過度校正,抑制了實(shí)際植被波動(dòng)。
每種時(shí)間序列平滑算法都有其獨(dú)特的優(yōu)點(diǎn)和缺點(diǎn),在選擇平滑算法時(shí),不僅應(yīng)考慮時(shí)間序列的應(yīng)用目的、數(shù)據(jù)中噪聲的性質(zhì)、時(shí)間序列曲線的典型形狀和使用方法的方便性等[56],還應(yīng)考慮原始時(shí)間序列的數(shù)據(jù)質(zhì)量[58]。如果數(shù)據(jù)質(zhì)量足夠高,可以選擇保持季節(jié)內(nèi)變化的濾波方法,如SG濾波[22, 59]和Whittaker濾波[31, 60]; 在高質(zhì)量數(shù)據(jù)較少的情況下,比如觀測(cè)頻率相對(duì)較低的Landsat和Sentinel-2數(shù)據(jù),函數(shù)擬合(如DL)可能是實(shí)現(xiàn)穩(wěn)健性的唯一選擇[61]。另外,好的插值算法也能間接提高平滑方法的質(zhì)量。比如,Padhee等[62]基于局地(尤其是同一土地覆蓋類型)物候時(shí)空相似性的考慮,使用參考物候曲線來預(yù)測(cè)NDVI時(shí)間序列中的缺失值的方法對(duì)MODIS NDVI時(shí)間序列進(jìn)行預(yù)插值,改善了云高覆蓋地區(qū)時(shí)間序列中存在較大數(shù)據(jù)間隙而導(dǎo)致的HANTS方法的不足。
盡管目前沒有公認(rèn)的標(biāo)準(zhǔn)來比較不同的時(shí)間序列重建方法[63],但是可以通過評(píng)估重建后的時(shí)間序列對(duì)原始無云數(shù)據(jù)的保真度和識(shí)別受云污染值的能力來判斷方法合適與否。由于地面真實(shí)數(shù)據(jù)通常不可用,Julien等[32]以GIMMS NDVI為例,提出了以下判斷標(biāo)準(zhǔn): 重建后的值與原始觀測(cè)值的距離、以及與上包絡(luò)線的接近度。與原始觀測(cè)值的距離旨在量化對(duì)未污染數(shù)據(jù)的保真度。對(duì)于上包絡(luò)近似準(zhǔn)則,它基于大氣污染有降低NDVI值的趨勢(shì)這一考慮,這一標(biāo)準(zhǔn)在整個(gè)時(shí)間序列中被定義為NDVI低于原始觀測(cè)值的重建觀測(cè)值的頻率(范圍在0~1)。對(duì)于該準(zhǔn)則,較低的值對(duì)應(yīng)于更接近原始時(shí)間序列的上包絡(luò)線。這2個(gè)標(biāo)準(zhǔn)對(duì)于評(píng)價(jià)時(shí)間序列重建方法具有較好的效果,特別是當(dāng)大氣污染或云對(duì)遙感反演的生物物理參數(shù)有負(fù)面影響時(shí)。
這里選取線性插值、SSA,Whittaker和HANTS等4類常用的不同類型的時(shí)間序列數(shù)據(jù)重建方法,通過在模擬的NDVI時(shí)間序列、原始NDVI完整時(shí)間序列中隨機(jī)制造不同比例的數(shù)據(jù)缺失,使用上述4類方法進(jìn)行數(shù)據(jù)重建,然后計(jì)算重建時(shí)間序列與原始時(shí)間序列的均方根誤差(root mean square error,RMSE),以衡量重建序列同原始序列之間的偏差,從而判斷不同方法的優(yōu)劣。
RMSE亦稱標(biāo)準(zhǔn)誤差,值越小,擬合效果越好。計(jì)算方法為:
(1)
式中:y為原始序列;z為擬合序列;N為序列長度。
模擬NDVI序列包含短周期的波動(dòng)和長期趨勢(shì)[64],按照下式生成為:
(2)
對(duì)生成的模擬NDVI序列隨機(jī)刪除10%,20%,30%和40%的數(shù)據(jù),以制造不同比例的數(shù)據(jù)缺失,然后分別使用前述的4種方法進(jìn)行數(shù)據(jù)重建,計(jì)算重建后的完整時(shí)間序列與原始完整序列之間的RMSE(用RMSEall表示)以及數(shù)據(jù)缺失位置處的重建序列與相應(yīng)位置原始序列之間的RMSE(用RMSEgap表示)。 4種方法的效果及相應(yīng)的RMSE見圖1和表1。
(a) 缺失10%(b) 缺失20%
(c) 缺失30%(d) 缺失40%
圖1 模擬NDVI序列數(shù)據(jù)重建效果對(duì)比
表1 基于模擬NDVI序列的不同數(shù)據(jù)重建方法的RMSE對(duì)比
分析可以發(fā)現(xiàn),線性插值對(duì)已有數(shù)據(jù)不進(jìn)行改動(dòng),僅對(duì)數(shù)據(jù)缺失位置進(jìn)行線性內(nèi)插。當(dāng)數(shù)據(jù)缺失較少或者數(shù)據(jù)缺失不在峰、谷端點(diǎn)時(shí),線性插值具有良好的準(zhǔn)確性(表1)。SSA方法作為基于識(shí)別序列周期性的方法,插值的序列有時(shí)具有相對(duì)較大的振幅(圖1),具體原因可能和模擬序列的生成方法有關(guān)。Whittaker方法對(duì)原始序列的保真及數(shù)據(jù)缺失位置的插值效果最好,而HANTS方法次之。
本序列來自GIMMS NDVI數(shù)據(jù)集,首先對(duì)GIMMS NDVI數(shù)據(jù)進(jìn)行月最大值合成,然后篩選1982年1月—2018年12月NDVI月值質(zhì)量標(biāo)示全部為0(flag=0)的格點(diǎn)得到,所選取的序列位于經(jīng)緯度分別為86.416°E,47.167°N的位置。在該序列中隨即剔除10%,20%,30%,40%數(shù)據(jù)制造數(shù)據(jù)缺失(圖2和圖3),評(píng)估插值后數(shù)據(jù)與真實(shí)值之間的RMSE(表2)。
(a) 缺失10%
(b) 缺失20%
(c) 缺失30%
(d) 缺失40%
(a) 缺失10%(b) 缺失20%
(c) 缺失30%(d) 缺失40%
圖3 NDVI序列數(shù)據(jù)重建方法效果局部放大對(duì)比
表2 基于GIMMS NDVI時(shí)間序列的不同數(shù)據(jù)重建方法的RMSE
圖2和表2顯示了針對(duì)GIMMS NDVI序列不同數(shù)據(jù)缺失比例下的4種數(shù)據(jù)重建方法的性能,圖3截取了其中一段展示其局部效果??梢园l(fā)現(xiàn),線性方法保持了模擬序列時(shí)的表現(xiàn),隨著數(shù)據(jù)缺失比例增加,RMSEgap逐漸上升。而處理模擬NDVI序列時(shí)表現(xiàn)最好的Whittaker方法依然保持了良好的性能,而且其只需要通過設(shè)置唯一參數(shù)即可平衡擬合的保真度和粗糙度,在保證擬合精度的同時(shí),也提高了曲線的平滑度,不過,該方法的RMSEgap有時(shí)稍高于SSA。相比,在該示例中,SSA成為最好的數(shù)據(jù)重建方法,而且隨缺失數(shù)據(jù)的增多,誤差變化不大。HANTS方法對(duì)原始序列的保真和斷點(diǎn)位置的插值基本穩(wěn)定,但該方法參數(shù)設(shè)置較為復(fù)雜,需要多次試驗(yàn)才能確定合適的參數(shù),提高平滑度的同時(shí)也犧牲了擬合的精度,而且其RMSE在不同缺失比例下都要高于SSA,這也與Ghafarian Malamiri等[42]的研究相一致。
完整的高質(zhì)量植被遙感時(shí)間序列是利用遙感準(zhǔn)確提取植被生態(tài)系統(tǒng)變化特征的重要前提。然而,云覆蓋等因素嚴(yán)重制約著植被遙感產(chǎn)品的觀測(cè)質(zhì)量,造成時(shí)間序列中存在不同程度的數(shù)據(jù)缺失或低質(zhì)量數(shù)據(jù)。本研究回顧了以往常用的時(shí)間序列重建方法,這些方法可以概括為2大類型: ①利用平滑方法對(duì)包含噪聲的原始時(shí)間序列直接進(jìn)行平滑處理; ②僅使用原始時(shí)間序列中的高質(zhì)量數(shù)據(jù),通過數(shù)據(jù)插值和平滑方法,重建完整時(shí)間序列。后者是目前數(shù)據(jù)重建的主流方法,且已經(jīng)發(fā)展了相應(yīng)的多種多樣的數(shù)據(jù)插值和平滑方法。
在回顧以往數(shù)據(jù)重建方法的基礎(chǔ)上,本研究以在模擬的NDVI時(shí)間序列、原始NDVI完整時(shí)間序列中隨機(jī)制造不同比例的數(shù)據(jù)缺失為例,具體對(duì)比了線性插值、SSA方法、Whittaker方法和HANTS方法等4類方法的數(shù)據(jù)重建性能,研究發(fā)現(xiàn),這些方法在NDVI數(shù)據(jù)缺失插補(bǔ)中均取得了較好的精度。然而,它們有各自的優(yōu)點(diǎn)和缺點(diǎn),在不同的情況下填補(bǔ)數(shù)據(jù)空缺時(shí)需要加以考慮。其中,線性插值是一種廣泛使用的方法,然而當(dāng)缺失數(shù)據(jù)過多時(shí),這種方法并不適用; 相比Whittaker 方法、SSA方法和HANTS方法顯示出了更好的性能,盡管一些情形下,SSA及HANTS對(duì)應(yīng)的RMSE高于Whittaker方法,但這3種方法的整體差異并不大; 不過,HANTS方法需要設(shè)置的參數(shù)相對(duì)較多,SSA方法在某些情形下的重建序列具有較大的振幅,而Whittaker方法在不同的數(shù)據(jù)缺失情形下都顯示出了較好的效果,且需要的參數(shù)較少,是一種值得推廣的插值方法。當(dāng)然,除NDVI以外,EVI,EVI2以及近年來的SIF等也是較為常用的植被遙感產(chǎn)品。由于不同植被遙感時(shí)間序列最重要的共同特征之一是具有顯著的季節(jié)動(dòng)態(tài),而常見的植被遙感時(shí)間序列重建方法一般具有很好的普適性(比如Whittaker 方法),也多基于序列周期性(比如HANTS方法),因此它們也適用于NDVI以外的其他植被遙感時(shí)間序列。
總體上,本研究主要側(cè)重于回顧近年來的植被遙感時(shí)間序列重建方法,但僅采用了模擬數(shù)據(jù)和一個(gè)樣點(diǎn)的遙感數(shù)據(jù)進(jìn)行時(shí)間序列重建方法比較。而隨區(qū)域的不同,插值方法的表現(xiàn)可能有所差異,故研究結(jié)果還有待進(jìn)一步推廣試驗(yàn)。