章 勇,陳保平,劉培朕
(池州學(xué)院 地理與規(guī)劃學(xué)院,安徽 池州 247000)
地表溫度(Land Surface Temperature,LST)作為測量地表熱平衡的關(guān)鍵參數(shù),影響地表和大氣之間的相互作用和能量交換,因此獲取高精度的地表溫度數(shù)據(jù)具有重要意義[1]。它不僅是全局和區(qū)域?qū)用嫜芯康乇硐到y(tǒng)過程的重要參考,也是描述熱島效應(yīng)和全球變暖等自然現(xiàn)象的重要指標(biāo)[2]。此外,地表溫度廣泛應(yīng)用于氣候、水文、干旱等科學(xué)領(lǐng)域[3]。
目前,全局和區(qū)域地表溫度數(shù)據(jù)主要依靠熱紅外遙感,然而,熱紅外遙感無法穿透云層,造成基于熱紅外遙感的LST 數(shù)據(jù)在有云條件下存在缺失值[4]。多云地區(qū)地表溫度遙感數(shù)據(jù)的缺失造成了地表溫度產(chǎn)品時(shí)空不連續(xù),限制了地表溫度相關(guān)的應(yīng)用,因此,云下地表溫度的重建具有重要意義[5]。隨機(jī)森林模型具有強(qiáng)大的非線性表達(dá)能力,本文基于隨機(jī)森林模型重建云下地表溫度,以獲得全空條件下的地表溫度數(shù)據(jù)。
黑河流域,為我國西部的第二大內(nèi)河流域,它位于河西走廊的中心。黑河流域地處歐亞大陸中央,不與海洋相接壤,周圍被山地所包圍。其活動(dòng)一般受海洋環(huán)流限制,并受極地冷空氣團(tuán)的直接影響。屬干旱氣候,降水小而集中,風(fēng)大,日照較強(qiáng)而充實(shí),但晝夜氣溫差異也比較大。裸地是黑河流域最主要的覆蓋類型,耕地較少多在水體、濕地處,草地、林地主要分布在南部地區(qū)。黑河流域土地覆蓋分布如圖1所示。
圖1 黑河流域土地覆蓋分布圖
本文主要數(shù)據(jù)源如表1所示,主要包括MODIS每日地表溫度產(chǎn)品MOD11A1,MODIS 歸一化植被指數(shù)(NDVI)產(chǎn)品MOD13A2,GLASS 反照率(Albedo)以及ALOS 數(shù)字高程模型(DEM)數(shù)據(jù),CLDAS土壤濕度數(shù)據(jù)。由于MODIS地表溫度和歸一化植被指數(shù)以及GLASS反照率的空間分辨率為1km,而DEM 和CLDAS 土壤濕度(SM)數(shù)據(jù)的空間分辨率分別為30m和7km。為了統(tǒng)一空間分辨率,采用雙線性內(nèi)插法將DEM 和土壤濕度數(shù)據(jù)重采樣到1km。
表1 多元數(shù)據(jù)集
本文技術(shù)路線圖如圖2所示,主要通過隨機(jī)森林算法,建立了晴空條件下地表溫度與回歸因子NDVI、Albedo、SM、DEM之間的回歸關(guān)系,并將云空下的NDVI、Albedo、SM、DEM 回歸因子代入建立的晴空回歸模型,實(shí)現(xiàn)了云空LST 的重建,最后合并原始MODIS 晴空LST 和重建的云空LST 以獲得全空條件下的LST。
圖2 技術(shù)路線圖
隨機(jī)森林模型,是由Leo Brayman 和Carter Adele 于2001 年發(fā)明的一個(gè)數(shù)據(jù)挖掘技術(shù)。隨機(jī)森林由決策樹組成,具有強(qiáng)大的非線性表達(dá)能力,與其他暗箱方法相比,更有利于分析變量的重要性。隨機(jī)森林不但可以進(jìn)行分類,而且還可以進(jìn)行回歸分析,能夠建立良好的回歸方程,并利用變量與多個(gè)參數(shù)之間的互相依賴性,將其外推到量化關(guān)系之中。
在建立隨機(jī)森林模型時(shí),必須選取合適的模型因子作為輸入變量。因?yàn)榈乇頊囟扰c植被、反照率、土壤濕度以及地形之間都存在著高度的關(guān)聯(lián)。因此,本文在地表溫度重建中選取了歸一化植被指數(shù)、反照率、土壤濕度和數(shù)字高程模型作為模型因子。通過隨機(jī)森林構(gòu)建地表溫度和模型因子之間的非線性關(guān)系,其回歸關(guān)系可以用公式(1)表示。
式中,LST表示地表溫度,NDVI表示歸一化植被指數(shù),Albedo表示反照率,SM表示土壤濕度,DEM表示數(shù)字高程模型,f表示隨機(jī)森林回歸模型。
為比較重建前后LST 的視覺效果,圖3 顯示了2015年5月8日和11月4日的LST原始數(shù)據(jù)與重建的全空LST可視化結(jié)果。
圖3 黑河流域重建前后地表溫度
由圖3 可以看出,采用隨機(jī)森林算法實(shí)現(xiàn)LST重建的有效性較高,該算法能夠重建云下缺失的地表溫度數(shù)值,并保持重構(gòu)結(jié)果和原始LST之間的空間一致性。同時(shí),重建圖像也可以很好地保留原始LST的細(xì)節(jié)信息。經(jīng)過對隨機(jī)森林模型重構(gòu)之后,可以獲得空間上完整的LST,從而可以突出地表溫度的空間變化特性,黑河流域南部地區(qū)多植被覆蓋,溫度較低;北部地區(qū)有建筑物、裸地等,溫度較高;符合客觀規(guī)律。
為了定量驗(yàn)證云下LST的重建精度,選取云量較小的2015年8月30日的LST原始數(shù)據(jù),通過模擬云空進(jìn)行定量評(píng)價(jià),如圖4所示。隨機(jī)提取晴空下原始影像中區(qū)域數(shù)據(jù)作為驗(yàn)證集模擬云空,剩下的晴空數(shù)據(jù)用于構(gòu)建隨機(jī)森林回歸模型,通過將晴空下像元的回歸因子和地表溫度構(gòu)建隨機(jī)森林模型,再將模擬云空的回歸因子代入構(gòu)建的隨機(jī)森林模型即可獲得模擬云空下地表溫度。
圖4 模擬云空重建結(jié)果
模擬云空區(qū)域重建結(jié)果如圖5 所示,重建的LST保留了原始LST的紋理信息。為了進(jìn)一步評(píng)價(jià)重建結(jié)果,我們計(jì)算了模擬云空區(qū)域的R、MAE 以及RMSE,進(jìn)行對比驗(yàn)證,模擬地表溫度與實(shí)際地表溫度相互之間的相關(guān)系數(shù)R為0.99,說明重建前后地表溫度數(shù)值間的密切度高、關(guān)聯(lián)性較好;重建前后的影像圖中MAE 為0.12,模擬值與實(shí)際地表溫度高度一致;重建前后影像RMSE 為0.22,說明偏差較小。綜上,利用隨機(jī)森林模型具有可信度,能合理實(shí)現(xiàn)云下地表溫度重建,同時(shí)其重建的準(zhǔn)確度也較高。
圖5 模擬云空區(qū)域
本文主要基于隨機(jī)森林回歸模型,選擇NDVI、Albedo、SM 和DEM 作為回歸因子,重建云下LST 信息。重建結(jié)果在視覺上能夠在保留原始LST 紋理信息的基礎(chǔ)上獲得空間上完整的LST 數(shù)據(jù),重建結(jié)果符合客觀規(guī)律。在模擬重建實(shí)驗(yàn)中,重建結(jié)果的R 為0.99,MAE 為0.12,RMSE 為0.22,重建誤差較低。