張忠雪,馮琦勝,王瑞涇,金哲人,梁天剛
(蘭州大學草地農(nóng)業(yè)科技學院, 甘肅 蘭州 730020)
草地是全球生態(tài)系統(tǒng)的重要組成部分[1],在生態(tài)環(huán)境中具有至關(guān)重要的作用[2]。草地地上生物量(above-ground biomass, AGB)是評價草地生態(tài)系統(tǒng)功能和生產(chǎn)力的重要指標[3],它影響著生物多樣性和環(huán)境過程(水循環(huán)、土壤侵蝕和退化)。此外,它不僅能夠反映草地的生長狀況,還可以反映草地對全球氣候變化和人類活動的敏感性,對評價和認識草地生態(tài)系統(tǒng)退化的嚴重程度至關(guān)重要[4]。近年來,隨著高時空分辨率的多光譜遙感和無人機技術(shù)的不斷發(fā)展,草地監(jiān)測遙感數(shù)據(jù)的類型也發(fā)生了變化。MODIS NDVI [中分辨率成像光譜儀(moderateresolution imaging spectroradiometer, MODIS) 歸 一 化植被指數(shù)(normalized differential vegetation index)]自2000 年起逐步替代AVHRR NDVI [改進型甚高分辨率輻射計(advanced very high resolution radiometer)NDVI],其繼承了AVHRR NDVI 的優(yōu)點,同時彌補了AVHRR NDVI 的部分不足,能更好地反映植被狀況[5]。2011 年10 月28 日美國發(fā)射了Suomi NPP(The Suomi National Polar-orbiting Partnership)衛(wèi) 星,該衛(wèi)星用來接替處于超期服役狀態(tài)下的Terra 和Aqua 衛(wèi)星[6]。NPP 攜帶包括可見光紅外成像輻射儀(visible infrared imaging radiometer, VIIRS)在 內(nèi) 的5 個對地觀測儀器,其中VIIRS 具有中、高分辨率的兩種工作模式,是MODIS 系列的拓展。如果MODIS失效,VIIRS 將在延續(xù)MODIS 的任務上發(fā)揮重要作用[7]。
自NPP 衛(wèi)星發(fā)射以來,VIIRS 應用于諸多研究領(lǐng)域。比如研究者利用VIIRS 晝夜通道反演華北地區(qū)夜間氣溶膠光學厚度[8];使用VIIRS 夜燈復合材料繪制了巴西、印度、中國和美國多個定居點的夜燈地圖[9];利用NPP-VIIRS 夜間燈光影像和氣象數(shù)據(jù)等構(gòu)建長株潭城市群PM 2.5 濃度估算模型[10];利用NPP-VIIRS 日/夜波段數(shù)據(jù),并結(jié)合夜間光照變化和輻射歸一化方法,評估鄭州的經(jīng)濟恢復力[11];對比分析了MODIS 和VIIRS 的熱發(fā)射波段數(shù)據(jù),結(jié)果表明當亮度溫度大于230 K 時,MODIS 和VIIRS可比波段的亮度溫度差一般在0.2 K 以內(nèi)[12]。MODIS傳感器已經(jīng)持續(xù)提供了20 多年的遙感數(shù)據(jù),VIIRS傳感器可為遙感數(shù)據(jù)監(jiān)測研究提供更長的時間序列資料,因此對比分析MODIS 與VIIRS 在估算草地地上生物量方面的精度,探究VIIRS 能否代替MODIS 為草地地上生物量的變化監(jiān)測提供數(shù)據(jù)支撐,具有重要意義。
本研究以甘南地區(qū)為例,選用MODIS 的4 種植被數(shù)據(jù)產(chǎn)品和VIIRS 的兩種植被數(shù)據(jù)產(chǎn)品,結(jié)合增強型植被指數(shù)(enhanced vegetation index, EVI)和NDVI兩種植被指數(shù),分別基于傳統(tǒng)方法與隨機森林方法構(gòu)建反演模型,分析MODIS 與VIIRS 在高寒草地地上生物量估測方面的精度差異,探究在高寒草地地上生物量估測方面表現(xiàn)更好的產(chǎn)品,對甘南高寒草地地上生物量監(jiān)測具有指導作用,對高寒草地資源保護與利用、草畜平衡管理的可持續(xù)發(fā)展具有重要意義。
甘南位于我國甘肅省西南部,地處青藏高原東北邊緣,南與四川阿壩州相連,西南與青海黃南州、果洛州接壤,東面和北部與隴南、定西、臨夏毗鄰。地理坐標為100°46′~104°44′ E,33°06′~36°10′ N,南北寬270 km,東西長360 km,海拔介于1 100~4 900 m,海拔由東向西逐漸增加,平均海拔超過3 000 m。甘南各地年平均氣溫在1~13 ℃,地域差異很大。總的分布趨勢是自東南向西北逐漸遞減。四季氣溫的分布趨勢大致與年平均氣溫相似,由東南向西北遞減。氣溫的年較差一般在20~22 ℃。年平均降水量400~800 mm,但是降水并不是平均分布,其隨海拔的升高而增加。甘南地處青藏高原東緣,是黃河重要的水源補給區(qū),同時也是甘肅省極為重要的農(nóng)牧業(yè)產(chǎn)品供給區(qū)[13]。草地作為農(nóng)牧業(yè)和水源補給的載體,對生態(tài)調(diào)節(jié)和經(jīng)濟發(fā)展具有極其重要的作用。甘南天然草地類型有山地草甸、高寒草甸、沼澤等,地勢東低西高,可利用草地面積較大,主要分布在瑪曲、碌曲、夏河三縣。雖然其地處高原,年平均氣溫較低,但草地資源豐富,畜牧業(yè)較發(fā)達[14]。
本研究采用2016-2021 年的7 月-8 月甘南的實測數(shù)據(jù),在甘南選擇具有代表性的位置設(shè)置樣地。本研究采用的樣方大小為0.5 m × 0.5 m,共采集了105 個樣點數(shù)據(jù),每個樣點設(shè)置3 個樣方,取平均值(圖1)。同時應用每個樣點對應的經(jīng)度(X)、緯度(Y)和地上生物量等實測數(shù)據(jù)。采樣記錄的內(nèi)容包括樣點經(jīng)緯度、地上生物量、干重、草層高度、植被類型等指標。其中,在采樣過程中,齊地剪取植被的地上部分,將樣品烘干,測量干重,即為地上生物量。圖2 為105 個實測樣點采樣的具體時間分布。
圖1 甘南草地類型和定位觀測點分布Figure 1 Distribution of grassland types and locating observation points in Gannan
圖2 2016-2021 年甘南野外實測地上生物量Figure 2 Above-ground biomass of field measurements in Gannan from 2016 to 2021
本研究使用了來自美國航空航天局發(fā)布的MOD13A1、MOD13A3、MOD13Q1 和MCD43A4 產(chǎn)品以及VNP13A1、VNP13A3 產(chǎn)品(表1)。其中,MCD43A4 產(chǎn)品提供了經(jīng)過雙向反射分布函數(shù)(bidirectional reflectance distribution function, BRDF)校準的逐日地表反射率數(shù)據(jù),它包括MODIS1-7 通道,本研究僅使用第1 波段、第2 波段和第3 波段來計算NDVI[15]和EVI[16]。此外,對于MOD13A1、MOD13A3、MOD13Q1 這3 種產(chǎn)品,本研究使用MODIS數(shù)據(jù)重投影工具(MODIS reprojection tool,MRT)進行了提取與格式轉(zhuǎn)換,VNP13A1 和VNP13A3 產(chǎn)品基于ArcGIS 軟件進行了提取與格式轉(zhuǎn)換,此5 種產(chǎn)品均基于最鄰近法重采樣,并利用ArcGIS 軟件進行轉(zhuǎn)投影,采用AEA-Krassovsky 投影,處理后的數(shù)據(jù)為Geo-Tiff 格式。遙感影像日期與實際采樣日期的對比如表2 所示。
表1 基于MODIS 和VIIRS 傳感器的各植被指數(shù)產(chǎn)品的參數(shù)Table 1 Parameters of various vegetation index products based on MODIS and VIIRS sensors
表2 影像日期與采樣日期對比表Table 2 Comparison table of the image and sampling dates
本研究采用NDVI 和EVI 兩種植被指數(shù)進行草地地上生物量反演模型的構(gòu)建,其公式分別為:
式中:NIR、R、B分別表示近紅外波段、紅光波段和藍光波段,在EVI中,L= 1,為土壤調(diào)節(jié)參數(shù),參數(shù)C1和C2的值分別為6.0 和7.5。
隨機森林(random forest,RF)回歸模型是Breiman提出的基于多棵決策樹對樣本進行訓練,并根據(jù)訓練得到的模型對待測樣本類別進行預測的一種監(jiān)督學習算法[17-19]。RF 利用bootstrap 重抽樣方法從原始樣本中抽取同原始數(shù)據(jù)樣本集個數(shù)相同的多個樣本構(gòu)成樣本子集,利用每個樣本子集構(gòu)建決策樹,然后融合多棵決策樹的預測結(jié)果[20],模型的最終輸出結(jié)果由森林中的每一棵決策樹共同決定。本研究中,設(shè)置的決策樹數(shù)量為100,為了減少訓練樣本劃分偶然性帶來的結(jié)果誤差,本研究采用10 折交叉驗證確保模型的穩(wěn)定性[21]。在10 折交叉驗證中,試驗數(shù)據(jù)樣本被劃分為10 份,其中9 份作為訓練集,1 份作為測試集,將系統(tǒng)選出的測試集中最好的模型作為最終構(gòu)建反演模型的結(jié)果。
本研究采用決定系數(shù)(coefficient of determination,R2)和均方根誤差(root mean square error, RMSE)評價AGB 估測模型的精度[22-23],計算公式如下:
式 中:yi、y?i和yˉ分別 為AGB 的實 測值、估測 值和實測值均值,n為 樣本數(shù)量。R2的范圍在0~1,數(shù)值越大,則說明模型與實測數(shù)據(jù)的擬合度越高;RMS E反映了AGB 實測值和估計值之間的離散程度,數(shù)值越小,說明預測結(jié)果越好[24]。
Slope 趨勢分析是描述時間序列變化趨勢的分析方法。其利用線性回歸對時間序列進行擬合,探究不同空間尺度下變量的時空變化趨勢[25]。本研究基于此方法探究甘南2016-2021 年高寒草地地上生物量的變化趨勢。計算公式如下:
式中:i為年變量,從1 到n,n為 年份數(shù),yi為 第i年的生物量。Slope為斜率,表征各參數(shù)的變化趨勢。Slope> 0 (Slope< 0),即斜率為正(負),表示生物量增加(減少)。
基 于MOD13A1、MOD13Q1、MOD13A3、MCD43A4和試驗區(qū)實測草地地上生物量建立的回歸模型(表3、表4、表5、表6)可知,在4 種遙感植被指數(shù)產(chǎn)品中,MOD13A1 EVI 的線性(R2= 0.482)、對數(shù)(R2=0.462)、逆(R2= 0.432)、冪(R2= 0.489)、S (R2= 0.472)、增長(R2= 0.495)和指數(shù)(R2= 0.495)模型的決定系數(shù)均高于其他遙感產(chǎn)品,而RMSE 與其他遙感資料相比較低;MOD13Q1 NDVI 的線性(R2= 0.295)、對數(shù)(R2= 0.288)、逆(R2= 0.277)、冪(R2= 0.330)、S (R2=0.325)、增長(R2= 0.331)和指數(shù)(R2= 0.331)模型的決定系數(shù)均低于MOD13A1 和MOD13A3 產(chǎn)品的相應模型,RMSE 介于MOD13A1 EVI 和MOD13A3 NDVI之間,整體RMSE 值偏高,說明本研究中MOD13Q1產(chǎn)品反演甘南地區(qū)AGB 的精度最差。其中MCD43A4產(chǎn)品的R2低于MOD13A1,RMSE 值大于MOD13A1 EVI 模型。由此可見,基于MOD13A1 EVI 的增長模型是反演試驗區(qū)草地生物量的最優(yōu)模型。
表3 基于MOD13A1 甘南試驗區(qū)草地生物量的回歸模型Table 3 Biomass regression models based on MOD13A1 in the experimental area of Gannan region
表4 基于MOD13Q1 甘南試驗區(qū)草地生物量的回歸模型Table 4 Biomass regression models based on MOD13Q1 in the experimental area of Gannan region
表5 基于MOD13A3 甘南試驗區(qū)草地生物量的回歸模型Table 5 Biomass regression models based on MOD13A3 in the experimental area of Gannan region
表6 基于MCD43A4 甘南試驗區(qū)草地生物量的回歸模型Table 6 Biomass regression models based on MCD43A4 in the experimental area of Gannan region
基于VNP13A1、VNP13A3 和試驗區(qū)實測草地地上生物量建立的回歸模型(表7、表8)可知,在兩種遙感植被指數(shù)產(chǎn)品中,VNP13A3 EVI 的線性(R2=0.213)、對 數(shù)(R2= 0.215)、逆(R2= 0.2092)、冪(R2=0.230)、S (R2= 0.226)、增長(R2= 0.226)和指數(shù)(R2=0.226)模型的決定系數(shù)均高于VNP13A3 產(chǎn)品,而RMSE 與其相比較低。由此可知,在以上兩種產(chǎn)品中,基于VNP13A3 EVI 的模型精度最高,但與MOD13A1 EVI 相 比,VNP13A3 EVI 的R2較 低 且RMSE 值 偏大,因此在傳統(tǒng)方法中,基于MODIS 數(shù)據(jù)建立的甘南草地地上生物量的模型精度更高。
表7 基于VNP13A3 甘南試驗區(qū)草地生物量的回歸模型Table 7 Biomass regression models based on VNP13A3 in the experimental area of Gannan region
表8 基于VNP13A1 甘南試驗區(qū)草地生物量的回歸模型Table 8 Biomass regression models based on VNP13A1 in the experimental area of Gannan region
基于隨機森林和試驗區(qū)實測的草地地上生物量建立的回歸模型(表9)可知,在6 種遙感植被數(shù)據(jù)產(chǎn)品中,MOD13A1 的測試集R2(0.653)最高,RMSE值(718.89)最低;VNP13A3 的測試集R2(0.246)最低,RMSE (851.34)最高,二者精度相差較大,因此基于MOD13A1 植被指數(shù)產(chǎn)品的隨機森林模型的精度較高,VNP13A3 植被指數(shù)產(chǎn)品的精度較低。與傳統(tǒng)方法得出的最優(yōu)模型的精度相比,應用隨機森林方法計算的精度更高。
表9 基于VNP13A3 甘南試驗區(qū)草地生物量的回歸模型Table 9 Biomass regression models based on VNP13A3 in the experimental area of Gannan region
基于隨機森林反演得到的生物量和試驗區(qū)實測草地地上生物量數(shù)據(jù)(圖3)對比分析表明,真實值和預測值的擬合度較好,數(shù)據(jù)的分布比較集中,異常值較少,中位數(shù)位于四分位距的中間。預測值偏態(tài)非對稱,中位數(shù)位于四分位距的中間偏下,預測值的分布與真實值相比較集中。
圖3 基于隨機森林得出的預測值與真實值Figure 3 Prediction and actual based on a random forest
基于MOD13A1 產(chǎn)品模擬甘南地區(qū)2016-2021年草地地上生物量的分布結(jié)果(圖4)表明,甘南地區(qū)草地地上生物量較大的區(qū)域(> 3 000 kg·hm-2)主要是瑪曲縣、碌曲縣和合作市,草地地上生物量較小 的 區(qū) 域(< 1 500 kg·hm-2)主 要 是 夏 河 縣 和 迭 部縣。西部地區(qū)的草地地上生物量較高,東部地區(qū)的非草地區(qū)域比較多,且生物量較低。
圖4 2016-2021 年甘南地區(qū)草地地上生物量均值空間分布Figure 4 The spatial distribution of mean grassland above-ground biomass on the Gannan Plateau from 2016 to 2021
2016-2021 年甘南地區(qū)地上生物量變化趨勢情況如圖5 所示。生物量增加幅度較大的區(qū)域主要分布于夏河縣北部、瑪曲縣西北部以及碌曲縣中部,生物量減少幅度較大的區(qū)域主要分布于瑪曲縣東南部和碌曲縣南部。
圖5 2016-2021 年甘南地區(qū)草地地上生物量變化趨勢Figure 5 The trends of grassland above-ground biomass on the Gannan Plateau from 2016 to 2021
本研究選用的6 種植被數(shù)據(jù)產(chǎn)品間EVI 的相關(guān)系數(shù)如圖6 所示。結(jié)果表明,MOD13A1 與其他5 種產(chǎn)品的相關(guān)性最好,其中,MOD13A1 與MOD13Q1、MOD13A3、MCD43A4 的相關(guān)系數(shù)均在0.8 以上,相比較而言,MOD13A1 產(chǎn)品與VNP13A3、VNP13A1的相關(guān)性較低。MCD43A4 產(chǎn)品與其他5 種產(chǎn)品的相關(guān)性也較高,與MOD13A1、MOD13Q1 的相關(guān)系數(shù)在0.8 以上,與MOD13Q1、VNP13A3、VNP13A1的相關(guān)系數(shù)均在0.7 以上。VNP13A1 產(chǎn)品與其他5 種產(chǎn)品的相關(guān)性最差。本研究選用的6 種植被數(shù)據(jù)產(chǎn)品間NDVI 的相關(guān)系數(shù)如圖7 所示。結(jié)果表明,MOD13A1 與其他5 種產(chǎn)品的相關(guān)性最好。其中,MOD13A1 與MOD13Q1、MOD13A3、MCD43A4的相關(guān)系數(shù)均在0.8 以上,相比較而言,MOD13A1產(chǎn)品與VNP13A3、 VNP13A1 的相關(guān)性較低。MOD13A3 產(chǎn)品與其他5 種產(chǎn)品的相關(guān)性也較高,與MOD13A3、MCD43A4 的相關(guān)系數(shù)均在0.8 以上,與MOD13Q1、VNP13A3 的相關(guān)系數(shù)在0.7 以上,與VNP13A1 的相關(guān)性較低。VNP13A3 產(chǎn)品與其他5 種產(chǎn)品的相關(guān)性最差。經(jīng)對比分析發(fā)現(xiàn),4 種MODIS植被指數(shù)產(chǎn)品間具有較高的相關(guān)性,這可能是由于傳感器相同,而相關(guān)性大小有所不同的原因可能是時間分辨率、空間分辨率及交點時間不同。本研究發(fā)現(xiàn)MODIS 與VIIRS 間的相關(guān)性較低,原因可能是衛(wèi)星和傳感器不同。
圖7 各植被指數(shù)產(chǎn)品間NDVI 的相關(guān)系數(shù)Figure 7 The correlatio coefficient of NDVI among different vegetation index products
陸蔭等[26]基于MOD13Q1 產(chǎn)品采用傳統(tǒng)方法構(gòu)建了甘南草地地上生物量的反演模型,建模精度R2=0.525,與其相比,本研究建模精度為0.653,建模精度的差異可能是因為植被指數(shù)產(chǎn)品不同以及建模方法不同。但本研究基于傳統(tǒng)方法下的MOD13Q1 產(chǎn)品估算甘南地上生物量的最優(yōu)模型精度僅為R2= 0.387,這可能是由于采樣點不同,導致了結(jié)果的差異。于惠等[27]基于MCD43A4 產(chǎn)品采用傳統(tǒng)方法構(gòu)建了古浪縣草地地上生物量的反演模型,建模精度R2=0.540,而本研究基于傳統(tǒng)方法下的MCD43A4 產(chǎn)品估算甘南地上生物量的最優(yōu)模型精度R2= 0.391,出現(xiàn)差異的原因可能是研究區(qū)域以及應用的植被指數(shù)不同。Meng 等[28]研究表明,衛(wèi)星圖像的時間和空間分辨率、傳感器類型、圖像處理方法和采樣點等都會對草地生物量反演模型的精度造成影響。
本研究基于傳統(tǒng)方法的6 種植被數(shù)據(jù)產(chǎn)品估算的模型精度在0.154~0.495,而基于隨機森林估算的模型精度在0.246~0.653。以MOD13A1 為輸入數(shù)據(jù)的隨機森林AGB 模型具有較高的建模精度(R2= 0.653,RMSE= 718.89 kg·hm-2),而傳統(tǒng)方法的精度較低(R2= 0.495,RMSE= 580.77 kg·hm-2)。說明在本研究中機器學習相較于傳統(tǒng)回歸模型,更具優(yōu)勢,精度更高。Zhang 等[29]以青藏高原AGB 觀測數(shù)據(jù)為基礎(chǔ),結(jié)合氣候、土壤和地形數(shù)據(jù),利用隨機森林算法構(gòu)建草地地上生物量估算模型,建模精度為0.760。與其相比,本研究建模精度較低。因此,在后續(xù)研究中,還應探討其他輔助數(shù)據(jù)對于建模精度的影響。
本研究探討了MODIS 與VIIRS 的NDVI、EVI指數(shù)和草地地上生物量的關(guān)系,然而MODIS 和VIIRS還包括如MCD19A2 等在內(nèi)的多源數(shù)據(jù),我們將在后續(xù)研究中探討其他產(chǎn)品與高寒草地地上生物量的關(guān)系。此外,根據(jù)本研究結(jié)果,在地上生物量方面,雖然VIIRS 也有較高的精度,但是仍無法代替MODIS,因此,在今后的研究中會繼續(xù)探討其他產(chǎn)品,例如FY-3D 等能否在研究高寒草地地上生物量方面比MODIS 表現(xiàn)出更好的性能。
本研究以甘南地區(qū)為例,選用MODIS 的4 種植被指數(shù)產(chǎn)品和VIIRS 的兩種植被指數(shù)產(chǎn)品,結(jié)合EVI 和NDVI 兩種植被指數(shù),基于傳統(tǒng)方法和隨機森林分析對比MODIS 和VIIRS 兩種傳感器在甘南地區(qū)草地地上生物量估算中的精度?,F(xiàn)主要結(jié)論如下:1)與VIIRS 相比較,基于MODIS 的甘南地區(qū)草地地上生物量反演模型的精度更高,MODIS MOD13A1產(chǎn)品更適用于甘南高寒草地地上生物量的估算。2)甘南地區(qū)草地地上生物量較大的區(qū)域(> 3 000 kg·hm-2)主要分布于瑪曲縣、碌曲縣和合作市,草地地上生物量較小的區(qū)域(< 1 500 kg·hm-2)主要分布于夏河縣和迭部縣。西部地區(qū)的草地地上生物量較高,東部地區(qū)的非草地區(qū)域比較多,且生物量較低。3)生物量增加幅度較大的區(qū)域主要分布于夏河縣北部、瑪曲縣西北部以及碌曲縣中部,生物量減少幅度較大的區(qū)域主要分布于瑪曲縣東南部和碌曲縣南部。