雷 瑛,劉園園
(1.甘肅省基礎(chǔ)地理信息中心,甘肅 蘭州730030;2.中國地質(zhì)調(diào)查局自然資源綜合調(diào)查指揮中心,北京100055)
草地分布在全球范圍內(nèi),是陸地生態(tài)系統(tǒng)的核心組成部分。我國草地資源極其豐富,其覆蓋國土面積的比例高達(dá)60%以上,天然草地在陸地面積中占據(jù)了41.7%的比例[1]。草地蘊(yùn)含著巨大的生物儲量,對于維護(hù)生態(tài)平衡、碳匯、水循環(huán)、改善土壤性質(zhì)、維護(hù)草原生態(tài)系統(tǒng)、指導(dǎo)放牧決策等都具有重要意義[2]。維持草地生物儲量的穩(wěn)定,對于生態(tài)環(huán)境的健康和持續(xù)發(fā)展起到積極的促進(jìn)作用。
1960年新發(fā)明的遙感技術(shù)被人們用在草原出草量變化的監(jiān)測[3]。80年代起,利用美國國家海洋大氣局的第三代實用氣象觀測衛(wèi)星TIROS-N/NOAA所采集的遙感數(shù)據(jù),國外已開始對草原植被蓋度進(jìn)行監(jiān)測研究;利用美國國家航空航天局(National Aeronautics and Space Administration,NASA)的陸地衛(wèi)星(Landsat)主題成像儀(TM)數(shù)據(jù)對阿根廷的草退化進(jìn)行了研究[4]。80年代初,我國引入了遙感技術(shù),使我國的草原生態(tài)研究取得了一定進(jìn)展。趙冰茹等[5]利用美國宇航局研制的中分辨率成像光譜儀系列的歸一化植被指數(shù)(Normalized Digital Vegetation Index,NDVI)。何矣等[6]采用線性回歸方法探討了美國陸地衛(wèi)星計劃的第八顆衛(wèi)星(Landsat8)影像與地上生物量之間的關(guān)系。傳統(tǒng)的監(jiān)測手段依賴人工上報,頻次不高,不夠及時;僅依靠單一衛(wèi)星遙感數(shù)據(jù)進(jìn)行遙感反演應(yīng)用存在很多局限。
有學(xué)者認(rèn)為,嘗試多源衛(wèi)星遙感數(shù)據(jù)的協(xié)同反演,可以克服單一衛(wèi)星情況下遙感圖像中出現(xiàn)多云霧等不可抗力因素的干擾,同時也消除了原始遙感數(shù)據(jù)的缺陷和噪聲,對遙感圖像融合有著很大的幫助[7]。近年來,作物生長評估地類變化監(jiān)測等領(lǐng)域用多時間分辨率遙感圖像融合取得了成功。例如,文獻(xiàn)[8-9]利用時間分辨率更高的中分辨率成像光譜儀(Moderate-resolution Imaging Spectroradiometer,MODIS)多光譜圖像和空間分辨率更高的Landsat多光譜圖像進(jìn)行融合,在農(nóng)作物的產(chǎn)量監(jiān)測和長勢分析中得到了成功的應(yīng)用。在模型的選擇方面,除了常用的多元回歸模型,還可以用機(jī)器學(xué)習(xí)等其他方法對此進(jìn)行計算,其中,隨機(jī)森林(Random Forest,RF)算法表現(xiàn)出最佳的性能,達(dá)到了0.85的高精度[10]。雖然上述方法不同程度嘗試提升生物量反演的成功率及精度,但是由于遙感數(shù)據(jù)時間序列連續(xù)性低及構(gòu)建經(jīng)驗關(guān)系的地面采樣數(shù)據(jù)稀疏導(dǎo)致的反演成功率及精度的問題仍有待進(jìn)一步提升,而這一問題在高分辨率遙感領(lǐng)域更為突出。
隨著遙感技術(shù)的發(fā)展,較高影像分辨率和較短成像周期在生物量定量估測中起到了重要作用。Landsat8采用陸地成像儀(Operational Land Imager,OLI)作為傳感器類型,其時間分辨率為16 d,空間分辨率為30 m,可獲得更多無云的高品質(zhì)影像,從而提高對地球環(huán)境的認(rèn)知和保護(hù)能力[11-12],在全球變化監(jiān)測中具有重要作用。我國首個高分辨率衛(wèi)星高分一號(GF-1),標(biāo)志著我國衛(wèi)星技術(shù)的重大進(jìn)步,它搭載全色和多光譜2臺組合相機(jī),重訪周期短、時相多,在農(nóng)業(yè)生態(tài)環(huán)境觀測中起到重要作用[13]。高分四號(GF-4)衛(wèi)星發(fā)射至36 000 km的地球同步軌道上,衛(wèi)星搭載了50 m分辨率的可見光、400 m分辨率的中波紅外相機(jī),通過凝視成像光學(xué)相機(jī)進(jìn)行高空對地觀測,該技術(shù)具備在特定區(qū)域長期保持靜止觀測的能力,可廣泛應(yīng)用于災(zāi)害風(fēng)險預(yù)警預(yù)報、林火災(zāi)害監(jiān)測、地震構(gòu)造信息提取和氣象天氣監(jiān)測等多個領(lǐng)域[14]?;诋?dāng)前遙感數(shù)據(jù)反演草原生物量面臨的問題,結(jié)合大量在軌且具有高分辨率的各種光學(xué)衛(wèi)星觀測,本文將利用Landsat8、GF-1、GF-4和環(huán)境數(shù)據(jù),通過多源數(shù)據(jù)方案初步提升星基遙感參數(shù),比如NDVI時間序列的連續(xù)性;然后,通過地理學(xué)第一理論思想,將稀疏的、空間不一致的地面采樣數(shù)據(jù)與目標(biāo)位置的遙感參數(shù)建立空間對應(yīng)關(guān)系,從而構(gòu)建具有較好時空連續(xù)性的星基遙感參數(shù)時間序列與地面采樣生物量時間序列的時空匹配。
本文構(gòu)建了從遙感參數(shù)到地面實測草地生物量的經(jīng)驗?zāi)P?實現(xiàn)了基于多源遙感數(shù)據(jù)的大范圍草地生物量的景區(qū)估算。研究內(nèi)容包括以下幾個部分:第一部分分析了當(dāng)前草地生物量研究的進(jìn)展和面臨的問題,針對問題提出解決方案;第二部分介紹了研究數(shù)據(jù)、理論基礎(chǔ)、研究方法和研究流程;第三部分對實驗結(jié)果進(jìn)行驗證及評價,討論不同方法的優(yōu)缺點(diǎn),確定本文方法的特點(diǎn);第四部分討論了本文的創(chuàng)新點(diǎn),明確了存在的不足,并提出未來的工作重點(diǎn)。
研究區(qū)位于青海省黃南藏族自治州河南蒙古族自治縣(河南縣)境內(nèi),平均海拔3 650 m,此處陽光充沛、輻射強(qiáng)度高、熱量較低、氣溫差異顯著。研究區(qū)位于高寒氣候區(qū),受地形影響,氣候空間分布不均衡。夏季濕潤,冬季干冷,平均氣溫在-1.35 ℃左右,該地區(qū)年均日照2 530~3 100 h,而年降雨量則平均達(dá)到579.50 mm[15]。由于氣候條件的差異,研究區(qū)植被類型也呈現(xiàn)出空間分布的不均衡性,中西部以高寒草甸和高寒草原為主,而東部以山地草甸為主。整體上屬于典型的高寒草地,頻繁發(fā)生自然災(zāi)害和極端天氣,導(dǎo)致生態(tài)系統(tǒng)的脆弱性和易損性增加,同時對氣候變化表現(xiàn)出高度敏感性,進(jìn)而引發(fā)草地年際產(chǎn)量的劇烈波動。為保護(hù)好生態(tài)環(huán)境,促進(jìn)經(jīng)濟(jì)發(fā)展,需要建立完善的草原生態(tài)系統(tǒng)監(jiān)測預(yù)警體系。為確保草原生態(tài)系統(tǒng)的可持續(xù)發(fā)展,必須建立一套完備的監(jiān)測預(yù)警機(jī)制,以保障生態(tài)環(huán)境的健康和經(jīng)濟(jì)的繁榮。研究區(qū)草場面積65.62萬hm2,草場可利用面積60.88萬hm2,占草場面積的92.78%,在全國范圍內(nèi)屬于典型的生態(tài)脆弱帶之一,是我國重要的畜牧業(yè)基地。因為人類活動的頻繁和氣候變暖等因素的影響,草原的生態(tài)系統(tǒng)已經(jīng)遭受了嚴(yán)重的破壞,其中以草地沙化和鹽漬化最為突出,是影響牧區(qū)生態(tài)安全的重要因素之一。在高寒草甸、山地草甸、灌叢草甸、沼澤草甸和疏林草甸五大草場類型中,天然草場總面積的94.19%被山地草甸和灌叢草甸2種草場類型所占據(jù)。
1.2.1 草原生物量樣方數(shù)據(jù)
本文實測數(shù)據(jù)樣品的采集時間為2018年5—8月,根據(jù)行政區(qū)劃、植被類型和坡度坡向等需要,共獲得193個地面實測樣本數(shù)據(jù),包括經(jīng)緯度、海拔高度、行政區(qū)劃、地貌類型、坡度、植被種類、土壤類型等信息,在每個樣點(diǎn)選取大小為50 cm×50 cm的隨機(jī)樣方,齊地剪取所有地上植被,獲取地上生物量鮮重,將樣本帶回并放入75 ℃恒溫烘箱中40 h烘干至恒重后稱干重,計算單位面積地上生物量。樣方的分布情況如圖1所示,樣方基本信息如表1、圖2和圖3所示。
圖1 研究區(qū)范圍示意及實測樣方分布(影像采用已處理的成像時間為2018-08-24的GF-1全彩色影像)Fig.1 Map of the study area and the distribution of mea-sured sample plots (The image used is a pre-processed full-color image from GF-1 satellite,captured on August 24, 2018)
表1 實測樣方信息
圖2 實測樣方土壤分布Fig.2 Distribution of measured soil samples
圖3 實測樣方采集時間統(tǒng)計圖Fig.3 Statistical diagram of measured data collection time
1.2.2 遙感數(shù)據(jù)獲取與處理
本文根據(jù)遙感影像數(shù)據(jù)的特點(diǎn),利用3種遙感影像數(shù)據(jù),分別為Landsat8、GF-1、GF-4遙感衛(wèi)星。為了保證影像數(shù)據(jù)成像時間與地面數(shù)據(jù)調(diào)查時間盡量一致,研究選取了2018年5—8月覆蓋研究區(qū)實測點(diǎn)及全域、云量≤30%的多源遙感影像,共11景,遙感衛(wèi)星的具體信息如表2所示。利用遙感圖像處理平臺(ENVI)軟件,對遙感影像的相關(guān)數(shù)據(jù)實施預(yù)處理,多源遙感影像數(shù)據(jù)處理為NDVI的效果如圖4所示[16]。
表2 遙感衛(wèi)星信息
(a)Landsat8 OLI NDVI (2018-05-09)
(b)GF-4 NDVI (2018-05-15)
(c)Landsat8 OLI NDVI (2018-05-25)
(d)Landsat8 OLI NDVI (2018-06-10)
(e)Landsat8 OLI NDVI (2018-06-26)
(f)Landsat8 OLI NDVI (2018-07-12)
(g)GF-4 NDVI (2018-07-16)
(h)Landsat8 OLI NDVI (2018-07-28)
(i)Landsat8 OLI NDVI (2018-08-13)
(j)GF-1 NDVI (2018-08-24)
(k)Landsat8 OLI NDVI (2018-08-29)
1.2.3 其他數(shù)據(jù)
考慮到氣候因素對當(dāng)?shù)馗吆脖坏挠绊?收集了當(dāng)?shù)?018年的氣象數(shù)據(jù)作為變量參與RF模型的擬合中。所使用的氣象數(shù)據(jù)包括氣溫(Temperature,Tem)、降水(Precipitation,Pre)、濕潤度指數(shù)(K)、實際蒸散量(Actual Evapotranspiration,EVP)和輻射干燥度(Radiation Dryness Index,RDI)五類。環(huán)境變量的處理方法為:從2018年青海省氣象臺站下載逐日降雨量、氣溫、經(jīng)度、緯度和海拔等數(shù)據(jù);將逐日數(shù)據(jù)經(jīng)過處理,轉(zhuǎn)化為逐月數(shù)據(jù)。其中,降雨量被處理成總和值,而氣溫則處理成平均值;使用專業(yè)氣象插值軟件ANUSPIN4.36將氣象數(shù)據(jù)插值為研究區(qū)的數(shù)據(jù);用地理信息平臺(ArcGIS10.2)處理研究區(qū)數(shù)據(jù),得到研究區(qū)2018年的氣象數(shù)據(jù)集。
采用數(shù)字高程模型(Dynamic Effect Model,DEM)作為高程數(shù)據(jù)源和氣象數(shù)據(jù)空間插值的協(xié)變量,以實現(xiàn)更高級別的數(shù)據(jù)處理和分析。地理高程數(shù)據(jù)集——Shuttle Radar Topography Mission 3(SRTM3)提供了DEM數(shù)據(jù),其空間分辨率達(dá)到了90 m。具體處理方法為:首先,從網(wǎng)站上下載得到包含中國全部地上國土的DEM圖像,格式為hgt;然后,在ArcGIS10.2中對全部圖像進(jìn)行格式轉(zhuǎn)換,將其轉(zhuǎn)換為.geotiff格式,并拼合成一幅新的圖像;最后,使用研究區(qū)邊界剪裁得到研究區(qū)的DEM數(shù)據(jù)。環(huán)境變量和DEM信息如表3所示。
表3 環(huán)境變量
本文基于Landsat8和GF-1/4多源遙感數(shù)據(jù)融合技術(shù),獲取時序精度較高時空連續(xù)性及空間分辨率的NDVI時間序列,通過時空匹配方法與各樣地實測草地生物量建立時空對應(yīng)關(guān)系,分別擬合草地生物量反演模型并檢驗擬合精度,進(jìn)而估算研究區(qū)的草場生物量,并討論草地生物量的時空分布規(guī)律。具體包括以下幾個步驟:① 星基NDVI時間序列與地面樣方草地生物量的時空匹配,分析通過時空匹配方法建立的2個參數(shù)的時間序列的相關(guān)性是否滿足反演精度需要;② 進(jìn)行生物量模型構(gòu)建;③ 基于地理學(xué)第一定律思想,嘗試將構(gòu)建的各個生物量反演模型推廣到整個空間范圍,實現(xiàn)區(qū)域草地生物量反演。技術(shù)路線如圖5所示。
圖5 技術(shù)路線Fig.5 Technical roadmap
1.3.1 多源衛(wèi)星驅(qū)動的NDVI與稀疏樣方數(shù)據(jù)時間序列的時空匹配
NDVI時序建立及與實測樣方草原生物量的匹配植被指數(shù)是根據(jù)植被反射波段的特性算出能夠體現(xiàn)地表植物生長狀況的指標(biāo),計算方便。從草地地上生物量估算出發(fā),植被指數(shù)需要滿足以下條件:波段反射率對綠色植被足夠敏感;紅光受到葉片吸收,波段反射率處于低值;在近紅外波段,葉片對近紅外光反射相較其他波段更強(qiáng)。有研究結(jié)果表明, NDVI和比值植被指數(shù)(Ratio Vegetation Index,RVI)對綠色植被變化靈敏,能較好地反映出草地的覆蓋度、生物量,與地上凈初級生物量相關(guān)性較好[17]。根據(jù)實測生物量樣點(diǎn)坐標(biāo)信息以及實測數(shù)據(jù)的獲取時間,排除大氣、云層、土壤等環(huán)境因素的影響,本文主要應(yīng)用NDVI作為自變量參與草地生物量模型擬合。NDVI的計算方法如下:
NDVI=(NIR-R)/(NIR+R) ,
(1)
式中:NDVI為歸一化植被指數(shù),R為紅光波段的地表反射率,NIR為近紅外波段的地表反射率[18]。
基于式(1)計算獲取了研究區(qū)2018年5—8月的高分辨率NDVI數(shù)據(jù)時間序列;然而樣方草原生物量數(shù)據(jù)因人工低效導(dǎo)致無法與NDVI時間序列在相同空間位置實現(xiàn)高時間頻率的匹配,導(dǎo)致2個問題:① 生物量估算模型的構(gòu)建效率低下;② 基于樣方草原生物量模型的構(gòu)建如何推廣到更大區(qū)域。
本文引入時空匹配模型,通過該模型,在研究區(qū)構(gòu)建單個網(wǎng)格像元為0.2 m×0.2 m的格網(wǎng),如圖6所示。將網(wǎng)格內(nèi)的樣方生物量與同時刻同位置的NDVI(Landsat8和GFs 16 m)數(shù)據(jù)進(jìn)行匹配;基于地理學(xué)第一定律,認(rèn)為0.2 m像元內(nèi)的植被反映的物候特性相同,包括其NDVI與生物量的物候變化規(guī)律。
圖6 構(gòu)建研究區(qū)格網(wǎng)(影像采用已處理的成像時間為2018-08-24的GF-1全彩色影像)Fig.6 Creating a grid network for the study area (The image used is a pre-processed full-color image from GF-1 satellite, captured on Au- gust 24, 2018)
1.3.2 生物量估算模型構(gòu)建
(1)基于時間序列的一元回歸模型
一元回歸模型預(yù)測草地生物量與植被指數(shù)之間存在的關(guān)系,與多元回歸模型相比,一元回歸模型更容易理解和解釋。通過簡化模型,可以減少模型錯誤,更好地理解數(shù)據(jù)模式和趨勢。
在建立草地生物量一元線性模型中,選定像元生物量作為因變量,選取遙感影像提取的NDVI作為自變量,利用EXCEL散點(diǎn)圖分別擬合一元回歸模型,一元回歸方程為:
f(xNDVI)=kxNDVI+b,
(2)
式中:xNDVI為NDVI的值,k、b為參數(shù),可以通過散點(diǎn)圖擬合獲取。
本文采用了十折交叉驗證法來提高模型的精確度和適用性。具體方法是將樣本集按照1∶1的比例分成訓(xùn)練集和測試集,共有98個樣本用于訓(xùn)練集,95個樣本用于測試集,利用上述公式建立實地采樣數(shù)據(jù)和變量之間的一元回歸模型,各時點(diǎn)影像對應(yīng)的一元回歸模型公式如表4所示。
表4 一元回歸模型構(gòu)建結(jié)果
(2)RF模型
RF模型是分類器,其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。
針對一個輸入樣本,N棵樹所呈現(xiàn)的分類結(jié)果數(shù)量為N。在這種情況下,如何對其進(jìn)行選擇和排序是非常重要的問題。在此情形下,對其進(jìn)行篩選和排列是一項至關(guān)重要的任務(wù)。為了解決這個問題,提出了一種基于RF的聚類方法來幫助用戶確定最適合的類。RF綜合了所有的分類投票結(jié)果,篩選出投票次數(shù)最多的類別作為最終的輸出,這一引導(dǎo)聚集算法(Bagging)的理念在實踐中得到了廣泛的應(yīng)用,本文采用Bagging算法的公式如下:
(3)
式中:M為數(shù)據(jù)集的規(guī)模,m為樣本個數(shù),x為環(huán)境、植被指數(shù)等變量因子。
RF能夠避免過度擬合的問題,并且能夠很好地適應(yīng)數(shù)據(jù)的變化,讓預(yù)測精度更高并且還能讓泛化能力更強(qiáng)[19-20]。
本文使用RF模型來建立生態(tài)環(huán)境反演模型,通過2.1節(jié)中環(huán)境變量與實測草地生物量的相關(guān)性分析可以看出,環(huán)境變量與研究區(qū)生物量的相關(guān)性較大,該模型包括氣象因子、地形因子和植被因子等10個環(huán)境變量。本文以隨機(jī)1∶1的比例構(gòu)建實測數(shù)據(jù)訓(xùn)練集和測試集,選取Lansat8、GF-1、GF-4衛(wèi)星遙感參與建模。
1.3.3 估算區(qū)域草地生物量
基于地理學(xué)第一定律,為了計算大區(qū)域草地生物量,將研究區(qū)劃分為較小的網(wǎng)格,計算一個網(wǎng)格中心點(diǎn)與樣本點(diǎn)中最近的點(diǎn)之間的距離,利用最小距離空間插值的方法,將樣本點(diǎn)對應(yīng)位置的反演模型擴(kuò)展到每個網(wǎng)格,用已知點(diǎn)的草地生物估算模型計算最近距離網(wǎng)格的草地生物量,進(jìn)而估算整個研究區(qū)的草地生物量分布情況。最小距離計算如下:
(4)
式中:(x1,y1)為草原生物量模型坐標(biāo)位置變量,(x2,y2)為目標(biāo)像元的位置變量。當(dāng)d最小時,使用距離目標(biāo)像元最近的草原生物量模型驅(qū)動目標(biāo)像元的草原生物量。
決定系數(shù)(R2)和均方根誤差(RMSE)是2個廣泛使用的評估模型優(yōu)劣的指標(biāo),有助于對模型的性能進(jìn)行定量評估。通過對這2個參數(shù)的比較,對2種方法在模擬研究中的優(yōu)缺點(diǎn)進(jìn)行了評估,并通過實例分析驗證了其結(jié)果的合理性。衡量模型對觀測數(shù)據(jù)的解釋能力,可以采用R2來衡量其擬合程度,這一指標(biāo)能夠反映出模型的適用性。同時還可根據(jù)實際應(yīng)用需要,確定最佳參數(shù)值,使其具有更好的效果。在不同的環(huán)境條件下,對該模型進(jìn)行了模擬實驗。R2的取值被限制在[0,1]。在不同的情形下,R2所蘊(yùn)含的意義是多種多樣的。隨著R2值的增加,模型對觀測數(shù)據(jù)的擬合程度得到了顯著提升,從而有效增強(qiáng)了其預(yù)測能力。本文將以具體案例為例,探討如何運(yùn)用最小二乘支持向量機(jī)回歸算法進(jìn)行模型構(gòu)建和預(yù)測。一項衡量模型預(yù)測值與實際值差異的指標(biāo)是RMSE,當(dāng)RMSE減小時,模型預(yù)測結(jié)果與實際結(jié)果之間的誤差將減小,從而提升了模型的預(yù)測能力。為了保證該指標(biāo)能夠達(dá)到較高的數(shù)值,就需要根據(jù)具體的應(yīng)用條件確定合理的權(quán)重系數(shù)和最小二乘估計量的參數(shù)估計參數(shù)。通過計算,得出了在不同精度要求下選擇最優(yōu)權(quán)重系數(shù)和加權(quán)最小二乘估計參數(shù)的方法,為研究提供了有益的參考。為了驗證這些選擇方法的有效性,本文分別對2種常用的最小二乘法——直接法和間接法作了對比分析。R2和RMSE的計算如下:
(5)
(6)
相關(guān)分析是研究2個要素相互間密切程度的一種常用的統(tǒng)計方法,為了選取地上生物量反演模型變量,將采用空間匹配以后的NDVI與生物量時間序列進(jìn)行相關(guān)性分析,本文得到的2018年5—8月河南縣實測樣本的草地生物量與NDVI擬合情況如圖7所示。
圖7 實測樣方數(shù)據(jù)與NDVI相關(guān)性分析圖Fig.7 Correlation analysis between measured data and NDVI
圖7建立了草地生物量與NDVI的相關(guān)性矩陣,分析了2018年5—8月河南縣的實測草地生物量與NDVI的相關(guān)性, R2的平均值為0.479, RMSE為1.827 kg/km2,說明河南縣草地生物量與NDVI之間存在較顯著的正相關(guān)關(guān)系,同時表明,基于時間序列的NDVI與樣方生物量相關(guān)性可靠,能夠用于進(jìn)一步的生物量評價,是河南縣草地生物量反演的一種有效方法,有助于更好地監(jiān)測和評估草地資源的利用和管理。
通過將環(huán)境變量與地上生物量進(jìn)行相關(guān)性分析,選擇相關(guān)性高的因子作為RF模型的變量,本文計算環(huán)境變量與實測草地生物量的相關(guān)性系數(shù),結(jié)果如表5所示。
表5 環(huán)境變量因子與實測樣本相關(guān)性分析Tab.5 Correlation analysis between environmental variable factors and measured samples
通過相關(guān)性分析發(fā)現(xiàn),除了DEM、RDI與實測樣本數(shù)據(jù)為負(fù)相關(guān)外,其余皆為正相關(guān),Pre4-10、Tem4-10變量與實測樣本數(shù)據(jù)的相關(guān)性較好,這些環(huán)境因子有助于更好地理解環(huán)境條件對草地生物量狀況的影響,從而為生態(tài)環(huán)境監(jiān)測和保護(hù)提供有力支持。
本文對2018年5—8月獲取的實測生物量數(shù)據(jù)進(jìn)行篩選,在剔除異常值和離群值后,得到193個有效生物量數(shù)據(jù)參與模型的模擬,這就可以確定生物量估算模型,并對模型精度進(jìn)行評價。采用一元回歸模型和RF模型2種估算方法,對模型精度進(jìn)行驗證與評價,結(jié)果如表6所示。
表6 一元回歸模型草地生物量反演精度
由表6可以看出,在一元線性的回歸模型當(dāng)中, R2平均值為0.75, RMSE平均值為1.10 kg/km2,RMSE相對較小,可信度高,可以說明以NDVI為自變量、訓(xùn)練樣本草地生物量為因變量,按時空匹配擬合的模型效果較好、精度較高。同時,利用預(yù)留的95個樣本用于測試集,用R2和RMSE對一元線性回歸模型的數(shù)據(jù)結(jié)果進(jìn)行驗證,驗證結(jié)果中, R2的平均值為0.49,RMSE平均值為3.50 kg/km2,測試模型的R2較訓(xùn)練集的稍低,總體擬合效果較好。
通過對數(shù)據(jù)的總體分析發(fā)現(xiàn),按影像時間序列擬合的一元線性回歸模型在6月反演生物量模型的精度更高,主要因為6月是一年中植被生長最旺盛的時期,植被生長的速度和穩(wěn)定性都比其他月份更好,因此,模型對這一時期的生物量預(yù)測更加準(zhǔn)確;同時,6月植被的生物量變化與其他生物量變化有較強(qiáng)的相關(guān)性,這使得模型能夠更好地捕捉到生物量之間的相關(guān)性,從而提高模型精度;由于6月是植被生長的旺季,獲取的影像數(shù)據(jù)往往具有較高的質(zhì)量,模型在這一階段的預(yù)測更加可靠。
表7為Landsat8、GF-1、GF-4遙感衛(wèi)星RF模型反演后訓(xùn)練集和測試集的反演精度。
表7 RF模型草地生物量反演精度
通過表7可以發(fā)現(xiàn),基于RF模型訓(xùn)練結(jié)果Landsat8衛(wèi)星(R2=0.36,RMSE=11.46 kg/km2)的測試集精度相對GF-1衛(wèi)星(R2=0.33,RMSE=25.911 kg/km2)、GF-4衛(wèi)星(R2=0.17,RMSE=20.92 kg/km2)更好,但相關(guān)性較小。Landsat8訓(xùn)練集和測試集的RMSE最低,相比GF-1、GF-4表現(xiàn)更好。
利用2個估算模型擬合結(jié)果與實測生物量進(jìn)行相關(guān)性分析,如圖8和圖9所示。
(a)一元線性回歸模型擬合結(jié)果與實測生物量(0509)
(b)一元線性回歸模型擬合結(jié)果與實測生物量(0515)
(c)一元線性回歸模型擬合結(jié)果與實測生物量(0525)
(d)一元線性回歸模型擬合結(jié)果與實測生物量(0610)
(e)一元線性回歸模型擬合結(jié)果與實測生物量(0626)
(f)一元線性回歸模型擬合結(jié)果與實測生物量(0712)
(g)一元線性回歸模型擬合結(jié)果與實測生物量(0716)
(h)一元線性回歸模型擬合結(jié)果與實測生物量(0728 )
(i)一元線性回歸模型擬合結(jié)果與實測生物量(0813)
(j)一元線性回歸模型擬合結(jié)果與實測生物量(0824)
(a)隨機(jī)森林模型擬合結(jié)果與實測生物量(Landsat8)
(b)隨機(jī)森林模型擬合結(jié)果與實測生物量(GF-1)
(c)隨機(jī)森林模型擬合結(jié)果與實測生物量(GF-4)
通過圖8一元回歸模型擬合結(jié)果與實測生物量散點(diǎn)分布情況,以及圖9 RF模型擬合結(jié)果與實測生物量散點(diǎn)分布情況可以看出,2種模型擬合的草地生物量與實測生物量分布較分散,但均具有一定的相關(guān)性。
對比上述一元回歸模型及RF模型的精度可以發(fā)現(xiàn),按時序構(gòu)建的一元回歸模型相比RF模型,R2更高,RMSE也相對較小,具有更高的模型精度,每個時刻具有較好的擬合結(jié)果,選取該模型,可更好地估算研究區(qū)在一個時間序列上的生物量。RF模型由于進(jìn)入了更多的環(huán)境變量,能夠避免過度擬合的問題,并且能夠很好地適應(yīng)數(shù)據(jù)的變化,但該模型的精度較低,因此,綜合考慮,選定一元回歸模型為反演研究區(qū)草地生物量模型。
通過對研究區(qū)草地生物量模型精度的驗證,選取一元回歸模型作為估算研究區(qū)生物量的模型,利用1.3.3節(jié)的最近距離空間插值法,將反演模型導(dǎo)入到每個網(wǎng)格,估算整個研究區(qū)的草地生物量分布情況,如圖10所示。
(a)研究區(qū)估算草地生物量(2018-05-09)
(b)研究區(qū)估算草地生物量(2018-05-15)
(c)研究區(qū)估算草地生物量 (2018-05-25)
(d)研究區(qū)估算草地生物量 (2018-06-10)
(e)研究區(qū)估算草地生物量(2018-06-26)
(f)研究區(qū)估算草地生物量(2018-07-12)
(g)研究區(qū)估算草地生物量(2018-07-16)
(h)研究區(qū)估算草地生物量(2018-07-28)
(i)研究區(qū)估算草地生物量(2018-08-13)
(k)研究區(qū)估算草地生物量 (2018-08-29)
由圖10可以看出研究區(qū)域內(nèi)顯著的空間和時間層面上的差異。在空間維度上,草地的地上生物量會因地勢的起伏而產(chǎn)生波動;而在時間維度上,草地的地上生物量會伴隨著植被的發(fā)育和成熟而發(fā)生變動。每年的7—8月,植被步入成熟期,此時草地的生物量也將進(jìn)入旺盛增長階段。通過上圖可以看到,生物量的估算也遵循了植被的生長規(guī)律。
綜合分析研究區(qū)地形、地勢和水土條件等因素,計算得到研究區(qū)內(nèi)每個鄉(xiāng)鎮(zhèn)的年平均草地生物量,基本呈現(xiàn)自東向西、自東南向西北遞減的趨勢,與水熱條件分布一致,如表8所示。
表8 研究區(qū)草地生物量統(tǒng)計
托葉瑪鄉(xiāng)(43.61 kg/km2)、賽爾龍鄉(xiāng)(42.24 kg/km2)、柯生鄉(xiāng)(41.94 kg/km2)、優(yōu)干寧鎮(zhèn)(41.38 kg/km2)、多松鄉(xiāng)(40.62 kg/km2)、寧木特鎮(zhèn)(39.65 kg/km2),其中托葉瑪鄉(xiāng)草地生物量較高的主要原因與該區(qū)域位于研究區(qū)東南方向的地理位置、水熱條件分布較西北更好等因素有關(guān)。
本文聚焦于多源衛(wèi)星遙感數(shù)據(jù),從多源遙感數(shù)據(jù)融合切入,通過一個新穎的時空匹配方法將星基NDVI時間序列與稀疏的實測樣方生物量數(shù)據(jù)建立時空對應(yīng)的時間序列對,從而實現(xiàn)高精度草原生物量模型的構(gòu)建;進(jìn)一步地,基于地理學(xué)第一定律思想,將構(gòu)建的草原生物量點(diǎn)模型推廣到整個研究區(qū),實現(xiàn)區(qū)域草原生物量的精確反演。通過驗證,比較傳統(tǒng)的時空不一致的衛(wèi)星觀測與實測樣方數(shù)據(jù)擬合的方案(RF擬合方法),本文方法不但精度更加可靠,且實現(xiàn)了較精確的區(qū)域草原生物量估算,實現(xiàn)了河南縣大區(qū)域草地生物量的時空分布制圖,并對該區(qū)域草地生物量時空分布情況進(jìn)行了分析。
通過本文,在草地生物量的估計方面,利用多源遙感數(shù)據(jù)對草地生物量進(jìn)行反演,可以彌補(bǔ)傳統(tǒng)單一多光譜遙感數(shù)據(jù)源的局限,提高草原遙感估產(chǎn)精度,為北方草原資源調(diào)查、監(jiān)測、管理及合理利用提供有效技術(shù)支撐。
但由于本文的研究數(shù)據(jù)有限,可能無法代表整個草地生態(tài)系統(tǒng)的生物量分布情況。在研究中僅考慮了植被指數(shù)與生物量之間的關(guān)系,暫未考慮其他影響生物量的因素,如土壤類型、群落套件等,生物量反演模型的精度還有待進(jìn)一步提高,以滿足更精確的生物量估算需求。基于此,在本文的基礎(chǔ)上,將進(jìn)一步擴(kuò)大研究區(qū)域,以獲取更全面的草地生態(tài)系統(tǒng)生物量分布信息;引入其他影響因素,建立更完善的生物量估算模型;探索更高精度的遙感數(shù)據(jù)融合方法,以提高生物量反演模型的精度。