蔡潮勇,曹姍姍,孔繁濤,胡林,劉婷婷,孫偉*,王蕾
1.新疆農(nóng)業(yè)大學(xué)計(jì)算機(jī)與信息工程學(xué)院,烏魯木齊,830052
2.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081
3.國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心,北京 100081
4.中國農(nóng)業(yè)科學(xué)院國家南繁研究院,海南三亞 572024
5.中國農(nóng)業(yè)科學(xué)院特產(chǎn)研究所,長春 130112
6.新疆林業(yè)科學(xué)院現(xiàn)代林業(yè)研究所,烏魯木齊,830092
天山云杉(Picea schrenkianavar.tianshanica)是新疆山地森林生態(tài)系統(tǒng)中分布最為廣泛的樹種,主要分布在海拔1600-2800 m的中山地帶,多生長在陰坡及半陰坡上,發(fā)揮著涵養(yǎng)水源、保持水土、維護(hù)區(qū)域生態(tài)系統(tǒng)穩(wěn)定性等重要作用。生物量反映了林木的基本生物學(xué)特征和功能性狀,通過研究分析新疆天山云杉生物量,能夠監(jiān)測(cè)和評(píng)估區(qū)域森林生態(tài)系統(tǒng)的能量積累的情況,便于日后的經(jīng)營與管理。
從已有研究來看,由于受自然環(huán)境或者人為因素干擾[1],森林資源分布具有空間連續(xù)性、隨機(jī)性和結(jié)構(gòu)的復(fù)雜性[2]。因此,可以通過已有的天山西部云杉生物量空間分布點(diǎn)信息,利用空間插值方法生成云杉單位生物量的插值面,探索云杉林生物量空間變化趨勢(shì),定量解釋云杉林生物量的空間異質(zhì)性,分析云杉林的空間格局與變化規(guī)律,為天山西部云杉林的科學(xué)經(jīng)營管理和生態(tài)系統(tǒng)保護(hù)提供理論和數(shù)據(jù)基礎(chǔ)。目前在森林資源的空間分析研究中分為空間異相關(guān)模型[3]、與空間自相關(guān)模型[4]兩類??臻g異相關(guān)模型以回歸建模的方式出現(xiàn),建模的數(shù)據(jù)包括遙感、土壤、氣象、圖像、地形等多源數(shù)據(jù),能夠解釋森林資源與多源數(shù)據(jù)間的線性或非線性關(guān)系。但是森林資源在空間上的分布是存在空間依賴性的[5],因此該模型空間信息的解釋能力較差;空間自相關(guān)模型以變異函數(shù)分析空間異質(zhì)性,再通過地統(tǒng)計(jì)學(xué)模型進(jìn)行插值分析,建模主要利用數(shù)據(jù)的空間信息進(jìn)行分析,在不確定因素分析和空間預(yù)測(cè)方面具有顯著優(yōu)勢(shì)[6]。但單憑空間信息很難去適應(yīng)和利用森林調(diào)查中產(chǎn)生復(fù)雜的環(huán)境數(shù)據(jù),因此該方法對(duì)輔助數(shù)據(jù)的利用率差,模型精度不高。將兩種方法組合使用在森林資源空間分布的研究中逐漸熱門,地統(tǒng)計(jì)和回歸模型的耦合不僅考慮了空間信息非平穩(wěn)性以及多源數(shù)據(jù)帶來的影響[7],又拓展模型的使用深度和廣度。但是,到目前為止,天山西部云杉生物量研究中還未有公開共享的數(shù)據(jù)集,其他學(xué)者想要深入研究只能將以往的研究的結(jié)果作為理論,拓展性不強(qiáng),這也在一定程度上阻礙了該區(qū)域生物量研究進(jìn)展。
因此,本數(shù)據(jù)集整理了天山西部云杉的生物信息以及非生物信息,在今后天山西部云杉生物量研究中,不管是進(jìn)行空間異相關(guān)分析還是空間自相關(guān)的分析,都有提供全面的數(shù)據(jù)來進(jìn)行研究,積累思路。研究利用回歸克里格法對(duì)云杉林地上生物量進(jìn)行空間插值,得到云杉地上生物量區(qū)域的空間分布信息,有助于多角度綜合分析天山西部云杉林地上生物量與氣象、地形、土壤等環(huán)境因子之間的關(guān)聯(lián)關(guān)系,為天山西部云杉林地上生物量和碳儲(chǔ)量研究提供基礎(chǔ)監(jiān)測(cè)數(shù)據(jù)和空間統(tǒng)計(jì)建模等方面的支撐。
數(shù)據(jù)集由天山西部區(qū)域云杉野外林木調(diào)查數(shù)據(jù)、氣象因子、地形因子、遙感影像四類數(shù)據(jù)經(jīng)處理后組成,考慮到本研究涉及數(shù)據(jù)類型較多,可按照數(shù)據(jù)用途及對(duì)應(yīng)的子模型對(duì)數(shù)據(jù)進(jìn)行分類整理。
1.2.1 天山云杉調(diào)查數(shù)據(jù)描述與處理
數(shù)據(jù)來自2014年對(duì)天山西部區(qū)域的云杉林野外樣地調(diào)查,通過對(duì)布設(shè)的223個(gè)樣地(28 m×28 m)內(nèi)的天山云杉進(jìn)行每木檢尺,樣木胸徑起測(cè)5 cm,測(cè)量位置在樹高1.3 m處,調(diào)查因子主要有:行政區(qū)劃、測(cè)樹學(xué)因子(胸徑、樹高、齡組)、土壤因子(土壤類型、土層厚度、腐殖層厚度)、地形因子(海拔、坡度、坡向、坡位、坡度、地貌)、遙感數(shù)據(jù)(植被指數(shù)、比值植被指數(shù))等生物量和非生物量因子,樣地均勻分布在整個(gè)在天山山脈西部(41°59′ - 44°31′N,79°58′ - 84°05′E),研究區(qū)位置如圖1。
圖1 天山西部云杉研究區(qū)位置Figure 1 Location of spruce study area in the Western Tianshan Mountain
(1)剔除胸徑異常樣木
在處理林木野外林木調(diào)查數(shù)據(jù)的過程中,常會(huì)對(duì)目標(biāo)數(shù)據(jù)進(jìn)行簡單的統(tǒng)計(jì)分析,通過平均值三倍標(biāo)準(zhǔn)差可以剔除實(shí)測(cè)數(shù)據(jù)在測(cè)量過程中由于人為因素產(chǎn)生的異常值[8],以此保證數(shù)據(jù)的準(zhǔn)確性。在本研究中,胸徑是計(jì)算天山云杉生物量的重要參數(shù)。而通過對(duì)原始數(shù)據(jù)的目視檢驗(yàn),發(fā)現(xiàn)胸徑數(shù)據(jù)中會(huì)存在不符合天山云杉的最大生長尺寸范圍內(nèi)的錯(cuò)誤值,統(tǒng)計(jì)分析過程中會(huì)發(fā)現(xiàn),胸徑變異系數(shù)大過于離散,值段分布不均勻,這樣的胸徑計(jì)算出來的天山云杉生物量利用價(jià)值并不高,而通過平均值三倍準(zhǔn)差法結(jié)合可以將樣地中胸徑值異常的樣木剔除,保證數(shù)據(jù)集質(zhì)量和均勻分布??紤]到在同一齡組中的天山云杉胸徑變化不會(huì)很大,通過齡組進(jìn)行數(shù)據(jù)的分類再進(jìn)行平均值三倍標(biāo)準(zhǔn)差剔除的異常木會(huì)更準(zhǔn)確。因此將調(diào)查數(shù)據(jù)以齡組分為5類:1(幼齡)、2(中齡)、3(近熟)、4(成熟)、5(過熟)。計(jì)算每個(gè)齡組中胸徑的平均值和標(biāo)準(zhǔn)差,天山西部云杉各齡組統(tǒng)計(jì)情況如表1。
表1 齡組分類的天山西部云杉胸徑統(tǒng)計(jì)分析Table 1 Statistical analysis of DBH of Western Tianshan spruce classified by age group
表1中,各齡組胸徑的變異系數(shù)值較大,胸徑在齡組中的分布離散,需要剔除數(shù)據(jù)的異常樣木。以各齡組中不超過胸徑平均值三倍標(biāo)準(zhǔn)差為正常的樣木,其余的當(dāng)作異常木剔除,剔除異常胸徑后再將數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)結(jié)果見表2。其中幼齡組(樣點(diǎn)樹齡小于61年)、中齡組(樣點(diǎn)樹齡61-100年)、近熟組(樣點(diǎn)樹齡101-120年)、成熟組(樣點(diǎn)樹齡121-160年)、過熟組(樣點(diǎn)樹齡大于160年)中剔除的胸徑異常樣木分別占各組總數(shù)的2.3%、1.7%、1.3%、1.4%、0.8%。剔除異常木后,變異系數(shù)相比原始的數(shù)據(jù)中,變異系數(shù)都降低,這樣胸徑在各組內(nèi)的分布更均勻。
表2 天山西部云杉剔除異常胸徑統(tǒng)計(jì)分析Table 2 Statistical analysis of removing abnormal DBH of Western Tianshan spruce
(2)天山西部云杉單位面積生物量計(jì)算
考慮到不同區(qū)域天山云杉生長條件和環(huán)境差異,選擇文獻(xiàn)[9]中的天山云杉異速生長模型(R2=0.981)進(jìn)行本研究的單木生物量計(jì)算,該模型建立所采集的樣本位于本研究區(qū)范圍內(nèi)。模型公式如下:
公式(1)中,D為胸徑(cm),W為天山西部云杉的地上生物量(kg)。
單木生物量的計(jì)算在EXCLE 2019中完成。由于通過云杉異速生長模型計(jì)算出來的生物量為單木生物量(kg·株-1),不能體現(xiàn)樣地的生物量總體情況。因此,在EXCEL 2019中利用數(shù)據(jù)透視表計(jì)算得到每個(gè)樣地的總生物量,布設(shè)的樣地面積為0.0784 hm2的方形樣地,進(jìn)而計(jì)算出每個(gè)樣地的單位面積生物量值(t·hm2),以每個(gè)樣地的單位面積生物量值為采樣點(diǎn)進(jìn)行變異函數(shù)分析和插值計(jì)算。
1.2.2 DEM數(shù)據(jù)來源與處理
本研究使用的DEM數(shù)據(jù)通過地理空間數(shù)據(jù)云(https://www.gscloud.cn/)下載,為30米分辨率的TIF格式數(shù)據(jù),根據(jù)研究區(qū)范圍進(jìn)行了裁剪,利用ArcGIS提取DEM中坡度和坡向信息并轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)格式。
1.2.3 生物氣象因子來源與處理
本研究使用的氣象因子數(shù)據(jù)通過WorldClim網(wǎng)站(https://www.worldclim.org/)下載,為30弧秒的TIF格式數(shù)據(jù),根據(jù)研究區(qū)范圍進(jìn)行裁剪得到,利用ArcGIS提取樣點(diǎn)生物氣象因子信息并轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)格式。
本研究使用的遙感數(shù)據(jù)通過美國地質(zhì)勘探局(United States Geological Survey,https://glovis.usgs.gov/)下載,得到研究區(qū)30米的Landsat 8多光譜遙感影像13景,成像時(shí)間為2013年至2014年7/8/9月份,符合野外調(diào)查時(shí)間,影像總體云量小于3%。利用ENVI 5.3對(duì)下載的遙感影像進(jìn)行輻射校正,大氣校正,影像拼接處理,通過band math工具計(jì)算歸一化植被指數(shù)(NDVI)和比值植被指數(shù)(RVI),最后裁剪得到研究區(qū)的NDVI和RVI 30米分辨率柵格圖像,利用ArcGIS提取樣點(diǎn)的NDVI和RVI的值,并轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)格式。
1.3.1 變異函數(shù)模型
變異函數(shù)是地統(tǒng)計(jì)學(xué)中的基礎(chǔ)工具,不僅能夠描述變量結(jié)構(gòu)性的變化,還能反映出變量影響范圍的大小[10]。
(1)實(shí)驗(yàn)變異函數(shù)擬合。實(shí)驗(yàn)變異函數(shù)擬合優(yōu)度決定了插值模型的精度,函數(shù)公式如下:
公式(2)中γ*(h)為實(shí)驗(yàn)變異函數(shù),h表示樣本點(diǎn)間的距離,N(h)表示樣本點(diǎn)對(duì)數(shù),Z(xi)表示某點(diǎn)生物量值。將天山西部云杉單位生物量分20個(gè)值段,各值段頻數(shù)表現(xiàn)出分布偏度:0.699,峰度:3.05,結(jié)果較符合正態(tài)分布,可以進(jìn)行變異函數(shù)分析和插值計(jì)算,天山西部云杉生物量頻率分布如圖2。
圖2 天山西部云杉單位生物量頻率分布圖Figure 2 Frequency distribution of unit biomass of Western Tianshan spruce
研究利用GS+ 9.0對(duì)天山西部云杉單位生物量進(jìn)行變異函數(shù)分析,并繪制實(shí)驗(yàn)變異函數(shù)。通過塊基比值(比值大于0.75表示變量以隨機(jī)性變異為主,空間性弱;比值在0.25-0.75之間變量能夠表現(xiàn)出中等程度的空間相關(guān)性;比值小于0.25變量表現(xiàn)出較強(qiáng)空間相關(guān)性)判斷天山西部云杉的空間異質(zhì)性,計(jì)算塊基比公式如下:
公式(3)中C0表示塊金值,C1表示偏基臺(tái)值,C1+C0表示基臺(tái)值。變異函數(shù)分析中,指數(shù)函數(shù)擬合效果最優(yōu),殘差平方和(RSS)為0.378小于線性函數(shù)、高斯函數(shù)和球狀函數(shù)。指數(shù)函數(shù)擬合出的塊金值:960,基臺(tái)值:9520,變程:11.3,塊基比值:0.11。可以得出研究區(qū)天山云杉生物量有較強(qiáng)的空間自相關(guān)性。指數(shù)模型擬合的實(shí)驗(yàn)變異函數(shù)如圖3。
圖3 實(shí)驗(yàn)變異函數(shù)Figure 3 Experimental variogram
(2)天山西部云杉單位生物量各向異性分析??臻g異質(zhì)性研究中包括不同方向上表現(xiàn)出的各向異性。因此,本研究通過計(jì)算天山西部云杉單位生物量在0度,45度,90度,135度四個(gè)方向上的變異函數(shù),分析天山云杉單位生物量的各向異性,四個(gè)方向擬合結(jié)果如圖4所示。圖5中天山西部云杉單位生物量四個(gè)方向的實(shí)驗(yàn)變異函數(shù)擬合都為指數(shù)函數(shù)出來,各方向塊金值、基臺(tái)值、變程的變化小,各向異性表現(xiàn)不明顯,不考慮以各向異性作為研究區(qū)云杉單位生物量變異函數(shù)分析和插值計(jì)算。
圖4 天山西部云杉不同方向上實(shí)驗(yàn)變異函數(shù)(a:0度,b:45度,c:90度,d:135度)Figure 4 Experimental variogram of Western Tianshan spruce in different directions (a:0°,b:45°,c:90°,d:135°)
1.3.2 插值模型及結(jié)果展示
本研究天山云杉單位生物量數(shù)據(jù)符合正態(tài)分布且變異函數(shù)表現(xiàn)出強(qiáng)空間相關(guān)性滿足地統(tǒng)計(jì)學(xué)的建模,可以進(jìn)行插值計(jì)算。本研究利用RStudio的RandomForest包和Gstat包對(duì)天山云杉生物量進(jìn)行回歸克里格計(jì)算與插值?;貧w計(jì)算采用隨機(jī)森林建模,將土壤因子、氣象因子、地形因子、遙感數(shù)據(jù)中的因變量與天山云杉單位生物量進(jìn)行皮爾森相關(guān)性分析。其中地貌、坡度、NDVI、RVI、bio1、bio7、bio19、土層厚度、腐殖層厚度9個(gè)變量表現(xiàn)出與天山云杉單位生物量低相關(guān)性(r<0.50)和高顯著性(P<0.05),可以參與到隨機(jī)森林的建模。隨機(jī)森林回歸結(jié)果計(jì)算殘差再與普通克里格插值結(jié)果相加,生成天山云杉單位生物量空間分布的連續(xù)表面。本研究評(píng)價(jià)指標(biāo)主要以決定系數(shù)(R-Squared,R2)、均方根誤差(Root Mean Square Error,RMSE)來評(píng)價(jià)生物量插值模型的性能和結(jié)果的準(zhǔn)確性?;貧w克里格插值決定系數(shù)為0.642,均方根誤差為40.18 t/hm2。經(jīng)ArcGIS繪圖,回歸殘差克里格插值結(jié)果見圖5。
圖5 回歸克里格插值結(jié)果Figure 5 Regression Kriging interpolation results
本研究數(shù)據(jù)集構(gòu)成的基本信息如下:
(1)云杉數(shù)據(jù)包括研究區(qū)邊界圖片(影像數(shù)據(jù)的裁剪,云杉單位生物量插值)、回歸克里格插值表面、樣地結(jié)構(gòu)數(shù)據(jù)(編號(hào)、行政區(qū)位置、單位生物量、齡組、植被覆蓋度、海拔、坡度、坡向、坡位、地貌、土壤類型、土層厚度、腐殖層厚度、NDVI值、RVI值、19個(gè)氣象生物因子),數(shù)據(jù)樣例見表3。
表3 云杉調(diào)查數(shù)據(jù)基本信息Table 3 Basic information of spruce survey data
序號(hào) 數(shù)據(jù)名稱 參數(shù)范圍 單位坡位 谷、脊、上坡位、中坡位、下坡位地貌 高山、中山bio1-年平均溫度 -22.4~10.8℃ 攝氏度bio2-平均氣溫日較差 10.2~14.67 攝氏度bio3-等溫 22.3~36.7 攝氏度bio4-溫度季節(jié)性 800.5~1481.8 bio5-最暖月最高溫度 -6~33.9 攝氏度bio6-最冷月最低溫度 -40.2~14.7 攝氏度bio7-溫度年范圍 33.7~52.1 攝氏度bio8-最潮濕季度平均溫度 -12.85~22.5 攝氏度bio9-最干燥地區(qū)的平均溫度 -32~21.4 攝氏度bio10-最暖季平均溫度 -12~24.6 攝氏度bio11-最冷季平均溫度 -32~-6 攝氏度bio12-年降水 173~647 毫米bio13-最潮濕月份降水量 26~128 毫米bio14-最干旱月份的降水 2~18 毫米bio15-降水季節(jié)性 -22.1~97.9 毫米bio16-最濕季降水 70~328 毫米bio17-最干旱地區(qū)降水 6~61 毫米bio18-最暖季降水 60~328 毫米bio1-19最冷季降水 6~61 毫米土壤名稱 栗褐土、栗鈣土、暗棕壤、褐土、石灰土土壤厚度 10~120 厘米腐殖層厚度范圍 0~30 厘米NDVI / RVI -1~1 / 0~30
(2)天山西部地形因子包括研究區(qū)的數(shù)字高程圖、坡度圖、坡向圖。樣例展示見圖6。
(3)天山西部生物氣象因子包括:bio1-年平均溫度、bio2-平均氣溫日較差、bio3-等溫、bio4-溫度季節(jié)性、bio5-最暖月最高溫度、bio6-最冷月最低溫度、bio7-溫度年范圍、bio8-最潮濕季度平均溫度、bio9-最干燥地區(qū)的平均溫度、bio10-最暖季平均溫度、bio11-最冷季平均溫度、bio12-年降水、bio13-最潮濕月份降水量、bio14-最干旱月份的降水、bio15-降水季節(jié)性、bio16-最濕季降水、bio17-最干旱地區(qū)降水、bio18-最暖季降水、bio1-19最冷季降水一共19張圖片。樣例展示(bio1-年平均溫度,bio3-等溫,bio12-年降水),見圖7。
圖6 地形因子?xùn)鸥裼跋?a:坡度 ,b:坡向 ,c:數(shù)字高程)Figure 6 Raster images of terrain factors (a: slope, b: aspect, c: digital elevation)
圖7 生物氣象因子?xùn)鸥裼跋?a: bio1-年平均溫度, b: bio3-等溫, c: bio12-年降水)Figure 7 Raster images of bioclimatic factors (a: bio1 - annual average temperature, b: bio3 - isothermal, c: bio12 -annual precipitation)
(5)遙感數(shù)據(jù)包括研究區(qū)的NDVI圖和RVI圖,見圖8。
圖8 遙感因子?xùn)鸥裼跋?a: RVI , b: NDVI)Figure 8 Raster images of remote sensing factors (a: RVI, b: NDVI)
為保證數(shù)據(jù)處理、變異函數(shù)計(jì)算及回歸克里格插值過程的可靠性,研究測(cè)樹數(shù)據(jù)和土壤數(shù)據(jù)來源于2014天山西部云杉野外樣地調(diào)查數(shù)據(jù)。遙感影像通過訪問美國地質(zhì)勘探局下載影像成像時(shí)間在2013年至2014年的7、8、9月份,符合森林調(diào)查采樣時(shí)間,影像總體云量小于3%。嚴(yán)格按要求通過ENVI 5.3對(duì)下載的遙感影像進(jìn)行輻射校正,大氣校正,影像拼接等預(yù)處理工作;數(shù)字高程訪問中國地理空間數(shù)據(jù)云中下載,并通過ENVI 5.3軟件嚴(yán)格按照要求處理;生物氣象因子從WorldClim中下載。以上的數(shù)據(jù)的處理過程都按照技術(shù)規(guī)程、軟件指南和相關(guān)科學(xué)文獻(xiàn)等,確保數(shù)據(jù)準(zhǔn)確可靠。
數(shù)據(jù)的加工及處理全部在ENVI 5.3、ArcGIS10、EXCEL 2019、RStudio(R語言的版本為4.0.5)、GS+ 9.0軟件平臺(tái)上進(jìn)行。變異函數(shù)的計(jì)算和擬合是在《GS+操作指南》[11]指導(dǎo)說明下完成。插值是在RStudio的Gstat包和ArcGIS 10的Geostatistical Analyst模塊中完成,插值結(jié)果進(jìn)行交叉驗(yàn)證,保證插值的精度。
天山西部云杉分布是大尺度的研究工作,由于天山云杉林多為天然生長,海拔較高,云杉生物量研究單靠人為的去采集數(shù)據(jù)耗時(shí)耗力,數(shù)據(jù)集提供天山西部云杉空間分布信息,采用回歸克里格的方法分析該區(qū)域云杉生物量的空間格局,可以為研究學(xué)者提供基礎(chǔ)監(jiān)測(cè)數(shù)據(jù)和空間統(tǒng)計(jì)建?;A(chǔ)。本研究數(shù)據(jù)集整合了云杉野外調(diào)查林木數(shù)據(jù)、氣象因子、地形因子、遙感影像四類數(shù)據(jù),數(shù)據(jù)類型豐富,基本涵蓋了研究區(qū)領(lǐng)域內(nèi)的大部分關(guān)鍵指標(biāo)數(shù)據(jù)。在天山西部云杉生物量研究中,不管是進(jìn)行空間異相關(guān)分析還是空間自相關(guān)的分析,都有全面的數(shù)據(jù)來支持研究,積累思路。且后期開展天山西部云杉生物量的研究中可以結(jié)合多期的數(shù)據(jù),以本研究利用的輔助數(shù)據(jù)類型為參考,在空間分析研究的基礎(chǔ)上,對(duì)該區(qū)域的云杉生物量進(jìn)行時(shí)空異質(zhì)性分析,預(yù)測(cè)云杉生物量時(shí)空變化,為天山云杉林的科學(xué)經(jīng)營管理和生態(tài)系統(tǒng)保護(hù)提供理論和數(shù)據(jù)基礎(chǔ)。
中國科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)2022年3期