倪成才 方昆升 唐小焱
(1. 北華大學(xué)林學(xué)院,吉林 吉林 132013;2. 廣州天權(quán)信息科技有限公司,廣東 廣州 510635;3. 貴州財經(jīng)大學(xué)大數(shù)據(jù)應(yīng)用與經(jīng)濟學(xué)院,貴州 貴陽 550005)
林分的優(yōu)勢木平均樹高(簡稱優(yōu)勢樹高)主要受立地質(zhì)量和林分年齡的影響[1]。為了對比不同年齡林分的立地質(zhì)量,需要將林分的優(yōu)勢樹高轉(zhuǎn)換為一個特定林齡時的樹高,以消除林分林齡對優(yōu)勢樹高的影響效應(yīng),此特定林齡稱為指數(shù)年齡,指數(shù)年齡時的優(yōu)勢樹高稱為立地指數(shù),是林業(yè)上在衡量立地質(zhì)量的重要量化指標(biāo)[2]。
在林學(xué)上,將現(xiàn)時林分優(yōu)勢樹高轉(zhuǎn)化為立地指數(shù)的模型稱為立地指數(shù)模型[3]。目前,廣泛應(yīng)用的立地指數(shù)模型為Clutter 和Bailey 于1974 年提出的差分模型[4],以及Cieszewski 和Bailey 于2000 年提出的廣義差分模型[5]。差分型立地指數(shù)模型假設(shè)在理論生長模型中,例如理查德方程,僅有一個隨林分(立地質(zhì)量)變化而變化的可變參數(shù),如果指定漸近線參數(shù)(asymptote)為可變參數(shù),則可以導(dǎo)出單型模型;而指定漸近線以外的參數(shù)為可變參數(shù)時,則可導(dǎo)出多型模型[3]。
差分型立地指數(shù)模型根據(jù)一個林分在現(xiàn)時t1時的優(yōu)勢樹高h1來估計在指數(shù)年齡t2時的樹高h2,模型給出的h2估計值和實測值間必然存在差異,其受多個隨機因素的影響,包括t2和t1間的距離、模型參數(shù)的估計誤差、以及與h1和h2分別相關(guān)聯(lián)的隨機誤差項等[1-3]。本文以實測數(shù)據(jù)為基礎(chǔ),對估計誤差的行為模式進行經(jīng)驗性分析。
本文考慮的理論生長方程包括豪斯費爾德(Hossfeld)、考爾夫(Korf)、理查德(Richards)[2]、威布爾(Weibull)、單分子(Mitscherlich)以及邏輯斯蒂(Logistic)模型[3],均為三參數(shù)的生長方程。由于單分子和邏輯斯蒂模型擬合殘差均方明顯高于其它生長方程,因而在后續(xù)分析不予考慮,僅以表1 中4 個模型為基礎(chǔ)模型,并推導(dǎo)出了8 個差分型生長模型,單型和多型模型各有4 個,均同時列于表1。
數(shù)據(jù)來源于110 個黑云杉Picea mariana 樣地優(yōu)勢木的樹干解析。樣地布設(shè)于加拿大哥倫比亞省的黑云杉天然林,面積為0.04 hm2,20 m×20 m。每個樣地選取了胸徑最大的3 株優(yōu)勢木,每株優(yōu)勢木未經(jīng)歷過任何影響樹高生長的損傷、疾病或受壓等過程。每株優(yōu)勢木在0.3、0.8 和1.3 m 處,以及胸高以上每隔1 m 處截斷,查取年輪數(shù),并縱切獲取樹高數(shù)據(jù)。
表1 理論生長模型及導(dǎo)出的差分立地指數(shù)模型Table 1 Theoretical growth functions and derived ADA site index models
所用數(shù)據(jù)為樹干解析逐年的年齡和樹高。對于模型擬合來說數(shù)據(jù)過多,也與現(xiàn)實中重復(fù)觀測的優(yōu)勢樹高的數(shù)據(jù)不同,因而通過SAS 的IML 過程,以樣地測量時林齡為起點,從樹高生長序列中每隔10 年提取一組樹高—年齡的數(shù)據(jù),共計5次,以模仿實際應(yīng)用中的重復(fù)觀測數(shù)據(jù)。
表1 中的8 個立地指數(shù)模型用SAS9.2 的nlin過程擬合,采用了分類變量回歸法擬合模型,其技術(shù)細節(jié)可參考Cieszewski 等[6]。在完成模型擬合后,需要分析每一個模型的立地指數(shù)估計誤差的行為模式和變化規(guī)律。假設(shè)有n 個樣地的數(shù)據(jù),給定第i 個樣地在年齡t1時的優(yōu)勢樹高為hi,1,估計在指數(shù)年齡t2時的樹高 h?i,2(立地指數(shù)),所有樣地的估計誤差均方(MSE)可定義為
由于差分模型通過一個年齡時(t1)樹高(h1)估計另一個年齡時(t2)的樹高(h2),因而又常稱之為投影模型。立地指數(shù)常用于作為林分特征預(yù)估方程的預(yù)測變量,例如蓄積和胸斷面積等。式(9)中MSE 可用于近似地代表從(t1, h1)投影到(t2, h2)的估計誤差的方差,便于評估立地指數(shù)估計誤差對其它林分特征的預(yù)測誤差的影響效應(yīng)(誤差分量)。通過不同的t1和t2取值組合,可以分析在不同投影長度t1和t2間的距離和投影方向時不同模型的估計誤差的變化規(guī)律。投影方向指t1和t2間對比關(guān)系,例如t1≤t2時,由于投影方向與時間軸一致,因而可稱之為正向投影,否則為反向投影。
利用SAS 9.2 的nlin 過程擬合了表1 中8 個差分指數(shù)模型,各模型的參數(shù)估計值和擬合殘差均方列于表2。由于各模型均有3 個參數(shù),因而可以用擬合殘差均方對比擬合效果。一般而言,源于同一理論方程的多型模型優(yōu)于單型模型。模型(2)的擬合殘差均方值最小,為0.353 0 m2,但與其它多型模型相比,優(yōu)勢并不明顯。
表2 選用的立地指數(shù)模型的參數(shù)估計值Table 2 Parameter estimates for selected site index models
由于誤差均方(MSE)與預(yù)測誤差的方差密切相關(guān),可用于評估立地指數(shù)對其它林分特征預(yù)估準(zhǔn)確性的影響效應(yīng),因而如下的分析將以誤差均方(MSE)為主,以平均相對誤差(MRE)為輔。
不同投影方向和投影距離時,代表性的MSE行為模式示意于圖1 和2。圖1 和圖2 分別給出了當(dāng)t1=100 和60 時隨t2值變化的誤差均方(MSE)的變化模式。當(dāng)t2=t1時MSE 值為0,所有的差分指數(shù)模型包括廣義差分模型,均有這一性質(zhì),例如表1 的8 個模型均如此。
圖1 估計誤差均方隨指數(shù)年齡t2 的變化趨勢(t1=100)Fig. 1 The trends of mean squared estimate error with t2 at t1=100
圖2 估計誤差均方隨指數(shù)年齡t2 的變化趨勢(t1=60)Fig. 2 The trends of mean squared estimate error with t2 at t1=60
估計誤差均方(MSE)一般隨投影距離增加而增加。當(dāng)t2>t1時(正向投影),一般表現(xiàn)為隨投影距離的增加而單調(diào)增加;但當(dāng)t2<t1時(反向投影),MSE 首先隨投影距離而增加,達到一個峰值后再逐漸下降,如圖1 所示。
在投影距離一定時,反向投影(t2<t1時)的MSE 往往明顯低于正向投影(t2>t1時)。假設(shè)林分現(xiàn)時年齡t1=60,如果投影距離為20 年,圖2顯示反向投影的MSE 約為0.35 m2,但正向投影的MSE 則約為0.90 m2。一般而言,反向投影的MSE 值一般均在可接受的范圍之內(nèi)。從圖2 可見,從t1=60 投影到t2=140 時,立地指數(shù)的估計誤差均方最高可達10 m2。
在投影距離和方向均相同時,多型模型的MSE 往往顯著地少于單型模型。在圖2 中共計有8 個立地指數(shù)模型的估計誤差MSE 曲線,單型和多型各有4 個。在80 到140 年的范圍內(nèi),多型和單型MSE 變化曲線自然地匯聚而成2 個截然不同的曲線族。單型曲線的MSE 相互重疊,位于圖2上方,相互間幾乎無法分辨,表現(xiàn)出了高度一致的行為模式;而多型曲線則位于下方,表現(xiàn)出一致的、與單形曲線完全不同的MSE 變化規(guī)律,且MSE 值系統(tǒng)地顯著少于單型曲線,例如當(dāng)t2=140時,多型模型的MSE 約為6 m2,而單型模型的MSE 卻高達10 m2,參考圖2。
平均相對誤差(MRE)行為模式的代表性結(jié)果示于圖3 和4。MRE 同MSE 相比,行為模式基本一致,MRE 同樣表現(xiàn)出了隨投影距離延長而增加的趨勢,而且單型曲線也內(nèi)部趨勢一致,與多型曲線截然不同,MRE 往往明顯高于多型曲線。MRE 和MSE 相比,也有幾點不同。第一點,在反向投影(t2<t1)時,MRE 表現(xiàn)出一定程度的單調(diào)性,隨著投影距離的延長MRE 單調(diào)增加,并不存在一個類似于MSE 的峰值。第二點,正向投影的MRE 隨投影距離增加速度低于反向投影,這一點也與MSE 不同。
圖3 平均相對誤差隨指數(shù)年齡t2 的變化趨勢(t1 =100)Fig. 3 The trends of mean relative error with t2 at t1 =100
圖4 平均相對誤差隨指數(shù)年齡t2 的變化趨勢(t1=60)Fig. 4 The trends of mean relative error with t2 at t1=60
從以上分析可見,在估計立地指數(shù)時應(yīng)盡量地避免長距離投影(預(yù)測),以減少估計誤差,因而需要確定合理的指數(shù)年齡(t2)以降低投影距離。關(guān)于指數(shù)年齡的討論可參考陳永富[7]的報道。從控制MRE 角度看,一方面要通過合理的指數(shù)年齡降低投影距離,另一方面則需要盡可能地減少反向投影。但從MSE 角度看,特別是當(dāng)立地指數(shù)將作為其它林分特征(例如蓄積)的預(yù)測變量時,則在確定指數(shù)年齡時應(yīng)盡量減少正向投影,因為較大MSE 可能極大地降低目標(biāo)林分特征的預(yù)測準(zhǔn)確性。無論MRE 或MSE,均要求應(yīng)根據(jù)總體的林齡結(jié)構(gòu),以及各林齡的面積比例系數(shù)等因素來確定指數(shù)年齡,而不可以隨意指定。這一結(jié)論與差分模型的指數(shù)年齡無關(guān)性(base-invariance)并不矛盾,因為這一屬性僅為差分模型的期望方程的一個性質(zhì)。