楊嘉龍,肖生苓
(東北林業(yè)大學 工程技術(shù)學院,哈爾濱 150040)
自國際林聯(lián)(IUFRO)1994年出版《國際森林監(jiān)測指南》將生物量列為全球、區(qū)域和國家級森林資源監(jiān)測的重要內(nèi)容,越來越多的專家和學者提出了更新的生物量研究方法和理論,從變量選取到模型優(yōu)化,生物量模型經(jīng)歷了從線性到非線性的結(jié)構(gòu)轉(zhuǎn)變。目前,應用最廣泛也最被認可的是建立非線性的相容性生物量模型[1-5]。非線性模型對生物量的擬合效果比線性模型好,模型評價指標更高,更加符合林木的生長規(guī)律。相容性生物量模型通過以總量或樹干生物量為基礎(chǔ)的分級控制理論,能夠很好的解決的總量和分量不相容的問題,而且模型檢驗指標滿足建模要求。
非線性生物量模型的構(gòu)建不同于線性生物量模型,其中最主要的原因就是非線性模型中變量的方差非齊性,線性生物量模型的構(gòu)建就是基于方差齊性的假設前提,模型的誤差項期望Eζ=0,得到線性模型的最優(yōu)估計。而實際中,誤差項的方差隨自變量的變化而變化,如果忽略了模型中的異方差性,將會造成模型的參數(shù)估計值變化,不僅降低模型的估計精度,還會使估計值的檢驗和置信區(qū)間失效。為此,對模型的異方差檢驗和消除就顯得尤為重要。
由于調(diào)查數(shù)據(jù)往往存在測量誤差,以及樣本數(shù)據(jù)具有的個體差異性和建模模型的忽略因素,導致估計結(jié)果存在異方差性,在數(shù)據(jù)處理時,往往首先要檢驗誤差項間是否有異方差存在,從而不影響模型的建立和參數(shù)的估計??刹捎玫臋z驗方法有:圖示檢驗法、帕克(Park)檢驗、巴特利特(Bartlett)檢驗、格萊澤(Glejser)檢驗、斯皮爾曼(Spearman)等級相關(guān)檢驗、戈德菲爾特-匡特(Goldfelt-Quandt)檢驗、布勞特-陪干-戈弗雷(Breusch-Pangan-Godfrey)檢驗、懷特(White)檢驗、ARCH(自回歸條件異方差)檢驗、Wald檢驗、拉格朗日乘數(shù)檢驗和似然比檢驗[6]。其中,比較常用的是圖示檢驗法、格萊澤(Glejser)檢驗、斯皮爾曼(Spearman)等級相關(guān)檢驗和懷特(White)檢驗。
圖1 幾種可能存在異方差的殘差示意圖
圖示檢驗法雖然簡單直觀,但是只能夠作為一種趨勢的判定,不能通過圖形看出引起異方差的變量,也得不到異方差的具體形式。
格萊澤(Glejser)檢驗是基于殘差和解釋變量間有顯著成立的關(guān)系,如果方程存在異方差,那么異方差與解釋變量的冪相關(guān),假設異方差σi與第j個解釋變量的關(guān)系如下:
(1)
由于異方差σi是經(jīng)過檢驗后計算所得,格萊澤利用殘差絕對值|ei|代替異方差σi,得到:
(2)
假如δ1=0,則可以認為異方差σ1與xi無關(guān),即隨即擾動項ui的方差與xj無關(guān);δ1≠0,則隨即擾動項ui的方差與xj的變化相關(guān)。異方差檢驗就轉(zhuǎn)化為對δ1是否為0的檢驗,用T檢驗,如果參數(shù)δ1顯著的不為0,則認為存在異方差。
此檢驗不僅能對異方差的存在作出判斷,而且還能得到異方差隨變量變化的具體形式,檢驗需要大量樣本數(shù)據(jù),而且誤差項本身可能含有異方差。
斯皮爾曼(Spearman)等級相關(guān)檢驗不用考慮模型參數(shù),類似于格萊澤(Glejser)檢驗,通過檢驗殘差和解釋變量是否有顯著關(guān)系,來判定異方差性?;诠?1)將求得的隨機變量的殘差ei取絕對值,并與xi以升序或降序排列,按斯皮爾曼(Spearman)等級相關(guān)系數(shù)計算公式:
(3)
式中:Di=xi-ei,N為樣本個數(shù)。
檢驗需要對殘差和解釋變量進行排序,樣本容量過小會導致數(shù)據(jù)變異程度較大,降低檢驗可信度,而且此檢驗也無法給出異方差的具體形式[7]。
懷特檢驗能夠?qū)埐钆c不同形式的自變量結(jié)合起來,建立多元回歸方程,其基本多元回歸方程形式如下:
yi=δ0+δ1x1i+δ2x2i+δ3x3i+…+σnxni+ui。
(4)
再通過建立輔助回歸模型的方式來判斷回歸方程的異方差性,假設自變量含3種形式,其輔助回歸模型形式[8]為:
(5)
以上常用檢驗除格萊澤(Glejser)檢驗能得到異方差的具體形式,其余檢驗只能驗證異方差性,圖示檢驗可以依靠SPSS、SAS、MALTABLE等統(tǒng)計軟件直接給出,應用最為普遍。
通過上述檢驗,可以知道誤差項是否具有異方差性,而且異方差的存在并不影響普通最小二乘法(Ordinary Least Squares,簡稱OLS)估計量的無偏性,但是會造成估計量的方差變大,導致通常假設的檢驗值失效。所以,對已經(jīng)驗證的異方差要采用辦法去消除,以保證得到的模型具有最優(yōu)的無偏估計。通常采用加權(quán)最小二乘法(The Weighted Least squares,簡稱WLS)、改變變量形式或重新設定模型這三種方法,這里只介紹最簡單和最常用的方法——加權(quán)最小二乘法(WLS)。
應用加權(quán)最小二乘法消除異方差已被得到廣泛證實。采用加權(quán)最小二乘法最回歸估計在消除異方差的同時,能夠保證模型不含系統(tǒng)誤差,其權(quán)函數(shù)形式可由變量本身構(gòu)造,方便適用[10]。模型的擬合結(jié)果與普通最小二乘法相比,各項指標均有明顯改善[11]。如果假定因變量yi的方差與自變量xi的某種形式成一定比例,權(quán)函數(shù)可以定義為wi=1/f(xi)消除異方差,但是要想得到準確具體的f(xi)形式就相對比較困難[12]。在實際應用WLS時,常以SPSS、Eviews等統(tǒng)計軟件為工具,繪制殘差圖或?qū)ο惙讲畹臋?quán)函數(shù)進行探討,理論上的最優(yōu)權(quán)函數(shù)應該是與最大對數(shù)似然函數(shù)相應的取值[13]。
以77株落葉松樹干生物量建模數(shù)據(jù)為例,擬合的單木樹干生物量優(yōu)勢方程形式為W樹干=a(D2H)b,用此經(jīng)驗模型作為分析異方差的基礎(chǔ)模型,通過SPSS軟件繪制的殘差圖可以看出方程存在異方差性,如圖2(a)所示。
圖2 存在和消除異方差的樹干模型殘差圖
對模型異方差的消除分兩個部分,首先是對經(jīng)驗模型進行對數(shù)轉(zhuǎn)換,消除基于OLS下假設誤差期望為0而造成的參數(shù)偏小和異方差性,如圖2(b)所示。其次,建立樹干相容性生物量模型,做到總量和各分量和相等,為了消除模型間的度量誤差和異方差,要對干材和樹皮生物量方程進行非線性聯(lián)合估計,復雜生物量模型異方差的消除采取構(gòu)造權(quán)函數(shù)的方法,鑒于一元回歸方程與二元回歸權(quán)函數(shù)方程對消除異方差的效果差別不大,這里采用由胸徑D和樹干生物量預估殘差值方差1.06構(gòu)造的一元回歸方程作為權(quán)函數(shù)方程,即權(quán)函數(shù)為G=1/D1.06,模型通過決定系數(shù)(R2)、估計值的標準差(SEE)、平均估計誤差(MPE)、平均相對偏差(ME)、平均相對偏差絕對值(MAE)以及預估精度(P)作為選擇最優(yōu)模型的檢驗指標。消除異方差的樹干生物量模型擬合和檢驗結(jié)果,見表1。
通過表1可以看出,消除異方差后的對數(shù)模型和相容性生物量模型SEE值減小,說明采用模型轉(zhuǎn)換和加權(quán)函數(shù)的方法是可行有效的,而且對模型的預估效果起到了很好的作用。
表1 消除異方差的樹干生物量模型擬合結(jié)果和檢驗結(jié)果統(tǒng)計
生物量建模過程中,往往存在著異方差性,會導致采用普通最小二乘法進行回歸所得估計值有偏,參數(shù)值和有效區(qū)間失真。這就需要對誤差項可能存在的方差性進行檢驗,并采取有效的消除方法,文章通過實例證明檢驗和消除異方差的方法是行之有效的,而且能夠保證系統(tǒng)模型的建模要求。
【參 考 文 獻】
[1] 唐守正,張會儒,胥 輝.相容性生物量模型的建立及其估計方法研究[J].林業(yè)科學,2000,36(1):20-27.
[2] 胥 輝,劉偉平.相容性生物量模型研究[J].福建林學院學報,2001,21(1):18-23.
[3] 羅云建.森林生物量的估算方法及其研究進展[J].林業(yè)科學,2009,45(8):129-134.
[4] 翟 暢,胡潤田,范文義.森林水源縣生態(tài)效益的估算與評價研究[J].森林工程,2012,28(4):69-72.
[5] 曾偉生,唐守正.利用度量誤差模型方法建立相容性立木生物量方程系統(tǒng)[J].林業(yè)科學研究,2010,23(6):797-802.
[6] 白雪梅.異方差性的檢驗方法及評述[J].東北財經(jīng)大學學報,2002(6):26-29.
[7] 徐唐先.關(guān)于等級相關(guān)中斯皮爾曼公式[J].統(tǒng)計與決策,1995,22-23.
[8] 申屠惠良.使用懷特檢驗判斷生物量模型的異方差性[J].浙江林業(yè)科技,2012,32(3):43-45.
[9] 龔秀芳.回歸模型中異方差數(shù)據(jù)的處理[D].上海:華東師范大學,2002.
[10] 唐守正,胥 輝.關(guān)于生物量模型中的異方差問題[J].林業(yè)資源管理,1999(1):46-49.
[11] 鄭春茂.加權(quán)回歸及權(quán)函數(shù)的變換在生物量建模中的應用[J].華東森林經(jīng)理,2012,26(2):77-79.
[12]胥 輝.生物量模型方差非齊性研究[J].西南林學院學報,1999,19(2):73-77.
[13]宋廷山,李 杰.回歸模型的異方差性消除方法探討[J].統(tǒng)計教育,2007(4):6-7.