劉 明
異方差White檢驗(yàn)應(yīng)用的幾個(gè)問題
劉 明a,b
(蘭州商學(xué)院a.統(tǒng)計(jì)學(xué)院;b.甘肅經(jīng)濟(jì)發(fā)展數(shù)量分析研究中心,甘肅蘭州730020)
White檢驗(yàn)通常由LM檢驗(yàn)來完成,現(xiàn)實(shí)中也可以使用更簡單的F檢驗(yàn)來替代LM檢驗(yàn);White檢驗(yàn)過程中需要構(gòu)筑輔助回歸模型,它可以有不同的形式以應(yīng)對實(shí)際問題的需要;討論了四類不同的輔助回歸模型,理論分析表明,它們在應(yīng)用中各有所長;最后通過一個(gè)實(shí)際例子,驗(yàn)證了理論分析的結(jié)論,展示了White檢驗(yàn)應(yīng)用的靈活性。
異方差;White檢驗(yàn);輔助回歸模型
異方差是計(jì)量經(jīng)濟(jì)學(xué)中所討論的一個(gè)重要問題,異方差的檢驗(yàn)方法在異方差問題的討論中居于核心地位。在線性回歸模型中,異方差的檢驗(yàn)方法有很多,依據(jù)不同的前提條件,這些檢驗(yàn)又各有所倚。在諸多異方差檢驗(yàn)方法中,最有效、最常用的當(dāng)屬White檢驗(yàn)了,這種檢驗(yàn)方法提出以后,以其快捷的檢驗(yàn)過程和有效的檢驗(yàn)結(jié)論而得到廣大學(xué)者的認(rèn)可,并迅速成為異方差檢驗(yàn)的經(jīng)典方法。筆者在計(jì)量經(jīng)濟(jì)學(xué)課程教學(xué)過程中發(fā)現(xiàn),White檢驗(yàn)是初學(xué)者的一個(gè)學(xué)習(xí)難點(diǎn),很多初學(xué)者只懂得White檢驗(yàn)的思路和方法,而不會對其加以靈活應(yīng)用。本文將對White檢驗(yàn)的使用技巧進(jìn)行總結(jié)提煉,為初學(xué)者提供學(xué)習(xí)便利,為研究者提供借鑒。
White檢驗(yàn)是Halbert White在1980年提出的,他在隨機(jī)項(xiàng)存在異方差的情形下,構(gòu)造出參數(shù)估計(jì)量方差協(xié)方差矩陣的一致估計(jì),并根據(jù)這個(gè)估計(jì)結(jié)果,導(dǎo)出了一個(gè)服從χ2分布的統(tǒng)計(jì)量,即拉格朗日乘數(shù)(LM),用此統(tǒng)計(jì)量可完成異方差的檢驗(yàn)[1]。在統(tǒng)計(jì)學(xué)中,通過構(gòu)造LM統(tǒng)計(jì)量進(jìn)行的檢驗(yàn)也可簡稱為LM檢驗(yàn)。為避免繁雜的數(shù)學(xué)推導(dǎo)公式,這里借用普通教科書中的關(guān)于White檢驗(yàn)的表述內(nèi)容,并以此作為討論的開始。對于更嚴(yán)謹(jǐn)?shù)?、一般化的論述,可參見Halbert White所述[1]。
White檢驗(yàn)基于這樣的一個(gè)前提:隨機(jī)干擾項(xiàng)的異方差和解釋變量有關(guān)。經(jīng)驗(yàn)證明這是合乎實(shí)際的。以二元線性回歸模型為例的White檢驗(yàn)方法如下[2]413-414:
設(shè)二元線性回歸模型:
該模型存在異方差:var(μi)=
第一步,構(gòu)造檢驗(yàn)輔助回歸模型:
式(2)表明隨機(jī)項(xiàng)的方差受到解釋變量的影響。
第二步,提出假設(shè)H0∶αi=0,(i=1,2,3,4,5),即原模型不存在異方差;H1∶αi(i=1,2,3,4,5)不同時(shí)等于零,即原模型存在異方差。
第三步,估計(jì)輔助回歸模型。首先用OLS方法估計(jì)式(1)得到殘差ei并取平方得e2i,再利用e2i估計(jì)出輔助回歸模型。進(jìn)一步計(jì)算出輔助回歸模型的多重可決系數(shù)R2。
第四步,構(gòu)造并計(jì)算檢驗(yàn)統(tǒng)計(jì)量nR2,即拉格朗日乘數(shù)。該統(tǒng)計(jì)量服從自由度為約束條件個(gè)數(shù)的χ2分布。式中n為樣本容量,R2為輔助回歸模型的多重可決系數(shù)。此處約束條件個(gè)數(shù)為5。
第五步,做出檢驗(yàn)決策。如果nR2大于χ2分布上自由度為5的上端100α%的臨界點(diǎn)χ2α(5),則拒絕原假設(shè)。
以上即為異方差White檢驗(yàn)的基本過程。在現(xiàn)實(shí)應(yīng)用中,針對具體的情況和檢驗(yàn)要求,可以做出不同的處理。下面將基于上述檢驗(yàn)過程,討論在具體問題中如何靈活應(yīng)用White檢驗(yàn)。
在實(shí)際問題中,White檢驗(yàn)可以演化為不同的檢驗(yàn)形式,在不同情形下對這些檢驗(yàn)形式也有著不同的要求,下面對這些具體的檢驗(yàn)方法做出分析。
(一)White檢驗(yàn)中的統(tǒng)計(jì)檢驗(yàn)方法
White檢驗(yàn)通過構(gòu)建反映隨機(jī)項(xiàng)的方差和解釋變量之間關(guān)系的線性回歸模型即輔助回歸模型,并利用LM檢驗(yàn)方法來檢驗(yàn)輔助回歸模型的顯著性,依此判斷原模型是否存在異方差。這里使用的LM檢驗(yàn)屬于χ2檢驗(yàn)范疇。LM檢驗(yàn)的對象是輔助回歸模型的偏回歸系數(shù)全部等于0,注意到輔助回歸模型是一個(gè)線性模型,由此可知,這里所檢驗(yàn)的就是輔助回歸模型的整體顯著性,原假設(shè)可看成是輔助回歸模型的偏回歸系數(shù)等于零所形成的線性約束條件。對此,White在他的論文中使用了LM檢驗(yàn),而事實(shí)上,也可以用一個(gè)更為簡單的檢驗(yàn)來替代,那就是F檢驗(yàn)。
仍以上述二元回歸模型為例,針對輔助回歸模型所構(gòu)造的原假設(shè)仍然為αi=0(i=1,2,3,4,5),顯然,這5個(gè)線性約束條件表明所檢驗(yàn)的是模型整體的顯著性,由此可以構(gòu)造F統(tǒng)計(jì)量:
其中ESS、RSS分別為輔助回歸模型的回歸平方和及剩余平方和,5、n-6分別為它們各自的自由度。接下來即可根據(jù)F檢驗(yàn)方法來完成檢驗(yàn)決策,因此用F檢驗(yàn)替代LM檢驗(yàn)亦可完成White檢驗(yàn)。
(二)White檢驗(yàn)中輔助回歸模型的構(gòu)造
在White檢驗(yàn)中,構(gòu)造輔助回歸模型是檢驗(yàn)的核心環(huán)節(jié),White在其論文中提出的輔助回歸模型在現(xiàn)實(shí)應(yīng)用中即為:用原始模型的殘差平方對原始模型中的解釋變量、解釋變量的平方和解釋變量的交叉乘積進(jìn)行回歸所建立的回歸模型。在二元回歸中所構(gòu)建的輔助回歸模型如式(2)所示。這類輔助回歸模型涵蓋的信息全面,考慮到了異方差出現(xiàn)的多種可能途徑,同時(shí)對這些可能的出現(xiàn)途徑也有著明確的展示,在大樣本的前提下,用此類輔助回歸模型所得到的檢驗(yàn)結(jié)論是極具說服力的。但是,這類輔助回歸模型由于待估參數(shù)較多而造成了模型自由度的損失,例如,在三元回歸模型的異方差檢驗(yàn)中按上述方法構(gòu)建的輔助回歸模型的參數(shù)個(gè)數(shù)是10個(gè),而在四元回歸模型中就達(dá)到了15個(gè)。在此情形下就會降低輔助回歸模型估計(jì)的精度,進(jìn)而對檢驗(yàn)結(jié)論造成不利影響。
為避免參數(shù)個(gè)數(shù)較多而造成的輔助回歸模型自由度損失的問題,可以考慮簡化輔助回歸模型,一般的做法是剔除模型中的解釋變量的交叉乘積項(xiàng),從而減少了參數(shù)的個(gè)數(shù),降低自由度損失的影響。在二元回歸模型中,剔除交叉乘積項(xiàng)的輔助回歸模型為:
不難發(fā)現(xiàn)模型中參數(shù)的個(gè)數(shù)減少了一個(gè)。如果原模型中有更多的解釋變量,參數(shù)的個(gè)數(shù)會減少得更多。
繼續(xù)考察輔助回歸模型(2),其解釋變量是原回歸模型的解釋變量、解釋變量的平方和解釋變量的交叉乘積。如果考慮使用原回歸模型的解釋變量的線性組合來重新構(gòu)造輔助回歸模型,則又會產(chǎn)生一種新的構(gòu)造輔助回歸模型的辦法。以二元回歸模型為例,具體方法是:
首先估計(jì)出原始模型(1),得到殘差ei并進(jìn)而得到e2i,同時(shí)得到被解釋變量Yi的估計(jì)值:
式(4)即為所構(gòu)造的輔助回歸模型。對于式(4)存在這樣兩個(gè)特點(diǎn):一是參數(shù)個(gè)數(shù)較式(2)大幅減少,事實(shí)上,按此法構(gòu)建的輔助回歸模型的參數(shù)在任何情形下都只有3個(gè);二是式(4)中的解釋變量囊括了式(2)中的所有解釋變量,只要將^Yi=^β0+^β1X1i+^β2X2i代入式(4)即可看出這一點(diǎn)。對模型(4)實(shí)施F檢驗(yàn)或LM檢驗(yàn)即可以完成White檢驗(yàn)。
(三)White檢驗(yàn)中輔助回歸模型的選擇
通過上述討論可以發(fā)現(xiàn),White檢驗(yàn)中的輔助回歸模型可根據(jù)不同的研究視點(diǎn)構(gòu)造出式(2)、式(3)和式(4)三種形式,應(yīng)用中可根據(jù)不同的研究需要加以選擇。式(2)的優(yōu)點(diǎn)在于,涵蓋信息全面,能夠發(fā)現(xiàn)異方差變動的路徑,但模型中包括的參數(shù)較多,易造成自由度的損失,形成相應(yīng)的缺點(diǎn);式(3)在一定程度上解決了自由度損失的問題,但由于丟失了一部分解釋變量而使得信息不夠全面——實(shí)際上是通過犧牲更多的信息來源,以彌補(bǔ)自由度的損失;式(4)解決了由于參數(shù)過多而造成的自由度損失的問題,提高了檢驗(yàn)結(jié)果的可靠性,同時(shí)它也沒有從根本上丟棄交叉乘積項(xiàng)——它將所有的解釋變量都隱含在^Yi和^Y2i中了,但式(4)卻無法表述異方差和原模型解釋變量之間的具體聯(lián)系,同時(shí),擬合的^Yi實(shí)際上相當(dāng)于對X1、X2、X21、X22、X1X2等解釋變量形成了約束,進(jìn)而使得式(4)估計(jì)結(jié)果的可靠性降低,不利于異方差進(jìn)一步的解決。
根據(jù)上述三類輔助回歸模型的優(yōu)缺點(diǎn)分析,不難得出如下簡單結(jié)論:如果樣本容量足夠大,自由度的損失不會影響估計(jì)結(jié)果和檢驗(yàn)結(jié)果,則輔助回歸模型選擇式(2);如果樣本容量不夠大,同時(shí)還需要構(gòu)造異方差和解釋變量之間的關(guān)系,則式(3)可委曲求全;若樣本容量較小,同時(shí)只想檢驗(yàn)異方差是否存在而不關(guān)注其具體的形式,則式(4)較為可靠。如果檢驗(yàn)的目的僅在于是否存在異方差,而不關(guān)注異方差和解釋變量的關(guān)系,筆者認(rèn)為下述輔助回歸模型亦較為可靠:
lne2i=?0+?1ln^Yi+πi(5)
其中πi是隨機(jī)項(xiàng)。式(5)中e2i、^Yi取對數(shù)的原因有:一是降低數(shù)據(jù)的波動,減少異方差對其估計(jì)結(jié)果的影響;二是^Yi取對數(shù)后在一定程度上包括了其他次冪的信息。對于式(5)的顯著性檢驗(yàn)借助于t統(tǒng)計(jì)量即可完成,更方便快捷。
(四)White檢驗(yàn)對解決異方差問題的作用
異方差問題的解決通常需要借助于加權(quán)最小二乘法,而實(shí)施加權(quán)最小二乘法的關(guān)鍵是確定權(quán)重。加權(quán)最小二乘法的權(quán)重在理論上是隨機(jī)項(xiàng)方差的倒數(shù),但在實(shí)際應(yīng)用中隨機(jī)項(xiàng)方差是未知的,因而需要對權(quán)重進(jìn)行構(gòu)造,用已知量加以估計(jì)。現(xiàn)實(shí)中是通過估計(jì)隨機(jī)項(xiàng)方差關(guān)于解釋變量的函數(shù)來構(gòu)造權(quán)重,即:
σ2i=f(X1,X2,…,Xk)
如果用e2i代表隨機(jī)項(xiàng)方差,則可以利用輔助回歸模型式(2)構(gòu)造函數(shù)f的估計(jì)結(jié)果,將1/f作為權(quán)重,加權(quán)最小二乘法即可順利實(shí)施,異方差問題便得到解決。這一過程將在文中下一部分的例證中予以展示。
為了展示異方差White檢驗(yàn)的靈活性和實(shí)用性,筆者收集了2009年中國各省、市、區(qū)人均GDP、人均消費(fèi)、人均投資等宏觀經(jīng)濟(jì)指標(biāo)的數(shù)據(jù),構(gòu)建了反映人均GDP變動的線性回歸模型,利用此模型對上述理論分析內(nèi)容做出實(shí)證展示。
表1 2009年中國各省、市、區(qū)人均GDP、人均消費(fèi)、人均投資數(shù)據(jù)表 單位:萬元/人
用PGDP表示人均GDP,PC表示人均消費(fèi),PI表示人均投資,則以PGDP為被解釋變量,PC、PI為解釋變量的線性回歸模型的估計(jì)結(jié)果為①需要指出的是,這里所構(gòu)建的模型未必是正確的,例如它沒有考慮到進(jìn)出口的影響,但這并不影響本文的研究目的和分析結(jié)論。:
通過各項(xiàng)統(tǒng)計(jì)檢驗(yàn)指標(biāo)可以看出,模型擬合結(jié)果較好;通過進(jìn)一步考察表明,模型未受到多重共線性的干擾,同時(shí)模型也不存在空間自相關(guān)問題。下面利用White檢驗(yàn)法來檢驗(yàn)該模型是否存在異方差,檢驗(yàn)思路是:同時(shí)使用F檢驗(yàn)和LM檢驗(yàn)對前文所構(gòu)造的四類輔助回歸模型進(jìn)行檢驗(yàn),以比較彼此間在過程上和結(jié)果上的差異。
首先利用輔助回歸模型式(2)進(jìn)行異方差檢驗(yàn)。輔助回歸模型的估計(jì)結(jié)果為:
可以看出,無論是LM檢驗(yàn)還是F檢驗(yàn),都拒絕了同方差的假定。
再利用輔助回歸模型式(3)進(jìn)行檢驗(yàn),其估計(jì)結(jié)果為:
估計(jì)結(jié)果式(8)也得到了拒絕同方差假定的結(jié)論。值得注意的一點(diǎn)是,式(8)的整體擬合效果優(yōu)于式(7),這說明在樣本容量不是充分大的條件下,剔除輔助回歸模型的交叉乘積項(xiàng)對于其估計(jì)結(jié)果來說是有利的。
輔助回歸模型式(4)的估計(jì)結(jié)果如下:
估計(jì)結(jié)果式(9)同樣表明原模型存在異方差。式(9)整體上非常顯著,這由LM及F統(tǒng)計(jì)量即可看出,但也應(yīng)注意到,對于單個(gè)參數(shù)的估計(jì)結(jié)果,t檢驗(yàn)是不顯著的。
利用輔助回歸模型式(5)對原回歸模型作異方差檢驗(yàn),根據(jù)其回歸系數(shù)的t檢驗(yàn)結(jié)果得知,原模型存在異方差。式(5)的估計(jì)結(jié)果如下:
各類檢驗(yàn)結(jié)果均表明,原模型存在異方差問題,可以使用加權(quán)最小二乘法對其加以解決。首先需要構(gòu)建權(quán)重。按前文表述,可以依據(jù)輔助回歸模型式(2)的估計(jì)結(jié)果來構(gòu)造權(quán)重的表達(dá)式。通過估計(jì)結(jié)果式(7)可以看出,隨機(jī)項(xiàng)的方差(由式(6)的殘差的平方來表示)的變動主要和PIi、PI2i有關(guān),因此可構(gòu)建如下回歸模型:
式(11)擬合效果較好。^e2i是PIi和PI2i的線性組合,可以用它的倒數(shù)1/^e2i作為所估計(jì)的權(quán)重。為了保證權(quán)重的非負(fù)性,可以在運(yùn)算過程中取其絕對值。用式(11)所得到的權(quán)重1/^e2i對原模型進(jìn)行加權(quán)最小二乘估計(jì),估計(jì)結(jié)果如下:
模型各項(xiàng)統(tǒng)計(jì)檢驗(yàn)均通過,擬合效果較好。該模型的殘差和殘差的平方變動都較為平穩(wěn),對此模型進(jìn)行異方差檢驗(yàn)發(fā)現(xiàn)沒有異方差問題。因此,以為權(quán)重的加權(quán)最小二乘法很好地解決了異方差的問題。
筆者也試著根據(jù)輔助回歸模型式(4)(其估計(jì)結(jié)果為式(9))構(gòu)建權(quán)重,對原模型進(jìn)行加權(quán)最小二乘估計(jì),但得到的估計(jì)結(jié)果不甚理想。
異方差White檢驗(yàn)的思想和使用過程均不復(fù)雜,在現(xiàn)實(shí)中可以靈活應(yīng)用。通過分析研究表明,異方差White檢驗(yàn)可以使用經(jīng)典的LM檢驗(yàn)方法,也可以借助于F檢驗(yàn)來完成,因?yàn)闄z驗(yàn)?zāi)繕?biāo)都是輔助回歸模型的整體顯著性;在White檢驗(yàn)中,可以根據(jù)不同的前提條件(例如樣本容量)和檢驗(yàn)?zāi)康模ɡ缡欠窨疾飚惙讲畹淖儎樱﹣順?gòu)造不同的輔助回歸模型,以滿足研究的需要,文中所討論的四類輔助回歸模型在不同的場合中都有各自的優(yōu)勢,使用時(shí)可以根據(jù)實(shí)際加以選擇;White檢驗(yàn)的一個(gè)顯著的優(yōu)點(diǎn)在于,可以利用輔助回歸模型探尋隨機(jī)項(xiàng)方差與解釋變量之間的關(guān)系,并據(jù)此構(gòu)造加權(quán)最小二乘法中的權(quán)重函數(shù),以有效解決存在異方差問題的線性回歸模型的參數(shù)估計(jì)問題。所有上述觀點(diǎn)均在文中最后的例證中得到了充分的論證和展示。
[1] Halbert White.A Heteroscedasticity-Consistent Covariance Matrix Estimator and a Direct Test of Heteroscedasticity[J].Econometrica,1980,48(5).
[2] Gujarati Damodar N.Basic Econometrics[M].Fourth ed.New York:McGraw-Hill,2004.
Some Application Problems of White Heteroscedasticity Test
LIU Minga,b
(a.School of Statistics;b.Gansu Economics &Development Quantitative Analysis Institute,Lanzhou University of Finance and Economics,Lanzhou 730020,China)
It is true that White test is usually done by LM test,but we also can use the F-test to replace the LM test in reality.It need to build an auxiliary regression model during the proceeding of White test,and it can take different forms in response to practical needs.It discusses four types of different auxiliary regression models in the paper,theoretical analysis showed that every of them has its own advantage.In finally we show a practical example to verify that the conclusions of the theoretical analysis,and show the flexibility of White test in application.
heteroscedasticity;White test;auxiliary regression models
book=45,ebook=92
O212
A
1007-3116(2012)06-0045-05
(責(zé)任編輯:崔國平)
2012-02-18
劉 明,男,安徽霍邱人,經(jīng)濟(jì)學(xué)碩士,講師,研究方向:統(tǒng)計(jì)理論與方法,經(jīng)濟(jì)計(jì)量分析。