劉 超,桂風(fēng)云
(1.北京航空航天大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,北京100191;2.中央民族大學(xué) 理學(xué)院,北京100081)
時空數(shù)據(jù)分析在統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域受到越來越多的關(guān)注。時空數(shù)據(jù)不同于一般的截面數(shù)據(jù)和時間序列數(shù)據(jù),同時具有空間和時間上的特性。社會科學(xué)領(lǐng)域常用的時空數(shù)據(jù)模型為空間面板數(shù)據(jù)模型,有關(guān)時空數(shù)據(jù)模型的介紹可參考Anselin(1988)[1]和Elhors(t2014)[2]。
實(shí)際問題分析中,因變量和自變量之間的關(guān)系往往會隨著空間和時間的改變而發(fā)生變化,這就是時空異質(zhì)性。傳統(tǒng)的空間面板數(shù)據(jù)模型一般都是單獨(dú)考慮空間異質(zhì)性和時間異質(zhì)性,將二者同時考慮的模型還很少見,其中桂風(fēng)云和魏傳華(2016)[3]將地理加權(quán)回歸技術(shù)用于空間似乎不相關(guān)模型,提出了地理加權(quán)似乎不相關(guān)模型,Wei等(2017)[4]進(jìn)一步研究了該模型的估計(jì)問題。這一新模型適合空間觀測點(diǎn)個數(shù)較多,時間觀測點(diǎn)較少的傳統(tǒng)空間面板數(shù)據(jù),利用地理加權(quán)回歸技術(shù)刻畫空間異質(zhì)性,利用似乎不相關(guān)結(jié)構(gòu)刻畫時間異質(zhì)性。該模型在結(jié)構(gòu)上是一類空間變系數(shù)似乎不相關(guān)模型,假設(shè)了不同時刻的回歸系數(shù)都是隨著空間位置變化而變化的。然而實(shí)際問題中,更為一般的情形是有一部分回歸系數(shù)會隨著地理位置的變化而變化,而另一部分系數(shù)不隨地理位置的改變而改變?;谶@一考慮,本文提出一類混合地理加權(quán)似乎不相關(guān)模型(簡稱MGW-SUR模型),并研究該模型的估計(jì)問題。
在桂風(fēng)云和魏傳華(2016)[3]的基礎(chǔ)上,考慮如下的混合地理加權(quán)似乎不相關(guān)模型
其中Yti和Xti=(xti1,xti2,…,xtip)T,Zti=(zti1,zti2,…,分別為i觀測點(diǎn)t時刻的因變量與自變量觀測值,和分 別為未知的常值系數(shù)向量和系數(shù)函數(shù)向量。模型(1)可記為如下矩陣形式:
其中:
顯然,該模型是由m個混合地理加權(quán)回歸模型組成的,這m個模型通過如下模型誤差之間的相關(guān)性建立聯(lián)系:
其中Ω是模型誤差項(xiàng)的協(xié)方差矩陣;Σ是同一觀測點(diǎn)上誤差項(xiàng)的協(xié)方差矩陣。
MGW-SUR模型(2)和模型(3)將混合地理加權(quán)回歸模型和似乎不相關(guān)模型相結(jié)合,能夠同時刻畫時空數(shù)據(jù)的時間異質(zhì)性和空間異質(zhì)性,是普通的空間似乎不相關(guān)模型和地理加權(quán)似乎不相關(guān)模型的推廣。
混合地理加權(quán)似乎不相關(guān)模型中既有隨著地理位置變化而變化的非參數(shù)系數(shù)函數(shù),也有常值系數(shù)。同其他類型的半?yún)?shù)模型一樣,重點(diǎn)關(guān)注常值系數(shù)的估計(jì)。對于普通的線性似乎不相關(guān)模型,眾所周知,如果不考慮模型之間的相關(guān)性,那么多個子模型的聯(lián)合估計(jì)等價于子模型的單獨(dú)估計(jì),而將模型的相關(guān)性考慮進(jìn)去構(gòu)造的廣義最小二乘估計(jì)更有效。對于本文所提的MGW-SUR模型,將給出兩種估計(jì)方法,分別對應(yīng)不考慮子模型之間的相關(guān)性和考慮這種相關(guān)性。
如果不考慮子模型之間的相關(guān)性,那么本文將分別對子模型進(jìn)行單獨(dú)估計(jì)。此時子模型就是一個普通的混合地理加權(quán)回歸模型。本文采用基于局部線性光滑方法的兩步估計(jì)法(profile最小二乘法)對模型進(jìn)行估計(jì)。時間點(diǎn)t處對應(yīng)的子模型為:
首先,假定常系數(shù)αt已知,則模型(4)可以寫成:
顯然,模型(5)是標(biāo)準(zhǔn)的地理加權(quán)回歸模型,基于Wang等(2008)[5]局部線性光滑方法,可得βt(ui,vi)的估計(jì)為:
將式(6)代入原模型(4)中,可以得到下面的模型:
其中:
其中wti(u0,v0)作為一個權(quán)函數(shù)值表示t時間點(diǎn)上第i組因變量和自變量觀測值Xti,yti對估計(jì)(u0,v0)處的系數(shù)函數(shù)所起的重要性。同桂風(fēng)云和魏傳華(2016)[3],本文設(shè)置為:
其中d0j表示空間位置(u0,v0)和(uj,vj)之間的距離,ht>0稱為光滑參數(shù),可以用交叉證實(shí)法來選取,詳細(xì)介紹可參考Fotheringham等(2003)[6]。
采用普通最小二乘估計(jì)法來估計(jì)(7),可以得到常值系數(shù)αt的估計(jì)是:
從而變系數(shù)函數(shù)的估計(jì)為:
進(jìn)而得到Y(jié)t的擬合值:
從而模型擬合為:
其中:
上文的普通估計(jì)沒有考慮子模型之間的相關(guān)性,為了構(gòu)造更為有效的提高估計(jì),本文提出一類廣義兩步估計(jì)。先假設(shè)常值系數(shù)已知,則模型可以轉(zhuǎn)化為標(biāo)準(zhǔn)的地理加權(quán)似乎不相關(guān)模型:
其中:
由Wei等(2017)[4],的有效估計(jì)定義為:
其中,Ω由式(3)定義。
由廣義最小二乘估計(jì)法可以得到常值系數(shù)的估計(jì):
相應(yīng)的變系數(shù)函數(shù)的估計(jì)為:
進(jìn)而得到因變量擬合結(jié)果:
其中:
針對MGW-SUR模型的廣義局部線性加權(quán)最小二乘兩步估計(jì),有如下性質(zhì):
定理1:常值系數(shù)的廣義局部加權(quán)最小二乘估計(jì)量的期望和方差分別為:
本文通過數(shù)值模擬來驗(yàn)證所提的兩種估計(jì)方法的有效性。模擬實(shí)驗(yàn)中,空間位置的選取是通過二維格子空間來定義的,在每個m×m個格子點(diǎn)上取觀測值,觀測點(diǎn)之間的距離可以通過格子空間的橫、縱坐標(biāo)來求得。在平面直角坐標(biāo)系中,這n=m2個點(diǎn)的坐標(biāo)定義為:
假設(shè)數(shù)據(jù)來自下面的模型:
其中自變量的取值為x1i~U(- 1,1),x2i~N(0 ,1),z1i~U(0 ,1),z2i~N(1 ,1),常值系數(shù)為α1=2,α2=3,系數(shù)函數(shù)分別為:
誤差之間的相關(guān)性滿足:
權(quán)函數(shù)采用下面的形式:
為簡化計(jì)算過程,實(shí)際操作中假設(shè)不同時間點(diǎn)對應(yīng)的窗寬ht=h是相同的,通過交叉驗(yàn)證(CV)進(jìn)行選擇。誤差相關(guān)系數(shù)分別取r=0.5,0.8兩種情況,樣本數(shù)量n=m2,其中m=7,13兩種情況,對每種情況重復(fù)實(shí)驗(yàn)1000次。
本文重點(diǎn)關(guān)注常值系數(shù)的表現(xiàn),利用1000次重復(fù)中得到的估計(jì)量的均值(Mean)、標(biāo)準(zhǔn)差(SD)和估計(jì)均方誤差來考察其表現(xiàn),其中估計(jì)均方誤差(EMSE)定義為:
其中表示第j次重復(fù)時得到的估計(jì)值。
模擬實(shí)驗(yàn)結(jié)果如表1所示??梢钥闯?,隨著樣本量的增加,兩種估計(jì)的效果都越來越好。并且隨著誤差相關(guān)性的增加,廣義最小二乘估計(jì)比普通最小二乘估計(jì)表現(xiàn)更好。
表1 混合地理加權(quán)似乎不相關(guān)模型兩種估計(jì)的實(shí)驗(yàn)?zāi)M結(jié)果
本文研究了一種能夠同時刻畫時空數(shù)據(jù)的時間異質(zhì)性和空間異質(zhì)性的混合地理加權(quán)似乎不相關(guān)回歸模型,并且研究了模型的兩種估計(jì)方法:一是不考慮模型誤差相關(guān)性的普通局部線性加權(quán)最小二乘兩步估計(jì),二是考慮模型誤差相關(guān)性的廣義局部線性加權(quán)最小二乘兩步估計(jì)。本文重點(diǎn)研究了所提模型的估計(jì)問題,關(guān)于MGW-SUR模型的統(tǒng)計(jì)檢驗(yàn),以及模型在實(shí)際應(yīng)用中的表現(xiàn)都還有待進(jìn)一步研究。