李文斌,何幫強(qiáng)
(安徽工程大學(xué) 數(shù)理與金融學(xué)院,安徽 蕪湖 241000)
半?yún)?shù)變系數(shù)模型在近些年來(lái)被廣泛研究的模型,它一般可以簡(jiǎn)化為線性模型部分、線性模型等一系列退化情形的模型。半?yún)?shù)變系數(shù)模型與其他線性或者部分線性模型相比較,是一種更應(yīng)用多變的函數(shù)形式,同時(shí)還避免了相當(dāng)多的“維數(shù)禍根”問(wèn)題。研究考慮的是具有誤差變量(Errors-in-Variables,EV)半?yún)?shù)變系數(shù)部分線性的模型:
(1)
式中,響應(yīng)變量是Y;解釋變量是X、Z和U,其中X是p維隨機(jī)向量;Z是q維不可觀測(cè)隨機(jī)變量,U是1維隨機(jī)變量;β=(β1,β2,…,βp)τ是p維未知參數(shù)量;g(U)=(g1(U),g2(U),…,gq(U))τ是q維未知函數(shù)向量;ε是不可觀測(cè)的隨機(jī)誤差。
You等[1]研究了半?yún)?shù)變系數(shù)含EV的回歸模型的估計(jì),利用校正衰減方法提出修正的profile最小二乘法估計(jì)參數(shù)部分以及利用局部多項(xiàng)式的方法估計(jì)非參數(shù)部分。馮三營(yíng)等[2]研究了半?yún)?shù)變系數(shù)模型,考慮其中的非參數(shù)部分的解釋變量含有EV,并且構(gòu)建了參數(shù)的局部的糾偏經(jīng)驗(yàn)log似然比統(tǒng)計(jì)量。陳夏等[3]研究了半?yún)?shù)變系數(shù)部分線性EV模型,考慮的是參數(shù)部分解釋變量具有EV。本文考慮的是模型的非參數(shù)部分的解釋變量帶有EV的半?yún)?shù)變系數(shù)面板數(shù)據(jù)模型。在醫(yī)學(xué)、可靠性工程、金融保險(xiǎn)、環(huán)境科學(xué)和臨床的試驗(yàn)研究中經(jīng)常會(huì)遇到隨機(jī)刪失的情況。王啟華等[4-5]研究了隨機(jī)刪失的情況下半?yún)?shù)線性模型,考慮了其中的參數(shù)估計(jì)的漸進(jìn)特征與參數(shù)的經(jīng)驗(yàn)似然推斷。陳放等[6]研究了在右刪失的情況下,非線性回歸模型的經(jīng)驗(yàn)似然推斷。侯文等[7]研究了在刪失數(shù)據(jù)下,若干個(gè)半?yún)?shù)模型的經(jīng)驗(yàn)似然和懲罰經(jīng)驗(yàn)似然的推斷。劉強(qiáng)等[8]研究了隨機(jī)刪失發(fā)生在響應(yīng)變量中,部分線性EV模型的統(tǒng)計(jì)推斷,考慮構(gòu)建了其中的未知參數(shù)的經(jīng)驗(yàn)log似然比統(tǒng)計(jì)量。李蕓[9]分別研究了基于區(qū)間刪失數(shù)據(jù)下的變系數(shù)模型和部分線性模型的統(tǒng)計(jì)推斷。閆一冰等[10]研究了隨機(jī)右刪失發(fā)生在響應(yīng)變量中,部分線性測(cè)量誤差模型的統(tǒng)計(jì)推斷。類(lèi)似的研究還有許多,比如文獻(xiàn)[11-18]都是最新的研究成果。面板數(shù)據(jù)在現(xiàn)今生活中應(yīng)用非常廣泛,比如經(jīng)濟(jì)、金融、生物、工程和社會(huì)科學(xué)等領(lǐng)域,同時(shí)面板數(shù)據(jù)可以為研究人員提供更大規(guī)模的擴(kuò)展。在尋常的研究中收集的數(shù)據(jù)往往不能完全觀測(cè),面板數(shù)據(jù)更是由截面和時(shí)間序列融合在一起的數(shù)據(jù),因此研究刪失數(shù)據(jù)下的面板數(shù)據(jù)更具有實(shí)際意義。在刪失數(shù)據(jù)下參數(shù)估計(jì)量的漸近方差會(huì)非常復(fù)雜,所以本文將經(jīng)驗(yàn)似然應(yīng)用其中,既不需要估計(jì)方差,又使得統(tǒng)計(jì)推斷不會(huì)繁雜。因?yàn)橛袦y(cè)量誤差,所以研究對(duì)構(gòu)造的輔助隨機(jī)變量進(jìn)行了修正,并修正了由測(cè)量誤差引起的估計(jì)偏差。
本文研究了刪失數(shù)據(jù)下含有EV的半?yún)?shù)變系數(shù)面板數(shù)據(jù)模型的經(jīng)驗(yàn)似然推斷,構(gòu)建了關(guān)于未知參數(shù)的修正經(jīng)驗(yàn)log似然比統(tǒng)計(jì)量,在合適的條件下證明了所構(gòu)建的統(tǒng)計(jì)量趨近于χ2分布,所得到的結(jié)果可以用作構(gòu)建未知參數(shù)的置信域。
假設(shè)數(shù)據(jù){Yit,Xit,Zit,Uit,Wit,i=1,2,…,n;t=1,…,T}是來(lái)自{Y,X,Z,U,W}的一個(gè)獨(dú)立同分布的樣本,即有
(2)
式中,Zit是不可隨意觀測(cè)的隨機(jī)變量;Wit是可觀測(cè)到的隨機(jī)變量;εit、eit是與Zit互相獨(dú)立的,εit是隨機(jī)誤差,且E(εit)=0,E(eit)=0,var(εit)σ2<∞,var(eit)=Σe。
研究考慮的是刪失下的情況,當(dāng)響應(yīng)變量Y被刪失變量C隨機(jī)右刪失的時(shí)候,觀察到的是ζit、δit,而不是Yit,其中,
ζit=min{Yit,Cit},δit=I(Yit≤Cit),i=1,2,…,n;t=1,2,…,T,
式中,Cit是來(lái)自刪失變量C的樣本數(shù)據(jù),且假定{Yit,Xit,Zit,Tit,Wit}獨(dú)立。假設(shè)A(·)、B(·)分別作為響應(yīng)變量Yit與刪失變量Cit的分布,記
τA=inf{u:A(u)=1},τB=inf{u:B(u)=1},
現(xiàn)假定
τB≥τA,Yit≥0,Cit≥0,i=1,2,…,n;t=1,2,…,T。
由于Yit被隨機(jī)地刪失,通常情況下參數(shù)的估計(jì)方法不能被直接的應(yīng)用,原因是ζit與Yit擁有不一樣的數(shù)學(xué)期望,需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。當(dāng)B已知時(shí),定義
可以證明
采用Profile最小二乘估計(jì)的方法,假設(shè)有一個(gè)隨機(jī)的樣本{(Uit,Xit1,…,Xitp,Zit1,…,Zitq,Yit),i=1,…,n;t=1,…,T}來(lái)自于式(2)第一式。當(dāng)β給定時(shí),有
(3)
運(yùn)用局部多項(xiàng)式的方法對(duì)模型(3)中g(shù)(U)這個(gè)變系數(shù)函數(shù)進(jìn)行估計(jì),假如操作中沒(méi)有EV的情況,即Zit已知時(shí),那么Uit在u0的一個(gè)小鄰域內(nèi)時(shí),可以估計(jì)gj(Uit)為
(4)
記
YB=(Y11B,…,Y1TB,…,YnTB)τ,X=(X11,…,X1T,…,XnT)τ,ε=(ε11,…,ε1T,…,εnT)τ,
W=(W11,…,W1T,…,WnT)τ,ωu=diga(Kh(U11-u),…,Kh(U1T-u),…,Kh(UnT-u)),
則基于式(4)由廣義最小二乘法可得
(5)
因?yàn)閆it不可觀測(cè),可觀測(cè)到的是含有誤差擾動(dòng)項(xiàng)WitW,如果式(5)中直接操作Zit被Wit替代,則這里的估計(jì)不再被認(rèn)為是相合估計(jì),為了消定估計(jì)中是EV所導(dǎo)致的偏差,參考了Feng等[19]的方法,對(duì)式(5)進(jìn)行下面形式的局部修正得
(6)
這里的?表示的是克羅內(nèi)克乘積。
定義S=(Q1W1,…,QnWn),構(gòu)建的輔助隨機(jī)變量為
由于隨機(jī)刪失情況下的線性模型中參數(shù)估計(jì)量的趨近方差計(jì)算較為繁瑣,運(yùn)用近似于Owen[20]所提出的方法,可以得到經(jīng)驗(yàn)log似然比函數(shù)為
然而,B分布函數(shù)在實(shí)際中往往未知,這時(shí)采用Kaplan-Meier估計(jì)
其中,
(7)
從而該參數(shù)的log經(jīng)驗(yàn)似然比函數(shù)可以寫(xiě)為
(8)
由拉格朗日乘子法可得
(9)
為了下面內(nèi)容方便描述,引入一些記號(hào),
A?2=AAτ,Φ(U)=E(WXτ|U),Γ(U)=E(WWτ|U),
Σ1(β)=E[(X-Φτ(U)Γ-1(U)Z)(ε-eτg(U))]?2-E[Φτ(U)Γ-1(U)ΣeΓ-1(U)Φτ(U)ετε]+
E{Φτ(U)Γ-1(U)(eeτ-Σe)g(U)}?2。
Δ=E(XXτ)-E(Eτ(WXτ|U)E-1(WWτ|U)Eτ(WXτ|U)),
Σ(β)=Σ1(β)-Σ2(β)。
為了得到研究的結(jié)果,列出下列條件,以下約定對(duì)任何向量a,用‖a‖表示Euclidean模。
A1:隨機(jī)變量U具有有界支撐,其密度函數(shù)f(·)滿足Lipschitz連續(xù),且f(·)>0。
A2:{gj(·),j=1,2,…,q}在U∈Ω內(nèi)有二階連續(xù)導(dǎo)數(shù)。
A5:存在常數(shù)s>2使得E‖X1‖2s<∞,E‖Z1‖2s<∞,E‖e1‖2s<∞,E‖ε1‖2s<∞,對(duì)某個(gè)δ<2-s-1,當(dāng)n→∞時(shí),有n2δ-1h→∞。
設(shè)An表示A的Kaplan-Meier估計(jì),記
調(diào)整后的經(jīng)驗(yàn)似然函數(shù)定義為
Iα(β)是參數(shù)向量β的置信域,這里的置信域是在具有趨近置信水平1-α的情況下,而且還有P(β∈Iα(β))=α+o(1)。
為了下文敘述方便,令
并且以下假設(shè)中c表示常數(shù),在各處所取的取值不同。令
引理1 在條件A1~A5成立下,當(dāng)n→∞時(shí)有
式中,j,j1,j2=1,2,…,q,Γj1j2(U)是矩陣Γ(U)的第(j1,j2)元素。
證明類(lèi)似于文獻(xiàn)[21]中引理A2的證明。
引理2 在條件A1~A5成立下,有
證明類(lèi)似于文獻(xiàn)[22]中引理A2的證明。
引理3 在條件A1~A5成立下,當(dāng)n→∞時(shí)有
證明類(lèi)似于文獻(xiàn)[22]中引理A3的證明。
引理4 在條件A1~A5成立下,有
(10)
(11)
(12)
證明由泰勒展開(kāi),容易得到
首先證明,
由中心極限定理可得,
接下來(lái)可證
類(lèi)似于侯文[7]的引理4.4的證明,可知
由以上證明可知式(10)成立。
類(lèi)似于侯文[7]的引理4.7的證明,可得式(11)成立。
由引理1以及條件A5可得到
從而式(12)成立。
定理1的證明
然后由引理4得到
從而
再結(jié)合引理4,此定理可證。
定理2的證明:類(lèi)似于文獻(xiàn)[8]中定理2的證明可得。
近年來(lái)隨著社會(huì)經(jīng)濟(jì)的迅猛發(fā)展,科研的不斷深入,人們所收集到的面板數(shù)據(jù)越來(lái)越豐富,如何準(zhǔn)確地處理和分析這些數(shù)據(jù)是目前統(tǒng)計(jì)學(xué)者們面臨的一個(gè)大的研究課題。當(dāng)半?yún)?shù)變系數(shù)部分線性EV模型應(yīng)用在生存數(shù)據(jù)的分析時(shí)會(huì)面臨一些困難,因?yàn)樯鏀?shù)據(jù)通常情況下都會(huì)是刪失的。研究把經(jīng)驗(yàn)似然方法推廣到刪失下帶有EV的半?yún)?shù)變系數(shù)面板數(shù)據(jù)模型中,通過(guò)得到的統(tǒng)計(jì)量的趨近性質(zhì),說(shuō)明了經(jīng)驗(yàn)似然方法在刪失下帶有EV的半?yún)?shù)變系數(shù)面板數(shù)據(jù)模型中是有效的,為研究刪失下帶有EV的半?yún)?shù)變系數(shù)面板數(shù)據(jù)模型提供了一種方法與思路。