王緊杰,羅雙華
(西安工程大學(xué) 理學(xué)院,陜西 西安 710048)
數(shù)據(jù)缺失問題廣泛存在于經(jīng)濟(jì)學(xué)、金融學(xué)、醫(yī)學(xué)和生態(tài)學(xué)等領(lǐng)域中,人們經(jīng)常采用變系數(shù)模型或分位數(shù)回歸模型來研究此類問題[1-2].但是,對(duì)此問題采用變系數(shù)分位數(shù)回歸模型研究較少,由于變系數(shù)分位數(shù)回歸模型具有良好的性質(zhì),因而,研究缺失數(shù)據(jù)下的變系數(shù)分位數(shù)回歸模型不但具有重要的理論意義,而且也有很好的實(shí)際應(yīng)用價(jià)值.Hastie等[3]首次提出了變系數(shù)回歸模型,它比線性模型具有更強(qiáng)的適應(yīng)性和建模能力,同時(shí)變系數(shù)模型又避免了“維數(shù)禍根”問題.變系數(shù)分位數(shù)模型是經(jīng)典線性回歸模型的延伸.Zhao等[4]在不可忽略缺失數(shù)據(jù)下研究了分位數(shù)回歸模型的逆概率加權(quán)方法;Tang等[5]在缺失數(shù)據(jù)下研究了分位數(shù)和最小二乘回歸的估計(jì)和推斷;Jin等[6]在協(xié)變量缺失下討論了部分線性變系數(shù)模型的懲罰加權(quán)復(fù)合分位數(shù)回歸估計(jì);Wang[7]討論了變系數(shù)分位數(shù)回歸模型的系數(shù)估計(jì)和檢驗(yàn)方法.
在協(xié)變量隨機(jī)缺失的情形下,考慮變系數(shù)分位數(shù)回歸模型的廣義擬似然比檢驗(yàn)問題.首先,用Jackknife方法對(duì)變系數(shù)分位數(shù)回歸模型的系數(shù)進(jìn)行估計(jì).其次,構(gòu)造缺失數(shù)據(jù)下的廣義擬似然檢驗(yàn)統(tǒng)計(jì)量去檢驗(yàn)變系數(shù)分位數(shù)回歸模型的系數(shù)的形式.最后,在一定條件下證明了所構(gòu)造統(tǒng)計(jì)量的大樣本性質(zhì).
考慮變系數(shù)分位數(shù)回歸模型為
Y=Aτ(U)TX+ε
(1)
其中Y∈R是響應(yīng)變量,U∈Rd被稱為光滑的向量,ε和(X,U)相互獨(dú)立,Aτ(U)=(a0,τ(u),…,ap,τ(u))T是光滑系數(shù)函數(shù),考慮U是一維的情形.設(shè)(Yt,Tt,δtVt,Ut)是模型(1)中的一個(gè)隨機(jī)樣本,其中Xt=(Tt,δtVt)T,Yt,Tt和Ut可以完全被觀察到,Vt有部分缺失,若Vt缺失,則δt=0,否則δt=1.假設(shè)Vt是隨機(jī)缺失,則有
P(δt=1|Yt,Tt,Vt,Ut)=P(δt=1|Yt,Tt,Ut)=π(Zt),其中Zt=(Yt,Tt,Ut)T.
估計(jì)系數(shù)函數(shù)A(·)采用Jackknife方法局部線性擬合.假設(shè)A(U)具有連續(xù)二階導(dǎo)數(shù),對(duì)于Ut鄰域內(nèi)的Ui,應(yīng)用泰勒公式近似估計(jì)A(Ui),則有
A(Ui)≈a0+a1(Ui-Ut),
(2)
其中a0=A(Ut),a1=A′(Ut)是A(Ut)的一階導(dǎo)數(shù).Jackknife方法是在估計(jì)A(Ut)時(shí),使用除第t個(gè)觀測(cè)值以外的所有觀測(cè)值.則得到的局部線性加權(quán)損失函數(shù)為
(3)
檢驗(yàn)變系數(shù)是否具有某種特定的函數(shù)形式,等價(jià)于下面的假設(shè)檢驗(yàn)問題:
H01∶Aτ(u)=A0,τ(u)與Ha1∶Aτ(u)≠A0,τ(u),
(4)
其中A0,τ(u)是已知的函數(shù)向量.
按照Wang[7]完整數(shù)據(jù)下的廣義擬似然比檢驗(yàn)思想,構(gòu)造模型(1)的廣義擬似然比檢驗(yàn)統(tǒng)計(jì)量為
Tn1=(Ha1)-(H01),
式(4)中若A0,τ(u)是常數(shù)向量,等價(jià)于下面的假設(shè)檢驗(yàn)問題:
H02∶Aτ(u)=A0,τ與Ha2∶Aτ(u)≠A0,τ,
(5)
其中A0,τ是已知的常數(shù)向量,同理可得模型(1)的廣義擬似然比檢驗(yàn)統(tǒng)計(jì)量,其表達(dá)式為
Tn2=(Ha2)-(H02),
首先給出結(jié)論成立所需要的一組假設(shè)條件A.
(A1) 對(duì)任意給定的網(wǎng)格點(diǎn)u0,Aτ(u)=(a0,τ(u),…,ap,τ(u))′在u0鄰域內(nèi)連續(xù)兩次可微.
(A2)fu(u)連續(xù),且fu(u0)>0.
(A3)fy|u,x(y)有界且滿足Lipschitz條件.
(A4) 核函數(shù)K(·)是具有有界支撐的對(duì)稱概率密度函數(shù),是Lipschitz連續(xù)的.
(A7)Ω(u0),Ω*(u0)在u0的一個(gè)鄰域內(nèi)是正定、連續(xù)的.
(A8) 帶寬h滿足h→0,nh→∞且n1/2-δ/4hδ/δ*-1/2-δ/4=Ο(1).
(A10)E|ε|4<∞.
定理1 在A0,τ(u)是已知的函數(shù)向量下,假設(shè)條件A成立,當(dāng)H01為真時(shí),有
(6)
證明在A0,τ(u)是已知的函數(shù)向量下,當(dāng)H01成立時(shí),檢驗(yàn)統(tǒng)計(jì)量Tn1如下:
由于B2=E(B2)+(B2-EB2)=C1+C2,由大數(shù)定律可得C2=οp(1).
因?yàn)棣舤=Yt-A0(Ut)TXt,可得
因此檢驗(yàn)統(tǒng)計(jì)量Tn1如下:
其中ηt=τ-I(Yt-A0(Ut)TXt<0),由Wang[7]中的定理2.1和Cai等[8]中的結(jié)論可知
因此可得檢驗(yàn)統(tǒng)計(jì)量Tn1為
應(yīng)用Zhang[9]中的引理3.3.2,可得
所以
因此
Tn1+dn=Tn1+T2-T4-T5=T3+op(1)
通過應(yīng)用Peter[10]命題3.2可得
定理2 在A0,τ是已知的常數(shù)向量下,假設(shè)條件A成立,當(dāng)H02為真時(shí),有
(7)
證明在A0,τ是已知常數(shù)向量下,當(dāng)H02成立時(shí),檢驗(yàn)統(tǒng)計(jì)量Tn2為
其中A0為常數(shù)向量.
根據(jù)定理1中的推導(dǎo)可以把檢驗(yàn)統(tǒng)計(jì)量Tn2可化解為
由證明定理1推導(dǎo)過程中的結(jié)論有
因此可得Tn2服從漸近正態(tài)分布.