王江峰,裘良華
(1.杭州師范大學(xué)理學(xué)院,浙江杭州 310036;2.杭州師范大學(xué)錢江學(xué)院,浙江杭州 310012)
刪失相依數(shù)據(jù)下的分位數(shù)核估計(jì)的Bahadur型表達(dá)
王江峰1,裘良華2
(1.杭州師范大學(xué)理學(xué)院,浙江杭州 310036;2.杭州師范大學(xué)錢江學(xué)院,浙江杭州 310012)
該文考慮了在刪失相依數(shù)據(jù)下分位數(shù)函數(shù)的核估計(jì).在適當(dāng)條件下,建立了該估計(jì)的弱和強(qiáng)Bahadur型表達(dá)形式.作為它的應(yīng)用,導(dǎo)出了該估計(jì)的漸近正態(tài)性.通過模擬給出了該估計(jì)在有限樣本下的表現(xiàn).
漸近正態(tài)性;Bahadur型表達(dá);刪失數(shù)據(jù);α-混合序列;分位數(shù)函數(shù).
X1,X2,…和T1,T2,…是兩個(gè)相互獨(dú)立的非負(fù)隨機(jī)變量序列,分布函數(shù)分別為F和G,這里{Xi,i≥1}和{Ti,i≥1}都是相依的隨機(jī)變量序列.設(shè)Zi=min(Xi,Ti)=Xi∧Ti和δi=I(Xi≤Ti),這里I(·)表示示性函數(shù).在刪失模型中,僅僅能觀察到數(shù)據(jù)(Z1,δ1),…,(Zn,δn).顯然,Zi的分布函數(shù)
H(x)=1-(1-F(x))(1-G(x)).令=1-H和.在區(qū)間[0,∞)上定義兩個(gè)隨機(jī)過程如下:
這樣分布函數(shù)F的Kaplan-Meier(KM)估計(jì)為
這里dNn(s)=Nn(s)-Nn(s-),Nn(s-)為Nn在s上的左極限.接下來,筆者給出分布函數(shù)F的p分位數(shù)的定義:Q(p)≡F-1(p)=inf{t:F(t)≥p},0≤p≤1.這樣根據(jù)分布函數(shù)F的KM估計(jì)得到F的p分位數(shù)估計(jì)為
當(dāng)(Xi)i≥1和(Ti)i≥1為獨(dú)立同分布且相互獨(dú)立時(shí),Cs?rg?[1]和Cheng[2]在刪失模型下得到了(p)的一些漸近結(jié)果.Ould-sa?d和Sadki[3]在強(qiáng)混合條件下得到了(p)的Badadur型表達(dá)式.由于Q(p)為連續(xù)函數(shù),因此用一個(gè)光滑估計(jì)比(p)更適用.Padgett[4]基于(p)上提出了Q(p)的一個(gè)核估計(jì)如下:
這里k(·)為核函數(shù),hn為窗寬滿足hn→0(n→∞).在刪失獨(dú)立樣本下,估計(jì)Qn(p)的性質(zhì)有一些作者進(jìn)行研究,可以參考Lio等人[5]和Lio和Padgett[6].
據(jù)知,還沒有人在刪失相依數(shù)據(jù)下來研究Qn(p)的性質(zhì).該論文主要目的在刪失相依數(shù)據(jù)下建立Qn(p)弱和強(qiáng)Bahadur型表達(dá)式,作為應(yīng)用得到了Qn(p)的漸近正態(tài)性結(jié)果,并對(duì)估計(jì)進(jìn)行模擬研究.
定義1 {ξk,k≥1}稱為α-混合序列,若當(dāng)n→∞,
這樣,有E[ξ(Zi,δi,x)]=0和Cov(ξ(Zi,δi,s),ξ(Zi,δi,t))=g(s∧t).設(shè)C為任意正數(shù),在不同的地方可以表示不同的值.an=O(bn)表示an≤Cbn.
為了得到結(jié)果,先給出一些條件:
(A1)(Xi)i≥1為平穩(wěn)的α-混合序列,具有連續(xù)的分布函數(shù)F和混合系數(shù)α1(n).
(A2)(Ti)i≥1i為平穩(wěn)的α-混合序列,具有連續(xù)的分布函數(shù)G和混合系數(shù)α2(n).
(A4)核函數(shù)k(·)為概率密度函數(shù)且在[-1,1]上緊支撐和∫tk(t)dt=0.
(A5)F為L(zhǎng)ipschitz連續(xù)的且密度函數(shù)為f.
(A6)對(duì)0<p<1,f(x)在x=Q(p)上連續(xù),并且有f(Q(p))>0和Q(p)<τH.
(A7)對(duì)0<p<1,F(xiàn)(x)在x=Q(p)上具有連續(xù)的二階導(dǎo)數(shù).
注1 (A1)-(A7)都是一般性的條件.(A1)-(A3)和(A5)-(A7)在文獻(xiàn)[3]中用到了.條件(A4)在文獻(xiàn)[8]中應(yīng)用到了.
注2 注意到以上條件不需要{Ti}是獨(dú)立的,獨(dú)立條件在文獻(xiàn)[9]和[10]中應(yīng)用到了.在他們的文獻(xiàn)中,{Xi}的混合系數(shù)為a1(n)=O(n-ν)(ν>3),比條件(A3)要弱.但通過文獻(xiàn)[11]的引理2知道,當(dāng){Xi}和{Ti}都為α-混合序列時(shí),得到{Zi}仍然是α-混合序列且混合系數(shù)為4α(n),這樣{Zi}滿足文獻(xiàn)[12]中定理3的條件.由于文獻(xiàn)[9]中的結(jié)果和[10]中定理1的結(jié)果是通過文獻(xiàn)[12]中的定理3證明過來的,因此他們的結(jié)果在以上條件下也是成立的.
下面先給出分位數(shù)Q(p)的核估計(jì)Qn(p)的弱Bahadur型表達(dá)式:
作為定理1的應(yīng)用,可以通過文獻(xiàn)[9]的定理5得到Qn(p)的漸近正態(tài)性:
推論1 在定理1的假設(shè)條件下,有
最后,給出Qn(p)的強(qiáng)Bahadur型表達(dá)式.
這里λ>0.
在這一節(jié),給出模擬來完成兩件事情,首先,通過偏移和均方誤差來比較估計(jì)Qn(p)和(p);其次,給出估計(jì)Qn(p)在p=0.5的漸近正態(tài)性的效果.
模擬X1~N(0,1/0.84),Xi=0.4Xi-1+ei,這里ei~N(0,0.82).模擬T1~N(0,1/0.75),Ti=0.5Ti-1+ei.這樣,Xi和Ti為α-混合序列,且混合系數(shù)都是以指數(shù)衰退的速度趨向零,并且它們的分布分別為N(0,1/0.84)和N(0,1/0.75).顯然這時(shí)刪失比例為50%.
表1 Qn(p)和(p)的偏移和均方誤差Tab.1 The bias and mean squared errors for Qn(p)and(p)
表1 Qn(p)和(p)的偏移和均方誤差Tab.1 The bias and mean squared errors for Qn(p)and(p)
pn偏移Qn(p) Q^n(p)均方誤差Qn(p) Q^n(p)0.25 300 0.038 7 0.064 9 1.023×10-3 3.376×10-3 800 0.014 3 0.044 1 8.566×10-4 1.409×10-3 0.5 300 0.029 8 0.031 9 1.139×10-3 1.687×10-3 800 0.009 3 0.021 3 5.077×10-4 9.987×10-4 0.75 300 0.046 5 0.051 0 3.309×10-3 5.998×10-3 800 0.025 5 0.031 4 1.678×10-3 1.987×10-3
從表1發(fā)現(xiàn):(i)這兩個(gè)估計(jì)都是隨著樣本容量n增大,效果越好.(ii)核估計(jì)Qn(p)模擬的效果比估計(jì)(p)好.接下來,通過直方圖和正態(tài)概率圖來模擬估計(jì)Qn(p)在p=0.5的漸近正態(tài)性.在樣本容量為n下獨(dú)立地模擬了M=1000個(gè)數(shù)據(jù),選擇窗寬hn=n-1/3.在圖1和2中,分別選取n=200和800.從圖1和圖2看出樣本容量n越大,模擬的效果越好.
為了證明以下結(jié)果,需要一些注記和引理.
引理1 如果(A1)-(A3)和(A5)-(A6)滿足,則
圖1 在n=200下Qn(p)的直方圖和正態(tài)概率圖Fig.1 Histogram and Normal-probability-polt of Qn(p)with n=200
圖2 在n=800下Qn(p)的直方圖和正態(tài)概率圖Fig.2 Histogram and Normal-probability-plot of Qn(p)with n=800
證明 設(shè)In=[p-h(huán)n,p+hn]and 0<p0≤p1<1.由文獻(xiàn)[3]中的定理2.1和文獻(xiàn)[10]中的定理1,得到
這里B(x,n)為文獻(xiàn)[10]中的定理1所示.類似地,也可以證明
[1]Cs?rg?M.Quantile processes with statistical applications[C]//CBMS-NSF Regional Conference Series in Applied Mathematics,No.42,Philadelphia,1983.
[2]Cheng Kuangfu.On almost sure representation for quantiles of the product-limit estimator with applications[J].Sankhyà,1984,46:426-443.
[3]Ould-sa?d E,Sadki O.Strong approximation of quantile function for strong mixing censored processes[J].Comm Statist Theory Methods,2005,34:1449-1459.
[4]Padgett W J.A kernel-type estimator of a quantile function from right-censored data[J].J Amer Statist Association,1986,81:215-222.
[5]Lio Y L,Padgett W J,Yu K F.On the asymptotic properties of a kernel-type quantile estimator from censored samples[J].J Statist Plann Inference,1986,14:169-177.
[6]Lio Y L,Padgett W J.Asymptotically optimal bandwidth for a smooth nonparametric quantile estimator under censoring[J].J.Nonparametr.Stat,1992(1):219-229.
[7]Doukhan P.Mixing:Properties and Examples[M].New York:Springer-verlag,1994.
[8]Xiang Xiaojing.Bahadur representation of the kernel quantile estimator under random censorship[J].J.Multivariate Anal,1995,54:193-209.
[9]Cai Zongwu.Asymptotic properties of Kaplan-Meier estimator for censored dependent data[J].Statist Probab Lett,1998,37:381-389.
[10]Fakoor V,Jomhoori S,Azarnoosh H.Asymptotic expansion for ISE of kernel density estimators under censored dependent model[J].Statist Probab Lett,2009,79:1809-1817.
[11]Cai Zongwu.Estimating a distribution function for censored time series data[J].J Multivar Analysis,2001,78:299-318.
[12]Dhompongsa S.A note on the almost sure approximation of the empirical process of weakly dependent random variables[J].Yokohama Math J,1984,32:113-121.
Abstract:asymptotic normality;Bahadur-type representation;censored data;α-mixing;quantile function.
Bahadur Type Representation for the Kernel Quantile Estimation of Quantile Funtion with Censored Dependent Data
WANG Jiang-feng1,QIU Liang-h(huán)ua2
(1.College of Science,Hangzhou Normal University,Hangzhou 310036,China;
2.Qianjiang College,Hangzhou Normal University,Hangzhou 310012,China)
This paper considered the kerne estimation of the quantile function wtih censored dependent data.Under appropriate assumptions,the paper established the weak and strong Bahadur-type representations for the kernel estimation,derivd the asymptotic normality of the estimation and provided the representation of the estimation in firute samples via simulation
O211.4 MSC2010:60F15
A
1674-232X(2011)05-0385-08
10.3969/j.issn.1674-232X.2011.05.001
2011-04-23
國(guó)家自然科學(xué)基金項(xiàng)目(11001070);浙江省教育廳科研基金項(xiàng)目(Y200906404).
王江峰(1978—),男,江西南昌人,講師,博士,主要從事統(tǒng)計(jì)推斷方面研究.E-mail:wjf2929@163.com
杭州師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2011年5期