董 凱,秦永松,鄧 裕
(1.浙江師范大學 數(shù)理與信息工程學院,浙江 金華 321004;2.廣西師范大學 數(shù)學與統(tǒng)計學院,廣西 桂林 541004)
[數(shù)理科學與信息科學研究]
α混合樣本下含附加信息時概率密度的經(jīng)驗似然置信區(qū)間
董凱1,秦永松2,鄧裕1
(1.浙江師范大學 數(shù)理與信息工程學院,浙江 金華 321004;2.廣西師范大學 數(shù)學與統(tǒng)計學院,廣西 桂林541004)
利用分塊技術證明了α混合樣本下含附加信息時概率密度函數(shù)的經(jīng)驗似然比統(tǒng)計量的漸近分布是分布,由此得到了概率密度函數(shù)的經(jīng)驗似然置信區(qū)間。
α混合樣本;附加信息;經(jīng)驗似然;卡方分布;置信區(qū)間
首先給出α混合樣本的定義。
定義1設{ηi,i≥1}為實值隨機變量序列,是由隨機變量序列{ηi,s≤i≤t}產(chǎn)生的σ代數(shù),若當n→∞時,
則稱隨機變量序列{ηi,i≥1}為α混合,其中α(n)被稱為α混合系數(shù)。
Owen[1-2]在1988年最先提出用經(jīng)驗似然方法構建置信區(qū)間。Owen[1]主要提出經(jīng)驗似然方法可以用于構建M函數(shù)的置信區(qū)間,Chen[3]發(fā)展了經(jīng)驗似然方法用于構建概率密度函數(shù) f(x)的置信區(qū)間,Zhang[4]在特定的情形下證明了用經(jīng)驗似然方法可以有效地處理附加信息;但他們的研究都是針對獨立樣本情形。在α混合樣本情形,趙翌和楊善朝[5]研究了核密度估計的漸近分布,主要結論可以構建 f(x)的漸近正態(tài)置信區(qū)間,但不能構建 f(x)的經(jīng)驗似然置信區(qū)間;Lei and Qin[6]研究了α混合樣本下不含附加信息時概率密度函數(shù)的經(jīng)驗似然置信區(qū)間,然而卻未見含附加信息時 f(x)的經(jīng)驗似然置信區(qū)間。故本文將用經(jīng)驗似然方法討論含附加信息時 f(x)的置信區(qū)間的構造。
設X1,X2,…,Xn(n≥2)是來自總體X的同分布α混合樣本,那么 f(x)在已給定的任意點x的核密度估計如下
其中K(·)為核密度,0<h=hn→0為窗寬。
假設存在r(r≥1)個已知函數(shù)g1(x),g2(x),…,gr(x)(gi(x)∈R,i=1,2,…,r),使得
其中 g(x)=(g1(x),g2(x),…,gr(x)τ是一個r維向量。下面將在附加信息式(1)下給出 f(x)的置信區(qū)間。
為簡便起見,可設 Kh(u)=K(u/h)對任意u∈R。本文希望得到概率密度函數(shù)θ0=f(x)在任意給定點x(x∈R)的經(jīng)驗似然置信區(qū)間。與文獻[3]提出的方法類似,可得得分函數(shù)為
記 e(Xi,θ0)=ei(θ0),并運用分塊技術將函數(shù)g(Xi),ei(θ0)分成大塊(含 p個數(shù)據(jù))和小塊(含q個數(shù)據(jù))。取 p=p(n),q=q(n)是正整數(shù),且滿足p+q≤n。設k=[n/(p+q)](其中[t]表示對t取整),
rm=(m-1)(p+q)+1,
lm=(m-1)(p+q)+p+1,m=1,2,…,k,
那么可將函數(shù)g(Xi),ei(θ0)分塊如下
考慮如下分塊經(jīng)驗似然函數(shù)
那么由Lagrange乘子法求L(θ0)在約束條件下的最大值
其中
下面再次考慮如下分塊經(jīng)驗似然函數(shù)
其中
λ1∈Rr由下式確定
為簡化連乘,則當含附加信息式(1)關于θ0的分塊似然比統(tǒng)計量取-2log后為
為了得到?(θ0)的漸近分布,首先給出如下假設條件:
(A1)1)隨機變量序列X1,X2,…,Xn為嚴平穩(wěn)序列,f(·)是該序列對于Language測度的一維邊緣密度函數(shù)。
2){Xi,1≤i≤n}是混合系數(shù)α(·)的α混合隨機樣本序列,并且存在δ>0以及正常數(shù)δ1,τ0,對于δ1<δ/2,τ0>3(δ+4)(2+δ1)/{2(δ-2δ1)},α混合系數(shù)都滿足α(m)≤Cm-τ0,m≥1。
3)隨機變量X1,Xj+1的聯(lián)合概率密度函數(shù) f1,j存在且滿足
其中C表示與n無關的常數(shù)。
4)f(·)在x的領域內有連續(xù)的r0(r0≥2)階導數(shù),f(x)>0。
5)對任意u,f1|j(v|u)作為v的函數(shù)在x點連續(xù),其中 f1|j(v|u)表示當X1已給定時Xj(j>1)的條件密度函數(shù)。
(A2)1)核函數(shù)K(u)有界,有緊支撐且滿足
其中r0見(A1)4)。
2)(dK/du)(u)=K'(u)存在且|K'(u)|≤C,u∈R。
p,q,k和h如上所述,且滿足下述條件:
(A4)函數(shù)g是實值函數(shù),滿足
1)(dg/du)(u)=g'(u)存在且|g'(u)|≤C,u∈R。
2)Egj(X)=0,E|gj(X)|(4+δ)<∞,Σg>0,其中
注1假設條件和下文中所有的極限都是在n→∞的條件下取得的。
注2若假設條件(A1)2)成立,取
其中0<ξ2<ξ1<(4+δ)/{2(5+δ)},那么對假設條件(A3)1)-(A3)3)滿足;并且注意到k≤np-1,α(m)≤Cm-τ0。若ξ1+τ0ξ2>1,假設條件(A3)4)成立。
注3由q/p→0,kp/n→1,可得kq/n→0。
由q/p→0,u(p)→0可得u(q)→0。
下面給出本文的主要結果。
定理1若假設條件(A1)-(A4)滿足,則對任意常數(shù)c1,有
其中
為了證明主要結論,首先要證明一些引理。為簡便起見,本文用C表示一個與n無關且充分大的正整數(shù)。另外,如果對任意常數(shù)s≥1和隨機變量ξ,滿足,則記。
引理1[7]設{ηi,i≥1}為α混合隨機變量序列,是由隨機變量序列{ηi,s≤i≤t}產(chǎn)生的σ代數(shù),若ξ和η分別是和上可測的隨機變量,且||ξ||p1<∞,||η||p1<∞,其中p1,q1>1,,則有
若ξ和η都是有界的隨機變量,則有
證明參見文獻[7]的引理1。
引理2[8]設{ηi,i≥1}為α混合隨機變量序列,是由隨機變量序列{ηi,s≤i≤t}產(chǎn)生的σ代數(shù),若{ξi,1≤i≤n}分別在,…,上是可測的,其中1≤i1<j1<i2<…<in<jn,il+1-jl≥m,且|ξl|≤1,l=1,2,…,n,則有
證明參見文獻[8]的引理1。
引理3[9]設2<p0<r0<∞,{ηi,i≥1}為α混合隨機變量序列且滿足E(ηi)=0,E|ηi|r0<∞。若存在C>0和θ>p0r0/{2(r0-p0)},使得α(n)≤Cn-θ,則有
引理4若假設條件(A1)-(A4)滿足,則對任意常數(shù)c1,當θn=θ0+(nh)-1/2c1時,
其中
結合多維隨機變量的方差的定義和式(9)-(11)知式(6)成立。
(iii)接下來證明式(7)。顯然式(7)等價于
只需證明
其中Q(Xi)=W(Xi,θn)-E(W(Xi,θn)。
下面先證明式(12),因為
再結合附加信息式(1)可得式(12)成立。
接下來證明式(13)。記
要證式(13),只需證明對任意a∈Rr+1,且||a||=1,有
aτLn可被分解為
其中
那么只需證明
另外,作為證明式(14)的準備工作,還需證明
注意到
那么由假設條件(A3),引理1和式(6),取引理1中的p0,q0分別為p0=q0=4+δ,可得
另一方面,由平穩(wěn)性,引理1和式(6)。類比文獻中引理3的證明,可得
因此式(17)成立。
最后證明式(14),由引理2可知
假設{ξm,m=1,2,…,k}是與aτΣ-1/2nenm分布相同的獨立隨機變量序列,取引理3中的 p0,r0為p0=3,r0=4+δ,由引理3可得
由式(24)和(25)可得式(14)成立。再由式(14)-(16)可得式(7)成立。
(iv)最后證明式(8)。只需證明
為證式(26),需先證明對任意‖a∈Rr+1,‖a‖=1有
式(28)-(30)的證明過程和本文式(15)-(17)的證明過程類似,在此不再次證明。由式(28)-(30)可得式(27)成立。
接下來證明式(31)。
為證明式(31),則需要證明,對給定的0<δ1<δ/2,都有
這樣取δ2是因為:
則在證明式(32)過程中就可運用假設條件(A1)2)和引理3。由引理3可得
再次運用引理3,取 p0=4+2δ1+2δ2,r0=4+δ,則有
于是式(32)成立。由式(32)可知式(31)成立。再由式(27)和(31),有
其中bs表示Rr+1中第s個標準坐標,1≤s≤r+1,則由式(33)可得
因此,式(8)成立。
引理5設假設條件A(1)—A(4)滿足,則
證明:設λ(θn)=ρ1a,Zn=max1≤i≤2k+1|aτψni(θn)|,其中||a||=1,那么由式(2)可得
所以
則由引理4可知λ(θn)=Op(n-1/2)。事實上,令γi=λτ(θn)ψni(θn),則
再次運用式(2),可得
引理5得證。
引理6當假設條件(A1)1),(A1)2),(A3),(A4)滿足,則
證明可參見本文引理4和引理5。
引理7[11]設A∈Rp×p是對稱矩陣,
證明參見文獻[11]的推論2.11.2。
結合式(34),引理4和引理7可知定理1成立。
[1]OWEN A B.Empirical likelihood ratio confidence intervals for a single functional[J].Biometrika,1988,75(2):237-249.
[2]OWEN A.Empirical likelihood ratio confidence regions[J]. TheAnnals of Statistics,1990,18(1):90-120.
[3]CHEN S X.Empirical likelihood confidence intervals for nonparametric density estimation[J].Biometrika,1996,83 (2):329-341.
[4]ZHANG B.Empirical likelihood confidence intervals for M-functionals in the presence of auxiliary information[J]. Statistics&Probability Letters,1997,32(1):87-97.
[5]趙翌,楊善朝.α混合序列下的核密度估計量的漸近正態(tài)性[J].工程數(shù)學學報,2010,27(4):605-611.
[6]LEI Q,QIN Y.Confidence intervals for probability density functions under strong mixing samples[J].Journal of Nonparametric Statistics,2015,27(2):181-193.
[7]DEO C M.A note on empirical processes of strong-mixing sequences[J].The Annals of Probability,1973,1(5):870-875.
[8]VOLKONSKII V,ROZANOV Y A.Some limit theorems for random functions.I[J].Theory of Probability&Its Applications,1959,4(2):178-197.
[9]SHAO Q M,YU H.Weak convergence for weighted empirical processes of dependent sequences[J].The Annals of Probability,1996,24(4):2098-2127.
[10]ZHANG L X.The weak convergence for functions of negatively associated random variables[J].Journal of Multivariate Analysis,2001,78(2):272-298.
[11]SRIVASTAVA M,KHATRI C.An introduction to multivariate statistics[M].New York:North-Holland,1979:64.
Empirical Likelihood Confidence Intervals for Probability Density Functions in Presence ofAuxiliary Information Under Strong Mixing Samples
DONG Kai1,QIN Yongsong2,DENG Yu1
(1.College of Mathematics,Physicas and Information Engineering,Zhejiang Normal University,Jinhua 321004,Zhejiang,China;2.College of Mathematics and Statistics,Guangxi Normal University,Guilin 541004,Guangxi,China)
In this paper,it is proved that the empirical likelihood(EL)ratio statistic for probability density functions in presence of auxiliary information under a strong mixing sample is asymptotically-type distributed by using the blockwise technique.The result is used to obtain EL based confidence interval on the probability density function.
strong mixing sample;auxiliary information;empirical likelihood;-type distribution;confidence interval
O212.1
A
1672-2914(2016)04-0026-07
2016-03-07
國家自然科學基金項目(11271088,11361011)。
董凱(1990—),男,浙江金華市人,浙江師范大學數(shù)理與信息工程學院碩士研究生,研究方向為概率論與數(shù)理統(tǒng)計。
秦永松,教授,E-mail:ysqin@gxnu.edu.cn。