王寧寧,秦永松
(廣西師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣西 桂林 541006)
經(jīng)驗(yàn)似然是Owen[1-2]在獨(dú)立樣本下提出的一種非參數(shù)統(tǒng)計(jì)推斷方法,與經(jīng)典方法(如正態(tài)逼近理論)以及當(dāng)前比較流行的統(tǒng)計(jì)方法(如Bootstrap)相比,經(jīng)驗(yàn)似然方法具有諸如: 置信域的形狀由數(shù)據(jù)決定、置信域具有Bartlett可修正性、無(wú)需構(gòu)造樞軸量、具有保值域性和函數(shù)變換不變性等優(yōu)點(diǎn).正因?yàn)槿绱?許多統(tǒng)計(jì)學(xué)家將這一方法應(yīng)用到各種統(tǒng)計(jì)模型及各種領(lǐng)域.如線性回歸模型的統(tǒng)計(jì)推斷[3-4],分位數(shù)統(tǒng)計(jì)推斷[5]、廣義線性統(tǒng)計(jì)推斷[6]等,此外CHEN[7]將經(jīng)驗(yàn)似然方法與核方法結(jié)合構(gòu)造精度更高的概率密度函數(shù)的置信區(qū)間等.然而,上述文獻(xiàn)所提到的經(jīng)驗(yàn)似然方法都針對(duì)于獨(dú)立樣本情形,而現(xiàn)實(shí)中相協(xié)樣本情形經(jīng)常出現(xiàn),針對(duì)于相協(xié)樣本,現(xiàn)有的研究較多采用分塊經(jīng)驗(yàn)似然方法進(jìn)行推導(dǎo).Kitamural[8]在α-混合樣本下首次運(yùn)用分塊經(jīng)驗(yàn)似然方法構(gòu)建參數(shù)的置信區(qū)間.此后,ZHANG[9]將分塊經(jīng)驗(yàn)似然用于構(gòu)造負(fù)相協(xié)樣本下非參數(shù)整體均值的置信區(qū)間、LEI和QIN[10]將分塊經(jīng)驗(yàn)似然用于構(gòu)造負(fù)相協(xié)樣本下總體分位數(shù)的置信區(qū)間、QIN等[11]將分塊經(jīng)驗(yàn)似然用于構(gòu)造負(fù)相協(xié)樣本下概率密度函數(shù)的置信區(qū)間等.
為了保證經(jīng)驗(yàn)似然統(tǒng)計(jì)量的存在,需要假定0在數(shù)據(jù)的凸包內(nèi),針對(duì)0向量可能不在數(shù)據(jù)的凸包內(nèi)的問(wèn)題,CHEN等[12]提出了調(diào)整經(jīng)驗(yàn)似然.此后CHEN和HUANG[13]使用調(diào)整經(jīng)驗(yàn)似然構(gòu)造總體均值的置信區(qū)間并研究了其有限樣本下的性質(zhì),ZHOU和JING[14]使用調(diào)整經(jīng)驗(yàn)似然構(gòu)造分位數(shù)的置信區(qū)間等.本文受到文[12,15]的啟發(fā),研究相協(xié)樣本[16]下概率密度函數(shù)的調(diào)整經(jīng)驗(yàn)似然推斷問(wèn)題,采用不分塊的調(diào)整經(jīng)驗(yàn)似然方法進(jìn)行推導(dǎo)避免了分塊技術(shù)的復(fù)雜性,并構(gòu)造了相協(xié)樣本下概率密度函數(shù)的調(diào)整經(jīng)驗(yàn)似然置信區(qū)間.通過(guò)模擬得到,調(diào)整經(jīng)驗(yàn)似然(AEL)的表現(xiàn)略優(yōu)于經(jīng)驗(yàn)似然(EL) 和正態(tài)逼近(NA).
本文結(jié)構(gòu)如下: 第2節(jié)將給出本文的主要結(jié)論,第3節(jié)將給出有限樣本下的模擬結(jié)果,第4節(jié)將給出相關(guān)的引理及其證明,第5節(jié)將給出主要結(jié)論的證明.
設(shè)X1,X2,···,Xn是來(lái)自總體X的一組嚴(yán)平穩(wěn)相協(xié)樣本,f(x)為X的概率密度函數(shù),給定x ∈R,f(x)的核密度估計(jì)為
通過(guò)拉格朗日乘數(shù)法可以得到pi=1/[(n+1)(1+λgn,i(θ))],其中λ=λ(θ)滿足
則對(duì)數(shù)調(diào)整經(jīng)驗(yàn)似然比統(tǒng)計(jì)量為
下面我們列出一些正則條件,這些正則條件將會(huì)用在后面的定理中.通常設(shè)C為正常數(shù),在不同情況下可能取到不同的數(shù)值.
正則條件:(A1)(i)X1,···,Xn為嚴(yán)平穩(wěn)相協(xié)序列(正相協(xié)或者負(fù)相協(xié));
(A3) 設(shè)pn,qn為正整數(shù)且滿足:pn+qn ≤n,kn=[n/(pn+qn)],其中[t]表示t的整數(shù)部分.設(shè)hn>0為窗寬,且pn,qn和hn分別滿足
注2.1本文中條件(A1)-(A3)與文[16]中條件(A1)-(A3)完全相同.條件(A1)(v),(A2)(iii),(A3)(iv)與文[16]推論2.1中條件(b)相同.若f在x的鄰域內(nèi)有連續(xù)的一階導(dǎo)函數(shù),可用文[16]中的條件(a)代替(A1)(v),(A2)(iii),(A3)(iv).
本文主要結(jié)論為以下內(nèi)容.
定理2.1設(shè)條件(A1)-(A3)成立且an=o(n),則當(dāng)n →∞時(shí)有
注2.4定理2.1用于構(gòu)造f(x)的調(diào)整經(jīng)驗(yàn)似然置信區(qū)間.令Zα滿足P(≥Zα)=α,其中0<α<1,則f(x)基于(1-α)的調(diào)整經(jīng)驗(yàn)似然的置信區(qū)間為
為了進(jìn)一步研究當(dāng)θf(wàn)(x)時(shí),對(duì)數(shù)調(diào)整經(jīng)驗(yàn)似然比統(tǒng)計(jì)量W?(θ)和對(duì)數(shù)經(jīng)驗(yàn)似然比統(tǒng)計(jì)量W(θ)的功效,我們引入定理2.2.
定理2.2假設(shè)定理2.1的條件(A1)-(A3)成立且an=o(n2/3),對(duì)于θf(wàn)(x),當(dāng)n →∞時(shí),依概率趨于1有-2(nh)-1/3W?(θ)→∞且-2(nh)-1/3W(θ)→∞成立.
注2.5定理2.2表明,當(dāng)θf(wàn)(x)時(shí),對(duì)數(shù)調(diào)整經(jīng)驗(yàn)似然比統(tǒng)計(jì)量W?(θ)和對(duì)數(shù)經(jīng)驗(yàn)似然比統(tǒng)計(jì)量W(θ)以至少(nh)1/3的速率趨于無(wú)窮大.
本節(jié)通過(guò)模擬來(lái)研究式(2.2)所示的AEL置信區(qū)間在有限樣本下的表現(xiàn).用AELCI表示式(2.2)所示的AEL置信區(qū)間,ELCI表示文[15]中式(2.7)所示的EL置信區(qū)間,NACI表示式(3.1)中所示的NA置信區(qū)間,即
Ⅰ 負(fù)相協(xié)樣本
i) 多元正態(tài)分布隨機(jī)樣本
在本節(jié)模擬中,(X1,···,Xn)是多元正態(tài)隨機(jī)向量,且滿足E(X1,···,Xn)=(1,···,1),Cov(Xi,Xj)=-4-(j-i)-1(1≤i ≤n,j>i)和V ar(Xi)=0.52(1≤i ≤n),取an=1,由此生成的{Xi;1≤i ≤n}是負(fù)相協(xié)序列(見(jiàn)文[17]),該情形下的模擬結(jié)果見(jiàn)表1.
表1 多元正態(tài)分布隨機(jī)樣本下置信度為0.90和0.95時(shí)f(1)的置信區(qū)間的CP和AL
由表1得,在多元正態(tài)隨機(jī)樣本下,隨著樣本量的不斷增大,置信區(qū)間的覆蓋率逐漸增大且越來(lái)越接近于置信度,置信區(qū)間的平均長(zhǎng)度逐漸減小.當(dāng)n相同時(shí),AEL方法的置信區(qū)間的覆蓋率高于EL和NA兩種方法的置信區(qū)間的覆蓋率,雖然AEL方法置信區(qū)間的平均長(zhǎng)度略大于EL和NA兩種方法的置信區(qū)間的平均長(zhǎng)度,但是相差非常小.因此綜合分析可得,多元正態(tài)隨機(jī)樣本下,AEL的表現(xiàn)略優(yōu)于EL和NA的表現(xiàn).
ii) 多元t分布隨機(jī)樣本
在本節(jié)模擬中,(X1,···,Xn)是多元t分布隨機(jī)向量,且滿足E(X1,···,Xn)=(1,···,1),Cov(Xi,Xj)=-3-(j-i)-1(1≤i ≤n,j>i) 和Var(Xi)=5/3(1≤i ≤n),取an=0.5,由此生成的{Xi;1≤i ≤n}是負(fù)相協(xié)序列(見(jiàn)文[17]),該情形下的模擬結(jié)果見(jiàn)表2.
表2 多元t分布隨機(jī)樣本下置信度為0.90和0.95時(shí)f(1)的置信區(qū)間的CP和AL
由表2得,在多元t分布隨機(jī)樣本下,隨著樣本量的不斷增大,三種方法的置信區(qū)間的覆蓋率均逐漸增大且越來(lái)越接近置信度,置信區(qū)間的平均長(zhǎng)度均不斷減小.當(dāng)n相同時(shí),AEL方法的置信區(qū)間的覆蓋率高于EL和NA兩種方法的置信區(qū)間的覆蓋率,盡管其置信區(qū)間的平均長(zhǎng)度也稍有增加,但與EL和NA的置信區(qū)間的平均長(zhǎng)度相比相差甚微.綜合分析可得在多元t分布隨機(jī)樣本下,AEL表現(xiàn)略好于EL和NA的表現(xiàn).
因此一般來(lái)說(shuō),在正相協(xié)隨機(jī)樣本下,AEL表現(xiàn)略好于EL和NA的表現(xiàn).此外,通過(guò)對(duì)比兩種不同分布隨機(jī)樣本下的模擬結(jié)果可得,當(dāng)n取同一值時(shí),多元正態(tài)分布樣本下三種方法的置信區(qū)間的覆蓋率都更高且更接近于置信度,因此可得三種方法在多元正態(tài)分布隨機(jī)樣本下的表現(xiàn)均優(yōu)于在多元t分布隨機(jī)樣本下的表現(xiàn).
Ⅱ 正相協(xié)樣本
由表3、表4得,從置信區(qū)間覆蓋率來(lái)看,隨著樣本量的不斷增大,兩種隨機(jī)分布樣本下置信區(qū)間的覆蓋率均不斷增加且越來(lái)越接近置信度,當(dāng)n相同時(shí),AEL的置信區(qū)間的覆蓋率高于EL和NA的置信區(qū)間的覆蓋率.從置信區(qū)間的平均長(zhǎng)度來(lái)看,兩種隨機(jī)分布樣本下置信區(qū)間的平均長(zhǎng)度均隨著樣本量的增加不斷減小.盡管AEL方法在置信區(qū)間的覆蓋率增大的同時(shí)其平均長(zhǎng)度也稍有增加,但其與EL和NA的置信區(qū)間的平均長(zhǎng)度相比相差甚微.
表3 ~N(1,1)情形下置信度為0.90和0.95時(shí)f(1)的置信區(qū)間的CP和AL
表3 ~N(1,1)情形下置信度為0.90和0.95時(shí)f(1)的置信區(qū)間的CP和AL
表4 ~情形下置信度為0.90和0.95時(shí)f(1)的置信區(qū)間的CP和AL
表4 ~情形下置信度為0.90和0.95時(shí)f(1)的置信區(qū)間的CP和AL
綜合分析可得,正相協(xié)樣本下,AEL的表現(xiàn)略好于EL和NA.此外,通過(guò)兩表對(duì)比可得,當(dāng)n取相同值時(shí),正態(tài)分布樣本下三種方法對(duì)的置信區(qū)間的覆蓋率更高且更接近于置信度,且置信區(qū)間的平均長(zhǎng)度也更短,由此可得三種方法在正態(tài)分布隨機(jī)樣本下的表現(xiàn)優(yōu)于在卡方分布隨機(jī)樣本下的表現(xiàn).
綜上可得,相協(xié)樣本下(正相協(xié)或負(fù)相協(xié)),對(duì)于概率密度函數(shù)置信區(qū)間的估計(jì),AEL方法的表現(xiàn)略好于EL和NA兩種方法的表現(xiàn),且三種方法均在正態(tài)分布隨機(jī)樣本下表現(xiàn)得更好.
此外,通過(guò)模擬結(jié)果發(fā)現(xiàn),在相協(xié)樣本下文中提到的三種方法得到的置信區(qū)間的覆蓋率一致低于名義覆蓋水平1-α,嘗試增大樣本量進(jìn)行模擬發(fā)現(xiàn)(模擬結(jié)果不再列出),置信區(qū)間的覆蓋率有所改善且偶爾出現(xiàn)高于置信度1-α的情形,但是與樣本量較小時(shí)模擬結(jié)果相比,樣本量增大時(shí)AEL方法的表現(xiàn)優(yōu)于EL和NA的表現(xiàn)的程度有所下降.因此,AEL方法更適合在樣本量較小時(shí)使用,在樣本容量較大時(shí),EL和AEL的表現(xiàn)相差不大.在獨(dú)立樣本情形下,Tsao[18]討論了EL置信區(qū)間的覆蓋率常常低于名義覆蓋水平的情況,并且從理論上分析了出現(xiàn)這一現(xiàn)象的原因,相協(xié)樣本情況下EL置信區(qū)間出現(xiàn)低覆蓋的原因尚需進(jìn)一步研究.
以下引理將用于后面定理的證明,其中引理4.1-4.3的證明見(jiàn)文[15]的引理4.1-4.3的證明.
引理4.11)設(shè)條件(A1)(i)-(iv),(A2)(i)(ii),(A3)(i)-(iii)成立,則對(duì)于f的連續(xù)點(diǎn)x有
2)設(shè)條件(A1)-(A3)成立,則
引理4.2設(shè)條件(A1)(i)(v)和(A2)(i)成立.則對(duì)于任意的l ∈n有
引理4.3設(shè)條件(A1)-(A3)成立,則
引理4.4設(shè)條件(A1)-(A3)成立,則
定理2.1的證明1) 首先證明
利用最大化問(wèn)題的對(duì)偶性可得
因?yàn)镸可任意大,則對(duì)于θf(wàn)(x),當(dāng)n →∞時(shí),依概率趨于1有-2(nh)-1/3W?(θ)→∞成立.對(duì)于-2(nh)-1/3W(θ)→∞的證明與-2(nh)-1/3W?(θ)→∞的證明相似.
定理2.2證畢.