趙麗棉,黃基廷
(河池學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣西 宜州 546300)
設(shè)X=(X1,…,Xn)是從總體{Fθ(x),θ∈Θ}中抽取的簡單樣本,其中Θ為參數(shù)空間,檢驗(yàn)問題為H0∶θ∈Θ0?H1∶θ∈Θ1=Θ-Θ0.我們通過一個統(tǒng)計(jì)量在一個子樣中的觀察值來檢驗(yàn)H0,則當(dāng)觀察到點(diǎn)X屬于拒絕域 W 時(shí),拒絕假設(shè)H0,否則接受H0,稱稱為非隨機(jī)化檢驗(yàn)。在實(shí)際問題中,有些檢驗(yàn)函數(shù)φ(x)除了0,1外還能取(0,1)內(nèi)的值,如設(shè)X=(X1,…,Xn)是從一大批產(chǎn)品中抽得的樣本,記G(X)為其中的次品數(shù),當(dāng)G(X)<c時(shí)認(rèn)為這批產(chǎn)品合格;當(dāng)G(X)>c時(shí)認(rèn)為不合格;而當(dāng)G(X)=c時(shí)可以定下(0,1)內(nèi)的一個數(shù)r,作一次成功概率為r的隨機(jī)試驗(yàn),根據(jù)試驗(yàn)結(jié)果來決定這批產(chǎn)品是否合格,這種檢驗(yàn)稱為隨機(jī)化檢驗(yàn)。由于子樣觀察值的出現(xiàn)帶有隨機(jī)性,因此判斷會發(fā)生兩種錯誤:第一,假設(shè)H0本來是對的,但由于觀察值落入拒絕域W,錯誤地將H0否定了,這時(shí)犯的錯誤稱為第一類錯誤;第二,假設(shè)H0本來是不對的,但由于觀察值落入接受域,錯誤地將H0接受了,這時(shí)犯的錯誤稱為第二類錯誤。一個好的檢驗(yàn)當(dāng)然是使犯兩種錯誤的概率盡可能小,最好全為零,但實(shí)際上這是不可能的,通常只能通過限制第一類錯誤的概率使第二類錯誤的概率達(dá)到最小。用βφ(θ)=Pθ{用檢驗(yàn)φ否定了H0}=Eθ[φ(X)](θ∈Θ)表示 φ(x)的功效函數(shù),則當(dāng) θ∈Θ0時(shí),βφ(θ)是犯第一類錯誤的概率;θ∈Θ1時(shí),1 - βφ(θ)是犯第二類錯誤的概率。我們要做的是在 Eθ[φ(X)]≤α,θ∈Θ0的條件下,使 βφ(θ),θ∈Θ1達(dá)到最大值。這種檢驗(yàn)稱為水平為α的一致最優(yōu)檢驗(yàn)(簡稱UMP檢驗(yàn))。UMP檢驗(yàn)不一定存在,但對相當(dāng)廣泛的指數(shù)分布族卻能找出這種檢驗(yàn)來。為檢驗(yàn)函數(shù),這里φ(x)只取0,1兩個值,這種檢驗(yàn)
定義:設(shè){f(x,θ)∶θ∈Θ}是定義在樣本空間R上的分布族,其中Θ為參數(shù)空間。若其概率密度函數(shù)f(x,θ)可表示成如下形式:
其中,k為自然數(shù),C(θ)>0和 Qi(θ)(i=1,2,…,k)都是定義在 Θ 上的函數(shù),h(x)>0和 Ti(x)(i=1,2,…,k)都是定義在R上的函數(shù),則稱此分布族為指數(shù)分布族。
NP基本引理:設(shè)樣本X有概率函數(shù)f(x,θ),參數(shù)θ只有兩個可能的值θ0和θ1,檢驗(yàn)問題為:
則存在非負(fù)常數(shù)c和0≤r≤1,使得檢驗(yàn)問題(1)的水平為α的一致最優(yōu)檢驗(yàn)函數(shù)為:
證明參見文獻(xiàn)[1]。
定理:設(shè)樣本X=(X1,…,Xn)的分布為指數(shù)分布族:
其中c(θ),Q(θ)為θ的函數(shù)且c(θ)>0,T(x)和h(x)是樣本x的函數(shù)。參數(shù)空間Θ為R1的子集,θ0為Θ的一個內(nèi)點(diǎn)且Q(θ)為θ的嚴(yán)格增函數(shù),則檢驗(yàn)問題:
的水平為α的一致最優(yōu)檢驗(yàn)存在,且具有形式:
其中 c和 r(0≤r≤1)滿足條件 Eθ0[φ(X)]=α.
證:①先考慮檢驗(yàn)問題:
易知λ(x)是T(x)的嚴(yán)格增函數(shù),由引理知檢驗(yàn)問題(5)的一致最優(yōu)檢驗(yàn)函數(shù)為(4)式,其中c和r滿足:
由于c和r與θ1無關(guān),所以(4)式確定的φ(x)也是檢驗(yàn)問題:
的水平為α的一致最優(yōu)檢驗(yàn)。
②證由(4)式確定的φ(x)也是檢驗(yàn)問題(3)的水平為α的檢驗(yàn),即證
當(dāng) θ≤θ0時(shí),
對任意的 θ≤θ0,顯然
似然比
是T(x)的嚴(yán)格減函數(shù)。由
其中R為樣本空間知,存在t0使
由(4)式知φ(x)只與T(x)有關(guān),且是T(x)的非降函數(shù),故有
由定理可知UMP檢驗(yàn)函數(shù)φ(x)主要由r和c確定,所以確定指數(shù)分布族的UMP檢驗(yàn)的步驟可分為以下幾步:
(1)寫出樣本 X=(X1,…,Xn)的密度:f(x,θ)=c(θ)exp{Q(θ)T(x)}h(x),并確定統(tǒng)計(jì)量 T(X)的分布;
(2)由 Eθ0[φ(X)]=α 即 Pθ0(T(X)>c)+rPθ0(T(X)=c)=α 確定 r;
(3)由0≤r≤1及T(X)的分布確定c.
注:當(dāng)總體為連續(xù)分布時(shí),由于 Pθ0(T(X)=c)=0,所以直接由 Eθ0[φ(X)]=Pθ0(T(X)> c)= α 及統(tǒng)計(jì)量T(x)的分布即可確定c.此時(shí)
不難看出,統(tǒng)計(jì)上常用的正態(tài)分布族、二項(xiàng)分布族、Poisson分布族等都是指數(shù)分布族,它們的一致最優(yōu)檢驗(yàn)都是存在的。
例1:設(shè)X1,…,Xn是從分布為Fθ的總體中抽取的簡單樣本,其中θ為未知參數(shù)。求檢驗(yàn)問題H0∶θ≤θ0?H1∶θ>θ0)的水平為α的UMP檢驗(yàn)函數(shù)φ(x),其中θ0,α給定。下面幾種常見分布均滿足定理?xiàng)l件,故它們的UMP檢驗(yàn)函數(shù)φ(x)為(4)或(6)式。
1° 當(dāng) Fθ~N(θ,σ2),σ2已知時(shí)
其中
從而
得
其中Φ(u1-α)=1-α,Φ為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。UMP檢驗(yàn)函數(shù)φ(x)為(6)式。
2° 當(dāng) Fθ~N(a,θ2),a已知,θ>0 時(shí)
得 c= θ20χ2n(α),一致最優(yōu)檢驗(yàn)函數(shù) φ(x)為 (6)式。3° 當(dāng) Fθ為指數(shù)分布 θ-1e-x/θ,θ>0 時(shí)
因此f(y)是自由度為2的χ2密度,即分布。再利用分布的可加性知,
UMP檢驗(yàn)函數(shù)φ(x)為 (6)式。
所以c由下列不等式確定:
UMP檢驗(yàn)函數(shù)φ(x)為 (4)式。
所以c由下列不等式確定:
UMP檢驗(yàn)函數(shù)φ(x)為 (4)式。
前面討論的問題,都是根據(jù)樣本容量及第一類錯誤的概率(即顯著水平),確定一致最優(yōu)檢驗(yàn)使其犯第二類錯誤的概率到最小。在實(shí)際應(yīng)用中,有時(shí)會提出檢驗(yàn)問題(1),且給出第一、第二類錯誤的概率α、β,要確定樣本容量并找出UMP檢驗(yàn)。要解決這類問題,可先按前面方法確定最優(yōu)檢驗(yàn)函數(shù)φ(x),再由第一、第二類錯誤的概率的定義,聯(lián)立關(guān)于α、β方程組,從中求出樣本容量及c。下面只舉一例說明解決這類問題的具體方法。
例2:設(shè)總體服從正態(tài)分布N(θ,σ2),其中θ為未知參數(shù),σ2為已知。要在第一、第二類錯誤的概率分別為 α、β 條件下用 UMP 檢驗(yàn)問題 H0∶θ=θ0?H1∶θ=θ1(θ1>θ0),樣本容量 n必須多大?
解:由例1知此問題的UMP檢驗(yàn)函數(shù)為:
其中當(dāng)H0為真時(shí));當(dāng) H1為真時(shí)
依題意得:
[1]韋來生.數(shù)理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2008.
[2](波蘭)M.費(fèi)史.概率論及數(shù)理統(tǒng)計(jì)[M].上海:上??茖W(xué)技術(shù)出版社,1978.
[3]復(fù)旦大學(xué).概率論(第二冊)數(shù)理統(tǒng)計(jì)(第二分冊)[M].北京:人民教育出版社,1983.
[4]陳希孺.高等數(shù)理統(tǒng)計(jì)學(xué)[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2009.
[5]孫榮恒.應(yīng)用數(shù)理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2003.