亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于假設(shè)檢驗(yàn)的區(qū)間估計(jì)必要樣本容量確定

2023-11-30 06:21:28王軍虎

統(tǒng)計(jì)與決策 2023年21期

關(guān)鍵詞：開(kāi)區(qū)間樣本容量假設(shè)檢驗(yàn)

王軍虎

（洛陽(yáng)理工學(xué)院經(jīng)濟(jì)與管理學(xué)院，河南洛陽(yáng) 471023）

0 引言

區(qū)間估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的基本內(nèi)容。用隨機(jī)樣本推斷總體數(shù)量特征的準(zhǔn)確程度一般用抽樣誤差來(lái)表征，抽樣誤差由登記誤差和隨機(jī)誤差組成。登記誤差是調(diào)查或?qū)嶒?yàn)工作的誤差，理論上是可以消除的，在推斷統(tǒng)計(jì)中一般只研究隨機(jī)誤差。隨機(jī)誤差無(wú)法消除，但可以通過(guò)抽樣設(shè)計(jì)進(jìn)行控制，其核心是確定必要樣本容量。對(duì)于單一推斷目標(biāo)的參數(shù)閉區(qū)間估計(jì)的必要樣本容量確定方法已經(jīng)很成熟，林才生和曾五一（2005）[1]、賀建風(fēng)和劉建平（2008）[2]研究了多推斷目標(biāo)參數(shù)估計(jì)的必要樣本容量確定方法，但研究者很少涉及開(kāi)區(qū)間估計(jì)的樣本容量，也沒(méi)有考慮到納偽錯(cuò)誤的概率。郭文（2012）[3]研究了方差假設(shè)檢驗(yàn)的樣本容量，耿修林（2008）[4]研究了方差分析的必要樣本容量，但都沒(méi)有涉及參數(shù)估計(jì)問(wèn)題。鄭慶玉（2001）[5]單獨(dú)研究了總體均值閉區(qū)間估計(jì)與雙側(cè)假設(shè)檢驗(yàn)時(shí)必要樣本容量的確定方法，但沒(méi)有建立二者之間的聯(lián)系。魏杰（2004）[6]對(duì)總體均值閉區(qū)間估計(jì)時(shí)的必要樣本容量與總體均值左側(cè)假設(shè)檢驗(yàn)時(shí)的必要樣本容量進(jìn)行了簡(jiǎn)單比較，但未能說(shuō)明二者之間的本質(zhì)聯(lián)系。本文基于抽樣推斷的基本原理，探索總體參數(shù)區(qū)間估計(jì)與假設(shè)檢驗(yàn)時(shí)必要樣本容量的確定方法之間的內(nèi)在聯(lián)系，把兩類錯(cuò)誤納入閉區(qū)間估計(jì)和開(kāi)區(qū)間估計(jì)的必要樣本容量確定之中，以實(shí)現(xiàn)對(duì)總體參數(shù)的科學(xué)推斷。

1 假設(shè)檢驗(yàn)必要樣本容量的確定

假設(shè)檢驗(yàn)是利用小概率原理，通過(guò)隨機(jī)樣本信息推斷事先做出的關(guān)于總體某一數(shù)量特征的論斷是否成立的統(tǒng)計(jì)研究方法。假設(shè)檢驗(yàn)結(jié)論的有效性與事先設(shè)定的小概率α有關(guān)，但并不是越小越好，而是需要同時(shí)控制存在著此消彼長(zhǎng)關(guān)系的兩種錯(cuò)誤發(fā)生的概率，即棄真錯(cuò)誤發(fā)生的概率α和納偽錯(cuò)誤發(fā)生的概率β。通過(guò)調(diào)節(jié)樣本容量可以達(dá)到有效控制兩類錯(cuò)誤的目的。

1.1 雙側(cè)檢驗(yàn)的必要樣本容量

總體均值的雙側(cè)檢驗(yàn)的原假設(shè)是“H0：μ=μ0”，備擇假設(shè)是“H1：μ＜μ0或μ＞μ0”。

當(dāng)原假設(shè)H0非真而備擇假設(shè)“H1：μ=μ1（μ1＞μ0）”為真時(shí)，檢驗(yàn)中納偽錯(cuò)誤發(fā)生的概率，即：

圖1 雙側(cè)檢驗(yàn)中的兩類錯(cuò)誤圖

如圖1（b）所示，當(dāng)原假設(shè)“H0：μ=μ0”為真而備擇假設(shè)“H1：μ=μ1（μ1＜μ0）”非真時(shí)，檢驗(yàn)中棄真錯(cuò)誤發(fā)生的概率，即公式（1）。

當(dāng)原假設(shè)H0非真而備擇假設(shè)“H1：μ=μ1（μ1＜μ0）”為真時(shí)，檢驗(yàn)中納偽錯(cuò)誤發(fā)生的概率即：

兩類錯(cuò)誤發(fā)生的概率α和β此消彼長(zhǎng)。在平衡點(diǎn)B，由公式（1）和公式（5）可以得到：

1.2 單側(cè)檢驗(yàn)的必要樣本容量

假設(shè)x1，x2，…，xn是來(lái)自總體X的一個(gè)簡(jiǎn)單隨機(jī)樣本，X～N(μ，σ2)，σ2已知，

1.2.1 左側(cè)檢驗(yàn)

總體均值左側(cè)檢驗(yàn)的原假設(shè)是“H0：μ≥μ0”，備擇假設(shè)是“H1：μ＜μ0”。

如圖2（a）所示，當(dāng)原假設(shè)“H0：μ=μ0”為真而備擇假設(shè)“H1：μ＜μ0”非真時(shí)，檢驗(yàn)中棄真錯(cuò)誤發(fā)生的概率為真)，即：

圖2 單側(cè)檢驗(yàn)中的兩類錯(cuò)誤圖

當(dāng)原假設(shè)H0非真而備擇假設(shè)“H1：μ=μ1（μ1＜μ0）”為真時(shí)，檢驗(yàn)中納偽錯(cuò)誤發(fā)生的概率即公式（5）。在兩類錯(cuò)誤的平衡點(diǎn)C，由公式（5）和公式（8）可以得到：

1.2.2 右側(cè)檢驗(yàn)

總體均值右側(cè)檢驗(yàn)的原假設(shè)是“H0：μ≤μ0”，備擇假設(shè)是“H1：μ＞μ0”。

如圖2（b）所示，當(dāng)原假設(shè)“H0：μ≤μ0”為真而備擇假設(shè)“H1：μ＞μ0”非真時(shí)，檢驗(yàn)中棄真錯(cuò)誤發(fā)生的概率為真)，即：

在簡(jiǎn)單隨機(jī)重復(fù)抽樣和簡(jiǎn)單隨機(jī)不重復(fù)抽樣下，分別可以推導(dǎo)出與左側(cè)檢驗(yàn)相同的兼顧控制兩類錯(cuò)誤發(fā)生的概率α和β的樣本容量確定公式（10）和公式（11）。

2 區(qū)間估計(jì)必要樣本容量的確定

參數(shù)的區(qū)間估計(jì)是在給定的置信度1-α下，利用隨機(jī)樣本信息對(duì)總體參數(shù)真值的取值范圍做出的統(tǒng)計(jì)推斷。評(píng)價(jià)總體均值μ的區(qū)間估計(jì)的精度時(shí)常用絕對(duì)誤差來(lái)衡量，它是樣本均值與總體均值真值的誤差。由于總體均值的真值μ是無(wú)法得到的，因此估計(jì)的絕對(duì)誤差也無(wú)法計(jì)算，但在區(qū)間估計(jì)時(shí)需要控制這個(gè)絕對(duì)誤差的取值范圍，使它不超過(guò)一個(gè)極限值Δ，Δ 稱為區(qū)間估計(jì)的極限誤差。在區(qū)間估計(jì)中，置信度1-α和極限誤差Δ 呈正向關(guān)系。當(dāng)置信度1-α增大時(shí)，區(qū)間估計(jì)錯(cuò)誤的概率α?xí)p小，但極限誤差Δ 會(huì)增大，估計(jì)的精度降低；反之，當(dāng)提高估計(jì)精度時(shí)，極限誤差Δ 變小，但置信度1-α?xí)档?，區(qū)間估計(jì)錯(cuò)誤的概率α將增大。通過(guò)調(diào)節(jié)樣本容量可以有效調(diào)和區(qū)間估計(jì)錯(cuò)誤的概率α和極限誤差Δ 之間存在的矛盾。

2.1 閉區(qū)間估計(jì)

總體參數(shù)的閉區(qū)間估計(jì)是指在估計(jì)總體參數(shù)真值θ時(shí)，所估計(jì)的1-α置信區(qū)間是一個(gè)既有上限值又有下限值的閉區(qū)間，即為θ的點(diǎn)估計(jì)值，Δ ≥0 為估計(jì)的極限誤差。

2.2 開(kāi)區(qū)間估計(jì)

總體參數(shù)的開(kāi)區(qū)間估計(jì)是指在估計(jì)總體參數(shù)真值θ時(shí)，所估計(jì)的1-α置信區(qū)間是一個(gè)只有上限值或只有下限值的開(kāi)區(qū)間。其中，只有下限值的開(kāi)區(qū)間估計(jì)稱為最小值開(kāi)區(qū)間估計(jì)，即只有上限值的開(kāi)區(qū)間估計(jì)稱為最大值開(kāi)區(qū)間估計(jì)，即

假設(shè)x1，x2，…，xn是來(lái)自總體X的一個(gè)簡(jiǎn)單隨機(jī)樣本，X～N(μ，σ2)，σ2已知，

2.2.1 最小值開(kāi)區(qū)間估計(jì)

參照?qǐng)D2（b），在給定的置信度1-α下，有：

2.2.2 最大值開(kāi)區(qū)間估計(jì)

參照?qǐng)D2（a），在給定的置信度1-α下，有：

3 假設(shè)檢驗(yàn)與區(qū)間估計(jì)兩種樣本容量確定方法的比較

通過(guò)比較總體均值雙側(cè)檢驗(yàn)的必要樣本容量計(jì)算公式（4）、公式（7）和總體均值閉區(qū)間的必要樣本容量計(jì)算公式（14）、公式（15），以及總體均值單側(cè)檢驗(yàn)的必要樣本容量計(jì)算公式（10）、公式（11）和總體均值開(kāi)區(qū)間的必要樣本容量計(jì)算公式（17）、公式（18），可以得到如下結(jié)論：

（1）對(duì)于單側(cè)檢驗(yàn)而言，無(wú)論是左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn)，確定樣本容量都采用同一個(gè)計(jì)算公式；在進(jìn)行開(kāi)區(qū)間估計(jì)時(shí)，無(wú)論是最小值開(kāi)區(qū)間估計(jì)還是最大值開(kāi)區(qū)間估計(jì)，確定樣本容量也都采用同一個(gè)計(jì)算公式。單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)、閉區(qū)間估計(jì)和開(kāi)區(qū)間估計(jì)，計(jì)算必要樣本容量的公式不相同但非常相似。在研究總體均值時(shí)，只有一點(diǎn)不同：?jiǎn)蝹?cè)檢驗(yàn)或開(kāi)區(qū)間估計(jì)計(jì)算必要樣本容量公式中的zα在雙側(cè)檢驗(yàn)或閉區(qū)間估計(jì)中變成了

（2）假設(shè)檢驗(yàn)和區(qū)間估計(jì)的必要樣本容量大小與抽樣的方式和方法有關(guān)，不同的抽樣方式和方法下計(jì)算必要樣本容量的公式是不同的。就簡(jiǎn)單隨機(jī)抽樣方式而言，采用不重復(fù)抽樣方法的必要樣本容量小于重復(fù)抽樣方法的必要樣本容量。一般而言，分層抽樣、系統(tǒng)抽樣等其他抽樣方式有效地利用了已有的總體信息，降低了隨機(jī)抽樣的盲目性，使樣本的代表性增加，可以減小假設(shè)檢驗(yàn)和區(qū)間估計(jì)的必要樣本容量。

（3）假設(shè)檢驗(yàn)和區(qū)間估計(jì)的必要樣本容量與總體方差成正比?？傮w方差越大，總體中的個(gè)體變異程度越大，需要抽取更大容量的樣本，以保證假設(shè)檢驗(yàn)中兩類錯(cuò)誤的概率都得到有效控制或保證區(qū)間估計(jì)在一定的置信度下的估計(jì)精度。反之，總體方差越小，總體中的個(gè)體變異程度越低，只需要抽取較小容量的樣本就能滿足假設(shè)檢驗(yàn)或區(qū)間估計(jì)的設(shè)計(jì)需要。

（4）在計(jì)算假設(shè)檢驗(yàn)的必要樣本容量時(shí)，需要確定參數(shù)真值與其假設(shè)值之間的偏差，如|μ1-μ0|。在計(jì)算區(qū)間估計(jì)的必要樣本容量時(shí)，需要確定參數(shù)真值與樣本估計(jì)值之間允許的最大偏差，如在實(shí)踐中，|μ1-μ0|和都是未知的，在確定必要樣本容量時(shí)，可以通過(guò)分析增大或減小偏差帶來(lái)的成本和收益之間的平衡關(guān)系來(lái)確定這兩個(gè)離差的最大允許值。兩個(gè)最大允許偏差值均可以用Δ 來(lái)表示。

4 兩類錯(cuò)誤下的區(qū)間估計(jì)必要樣本容量的確定

作為統(tǒng)計(jì)推斷的兩個(gè)基本研究?jī)?nèi)容，參數(shù)的假設(shè)檢驗(yàn)和區(qū)間估計(jì)都是依據(jù)一個(gè)隨機(jī)樣本提供的統(tǒng)計(jì)信息和統(tǒng)計(jì)量的概率分布原理，在一定的概率保證下，對(duì)總體的數(shù)量特征進(jìn)行科學(xué)推斷。因此，可以用區(qū)間估計(jì)方法進(jìn)行假設(shè)檢驗(yàn)，即在假設(shè)檢驗(yàn)中用區(qū)間估計(jì)準(zhǔn)則進(jìn)行檢驗(yàn)決策：構(gòu)造備擇假設(shè)H1的1-α置信區(qū)間，如果備擇假設(shè)H1的區(qū)間完全包含了這個(gè)1-α置信區(qū)間，那么就拒絕原假設(shè)；否則，就接受原假設(shè)[7]。用區(qū)間估計(jì)準(zhǔn)則進(jìn)行假設(shè)檢驗(yàn)有助于從假設(shè)檢驗(yàn)的視角認(rèn)識(shí)區(qū)間估計(jì)問(wèn)題。

可以把區(qū)間估計(jì)看作一個(gè)假設(shè)檢驗(yàn)問(wèn)題。對(duì)于單個(gè)總體均值的閉區(qū)間估計(jì)，可以用下列假設(shè)檢驗(yàn)來(lái)表示：

顯然，當(dāng)β=0.5，即zβ=0 時(shí)，這樣的假設(shè)檢驗(yàn)的必要樣本容量與區(qū)間估計(jì)的必要樣本容量相等。由此可見(jiàn)，參數(shù)區(qū)間估計(jì)的實(shí)質(zhì)是一個(gè)忽視納偽錯(cuò)誤的假設(shè)檢驗(yàn)，它所檢驗(yàn)的假設(shè)值就是樣本估計(jì)值。忽視納偽錯(cuò)誤意味著當(dāng)總體參數(shù)的真值沒(méi)有落入所估計(jì)的1-α置信區(qū)間時(shí)，接受這個(gè)置信區(qū)間和拒絕這個(gè)置信區(qū)間具有相同的概率，區(qū)間估計(jì)方法本身并不能為人們避免接受錯(cuò)誤的置信區(qū)間提供有用的信息，只能由決策人自己來(lái)做出判斷。

如果期望區(qū)間估計(jì)和假設(shè)檢驗(yàn)一樣，能為人們避免接受錯(cuò)誤的置信區(qū)間提供幫助，那么就不能忽視納偽錯(cuò)誤，必須把納偽錯(cuò)誤發(fā)生的概率β和棄真錯(cuò)誤發(fā)生的概率α同時(shí)納入必要樣本容量的確定之中，使兩類錯(cuò)誤在區(qū)間估計(jì)中都得到有效控制。

5 兩類錯(cuò)誤下區(qū)間估計(jì)的效果模擬

在同時(shí)考慮兩類錯(cuò)誤的條件下進(jìn)行區(qū)間估計(jì)時(shí)，納偽錯(cuò)誤發(fā)生的概率β應(yīng)控制在0.5以下，zβ＞0。此時(shí)，進(jìn)行區(qū)間估計(jì)的必要樣本容量n′大于僅考慮去真錯(cuò)誤時(shí)進(jìn)行區(qū)間估計(jì)的必要樣本容量n。由于必要樣本容量增大，因此當(dāng)其他條件不變時(shí)，置信區(qū)間的寬度變窄，估計(jì)的精度提高。下面以簡(jiǎn)單重復(fù)抽樣為例，模擬驗(yàn)證在同時(shí)考慮兩類錯(cuò)誤的條件下區(qū)間估計(jì)必要樣本容量的變化及估計(jì)精度的變化。

假設(shè)總體服從正態(tài)分布，且方差σ2已知，采用重復(fù)抽樣方法從總體中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本。在相同的置信度1-α和相同的極限誤差Δ 要求下，控制納偽錯(cuò)誤的概率β與不控制納偽錯(cuò)誤的概率β時(shí)，進(jìn)行區(qū)間估計(jì)的必要樣本容量變化率δn的計(jì)算公式分別如下：

抽取的必要樣本容量變化后，引起的置信區(qū)間寬度變化率δΔ的計(jì)算公式分別如下：

當(dāng)分別取常用的置信度0.90、0.95和0.99時(shí)，表1模擬了把納偽錯(cuò)誤的概率β控制在不同水平下的閉區(qū)間估計(jì)和開(kāi)區(qū)間估計(jì)必要樣本容量的變化率δn和置信區(qū)間寬度的變化率δΔ的變動(dòng)規(guī)律。δn為正值表明控制納偽錯(cuò)誤的概率β之后，必須增加必要樣本容量，才能在區(qū)間估計(jì)中滿足同時(shí)控制兩類錯(cuò)誤和極限誤差的要求；δΔ為負(fù)值表明控制納偽錯(cuò)誤的概率β之后，由于必要樣本容量增加，因此區(qū)間估計(jì)寬度變窄，估計(jì)的精度提高。

表1 控制兩類錯(cuò)誤下置信區(qū)間寬度變化率和必要樣本容量變化率（單位：%）

表1的模擬結(jié)果顯示，與不考慮納偽錯(cuò)誤的區(qū)間估計(jì)相比，將納偽錯(cuò)誤的概率β控制得越低，必要樣本容量增加得越多，估計(jì)結(jié)果的精度也越高。在相同的兩類錯(cuò)誤控制要求下，開(kāi)區(qū)間估計(jì)的必要樣本容量增加率和估計(jì)精度增加率高于閉區(qū)間估計(jì)。當(dāng)β取0.20時(shí)，必要樣本容量約增加1 倍，區(qū)間估計(jì)的精度約增加30%。當(dāng)β取0.05 時(shí)，必要樣本容量約增加1.6至4.2倍，區(qū)間估計(jì)的精度約增加41%至50%。當(dāng)β取值減小時(shí)，由于必要樣本容量增加導(dǎo)致的抽樣成本增加的程度可能會(huì)大于估計(jì)精度增加的程度，因此β的取值不宜太小。

6 結(jié)論

本文通過(guò)對(duì)總體均值單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)確定必要樣本容量的方法和總體均值開(kāi)區(qū)間估計(jì)和閉區(qū)間估計(jì)確定必要樣本容量的方法進(jìn)行比較，發(fā)現(xiàn)二者所依據(jù)的數(shù)理統(tǒng)計(jì)原理相同，主要區(qū)別在于二者采用不同的統(tǒng)計(jì)方法來(lái)推斷總體的數(shù)量特征。區(qū)間估計(jì)所提供的方法可以用于進(jìn)行假設(shè)檢驗(yàn)。同理，區(qū)間估計(jì)也可以看作一種特殊的假設(shè)檢驗(yàn)，即樣本統(tǒng)計(jì)量計(jì)算值是否與總體參數(shù)的真值在統(tǒng)計(jì)上顯著相同。在區(qū)間估計(jì)中，一般忽略了決策者使用置信區(qū)間時(shí)可能犯下的納偽錯(cuò)誤的概率為50%。如果決策者希望降低犯納偽錯(cuò)誤的概率，那么就需要在抽樣實(shí)驗(yàn)設(shè)計(jì)或抽樣調(diào)查設(shè)計(jì)中借助相應(yīng)的假設(shè)檢驗(yàn)方法來(lái)確定必要的樣本容量。當(dāng)其他條件不變時(shí)，在估計(jì)置信區(qū)間時(shí)若要同時(shí)控制棄真錯(cuò)誤和納偽錯(cuò)誤的概率，則可以通過(guò)增加樣本容量的方法來(lái)實(shí)現(xiàn)，進(jìn)而提高置信區(qū)間的精度。