亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于假設(shè)檢驗(yàn)的區(qū)間估計(jì)必要樣本容量確定

        2023-11-30 06:21:28王軍虎
        統(tǒng)計(jì)與決策 2023年21期
        關(guān)鍵詞:開(kāi)區(qū)間樣本容量假設(shè)檢驗(yàn)

        王軍虎

        (洛陽(yáng)理工學(xué)院 經(jīng)濟(jì)與管理學(xué)院,河南 洛陽(yáng) 471023)

        0 引言

        區(qū)間估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的基本內(nèi)容。用隨機(jī)樣本推斷總體數(shù)量特征的準(zhǔn)確程度一般用抽樣誤差來(lái)表征,抽樣誤差由登記誤差和隨機(jī)誤差組成。登記誤差是調(diào)查或?qū)嶒?yàn)工作的誤差,理論上是可以消除的,在推斷統(tǒng)計(jì)中一般只研究隨機(jī)誤差。隨機(jī)誤差無(wú)法消除,但可以通過(guò)抽樣設(shè)計(jì)進(jìn)行控制,其核心是確定必要樣本容量。對(duì)于單一推斷目標(biāo)的參數(shù)閉區(qū)間估計(jì)的必要樣本容量確定方法已經(jīng)很成熟,林才生和曾五一(2005)[1]、賀建風(fēng)和劉建平(2008)[2]研究了多推斷目標(biāo)參數(shù)估計(jì)的必要樣本容量確定方法,但研究者很少涉及開(kāi)區(qū)間估計(jì)的樣本容量,也沒(méi)有考慮到納偽錯(cuò)誤的概率。郭文(2012)[3]研究了方差假設(shè)檢驗(yàn)的樣本容量,耿修林(2008)[4]研究了方差分析的必要樣本容量,但都沒(méi)有涉及參數(shù)估計(jì)問(wèn)題。鄭慶玉(2001)[5]單獨(dú)研究了總體均值閉區(qū)間估計(jì)與雙側(cè)假設(shè)檢驗(yàn)時(shí)必要樣本容量的確定方法,但沒(méi)有建立二者之間的聯(lián)系。魏杰(2004)[6]對(duì)總體均值閉區(qū)間估計(jì)時(shí)的必要樣本容量與總體均值左側(cè)假設(shè)檢驗(yàn)時(shí)的必要樣本容量進(jìn)行了簡(jiǎn)單比較,但未能說(shuō)明二者之間的本質(zhì)聯(lián)系。本文基于抽樣推斷的基本原理,探索總體參數(shù)區(qū)間估計(jì)與假設(shè)檢驗(yàn)時(shí)必要樣本容量的確定方法之間的內(nèi)在聯(lián)系,把兩類錯(cuò)誤納入閉區(qū)間估計(jì)和開(kāi)區(qū)間估計(jì)的必要樣本容量確定之中,以實(shí)現(xiàn)對(duì)總體參數(shù)的科學(xué)推斷。

        1 假設(shè)檢驗(yàn)必要樣本容量的確定

        假設(shè)檢驗(yàn)是利用小概率原理,通過(guò)隨機(jī)樣本信息推斷事先做出的關(guān)于總體某一數(shù)量特征的論斷是否成立的統(tǒng)計(jì)研究方法。假設(shè)檢驗(yàn)結(jié)論的有效性與事先設(shè)定的小概率α有關(guān),但并不是越小越好,而是需要同時(shí)控制存在著此消彼長(zhǎng)關(guān)系的兩種錯(cuò)誤發(fā)生的概率,即棄真錯(cuò)誤發(fā)生的概率α和納偽錯(cuò)誤發(fā)生的概率β。通過(guò)調(diào)節(jié)樣本容量可以達(dá)到有效控制兩類錯(cuò)誤的目的。

        1.1 雙側(cè)檢驗(yàn)的必要樣本容量

        總體均值的雙側(cè)檢驗(yàn)的原假設(shè)是“H0:μ=μ0”,備擇假設(shè)是“H1:μ<μ0或μ>μ0”。

        當(dāng)原假設(shè)H0非真而備擇假設(shè)“H1:μ=μ1(μ1>μ0)”為真時(shí),檢驗(yàn)中納偽錯(cuò)誤發(fā)生的概率,即:

        圖1 雙側(cè)檢驗(yàn)中的兩類錯(cuò)誤圖

        如圖1(b)所示,當(dāng)原假設(shè)“H0:μ=μ0”為真而備擇假設(shè)“H1:μ=μ1(μ1<μ0)”非真時(shí),檢驗(yàn)中棄真錯(cuò)誤發(fā)生的概率,即公式(1)。

        當(dāng)原假設(shè)H0非真而備擇假設(shè)“H1:μ=μ1(μ1<μ0)”為真時(shí),檢驗(yàn)中納偽錯(cuò)誤發(fā)生的概率即:

        兩類錯(cuò)誤發(fā)生的概率α和β此消彼長(zhǎng)。在平衡點(diǎn)B,由公式(1)和公式(5)可以得到:

        1.2 單側(cè)檢驗(yàn)的必要樣本容量

        假設(shè)x1,x2,…,xn是來(lái)自總體X的一個(gè)簡(jiǎn)單隨機(jī)樣本,X~N(μ,σ2),σ2已知,

        1.2.1 左側(cè)檢驗(yàn)

        總體均值左側(cè)檢驗(yàn)的原假設(shè)是“H0:μ≥μ0”,備擇假設(shè)是“H1:μ<μ0”。

        如圖2(a)所示,當(dāng)原假設(shè)“H0:μ=μ0”為真而備擇假設(shè)“H1:μ<μ0”非真時(shí),檢驗(yàn)中棄真錯(cuò)誤發(fā)生的概率為真),即:

        圖2 單側(cè)檢驗(yàn)中的兩類錯(cuò)誤圖

        當(dāng)原假設(shè)H0非真而備擇假設(shè)“H1:μ=μ1(μ1<μ0)”為真時(shí),檢驗(yàn)中納偽錯(cuò)誤發(fā)生的概率即公式(5)。在兩類錯(cuò)誤的平衡點(diǎn)C,由公式(5)和公式(8)可以得到:

        1.2.2 右側(cè)檢驗(yàn)

        總體均值右側(cè)檢驗(yàn)的原假設(shè)是“H0:μ≤μ0”,備擇假設(shè)是“H1:μ>μ0”。

        如圖2(b)所示,當(dāng)原假設(shè)“H0:μ≤μ0”為真而備擇假設(shè)“H1:μ>μ0”非真時(shí),檢驗(yàn)中棄真錯(cuò)誤發(fā)生的概率為真),即:

        在簡(jiǎn)單隨機(jī)重復(fù)抽樣和簡(jiǎn)單隨機(jī)不重復(fù)抽樣下,分別可以推導(dǎo)出與左側(cè)檢驗(yàn)相同的兼顧控制兩類錯(cuò)誤發(fā)生的概率α和β的樣本容量確定公式(10)和公式(11)。

        2 區(qū)間估計(jì)必要樣本容量的確定

        參數(shù)的區(qū)間估計(jì)是在給定的置信度1-α下,利用隨機(jī)樣本信息對(duì)總體參數(shù)真值的取值范圍做出的統(tǒng)計(jì)推斷。評(píng)價(jià)總體均值μ的區(qū)間估計(jì)的精度時(shí)常用絕對(duì)誤差來(lái)衡量,它是樣本均值與總體均值真值的誤差。由于總體均值的真值μ是無(wú)法得到的,因此估計(jì)的絕對(duì)誤差也無(wú)法計(jì)算,但在區(qū)間估計(jì)時(shí)需要控制這個(gè)絕對(duì)誤差的取值范圍,使它不超過(guò)一個(gè)極限值Δ,Δ 稱為區(qū)間估計(jì)的極限誤差。在區(qū)間估計(jì)中,置信度1-α和極限誤差Δ 呈正向關(guān)系。當(dāng)置信度1-α增大時(shí),區(qū)間估計(jì)錯(cuò)誤的概率α?xí)p小,但極限誤差Δ 會(huì)增大,估計(jì)的精度降低;反之,當(dāng)提高估計(jì)精度時(shí),極限誤差Δ 變小,但置信度1-α?xí)档?,區(qū)間估計(jì)錯(cuò)誤的概率α將增大。通過(guò)調(diào)節(jié)樣本容量可以有效調(diào)和區(qū)間估計(jì)錯(cuò)誤的概率α和極限誤差Δ 之間存在的矛盾。

        2.1 閉區(qū)間估計(jì)

        總體參數(shù)的閉區(qū)間估計(jì)是指在估計(jì)總體參數(shù)真值θ時(shí),所估計(jì)的1-α置信區(qū)間是一個(gè)既有上限值又有下限值的閉區(qū)間,即為θ的點(diǎn)估計(jì)值,Δ ≥0 為估計(jì)的極限誤差。

        2.2 開(kāi)區(qū)間估計(jì)

        總體參數(shù)的開(kāi)區(qū)間估計(jì)是指在估計(jì)總體參數(shù)真值θ時(shí),所估計(jì)的1-α置信區(qū)間是一個(gè)只有上限值或只有下限值的開(kāi)區(qū)間。其中,只有下限值的開(kāi)區(qū)間估計(jì)稱為最小值開(kāi)區(qū)間估計(jì),即只有上限值的開(kāi)區(qū)間估計(jì)稱為最大值開(kāi)區(qū)間估計(jì),即

        假設(shè)x1,x2,…,xn是來(lái)自總體X的一個(gè)簡(jiǎn)單隨機(jī)樣本,X~N(μ,σ2),σ2已知,

        2.2.1 最小值開(kāi)區(qū)間估計(jì)

        參照?qǐng)D2(b),在給定的置信度1-α下,有:

        2.2.2 最大值開(kāi)區(qū)間估計(jì)

        參照?qǐng)D2(a),在給定的置信度1-α下,有:

        3 假設(shè)檢驗(yàn)與區(qū)間估計(jì)兩種樣本容量確定方法的比較

        通過(guò)比較總體均值雙側(cè)檢驗(yàn)的必要樣本容量計(jì)算公式(4)、公式(7)和總體均值閉區(qū)間的必要樣本容量計(jì)算公式(14)、公式(15),以及總體均值單側(cè)檢驗(yàn)的必要樣本容量計(jì)算公式(10)、公式(11)和總體均值開(kāi)區(qū)間的必要樣本容量計(jì)算公式(17)、公式(18),可以得到如下結(jié)論:

        (1)對(duì)于單側(cè)檢驗(yàn)而言,無(wú)論是左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn),確定樣本容量都采用同一個(gè)計(jì)算公式;在進(jìn)行開(kāi)區(qū)間估計(jì)時(shí),無(wú)論是最小值開(kāi)區(qū)間估計(jì)還是最大值開(kāi)區(qū)間估計(jì),確定樣本容量也都采用同一個(gè)計(jì)算公式。單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)、閉區(qū)間估計(jì)和開(kāi)區(qū)間估計(jì),計(jì)算必要樣本容量的公式不相同但非常相似。在研究總體均值時(shí),只有一點(diǎn)不同:?jiǎn)蝹?cè)檢驗(yàn)或開(kāi)區(qū)間估計(jì)計(jì)算必要樣本容量公式中的zα在雙側(cè)檢驗(yàn)或閉區(qū)間估計(jì)中變成了

        (2)假設(shè)檢驗(yàn)和區(qū)間估計(jì)的必要樣本容量大小與抽樣的方式和方法有關(guān),不同的抽樣方式和方法下計(jì)算必要樣本容量的公式是不同的。就簡(jiǎn)單隨機(jī)抽樣方式而言,采用不重復(fù)抽樣方法的必要樣本容量小于重復(fù)抽樣方法的必要樣本容量。一般而言,分層抽樣、系統(tǒng)抽樣等其他抽樣方式有效地利用了已有的總體信息,降低了隨機(jī)抽樣的盲目性,使樣本的代表性增加,可以減小假設(shè)檢驗(yàn)和區(qū)間估計(jì)的必要樣本容量。

        (3)假設(shè)檢驗(yàn)和區(qū)間估計(jì)的必要樣本容量與總體方差成正比??傮w方差越大,總體中的個(gè)體變異程度越大,需要抽取更大容量的樣本,以保證假設(shè)檢驗(yàn)中兩類錯(cuò)誤的概率都得到有效控制或保證區(qū)間估計(jì)在一定的置信度下的估計(jì)精度。反之,總體方差越小,總體中的個(gè)體變異程度越低,只需要抽取較小容量的樣本就能滿足假設(shè)檢驗(yàn)或區(qū)間估計(jì)的設(shè)計(jì)需要。

        (4)在計(jì)算假設(shè)檢驗(yàn)的必要樣本容量時(shí),需要確定參數(shù)真值與其假設(shè)值之間的偏差,如|μ1-μ0|。在計(jì)算區(qū)間估計(jì)的必要樣本容量時(shí),需要確定參數(shù)真值與樣本估計(jì)值之間允許的最大偏差,如在實(shí)踐中,|μ1-μ0|和都是未知的,在確定必要樣本容量時(shí),可以通過(guò)分析增大或減小偏差帶來(lái)的成本和收益之間的平衡關(guān)系來(lái)確定這兩個(gè)離差的最大允許值。兩個(gè)最大允許偏差值均可以用Δ 來(lái)表示。

        4 兩類錯(cuò)誤下的區(qū)間估計(jì)必要樣本容量的確定

        作為統(tǒng)計(jì)推斷的兩個(gè)基本研究?jī)?nèi)容,參數(shù)的假設(shè)檢驗(yàn)和區(qū)間估計(jì)都是依據(jù)一個(gè)隨機(jī)樣本提供的統(tǒng)計(jì)信息和統(tǒng)計(jì)量的概率分布原理,在一定的概率保證下,對(duì)總體的數(shù)量特征進(jìn)行科學(xué)推斷。因此,可以用區(qū)間估計(jì)方法進(jìn)行假設(shè)檢驗(yàn),即在假設(shè)檢驗(yàn)中用區(qū)間估計(jì)準(zhǔn)則進(jìn)行檢驗(yàn)決策:構(gòu)造備擇假設(shè)H1的1-α置信區(qū)間,如果備擇假設(shè)H1的區(qū)間完全包含了這個(gè)1-α置信區(qū)間,那么就拒絕原假設(shè);否則,就接受原假設(shè)[7]。用區(qū)間估計(jì)準(zhǔn)則進(jìn)行假設(shè)檢驗(yàn)有助于從假設(shè)檢驗(yàn)的視角認(rèn)識(shí)區(qū)間估計(jì)問(wèn)題。

        可以把區(qū)間估計(jì)看作一個(gè)假設(shè)檢驗(yàn)問(wèn)題。對(duì)于單個(gè)總體均值的閉區(qū)間估計(jì),可以用下列假設(shè)檢驗(yàn)來(lái)表示:

        顯然,當(dāng)β=0.5,即zβ=0 時(shí),這樣的假設(shè)檢驗(yàn)的必要樣本容量與區(qū)間估計(jì)的必要樣本容量相等。由此可見(jiàn),參數(shù)區(qū)間估計(jì)的實(shí)質(zhì)是一個(gè)忽視納偽錯(cuò)誤的假設(shè)檢驗(yàn),它所檢驗(yàn)的假設(shè)值就是樣本估計(jì)值。忽視納偽錯(cuò)誤意味著當(dāng)總體參數(shù)的真值沒(méi)有落入所估計(jì)的1-α置信區(qū)間時(shí),接受這個(gè)置信區(qū)間和拒絕這個(gè)置信區(qū)間具有相同的概率,區(qū)間估計(jì)方法本身并不能為人們避免接受錯(cuò)誤的置信區(qū)間提供有用的信息,只能由決策人自己來(lái)做出判斷。

        如果期望區(qū)間估計(jì)和假設(shè)檢驗(yàn)一樣,能為人們避免接受錯(cuò)誤的置信區(qū)間提供幫助,那么就不能忽視納偽錯(cuò)誤,必須把納偽錯(cuò)誤發(fā)生的概率β和棄真錯(cuò)誤發(fā)生的概率α同時(shí)納入必要樣本容量的確定之中,使兩類錯(cuò)誤在區(qū)間估計(jì)中都得到有效控制。

        5 兩類錯(cuò)誤下區(qū)間估計(jì)的效果模擬

        在同時(shí)考慮兩類錯(cuò)誤的條件下進(jìn)行區(qū)間估計(jì)時(shí),納偽錯(cuò)誤發(fā)生的概率β應(yīng)控制在0.5以下,zβ>0。此時(shí),進(jìn)行區(qū)間估計(jì)的必要樣本容量n′大于僅考慮去真錯(cuò)誤時(shí)進(jìn)行區(qū)間估計(jì)的必要樣本容量n。由于必要樣本容量增大,因此當(dāng)其他條件不變時(shí),置信區(qū)間的寬度變窄,估計(jì)的精度提高。下面以簡(jiǎn)單重復(fù)抽樣為例,模擬驗(yàn)證在同時(shí)考慮兩類錯(cuò)誤的條件下區(qū)間估計(jì)必要樣本容量的變化及估計(jì)精度的變化。

        假設(shè)總體服從正態(tài)分布,且方差σ2已知,采用重復(fù)抽樣方法從總體中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本。在相同的置信度1-α和相同的極限誤差Δ 要求下,控制納偽錯(cuò)誤的概率β與不控制納偽錯(cuò)誤的概率β時(shí),進(jìn)行區(qū)間估計(jì)的必要樣本容量變化率δn的計(jì)算公式分別如下:

        抽取的必要樣本容量變化后,引起的置信區(qū)間寬度變化率δΔ的計(jì)算公式分別如下:

        當(dāng)分別取常用的置信度0.90、0.95和0.99時(shí),表1模擬了把納偽錯(cuò)誤的概率β控制在不同水平下的閉區(qū)間估計(jì)和開(kāi)區(qū)間估計(jì)必要樣本容量的變化率δn和置信區(qū)間寬度的變化率δΔ的變動(dòng)規(guī)律。δn為正值表明控制納偽錯(cuò)誤的概率β之后,必須增加必要樣本容量,才能在區(qū)間估計(jì)中滿足同時(shí)控制兩類錯(cuò)誤和極限誤差的要求;δΔ為負(fù)值表明控制納偽錯(cuò)誤的概率β之后,由于必要樣本容量增加,因此區(qū)間估計(jì)寬度變窄,估計(jì)的精度提高。

        表1 控制兩類錯(cuò)誤下置信區(qū)間寬度變化率和必要樣本容量變化率(單位:%)

        表1的模擬結(jié)果顯示,與不考慮納偽錯(cuò)誤的區(qū)間估計(jì)相比,將納偽錯(cuò)誤的概率β控制得越低,必要樣本容量增加得越多,估計(jì)結(jié)果的精度也越高。在相同的兩類錯(cuò)誤控制要求下,開(kāi)區(qū)間估計(jì)的必要樣本容量增加率和估計(jì)精度增加率高于閉區(qū)間估計(jì)。當(dāng)β取0.20時(shí),必要樣本容量約增加1 倍,區(qū)間估計(jì)的精度約增加30%。當(dāng)β取0.05 時(shí),必要樣本容量約增加1.6至4.2倍,區(qū)間估計(jì)的精度約增加41%至50%。當(dāng)β取值減小時(shí),由于必要樣本容量增加導(dǎo)致的抽樣成本增加的程度可能會(huì)大于估計(jì)精度增加的程度,因此β的取值不宜太小。

        6 結(jié)論

        本文通過(guò)對(duì)總體均值單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)確定必要樣本容量的方法和總體均值開(kāi)區(qū)間估計(jì)和閉區(qū)間估計(jì)確定必要樣本容量的方法進(jìn)行比較,發(fā)現(xiàn)二者所依據(jù)的數(shù)理統(tǒng)計(jì)原理相同,主要區(qū)別在于二者采用不同的統(tǒng)計(jì)方法來(lái)推斷總體的數(shù)量特征。區(qū)間估計(jì)所提供的方法可以用于進(jìn)行假設(shè)檢驗(yàn)。同理,區(qū)間估計(jì)也可以看作一種特殊的假設(shè)檢驗(yàn),即樣本統(tǒng)計(jì)量計(jì)算值是否與總體參數(shù)的真值在統(tǒng)計(jì)上顯著相同。在區(qū)間估計(jì)中,一般忽略了決策者使用置信區(qū)間時(shí)可能犯下的納偽錯(cuò)誤的概率為50%。如果決策者希望降低犯納偽錯(cuò)誤的概率,那么就需要在抽樣實(shí)驗(yàn)設(shè)計(jì)或抽樣調(diào)查設(shè)計(jì)中借助相應(yīng)的假設(shè)檢驗(yàn)方法來(lái)確定必要的樣本容量。當(dāng)其他條件不變時(shí),在估計(jì)置信區(qū)間時(shí)若要同時(shí)控制棄真錯(cuò)誤和納偽錯(cuò)誤的概率,則可以通過(guò)增加樣本容量的方法來(lái)實(shí)現(xiàn),進(jìn)而提高置信區(qū)間的精度。

        猜你喜歡
        開(kāi)區(qū)間樣本容量假設(shè)檢驗(yàn)
        羅爾定理中輔助函數(shù)的構(gòu)造法
        采用無(wú)核密度儀檢測(cè)壓實(shí)度的樣本容量確定方法
        統(tǒng)計(jì)推斷的研究
        雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
        Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
        統(tǒng)計(jì)學(xué)教學(xué)中關(guān)于假設(shè)檢驗(yàn)問(wèn)題探討
        導(dǎo)函數(shù)在開(kāi)區(qū)間上的性質(zhì)
        有限覆蓋定理在若干數(shù)學(xué)命題證明中的應(yīng)用①
        閉區(qū)間有限覆蓋的算法
        廣義高斯分布參數(shù)估值與樣本容量關(guān)系
        熟女体下毛毛黑森林| 日韩一二三四区在线观看| 蜜桃传媒免费在线播放| 天天噜日日噜狠狠噜免费| 中文字幕无码免费久久| 一级无码啪啪| 少妇又紧又爽丰满在线视频| 国产精品国产三级国产专播| 极品嫩模大尺度av在线播放| 亚洲国产成人精品无码区二本| 奇米狠狠色| 日本女优中文字幕在线观看| 就爱射视频在线视频在线| 精品国产拍国产天天人 | av无码一区二区三区| 又黄又爽又色又刺激的视频| 国产美女a做受大片免费| 国产毛片一区二区三区| 激情亚洲一区国产精品| 蜜桃无码一区二区三区| 中文字幕一区二区人妻出轨| 日本高清无卡一区二区三区| 中文字幕乱码亚洲三区| 极品白嫩的小少妇| 午夜国产在线| 国产麻豆一区二区三区在线播放| 亚洲一区二区三区在线看| 精品成在人线av无码免费看| 久久精品无码鲁网中文电影| 亚洲成人激情在线影院| 久久天堂一区二区三区av| 亚洲精品乱码久久久久久久久久久久 | 日韩黑人欧美在线视频观看| 国产一区二区黑丝美女| 人妻少妇精品中文字幕专区| 国产精品久久久久久52avav| 久久夜色精品国产噜噜噜亚洲av | 青青青爽在线视频免费播放 | 国产一级黄色片在线播放| 日韩免费视频| 熟妇激情内射com|