屈麗娜
【摘 要】假設(shè)檢驗(yàn)在統(tǒng)計(jì)推斷中是一項(xiàng)十分重要內(nèi)容,它在數(shù)理統(tǒng)計(jì)中占有相當(dāng)重要的地位。它是對總體參數(shù)的取值給出某種假設(shè)后,根據(jù)樣本信息來判斷所做的假設(shè)是否成立,最后做出某種決策的一種推斷方法[1]。本文主要介紹了對假設(shè)檢驗(yàn)中原假設(shè)的選取問題和假設(shè)檢驗(yàn)中產(chǎn)生兩類錯誤的原因進(jìn)行研究,并且計(jì)算兩類錯誤的概率。
【關(guān)鍵詞】假設(shè)檢驗(yàn) 原假設(shè) 兩類錯誤
一、假設(shè)檢驗(yàn)的基本思想及方法
假設(shè)檢驗(yàn)是指總體提出某項(xiàng)假設(shè),然后利用從總體中抽樣所得的樣本值來驗(yàn)證所提出假設(shè)是否正確。在給定備擇假設(shè)H1的情況下對原假設(shè)H0,如果我們拒絕了原假設(shè)H0,這也就意味著我們必須接受備擇假設(shè)H1,相反的,我們就只能接受原假設(shè)H0。
我們一般可以把假設(shè)檢驗(yàn)分為四步進(jìn)行:(1)依據(jù)實(shí)際的問題提出原假設(shè)H0與備擇假設(shè)H0;(2)選擇合理的檢驗(yàn)統(tǒng)計(jì)量,并且在原假設(shè)H0成立的情況下確定統(tǒng)計(jì)量的分布;(3)按問題的具體要求,選取恰當(dāng)?shù)娘@著性水平α,并且確定原假設(shè)H0的拒絕域;(4)依據(jù)樣本觀察值來計(jì)算統(tǒng)計(jì)量的觀察值,并與原假設(shè)的拒絕域進(jìn)行比較,從而做出拒絕或接受原假設(shè)H0的判斷。在假設(shè)檢驗(yàn)的四步中,提出原假設(shè)H0與備擇假設(shè)H1是第一步,這一步在假設(shè)檢驗(yàn)中占有舉足輕重的地位。以下將通過實(shí)例對原假設(shè)的選取問題進(jìn)行深入的分析[2]。
二、原假設(shè)的選取
(一)問題的提出
利用假設(shè)檢驗(yàn)解決一些實(shí)際問題時,常會發(fā)生一種狀況,即對于同一個樣本信息,由于原假設(shè)H0的選取不同,可能會得到兩種完全相反的檢驗(yàn)結(jié)果。下面我通過兩個實(shí)例來說明一下:
例1:某廠批量生產(chǎn)的電燈泡的質(zhì)量標(biāo)準(zhǔn)為平均使用壽命1000小時。該廠稱他們引進(jìn)了一種新技術(shù)后生產(chǎn)的電燈泡質(zhì)量高于規(guī)定標(biāo)準(zhǔn)。為了證實(shí)廠家所說的真實(shí)性,工作人員隨機(jī)抽取了250個燈泡作為樣本,測試電燈泡的平均使用壽命1035小時,其標(biāo)準(zhǔn)差為100小時。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)?
μ值未落入了拒絕域內(nèi),因此接受原假設(shè)H0,即不能說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)。
通過例1我們觀察到在同一顯著性水平α下,由于將原假設(shè)H0與備擇假設(shè)H1的位置調(diào)換,產(chǎn)生了完全相反的檢驗(yàn)結(jié)論。這就說明了原假設(shè)的選取對假設(shè)檢驗(yàn)問題的解決有著至關(guān)重要的地位。
假設(shè)檢驗(yàn)問題的第一步即為建立假設(shè),正確合理地確定原假設(shè)與備擇假設(shè)。這對檢驗(yàn)結(jié)果的正確與否起到很大的作用,因此正確建立假設(shè)是解決問題的關(guān)鍵。在解決假設(shè)檢驗(yàn)問題時,在假設(shè)檢驗(yàn)中原假設(shè)和備擇假設(shè)地位是不平等的,原假設(shè)是受到保護(hù)的。
(二)原假設(shè)的選取原則
因?yàn)樵僭O(shè)是處于被保護(hù)地位,在實(shí)際問題中選取原假設(shè)時應(yīng)該遵循以下三點(diǎn)原則:
1.參考過去的有效信息
2.將希望否定的作為原假設(shè)
3.將拒絕后導(dǎo)致嚴(yán)重后果的作為原假設(shè)
三、假設(shè)檢驗(yàn)的兩類錯誤
(一)兩類錯誤產(chǎn)生的原因
在假設(shè)檢驗(yàn)中,檢驗(yàn)結(jié)果與實(shí)際的情況可能吻合也可能不吻合,因此,檢驗(yàn)中犯錯誤是很有可能的[3]。檢驗(yàn)可能犯的錯誤有兩類:第一類是當(dāng)H0為真時,由于隨機(jī)性使得樣本觀測值落入拒絕域中,導(dǎo)致結(jié)果拒絕原假設(shè)H0,這種錯誤稱為第一類錯誤,其發(fā)生的概率稱為犯第一類錯誤的概率,或稱拒真概率,通常記為α;第二類錯誤是當(dāng)H0不是真的,即H1為真時,由于隨機(jī)性使得樣本觀測值落入接受域中,導(dǎo)致結(jié)果為接受原假設(shè)H0,這種錯誤稱為第二類錯誤,其發(fā)生的概率稱為犯第二類錯誤的概率,或稱取偽概率,通常記為β[2]。
(二)兩類錯誤的概率的計(jì)算
當(dāng)我們知道了假設(shè)檢驗(yàn)的兩類錯誤發(fā)生的原因時,這就為我們計(jì)算它們出現(xiàn)的概率奠定了基礎(chǔ)。從之前的分析,我們知道了,第一類錯誤是由于實(shí)際推斷原理所引起的,即“小概率事件不會發(fā)生”的假定引起的,所以小概率事件發(fā)生的概率即顯著性水平α就是第一類錯誤發(fā)生的概率[4]。
犯第二類錯誤的概率計(jì)算相比較而言是復(fù)雜的,因此我們在上述例子的基礎(chǔ)上進(jìn)行進(jìn)一步的設(shè)計(jì):該公司職員實(shí)際工資不是870元,而是860元,原假設(shè)為假,我們依舊假設(shè)實(shí)際工資是870元。下面我們分別作出總體均值為860元和870元這兩種情況下的正態(tài)分布曲線(A和B)我們能夠明確地知道,在理論上存在的若干個樣本均值中,一旦某個樣本均值864.4<<875.6時,我們將把870元誤認(rèn)為總體均值,不拒絕原假設(shè)。由于860元才是真實(shí)的情況,所以我們就犯了第二類錯誤,即取偽錯誤。犯第二類錯誤概率的大小是相對于正態(tài)曲線A而言的,圖1中陰影部分的面積計(jì)算:
結(jié)論
本文主要探討了假設(shè)檢驗(yàn)中的幾個問題。首先說明了假設(shè)檢驗(yàn)的基本思想以及假設(shè)檢驗(yàn)的一般步驟;然后論述了假設(shè)檢驗(yàn)的第一步原假設(shè)的選取,最后簡述了假設(shè)檢驗(yàn)中兩類錯誤,說明產(chǎn)生“棄真錯誤”和“取偽錯誤”的原因,文中又進(jìn)一步給出例題進(jìn)行說明,并計(jì)算出兩類錯誤的概率[5]。
【參考文獻(xiàn)】
[1]詹曉琳,沈薇薇.顯著性假設(shè)檢驗(yàn)中原假設(shè)的建立[J].上海第二工業(yè)大學(xué)學(xué)報(bào),2012(2).
[2]茆詩柳,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京.高等教育出版社,2004.
[3]韓兆洲等.假設(shè)檢驗(yàn)的一個常見誤區(qū)[J].統(tǒng)計(jì)與信息論壇,2005(1).
[4] 李文華.雷金星.假設(shè)檢驗(yàn)中兩類錯誤的成因、發(fā)生概率及其相關(guān)問題[J].統(tǒng)計(jì)與決策,2005(4):117-119.
[5]曹遠(yuǎn)紅.假設(shè)檢驗(yàn)在體育統(tǒng)計(jì)應(yīng)用中注意的兩個問題[J].湖南科技學(xué)院學(xué)報(bào),2011(12).endprint