葉鴻烈
【摘要】以具體工作中的假設(shè)檢驗(yàn)的兩個(gè)例子,嘗試回答假設(shè)檢驗(yàn)教學(xué)中經(jīng)常碰到的幾個(gè)問(wèn)題,如果某事件在一次實(shí)驗(yàn)中發(fā)生了,就有足夠的理由認(rèn)為這個(gè)事件不是小概率事件,在參數(shù)估計(jì)中,根據(jù)樣本所提供的信息,求出總體參數(shù)置信區(qū)間,就能以一定的置信水平保證總體參數(shù)落在該置信區(qū)間內(nèi)。在假設(shè)檢驗(yàn)中,如果原假設(shè)為真,樣本對(duì)應(yīng)的統(tǒng)計(jì)量值落在置信區(qū)間外的可能性是很小的,而假如一旦落在置信區(qū)間內(nèi),就可以拒絕原假設(shè)。對(duì)于如何建立原假設(shè),本文提出兩個(gè)原則,拒絕原則和棄真成本比較原則,對(duì)具有方向性的并且統(tǒng)計(jì)量值在置信區(qū)間內(nèi)的假設(shè)檢驗(yàn)具有實(shí)踐指導(dǎo)作用。
【關(guān)鍵詞】假設(shè)檢驗(yàn)參數(shù)估計(jì)小概率原理
【基金項(xiàng)目】2013年廣西高等教育教學(xué)改革工程立項(xiàng)項(xiàng)目(編號(hào):2013JGA427)資助。
【中圖分類(lèi)號(hào)】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2014)05-0248-02
《統(tǒng)計(jì)學(xué)》是教育部規(guī)定的經(jīng)管類(lèi)專(zhuān)業(yè)必須開(kāi)設(shè)的核心課程,為決策者提供數(shù)量依據(jù)的一門(mén)方法論學(xué)科。該課程在本科經(jīng)管類(lèi)專(zhuān)業(yè)的內(nèi)容主要分三大塊,描述統(tǒng)計(jì)、推斷統(tǒng)計(jì),統(tǒng)計(jì)應(yīng)用部分,其中統(tǒng)計(jì)應(yīng)用部分主要是講述基于推斷統(tǒng)計(jì)基礎(chǔ)上特別是應(yīng)用假設(shè)檢驗(yàn)方法解決具體問(wèn)題。因此推斷統(tǒng)計(jì)中的假設(shè)檢驗(yàn)是一個(gè)重點(diǎn)內(nèi)容,但這部分內(nèi)容學(xué)生以前沒(méi)有接觸過(guò),特別是經(jīng)管類(lèi)專(zhuān)業(yè)招生時(shí)為文理兼招,數(shù)學(xué)的基礎(chǔ)不是特別理想,學(xué)生在學(xué)習(xí)的很多時(shí)候,知其然而不知其所以然。如何講清楚假設(shè)檢驗(yàn)內(nèi)容是一個(gè)難題,本文嘗試在疏理傳統(tǒng)教材的前提下,提出一些的新的講述方法。
1.假設(shè)檢驗(yàn)授課的困惑
傳統(tǒng)的教學(xué)順序是,從小概率原理出發(fā),說(shuō)明假設(shè)檢驗(yàn)的基本思想,介紹假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤,建立假設(shè)檢驗(yàn)的基本步驟。但存在下面幾個(gè)問(wèn)題,試以下面例子說(shuō)明。某燈泡生產(chǎn)企業(yè)欲向某超市提供一批燈泡,按合同規(guī)定,燈泡的使用壽命平均不能低于2000小時(shí)。假定燈泡使用壽命服從正態(tài)分布,且標(biāo)準(zhǔn)差為250小時(shí)。燈泡生產(chǎn)企業(yè)為確認(rèn)這批燈泡的使用壽命,隨機(jī)測(cè)試了30只燈泡,并算得樣本均值為1998小時(shí)?,F(xiàn)在來(lái)研究超市是否應(yīng)該接受這批燈泡?(α=0.05)。首先,使用區(qū)間估計(jì)方法,這里,■■=1998,n=30 , Z■=1.96 , σ=250 ,■±Z■×■=1998±1.96×■=1998±89.42 即,(1908.58,2087.42),這里包含了2000,顯然超市是應(yīng)該接受這批燈泡的。但是,學(xué)生的困惑是,這里面不是也有很多的數(shù)據(jù)處在2000以下嗎?現(xiàn)試用假設(shè)檢驗(yàn),這是一個(gè)關(guān)于單個(gè)正態(tài)總體均值的具有方向性的單邊檢驗(yàn)問(wèn)題,可以設(shè)立兩種原假設(shè),原假設(shè)一,H0:μ≥2000,H1:μ<2000,Z=■=■=-0.044,大于-Z0.05=-1.645因此結(jié)論是沒(méi)有證據(jù)表明能夠拒絕原假設(shè),超市是應(yīng)該接受這批燈泡。另外原假設(shè)二,H0:μ≤2000,H1:μ>2000,Z=■=■=-0.044 ,小于Z0.05=1.645,因此,結(jié)論是沒(méi)有證據(jù)表明能夠拒絕原假設(shè),超市是不應(yīng)該接受這批燈泡。學(xué)生在此又有一個(gè)困惑,原假設(shè)不同,得到的結(jié)論卻是不同的。其實(shí),關(guān)鍵的地方應(yīng)該給學(xué)生講清楚下面幾個(gè)問(wèn)題,第一,有了教材前面的區(qū)間估計(jì)方法,為什么還要講述假設(shè)檢驗(yàn)?假設(shè)檢驗(yàn)和區(qū)間估計(jì)有什么異同?它們各自的適用范圍。第二,顯著性水平的含義α=0.05是什么?第三,原假定的建立有什么原則嗎?采用不同的原假設(shè),得出相反的兩個(gè)結(jié)論原因是什么。第四,兩類(lèi)錯(cuò)誤的關(guān)系如何理解?在傳統(tǒng)假設(shè)檢驗(yàn)的教學(xué)中,老師重點(diǎn)放在讓學(xué)生對(duì)在給定的原假設(shè)基礎(chǔ)上如何選擇合適的檢驗(yàn)統(tǒng)計(jì)量并進(jìn)行計(jì)算,讓學(xué)生判斷樣本數(shù)據(jù)是否落入拒絕域從而做出拒絕或接受原假設(shè),結(jié)果是大部分學(xué)生在學(xué)習(xí)假設(shè)檢驗(yàn)過(guò)程中總是死記硬背各類(lèi)檢驗(yàn)統(tǒng)計(jì)量和拒絕域的具體形式,忽略假設(shè)檢驗(yàn)的統(tǒng)計(jì)思想的培養(yǎng)與統(tǒng)計(jì)方法的掌握,沒(méi)能達(dá)到“舉一反三”的學(xué)習(xí)效果。
2.問(wèn)題的解決
首先,我們要講清楚小概率事件原理,小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。小概率事件沒(méi)有發(fā)生不奇怪,我們感興趣的是奇怪的事情,小概率事件發(fā)生了,這說(shuō)明原設(shè)定的小概率事件不是小概率事件,另外還要明確假設(shè)檢驗(yàn)中到底什么是小概率事件。上面的例子計(jì)算的Z值對(duì)應(yīng)的概率換算為0.4825,比0.05大多了,顯然不是一個(gè)小概率事件。區(qū)間估計(jì)和假設(shè)檢驗(yàn)有什么異同?置信區(qū)間可以回答假設(shè)檢驗(yàn)的問(wèn)題,算得的置信區(qū)間如不包含原假設(shè),則拒絕原假設(shè)。如包含了原假設(shè),則不拒絕原假設(shè),但可信區(qū)間不能代替假設(shè)檢驗(yàn), 可信區(qū)間只能在預(yù)先規(guī)定的α水準(zhǔn)下計(jì)算, 而假設(shè)檢驗(yàn)?zāi)苡?jì)算較為確切的 P 值。參數(shù)估計(jì)解決的是范圍問(wèn)題,假設(shè)檢驗(yàn)則判斷結(jié)論是否成立。另外 ,兩者對(duì)問(wèn)題的了解程度各不相同。進(jìn)行區(qū)間估計(jì)之前不了解未知參數(shù)的有關(guān)信息。而假設(shè)檢驗(yàn)對(duì)未知參數(shù)的信息有所了解,但作出某種判斷無(wú)確切把握?,F(xiàn)實(shí)工作中更多的是使用假設(shè)檢驗(yàn),比如,上例的燈泡案例用參數(shù)估計(jì)計(jì)算出來(lái)的范圍盡管包含了2000,但也包含了太多的2000以下的數(shù)據(jù),給管理者作出決策帶來(lái)太多的風(fēng)險(xiǎn)。但假設(shè)檢驗(yàn)就能定性地給出結(jié)論,并告訴管理者有多大的把握。那么,如何建立原假設(shè)?上面的例子,由于采用不同的原假設(shè),得出絕然相反的兩個(gè)結(jié)論。根據(jù)NEYMAN和 PEARSON提出的“在控制犯第一類(lèi)錯(cuò)誤的概率α的條件下,盡量使犯第二類(lèi)錯(cuò)誤的概率β減小”原則,在解決具體問(wèn)題時(shí)只限制α的大小而忽略β ,在假設(shè)檢驗(yàn)時(shí)更傾向拒絕原假設(shè)而不是接受。因?yàn)榧偃缇芙^了原假設(shè),我們就有1-α信心相信原假設(shè)為偽,即只有α的概率大小犯錯(cuò)誤,從實(shí)際上說(shuō)就是因?yàn)槭孪纫呀?jīng)對(duì)原假設(shè)產(chǎn)生了懷疑而純粹為了推翻或拒絕它。基本原則是從檢驗(yàn)者本身的目的出發(fā),將希望推翻或拒絕的結(jié)論設(shè)為原假設(shè),這一原則或者叫拒絕原則。另外,從可能犯錯(cuò)成本角度來(lái)看,否定原假設(shè)的概率是α,假如原假設(shè)是對(duì)的,我們拒絕了,拒真錯(cuò)誤概率就是α,如果拒真造成的犯錯(cuò)成本很高,說(shuō)明這時(shí)設(shè)定的原假設(shè)就設(shè)對(duì)了,因?yàn)橐懈喔鼑?yán)格的證據(jù)才能拒絕原假設(shè)。具體到上面的燈泡例子。使用拒絕原則,我們認(rèn)為該批產(chǎn)品不合格,原假設(shè)H0:μ≥ 2000.,H1:μ<2000,原假設(shè)是我們拒絕的。如果我們認(rèn)為該批產(chǎn)品合格,H0:μ≤2000,H1:μ>2000,原假設(shè)是我們拒絕的。具體到實(shí)際工作中,我們找證據(jù)證實(shí)產(chǎn)品合格比證實(shí)不合格要困難得多。使用拒真成本最高原則分析,產(chǎn)品實(shí)際上是好的,被我們拒絕了:H0:μ≥ 2000.,H1:μ<2000,造成的損失,和這批產(chǎn)品是差的但我們沒(méi)有拒絕H0:μ≤2000,H1:μ>2000,造成的損失相比那個(gè)更大?現(xiàn)實(shí)工作中,使用不合格產(chǎn)品比不使用合格產(chǎn)品造成的損失要大得多。所以,對(duì)于具有方向性的統(tǒng)計(jì)量的假設(shè)檢驗(yàn)分析,假如計(jì)算出來(lái)的統(tǒng)計(jì)量值在(-1.65,1.65.α=0.05)或者(-1.96,1.96.α=0.01)之間,或者轉(zhuǎn)換概率P值大于0.05或者0.01,則建議加大樣本量,或者根據(jù)拒真成本最高原則來(lái)設(shè)定原假設(shè),比如上述燈泡例子,建議取H0:μ≤2000,H1:μ>2000,結(jié)論是超市不應(yīng)該接受這批燈泡。再者,顯著性水平的含義是什么?小概率事件在一次實(shí)驗(yàn)中居然發(fā)生了, 說(shuō)明原假設(shè)顯著的不成立,此時(shí)我們拒絕原假設(shè)犯錯(cuò)誤的概率為α,因?yàn)棣梁苄?一般是0.05, 0.01等, α也稱(chēng)為顯著性水平,也就是拒真的概率,也就是說(shuō),樣本證明要拒絕原假設(shè),但畢竟是樣本,要冒概率α犯錯(cuò)誤的風(fēng)險(xiǎn)。這就是所謂的第一類(lèi)錯(cuò)誤,如果樣本證明沒(méi)能拒絕原假設(shè),只能說(shuō)明觀(guān)測(cè)值與零假設(shè)不矛盾,但并不能肯定原假設(shè)為真,此時(shí)接受原假設(shè)會(huì)以概率β冒取偽的風(fēng)險(xiǎn),這就是第二類(lèi)錯(cuò)誤,在一定的樣本量條件下,犯第一類(lèi)錯(cuò)誤概率小,則犯第二類(lèi)錯(cuò)誤概率就大。
以下面的例子結(jié)束我們的討論。 咖啡生產(chǎn)廠(chǎng)商在其產(chǎn)品標(biāo)簽上聲稱(chēng),其出品的咖啡罐頭平均重量為1.5千克或者以上,監(jiān)督部門(mén)對(duì)其咖啡罐頭產(chǎn)品進(jìn)行質(zhì)量檢查,根據(jù)以往的數(shù)據(jù)得知,咖啡罐頭重量標(biāo)準(zhǔn)差為0.05千克。今隨機(jī)抽取了49聽(tīng)咖啡罐頭,測(cè)量其重量,平均重量為1.49千克。要求在0.05的顯著性水平下,檢驗(yàn)咖啡罐頭重量的總體均值是否與標(biāo)簽上聲稱(chēng)的內(nèi)容相符?
這是一個(gè)具有方向性的檢驗(yàn)問(wèn)題。這里也有兩個(gè)原假設(shè)。如果使用上述的拒絕原則,原假設(shè)是H0:μ≥1.5,Z=■=■=-1.4>-1.645,沒(méi)有證據(jù)表明能夠拒絕原假定,但從犯拒真的成本的大小來(lái)分析,使用了不合格的產(chǎn)品的風(fēng)險(xiǎn)成本比不使用合格的產(chǎn)品的風(fēng)險(xiǎn)成本要大,所以,原假定應(yīng)該是:H0:μ≤1.5, Z=■=■=-1.4<1.65,沒(méi)有證據(jù)表明能夠拒絕原假設(shè)。實(shí)際檢驗(yàn)工作中,對(duì)于方向性明確的問(wèn)題,一定要從風(fēng)險(xiǎn)成本出發(fā)確定原假設(shè),否則,增大樣本量,或者做出讓步。
本文以具體工作中的假設(shè)檢驗(yàn)的兩個(gè)例子,嘗試回答假設(shè)檢驗(yàn)教學(xué)中經(jīng)常碰到的幾個(gè)問(wèn)題,主要是要求學(xué)生正確理解小概率事件原理,顯著性水平的含義等概念,要求學(xué)生掌握如果某事件發(fā)生的概率很小,在一次實(shí)驗(yàn)中,是可以忽略它的,也就是說(shuō)明在一次實(shí)驗(yàn)中該事件是不會(huì)發(fā)生的,如果某事件在一次實(shí)驗(yàn)中就發(fā)生了,就有足夠的理由認(rèn)為這個(gè)事件不是小概率事件,也就不能忽略它等基本思想?;卮鹆藚?shù)估計(jì)與假設(shè)檢查的異同,在參數(shù)估計(jì)中,我們是根據(jù)樣本所提供的信息,求出總體參數(shù)置信區(qū)間,以一定的置信水平保證總體參數(shù)落在該置信區(qū)間內(nèi)。在假設(shè)檢驗(yàn)中,由臨界值圍成的區(qū)域就是以總體均值為中心的置信區(qū)間。如果原假設(shè)為真,樣本對(duì)應(yīng)的統(tǒng)計(jì)量值落在置信區(qū)間外的可能性是很小的,而假如一旦落在外面,利用“小概率原理”就可以拒絕原假設(shè)。對(duì)于如何建立原假設(shè),本文提出兩個(gè)原則,拒絕原則和棄真成本原則,特別是對(duì)具有方向性的并且統(tǒng)計(jì)量值在置信區(qū)間內(nèi)假設(shè)檢驗(yàn)具有實(shí)踐指導(dǎo)作用,教師的教學(xué)不僅要向?qū)W生傳授學(xué)科知識(shí),更為重要的是培養(yǎng)學(xué)生主動(dòng)學(xué)習(xí)、思考的學(xué)習(xí)方式。在實(shí)際教學(xué)環(huán)節(jié)中,這就要求授課教師要做到能夠準(zhǔn)確的把握重點(diǎn)和難點(diǎn),對(duì)重難點(diǎn)內(nèi)容既要能夠擴(kuò)展引申,也要能夠深入剖析。 此外,教師還必須對(duì)重點(diǎn)問(wèn)題做好總結(jié)歸納,將實(shí)際問(wèn)題與理論相結(jié)合,通過(guò)案例教學(xué)的方式,最大程度上調(diào)動(dòng)學(xué)生的學(xué)習(xí)積極性,培養(yǎng)學(xué)生創(chuàng)新思維,特別是統(tǒng)計(jì)學(xué)教學(xué)尤其是這樣,激發(fā)學(xué)生學(xué)習(xí)熱情,提高學(xué)習(xí)效果,實(shí)現(xiàn)有效學(xué)習(xí)與有效教學(xué),解決學(xué)生對(duì)該課程學(xué)習(xí)的難學(xué)難記的問(wèn)題,培養(yǎng)他們利用《統(tǒng)計(jì)學(xué)》知識(shí)分析、解決實(shí)際問(wèn)題的能力,使學(xué)生具有較強(qiáng)的理論與實(shí)踐應(yīng)用能力、獨(dú)立分析與解決問(wèn)題能力、交流與合作能力等,為學(xué)生學(xué)習(xí)相關(guān)課程以及今后實(shí)際工作中打下扎實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ),提高學(xué)生的就業(yè)能力。
參考文獻(xiàn):
[1]蒲冰.對(duì)假設(shè)檢驗(yàn)的教學(xué)探討[J].重慶科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2011年第2期:193-194.
[2]王藝明. 假設(shè)檢驗(yàn)教學(xué)和應(yīng)用中的幾個(gè)問(wèn)題探討[J].廈門(mén)廣播電視大學(xué)學(xué)報(bào),2007年第1 期:57-59.
[3]曹遠(yuǎn)紅. 體育統(tǒng)計(jì)教學(xué)中假設(shè)檢驗(yàn)的教學(xué)方法建議[J].湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版),2011年第2期:203-204.
[4]郭寶才,孫利榮.關(guān)于假設(shè)檢驗(yàn)中的幾個(gè)問(wèn)題的探討[J]. 統(tǒng)計(jì)與決策,2010年第6期(總第 306 期):10-11.
[5]劉群鋒. 假設(shè)檢驗(yàn)中的三個(gè)問(wèn)題及其思考[J].大學(xué)數(shù)學(xué),2008年10月第24卷第5期:190-193.
[6]詹曉琳,沈薇薇. 顯著性假設(shè)檢驗(yàn)中原假設(shè)的建立[J].上海第二工業(yè)大學(xué)學(xué)報(bào),2010年6月第 27卷第 2 期:156-159.
[7]馮力.統(tǒng)計(jì)學(xué)[J].東北財(cái)經(jīng)大學(xué)出版社,2011年1月第1版.