宋繼革
一、引言
推斷統(tǒng)計(jì)中的一個(gè)重要內(nèi)容,就是假設(shè)檢驗(yàn)。通過多年的教學(xué)實(shí)踐,發(fā)現(xiàn)學(xué)生對這部分教學(xué)內(nèi)容接受困難。甚至在畢業(yè)多年之后,還坦言,自己當(dāng)時(shí)沒有搞清楚。通過思考,引入了一個(gè)“中大獎(jiǎng)”判斷的例子,將假設(shè)檢驗(yàn)的基本思想與方法串連起來,取得了非常好的教學(xué)效果。
二、案例的引入
假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)一個(gè)非常重要的內(nèi)容,思想性強(qiáng)。學(xué)生們往往把假設(shè)檢驗(yàn)這部分內(nèi)容當(dāng)成數(shù)學(xué)來學(xué),忽略了其中的部分主觀性。原假設(shè)與備擇假設(shè)、小概率原理、兩類錯(cuò)誤、拒絕域與接受域、P值檢驗(yàn)等概念本身的邏輯性與連貫性,需要一個(gè)背景簡單的案例串連起來,以便取得良好的教學(xué)效果。
1、“中大獎(jiǎng)”問題的提出
如果,作為統(tǒng)計(jì)學(xué)教師的我,今天向大家宣布:我昨天買了一張彩票,中了500萬。你們信不信?信的同學(xué)有自己的理由:這是老師說的。不信的同學(xué)也有理由:可能性太小了。這就需要統(tǒng)計(jì)學(xué)意義上的假設(shè)檢驗(yàn)。
2、原假設(shè)與備擇假設(shè)概念的引入
誰來做假設(shè)檢驗(yàn)?zāi)??是不信的同學(xué),他們希望收集證據(jù),以支持不信的觀點(diǎn)。這就是假設(shè)檢驗(yàn)的主觀性,它是有立場的。假設(shè)檢驗(yàn)不是純粹的數(shù)學(xué)。
原假設(shè):研究者想收集證據(jù)予以反對的假設(shè)稱為原假設(shè),記為 ;備擇假設(shè):研究者想收集證據(jù)予以支持的假設(shè)稱為備擇假設(shè),記為 。這里,原假設(shè)應(yīng)該是“老師說的是真話”,備擇假設(shè)應(yīng)該是“老師說的是假話”。 原假設(shè)與備擇假設(shè)是“非此即彼”的關(guān)系。
3、小概率原理與顯著性水平的引入
一個(gè)事件如果發(fā)生概率很小,那么它在一次試驗(yàn)中是不可能發(fā)生的。通常把5%作為一個(gè)界限,發(fā)生概率在5%以下的事件,被稱為小概率事件。如果老師說的話,連5%的可能性都沒有,我們就有充分的理由拒絕相信。假設(shè)檢驗(yàn)的核心思想就是,在肯定原假設(shè)的基礎(chǔ)上,是不是會引起小概率事件?如果發(fā)生了小概率事件,就拒絕原假設(shè);如果沒有發(fā)生小概率事件,就不能拒絕原假設(shè)。這個(gè)5%,就是顯著性水平。我們可以設(shè)的更小,以增加說服力。
4、兩類錯(cuò)誤
其實(shí),我們無論是信,還是不信,都無法避免出錯(cuò)。棄真錯(cuò)誤:原假設(shè)為真,拒絕原假設(shè)。取偽錯(cuò)誤:原假設(shè)為假,接受原假設(shè)。我們拒絕老師說的話,認(rèn)為他不可能中大獎(jiǎng)時(shí),有可能犯棄真錯(cuò)誤;我們接受老師說的話,認(rèn)為他中了大獎(jiǎng),有可能犯取偽錯(cuò)誤。一般認(rèn)為,需要控制棄真錯(cuò)誤的概率,使之不超過5%、1%等。
5、拒絕域與接受域、P值檢驗(yàn)
基本概念了解之后,拒絕域與接受域、P值檢驗(yàn)不過是具體操作過程,來進(jìn)行判斷了。我們可以到彩票站收集樣本數(shù)據(jù),發(fā)現(xiàn)中大獎(jiǎng)的概率不足5%,甚至不足萬分之一。中大獎(jiǎng)完全是一個(gè)小概率事件,拒絕原假設(shè),理由是充分的,犯錯(cuò)誤的概率很小,遠(yuǎn)低于顯著性水平。
三、假設(shè)檢驗(yàn)基本原理的實(shí)際應(yīng)用
1、問題分析
由統(tǒng)計(jì)資料得知,去年某地區(qū)新生兒平均體重為3190克,標(biāo)準(zhǔn)差80克。現(xiàn)從今年新生兒中隨機(jī)抽取了100個(gè),測得其平均體重為3210克,請問今年與上一年相比新生兒體重有無明顯差異?
20克的差異究竟意味著什么呢?兩種觀點(diǎn)。第一種觀點(diǎn): 20克的差異不過是抽樣的隨機(jī)性引起的,也就是說抽取的100個(gè)新生兒中恰好有幾個(gè)超重的,拉高了平均值。不需要進(jìn)一步調(diào)查分析。第二種觀點(diǎn):20克的差異太大了,抽樣的隨機(jī)性不足以解釋這么大的差異。有必要進(jìn)一步調(diào)查分析。所以,假設(shè)檢驗(yàn)工作是由持第二種觀點(diǎn)的人做的。
2、原假設(shè)與備擇假設(shè)的確定
原假設(shè)是研究者想收集證據(jù)予以反對的假設(shè)。進(jìn)行假設(shè)檢驗(yàn)的人,是持第二種觀點(diǎn)的人。所以,原假設(shè)應(yīng)該是:“今年與去年相比,新生兒體重沒什么變化”,備擇假設(shè)則與之相反,應(yīng)該是:“今年與去年相比,新生兒體重有明顯變化”。我們把它用數(shù)學(xué)語言來描述,就是: (這是一個(gè)雙側(cè)檢驗(yàn), 過大或是過小,都將導(dǎo)致推翻原假設(shè))
3、檢驗(yàn)統(tǒng)計(jì)量的確定
假設(shè)檢驗(yàn)從邏輯上說,是一種反證法,在肯定原假設(shè)的基礎(chǔ)上,看看是不是能推導(dǎo)出一個(gè)小概率事件。如果說,“今年與去年相比,新生兒體重沒什么變化”是正確的話,那么根據(jù)中心極限定理, 。這就是我們構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量。樣本均值是一個(gè)均值為總體均值,方差為總體方差的N分之一倍。
4、拒絕域和接受域的確定
令 =0.05,即顯著性水平為5%。我們犯第一類錯(cuò)誤的概率不超過5%, =±1.96。這樣,接受域和拒絕域就確定下來了。如果原假設(shè)是正確的,檢驗(yàn)統(tǒng)計(jì)量落入接受域的概率為0.95。
5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,作出推斷: ,落入拒絕域,我們有充分的理由拒絕原假設(shè),20克的差異無法用抽樣隨機(jī)性解釋。結(jié)論:去年與今年相比,新生兒的平均體重確實(shí)有明顯差異(原因不屬于統(tǒng)計(jì)學(xué)的研究范圍)。如果原假設(shè)是正確的,導(dǎo)致一件真實(shí)發(fā)性的事件成為不可能的小概率事件。所以,我們拒絕原假設(shè)是有充分理由的。
(作者單位:滄州師范學(xué)院經(jīng)濟(jì)管理學(xué)院)