曹遠紅
(湖南師范大學 體育學院,湖南 長沙 410012)
體育統計教學中假設檢驗的教學方法建議
曹遠紅
(湖南師范大學 體育學院,湖南 長沙 410012)
在體育統計的教學實踐中發(fā)現,學生對假設檢驗的方法和原理難以理解和掌握。建議用區(qū)間估計和假設檢驗的內容合并起來進行假設檢驗教學;從區(qū)間估計的角度論述了假設檢驗中的小概率事件,進而對假設檢驗中原假設的建立、統計量的計算等問題進行了論述。
體育統計;區(qū)間估計;假設檢驗
體育統計經過幾代體育統計工作者的努力,現已成為體育科學體系中的重要組成部分,是體育科學研究和體育事業(yè)發(fā)展不可或缺的重要力量。體育統計在我國正式設立為一門體育專業(yè)基礎課程,迄今已30年。[1]假設檢驗是體育統計教學中的重要內容,也是體育科研中經常運用的重要的統計分析方法。雖然我們現在借助計算機軟件能夠較快捷地進行假設檢驗,但是計算機軟件的運用必須是在正確的數理統計原理的基礎上進行的。已有的研究表明,大學本科生、碩士研究生和博士研究生在其撰寫的畢業(yè)論文中,均不同程度地存在著體育統計誤用的情況。[2]因此,熟練掌握和運用假設檢驗的原理和方法對從事體育科研工作有著重要的實踐意義。
區(qū)間估計和假設檢驗是統計推斷中的重要內容,是兩個不同的統計概念,但它們又有著密切的聯系。在某種意義下是同一問題的不同表達方式。這兩種統計推斷方法都是通過對具體事物的隨機抽樣所得到的樣本數據,用數理統計的方法進行統計分析并做出判斷的。因此,從區(qū)間估計和假設檢驗的雙重角度進行教學,有助于學生正確掌握和理解假設檢驗的原理和方法。
假設檢驗的基本思想和原理普遍認為是帶有概率性質的反證法,在目前常用的《體育統計學》教材中對假設檢驗基本思想和原理都有論述,但容易讓學生產生一種誤解:即“假設檢驗是運用小概率事件原理的反證法”,學生對假設檢驗中到底什么是小概率事件認識不清。特別是教材中“如果發(fā)生了,則應拒絕原假設”這樣的話更不能準確理解,學生容易陷入“假設檢驗中到底發(fā)生了什么事”這樣的疑團中。準確地說,假設檢驗的推理有兩個特點:第一,用了反證法的思想。為了判斷一個“斷言”是否成立,先假設該“斷言”成立,然后分析由此會產生什么結果,如果導致了一個不合理的現象出現,就表明這個“斷言”不成立。通常,我們稱假設“斷言”成立為原假設,記為H0,與之對立的稱為備選假設,記為H1;第二,用了小概率原則,前面所說的“不合理”現象并非邏輯上的錯誤,而是違背了稱之為小概率事件原理:小概率事件在一次試驗中是幾乎不可能發(fā)生的。[3]
小概率事件的原理實際上包含了這樣的意思:“如果某事件發(fā)生的概率很小,在一次實驗中,我們是可以忽略它的,也即在一次實驗中不會發(fā)生。如果某事件在一次實驗中就發(fā)生了,我們就沒有足夠的理由認為這個事件是小概率事件,也就不能忽略”。理解小概率事件原理的應用,關鍵是要明確假設檢驗中到底什么是小概率事件。
體育統計雖說是一門應用性體育學科,但也是以概率論和數理統計為理論基礎的很精深的學問,必須在掌握和理解一定的數理統計原理的基礎上,才能正確地應用在體育科研當中。在體育統計的教學中實踐中,“教師教得賣力,學生學得吃力,體育統計用起來費力”,可以說是其真實寫照。作為體育統計課程的教師應該根據體育專業(yè)學生的實際情況,認真鉆研教法,把復雜的統計問題簡單化,讓學生容易接受和理解。下面以常見的“差異性”檢驗為例,從區(qū)間估計和假設檢驗的本身兩個角度進行深入理解假設檢驗的原理和方法。
(一)從區(qū)間估計的角度理解假設檢驗
(二)從差異的來源角度理解假設檢驗
在假設檢驗中通常是對樣本平均數(率)與總體平均數(率)的差異或者兩樣本之間平均數(率)的差異進行檢驗。差異的來源通常有:過失誤差、條件誤差、抽樣誤差、隨機誤差,而過失誤差我們認為可以避免,隨機誤差一般我們不予考慮,主要是考慮條件誤差和抽樣誤差。抽樣誤差是不可避免的,但樣本仍是來自同一總體,所以這種差異沒有本質區(qū)別;條件誤差是實驗因素或觀察條件的改變而造成的差異,此時樣本可能會來自不同質的總體,其差別是本質性的差別,假設檢驗就是幫助人們去區(qū)分差異是由抽樣誤差還是條件誤差造成的一種科學方法。[5]下面以實例來說明假設檢驗。
例:由全國青少兒體質調查資料已知10歲男孩身高的平均數為135.3厘米。隨機抽測海淀區(qū)120名10歲男孩的平均身高數為137.2厘米,標準差為5.9厘米,問海淀區(qū)10歲男孩身高與全國10歲男孩身高之間有無顯著性差異?(α=0.05)
由題可知,μ0=135.3,X軍=137.2,差異為:X軍-μ0,造成它們之間的差異有兩種原因,即抽樣誤差、條件誤差,如果是抽樣誤差造成的,則說明這個差異沒有本質區(qū)別,也即差異無顯著性,如果是條件誤差引起的,則差異具有本質性,也即差異具有顯著性。題中給出的α=0.05,即說明抽樣誤差的概率如果小于或等于5%,那么抽樣誤差可以忽略,就認為這個差異是由于條件誤差引起的,如果抽樣誤差的概率大于5%就沒有足夠的理由認為這個差異是由條件誤差引起的。抽樣誤差概率的大小是可以通過計算統計量并根據統計量所對應的概率進行判斷的。此題的解法如下:
解:(1)建立原假設 H0:μ=μ0=135.3
原假設怎么建立呢?根據奈曼與皮爾遜(Neyman&Pearson)原則,我們在假設檢驗中更傾向于拒絕H0,而不是接受H0。換句話說,如果我們拒絕了H0,我們就有1-α把握相信為H0偽;但若接受H0,我們只能說沒有足夠的證據證明H0為偽。[6]為了便于學生理解,本人認為可以說原假設一般是無顯著性差異或者肯定性假設。題中原假設的意思是:海淀區(qū)10歲男孩平均身高等于全國10歲男孩的身高,也即題中平均身高的差異可能是由抽樣誤差的引起的,此差異無顯著性,抽樣誤差的概率大于5%。
(2)計算統計量Z值(也是我們常說的U值):
(3)α=0.05,則|Zα/2|=1.96
(4)判斷結果:Z=3.53>1.96,則 P<0.05,拒絕 H0,認為海淀區(qū)10歲男孩的身高與全國10歲男孩的身高之間的差異有顯著性。
總之,不管是單側還是雙側檢驗,首先是要要理解在原假設成立的基礎上,樣本平均數的分布形式及小概率區(qū)間,若落入小概率區(qū)間,則發(fā)生了小概率事件,就依據小概率事件原理拒絕原假設,否則只能接受原假設。
[1]權德慶,等,體育統計學科現狀與發(fā)展趨勢[J].西安體育學院學報,2008,(1).
[2]李健,祁國鷹,等.從體育統計誤用透視高校體育統計教育[J].體育科技,2009,(1).
[3]葉鷹,等.概率論與數理統計(第二版)[M].武漢:華中科技大學出版社,2004,(9).
[4]費宇.應用數理統計[M].北京:科學出版社,2007,(8).
[5]祁國鷹,等.體育統計簡明教程[M].北京:北京體育大學出版社,2004,(4).
[6]康鐵祥.深入理解假設檢驗原理[J].統計教育,2001,(1).