焉石 許水生 李尚濱 馮狄 祝凱 劉毅飛
摘 要:本研究旨在對體育碩士研究生科研論文中,常用統(tǒng)計方法的重要注意事項運用案例及直觀原則相結(jié)合方法進行解析。研究方法分別采用文獻資料法、邏輯分析等方法,對體育碩士學(xué)位論文常用的參數(shù)統(tǒng)計中的單樣本t檢驗、獨立樣本t檢驗、單因素組間方差分析、配對樣本t檢驗及重復(fù)測量等方法進行了解析,并分別舉例。同時,提出各種統(tǒng)計方法自變量及因變量的所應(yīng)對應(yīng)的數(shù)據(jù)類型,確保體育碩士研究生能正確合理使用參數(shù)檢驗。
關(guān)鍵詞:t檢驗 方差分析 體育統(tǒng)計
中圖分類號:G807 文獻標識碼:A 文章編號:2095-2813(2018)12(b)-0233-02
統(tǒng)計是一門分析和處理數(shù)據(jù)的藝術(shù),可以被分為描述性統(tǒng)計和推斷性統(tǒng)計。而體育統(tǒng)計學(xué)就是指將統(tǒng)計學(xué)的原理和方法應(yīng)用在體育中,它是統(tǒng)計學(xué)的一個分支學(xué)科[1]。體育統(tǒng)計學(xué)是一門收集、整理和分析體育中的統(tǒng)計數(shù)據(jù)的方法科學(xué),它的主要目的是從側(cè)面來揭示體育現(xiàn)象的特征和規(guī)律性。它也是體育碩士研究生進行科學(xué)科研所必須掌握的一種重要工具。但大量文獻表明,目前我國體育專業(yè)碩士論文統(tǒng)計學(xué)使用頻率較高,且t檢驗和方差分析占據(jù)比重較大,同時其中大量碩士論文普遍存在誤用現(xiàn)象,甚至呈現(xiàn)愈演愈烈的趨勢。針對這一現(xiàn)象大量統(tǒng)計學(xué)者提出了各種解決方法,魏登云[2]教授認為應(yīng)該以統(tǒng)計思想來統(tǒng)一理論與方法應(yīng)用,提高統(tǒng)計素質(zhì),但沒有給出具體可操作的解決途徑。李健[3]對體育科研中統(tǒng)計誤用的情況進行了分析,歸納了7個方面的誤用,除了多元統(tǒng)計分析方法誤用之外,其他都是基本概念掌握不清的問題。雖然許多體育統(tǒng)計學(xué)加入了大量案例教學(xué),并且結(jié)合了多媒體、網(wǎng)絡(luò)等技術(shù),努力使學(xué)生對統(tǒng)計學(xué)的認識從“工具性”轉(zhuǎn)向“思維性”,但通過調(diào)查顯示,仍然有大量學(xué)生普遍反饋統(tǒng)計學(xué)案例較少,且不夠生活化過于抽象,專業(yè)術(shù)語太過晦澀不夠直白,希望能具體化、簡潔化進行解釋。鑒于此,本研究旨在將目前體育碩士研究生常用的t檢驗和F檢驗兩大類統(tǒng)計方法,力爭用直白、簡潔、生動的方式進行解讀,為廣大體育碩士研究生正確合理使用t檢驗及方差分析提供參考。
1 關(guān)鍵統(tǒng)計概念解析
(1)研究假設(shè),指根據(jù)已知理論與事實,通過推理和論證,對研究結(jié)果進行推測性論斷和假定性解釋,是未經(jīng)實證檢驗或有待檢驗的理論。在t檢驗和方差分析中涉及的主要是比較性假設(shè),指根據(jù)已有的事實材料,對不同條件下變量的情況進行比較判斷,即A與B間的多少、大小等差異性。例如男、女大學(xué)生在鍛煉自我效能方面的差異性;不同年級大學(xué)生體育鍛煉興趣方面的差異等研究。以上內(nèi)容對于學(xué)生并不難理解,此處需要解讀關(guān)鍵是,在做差異性檢驗時,統(tǒng)計學(xué)通過運用小概率原理進行判斷,判斷的概率值為0.05,俗稱P值,如大于0.05就接受虛無假設(shè),小于0.05就拒接虛無假設(shè),接受對立假設(shè),故將研究假設(shè)分為虛無假設(shè)和對立假設(shè),運用非A即B、非B即A的反正法展開。但對于研究假設(shè)的名稱不同的統(tǒng)計書籍表達不一致,有的將虛無假設(shè)就稱為零假設(shè),且用H0表示,(假設(shè)英文為Hypothesis)另外,有的將對立假設(shè)稱為備擇假設(shè)等,且用H1表示。總之,目前表示研究假設(shè)的術(shù)語較多,導(dǎo)致學(xué)生無法正確掌握假設(shè)。此處,主要讓學(xué)生明確假設(shè)的各種名稱外,還要了解虛無假設(shè)就是指沒有差異、無效果等特指沒有的含義,而對立假設(shè)則指有差異、有效果等有的含義。
(2)0.05、0.01、0.001,指我們做推斷性統(tǒng)計時判斷差異成立與否的界值也稱概率值,P值(Probability)。這是我們?nèi)祟惖囊环N常識,下面我們一起做個試驗,請你根據(jù)自己的判斷說行還是不行,問題開始:(1)請問你能夠把一枚硬幣拋起后,落地正面朝上嗎?(2)你能夠連續(xù)拋起兩次,連續(xù)正面朝上嗎?(3)你能夠連續(xù)拋起3次,連續(xù)正面朝上嗎?(4)你能夠連續(xù)拋起4次,連續(xù)正面朝上嗎?(5)你能夠連續(xù)拋起5次,連續(xù)正面朝上嗎?在200多年前,英國就在一個會場進行了這個試驗,發(fā)現(xiàn)一個會場連續(xù)4次是寥寥幾個人說可以,連續(xù)5次時,幾乎就沒人說可以。我們用統(tǒng)計學(xué)理論看下剛才的試驗,連續(xù)1次概率為0.5;兩次概率為0.25;3次概率為0.125;4次概率為0.0625;5次概率為0.03125;因此取4次和5次兩個的中間值,即為0.05。所以目前為止0.05就成為我們判斷小概率事件推斷值。其實只要牢記P>0.05就表示無差異,P<0.05就有差異就好了。另外,0.05概率值對應(yīng)的就是研究假設(shè)(零假設(shè)),即H0假設(shè),表示檢驗變量間沒有差異。例如,我們想比較不同高校大學(xué)生的肺活量是否有差異性,通過檢驗得出P值為0.03,就表明不同高校間大學(xué)生肺活量沒有差異的概率僅為3%,那么反過來就說明有差異的概率為97%,故我們就認定不同高校間是存在差異性的。另外,那么0.05、0.01、0.001三者有啥區(qū)別呢?有人說P<0.001說明差異更大,P<0.05說明有差異可是不大,那就錯了。比如說有一箱蘋果和一箱梨,差異就已經(jīng)擺在那里了,不會因為P<0.05或者<0.01而發(fā)生變化;那兩者到底說明什么呢?如果我們做試驗發(fā)現(xiàn)二者差異P<0.05,是指我們有95%的把握認為蘋果和梨子有差異;P<0.01是指我么有99%的把握認為蘋果核梨子有差異,也就是說P<0.01比P<0.05得到的結(jié)果更加可靠,而差異就在那里,不大不小,不增不減。
2 單樣本t檢驗解析
指當把一個樣本均值和一些已知或估計的總體均值進行比較時可以采用單樣本t檢驗。切記這里我們研究的因變量一定應(yīng)是計量資料,又稱連續(xù)資料,而不能是等級或類別資料。例如我們已知全國男、女大學(xué)生的1000m及800m的平均成績,想了解本校男、女大學(xué)生的該項目成績與全國水平間是否存在差異。此時,我們研究的因變量是成績,而成績屬于計量資料,所以該研究適合采用單樣本t檢驗進行分析。
3 獨立樣本t檢驗解析
指當對兩個獨立分組中的一個連續(xù)因變量的均值進行比較時,可采用獨立樣本t檢驗。獨立樣本t檢驗與單樣本t檢驗雖然都是檢驗兩組均值間的差異性,但背后代表的樣本是不一樣的,單樣本t檢驗比較的二者,是指一個已知總體均值和一個樣本均值間,而獨立樣本t檢驗的二者則是兩個已知的樣本或總體均值間的比較。獨立樣本t檢驗的因變量也一定要符合計量資料要求。例如我們想了解北大和清華兩所高校大學(xué)生的智商水平是否具有差異性,自變量為不同大學(xué),因變量為智商水平,而智商屬于計量資料,故本研究適合采用獨立樣本t檢驗進行。獨立樣本t檢驗的統(tǒng)計前提要求因變量必須滿足正態(tài)分布、組與組間獨立不能有任何關(guān)聯(lián)、另外方差要齊,但在SPSS統(tǒng)計軟件中t檢驗具有校正功能,如方差不齊時可參考“假設(shè)方差不等”欄的結(jié)果。
4 單因素組間方差解析
指當我們研究的因變量在兩個或者更多獨立組中的均值進行比較時,可采用單因素組間方差分析,又稱ANOVA。相比較獨立樣本t檢驗,單因素組間方差分析主要解決當自變量下的水平多于三組時,當然,ANOVA也能解決獨立樣本t檢驗的問題。而后者卻不能替代單因素方差分析。因為如果當自變量多于三組時,如采用兩兩t檢驗,則會犯不適宜簡化的錯誤,將導(dǎo)致一型錯誤的概率上升。簡言之,如一個符合正態(tài)分布的變量下,且分別獨立的兩組進行比較時,應(yīng)首選獨立樣本t檢驗,而高于等于三組時,則應(yīng)選擇獨立樣本方差分析進行。例我們想了解北大、清華和人大學(xué)生的智商水平誰高誰低時,自變量高校分為3個各自獨立的群體,而因變量智商則為一個連續(xù)性資料又稱計量資料,此研究應(yīng)采用單因素組間方差分析。另外,如進行單因素方差分析時,結(jié)果P值顯著的話,應(yīng)進行事后檢驗,進一步發(fā)現(xiàn)三者間的關(guān)系,了解具體哪兩個變量間具有統(tǒng)計學(xué)差異。
5 配對樣本t檢驗解析
指對某種程度上相關(guān)聯(lián)的兩個樣本的均值進行比較時,應(yīng)使用該方法。與獨立樣本最大不同是其要求至少兩組,且組間獨立不能有任何關(guān)聯(lián),而配對樣本則要求以下幾種情況:(1)對一組樣本分別采取前測及后測,保證每個樣本分別具有兩個測試成績,例如檢測一種心理治療對運動員投籃的命中率效果,在心理治療前實施前測,然后進行心理治療結(jié)束后,對其進行后測,最終將前測與后測成績進行比較,如發(fā)現(xiàn)統(tǒng)計差異性則表明治療具有效果。(2)同一樣本的不同部位,醫(yī)學(xué)領(lǐng)域常見,例如想比較兩種藥膏療效,對患皮膚病樣本的兩個胳膊分別用藥比較療效;(3)同一樣本不同實驗方法,例一組血樣用不同儀器分別進行檢驗,比較儀器間的差異性??傊鋵颖総檢驗多半用于組內(nèi)因素,而獨立樣本t檢驗則針對組間因素。
6 重復(fù)測量解析
指當一個自變量估計一個連續(xù)因變量的情況,而自變量是一個包含兩個或更多水平的組內(nèi)因素,而且每個參與者接受自變量的所有水平。配對樣本t檢驗只能比較存在某種聯(lián)系樣本的或組內(nèi)因素兩次測試差異,但重復(fù)測量在其基礎(chǔ)上,可進一步比較組內(nèi)因素的三次測試以上間的差異,又稱成對比較,組內(nèi)因素在SPSS統(tǒng)計軟件中“選項”欄內(nèi)可進行設(shè)置。例如想檢驗一個新教學(xué)方法對學(xué)生立定跳遠成績的影響,分別在學(xué)期的第四周、第八周及第十二周進行測試,比較不同階段的差異性。重復(fù)測量檢驗主要針對是組內(nèi)因素,在SPSS統(tǒng)計中應(yīng)注重球形檢驗,如大于0.05表示符合球形假設(shè),則以滿足假設(shè)欄的F值和SIG值為準,如不滿足則以格林豪斯蓋斯特檢驗為準。
參考文獻
[1] 凌軍,張振華.論體育教學(xué)原則的現(xiàn)代重建[J].安徽師范大學(xué)學(xué)報:自然科學(xué)版,2017,40(1):99-102.
[2] 魏登云,華麥晨.體育統(tǒng)計方法應(yīng)用中的統(tǒng)計思維[J].體育科學(xué),2012,32(6):74-80.
[3] 李健,祁國鷹,王錫群.從體育統(tǒng)計誤用透視高校體育統(tǒng)計教育[J].體育科技,2009,30(1):79-81.