張寧
(寧夏大學(xué) 體育學(xué)院,寧夏 銀川 750021)
體育類核心期刊中運(yùn)動醫(yī)學(xué)論文的統(tǒng)計學(xué)應(yīng)用錯誤案例分析
張寧24
(寧夏大學(xué) 體育學(xué)院,寧夏 銀川 750021)
就近年來體育類核心期刊運(yùn)動醫(yī)學(xué)科研論文撰寫中常見的統(tǒng)計學(xué)應(yīng)用誤區(qū)進(jìn)行分析,結(jié)果發(fā)現(xiàn):①實(shí)驗分組不合理,受試對象的選取違背同質(zhì)性原則;②統(tǒng)計方法不合理,多個樣本均數(shù)比較,錯誤應(yīng)用多個 t檢驗代替,誤用單因素方差分析處理多因素方差分析;③誤判資料類型,從而誤用定量資料統(tǒng)計分析方法,兩樣本率的檢驗錯誤用兩樣本的t檢驗來代替。
統(tǒng)計學(xué);運(yùn)動醫(yī)學(xué)論文;體育類核心期刊
統(tǒng)計學(xué)是科學(xué)研究的基礎(chǔ),是研究結(jié)果科學(xué)性、可靠性的有力保障。而論文是研究成果的表達(dá)形式,通過論文可展示研究者的科研成果,也便于查閱者的了解、評價和引用。因此,在論文中要完整、準(zhǔn)確地進(jìn)行統(tǒng)計學(xué)內(nèi)容的表述,以展示研究設(shè)計的合理性和研究結(jié)果的可靠性。但運(yùn)動醫(yī)學(xué)論文中存在的統(tǒng)計學(xué)錯誤仍相當(dāng)嚴(yán)重,其中實(shí)驗設(shè)計和統(tǒng)計資料的應(yīng)用上最為突出。本文介紹論文中出現(xiàn)錯誤的部分,并對其進(jìn)行了正確的統(tǒng)計學(xué)內(nèi)容表述,以便供廣大運(yùn)動醫(yī)學(xué)科研工作者參考。
1)實(shí)驗分組不合理。
例1:《有氧健身操結(jié)合飲食控制改善代謝綜合征患者胰島素抵抗、血脂、血糖的實(shí)驗研究》[1]一文中研究對象為:西安市碑林區(qū)某社區(qū)代謝綜合征患者 77人年齡 40~65(55.35±7.26)歲。按照接診順序?qū)⑷脒xMS患者隨機(jī)分為以下2組,綜合干預(yù)組和對照組。
該文作者所選取代謝綜合征患者年齡跨度較大(40~65歲),因為年齡的不同機(jī)能的代謝水平有很大的差異性,不能認(rèn)為他們來自于同一個總體。把他們隨機(jī)分入綜合干預(yù)組和對照組參加試驗,兩組之間的可比性可能很差,其結(jié)論的可信度很低;如果,按年齡段分層隨機(jī)化,組間的均衡性要高得多。
2)受試對象的選取違背同質(zhì)性原則。
例2:《不同類型休閑活動對老年女性身體機(jī)能影響的差異性研究》[2]一文中對成都市老年大學(xué)、錦江區(qū)老年活動中心,隨機(jī)選取離退休5年以上,年齡65~75歲之間老年女性為研究對象。并依據(jù)她們的年齡段將活動類型分為:為棋牌隊、曲藝隊、門球隊、舞蹈隊;測量指標(biāo)為:血壓及脈率,肺活量,椎體骨密度。
從一般的常識可知,經(jīng)常參加體育鍛煉的人有利于其血壓及脈率,肺活量、椎體骨密度指標(biāo)向好的方向發(fā)展。原作者所選取的活動類型為:棋牌、曲藝隊、門球隊、舞蹈。其中棋牌是一種智力游戲和身體運(yùn)動沒有什么關(guān)系,而曲藝,門球,舞蹈主要以身體運(yùn)動為主(曲藝有利于人體的肺活量的提高)。所以原作者在試驗設(shè)計時違背同質(zhì)性原則[3]。
在實(shí)驗設(shè)計時一定要遵守3大原則:對照、隨機(jī)、重復(fù)。對照原則:要確定處理因素對實(shí)驗指標(biāo)的影響,如無對照是不能說明問題的。實(shí)驗分組時有處理組和對照組。對照原則要求處理組和對照組除處理因素以外的其他可能影響實(shí)驗的因素應(yīng)力求一致(即齊同比較或有可比性)。隨機(jī)原則:是使每個實(shí)驗對象在接受分組處理時具有相等的機(jī)會,以減少偏性,使各種因素對各組的影響保持一致(均衡性好),通過隨機(jī)化可減少分組人為誤差。這是對資料分析時進(jìn)行統(tǒng)計推斷的前提。重復(fù)原則:是指可靠的實(shí)驗應(yīng)能在相同條件下重復(fù)出來(重現(xiàn)性),這就要求實(shí)驗要有一定的例數(shù)(重復(fù)數(shù))。因此,重復(fù)的含義是重現(xiàn)性與重復(fù)數(shù)。重現(xiàn)性可用統(tǒng)計學(xué)中顯著性檢驗的值來衡量其是否滿意[4]。
2.1 多個樣本均數(shù)比較錯誤應(yīng)用多個t檢 驗
例3:《有氧運(yùn)動對大鼠血糖、血脂和血液凝固功能的影響》[5]一文中,將30只大鼠隨機(jī)分為3組:對照組、小運(yùn)動訓(xùn)練組和大運(yùn)動訓(xùn)練組。對照組大鼠進(jìn)行自由飲食和自由飲水;運(yùn)動訓(xùn)練組動物在此基礎(chǔ)上給予為期6周的游泳訓(xùn)練。有氧運(yùn)動(游泳)、運(yùn)動后2周和運(yùn)動后4周從眼眶后靜脈叢取血,以及實(shí)驗結(jié)束時(運(yùn)動后 6周)斷頭取血,分別做血糖、血脂和有關(guān)凝血指標(biāo)的測定。用 SPSS統(tǒng)計軟件對原始數(shù)據(jù)進(jìn)行常規(guī)數(shù)理統(tǒng)計分析,計量資料用均數(shù)±標(biāo)準(zhǔn)差描述,顯著性檢驗用t檢驗,P<0.05表示有統(tǒng)計學(xué)意義。
這類錯誤是定量資料分析中最常見的錯誤,而且是原則性錯誤,會增加犯第一類錯誤的概率[6]。案例(原)表1資料為對照組、小運(yùn)動組、大運(yùn)動組不同有氧運(yùn)動時間對大鼠血清LDL水平的影響,原作者用t檢驗分別對各組均數(shù)逐一進(jìn)行比較。對照組大鼠在實(shí)驗期間血清LDL水平?jīng)]有明顯變化P>0.05。與對照組相比,小運(yùn)動組大鼠隨著有氧運(yùn)動時間的延長,血清LDL濃度逐漸降低,至第 6周時,差異具有統(tǒng)計學(xué)意義P<0.05。大強(qiáng)度游泳運(yùn)動訓(xùn)練組的大鼠血清LDL則呈逐漸升高趨勢,雖然與同期對照組大鼠相比,差異沒有統(tǒng)計學(xué)意義P>0.05,但與同期(第4周和第6周)小運(yùn)動組大鼠血清 LDL相比,差異具有統(tǒng)計學(xué)意義P<0.05和P<0.01。這種檢驗方法有誤,因為該資料為多組均數(shù)間的比較,正確的方法是用單因素方差分析,只有在方差分析有顯著性的基礎(chǔ)上有必要再作均數(shù)間的兩兩比較,用q檢驗,而不是t檢驗,同時在表1中應(yīng)該列出方差分析的統(tǒng)計量F值及具體的P值。
(原)表1 不同有氧運(yùn)動時間對大鼠血清LDL水平的影響(mmol/L,n=10)(±s)
(原)表1 不同有氧運(yùn)動時間對大鼠血清LDL水平的影響(mmol/L,n=10)(±s)
與對照組相比,1)P<0.05:與小運(yùn)動組相比,2)P<0.05,3)P<0.01,“原表‥”表示原作者的表格,“表‥”表示取原作者表格的部分
組別 0周 2周 4周 6周對照組 1.01±0.18 1.00±0.16 1.07±0.19 1.03±0.19小運(yùn)動組 1.06±0.20 0.95±0.17 0.85±0.15 0.72±0.181)大運(yùn)動組 1.02±0.19 1.03±0.22 1.13±1.172)1.18±0.213)
在應(yīng)用t檢驗和方差分析時要注意它們之間的共性與區(qū)別。t檢驗和方差分析都是對總體(樣本)均數(shù)的檢驗。當(dāng)對兩個以上的總體(樣本)均數(shù)是否存在顯著性差異進(jìn)行檢驗時,如果用t檢驗,4個總體(樣本)均數(shù)則需做=6次可能組合的檢驗。若在α=0.05的顯著性水平上檢驗,則將降低統(tǒng)計結(jié)論效度。所以,兩總體(樣本)均數(shù)的檢驗用t檢驗,兩個以上總體(樣本)均數(shù)的檢驗用方差分析。
2.2 處理多因素設(shè)計定量資料誤用單因素設(shè)計定量資料的方差分析方法
例4:《不同營養(yǎng)干預(yù)對運(yùn)動性貧血大鼠紅細(xì)胞及鐵代謝指標(biāo)的影響》[7]一文中,實(shí)驗?zāi)康臑?觀察補(bǔ)充復(fù)方阿膠中藥與補(bǔ)充鐵劑營養(yǎng)對運(yùn)動性貧血大鼠紅細(xì)胞及鐵代謝指標(biāo)的影響。方法:以32只健康雄性Wistar大鼠為研究對象,每只體重約300 g,隨機(jī)分為4組,C組為安靜對照組(n=8),E組為遞增負(fù)荷跑臺運(yùn)動組(n=8),ENⅠ組為遞增負(fù)荷跑臺運(yùn)動+阿膠營養(yǎng)補(bǔ)充組(n=8),ENⅡ組為遞增負(fù)荷跑臺運(yùn)動+鐵劑營養(yǎng)補(bǔ)充組(n=8)。然后ENⅠ組和ENⅡ組營養(yǎng)補(bǔ)充4周。實(shí)驗結(jié)束后24h內(nèi)處死。結(jié)論:9周遞增負(fù)荷跑臺運(yùn)動導(dǎo)致大鼠紅細(xì)胞相關(guān)指標(biāo)的顯著性下降,引起運(yùn)動性貧血,但血液鐵代謝無顯著變化;補(bǔ)充4周復(fù)方阿膠中藥制劑或鐵制劑,提高紅細(xì)胞相關(guān)指標(biāo),改善大鼠運(yùn)動性貧血狀況。數(shù)據(jù)統(tǒng)計方法實(shí)驗數(shù)據(jù)用SPSS13.0軟件中one-wayANOVA處理,結(jié)果用均數(shù)±標(biāo)準(zhǔn)差表示,顯著性水平為P<0.05,非常顯著性水平為P<0.01。
原文采用單因素設(shè)計定量資料的方差分析不合適,仔細(xì)考察各處理組之間的關(guān)系有:是否遞增負(fù)荷跑臺運(yùn)動,是否補(bǔ)阿膠營養(yǎng)或補(bǔ)鐵劑營養(yǎng)(兩者都能促進(jìn)RBC生成,增加Hb含量的物質(zhì),在本研究中可以認(rèn)為它們是同一因素),原文在固定一個因素于某個水平下觀測另一個因素的作用,這種做法割裂了實(shí)驗設(shè)計的整體性。正確的做法是,先從專業(yè)角度上分析二個實(shí)驗因素之間是否存在交互作用、是否存在二個因素有主次之分、是否存在交互作用或交互作用可以忽略不計等情況。也就說對事物的影響只考慮施加了一個條件(因素)為單因素方差分析;如果施加了 2個以上的條件(因素)為多因素方差分析。如果是多因素方差分析還要考慮施加的條件(因素)之間有沒有聯(lián)系、有沒有主次之分。具體看(原)表2資料,施加了兩個條例(因素)即遞增負(fù)荷跑臺運(yùn)動和補(bǔ)阿膠營養(yǎng)或補(bǔ)鐵劑營養(yǎng),然后考慮兩條件(因素)之間的聯(lián)系,通過分析2個因素間存在交互作用的可能性比較大,應(yīng)采用交互作用多因素方差分析處理此定量資料為宜。
(原)表2 9周跑臺運(yùn)動后大鼠紅細(xì)胞指標(biāo)(±s)變化
(原)表2 9周跑臺運(yùn)動后大鼠紅細(xì)胞指標(biāo)(±s)變化
與對照組相比較,1)P<0.05,2)P<0.01;營養(yǎng)補(bǔ)充組與運(yùn)動組相比較,3)P<0.05
組別 N ρ(N Hb)/(g·L-1) 10-12×RBC/L-110-2×HCT/L-1C 8 157.13±6.98 9.16±0.49 48.15±2.43 E 8 141.88±9.142)7.83±1.451)43.10±4.512)ENⅠ 8 151.50±6.483)8.68±0.37 47.24±2.323)ENⅡ 8 149.75±9.103)8.49±0.50 46.61±3.673)
2.3 統(tǒng)計方法不合理,每一種統(tǒng)計方法都有其適用條件
例5:《高脂飲食對大鼠脂肪組織脂解調(diào)節(jié)因素的影響》[8],原文中采用單因素方差分析的LSD方法對(原)表3各組FFA濃度進(jìn)行分析,得出結(jié)論具有統(tǒng)計學(xué)意義。
(原)表3 10周高脂飲食對大鼠血清FFA和甘油濃度(±s)的影響 μmol/L
與 C組相比較,1)P<0.05,2)P<0.01;與 OR組相比較,3)P<0.05,4)P<0.01
多個總體均數(shù)比較的方差分析,要求方差齊性。方差齊性實(shí)際上是指要比較的各組數(shù)據(jù)分布是否一致,通俗的說就是各組是否適合比較,一般的經(jīng)驗是如果在比較的各組中,如有一組的標(biāo)準(zhǔn)差是另一組的一倍時方差不齊性的概率較大。在做方差分析時,做方差齊性檢驗主要是確認(rèn)數(shù)據(jù)的合理性(不具相關(guān)性)。對(原)表3數(shù)據(jù)進(jìn)行方差齊性檢驗,可發(fā)現(xiàn)C組與OR組及OB組FFA濃度指標(biāo)不能滿足方差齊性的要求,故不能采用單因素方差分析的LSD方法??梢韵冗M(jìn)行對數(shù)、倒數(shù)或函數(shù)的轉(zhuǎn)換,選擇適當(dāng)?shù)霓D(zhuǎn)換形式,直到齊性檢驗變?yōu)椴伙@著(不相關(guān))。如果還不行就只能用非參數(shù)的單因素分析。
3.1 誤判資料類型,而誤用定量資料統(tǒng)計分析方法
例6:題目:《傳統(tǒng)體育對老年知識分子原發(fā)性高血壓患者臨床癥狀影響的觀察研究》[9]原作者對原發(fā)性高血壓,癥狀療效評定標(biāo)準(zhǔn)是:頭痛、眩暈、心悸、耳鳴、失眠、煩躁。各癥狀按癥狀輕重不同采用“半定量”計分法,按程度進(jìn)行分級和計分,共分為4級:(“無”0分、“輕”1分、“中”2分、“重”3分),EH(原發(fā)性高血壓)患者經(jīng)6個月的傳統(tǒng)體育鍛煉實(shí)驗,癥狀計分情況。治療前后組內(nèi)比較,除A組心悸、耳鳴、失眠癥狀外,3組均能改善老年知識分子 EH(原發(fā)性高血壓)患者臨床癥狀(P<0.05或P<0.01);實(shí)驗后與A組比較,B組眩暈、心悸,C組頭痛、眩暈、心悸、失眠、煩躁癥狀改善均優(yōu)于對照組P<0.05。
統(tǒng)計資料常常分為定量資料和定性資料兩大類,所謂定量資料是指對每個觀察單位用計量方法測量某項指標(biāo)所獲得的數(shù)值;如身高(cm)、血壓(mmHg)、脈搏(次/min)、紅細(xì)胞(104/mm-3)轉(zhuǎn)氨酶(酶活性)等,都屬于計量資料。而定性資料是指記錄每個觀察單位的某一方面的特征和性質(zhì)[10]:如血型(A、B、O、AB)、職業(yè)(工人、農(nóng)民、軍人、學(xué)生)、性別(男、女),等等。本資料觀察的是原發(fā)性高血壓癥狀療效,這里的0、1、2、3、4代表的是原發(fā)性高血壓患者癥狀的輕重程度,屬于定性資料中有序資料,(如:無、輕、中、重;治愈、顯效、好轉(zhuǎn)、無效、死亡),但原作者卻錯誤地將其判斷為定量資料,表的標(biāo)題后括號內(nèi)寫x±s的形式,表中給出也是平均數(shù)和標(biāo)準(zhǔn)差的數(shù)據(jù)。一般來說,t檢驗僅適于分析來自“單組設(shè)計、配對設(shè)計和成組設(shè)計”的定量資料,用分析定量資料的方法分析定性資料,顯然是錯誤的。正確判定統(tǒng)計資料的類型是選用統(tǒng)計分析方法的首要前提[11]。本資料屬定性資料,應(yīng)根據(jù)分析目的,合理選用適合此類資料統(tǒng)計分析方法(如Riditi分析或者非參數(shù)檢驗秩和檢驗)。
3.2 兩樣本率的檢驗誤用兩樣本的t檢 驗來代替
例7:《健身跑運(yùn)動對中年人血脂異常者血脂、身體成分的影響》[12]一文中將所有受試者隨機(jī)分成低強(qiáng)度組(L組)、中等強(qiáng)度組(M組)和對照組(C組)。數(shù)據(jù)統(tǒng)計數(shù)據(jù)用平均值±標(biāo)準(zhǔn)差形式表示。相關(guān)指標(biāo)數(shù)據(jù)用t檢驗和多因素方差分析進(jìn)行分析,P<0.05和P<0.01為顯著性差異。脂肪百分比是脂肪體重除以體重,所以表4中實(shí)驗前與實(shí)驗后的數(shù)據(jù)是構(gòu)成比。實(shí)驗前后數(shù)據(jù)的統(tǒng)計處理方法,應(yīng)采用兩個樣本率的驗檢,即u驗檢而不是t驗檢。如果處理的數(shù)據(jù)是樣本率(或構(gòu)成比)時,要對它們進(jìn)行假設(shè)檢驗時,則采用率的假設(shè)檢驗,即:正態(tài)近似法。當(dāng)兩樣本含量n1及n2足夠大,此時兩樣本率的頻數(shù)分布近似正態(tài)分布可用正態(tài)分布的原理作 u檢驗。如果是兩個率(或兩個構(gòu)成比)比較的假設(shè)檢驗或多個率(或多個構(gòu)成比)比較的假設(shè)檢驗時,都可采用χ2(卡方)檢驗[13]。
(原)表4 健身跑運(yùn)動前后男性身高、體重指數(shù)和脂肪百分比的變化(±s)
(原)表4 健身跑運(yùn)動前后男性身高、體重指數(shù)和脂肪百分比的變化(±s)
與該組實(shí)驗前比較,1)P<0.01
指標(biāo) 實(shí)驗前 實(shí)驗后… … …脂肪百分比%L 組 20.27±3.50 19.09±3.311)M 組 23.86±3.38 22.37±3.431)C 組 20.31±3.79 20.49±3.59
運(yùn)動醫(yī)學(xué)研究離不開統(tǒng)計設(shè)計和統(tǒng)計學(xué)方法,如果選擇錯誤導(dǎo)致結(jié)果有偏倚或結(jié)果原則性的錯誤,對運(yùn)動醫(yī)學(xué)的危害性較大。正確的統(tǒng)計分析是獲得正確的科研結(jié)論的要素之一。只有明確資料的性質(zhì)、試驗設(shè)計類型、分析目的,掌握相關(guān)統(tǒng)計方法應(yīng)用的前提條件,才能進(jìn)行正確的統(tǒng)計分析。
[1] 郭漢,高曉華. 有氧健身操結(jié)合飲食控制改善代謝綜合征患者胰島素抵抗、血脂、血糖的實(shí)驗研究[J]. 北京體育大學(xué)學(xué)報,2009,32(2):77-82.
[2] 王科峰. 不同類型休閑活動對老年女性身體機(jī)能影響的差異性研究[J]. 成都體育學(xué)院學(xué)報,2009,35(8):70-72.
[3] 潘發(fā)明,范引光,葉冬青. 衛(wèi)生統(tǒng)計學(xué)教學(xué)形式和內(nèi)容的拓展[J]. 疾病控制,2004,8(4):1-2.
[4] 趙書祥. 實(shí)用體育統(tǒng)計學(xué)[M]. 北京:北京體育大學(xué)出版社,2008.
[5] 章羅庚. 有氧運(yùn)動對大鼠血糖、血脂和血液凝固功能的影響[J]. 北京體育大學(xué)學(xué)報,2009,32(7):66-68.
[6] 胡良平,劉惠剛. 定量與定性資料統(tǒng)計分析錯誤辨析(2)[J]. 外科理論與實(shí)踐,2005,10(6):15-16.
[7] 薛統(tǒng),高頎. 不同營養(yǎng)干預(yù)對運(yùn)動性貧血大鼠紅細(xì)胞及鐵代謝指標(biāo)的影響[J]. 北京體育大學(xué)學(xué)報,2009,32(8):62-64.
[8] 田吉明,汪軍,王瑞元. 高脂飲食對大鼠脂肪組織脂解調(diào)節(jié)因素的影響[J]. 成都體育學(xué)院學(xué)報,2009,35(1):60-64.
[9] 湯慶華. 傳統(tǒng)體育對老年知識分子原發(fā)性高血壓患者臨床癥狀影響的觀察研究[J]. 北京體育大學(xué)學(xué)報,2009,32(2):67-69.
[10] 安勝利,統(tǒng)計學(xué)系列講座(第8講):基于秩次的非參數(shù)檢驗[J]. 護(hù)理學(xué)報,2006,13(9):94-95.
[11] 周素華,陸云霞. t檢驗和χ2檢驗常見誤用辨析[J].公共衛(wèi)生與預(yù)防醫(yī)學(xué),2007,18(2):110-111.
[12] 鄭健榮. 健身跑運(yùn)動對中年人血脂異常者血脂、身體成分的影響[J]. 北京體育大學(xué)學(xué)報,2009,32(7):56-59.
[13] 叢湖平. 體育統(tǒng)計學(xué)[M]. 北京:高等教育出版社,1998:122.
Analysis of statistical application errors in sports medical theses in core journals in the sport category
ZHANG Ning
(Institute of Physical Education,Ningxia University,Yinchuan 750021,China)
The author analyzed statistical application mistakes commonly seen in the writing of sports medical research theses in core journals in the sport category in recent years: 1)the division of experiment groups was irrational; the selection of testees violated the principle of homogeneity; 2)the comparison of the average of multiple samples was wrongly replaced with multiple t tests; single factor variance analysis was wrongly used for multiple factor variance analysis; statistical methods were irrational; 3)data type was wrongly judged, thus a wrong quantitative data statistical analysis method was used; the test of two sample rates was wrongly replaced with the t test of two samples.
statistics;sports medicine theses;core journals in the sport category
G80-32
A
1006-7116(2010)11-0115-04
2010-05-02
張寧(1962-),男,副教授,研究方向:體育統(tǒng)計,體育教育。