常微微,袁慧,賀連平,姚應水 (皖南醫(yī)學院公共衛(wèi)生學院,安徽 蕪湖241002)
醫(yī)學統(tǒng)計學是運用概率論和數(shù)理統(tǒng)計的原理和方法,研究醫(yī)學領(lǐng)域中資料收集、整理、分析和推斷的一門學科[1],作為一種認識醫(yī)學現(xiàn)象的重要工具,在醫(yī)學研究的過程中起著非常重要的作用。但有研究者通過調(diào)查發(fā)現(xiàn),醫(yī)學論文中統(tǒng)計學方法的誤用比例比較高,比如忽視方法的應用條件、或是分析的方法不恰當?shù)?,從而影響研究結(jié)論的正確性和可信性[2~4]。為保證醫(yī)學科研結(jié)論的可靠性和醫(yī)學論文的科學性,我們對醫(yī)學研究論文中定量資料假設(shè)檢驗方面常見的錯誤分析如下。
定量資料,又稱計量資料、數(shù)值資料,是對觀察對象測量指標的數(shù)值大小所得的資料,表現(xiàn)為數(shù)值大小。例如:身高(cm),體質(zhì)量(kg),細胞數(shù)(個)等。在統(tǒng)計分析過程中,要根據(jù)資料的特點和假設(shè)檢驗的適用條件選用合適的統(tǒng)計方法。定量資料的假設(shè)檢驗常用的方法是t檢驗、方差分析和非參數(shù)檢驗。
t檢驗分為單樣本t檢驗、配對t檢驗和兩組獨立樣本t檢驗三類,應用于樣本量較?。ㄈ鏽<50)的研究設(shè)計,并且單樣本t檢驗的樣本所來自的總體、配對t檢驗兩樣本對應差值的總體和兩組獨立樣本t檢驗兩樣本所來自的總體均要求呈正態(tài)分布,兩組獨立樣本t檢驗的兩組樣本所代表的總體還需方差齊性。如果資料不呈正態(tài)分布,可以通過數(shù)據(jù)轉(zhuǎn)換使之滿足正態(tài)分布后再進t檢驗;若轉(zhuǎn)換后仍無法滿足t檢驗的應用條件,則需采用非參數(shù)檢驗的方法進行分析。如果資料方差不齊性,可采用近似t檢驗的方法進行分析。研究者如果不清楚t檢驗的適用條件以及這三種t檢驗的區(qū)別就很容易出現(xiàn)t檢驗的誤用。
多組均數(shù)間的比較,如果各樣本來自正態(tài)總體且各樣本的總體方差相等,我們可采用方差分析(F檢驗),包括完全隨機設(shè)計的方差分析、區(qū)組隨機設(shè)計的方差分析、多個樣本均數(shù)的兩兩比較(SNK檢驗,亦即q檢驗和LSD-t檢驗)等。
若定量資料不符合正態(tài)分布,我們采用非參數(shù)的秩和檢驗,包括配對設(shè)計的Wilcoxon符號秩和檢驗、兩樣本W(wǎng)ilcoxon檢驗、完全隨機設(shè)計多樣本比較的檢驗、隨機區(qū)組設(shè)計的檢驗等。
除應用條件的限制外,t檢驗最常誤用的原因便是兩組獨立樣本t檢驗和配對t檢驗以及兩組獨立樣本t檢驗和方差分析的混淆。使用兩組獨立樣本t檢驗還是配對t檢驗主要在于研究設(shè)計是配對還是完全隨機設(shè)計。t檢驗和方差分析的區(qū)別主要在于前者僅用于單因素兩水平設(shè)計和單組設(shè)計的資料,而后者主要用于單因素多水平(一般大于等于3個水平)和多因素設(shè)計的資料。
在醫(yī)學論文中,這是定量資料假設(shè)檢驗最常見的統(tǒng)計學錯誤。
例1 某作者比較了正常對照組和缺血性腦血管病患者有斑塊組及無斑塊組的同型半胱氨酸(Hcy)和基質(zhì)金屬蛋白酶-9(MMP-9)水平,采用兩兩比較的t檢驗,結(jié)果見表1。
錯誤分析:該研究目的是想比較對照組、有斑塊組和無斑塊組這三個獨立樣本來自的總體均數(shù)是否有差異,屬于多組樣本均數(shù)的比較。t檢驗只能用于2個成組樣本均數(shù)的比較,本例應該采用單因素方差分析。若差異有統(tǒng)計學意義,則可進行多個樣本均數(shù)的兩兩比較,如q檢驗等。
對處理觀測指標(本例是Hcy和MMP-9觀察值)是定量的、影響因素(本例是分組)是定性的實驗資料,無論有多少個組,也無論有多少個影響因素,很多人不加思索地就選擇t檢驗。這也是很多方差分析誤用成t檢驗的原因。如果3組或3組以上的計量資料分析時采用t檢驗,會增大第一類錯誤的概率。當進行n次假設(shè)檢驗時,則總的推斷結(jié)論犯第一類錯誤的概率就是1-(1-a)n,a為進行一次檢驗時犯第一類錯誤的概率(統(tǒng)計學一般定義為0.05),n為均數(shù)使用的重復次數(shù)。本例中n為3(兩兩比較3次),計算犯第一類錯誤的概率為1-(1-0.05)3=0.1426,遠遠大于0.05。由此可見,單因素方差分析誤用成兩兩獨立樣本t檢驗,會更容易得出差別有統(tǒng)計學意義的結(jié)論。
另外此表格設(shè)計也是不合理的。如果是假設(shè)檢驗,在統(tǒng)計表格中需要列出假設(shè)檢驗方法統(tǒng)計量的值,在根據(jù)統(tǒng)計量值的大小來判斷p值的大小。此表格中沒有列出每組假設(shè)檢驗統(tǒng)計量的值和p值,并且p值的大小一般是沒有<0.001這個界點的,一般為<0.01或<0.05。更合理的表格如表2。
表1 3組Hcy及MMP-9水平的比較
卡方檢驗是一種用途非常廣泛的假設(shè)檢驗方法,常用于兩個或多個率或構(gòu)成比之間比較,通常用于計數(shù)資料的統(tǒng)計推斷。
例2 某作者欲比較新觀念剖宮產(chǎn)和腹部橫切口剖宮產(chǎn)兩種手術(shù)方法的手術(shù)時間、術(shù)后排氣時間和術(shù)中出血量的差別,分析結(jié)果見下表2。該文作者認為,兩種方法剖宮手術(shù)從手術(shù)時間、術(shù)中出血量、術(shù)后排氣時間指標都有明顯縮短及減少。兩組經(jīng)卡方檢驗,P<0.01,具有顯著性差異。
錯誤分析:從表中我們可以看出本例的結(jié)果變量(手術(shù)時間、術(shù)后排氣時間和術(shù)中出血量)都是定量變量,變量值表現(xiàn)為數(shù)值的大小,因此資料為定量資料,不符合卡方檢驗的適用條件。本例中分組變量為兩組,如果三種變量的觀察值符合正態(tài)分布,正確的方法是采用兩組獨立樣本均數(shù)的t檢驗。
表2 3組Hcy及MMP-9水平的比較 (x±s)
表3 新觀念剖宮產(chǎn)與腹部橫切口子宮下段剖宮產(chǎn)手術(shù)比較
另外此表格設(shè)計也是不合理的,一般表格的左側(cè)(橫標目)表示被統(tǒng)計分析的事物(本例為兩種剖宮產(chǎn)的手術(shù)方法),即統(tǒng)計表的主語;表格的上端(縱標目)表示主語的各項指標(本例為手術(shù)時間、術(shù)后排氣時間和術(shù)中出血量),并且應列出兩組的例數(shù)n。如果使用卡方檢驗也應寫出確切的卡方值,具有顯著性差異應改為差異具有顯著性。合理的表格如表4。
例3 某研究采用Lysholm膝關(guān)節(jié)功能評分評定手術(shù)前后的膝關(guān)節(jié)功能,作者采用兩獨立樣本t檢驗,結(jié)果見表5。
錯誤分析:本例作者采用自身前后對照,比較治療前后膝關(guān)節(jié)功能療效,而錯誤地采用兩獨立樣本t檢驗進行統(tǒng)計學處理。原設(shè)計為自身對照配對設(shè)計,是最簡單的重復測量設(shè)計,這種比較應采用配對t檢驗,若每對數(shù)據(jù)的差值不服從正態(tài)分布時可采用配對比較的符號秩和檢驗(非參數(shù)檢驗)。
配對t檢驗和兩獨立樣本t檢驗有不同之處:①兩者設(shè)計類型不同;②觀察的內(nèi)容不同,兩獨立樣本t檢驗是比較兩樣本均數(shù)代表的總體均數(shù)有無差異,而 配對t檢驗是在同一個體上進行實驗,以觀察每個實驗單位處理前后(或兩種處理方法)兩次結(jié)果的差值平均數(shù)來推斷某處理因素對同一樣本處理前后(或兩種處理方法)有無差異;③配對t檢驗最大程度地減少了個體變異對處理問變異的可能影響,用較少樣本可得較多的信息,同時提高了檢驗效能。
表4 新觀念剖宮產(chǎn)與腹部橫切口子宮下段剖宮產(chǎn)手術(shù)比較
表5 治療前后Lysholm膝關(guān)節(jié)功能評分比較
假設(shè)檢驗是用樣本的信息推斷總體的某個特征是否成立,換句話說它的目的是研究理論總體。如果我們在進行假設(shè)檢驗的時候選用的方法不恰當甚至是錯誤的,那我們得出的結(jié)論肯定也是不正確的。在分析醫(yī)學研究數(shù)據(jù)中的定量資料時,切忌只關(guān)心P值的大小而忽視統(tǒng)計分析方法的適用條件,盲目套用公式而造成統(tǒng)計分析方法的誤用。換句話說,合理地選用統(tǒng)計分析方法,是得到正確結(jié)論的關(guān)鍵所在。
以上例舉的錯誤類型在各種醫(yī)學文獻中較為普遍,提示我們醫(yī)學科研工作人員的統(tǒng)計分析知識比較薄弱。在實際應用中,醫(yī)學科研工作者應進一步學習和掌握最基本統(tǒng)計學分析方法的概念及其應用條件,這些遠比掌握具體的檢驗步驟更為重要。同時醫(yī)學期刊也應加大對稿件中統(tǒng)計學分析方面的審查力度。只有這樣,才能使醫(yī)學論文中統(tǒng)計學方法應用上的缺陷和錯誤得以彌補和改正,從而保證論文的科學性和結(jié)論的可靠性。
[1]姚應水,劉更新 .預防醫(yī)學 [M].西安:第四軍醫(yī)大學出版社,2011:169.
[2]胡良平 .影響我國醫(yī)藥科技事業(yè)發(fā)展的要因分析及其對策研究 [J].醫(yī)學情報工作,2003,49(2):152~154.
[3]王倩,張博恒 .五種中華醫(yī)學會系列雜志論著中統(tǒng)計方法的應用現(xiàn)狀 [J].中華醫(yī)學雜志,1998,78(3):230~233.
[4]張亙稼 .略論科技期刊論文中統(tǒng)計方法的誤用 [J].中國科技期刊研究,2012,23(3):413~414.