陳利,王楊,李衛(wèi)
在分析定性資料時, χ2檢驗是一種常用的統(tǒng)計方法。χ2檢驗多用于比較兩個及兩個以上樣本的率(構(gòu)成比)或兩個分類變量的關(guān)聯(lián)性分析,如比較兩種藥物治療的有效率,比較兩種診斷試劑的靈敏度和特異度等。χ2檢驗用途雖廣,但并非所有定性資料都可選用χ2檢驗,而且不同的研究目的計算χ2值的公式也不完全相同。若不考慮資料類型、使用條件和檢驗?zāi)康亩つ刻子忙?公式就會有統(tǒng)計學錯誤,甚至得到相反結(jié)論。本文通過分析常見χ2檢驗誤用實例,來說明如何正確使用χ2檢驗。
例1:某醫(yī)院有疑似心肌梗死病例112人,現(xiàn)通過甲、乙兩種方法對同一份血清標本的心肌酶進行檢測判斷是否為心肌梗死,結(jié)果如表1,比較兩種檢測方法的陽性率有無差別?[1]
表1 甲乙兩種方法測定結(jié)果比較
研究者用獨立樣本χ2檢驗進行分析,得P>0.05。結(jié)論為兩種檢測方法的陽性率差異無統(tǒng)計學意義。
解析:分析定性資料前,首先應(yīng)明確資料是獨立樣本還是配對樣本。若為同一樣本一分為二分別接受兩種檢驗,即為配對設(shè)計的列聯(lián)表資料,應(yīng)選擇配對設(shè)計的χ2檢驗;若為兩組不同的樣本分別接受處理,則為獨立列聯(lián)表資料,此時可用獨立樣本χ2檢驗。
本例為配對設(shè)計資料,分析配對設(shè)計比較兩樣本率有無差異時應(yīng)選用配對設(shè)計兩樣本率比較的McNemanr 檢驗,但應(yīng)注意當b+c<40時,須計算校正的χ2值[2]。例中b+c=30<40,所以應(yīng)選用校正公式進行分析。計算得χ2=5.633,P=0.018,結(jié)論為兩種方法檢測的陽性率差異有統(tǒng)計學意義。
例2:某研究欲比較兩種治療方法的病死率。將43例急性心肌梗死患者分為復(fù)方丹參注射液治療組和非復(fù)方丹參注射液治療組。治療后24小時死亡情況見表2。[3]
表2 急性心肌梗死患者治療后24小時死亡情況
研究者選用一般χ2檢驗,得χ2=4.329,P<0.05。認為兩組病死率差異有統(tǒng)計學意義。
解析:對于可用χ2檢驗分析的資料,首先應(yīng)對資料進行檢驗,然后選擇合適的分析方法:①當總樣本量n≥40且所有格子的理論頻數(shù)T≥5時,選擇四格表χ2;②當總樣本量n≥40且所有格子的理論頻數(shù)滿足1≤T<5時,選擇校正的四格表χ2;③當總樣本量n<40或T<1時,應(yīng)選擇Fisher確切檢驗。
經(jīng)分析,該資料滿足條件(2),故應(yīng)選擇校正的四格表χ2公式。計算得χ2=2.938,P>0.05。結(jié)論為兩組病死率差異無統(tǒng)計學意義。
例3:某醫(yī)院為研究阿托伐他汀與辛伐他汀降血脂的療效。將223例高血脂患者分為阿托伐他汀治療組和辛伐他汀治療組。治療4周后療效見表3。
表3 高血脂患者治療4周后療效(例)
研究者用χ2檢驗計算得χ2=6.69,P>0.1。認為兩種藥物降血脂效果差異無統(tǒng)計學意義。
解析:資料中組別(分組變量)是二分類變量,療效(結(jié)局變量)為有序變量,因此屬單向有序列聯(lián)表資料(結(jié)局變量有序)。因χ2檢驗不考慮結(jié)局變量的有序性,得到的結(jié)論只能說明兩組病人在5個療效等級上的頻數(shù)分布是否有差異,而不能說明兩組的療效是否有差異。
因此資料應(yīng)選用適合單向有序列聯(lián)表資料(結(jié)局變量有序)的分析方法,如Wilcoxon秩和檢驗。計算得Uc=2.49,0.01<P<0.02,。結(jié)論為兩種藥物降血脂的療效差異有統(tǒng)計學意義。
根據(jù)上述案例分析可知, χ2檢驗并非適用于所有定性資料的分析,臨床研究中,應(yīng)充分考慮資料類型及分析目的,以選擇合理的分析方法。
[1] 李明,賈秀琴,陳嫚茵,等. 醫(yī)學研究中定性資料假設(shè)檢驗方法誤用分析 . 深圳中西醫(yī)結(jié)合雜志 , 2007, 17: 95-97.
[2] 潘興儀 . 卡方檢驗在醫(yī)學科研中的應(yīng)用 . 廣西醫(yī)學 , 2001, 23: 1396-1401.
[3] 方積乾主編 . 衛(wèi)生統(tǒng)計學 . 第 6 版 . 北京 : 人民衛(wèi)生出版社 , 2007. 161.