王琪,胡良平,柳偉偉
R × C 列聯(lián)表資料可以分為雙向無(wú)序的 R × C 列聯(lián)表資料、結(jié)果變量為有序變量的單向有序 R × C 列聯(lián)表資料、雙向有序且屬性不同的 R × C 列聯(lián)表資料和雙向有序且屬性相同的 R × C 列聯(lián)表資料[1],前兩期已介紹了前三類,本文將繼續(xù)介紹第四類 R × C 表資料及其用 SAS 軟件實(shí)現(xiàn)統(tǒng)計(jì)分析的全部?jī)?nèi)容。
列聯(lián)表資料中,當(dāng)行變量與列變量的性質(zhì)相同且取值的水平數(shù)及含義也相同時(shí),稱這樣的資料為雙向有序且屬性相同的列聯(lián)表資料。雙向有序且屬性相同的列聯(lián)表是一個(gè)“方形”列聯(lián)表,它的主要目的是希望回答行變量與列變量的檢測(cè)結(jié)果是否一致的問(wèn)題。
雙向有序且屬性相同的方形列聯(lián)表實(shí)際上是配對(duì)設(shè)計(jì)2 × 2 列聯(lián)表資料的“擴(kuò)大”,在處理“方表”資料時(shí),人們更關(guān)心的是兩種檢測(cè)方法檢測(cè)的結(jié)果之間是否具有一致性,故常用的統(tǒng)計(jì)分析方法叫做一致性檢驗(yàn),也稱為 Kappa 檢驗(yàn)。
一致性檢驗(yàn)(Kappa 檢驗(yàn))的計(jì)算公式如下[2]:
上式中 Ri代表第 i行的頻數(shù)合計(jì),Cj代表第 j 列的頻數(shù)合計(jì)。
以下將通過(guò)實(shí)例向讀者介紹如何用 SAS 軟件處理雙向有序且屬性相同的 R × C 列聯(lián)表資料。
【例 1】 圍產(chǎn)期缺氧可致新生兒腦損傷,為探討頭部 CT對(duì)新生兒缺氧后腦損傷程度判斷的作用,選擇 22 例缺氧缺血性腦病患兒,采用島津 TH700 螺旋 CT 對(duì)其頭部進(jìn)行檢查。臨床分度與 CT 分度的結(jié)果見(jiàn)表 1,試分析兩種方法有無(wú)一致性。
表 1 臨床分度與 CT 分度比較
分析與解答:該資料為雙向有序?qū)傩韵嗤?R × C 表,根據(jù)研究目的,應(yīng)采用 Kappa檢驗(yàn)(一致性檢驗(yàn))對(duì)其進(jìn)行統(tǒng)計(jì)分析。
SAS 程序如下,設(shè)程序名為 li1.sas。
data a1;do a=1 to 3;do b=1 to 3;input f @@;output;end; end; cards;7 2 1 4 2 1 2 1 2;run;ods html;proc freq;weight f;tables a*b;test agree;run;ods html close;
程序說(shuō)明:test agree 語(yǔ)句可同時(shí)輸出簡(jiǎn)單和加權(quán)Kappa 系數(shù)的估計(jì)值、漸近標(biāo)準(zhǔn)誤差、95% 置信區(qū)間以及假設(shè)檢驗(yàn)結(jié)果。此處 test 語(yǔ)句中的 agree 可以用 kappa 代替,輸出結(jié)果比用 agree 時(shí)少了對(duì)加權(quán) Kappa 系數(shù)進(jìn)行假設(shè)檢驗(yàn)的結(jié)果。
SAS 程序運(yùn)行結(jié)果:
a * b 表的統(tǒng)計(jì)量對(duì)稱性檢驗(yàn)
統(tǒng)計(jì)和專業(yè)結(jié)論:以上結(jié)果中,最上面是對(duì)稱性檢驗(yàn)的結(jié)果:S = 1.0000,P = 0.8013 > 0.05,說(shuō)明此方表的頻數(shù)滿足對(duì)稱性假設(shè),即此表中的各頻數(shù)關(guān)于主對(duì)角線是對(duì)稱的。
關(guān)于一致性檢驗(yàn)結(jié)果,有簡(jiǎn)單 Kappa 檢驗(yàn)與加權(quán)Kappa 檢驗(yàn)結(jié)果。如何選擇這兩種檢驗(yàn)結(jié)果,這要看結(jié)果判定時(shí)人為因素的作用大小來(lái)決定。若人為因素作用很小,選簡(jiǎn)單 Kappa 檢驗(yàn);否則,應(yīng)選加權(quán) Kappa 檢驗(yàn)。
本研究腦損傷程度主要由醫(yī)生進(jìn)行評(píng)判,每位醫(yī)生對(duì)同一張 CT 的判斷很可能是不同的,引入了人為因素,故此例擬參考加權(quán) Kappa 檢驗(yàn)分析的結(jié)果下結(jié)論。
加權(quán) Kappa 檢驗(yàn)結(jié)果給出了加權(quán) Kappa 系數(shù)的值、漸近標(biāo)準(zhǔn)誤差、總體 Kappa 值的 95% 置信區(qū)間。最后給出了對(duì)加權(quán) Kappa 系數(shù)進(jìn)行檢驗(yàn)的結(jié)果:Z = 1.4138,P =0.1574 > 0.05,表明 Kappa 值 0.2376 與 0 之間的差別沒(méi)有統(tǒng)計(jì)學(xué)意義,說(shuō)明兩種檢測(cè)方法的檢測(cè)結(jié)果不是一致的。
專業(yè)結(jié)論:22 例患者 CT 分度與臨床分度不完全相同,在對(duì)此病進(jìn)行分度時(shí),尚不能用 CT 分度取代臨床分度。
【例 2】 對(duì)某院確診為子宮內(nèi)膜癌的 30 例患者,行超聲造影檢查。病理檢查診斷與超聲造影檢查結(jié)果見(jiàn)表 2。試分析超聲造影檢查與病理結(jié)果之間是否存在一致性。
表 2 超聲造影檢查與病理結(jié)果比較
分析與解答:該資料行變量和列變量性質(zhì)相同且取值水平和含義也相同,因此,屬于雙向有序且屬性相同的 R × C列聯(lián)表。該例主要目的是研究?jī)煞N檢查方法結(jié)果是否一致的問(wèn)題,常用的統(tǒng)計(jì)方法是一致性檢驗(yàn),即 Kappa 檢驗(yàn)。
SAS 程序如下,設(shè)程序名為 li2.sas。
data a2;do a=1 to 3;do b=1 to 3;input f @@;output;end; end; cards;2 2 1 4 13 2 1 0 5;run;ods html;proc freq;weight f;tables a*b;test kappa;run;ods html close;
SAS 程序運(yùn)行結(jié)果:
a * b 表的統(tǒng)計(jì)量對(duì)稱性檢驗(yàn)
統(tǒng)計(jì)和專業(yè)結(jié)論:對(duì)稱性檢驗(yàn)的結(jié)果,S = 2.6667,P =0.4459,說(shuō)明頻數(shù)表滿足對(duì)稱性假設(shè),即此表中的各頻數(shù)關(guān)于主對(duì)角線是對(duì)稱的。經(jīng) Kappa 檢驗(yàn),Kappa = 0.4361,95% 置信區(qū)間為 0.1696 和 0.7026。對(duì)原假設(shè)“Kappa = 0”的假設(shè)檢驗(yàn)結(jié)果,Z = 3.3584,P = 0.0008,表明兩種檢查方法結(jié)果之間的一致性具有統(tǒng)計(jì)學(xué)意義。可以認(rèn)為病理檢查診斷與超聲造影檢查對(duì)子宮內(nèi)膜癌患者的分期評(píng)價(jià)結(jié)果具有一致性。但是就 Kappa 系數(shù)的取值來(lái)看,兩種檢查方法一致性的程度還不夠高。
以上統(tǒng)計(jì)分析的 SAS 實(shí)現(xiàn)結(jié)果中,既進(jìn)行了簡(jiǎn)單Kappa 檢驗(yàn),又進(jìn)行了加權(quán) Kappa 檢驗(yàn),這兩種方法都是用來(lái)檢驗(yàn)兩種檢測(cè)方法的評(píng)價(jià)結(jié)果是否具有一致性。其主要的區(qū)別是兩種方法計(jì)算的公式不一樣,更具體地說(shuō)是對(duì)兩個(gè)變量的打分不一樣,簡(jiǎn)單 Kappa 檢驗(yàn)主要是利用對(duì)角線上的信息,加權(quán) Kappa 檢驗(yàn)除了利用對(duì)角線上的數(shù)據(jù)外,還將對(duì)角線外的數(shù)據(jù)進(jìn)行加權(quán)打分,將對(duì)角線外的信息也充分利用。所以在選擇方法時(shí)應(yīng)根據(jù)專業(yè)知識(shí),如果兩個(gè)變量取值的界限比較明確,如“+”“++”“+++”等,這時(shí)可以選用簡(jiǎn)單的 Kappa 檢驗(yàn);如果兩個(gè)變量的取值界限不十分明確,人為因素較多時(shí),更宜選用加權(quán) Kappa 檢驗(yàn)。
[1] Hu LP. Medical statistics-analysis of quantitative and qualitative data applying the triple-type theory. Beijing: People’s Military Medical Press, 2009: 292-307. (in Chinese)胡良平. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)-運(yùn)用三型理論分析定量與定性資料. 北京:人民軍醫(yī)出版社, 2009:292-307.
[2] Hu LP. Scientific research design and statistical analysis of cardiovascular disease. Beijing: People’s Military Medical Press,2010:130-133. (in Chinese)胡良平. 心血管病科研設(shè)計(jì)與統(tǒng)計(jì)分析. 北京: 人民軍醫(yī)出版社,2010:130-133.