胡純嚴 ,胡良平 ,2*
(1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯合會臨床科研統計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在臨床資料中,定性資料占有相當大的比重。根據不同的試驗設計類型和統計分析目的,研究者常將定性資料整理成各式各樣的列聯表[1-2],其中,雙向有序且屬性相同的方形列聯表常被用于呈現兩位臨床醫(yī)生(或兩種測定方法)對同一批某病患者的樣本檢測的結果。這種列聯表也被稱為配對設計擴大形式的方表,對其進行統計分析的目的是判定兩位臨床醫(yī)生診斷結果之間是否具有一致性,需要采用的統計分析方法被稱為一致性檢驗。本文將基于SAS軟件對此種列聯表資料進行統計分析,對輸出結果給出合理的解釋并作出統計學結論和專業(yè)結論。
1.1.1 雙向有序且屬性相同的方形列聯表
1.1.1.1 配對設計2×2方形列聯表
表1中列出了采用兩種方法同時檢測68位某病患者的標本所得的結果。見表1。
表1 兩種檢測方法對同一組受試者檢測的結果
1.1.1.2 配對設計擴大形式3×3方形列聯表
表2呈現了在兩個不同時間段上對446例流行性出血熱病患者的病情轉化情況進行記錄的結果;而表3呈現了兩名醫(yī)生對200例棉屑沉著病可疑患者的診斷結果。見表2、表3。
1.1.1.3 配對設計擴大形式4×4方形列聯表
表4呈現了兩種測定方法同時檢測73個樣品中的抗體所得的檢測結果。見表4。
表2 446例流行性出血熱病情轉化情況
表3 甲、乙兩名醫(yī)生對200例棉屑沉著病可疑患者的診斷結果
表4 兩種測定方法同時檢測73個樣品中的抗體所得的檢測結果
1.1.2 統計分析方法的合理選擇
除了行數和列數不相同之外,以上四個表格在本質上是完全相同的,即都是兩種檢測方法或兩位評價者的測定結果按“配對的方法”整理出來的。對于按這種形式呈現的定性資料,雖然有多種不同的分析目的(例如考察兩者之間的“一致性”“對稱性”和“相關性”),但在實際工作中,研究者最關注的是兩者的“一致性”是否具有統計學意義和實際意義。因此,最常用的統計分析方法是一致性檢驗。
1.1.3 檢驗方法名稱的辨析
在對以上四個表格中的定性資料進行一致性檢驗時,統計學教科書上常有以下幾種說法:即“一致性檢驗”“kappa檢驗”和“Z檢驗(或U檢驗)”。事實上,它們指的是同一種檢驗,即計算公式和原理是完全相同的。仔細分析可知,“一致性檢驗”是目的,“kappa檢驗”是突出計算公式分子中有一個名叫kappa的一般統計量(它是用來度量兩種檢測方法檢測結果之間呈現一致性程度高低的一個系數),而“Z檢驗”則是指實現該檢驗的檢驗統計量的名稱為Z。在SAS軟件中,一般規(guī)定檢驗統計量Z為服從標準正態(tài)分布的隨機變量,通常記為Z~N(0,1)。然而,從檢驗統計量的公式中是否包含“臨床實際意義的界值”來劃分,所有的假設檢驗均可被劃分成兩大類,一類為不包含臨床實際意義的界值的一般差異性檢驗,例如文獻[3-6];另一類為包含臨床實際意義的界值的特殊差異性檢驗,例如非劣效性檢驗、等效性檢驗和優(yōu)效性檢驗[7-9]。
1.2.1 檢驗假設
給出檢驗假設,并規(guī)定檢驗水準α的值。
H0:總體kappa系數=0(兩種方法或者兩位醫(yī)生的檢查結果不一致);H1:總體kappa系數≠0(兩種方法或者兩位醫(yī)生的檢查結果一致);α=0.05。
【說明】kappa系數是度量一致性程度高低的一個數量,包括“簡單kappa系數”與“加權kappa系數”兩種。
1.2.2 與簡單kappa系數有關的內容
1.2.2.1 簡單kappa系數的計算公式
Kappa(簡寫成k)系數的計算公式為[10-12]:
在式(1)中,Pa和Pe分別代表“實際一致率”與“期望一致率”,其計算公式分別見式(2)和式(3):
在式(2)和式(3)中,“m”代表方形列聯表的“行數”或“列數”;“n”代表方形列聯表中的總頻數;“fii”代表方形列聯表中第i行第i列上的頻數(即從左上角到右下角對角線上的頻數);“Ri”與“Ci”分別代表第i行與第i列上的頻數之合計值。
1.2.2.2 簡單kappa系數的標準誤Sk
簡單kappa系數的標準誤Sk可由下面的公式計算:
1.2.2.3 基于簡單kappa系數的檢驗統計量Z
由式(1)和式(4)可以構造出檢驗統計量Z,見下式:
1.2.2.4 基于簡單kappa系數的置信區(qū)間
還可以構造出簡單kappa(簡寫成k)系數的100(1-α)%置信區(qū)間,見下式:
1.2.3 與加權kappa系數有關的內容
1.2.3.1 概述
簡單kappa系數在計算時僅與方形列聯表的主對角線上的頻數有關,但有時“非主對角線上的頻數”對“一致性的估計”也能提供一些“輔助信息”,將其納入kappa系數的計算之中,所得到的結果被稱為“加權 kappa系數”[10-12]。在 SAS的FREQ 過程中,引入了兩種計算kappa系數“權重”的定義,分別被稱為“Cicchetti-Allison權重(簡稱CA權重)”和“Fleiss-Cohen權重(簡稱FC權重)”[12]。
1.2.3.2 加權kappa系數
在式(7)中,Po(w)、Pe(w)分別為觀察的與期望的加權一致率,其計算公式見式(8)與式(9):
在式(8)和(9)中,wij、pij分別為方形表中第i行第j列上的“權重”與“比例”;pi.與p.j分別為方形表中“第i行上的比例”與“第j列上的比例”。
1.2.3.3 加權kappa系數的方差
加權kappa系數的方差見下式:
1.2.3.4 加權kappa系數的置信區(qū)間
總體加權kappa系數的100(1-α)%置信區(qū)間見下式:
1.2.3.5 基于加權kappa系數的Z檢驗統計量
假定總體kappa系數為“kw(o)≠ 0”,則:
假定總體kappa系數為“kw(o)=0”,則:
1.2.3.6 權重系數的計算公式
CA權重系數的計算公式見下式:
FC權重系數的計算公式見下式:
在式(17)和式(18)中,當i=j時,wij=1;當i≠ j,且i<j時,Ci、Cj分別代表第i列、第j列上的“得分值”(通常方形表中行、列方向上是相同的有序變量,分別代表甲、乙兩個評價者給出的評價結果,例如當分4檔時,可分為0、2、4、6分,也分為0、3、7、12分,相鄰檔次之間不必要求間隔相等,可依據專業(yè)知識進行賦值);“m”代表方形表的“行數”或“列數”(例如當分4檔時,Cm=C4,即第4檔上的“得分值”)。
1.2.4 計算檢驗統計量Z的數值及其對應的尾端概率
計算檢驗統計量Z的數值,按照檢驗水準查Z值表獲得概率分布尾端的概率(對手工計算而言)或由統計軟件直接算出標準正態(tài)分布曲線下尾端的概率;或者可以求出總體Kappa系數的95%置信區(qū)間。
1.2.5 得出統計學結論和專業(yè)結論
根據拒絕還是接受H0的結果,得出統計學結論,再結合專業(yè)知識給出專業(yè)結論。
現以分析表4資料為例,呈現SAS程序及結果。
SAS程序如下:
【程序說明】“TEST語句”中有兩個選項,第1個選項“KAPPA”要求計算簡單kappa系數、95%置信區(qū)間并對其進行假設檢驗;第2個選項“WTKAP”要求計算加權kappa系數、95%置信區(qū)間并對其進行假設檢驗。
【SAS主要輸出結果及解釋】
第1部分輸出結果:
由輸出結果可知,簡單kappa=0.6994,其漸近標準誤Sk=0.0658,其95%置信區(qū)間為[0.5704,0.8283]。由于此置信區(qū)間未包含“0”,說明總體kappa值不等于0,即兩種檢測方法檢測結果之間的一致性具有統計學意義。
以上是對簡單kappa進行假設檢驗的結果,Z=10.0044,無論是單側檢驗還是雙側檢驗都得出P<0.0001,說明總體kappa值不等于0。
第2部分輸出結果:
第2部分輸出結果是關于加權kappa的計算結果,除加權kappa系數、加權檢驗統計量Z值等較前面未加權的結果略有變化外,置信區(qū)間和假設檢驗的結果沒有發(fā)生根本性的改變,結論與基于簡單kappa計算所得的結論相同,不再贅述。
【結論】快速法與ELISA法檢測結果之間的一致性具有統計學意義,至于這種一致性是否具有實用價值,取決于研究者的專業(yè)需求。若以ELISA法檢測結果為“金標準”來判斷可否采用快速法取代ELISA法,關鍵取決于現在的樣本一致率78.08%是否滿足專業(yè)要求,若滿足,則可以取代;否則,就不可以取代。
【說明】樣本一致率78.08%是按如下方法計算出來的,即采用表4中主對角線上的頻數之和“57”除以總頻數73而得。
如何合理選用“簡單kappa系數及其有關分析方法”與“加權kappa系數及其有關分析方法”,文獻[11]認為:加權kappa系數法適用于“多級分組的兩次檢查結果的定性資料”?;诔WR可知,若被評價對象的“得分”是客觀存在的(例如某病患者的樣品的檢測結果在本質上應屬于某一檔是客觀真實的),僅由于評價者或測定方法無法準確認定其“得分”高低時,宜選用“簡單kappa法”(即在方形列聯表中,只需要利用主對角線上頻數所提供的信息);當被評價對象的“得分”不是客觀存在的(例如某聲樂參賽者的得分在本質上并不存在一個準確的數量),而是受各評價者主觀判斷或偏好的影響,此時,宜選用“加權kappa法”,即有必要參考“鄰近位置上的得分”(即在方形列聯表中,不單看主對角線上的頻數,也要適當利用非主對角線上頻數提供的信息,進行綜合考慮)。除采用SAS實現一致性檢驗、非劣效性檢驗、等效性檢驗和優(yōu)效性檢驗外,還有其他一些統計軟件也可以實現前述提及的各種檢驗,如R軟件[13]。
本文介紹了一致性Z檢驗的原理、方法和SAS實現。在計算原理和方法方面,介紹了“基于簡單kappa系數法”和“基于加權kappa系數法”兩方面的內容;在SAS實現方面,僅介紹了基于SAS中FREQ過程直接實現一致性Z檢驗,同時,還給出了總體kappa系數的置信區(qū)間。