姚寧寧 陳炳為△ 申春悌 錢(qián)劉蘭 黃 灝
·應(yīng)用研究·
對(duì)數(shù)線(xiàn)性模型在評(píng)分者一致性研究方法中的應(yīng)用*
姚寧寧1陳炳為1△申春悌2△錢(qián)劉蘭1黃 灝1
目的研究對(duì)數(shù)線(xiàn)性模型在等級(jí)資料評(píng)分者一致性研究方法中的應(yīng)用。方法由高級(jí)和中級(jí)及以下職稱(chēng)的醫(yī)生獨(dú)立收集慢性支氣管炎的四診信息,以口唇青紫程度為例,其評(píng)分為4個(gè)等級(jí)。采用不同的對(duì)數(shù)線(xiàn)性模型對(duì)觀測(cè)頻數(shù)進(jìn)行擬合,選擇擬合程度好的模型,再進(jìn)行一致性結(jié)構(gòu)分析。結(jié)果對(duì)三個(gè)對(duì)數(shù)線(xiàn)性模型進(jìn)行比較,得到等權(quán)重模型的結(jié)果最好,表明高級(jí)和中級(jí)及以下職稱(chēng)的醫(yī)生之間存在正相關(guān)。結(jié)論在一致性研究中應(yīng)用對(duì)數(shù)線(xiàn)性模型,可以分析一致性結(jié)構(gòu),對(duì)特定的假設(shè)進(jìn)行檢驗(yàn),不再是應(yīng)用單個(gè)統(tǒng)計(jì)量總結(jié)一致性。
一致性評(píng)價(jià) 對(duì)數(shù)線(xiàn)性模型 中醫(yī) 慢性支氣管炎
隨著大規(guī)??蒲泻献餮芯康脑絹?lái)越多和新方法的不斷出現(xiàn),一致性評(píng)價(jià)的重要意義越來(lái)越明顯。一般常用kappa系數(shù)評(píng)價(jià)兩種檢驗(yàn)方法和同一方法兩次檢驗(yàn)結(jié)果的一致性,它考慮了機(jī)遇因素對(duì)一致性的影響。然而,僅用單個(gè)的kappa系數(shù)總結(jié)一致性可能會(huì)損失一些重要信息,而且kappa值對(duì)邊際分布形式敏感,當(dāng)存在多個(gè)表格時(shí),kappa系數(shù)也不能比較[1-2]。Tanner和Young提出構(gòu)建研究者間的一致性結(jié)構(gòu)。后來(lái)Alan采用對(duì)數(shù)線(xiàn)性模型構(gòu)建研究者間的一致結(jié)構(gòu),不再只是得到一致性評(píng)價(jià)的單個(gè)統(tǒng)計(jì)量,它可以檢驗(yàn)一些特定的假設(shè),這些特定的參數(shù)用來(lái)解釋在獨(dú)立模型下單元格數(shù)值與期望值之間的差異,其特定假設(shè)的意義與一致性的意義是一致的[3]。
在中醫(yī)學(xué)的傳統(tǒng)辨證中,證候的診斷標(biāo)準(zhǔn)主要基于“望、聞、問(wèn)、切”得到的四診資料,醫(yī)師根據(jù)四診信息所歸納出的證候是一個(gè)無(wú)法直接測(cè)量的綜合變量[4]。定量證候診斷是中醫(yī)證候規(guī)范的重點(diǎn)與難點(diǎn)[5]。中醫(yī)證候的量化主要在于兩個(gè)步驟:第一是四診信息的采集,從資料類(lèi)型上看,四診信息通常由兩分類(lèi)和(或)等級(jí)分類(lèi)資料組成;第二是證候量化分類(lèi)過(guò)程,可應(yīng)用現(xiàn)代測(cè)量理論和技術(shù)對(duì)醫(yī)師通過(guò)臨床觀察所收集的四診信息篩選,探索這些臨床表現(xiàn)與其證候之間的關(guān)系,如結(jié)構(gòu)方程模型、潛在類(lèi)別模型[5]等。如果不同醫(yī)師在四診信息采集上存在偏差,將會(huì)對(duì)證候量化存在影響,因此四診信息的采集量化尤為重要。對(duì)中醫(yī)四診信息進(jìn)行一致性研究,可以提高中醫(yī)辨證的精確性和可重復(fù)性。本文的目的是研究對(duì)數(shù)線(xiàn)性模型在等級(jí)資料評(píng)分者一致性方法中的應(yīng)用。
對(duì)i×j的交叉表,對(duì)數(shù)線(xiàn)性模型要求i=j(luò)。基本模型:
mij是觀測(cè)頻數(shù),λ0是截距參數(shù),和分別為行變量(評(píng)估者A)和列變量(評(píng)估者B)的主效應(yīng)參數(shù),eij是殘差?;灸P椭袥](méi)有包含交互,因?yàn)槟P椭袧B透著交互或者評(píng)估者的等級(jí)可能相關(guān),但也可能由于其他原因。為了方便研究,可以用設(shè)計(jì)矩陣的方法來(lái)表示,因此基本模型也可以表示為:log M=Xλ+e。其中,X=■xb,xδ,xβ,xc」。M是觀測(cè)頻數(shù)的列向量;X是設(shè)計(jì)矩陣;λ是參數(shù)向量。Xb是基本模型的設(shè)計(jì)矩陣;Xδ是反應(yīng)評(píng)分者一致的設(shè)計(jì)矩陣;Xβ是定義模型有關(guān)特性的設(shè)計(jì)矩陣;Xc是協(xié)變量的設(shè)計(jì)矩陣。X的編碼通常有啞變量編碼和效應(yīng)編碼,常用啞變量編碼,但為了方便解釋?zhuān)梢赃x擇效應(yīng)量編碼。假設(shè)上述參數(shù)都存在,那么可以推廣到廣義對(duì)數(shù)線(xiàn)性模型:
在對(duì)數(shù)線(xiàn)性模型中,一致性為兩部分:機(jī)遇一致和評(píng)分者一致[3]。模型擬合后計(jì)算廣義 kappa系數(shù)元格的實(shí)際觀測(cè)頻數(shù)與總頻數(shù)的比,θ2為對(duì)角線(xiàn)單元格的期望頻數(shù)與總頻數(shù)的比),意義是:特定假設(shè)下的模型未能解釋的一致和不一致的比例[2]。廣義kappa與Cohen′s kappa的θ2值不同,前者同時(shí)考慮到機(jī)遇和非機(jī)遇因素的影響,后者僅考慮到機(jī)遇因素的影響。根據(jù)選擇模型的分析結(jié)果,篩選出擬合程度好的模型,對(duì)于最后選擇的模型的特定參數(shù)可以用對(duì)角線(xiàn)優(yōu)勢(shì)比θ(diagonal odds ratio theta)解釋。當(dāng)模型中僅含有δ時(shí),θ=exp(2δ),即 OR=exp(2δ),而當(dāng)模型中同時(shí)含有 β和 δ時(shí),θ=exp(β+2δ),即 OR=exp(β+2δ)[2,7]。如果對(duì)角線(xiàn)單元格的等級(jí)發(fā)生率大于非對(duì)角線(xiàn)的,則OR>1,OR提供了描述評(píng)分者間一致性的另一種選擇[2,8]。
以高級(jí)職稱(chēng)醫(yī)生和中級(jí)及以下職稱(chēng)醫(yī)生分別對(duì)同一個(gè)患有慢性支氣管炎的病人的口唇青紫程度進(jìn)行評(píng)價(jià)為例,高級(jí)職稱(chēng)醫(yī)生包括主任中醫(yī)師和副主任中醫(yī)師,中級(jí)及以下職稱(chēng)醫(yī)生包括主治中醫(yī)師和住院中醫(yī)師。采用對(duì)數(shù)線(xiàn)性模型對(duì)其進(jìn)行一致性評(píng)價(jià),數(shù)據(jù)整理如下(表1)。其中,B代表高級(jí)職稱(chēng)醫(yī)生,A代表中級(jí)及以下職稱(chēng)醫(yī)生,口唇青紫程度分為4個(gè)等級(jí)(0=無(wú),1=輕度,2=中度,3=重度)。
表1 慢性支氣管炎口唇青紫程度評(píng)價(jià)的頻數(shù)表
從表1中可以看到,對(duì)角線(xiàn)單元格的頻數(shù)明顯多于非對(duì)角線(xiàn)單元格的頻數(shù)。在研究者中,假定各變量等級(jí)是同等重要的,不考慮誤診的情況和協(xié)變量的影響,則有三種模型,分別為:
(1)主效應(yīng)模型:
(2)等權(quán)重模型:
(3)帶有線(xiàn)性間交互的等權(quán)重模型:
口唇青紫的程度為等級(jí)變量,X采用效應(yīng)量編碼,對(duì)于模型 3,μi=i,μj=j(luò)。研究中使用 SAS PROC GENMOD步進(jìn)行分析,分析后結(jié)果見(jiàn)表2。
表2 三種對(duì)數(shù)線(xiàn)性模型的匯總
從表2得出:模型1說(shuō)明高級(jí)職稱(chēng)醫(yī)生和中級(jí)職稱(chēng)及以下醫(yī)生在慢性支氣管炎口唇青紫程度的診斷之間存在相關(guān);模型2和模型3中P>0.05,說(shuō)明模型擬合較好,兩者相對(duì)于模型1都有很大的提高,差異是具有統(tǒng)計(jì)學(xué)意義的,但是模型3相對(duì)于模型2的提高是沒(méi)有統(tǒng)計(jì)學(xué)意義的,所以最終選擇模型2,其各參數(shù)估計(jì)值見(jiàn)表3。根據(jù)模型2的參數(shù)估計(jì)值,得到模型的期望頻數(shù)(見(jiàn)表4)。
表3 模型2參數(shù)估計(jì)值
表4 等權(quán)重模型估計(jì)的期望頻數(shù)
研究最終選擇的模型2(等權(quán)重模型)得到廣義kappa=0.000,說(shuō)明在該模型未能解釋的一致和不一致的比例接近于0,模型能很好地?cái)M合觀測(cè)頻數(shù)。等權(quán)重模型中特定參數(shù) δ=3.068(ASE=0.3584,P<0.001),說(shuō)明參數(shù)δ的設(shè)定具有統(tǒng)計(jì)學(xué)意義,一致性除了機(jī)遇因素造成外,還存在額外的一致。OR=exp(2δ)=462.2>1,表明高級(jí)職稱(chēng)醫(yī)生和中級(jí)及以下職稱(chēng)醫(yī)生在慢性支氣管炎口唇青紫程度的診斷之間存在正相關(guān)。對(duì)于i=1,2,3,4,高級(jí)職稱(chēng)醫(yī)生的診斷是i+1的優(yōu)勢(shì)比中級(jí)及以下職稱(chēng)醫(yī)生的診斷是i+1的優(yōu)勢(shì)要高出462.2倍。
對(duì)數(shù)線(xiàn)性模型的一致性是對(duì)一致性結(jié)構(gòu)進(jìn)行構(gòu)造。對(duì)數(shù)線(xiàn)性模型的主效應(yīng)模型所得的期望頻數(shù)與常用方法所求期望是一致的,其他模型均是考慮到一些特定的假設(shè),如果模型擬合程度好,則所求期望頻數(shù)與觀測(cè)頻數(shù)是非常接近的。廣義kappa接近于0,說(shuō)明模型中參數(shù)的假設(shè)是有意義的,模型擬合較好;廣義kappa越接近于1,說(shuō)明模型不能很好的擬合其觀測(cè)頻數(shù),機(jī)遇因素和非機(jī)遇因素的影響較小。應(yīng)用一致性的對(duì)數(shù)線(xiàn)性模型分析一致性的結(jié)構(gòu),而不再是應(yīng)用單個(gè)統(tǒng)計(jì)量來(lái)總結(jié)信息,它考慮到了變量間本身存在的線(xiàn)性關(guān)系、各變量等級(jí)的重要程度,以及協(xié)變量對(duì)一致性造成的影響,使得對(duì)一致性的結(jié)構(gòu)分析更加合理。
目前中醫(yī)臨床四診信息的采集方法仍然沿用傳統(tǒng)中醫(yī)學(xué)的望聞問(wèn)切方法,如果缺乏四診信息采集規(guī)范,臨床信息則采集不統(tǒng)一,搜集的癥狀缺乏客觀性,就會(huì)導(dǎo)致在填寫(xiě)臨床調(diào)查表時(shí),不同的研究者對(duì)同一研究疾病患病的四診信息采集發(fā)生較大差異。創(chuàng)建規(guī)范的操作程序,讓各臨床單位研究者掌握統(tǒng)一的中醫(yī)臨床四診信息采集操作標(biāo)準(zhǔn),加強(qiáng)不同研究單位和不同研究者對(duì)四診信息采集的一致性研究,可以提高中醫(yī)臨床辨證的精確性和可重復(fù)性,可使臨床試驗(yàn)中療效評(píng)價(jià)相對(duì)科學(xué)、客觀。將中醫(yī)診療結(jié)果量化,選擇合適的模型進(jìn)行分析,尋找出規(guī)律,會(huì)為中醫(yī)理論的傳承與發(fā)展提供巨大的幫助。
[1] Feinstein AR,Cicchetti DV.High agreement but low kappa:I.the problems of two paradoxes.Journal of clinical epidemiology,1990,43(6):543-549.
[2]Eye Av,Mun E.Analyzing Rater Agreement:Manifest Variable Methods.Mahwah,New Jersey:Law rence Erlbaum,2005.
[3]Tanner MA,Young MA.Modeling agreementamong raters.Journal of the American Statistical Association,1985,80(389):175-180.
[4]陳炳為,陳啟光,許碧云,等.潛在變量模型及其在中醫(yī)證候中的應(yīng)用概述.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,29(5):535-538.
[5]鄭建光,陳炳為,陳啟光,等.證實(shí)性因子分析在腦梗死病人中醫(yī)證候的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(5):504-506.
[6] Eye Av,Mun E.Log-linear modeling:Concepts,Interpretation,and Application.US:W iley,2013.
[7] Agresti A.A model for agreement between ratings on an ordinal scale.Biometrics,1988,44:539-548.
[8]Michelle C,Laura M,Debajyoti S.Beyond kappa:A review of inter rater agreement measures.The Canadian Journal of Statistics,1999,27(1):3-23.
“十二五”國(guó)家科技支撐計(jì)劃(2013BAI13B035);國(guó)家自然科學(xué)基因(81273190)
1.東南大學(xué)公共衛(wèi)生學(xué)院(210009)
2.南京中醫(yī)藥大學(xué)附屬常州市中醫(yī)醫(yī)院
△通信作者:陳炳為,E-mail:drchenbw@126.com;申春悌,E-mail:czsct@163.com
(責(zé)任編輯:鄧 妍)