南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計學(xué)系(510515) 朱玲湘 陳平雁
連續(xù)變量基于靈敏度和特異度的一次多項式函數(shù)選擇最佳診斷界點的方法*
南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計學(xué)系(510515) 朱玲湘 陳平雁△
在診斷試驗評價中,最佳診斷界點(cut-off point)的選擇一直是個尚未完全解決的熱點問題。該問題涉及兩個方面,一是“最佳”的標(biāo)準(zhǔn),二是尋找最佳診斷界點的方法。目前關(guān)于最佳診斷界點的確定多以評價指標(biāo)值最大化為標(biāo)準(zhǔn)。事實上,依此標(biāo)準(zhǔn)確定的最佳點有時只是數(shù)理上的最大值,但在實際臨床上可能并無實用價值。在如何尋找最佳診斷界點方面,Metz提出借助ROC曲線采用圖像的方法選擇最佳診斷界點[1],隨后Greiner等對比數(shù)積、似然比、Kappa系數(shù)等在圖像上做了更深入的研究[2-3],但都只是展示出幾何表現(xiàn)的不同,并沒有從實質(zhì)上給出具有實際操作性的一般計算方法。事實上,ROC曲線是所有可能診斷界點的直觀幾何表現(xiàn),而評價指標(biāo)才真正地決定選擇診斷界點的策略。直至近年P(guān)erkins等在兩個連續(xù)變量服從正態(tài)分布假設(shè)下,研究了關(guān)于Youden指數(shù)最大值點一般計算方法[2-10]。關(guān)于其它的評價指標(biāo)目前仍然缺少確定最佳診斷界點的一般計算方法。一個完整、有效的診斷試驗評價不僅包含評價指標(biāo)的計算,還應(yīng)給出在該指標(biāo)下相應(yīng)的最佳診斷界點確定標(biāo)準(zhǔn)及計算方法,以適應(yīng)不斷發(fā)展的診斷醫(yī)學(xué)的研究。
不同的評價指標(biāo)擁有各自對應(yīng)的最佳診斷界點。要建立確定最佳診斷界點的一般方法,首先要確定評價指標(biāo)的形式。為評價診斷試驗的效果,最常用的診斷試驗準(zhǔn)確度指標(biāo)是靈敏度(sen)和特異度(spe)[11]。由于這兩個指標(biāo)呈負(fù)相關(guān)關(guān)系,分別使用這兩個指標(biāo)進(jìn)行不同診斷方法之間的比較受到一定限制,因此產(chǎn)生了許多組合靈敏度和特異度而形成的綜合評價指標(biāo),如Youden指數(shù)和加權(quán)Youden指數(shù),診斷準(zhǔn)確率,診斷比數(shù)積,陽性似然比和陰性似然比,kappa系數(shù)、預(yù)測值,信息量等[12-20]。對于這些評價指標(biāo),我們均可以將其視為關(guān)于靈敏度和特異度的函數(shù)。我們可以根據(jù)相應(yīng)的函數(shù)形式把其分為兩類,第一類是關(guān)于sen和spe的多項式函數(shù),包括Youden指數(shù)、加權(quán)Youden指數(shù)、診斷準(zhǔn)確率;第二類是除第一類外的所有評價函數(shù),其中大部分是關(guān)于sen和spe有理分式函數(shù),如診斷比數(shù)積,似然比等。如果我們將第一類歸結(jié)為關(guān)于sen和spe的一次多項式函數(shù),其中每個指標(biāo)都是該一次多項式函數(shù)的一個特例,那么,我們就可以從更一般的角度探討綜合評價指標(biāo)的建立以及相對應(yīng)的尋找最佳診斷界點的方法,這正是本研究的目的所在。至于第二類函數(shù),尚不是本研究所考慮的內(nèi)容。
用Y和X分別代表對照組與病例組的連續(xù)型變量,非負(fù)可積函數(shù)fY(t)、fX(t)分別為相應(yīng)的概率密度函數(shù)。假設(shè)Y和X均服從正態(tài)分布,即Y~N(μY,在此不妨假設(shè)μY<μX(事實上,當(dāng)μX<μY時,只需調(diào)轉(zhuǎn)Y和X的位置即可)。此時,對任意的診斷界點c,對應(yīng)的靈敏度和特異度有如下表達(dá)式
靈敏度和特異度不再是關(guān)于c的初等函數(shù),而只能用變限積分來表示。一般來說,fY(t)和fX(t)下的面積中有相當(dāng)一部分重疊區(qū)域(如圖1),這正是導(dǎo)致最佳診斷界點難以確定的原因。
一般的基于靈敏度和特異度的一次多項式評價函數(shù)則可表述為式(2),
其中λX、λY、α0為定常數(shù),且λX>0、λY>0。另一個角度,可以將λX、λY看成靈敏度和特異度的權(quán)重,當(dāng)它們?nèi)〔煌闹禃r,可以得到不同的診斷試驗評價指標(biāo)??梢?,任何形式的一次評價函數(shù)都可以化為式(2)的形式,可將其作為基于靈敏度和特異度的一次多項式評價函數(shù)的標(biāo)準(zhǔn)形式。采用以上定義,在診斷試驗中希望ψ最大化。
圖1 兩個正態(tài)分布總體的密度函數(shù)
特別地,當(dāng)λX=r、λY=1-r、α0=0(r為病例組占比)時,式(2)即化為診斷準(zhǔn)確率[21-22];
當(dāng)λX=1、λY=1、α0=-1時,式(2)退化為Youden指數(shù)[16];
當(dāng)λX、λY、α0為不同的賦值組合時,式(2)退化為加權(quán)Youden指數(shù)[23-26]。
把式(1)代入上式,可得到的是進(jìn)一步化為關(guān)于診斷界點c的函數(shù)
顯然ψ(c)為實數(shù)域上連續(xù)可導(dǎo)函數(shù),其最大值點一定在駐點取得。
在確定最佳診斷界點之前,必須先對其判別標(biāo)準(zhǔn)重新定義。以往的研究認(rèn)為最佳診斷界點是使評價指標(biāo)ψ(c)取得最大值的點,這個定義是不嚴(yán)謹(jǐn)?shù)摹1热?,在使用診斷準(zhǔn)確率作為試驗的評價指標(biāo)時,恰逢發(fā)病率極低的疾病,我們將診斷界點確定在一個較高的水平上如圖2的點c,甚至是更大的臨界值,那么大部分受試者均診斷為陰性,從而得到較高的診斷準(zhǔn)確率。但按照這樣的診斷標(biāo)準(zhǔn)會導(dǎo)致較大的漏診率。這樣的診斷界點盡管達(dá)到了診斷準(zhǔn)確率最大值,但在臨床上卻失去了實用價值。
圖2 兩個正態(tài)分布總體假設(shè)下無實際意義的最佳診斷界點
由此,兩個正態(tài)分布總體假設(shè)下,最佳診斷界點c*需同時滿足兩個條件:
i)使評價指標(biāo)ψ(c)取得最大值,即ψ(c*)=maxψ(c);
ii)在臨床診斷中具有實際意義,即c*∈(μY,μX)。那么重新定義后的最佳診斷界點可以表示為{c|maxψ(c)∩(μY,μX)}。換言之,若{c|maxψ(c)}與(μY,μX)沒有交集,那么就要重新考慮測量指標(biāo)及評價指標(biāo)是否合適。尤其要注意的是,最佳診斷界點與在區(qū)間上(μY,μX)函數(shù)ψ(c)的最大值點是不同的。
按照上述標(biāo)準(zhǔn),進(jìn)一步給出最佳診斷界點的確定方法。
首先,令ψ(c)導(dǎo)函數(shù)為0,得
方程作形式改變后得
可以看到ψ(c)的最大值點一定是對照組與病例組密度函數(shù)之比恰等于靈敏度與特異度的權(quán)重之比。
在兩種不同情況下解方程(4)。
該點在圖像上即兩概率密度函數(shù)曲線位于兩均值間的中點。
因此,若式(5)同時滿足c∈(μY,μX),那么有
否則,在該診斷試驗中,最佳診斷界點不存在。此時,需要斟酌測量指標(biāo)及評價指標(biāo)的選取是否合適。在實際處理中,若將對照組數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,而病例組數(shù)據(jù)做同樣的線性變換,則可直接得到(9)所示結(jié)果。可以清楚看到界點的絕對位置由μ、σ、λ三者共同決定。相比之下,對式(9)進(jìn)行討論確定最佳診斷界點要簡單的多,我們稱該式為標(biāo)準(zhǔn)化數(shù)據(jù)后的診斷界點。同時Δ≥0的條件可解釋為:當(dāng)σ2>1,且λ2≤σ2·exp時方程有解。但此時僅是方程的解,要確定為最佳診斷界點,還必須滿足在區(qū)間(0,μ)內(nèi),即
特別當(dāng)λ=1時,最佳診斷界點在圖像上為兩密度函數(shù)交點。即
為更清楚闡明以上方法,以冠心病研究中關(guān)于氧化低密度脂蛋白(ox-LDL)水平的診斷試驗為例尋找最佳診斷界點。目前關(guān)于ox-LDL的研究中,多認(rèn)為冠心病患者循環(huán)中ox-LDL水平明顯增高。因此可將其作為診斷冠心病風(fēng)險的一項生化指標(biāo)來區(qū)別患病與否[27-32]。在中山大學(xué)第一附屬醫(yī)院心血管科的一項對照診斷研究中[33],先后測得對照組ox-LDL的均數(shù)和標(biāo)準(zhǔn)差分別為0.490和0.267;病例組分別為2.028和0.896。在此,用樣本估計的總體參數(shù)分別為
首先計算Youden指數(shù)及相應(yīng)最佳診斷界點,可以得c1=1.0053,c2=-0.3251。顯然,取c*=1.0053,并計算相應(yīng)的spe(c*)=0.9732,sen(c*)=0.8732,J(c*)=0.8646。還可以采用前面提到的加權(quán)Youden指數(shù)進(jìn)行評價[23],假設(shè)λX、λY有不同賦值組合的情況下,同時令α0=0,依次計算Δ、c1、c2,并給出最佳診斷界點c*,計算相應(yīng)spe(c*)和sen(c*),所得結(jié)果均列在表1。
表1 不同λX,λY賦值時的最佳診斷界點
由表中可看到,當(dāng)λX=0.01,λY=0.99時,得到c1=1.4179、c2=-0.7377,因為0.490<c1<2.028,故c*=1.4179。隨后計算相對應(yīng)的spe(c*)=0.9997,sen(c*)=0.7520,ψ(c*)=0.9973。當(dāng)λX=0.50,λY=0.50時,得到c1=1.0053、c2=-0.3251,因為0.490<c1<2.028,故c*=1.0053,隨后計算相對應(yīng)的spe(c*)=0.9732,sen(c*)=0.8732,ψ(c*)=0.9232。當(dāng)λX=0.94,λY=0.06時,得到c1=0.4491、c2=0.2311,因為c1,c2<0.490,故不存在c*。而當(dāng)λX=0.95,λY=0.05時,因為Δ=-0.1712,故不存在c*。若出現(xiàn)后面這兩種情況,那么需要重新考慮評價指標(biāo)ψ(c)中的賦值λX、λY是否合適,如果指標(biāo)合適,則需進(jìn)一步考慮該診斷試驗中測量指標(biāo)的選取是否合適。
換個角度來看,上面的計算也可以看成計算診斷準(zhǔn)確率的情況,不同的λX表示不同的發(fā)病率,會看到當(dāng)發(fā)病率不同時得到的診斷界點也是不同的,甚至有不存在最佳診斷界點的情形。當(dāng)然對于一個診斷試驗來說,一旦試驗對象確定,那么發(fā)病率就是固定的,而不能像加權(quán)Youden指數(shù)那樣來賦予不同的權(quán)重組合,在這里只是通過該例子來說明發(fā)病率對最佳診斷界點位置的影響。
在本文中可以看到,對于公式(3)所示的評價指標(biāo),不同的λX、λY是通過比值λ改變最佳診斷界點的位置,而α0的變化不會改變診斷界點的位置。對于同一診斷試驗,只要比值λ相同,那么得到的是相同的診斷界點。就像在表1中,當(dāng)λX=0.50,λY=0.50時,得到的c*與λX=1,λY=1時即在Youden指數(shù)中計算的c*是相同的,因此得到的spe(c*)和sen(c*)也相同。但J(c*)<ψ(c*),這是由于在J(c*)、ψ(c*)中,α0分別為-1和0造成的。Δ隨著λ的增大而減小,因此會出現(xiàn)λ過大或過小的極端情形,導(dǎo)致評價指標(biāo)ψ(c)沒有駐點,從而找不到最佳診斷界點c*。表1中當(dāng)λX=0.95,λY=0.05時就屬此情形。此時,需要再次考慮兩個問題:(1)該評價指標(biāo)中的λX、λY的選取是否合適;(2)在給定λX、λY的評價方案下,該診斷試驗的方法及觀測變量的選取是否有價值。
本文根據(jù)評價指標(biāo)的函數(shù)形式進(jìn)行分類,建立關(guān)于靈敏度和特異度的一次多項式評價函數(shù)的標(biāo)準(zhǔn)形式,該表達(dá)式通過待定系數(shù)來表征不同的診斷試驗評價指標(biāo)。在兩個正態(tài)分布總體的假設(shè)下,結(jié)合評價指標(biāo)最大化提出了最佳診斷界點的新定義?;谇懊娴募僭O(shè),分別從病例與對照組方差相等和方差不等的情形分析最佳診斷界點是否存在。當(dāng)最佳診斷界點存在時,給出相應(yīng)的計算公式,并對影響該界點位置的因素以及影響方式進(jìn)行詳細(xì)討論。結(jié)果表明觀測變量的分布參數(shù)以及評價指標(biāo)中靈敏度與特異度的權(quán)重共同決定了最佳診斷界點的位置。文中最后對未得到最佳診斷界點的情況給出了直觀和合理的解釋。
1.Metz CE.Basic principles of ROC analysis.Semin Nucl Med,1978,8(4):283-298.
2.Greiner M,Pfeiffer D,Sm ith RD.Principles and practical application of the receiver-operating characteristic analysis for diagnostic tests.Prev Vet Med,2000,45(1-2):23-41.
3.Greiner M,Gardner IA.Epidem iologic issues in the validation of veterinary diagnostic tests.Prev VetMed,2000,45(1-2):3-22.
4.Fluss R,F(xiàn)araggi D,Reiser B.Estimation of the Youden Index and its associated cutoff point.Biom J,2005,47(4):458-472.
5.Perkins NJ,Schisterman EF,Vexler A.Generalized ROC curve inference for a biomarker subject to a lim itof detection andmeasurementerror.Stat Med,2009,28(13):1841-1860.
6.Schisterman EF,Perkins NJ,Liu A,et al.Optimal cut-point and its corresponding Youden Index to discrim inate individuals using pooled blood samples.Epidem iology,2005,16(1):73-81.
7.Perkins NJ,Schisterman EF,Vexler A.Receiver operating characteristic curve inference from a samplew ith a lim it of detection.Am JEpidem iol,2007,165(3):325-333.
8.Ruopp MD,Perkins NJ,Whitcomb BW,et al.Youden Index and optimal cut-point estimated from observations affected by a lower lim it of detection.Biom J,2008,50(3):419-430.
9.Perkins NJ,Schisterman EF.The Youden Index and the optimal cutpoint corrected formeasurement error.Biom J,2005,47(4):428-441.
10.Perkins NJ,Schisterman EF.The inconsistency of“optimal”cutpoints obtained using two criteria based on the receiver operating characteristic curve.Am JEpidemiol,2006,163(7):670-675.
11.Yerushalmy J.Statistical problems in assessing methods of medical diagnosis,w ith special reference to X-ray techniques.Public Health Rep,1947,62(40):1432-1449.
12.陳平雁,郭祖超.比較兩種診斷試驗的統(tǒng)計方法.
13.陳平雁,王斌會.幾種診斷試驗統(tǒng)計方法的比較.
14.陳平雁.診斷試驗的評價指標(biāo)及其應(yīng)用.
15.陳平雁,胡琳.評價診斷試驗的信息量方法.
16.Youden WJ.Index for rating diagnostic tests.Cancer,1950,3(1):32-35.
17.Vecchio TJ.Predictive value of a single diagnostic test in unselected populations.N Engl JMed,1966,274(21):1171-1173.
18.Glas AS,Lijmer JG,Prins MH,et al.The diagnostic odds ratio:a single indicator of test performance.JClin Epidem iol,2003,56(11):1129-1135.
19.Cohen JA coefficient of agreement for nom inal scales.Educational and psychologicalmeasurement,1960,20(1):37-46.
20.Metz CE,Goodenough DJ,Rossmann K.Evaluation of receiver operating characteristic curve data in terms of information theory,w ith applications in radiography.Radiology,1973,109(2):297-303.
21.Guinan P,Bush I,Ray V,et al.The accuracy of the rectal examination in the diagnosis of prostate carcinoma.New England Journal of Medicine,1980,303(9):499-503.
22.Galen RS,Gambino SR.Beyond normality:the predictive value and efficiency ofmedical diagnoses.W iley New York,1975.
23.Rucker G,Schumacher M.Summary ROC curve based on a weighted Youden index for selecting an optimal cutpoint in meta-analysis of diagnostic accuracy.Stat Med,2010,29(30):3069-3078.
24.Li D,Shen F,Yin Y,et al.Weighted Youden index and its two-independent-sample comparison based on weighted sensitivity and specificity.Chinese Medical Journal,2013,126(6):1150-1154.
25.Zhou X,ObuchowskiNA,M cclish DK.Statisticalmethods in diagnostic medicine.Wiley,2011.
26.李丹玲,陳平雁.基于靈敏度和特異度任意賦權(quán)的廣義標(biāo)準(zhǔn)化診斷符合率.2011.
27.Kampus P,Kals J,Ristimae T,etal.Augmentation index and carotid intima-media thickness are differently related to age,C-reactive protein and oxidized low-density lipoprotein.JHypertens,2007,25(4):819-825.
28.Shimada K,Mokuno H,Matsunaga E,et al.Circulating oxidized lowdensity lipoprotein is an independent predictor for cardiac event in patients w ith coronary artery disease.Atherosclerosis,2004,174(2):343-347.
29.Holvoet P,Harris TB,Tracy RP,et al.Association of high coronary heart disease risk statusw ith circulating oxidized LDL in the well-functioning elderly:findings from the Health,Aging,and Body Composition study.Arterioscler Thromb Vasc Biol,2003,23(8):1444-1448.
30.Suzuki T,Kohno H,Hasegawa A,et al.Diagnostic implications of circulating oxidized low density lipoprotein levels as a biochem ical risk marker of coronary artery disease.Clin Biochem,2002,35(5):347-353.
31.Isomaa B,Almgren P,Tuom i T,et al.Cardiovascular morbidity and mortality associated w ith themetabolic syndrome.Diabetes Care,2001,24(4):683-689.
32.Holvoet P,Vanhaecke J,Janssens S,etal.Oxidized LDL andmalondialdehyde-modified LDL in patients w ith acute coronary syndromes and stable coronary artery disease.Circulation,1998,98(15):1487-1494.
33.Huang H,MaiW,Liu D,et al.The oxidation ratio of LDL:a predictor for coronary artery disease.Dis Markers,2008,24(6):341-349.
(責(zé)任編輯:郭海強)
*國家自然科學(xué)基金資助(30972554;81273191)
△通信作者:陳平雁