亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        合理進(jìn)行多重Logistic回歸分析
        ——結(jié)合ROC曲線分析

        2022-02-02 03:23:40胡純嚴(yán)胡良平
        四川精神衛(wèi)生 2022年6期
        關(guān)鍵詞:血鈉面積曲線

        胡純嚴(yán) ,胡良平 ,2*

        (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

        在醫(yī)學(xué)上,若某種定量觀測指標(biāo)的取值大小與受試者是否患某種疾病之間存在一定的關(guān)聯(lián)性,研究者希望用某種定量指標(biāo)的取值去預(yù)測或判斷受試者患該疾病的概率。這樣的定量指標(biāo)被稱為診斷指標(biāo)。而評價(jià)這種診斷指標(biāo)診斷性能高低的有效方法為ROC曲線分析。本文將基于多重Logistic回歸分析,并結(jié)合ROC曲線分析處理診斷試驗(yàn)資料,以展示將這兩種方法結(jié)合使用相較于僅用多重Logistic回歸分析,可以獲得更豐富、更合理的統(tǒng)計(jì)分析結(jié)果。

        1 基本概念

        1.1 常用診斷指標(biāo)的統(tǒng)計(jì)描述

        1.1.1 診斷試驗(yàn)結(jié)果的表達(dá)形式

        診斷試驗(yàn)結(jié)果可整理成表1所示的形式[1]。

        表1 診斷試驗(yàn)結(jié)果的表達(dá)形式Table 1 Expression of diagnostic test results

        1.1.2 評價(jià)診斷試驗(yàn)真實(shí)性的指標(biāo)

        1.1.2.1 金標(biāo)準(zhǔn)或標(biāo)準(zhǔn)診斷

        評價(jià)任何一種診斷試驗(yàn)在臨床上的價(jià)值,都是與金標(biāo)準(zhǔn)或標(biāo)準(zhǔn)診斷相比較而言的。所謂金標(biāo)準(zhǔn),是醫(yī)學(xué)界公認(rèn)的、具有診斷某一疾病價(jià)值的最佳方法,如國際、國內(nèi)公認(rèn)的診斷標(biāo)準(zhǔn)、方法、病理學(xué)檢查、手術(shù)所見及特殊檢查所獲得的結(jié)論等。

        1.1.2.2 靈敏度

        靈敏度(Sensitivity,Se)即真陽性率,指在標(biāo)準(zhǔn)診斷確診陽性組中,診斷試驗(yàn)陽性結(jié)果人數(shù)與患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(1)。

        靈敏度反映了診斷試驗(yàn)將實(shí)際已患所研究疾病的受試者正確判斷為該病患者的能力。

        1.1.2.3 假陰性率

        假陰性率(False negative rate,F(xiàn)NR)即漏診率,指在標(biāo)準(zhǔn)診斷確診陽性組中,診斷試驗(yàn)陰性結(jié)果人數(shù)與患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(2)。

        假陰性率反映了診斷試驗(yàn)將實(shí)際已患所研究疾病的受試者錯(cuò)誤判斷為非該病患者的比例。

        1.1.2.4 特異度

        特異度(Specificity,Sp)即真陰性率,指在標(biāo)準(zhǔn)診斷確診陰性組中,診斷試驗(yàn)陰性結(jié)果人數(shù)與非患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(3)。

        特異度反映了診斷試驗(yàn)將實(shí)際未患所研究疾病的受試者正確判斷為非該病患者的能力。

        1.1.2.5 假陽性率

        假陽性率(False positive rate,F(xiàn)PR)即誤診率,指在標(biāo)準(zhǔn)診斷確診陰性組中,診斷試驗(yàn)陽性結(jié)果人數(shù)與非患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(4)。

        假陽性率反映了診斷試驗(yàn)將實(shí)際未患所研究疾病的受試者錯(cuò)誤判斷為該病患者的比例。

        1.1.2.6 約登指數(shù)

        約登指數(shù)(Yonden's index)又稱正確指數(shù),是評價(jià)診斷試驗(yàn)結(jié)果真實(shí)性的綜合指標(biāo),其計(jì)算公式見式(5)。

        1.2 診斷資料的ROC曲線分析方法

        1.2.1 ROC曲線分析

        ROC是受試者工作特征(Receiver Operating Characteristic,ROC)或相對工作特征(Relative Operating Characteristic)的縮寫[2-3]。ROC曲線分析于20世紀(jì)50年代起源于統(tǒng)計(jì)決策理論,后來應(yīng)用于雷達(dá)信號觀察能力的評價(jià),20世紀(jì)60年代中期,該方法大量成功地用于實(shí)驗(yàn)心理學(xué)和心理物理學(xué)研究。1971年,Lusted描述了如何將心理物理學(xué)上常用的ROC曲線方法用于醫(yī)學(xué)決策,該方法克服了診斷試驗(yàn)中僅孤立地使用靈敏度與特異度以及相關(guān)指標(biāo)的缺陷。自此以后,ROC曲線分析成為非常有價(jià)值的描述與比較診斷試驗(yàn)的工具。

        1.2.2 ROC曲線的構(gòu)建

        ROC曲線的橫軸(x軸)表示診斷試驗(yàn)的假陽性率,常表示為1-Sp,縱軸(y軸)表示診斷試驗(yàn)的靈敏度,由不同決策界值點(diǎn)(1-Sp,Se)產(chǎn)生二維直角坐標(biāo)系(簡稱圖)中的不同點(diǎn)。采用線段連接圖中所有可能的界值點(diǎn),即形成經(jīng)驗(yàn)ROC曲線。隨著靈敏度的增加,假陽性率也增加,ROC曲線下面積反映了這種增加的數(shù)量大小。

        2 計(jì)算方法

        2.1 ROC曲線下面積的計(jì)算

        2.1.1 計(jì)算方法概述

        一般采用“ROC曲線下面積”反映診斷試驗(yàn)的準(zhǔn)確性。理論上,這一指標(biāo)取值范圍為0.5~1.0,完全無價(jià)值的診斷試驗(yàn)的ROC曲線下面積為0.5,完善的診斷試驗(yàn)的ROC曲線下面積為1.0。ROC曲線下面積及其標(biāo)準(zhǔn)誤的計(jì)算目前有非參數(shù)、半?yún)?shù)和參數(shù)方法,應(yīng)用較廣泛的包括Wilcoxon非參數(shù)法和最大似然估計(jì)“雙正態(tài)”參數(shù)法。參數(shù)法與非參數(shù)法估計(jì)ROC曲線下面積均適用于診斷結(jié)果為連續(xù)性定量資料或等級資料的診斷試驗(yàn)的評價(jià)。

        2.1.2 非參數(shù)法

        非參數(shù)法是根據(jù)診斷試驗(yàn)結(jié)果直接計(jì)算繪制ROC曲線所需的工作點(diǎn),由此繪制的ROC曲線為經(jīng)驗(yàn)ROC曲線,曲線下面積與患者和非患者試驗(yàn)結(jié)果秩和檢驗(yàn)的Mann-Whitney統(tǒng)計(jì)量相等,但其結(jié)果常小于真實(shí)的面積值。

        2.1.3 參數(shù)法

        參數(shù)法是根據(jù)試驗(yàn)結(jié)果擬合雙正態(tài)模型,利用最大似然法估計(jì)模型的2個(gè)參數(shù)a和b,由2個(gè)參數(shù)可得到光滑的ROC曲線及曲線下面積的估計(jì)值。參數(shù)法的應(yīng)用條件為:患者與非患者的診斷試驗(yàn)結(jié)果服從雙正態(tài)分布。當(dāng)不滿足這一應(yīng)用條件時(shí),需要采用變量變換,將診斷試驗(yàn)結(jié)果轉(zhuǎn)換為正態(tài)分布;在樣本量較大、相同值較少時(shí),參數(shù)法與非參數(shù)法估計(jì)的ROC曲線下面積常常近似相等。雙正態(tài)模型參數(shù)法估計(jì)ROC曲線下面積的公式見式(6)。

        式(6)中的a和b分別見式(7)和式(8)。

        式(6)、式(7)和式(8)中,A為ROC曲線下面積,a和b分別為雙正態(tài)模型的2個(gè)參數(shù),Φ表示標(biāo)準(zhǔn)正態(tài)分布函數(shù),xˉ和yˉ分別為患者組和非患者組診斷試驗(yàn)結(jié)果的均數(shù)(假定患者組高于非患者組,μx>μy),sx和sy分別為患者組和非患者組診斷試驗(yàn)結(jié)果的標(biāo)準(zhǔn)差。

        2.2 多條ROC曲線下面積的比較

        在成組設(shè)計(jì)下,兩獨(dú)立樣本所算得的ROC曲線下面積的比較,可令兩面積之間的協(xié)方差為0;在自身配對設(shè)計(jì)下,兩種診斷方法測定同一組樣本,此時(shí),兩面積之間的協(xié)方差不為0,有較復(fù)雜的計(jì)算公式。當(dāng)兩條ROC曲線無交叉時(shí),它們ROC曲線下面積的比較可由式(9)計(jì)算。

        式(9)中的Z值服從或近似服從標(biāo)準(zhǔn)正態(tài)分布,查正態(tài)分布表可得相應(yīng)的P值,A1和A2分別為兩診斷試驗(yàn)ROC曲線下面積,Var(A1)和Var(A2)分別為兩曲線下面積的方差,Cov(A1,A2)為兩曲線下面積的協(xié)方差,當(dāng)兩診斷試驗(yàn)獨(dú)立時(shí),此協(xié)方差項(xiàng)為0。當(dāng)兩條ROC曲線交叉時(shí),兩診斷試驗(yàn)的比較應(yīng)比較部分ROC曲線下的面積或固定假陽性率時(shí)的靈敏度。當(dāng)需要同時(shí)比較多條ROC曲線下面積時(shí),一般需要選定其中之一作為對照,生成比較矩陣,構(gòu)建復(fù)雜且服從χ2分布的檢驗(yàn)統(tǒng)計(jì)量,見文獻(xiàn)[2,4]。

        3 實(shí)例與SAS實(shí)現(xiàn)

        3.1 問題與數(shù)據(jù)結(jié)構(gòu)

        3.1.1 問題與數(shù)據(jù)

        【例1】研究者采用某種金標(biāo)準(zhǔn),將45例受試者中的21例診斷為落基山斑點(diǎn)熱(RMSF)(病例組),其余24例為非RMSF(對照組),分別用兩種方法測得受試者血鈉水平,因篇幅所限,具體數(shù)據(jù)見文獻(xiàn)[5]。問這兩種方法診斷性能之間的差異有無統(tǒng)計(jì)學(xué)意義?

        3.1.2 對數(shù)據(jù)結(jié)構(gòu)的分析

        例1的資料涉及3個(gè)變量,一是金標(biāo)準(zhǔn)診斷結(jié)果(包括患RMSF、非RMSF),二是檢測方法(包括方法1、方法2),三是血鈉水平。

        3.1.3 統(tǒng)計(jì)分析方法的選擇

        如何選擇統(tǒng)計(jì)分析方法對例1中的資料進(jìn)行分析,取決于研究目的。第一個(gè)目的:分析檢測方法和血鈉水平對診斷結(jié)果的影響是否有統(tǒng)計(jì)學(xué)意義。此時(shí),適合選用二值結(jié)果變量的多重Logistic回歸分析[6-7]。第二個(gè)目的:基于哪種檢測方法得到的血鈉水平,對診斷受試者是否患RMSF的診斷性能更好。此時(shí),適合選用基于多重Logistic回歸分析的ROC曲線分析。

        3.2 僅采用多重Logistic回歸分析

        3.2.1 將檢驗(yàn)方法和血鈉水平值分別視為定性和計(jì)量原因變量

        分別采用method和bs表示“檢測方法”和“血鈉水平值”。設(shè)所需要的SAS程序如下:

        【SAS主要輸出結(jié)果及解釋】由glm過程輸出的主要結(jié)果見表2。

        表2 兩因素各水平組合下的血鈉水平(±s)Table 2 Blood sodium value under the combination of two factors and different levels

        表2 兩因素各水平組合下的血鈉水平(±s)Table 2 Blood sodium value under the combination of two factors and different levels

        “disease”的水平“method”的水平數(shù) 目0 0 1 1 0 1 0 1 24 24 21 21血鈉水平(mmol/L)136.500±5.022 137.417±3.729 130.238±4.918 130.714±4.406

        由以上輸出結(jié)果可知,RMSF患者的平均血鈉水平(disease=1)低于非RMBF者的平均血鈉水平(disease=0);方法1測定的平均血鈉水平(method=1)高于方法2測定的平均血鈉水平(method=0)。

        由Logistic過程輸出的主要結(jié)果見表3。

        表3 Logistic回歸模型中參數(shù)的估計(jì)和假設(shè)檢驗(yàn)結(jié)果Table 3 Estimation and hypothesis test results of the parameters in the Logistic regression model

        由以上輸出結(jié)果可知,兩種檢測方法之間差異無統(tǒng)計(jì)學(xué)意義(χ2=0.207,P=0.649),說明兩種檢測方法在診斷RMSF方面的性能接近;血納水平對結(jié)果的影響有統(tǒng)計(jì)學(xué)意義(χ2=22.453,P<0.01),因血鈉水平的回歸系數(shù)為負(fù)值且建模的概率為disease=1(即患RMSF),說明RMSF患者較非RMSF者的血鈉水平低。

        3.2.2 將兩次檢測的血鈉水平作為自變量

        分別采用m1和m2表示第1次與第2次血鈉水平檢測結(jié)果。設(shè)所需要的SAS程序如下:

        【SAS主要輸出結(jié)果及解釋】由Logistic過程輸出的主要結(jié)果見表4。

        表4 Logistic回歸模型中參數(shù)的估計(jì)和假設(shè)檢驗(yàn)結(jié)果Table 4 Estimation and hypothesis test results of the parameters in the Logistic regression model

        由以上輸出結(jié)果可知,兩種檢測方法檢測的血鈉水平對預(yù)測患RMSF有統(tǒng)計(jì)學(xué)意義(P均<0.01)。由于對disease=1(患RMSF)建模,又由于m1與m2的回歸系數(shù)分別為負(fù)值與正值,表明方法1檢測的血鈉水平一般低于方法2。

        3.3 基于多重Logistic回歸分析并結(jié)合ROC曲線分析

        3.3.1 以空模型為對照進(jìn)行ROC曲線下面積比較

        設(shè)所需要的SAS程序如下:SAS數(shù)據(jù)步程序與“第3.2.2節(jié)”中的數(shù)據(jù)步相同,下面僅給出SAS過程步程序。

        proc logistic data=a1;

        model disease(event="1")=m1 m2;

        roc m1; roc m2; roc;

        roccontrast reference('roc3') / estimate e;

        run;

        【SAS主要輸出結(jié)果及解釋】與ROC曲線分析有關(guān)的計(jì)算結(jié)果見表5。

        表5 ROC曲線下面積及其關(guān)聯(lián)統(tǒng)計(jì)量的計(jì)算結(jié)果Table 5 Calculation results of area under ROC curveand its association statistics

        在以上的輸出結(jié)果中,“模型”代表包含方法1和方法2檢測結(jié)果的總模型;ROC1代表僅有方法1檢測結(jié)果的模型;ROC2代表僅有方法2檢測結(jié)果的模型;ROC3代表空模型。從表格的前3行結(jié)果中的95%置信區(qū)間不包含0.5可以間接判斷出,前3個(gè)模型對應(yīng)的ROC曲線下的面積與0.5之間的差異有統(tǒng)計(jì)學(xué)意義。不同模型對應(yīng)的ROC曲線下面積的比較結(jié)果見表6。

        表6 ROC對比估計(jì)和逐行檢驗(yàn)結(jié)果Table 6 Results of ROC comparative estimation and the row by row test

        由以上輸出結(jié)果可知,3個(gè)模型(總模型、ROC1、ROC2)與空模型(ROC3)ROC曲線下面積相比較,P值均<0.01。說明這3個(gè)模型對RMSF都具有一定的診斷價(jià)值。

        3.3.2 以方法2的模型為對照進(jìn)行ROC曲線下面積比較

        設(shè)所需要的SAS程序如下:

        【SAS主要輸出結(jié)果及解釋】以方法2的模型為對照,與其他模型ROC曲線下面積進(jìn)行比較,結(jié)果見表7。

        表7 ROC對比估計(jì)和逐行檢驗(yàn)結(jié)果Table 7 Results of ROC comparative estimation and the row by row test

        由以上輸出結(jié)果可知,3個(gè)其他模型與方法2的模型比較,ROC曲線下的面積之間的差異均有統(tǒng)計(jì)學(xué)意義(P<0.05或0.01)。說明在診斷RMSF方面,方法1比方法2好。

        3.3.3 采用score語句輸出各診斷評價(jià)指標(biāo)的估計(jì)值

        設(shè)所需要的SAS程序如下:

        【SAS主要輸出結(jié)果及解釋】各種診斷試驗(yàn)評價(jià)指標(biāo)[8]的估計(jì)值見表8。

        表8 各觀測點(diǎn)上各種診斷試驗(yàn)評價(jià)指標(biāo)的估計(jì)值Table 8 Estimated values of various diagnostic test evaluation indicatorsat each observation point

        “19個(gè)觀測”代表用方法1檢測45例受試者,得到了19個(gè)不同的血鈉水平(m1)。將這19個(gè)m1從小到大排序(實(shí)現(xiàn)的SAS程序?yàn)椋簆roc freq data=a1;tables m1;run;),到第9個(gè)m1(m1=133)時(shí)的累計(jì)頻率為0.400,到第10個(gè)m1(m1=134)時(shí)的累計(jì)頻率為0.444。由輸出結(jié)果的最后一行可知,Yonden指數(shù)=0.607為最大值,此時(shí)對應(yīng)的概率(近似等于累計(jì)頻率)為0.402。提示:基于方法1檢測結(jié)果診斷受試者是否患RMSF,對應(yīng)的血鈉水平的最佳診斷點(diǎn)介于133~134 mmol/L,可近似將血鈉水平133 mmol/L作為RMSF的最佳診斷點(diǎn)。

        3.4 結(jié)論

        由“第3.2節(jié)”的分析結(jié)果可知,采用兩種多重Logistic回歸模型分析,得到如下兩個(gè)結(jié)論:其一,兩種檢測血鈉水平的方法在診斷RMSF方面的性能基本相同;其二,檢測方法1比檢測方法2得到的平均血鈉水平低。

        由“第3.3節(jié)”的分析結(jié)果可知,采用基于多重Logistic回歸分析,并結(jié)合ROC曲線分析,得到如下兩個(gè)結(jié)論:其一,兩種檢測血鈉水平的方法在診斷RMSF方面的準(zhǔn)確度不同,方法1優(yōu)于方法2;其二,基于ROC曲線分析,可以獲得血鈉水平的診斷點(diǎn)的估計(jì)值。

        4 討論與小結(jié)

        4.1 討論

        在“第3.2節(jié)”的分析中,顯示的“觀測數(shù)(即樣本含量)”為90例,這是因?yàn)閷γ课皇茉囌哌M(jìn)行了兩次重復(fù)觀測,故得45×2=90。嚴(yán)格地說,該資料所對應(yīng)的設(shè)計(jì)類型為具有1個(gè)重復(fù)測量因素的兩因素設(shè)計(jì)(試驗(yàn)分組因素為“是否患RMSF”,重復(fù)測量因素為“兩種檢測方法”)。由于兩次檢測的指標(biāo)都是血鈉水平,故對每位受試者測得的兩個(gè)血鈉水平數(shù)據(jù)可以相減(屬于自身配對),得到差量(md)。這樣,就消除了一個(gè)自變量(即兩種檢測方法)。此時(shí),就可用差量md作為唯一的自變量,以disease作為二值結(jié)果變量,構(gòu)建一重Logistic回歸模型,分析的結(jié)果表明:md對結(jié)果的影響無統(tǒng)計(jì)學(xué)意義,也就意味著兩種檢測方法的診斷性能基本相同。但這個(gè)結(jié)論與“第3.3節(jié)”所得的結(jié)論(方法1的診斷性能好于方法2)不一致。值得一提的是:“第3.2.1節(jié)”的分析法相當(dāng)于兩血鈉水平均值之間的比較,而“第3.3.2節(jié)”的分析法相當(dāng)于兩條ROC曲線下面積之間的比較。結(jié)果表明,“第3.3.2節(jié)”的分析法對資料的利用率高于前者,故所得結(jié)論更可信。

        4.2 小結(jié)

        本文介紹了常用診斷指標(biāo)的統(tǒng)計(jì)描述和診斷資料的ROC曲線分析方法;扼要介紹了ROC曲線下面積的計(jì)算和多條ROC曲線下面積的比較;針對一個(gè)診斷試驗(yàn)資料,采取了兩種分析策略。第一種,僅采用多重Logistic回歸分析;第二種,基于多重Logistic回歸分析,再使用ROC曲線分析。從兩種分析策略得到的結(jié)果和結(jié)論來看,第二種分析策略比第一種分析策略好,獲得了更豐富的結(jié)果和更合理的結(jié)論。

        猜你喜歡
        血鈉面積曲線
        未來訪談:出版的第二增長曲線在哪里?
        出版人(2022年8期)2022-08-23 03:36:50
        自發(fā)性腦出血發(fā)病后血鈉水平對30 d內(nèi)死亡率的影響
        血鈉波動值在預(yù)警院內(nèi)死亡中的價(jià)值
        怎樣圍面積最大
        最大的面積
        巧用面積法解幾何題
        肝硬化急性消化道出血患者應(yīng)用特利加壓素治療后低鈉血癥的發(fā)病率及其危險(xiǎn)因素
        幸福曲線
        英語文摘(2020年6期)2020-09-21 09:30:40
        沿平坦凸曲線Hilbert變換的L2有界性
        巧用面積求坐標(biāo)
        中文字幕一区二区在线看| 久久久久人妻精品一区蜜桃 | 伊在人天堂亚洲香蕉精品区| 黄又色又污又爽又高潮动态图| 一区欧美在线动漫| 一区二区视频资源在线观看| 91精品久久久中文字幕| 无码人妻精品一区二区三区东京热| 大陆极品少妇内射aaaaaa| 中文字幕在线日韩| 精选二区在线观看视频| 日韩中文字幕不卡在线| 免费国产在线精品一区| 天天做天天爱天天爽综合网| 手机看片国产日韩| 色视频日本一区二区三区| 亚洲网站一区在线播放| 97久久精品人妻人人搡人人玩| 搡老熟女老女人一区二区| 禁止免费无码网站| 国产免费精品一品二区三| 亚洲国产成人av二区| 日韩丰满少妇无码内射| 亚洲另类激情综合偷自拍图| 夫妻一起自拍内射小视频| 人妻中文久久人妻蜜桃| 中文字幕日韩人妻在线视频| 97伦伦午夜电影理伦片| 仙女白丝jk小脚夹得我好爽| 国产少妇露脸精品自拍网站| 亚洲午夜狼人综合影院| 精品久久久久成人码免费动漫| 日本www一道久久久免费榴莲| 性色av成人精品久久| 亚洲精品久久视频网站| 蜜桃日本免费观看mv| 香蕉久久人人97超碰caoproen| 国产三级国产精品三级在专区| 精品国产乱子伦一区二区三| 风情韵味人妻hd| 久久av无码精品人妻出轨|