亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        定量變量的分級方法對logistic模型影響的研究*

        2014-04-03 07:49:24周凌峰安勝利
        中國衛(wèi)生統(tǒng)計 2014年4期
        關(guān)鍵詞:偏態(tài)均數(shù)因變量

        周凌峰 安勝利

        logistic回歸分析是用于篩選影響因素及建立預(yù)測模型的最常用的方法之一,它的綜合預(yù)報效果具有很好的穩(wěn)健性和非模糊性[1-2]。在logistic回歸分析中,常會用到三種自變量類型:定量變量、等級變量及分類變量,為使得OR值具有更明確的臨床意義或便于預(yù)測模型的實際應(yīng)用,研究者[3-5]常將有統(tǒng)計學(xué)意義的定量變量轉(zhuǎn)化為兩個或兩個以上等級,并賦予相應(yīng)的分數(shù)。但目前等級劃分方法大多是由研究者主觀決定,若分界點選擇不當(dāng),其模型預(yù)測效果便會受到影響,甚至?xí)绊懙窖芯拷Y(jié)論的正確性。本研究擬在計算機上以常用的非條件二分類logistic回歸分析為例進行模擬研究,在不同的參數(shù)條件下,對有統(tǒng)計學(xué)意義的自變量進行不同數(shù)量、不同方式的等級劃分,建立預(yù)測模型,考察其預(yù)測效果的變化規(guī)律,并對所得結(jié)論以實例進行考核,以期發(fā)現(xiàn)各種參數(shù)條件下合理的等級劃分方法。為建立更準確、實用的logistic預(yù)測模型提供可靠的變量轉(zhuǎn)化依據(jù)。

        方 法

        為了便于解釋,本研究將模擬數(shù)據(jù)簡化設(shè)計為僅有一個自變量X(連續(xù)變量)及一個因變量Y(0-1變量),然后觀測各種轉(zhuǎn)換方法對預(yù)測模型的影響規(guī)律,進而延伸說明多個自變量情況下該指標的變化狀況。

        1.自變量

        利用R語言,模擬產(chǎn)生單個自變量,考慮三種分布狀況,即標準正態(tài)分布、正偏態(tài)分布、負偏態(tài)分布。標準正態(tài)分布使用rnorm( )語句直接生成。正(負)偏態(tài)則采取以下方法產(chǎn)生。以正偏態(tài)為例,生成1000例標準正態(tài)分布數(shù)據(jù),并截掉大于0.8的部分,同時再生成1000例0至5.5服從均勻分布的數(shù)據(jù),合并二者后,從中選取1500例,最后得到近似正偏態(tài)的數(shù)據(jù)。負偏態(tài)自變量采取類似方法。

        2.因變量

        為了保證原始數(shù)據(jù)中自變量與因變量經(jīng)logistic回歸分析具有一定的聯(lián)系,因變量可利用自變量通過公式產(chǎn)生;鑒于因變量0、1的分布在實際數(shù)據(jù)中存在不同,我們通過調(diào)整OR值來改變Y的分布。方法如下:

        利用logistic回歸模型計算陽性事件發(fā)生概率P:

        (1)

        式中e為隨機誤差,服從標準正態(tài)分布。

        假定β0為任意已知常數(shù),如0.2,取βm為log(OR),并取多種OR值情況(如OR=1.5~5,以0.5為間隔)。當(dāng)確定某OR值后,便可通過上式計算相應(yīng)的陽性事件發(fā)生概率P,對應(yīng)的因變量Y則由0-1二項分布函數(shù)計算得到。

        3.確定樣本含量

        對上述產(chǎn)生的數(shù)據(jù)逐步增加樣本含量,并觀察自變量轉(zhuǎn)換后,其與因變量的關(guān)系變化,當(dāng)這種關(guān)系穩(wěn)定時所對應(yīng)的樣本含量即為所需模擬的樣本含量大小。經(jīng)測試,樣本量為1500時滿足上述要求。

        4.自變量分級方法

        共考慮三種分級數(shù),即二級、三級、四級分類。

        (1)二級分類

        均數(shù)分級:以均數(shù)為分割點分為兩級;中位數(shù)分級:以中位數(shù)為分割點分為兩級;ROC分級:對自變量與因變量做ROC曲線,取約登指數(shù)最大的自變量值為分割點。分別賦為0、1。

        (2)三級分類

        (3)四級分類

        百分位四等分:將自變量從小到大排序,并依據(jù)總的樣本量平均分為四級,各級觀察單位數(shù)約占總樣本量的25%;極差四等分分級:自變量最大值減最小值所得區(qū)間平均分為四份,分別賦為0、1、2、3。

        5.評價指標

        從現(xiàn)行的一些研究來看,學(xué)者們[6-9]較為關(guān)注兩個方面,一方面是分級后的自變量對因變量的預(yù)測準確程度;另一方面,分級后變量在回歸中的擬合效果。對于前者,人們普遍采用ROC曲線下面積AUC[10]來衡量其優(yōu)劣程度,本研究亦采用AUC作為其中一種評價指標。在第二方面,本研究擬采用AIC信息量[11]。

        在各種參數(shù)條件下(OR=1.5~5,以0.5為間隔),對模擬數(shù)據(jù)(分別對不分級、各分級情形)計算AUC,同時再進行l(wèi)ogistic回歸計算AIC信息量,重復(fù)模擬1000次,并計算上述兩指標的平均值及標準差。

        6.模擬次數(shù)確定

        不同分布、不同OR值下,當(dāng)AUC、AIC均值達到穩(wěn)定時所對應(yīng)的模擬次數(shù)即為所需模擬的總次數(shù)。經(jīng)過測試,本研究各種情況下模擬次數(shù)取1000次即可達到穩(wěn)定。

        結(jié) 果

        正態(tài)和部分正偏態(tài)分布模擬結(jié)果見圖1-圖5。

        圖1 正態(tài)分布分二級

        1.二級分級

        正態(tài)分布下均數(shù)與中位數(shù)分級結(jié)果基本沒有區(qū)別(理論上也應(yīng)如此)。分級首選為ROC分級,其次為均數(shù)或中位數(shù)分級。

        偏態(tài)分布時,首選ROC分級,其余方法AUC和AIC兩指標無法同時最優(yōu),若以AIC為首選指標,則最優(yōu)為均數(shù)分級,若以AUC為首選指標則最優(yōu)為中位數(shù)分級。

        2.三級分級

        圖2 正態(tài)分布分三級

        偏態(tài)時,均數(shù)±標準差不宜作為統(tǒng)計描述指標,因此不做模擬,從優(yōu)到劣的分級方法順序為百分位三等分、四分位數(shù)分級、極差三等分分級。

        3.四級分級

        正態(tài)分布或偏態(tài)分布下,方法優(yōu)先順序均為百分位數(shù)四等分分級、極差四等分分級,其中偏態(tài)分布下,OR值<3時,AIC信息量曲線略有交叉,OR>3后百分位數(shù)四等分分級AIC略優(yōu)于極差四等分,但二者區(qū)別不大。

        實例考核

        1.實例背景

        某研究在各個時間點均獲得57名病人的各指標結(jié)果,如neu,wbc,crp等,并以記錄病人是否發(fā)生了感染(1-發(fā)生感染,0-未發(fā)生感染),目的是用特定時間的指標建立診斷、預(yù)測感染的模型?,F(xiàn)假設(shè)需要對其中的第9個時間點的某定量指標(neu9)進行分級,將其轉(zhuǎn)換為等級變量來建立預(yù)測感染模型。

        2.實例分級驗證

        首先,確定該定量變量(neu9)的分布,經(jīng)Kolmogorov-Smirnov以及Shapiro-Wilk正態(tài)性檢驗,P值均大于0.10,可以近似看作正態(tài)分布。經(jīng)logistic回歸分析,有統(tǒng)計學(xué)意義,并計算出該變量OR值為1.1,假定欲將neu9分別分為二級、三級、四級,所得結(jié)果如表1。

        圖3 正態(tài)分布分四級

        表1 實例考核結(jié)果

        該定量變量OR<1.5,對比前述模擬結(jié)果,由表1可知,實例數(shù)據(jù)所得結(jié)論基本符合模擬結(jié)果給出的預(yù)期結(jié)論。

        由此,綜合以上結(jié)論分析,我們可以給出OR為1.5~5內(nèi)的一個簡明的分級建議,見表2。

        圖4 正偏態(tài)分布二級

        表2 三種分布分級建議

        其他數(shù)據(jù)分布若與上述特定分布存在較大偏差,則最優(yōu)分級方法可能會與上述分級建議不一致。建議通過比較不同分級方法下的ROC曲線下面積、AIC信息量兩指標,擇優(yōu)選擇。

        改進方向

        目前還有一些其他學(xué)者提出的分級方法未能在本研究中進行演示,擬在今后的研究中,繼續(xù)拓展分級方法,給出更多的分級參考。另外,由于偏態(tài)分布模擬沒有特定的參數(shù)標準,實際的偏態(tài)分布形式多樣。經(jīng)本研究的驗證,不同偏態(tài)分布數(shù)據(jù)可能得到不同最優(yōu)分級方法,因此對于特定偏態(tài)分布本研究的分級建議參考價值有限。本研究在數(shù)據(jù)模擬中,OR值取值范圍為常見的1.5~5(以0.5為間隔),如果繼續(xù)擴大OR值的取值范圍,AUC和AIC結(jié)果會否出現(xiàn)其他結(jié)論?其對分級方法的選擇又有何影響?這將在以后的研究中繼續(xù)探討。

        圖5 正偏態(tài)分布三級

        參 考 文 獻

        1.鐘曉妮,周燕榮.女性乳腺癌預(yù)報模型研究.數(shù)理醫(yī)藥學(xué)雜志,2002,15(1):4-6.

        2.Steyerberg EW,Eijkemans MJ,Harrell FE Jr.Prognostic modeling with logistic regression analysis:in search of a sensible strategy in small data sets.Medical Decision Making,2001,21 (1):45-56.

        3.萬偉.影響老年高血壓患者血壓控制率因素的Logistic回歸分析.高血壓雜志,2001,9(1):74-75.

        4.陳暉,王小波,張麗萍,等.中老年人牙列缺損危險因素的Logistic回歸分析.山東醫(yī)藥,2010,50(48):48-49.

        5.Subherwal S,Richard GB,Anita YC,et al.Baseline Risk of Major Bleeding in Non-ST-Segment-Elevation Myocardial Infarction.Circulation,2009,119:1843-1845.

        6.劉寶利,楊寶友,鄭桂敏,等.logistic回歸和ROC曲線綜合評價檢測四種尿蛋白排泄對早期腎小球疾病的診斷價值.中國中西醫(yī)結(jié)合腎病雜志,2011,12(8):695-697.

        7.Kheterpal S,Kevin KT,Heung M,et al.Development and Validation of an Acute Kidney Injury Risk Index for Patients Undergoing General Surgery.Anesthesiology,2009,110:505-15.

        8.Kim MY,Jang HR,Wooseong Huh.Incidence,Risk Factors,and Prediction of Acute Kidney Injury After Off-Pump Coronary Artery Bypass Grafting.Renal Failure,2011,33(3):316-322.

        9.Palomba H,de Castro I,Neto ALC,et al.Acute kidney injury prediction following elective cardiac surgery:AKICS Score.Kidney International,2007 (72):624-631.

        10.李康.連續(xù)變量診斷試驗數(shù)據(jù)的ROC分析.中國衛(wèi)生統(tǒng)計,2007,14(1):1-4.

        11.王濟川,郭志剛.Logistic回歸模型——方法與應(yīng)用.北京:高等教育出版社.2001.

        猜你喜歡
        偏態(tài)均數(shù)因變量
        調(diào)整有限因變量混合模型在藥物經(jīng)濟學(xué)健康效用量表映射中的運用
        中國藥房(2022年7期)2022-04-14 00:34:30
        考試成績轉(zhuǎn)換成偏態(tài)分布量化成績的算法
        適應(yīng)性回歸分析(Ⅳ)
        ——與非適應(yīng)性回歸分析的比較
        隧穿量子點分子的Wigner-Yanase偏態(tài)信息
        偏最小二乘回歸方法
        關(guān)于均數(shù)與偏差
        雙模壓縮真空態(tài)光場作用下耦合雙原子的Wigner-Yanase偏態(tài)信息
        關(guān)于均數(shù)與偏差
        關(guān)于均數(shù)與偏差
        關(guān)于均數(shù)與偏差
        大地资源网高清在线播放| 伊人久久婷婷综合五月97色| 激情一区二区三区视频| 男女动态91白浆视频| 激情综合五月| 五月激情在线视频观看| 久久精品国产免费观看三人同眠| 亚洲av无码专区在线播放| 亚洲熟女乱色综合亚洲av| 欧美极品色午夜在线视频| 国内精品久久久久久久久齐齐| 久久久久亚洲AV无码去区首| 亚洲一区二区女优av| 亚洲三级中文字幕乱码| 国产亚州精品女人久久久久久| 精品国产青草久久久久福利| 四川少妇大战4黑人| 在线观看国产内射视频| 91桃色在线播放国产| 国产成人一区二区三区乱| 日韩性爱视频| 欧洲熟妇色xxxx欧美老妇多毛| 国产福利酱国产一区二区| 国产日韩欧美视频成人| 国产免费激情小视频在线观看| 青青草视频在线播放81| 人妻制服丝袜中文字幕| 久久婷婷人人澡人人爽人人爱| 国产又黄又大又粗视频| 亚洲愉拍自拍视频一区| 国产少妇露脸精品自拍网站| 99e99精选视频在线观看| 米奇7777狠狠狠狠视频影院| 欧美人与物videos另类xxxxx| 国内自拍视频在线观看| 阴唇两边有点白是怎么回事| 中国人妻与老外黑人| 色老汉免费网站免费视频| 新久久久高清黄色国产| 一区二区三区中文字幕脱狱者| 熟女少妇内射日韩亚洲|