亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        傾向得分區(qū)間匹配法用于非隨機對照試驗的探索與研究*

        2012-12-04 02:59:26李嬋娟夏結(jié)來王永吉蔣志偉
        中國衛(wèi)生統(tǒng)計 2012年1期
        關(guān)鍵詞:卡鉗區(qū)間組間

        張 亮 李嬋娟△ 夏結(jié)來△ 王永吉 王 陵 蔣志偉

        在臨床試驗、流行病學病因研究以及大部分觀察性試驗研究和設(shè)計中,傾向得分方法已經(jīng)被廣泛的應(yīng)用到這些非隨機對照試驗中來降低由于混雜因素導(dǎo)致的選擇性偏倚,從而保證組間基線數(shù)據(jù)的均衡可比〔1-3〕。傾向得分是在給定可觀察的基線協(xié)變量條件下,研究對象分配到處理組或者對照組的條件概率,如果處理分配是強可忽略(strongly ignorable)的,那么根據(jù)傾向得分可獲得平均處理效應(yīng)的非偏估計〔4〕。傾向得分方法包括:匹配(matching)、分層(stratification)、回歸校正(regression adjustment)、加權(quán)(weighting)等。其中匹配法在觀察性數(shù)據(jù)研究中應(yīng)用最為廣泛。本文通過Monte Carlo模擬產(chǎn)生數(shù)據(jù)集,利用傾向得分的95%置信區(qū)間進行匹配,并與logistic回歸分析和傾向得分卡鉗匹配比較,探索研究傾向得分區(qū)間匹配法在均衡組間協(xié)變量降低選擇性偏倚從而正確估計處理效應(yīng)的能力。

        傾向得分介紹

        1.定義

        早在1976年,Miettinen就提出用多元混雜因子把多個協(xié)變量綜合成為一個單一變量〔5〕。1983年,Rosenbaum和Rubin提出了在隊列研究中,基線期估計傾向得分(propensity scores,PS)控制選擇性偏倚〔4〕。在流行病學研究中,估計藥物處理效應(yīng)和試驗處理的結(jié)果時用這種方法控制因混雜因素導(dǎo)致的選擇性偏倚越來越流行。根據(jù)研究對象的所有觀察特征,通常采用一個多變量logistic回歸模型來估計傾向得分。傾向得分的范圍在0到1之間,它表示研究個體分配到處理組或?qū)φ战M的概率。具有相同傾向得分的研究對象有著相同的機會接受處理,任何具有相同傾向得分的兩個研究對象,對于具體的協(xié)變量可能值不相同,但是對于進入模型的全部協(xié)變量將在組間趨于均衡〔6〕。假定在所有協(xié)變量都被觀察到的情況下,采用PS法,就好像進行了隨機分配一樣,所以有的研究者稱之為“事后隨機化”。

        傾向得分的定義:在觀察到的協(xié)變量(xi)條件下,研究對象i(i=1,…,N)被分配到特定處理組(Zi=1)而非對照組(Zi=0)的條件概率,可以表達為:

        假定在給定的一組特征變量Xi下,分組變量是獨立的,則:

        傾向得分是組間均衡性的一個函數(shù),反應(yīng)觀察到的所有協(xié)變量體現(xiàn)個體特征的作用,從而可以有效控制混雜因素使得組間各個協(xié)變量均衡一致。

        2.估計方法

        傾向得分估計的方法有很多種,目的是把影響處理因素的眾多協(xié)變量用一個單值的傾向得分來表示,然后再進行分析。傾向得分的估計方法有:①廣義線性模型(包括logistic回歸模型、Probit模型、廣義加法模型等);②判別分析;③Cox風險模型;④分類樹技術(shù);⑤神經(jīng)網(wǎng)絡(luò)技術(shù);⑥貝葉斯估計等。其中l(wèi)ogistic回歸模型是最常用也是最簡便易行的方法。

        logistic回歸屬于概率型非線性回歸,其模型的參數(shù)具有鮮明的實際意義,現(xiàn)已成為處理二分類反應(yīng)數(shù)據(jù)的常用方法〔7〕。

        3.PS匹配法

        傾向得分匹配是在所有進入對照組的個體中選擇與進入處理組個體傾向得分相同或相近的個體與之配對,從而達到均衡組間協(xié)變量的目的。在所有協(xié)變量都可以被觀察到的情況下,通過傾向得分匹配可以得到處理效應(yīng)的無偏估計〔8〕。

        卡鉗匹配(caliper matching)的定義是處理組與對照組個體傾向得分差值在事先設(shè)定的某個范圍內(nèi)才能進行匹配??ㄣQ的設(shè)定是非常重要的,Austin多次通過Monte Carlo模擬比較了研究者實際應(yīng)用中經(jīng)常選用的卡鉗值,研究結(jié)果證明最合適的卡鉗值是傾向得分經(jīng)logit變換后標準差的20%或者將其絕對值設(shè)為0.02、0.03〔9〕。

        區(qū)間匹配(interval matching)利用的是每個個體的傾向得分95%置信區(qū)間進行匹配,方法是從處理組第一個個體開始,在對照組中找到置信區(qū)間與之重合最多并且重合需大于處理組個體置信區(qū)間的特定百分比,滿足這個條件的個體作為匹配對象,然后對照組中匹配了的個體不參與處理組其他個體的匹配即進行無放回匹配(圖1)。

        圖1 傾向得分匹配法與傾向得分區(qū)間匹配法

        4.PS評價指標

        本文用檢驗效能、I類錯誤、標準化差異以及匹配比例四個指標來評價比較傾向得分區(qū)間匹配法和logistic回歸分析以及傾向得分卡鉗匹配,其中標準化差異能夠很好地反映組間協(xié)變量的均衡情況。

        標準化差異在近年的傾向得分研究中應(yīng)用較多〔10〕,其概念由Flury和Reidwyl在1986年首次提出〔11〕。

        對于二分類變量,標準化差異定義為:

        其中,pT和pC分別表示處理組和非處理組中待檢驗變量的陽性率。

        對于連續(xù)性變量,標準化差異定義為:

        計算機模擬

        采用Monte Carlo模擬比較傾向得分區(qū)間匹配法、傾向得分卡鉗匹配法和logistic回歸分析三種方法,數(shù)據(jù)模擬和統(tǒng)計分析通過軟件SAS 9.1實現(xiàn)。本研究經(jīng)過兩次建模,多次模擬來評價傾向得分區(qū)間匹配法均衡組間協(xié)變量的能力。

        1.模擬方法

        根據(jù)協(xié)變量與處理因素和結(jié)局變量的關(guān)系,協(xié)變量可分為:①只和處理因素有關(guān);②只和結(jié)局變量有關(guān);③與處理因素和結(jié)局變量都有關(guān);④與處理因素和結(jié)局變量都無關(guān)。根據(jù)這四類變量和相關(guān)程度強弱,本文模擬的協(xié)變量包括表1所列9個協(xié)變量。

        表1 模擬協(xié)變量的分類

        Monte Carlo模擬的目標就是檢驗傾向得分區(qū)間匹配法在處理組間均衡這9個協(xié)變量的能力〔13〕。根據(jù)Bernoulli分布產(chǎn)生9個獨立的隨機二分類協(xié)變量,利用 SAS 9.1的函數(shù) rand('bernoulli',P),P=0.5產(chǎn)生數(shù)據(jù)集。然后對每個研究對象采用Bernoulli分布根據(jù)下列回歸模型生成一個分組變量Ti:

        其中,β0,treat為常數(shù)項,調(diào)節(jié) β0,treat可以控制處理組與對照組間樣本比例,β1~β6為回歸系數(shù),exp(βi)為與處理因素有關(guān)的各協(xié)變量OR值。

        再對每一個研究對象,在分組變量Ti的條件下,根據(jù)下列回歸模型及Bernoulli分布產(chǎn)生一個結(jié)果變量Yi:

        其中,α0,outcome為常數(shù)項,調(diào)節(jié) α0,outcome可以控制對照組陽性結(jié)果的發(fā)生率,βtreat、α1~α6為回歸系數(shù),exp(βtreat)為處理因素的OR值,exp(αi)為與結(jié)果有關(guān)的各協(xié)變量OR值。

        2.模擬設(shè)置

        (1)弱相關(guān)模型:

        對于上面兩個logistic回歸中協(xié)變量的回歸系數(shù),設(shè)定弱相關(guān)模型參數(shù)為:中等相關(guān)的回歸系數(shù)為log(1.25),強相關(guān)的回歸系數(shù)為 log(1.5)。設(shè)定 β0,treat=-1.366,這樣就能保證大約40%的研究對象進入到處理組。設(shè)定α0,outcome=-2.688,保證對照組陽性結(jié)果的發(fā)生率約為15%。βtreat的設(shè)定:log(1.1)、log(1.5)、log(2)、log(2.5)和 log(3)。通過改變 β0,treat、α0,outcome和βtreat這三個參數(shù),可以調(diào)整處理組與對照組的比例,對照組陽性結(jié)果的發(fā)生率,和處理因素與結(jié)果效應(yīng)的關(guān)系。模擬產(chǎn)生1000個樣本量為500的數(shù)據(jù)集進行傾向得分區(qū)間匹配研究分析并與卡鉗值為傾向得分經(jīng)logit變換后標準差的20%的卡鉗匹配以及傳統(tǒng)的logistic回歸分析進行比較〔14〕。

        (2)強相關(guān)模型:

        調(diào)整模型參數(shù),對于上面兩個logistic回歸中協(xié)變量的回歸系數(shù),設(shè)定強相關(guān)模型參數(shù)為:中等相關(guān)的回歸系數(shù)為log(1.5),強相關(guān)的回歸系數(shù)為log(1.75)。設(shè)定β0,treat=-1.889,這樣就能保證大約40%的研究對象進入到處理組。設(shè)定α0,outcome=-3.687,保證對照組陽性結(jié)果的發(fā)生率約為10%。模擬產(chǎn)生1000個樣本量為500的數(shù)據(jù)集進行傾向得分區(qū)間匹配研究分析并與卡鉗值為傾向得分經(jīng)logit變換后標準差的20%的卡鉗匹配以及傳統(tǒng)的logistic回歸分析進行比較。

        3.模擬結(jié)果

        (1)最優(yōu)卡鉗區(qū)間的選擇

        我們分別設(shè)定卡鉗區(qū)間為處理組個體傾向得分置信區(qū)間長度的90%、85%、80%、70%進行模擬匹配,通過檢驗效能、I類錯誤、標準化差異、匹配比例四個指標來評價,然后得出最優(yōu)卡鉗區(qū)間值。

        表2 兩種模型下不同卡鉗區(qū)間匹配評價

        通過模擬不同卡鉗區(qū)間進行匹配,我們可以從表1中看出,當卡鉗區(qū)間選擇處理組置信區(qū)間的80%時,檢驗效能、I類錯誤、標準化差異和匹配比例都是令人滿意的。根據(jù)卡鉗區(qū)間為80%,進一步模擬比較區(qū)間匹配法、logistic回歸法和卡鉗匹配法的檢驗效能、I類錯誤、標準化差異和匹配比例。

        (2)檢驗效能

        區(qū)間匹配、logistic回歸及卡鉗匹配三種方法在強弱相關(guān)兩種模型下的檢驗效能比較結(jié)果見表3。

        當處理因素OR值不斷增大時,三種方法在兩種模型下的檢驗效能都是逐漸增大的。不管是強相關(guān)模型還是弱相關(guān)模型,logistic回歸法的檢驗效能均高于區(qū)間匹配法,區(qū)間匹配法均高于卡鉗匹配。進一步模擬表明,改變處理組與對照組的比例,改變對照組陽性結(jié)果發(fā)生率,其結(jié)論不變。

        (3)I類錯誤

        區(qū)間匹配、logistic回歸及卡鉗匹配三種方法在強弱相關(guān)兩種模型下的Ⅰ類錯誤比較結(jié)果見表4。

        表3 三種方法兩種模型在不同處理因素OR值下的檢驗效能(%)

        在弱相關(guān)模型和強相關(guān)模型中,logistic回歸法的I類錯誤最低,但三種方法都能控制I類錯誤在0.05以內(nèi)。在強相關(guān)模型中,區(qū)間匹配法的I類錯誤和卡鉗匹配基本一致,logistic回歸法的I類錯誤高于其他兩種方法,三種方法都能將I類錯誤控制在0.05左右。進一步模擬表明,改變處理組與對照組的比例,改變對照組陽性結(jié)果發(fā)生率,其結(jié)論不變。

        (4)標準化差異

        PS區(qū)間匹配法和PS卡鉗匹配法在強弱相關(guān)兩種模型下的標準化差異比較結(jié)果見表5。

        表4 三種方法兩種模型的I類錯誤

        表5 不同方法兩種模型的標準化差異(%)

        在弱相關(guān)模型下,區(qū)間匹配法和卡鉗匹配法都能很好的均衡各個協(xié)變量,其與結(jié)果有關(guān)的協(xié)變量的標準化差異均小于10%,而在強相關(guān)模型下,區(qū)間匹配法能夠?qū)⑷康?個協(xié)變量的標準化差異全部降低到10%以內(nèi),均衡了所有的協(xié)變量。

        (5)匹配比例

        PS區(qū)間匹配和PS卡鉗匹配兩種方法兩種模型的匹配比例比較結(jié)果見表6。

        表6 不同方法兩種模型的匹配比例(%)

        在弱相關(guān)模型下,區(qū)間匹配的匹配比例高于卡鉗匹配,也是其檢驗效能高于卡鉗匹配的一個原因;在強相關(guān)模型下,兩者的匹配比例要低于弱相關(guān)下的匹配比例,區(qū)間匹配在強相關(guān)模型下處理組個體的置信區(qū)間變窄,導(dǎo)致匹配精度的提高;強相關(guān)模型下,區(qū)間匹配的匹配比例略低于卡鉗匹配,但是其檢驗效能在不同處理因素OR值下是高于卡鉗匹配的。

        討 論

        通過上面的模擬研究發(fā)現(xiàn):(1)采用傾向得分區(qū)間匹配法能夠很好的均衡組間協(xié)變量。(2)從檢驗效能、I類錯誤、標準化差異和匹配比例四個評價指標等綜合考慮認為卡鉗區(qū)間設(shè)為處理組置信區(qū)間的80%是合適的。(3)通過模擬比較,區(qū)間匹配法在四個評價指標中與logistic回歸法和傾向得分卡鉗匹配無明顯差異,區(qū)間匹配法在處理因素不同OR值的情況下的檢驗效能稍好于卡鉗匹配,其I類錯誤也小于卡鉗匹配。用標準化差異判斷兩種方法均衡協(xié)變量的能力時,區(qū)間匹配法和卡鉗匹配都能均衡組間協(xié)變量。(4)兩種模型下,區(qū)間匹配法、logistic回歸法和卡鉗匹配都有良好的檢驗效能和控制I類錯誤的能力。不管是弱相關(guān)模型還是強相關(guān)模型,logistic回歸法稍好于區(qū)間匹配法,區(qū)間匹配法稍好于卡鉗匹配法。區(qū)間匹配法在強相關(guān)模型下均衡組間協(xié)變量的能力比弱相關(guān)模型更強。傾向得分區(qū)間匹配法在觀察性研究中均衡組間協(xié)變量的能力得到了印證,也反映出傾向得分區(qū)間匹配法的可行性和實用性。

        在流行病學病因研究、大量的觀察性研究中,運用傾向得分區(qū)間匹配法能夠有效地均衡組間協(xié)變量的分布,在組間協(xié)變量均衡的基礎(chǔ)上進一步評價處理因素的效應(yīng),從而得到接近隨機對照研究的結(jié)果〔15〕。由于傾向得分是協(xié)變量的一個函數(shù),無論有多少個協(xié)變量,都可以綜合成為一個傾向得分來表示,實際上起到了降維的作用,而且傾向得分區(qū)間匹配法操作簡便,容易理解,能夠很好地對結(jié)果進行解釋。logistic回歸法用于分析結(jié)局變量與協(xié)變量之間的關(guān)聯(lián)關(guān)系,而傾向得分方法推斷的是因果關(guān)系,在因果關(guān)系論證強度上大于logistic回歸法。傾向得分方法同樣適用于混雜因素很多,結(jié)局變量發(fā)生率很低的情況,而logistic回歸法并不適合〔16〕。另外,某些非隨機化臨床試驗,如醫(yī)療器械的臨床評價,Ⅳ期臨床試驗等,可以通過傾向得分方法進行分析〔17〕。

        傾向得分方法在實際應(yīng)用中,研究者一定要對數(shù)據(jù)資料和方法有足夠的了解,因為傾向得分方法永遠只是局限于可觀察到的協(xié)變量,而一些未知的混雜因子仍然可能對結(jié)果產(chǎn)生影響。因此科學運用傾向得分方法可以有效地控制混雜因素,得到結(jié)果的無偏估計。

        本研究的局限性在于:(1)只模擬了二分類協(xié)變量的情況,沒有對多分類和連續(xù)型協(xié)變量進行模擬;(2)模型只選擇了弱相關(guān)模型和強相關(guān)模型兩種進行研究分析;(3)只選擇了四類評價指標進行綜合評價;(4)對于最優(yōu)卡鉗區(qū)間的選擇上只局限于簡單的模擬。對于本研究的不足,我們將在以后進一步分析研究。

        1.Austin PC.A critical appraisal of propensity-score matching in the medical literature between 1996 and 2003.Statistics in Medicine,2008,27:2037-2049.

        2.Austin PC.Type I Error Rates,Coverage of Confidence Intervals,and Variance Estimation in Propensity-Score Matched Analyses.The international Journal of Biostatistics,2009,5:1-21.

        3.Newgard CD,Hedges JR,Mullins RJ.Advanced Statistics:The Propensity Score—A Method for Estimating Treatment Effect in Observational Research.Academic Emergency Medicine,2004,11:953-961.

        4.Rosenbaum PR,Rubin DB.The central role of the propensity score in observational studies for causal effects.Biometrika,1983,70:41-55.

        5.Miettinen OS.Stratification by a multivariate confounder score.Am J Epidemiol,1976,20:104-609.

        6.Til Stürmer,Manisha Joshi,Glynn RJ,et al.A review of the application of propensity score methods yielded increasing use,advantages in specific settings,but not substantially different estimates compared with conventional multivariable methods.Journal of Clinical Epidemiology,2006,59:437-447.

        7.孫振球,徐勇勇主編.醫(yī)學統(tǒng)計學.第2版.北京:人民衛(wèi)生出版社,2008,333-336.

        8.Austin PC,Mamdani1 MM.A comparison of propensity score methods:A case-study estimating the effectiveness of post-AMI statin use.Statistics in Medicine,2006,25:2084-2106.

        9.Austin PC.Some methods of propensity-score matching had superior performance to others:results of an empirical investigation and Monte Carlo simulations.Biometrical Journal,2009,51:171-184.

        10.Perkins SM,Tu W,Underhill MG,et al.The use of propensity scores in pharmacoepidemiologic research.Pharmacoepidemilology and Drug Safety,2000,9:93-101.

        11.Flury BK,Reidwyl H.Standard distance in univariate and multivariate analysis.The American Statistician,1986,40:249-251.

        12.Normand SLT,Landrum MB,Guadagnoli E,et al.Validating recommendations for coronary angiography following an acute myocardial infarction in the elderly:a matched analysis using propensity scores.Journal of Clinical Epidemiology,2001,54:387-398.

        13.Austin PC.Comparing paired vs non-paired statistical methods of analyses when making inferences about absolute risk reductions in propensity-score matched samples.Statistics in Medicine,2011,30:1292-301.

        14.Dehejia RH,Wahba S.Propensity score-matching methods for nonexperimental causal studies.Review of Economics and Statistics,2002,84:151-161.

        15.詹思延主編.流行病學進展.第12卷.北京:人民衛(wèi)生出版社,2010,358-375.

        16.王永吉,夏結(jié)來,蔡宏偉,等.傾向指數(shù)匹配法與logistic回歸分析方法對比研究.現(xiàn)代預(yù)防醫(yī)學,2011,38(12):2017-2018.

        17.王永吉,蔡宏偉,夏結(jié)來,等.傾向指數(shù)(第一講):傾向指數(shù)的基本概念和研究步驟.中華流行病學雜志,2009,31(3):347-348.

        猜你喜歡
        卡鉗區(qū)間組間
        解兩類含參數(shù)的復(fù)合不等式有解與恒成立問題
        你學會“區(qū)間測速”了嗎
        數(shù)據(jù)組間平均數(shù)、方差關(guān)系的探究
        基于ANSYS的制動卡鉗仿真分析
        更 正
        Geological characteristics, metallogenic regularities and the exploration of graphite deposits in China
        China Geology(2018年3期)2018-01-13 03:07:16
        制動卡鉗缸體CNC加工中心專用夾具定位方案分析
        布雷博發(fā)布全新高端制動卡鉗家族
        汽車之友(2016年10期)2016-05-16 22:00:12
        球盤式IPB卡鉗駐車效率的計算方法
        區(qū)間對象族的可鎮(zhèn)定性分析
        亚洲乱码av中文一区二区| 国产婷婷成人久久av免费| 欧洲美熟女乱av亚洲一区| 久久人妻内射无码一区三区| 99视频全部免费精品全部四虎| 日本变态网址中国字幕| 亚洲激情一区二区三区不卡| 人妻仑乱a级毛片免费看| 亚洲国产理论片在线播放| 日韩中文字幕无码av| 亚洲av在线观看播放| 日韩av激情在线观看| 中国亚洲女人69内射少妇| 91极品尤物在线观看播放| 九七青青草视频在线观看| 欧美丰满熟妇bbb久久久 | 中文字幕亚洲精品码专区| 亚洲一区亚洲二区视频在线| 免费va国产高清大片在线| 91精品福利观看| 色婷婷综合一区二区精品久久| 免费av网站大全亚洲一区| 国产精品欧美福利久久| 麻豆国产巨作AV剧情老师| 国产视频免费一区二区| 免费大片黄国产在线观看| 国产精品无套内射迪丽热巴| 亚洲熟妇av日韩熟妇av| 日韩精品一二三区乱码| 天天爽夜夜爱| 免费成人福利视频| 伊人久久综合狼伊人久久| 色噜噜亚洲男人的天堂| 日本大片在线看黄a∨免费| 亚洲国产精品综合福利专区| 日本一区二区三区区视频| 欧洲vat一区二区三区| 国产AV无码一区精品天堂| 国产精品国产三级农村妇女| 无套中出丰满人妻无码| 激情内射亚洲一区二区三区爱妻 |