亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基線資料均衡性檢驗存在的問題與探討*

        2011-03-11 14:01:42王永吉蔡宏偉夏結來李嬋娟蔣志偉
        中國衛(wèi)生統(tǒng)計 2011年2期
        關鍵詞:均衡性假設檢驗樣本量

        王永吉 蔡宏偉 夏結來△ 李嬋娟 蔣志偉 陳 冬

        均衡性原則是指除了處理因素不同外,其他對觀察結果有影響的因素應盡量一致〔1〕。組間基線資料的均衡性是為了保證反應變量觀察結果的組間可比性,以便在相似的基線條件下考察處理因素對觀察結果的真實影響。

        目前基線資料均衡性的檢驗方法常用的是假設檢驗。隨機化是假設檢驗應用的前提,只有滿足了隨機化原則的資料才能應用假設檢驗做統(tǒng)計推斷。在非隨機化研究中用假設檢驗來檢驗基線資料的均衡性顯然是不合理的;雖然隨機化分組在大樣本的情況下能較好的保持組間均衡性〔2〕,但在樣本量相對較小的情況下即使采用了隨機化分組也有較大的可能出現(xiàn)組間基線資料不均衡。另外文獻報道了其他的檢驗基線資料均衡性方法,如描述性統(tǒng)計、圖示法(如Q-Q圖、箱式圖)、標準化差異(standardized difference)和方差比(variance ratios)等〔3〕,其中標準化差異在近年的研究中應用較多〔4〕。本文的目的是通過理論闡述與模擬研究探討均衡性檢驗必要性的問題,以及如何選擇恰當?shù)慕y(tǒng)計方法有效地評價組間的不均衡性。

        假設檢驗與標準化差異的適用性

        假設檢驗的目的是通過樣本對總體進行推斷,而基線均衡性比較的目的是比較樣本間的可比性,因此前者的意義在總體層面,后者的意義則在樣本層面上。另外根據(jù)假設檢驗和樣本量的關系可知,即使樣本實際的均衡性沒有變化,隨著樣本量的減少,檢驗效能降低,也會得出較大的P值,即均衡性變好的假相,所以通過假設檢驗得出的基線“均衡”是不可靠的。假設檢驗用于基線均衡性比較本質(zhì)上只能考察隨機化是否正確實施。我們需要一種恰當?shù)姆椒▉碜骶庑詸z驗,標準化差異滿足了Imai等提出的均衡性檢驗方法應該具備的兩個性質(zhì):首先,它應該是針對樣本而不是總體;其次,樣本量不應該影響統(tǒng)計量的值〔5〕。

        標準化差異的定義由Flury和Reidwyl在1986年首次提出〔6〕。對于連續(xù)性變量,其定義是:

        其中,pT和pC分別表示處理組和對照組中待檢驗變量的陽性率。一般地,當標準化差異小于0.1時,認為組間該變量的均衡性較好〔4〕。

        M o n t e C a r l o模擬

        1.模擬方法及步驟

        采用Monte Carlo模擬比較假設檢驗和標準化差異在檢驗基線資料均衡性中的應用。本研究所有數(shù)據(jù)均由模擬產(chǎn)生,數(shù)據(jù)模擬及統(tǒng)計分析程序采用SAS 9.1統(tǒng)計軟件。模擬主要分為模型建立和統(tǒng)計分析兩部分,其中模型建立主要是建立處理因素與協(xié)變量的關系。具體模擬過程如下:

        (1)假定樣本量為500,設定種子數(shù),根據(jù)Bernoulli分布產(chǎn)生兩個獨立的隨機二分類變量x1和x2,模擬保證兩個變量各自陽性數(shù)與陰性數(shù)比例都約為1:1,利用 SAS函數(shù) rand(’bernoulli’,P)生成,P 均設為0.5。

        (2)模擬以處理因素T為應變量,x1和x2為協(xié)變量建立如下模型:

        其中,T為二分類處理因素,利用SAS函數(shù)rand(’bernoulli’,P)求得,T=rand(’bernoulli’,PT);a0為常數(shù)項,調(diào)整a0可以控制處理因素T陽性結果發(fā)生率,即處理組與對照組間樣本比例,為了方便模擬,將處理組和對照組樣本量比例控制在1:1;ai(i=1,2)為回歸系數(shù),其中 ORi=exp(ai),設 OR1=1,OR2=1.5,數(shù)據(jù)集模擬完成。

        (3)采用c2檢驗和標準化差異法分別對步驟(2)中產(chǎn)生的數(shù)據(jù)集進行均衡性評價。

        (4)保持 OR1和 OR2值不變,重復(1)~(3)1000次,記錄1000次中變量x1組間不均衡的次數(shù),計算檢出率。

        (5)保持OR1和OR2值不變,逐漸增大OR1,并同時調(diào)整a0保證處理組與對照組間樣本比例不變,重復(1)~(4)11次,每重復一次OR1值增加0.1,OR1值的變化范圍在1~2之間,結果見圖1。

        (6)固定OR1=1.5,OR2=1.5,逐漸增大樣本量,分別對樣本量50和100~1000之間進行模擬。當樣本量變化范圍在100~1000之間時,每重復一次樣本量增加100,即假定基線資料總體不均衡情況下,評價采用c2檢驗的P值(α取0.05)和標準化差異比較均衡性檢驗結果的差異,結果見圖2。

        (7)固定OR1=1,OR2=1.5,逐漸增大樣本量,分別對樣本量50和500~4000之間進行模擬。當樣本量變化范圍在500~4000之間時,每重復一次樣本量增加500,評價采用c2檢驗和標準化差異法比較均衡性檢驗結果的差異,結果見圖3。

        2.模擬結果

        假設檢驗和標準化差異法的檢出率隨OR1值變化的曲線如圖1所示;OR1≠1和OR1=1時,假設檢驗和標準化差異法的檢出率隨樣本量變化的曲線如圖2,圖3所示。

        圖1 變量x1檢出率隨OR1變化曲線(n=500)

        由圖1可知,OR1值較小時,標準化差異法的檢出率高于假設檢驗,隨著OR1值的增大,標準化差異法和假設檢驗的檢出率趨于一致。進一步模擬研究證明,如果改變樣本量,結果不變。結果提示,標準化差異檢驗變量不均衡的能力要高于假設檢驗。

        由圖2可知,在OR1≠1的情況下,假設檢驗的檢出率隨樣本量增大而降低,標準化差異的檢出率高于假設檢驗,并且一直處于相對平穩(wěn)的狀態(tài)。結果提示,標準化差異不受樣本量的影響,而假設檢驗受樣本量的影響,即使在小樣本情況下,標準化差異也可以檢驗出變量的不均衡性。

        圖2 變量x1檢出率隨樣本量變化曲線(OR1≠1)

        圖3 變量x1檢出率隨樣本量變化曲線(OR1=1)

        在OR1=1的情況下,假設檢驗由于Ⅰ型錯誤的控制,檢出率一直處于5%左右。小樣本時,標準化差異的檢出率高于假設檢驗,標準化差異的檢出率隨樣本量增大而降低,當樣本量達到4000時,標準化差異的檢出率趨于0。

        討 論

        非隨機化研究中,通常會存在基線資料不均衡的情況,導致估計處理效應時產(chǎn)生偏倚,均衡性檢驗是必不可少的。隨機化研究中,由圖3的模擬結果可知,當樣本量達到1500時,出現(xiàn)不均衡的可能性就很小了(小于0.05),因此,大樣本情況下,不需要作均衡性檢驗;而在樣本量相對較小的情況下,即使經(jīng)過隨機化分組,也很難保證基線資料的均衡性,需要作均衡性檢驗保證組間的可比性,提高試驗的可靠性。標準化差異正是在小樣本情況下也可以檢驗出基線資料不均衡性的方法。標準化差異同時適用于連續(xù)型變量和分類變量的均衡性比較,且不受度量衡的影響。標準化差異的優(yōu)點還在于可以量化指標差異的大小,也可以結合示意圖直觀地表示〔7〕。

        本研究的局限性在于只模擬研究了兩分組,基線資料為分類變量的情況?;€資料是多分類變量時,建議根據(jù)各分類樣本量大小加權后,再計算標準化差異。對于多分組資料,建議進行組間兩兩比較,選擇標準化差異最大的兩組作為均衡性評價的標準。而對于基線資料為非正態(tài)連續(xù)型變量的情況有待進一步研究。

        1.孫振球,徐勇勇,等.醫(yī)學統(tǒng)計學.第2版.北京:人民衛(wèi)生出版社,2006:618-619.

        2.Senn S.Testing for baseline balance in clinical trials.Statistics in Medicine,1994,13:1715-1726.

        3.Ho DE,Imai K,King G,et al.Matching as nonparametric preprocessing in parametric causal inference.Political Analysis,2007,15:199-236.

        4.Austin PC.A critical appraisal of propensity-score matching in the medical literature between 1996 and 2003.Statistics in Medicine,2008,27:2037-2049.

        5.Imai K,King G,Stuart EA.Misunderstandings among experimentalists and observationalists:balance test fallacies in causal inference.Journal of the Royal Statistical Society,2008,171:481-502.

        6.Flury BK,Reidwyl H.Standard distance in univariate and multivariate analysis.The American Statistician,1986,40:249-251.

        7.王永吉,蔡宏偉,夏結來,等.傾向指數(shù)(第三講)——應用中的關鍵問題.中華流行病學雜志,2010,31(7):823-8244.

        猜你喜歡
        均衡性假設檢驗樣本量
        醫(yī)學研究中樣本量的選擇
        京津冀全域旅游供需系統(tǒng)構建及均衡性研究
        航空裝備測試性試驗樣本量確定方法
        測控技術(2018年4期)2018-11-25 09:46:52
        Sample Size Calculations for Comparing Groups with Binary Outcomes
        統(tǒng)計推斷的研究
        時代金融(2017年6期)2017-03-25 12:02:43
        雙冪變換下正態(tài)線性回歸模型參數(shù)的假設檢驗
        Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
        統(tǒng)計學教學中關于假設檢驗問題探討
        均衡性原則司法適用解讀及適用路徑的精致化構造——以四個案例為出發(fā)點
        行政法論叢(2016年0期)2016-07-21 14:52:23
        著力破解基層民主“非均衡性”的困境
        學習月刊(2016年14期)2016-07-11 01:54:38
        四虎成人精品无码永久在线| 亚洲国产天堂久久综合网| 黄片视频免费观看蜜桃| 亚州性无码不卡免费视频| 色噜噜狠狠一区二区三区果冻| 无码人妻系列不卡免费视频| 丰满人妻av无码一区二区三区| 国产精品-区区久久久狼| 丰满少妇人妻无码超清| 人妻少妇中文字幕久久hd高清| 久久久精品国产亚洲av网深田| 尤物yw午夜国产精品视频| 久久久久久久97| 8888四色奇米在线观看| 精品国产日韩无 影视| 男女啪啪动态视频在线观看| 无码人妻久久久一区二区三区| 日射精情感性色视频| 熟女俱乐部五十路二区av| 人妻少妇喷水意淫诱惑| 蜜桃传媒免费在线观看| 在线播放五十路熟妇| 999久久久无码国产精品| 亚洲国产一区二区三区在线视频| 日本一区二区精品色超碰| 日本亚洲视频免费在线看 | 综合图区亚洲另类偷窥| 国产一级片内射在线视频| av网站国产主播在线| 色综合久久无码五十路人妻| 正在播放国产多p交换视频 | 内射白浆一区二区在线观看| 国产二级一片内射视频插放| 日韩内射美女人妻一区二区三区| 国产成人久久精品亚洲小说| 亚洲精品综合久久中文字幕| 在线免费观看一区二区| 性大毛片视频| 日韩久久久黄色一级av| 中文字幕乱码在线婷婷| 国产亚洲精品久久久久5区|