張珍, 趙強
(山東師范大學數(shù)學與統(tǒng)計學院, 山東 濟南 250014)
基于貝葉斯方法的Meta-分析
張珍, 趙強*
(山東師范大學數(shù)學與統(tǒng)計學院, 山東 濟南 250014)
稀疏數(shù)據(jù); 貝葉斯模型; Jeffreys分布; 鏈接函數(shù); Meta-分析
1976年,英國心理學家Glass[1-2]提出Meta-分析,這是以綜合已有發(fā)現(xiàn)為目的, 對單個研究結(jié)果的集合的統(tǒng)計學研究方法。Meta-分析又稱作薈萃分析、整合分析、匯總分析, 是對具有相同研究題目的多個研究進行綜合分析的一系列過程, 其中包括提出研究問題、制定納入和排除標準、檢索相關研究、匯總基本信息、綜合分析并報告結(jié)果等[3]。
到目前為止, 針對稀疏數(shù)據(jù)的合并, 大致分為兩個方向: 一種是對稀疏數(shù)據(jù)進行填補, 即對試驗中存在0案例的試驗進行連續(xù)性修正; 另外一種是無需進行連續(xù)性修正, 運用貝葉斯模型直接對各個試驗結(jié)果進行分析。
貝葉斯統(tǒng)計學的基礎是貝葉斯公式和貝葉斯定理,貝葉斯公式是基于條件概率的定義和全概率公式推導而來[4], 因此貝葉斯公式的實踐形式如下: 設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為樣本空間S的一個劃分, 且p(A)>0,p(Bi)>0,i=1,2,…,n,則由條件概率的定義及全概率公式可得:
貝葉斯公式密度函數(shù)形式如下: 設x=(x1,x2,…,xn)是來自某總體的樣本, 該總體的概率密度函數(shù)為p(x|θ),當給定一組觀察值x=(x1,x2,…,xn)時,θ的條件概率分布為
即在樣本x=(x1,x2,…,xn)下θ的后驗分布。其中,π(θ)是參數(shù)θ的先驗分布。
為樣本x=(x1,x2,…,xn)的聯(lián)合條件密度函數(shù), 也即似然函數(shù)。
為x的邊緣密度函數(shù), 是一個與θ無關的量。
而在0~1之間的不可觀察的變量x的貝葉斯模型如下:
其中,為了完善Meta-分析中貝葉斯模型的計算公式, 我們需要一個鏈接函數(shù)π(θi|θ), 注意這個條件分布必須兼容早先給的π(θi)和π(θ),也就意味著二維分布π(θi,θ)=π(θi|θ)π(θ)必須滿足積分公式[5]
通常π(θi,θ)可能依賴于不確切的超參數(shù)t。 這里考慮內(nèi)在先驗分布類
{πIJ(θi,θ|t),t≥1},
經(jīng)驗證
可用作模型的鏈接函數(shù), 上式是一個單變量Beta密度的混合。因此, 可以用統(tǒng)計軟件實現(xiàn)。例如R、Mathematic。 經(jīng)過計算, 可以得出在給定t下,θi和θ之間的相關系數(shù)如下:
這是一個關于t的遞減函數(shù)[6]。
考慮一個有不同中心的k個相互獨立的隨機臨床試驗結(jié)果, 用(xi,ni),i=1,2,3,…,k表示可觀察到的多中心數(shù)據(jù)集。θi表示數(shù)據(jù)中心的概率效應, 即xi~B(θi,ni)。 接下來的計算公式運用θi的似然函數(shù)和鏈接分布可得
在給定t下, 參數(shù)θ的似然函數(shù)可有下式表達出來:
其中,P(x)表示變量x的似然函數(shù)。假設(xi,ni)對i=1,2,…,k相互獨立, 在給定θ的條件下,θi在θ下條件獨立。然后對整個數(shù)據(jù)集有參數(shù)θ的似然函數(shù)如下:
令n=(n1,n2,…,nk),x=(x1,x2,…,xk),而在給定t下,θ的后驗概率可由下式給出:
其中關于參數(shù)θ, 應用數(shù)據(jù)(x,n)包含所有的信息, 符號“∝”表示“正比于”, 注意正?;?shù)不能從其封閉形式中得到。這里需要一個簡單的一維數(shù)值分析。關于變量X的預測分布, 在給定數(shù)據(jù)(x,n)和超參數(shù)t下, 可得
其中,X=0,1t≥1。
當X=1時, 上式得
注意, 處理組的試驗成功時恰好有P(X=1|x,n,t); 并且觀察到只有在0-1隨機變量的情況下, 預測分布的變量和參數(shù)的后驗期望一致。然而, 當隨機變量超過兩個值時, 這個情況將不會成立。
滿足條件; 這里,t是一個超參數(shù). 運用θi的似然函數(shù)和鏈接分布可得:
類似2.1的計算過程, 關于變量X的預測分布, 在給定數(shù)據(jù)(x,n)和超參數(shù)t下, 可由下式得出:
其中,X=0,1,t≥1。當X=1時, 上式得
事實上, 處理組的試驗成功時恰好有P(X=1|x,n,t), 而上面得到是關于θ的一組向量。
[1]GLASS G V. Primary,secondaryand Meta-analysis of research[J]. Educ Res, 1976, 5(10):3-8.
[2]YATES F. Contingency tables involving small numbers and the chi-squared test[J]. Supplement to the Journal of the Royal Statistical Society,1934,1(2):217-235.
[3]王丹,翟俊霞,牟振云,等. Meta-分析中的異質(zhì)性及其處理方法[J].中國循證醫(yī)學雜志,2009.9(10):1115-1118.
[4]COCHRAN W G. Problems arising in the analysis of a series of similar experiments[J]. Supplement to the Journal of the Royal Statistical Society,1937,4(1)102-118.
[5]MANTEL N,HAENSZEL W. Statistical aspects of the analysis of data from retrospective studies of disease[J].Journal of the National Cancer Institute,1959,22(4):719-748.
[6]MORENO E,VAZQUEZ-POLO E J,NEGRIN M A. Objective Bayesian meta-analysis of sparse discrete data[J].Stat Med,2014,33(21)3676-92.
[7]VAZQUEZ-POLO F J,MORENO E, Negrín M A, et al. A bayesian sensitivity study of risk difference in the meta-analysis of binary outcomes from aparse data[J]. Expert Rev Pharmacoecom Outcomes Res,2015,15(2):317-322.
Meta-analysisbasedonBayesianmethod
ZHANGZhen,ZHAOQiang*
(InstituteofMathematicsandStatistics,ShandongNormalUniversity,Jinan250014,China)
∶sparse data;Bayesian model;jeffreys distribution;link function;Meta-analysis
10.3976/j.issn.1002-4026.2017.06.019
2017-03-31
國家自然科學基金(11001155)
張珍(1991—), 女, 碩士研究生, 研究方向為應用統(tǒng)計。
*通信作者,趙強,男,副教授。E-mail:zhaoqstst@126.com
O211
A
1002-4026(2017)06-0115-04