谷鴻秋
在臨床研究統(tǒng)計(jì)分析思路與統(tǒng)計(jì)圖表系列的首篇文章中[1],我們將臨床研究的統(tǒng)計(jì)分析思路歸納為三部分:描述基線信息;估計(jì)效應(yīng)大??;補(bǔ)充敏感性分析?;€信息作為臨床研究論文結(jié)果中不可或缺的重要內(nèi)容,其統(tǒng)計(jì)分析方法和展現(xiàn)形式也值得臨床研究者重視。本文將結(jié)合研究實(shí)例闡述基線信息分析所涉及的統(tǒng)計(jì)方法和統(tǒng)計(jì)圖表。
“基線”并無(wú)嚴(yán)格的定義,Segen醫(yī)學(xué)詞典給臨床研究語(yǔ)境中基線(baseline)的解釋為:基線是研究人群在前瞻性研究中最開(kāi)始時(shí)的健康狀況,是研究對(duì)象在接受試驗(yàn)組或?qū)φ战M干預(yù)措施前的“0”時(shí)刻。藥物的安全性和有效性可從基線數(shù)據(jù)的變化中評(píng)估,基線數(shù)據(jù)組間分布的差異或?qū)Y(jié)果評(píng)估造成偏倚[2]。通常所謂的“基線”實(shí)則相對(duì)“隨訪”而言,專用于前瞻性研究設(shè)計(jì),不過(guò)其它研究設(shè)計(jì)類型也可用“基線“泛指研究人群的基本情況?;€信息包括兩方面的內(nèi)容:(1)研究人群的入選排除過(guò)程。先用入選標(biāo)準(zhǔn)粗略圈定分析人群,再用排除標(biāo)準(zhǔn)修正分析人群;(2)研究人群基線特征的描述與比較?;€特征常包括社會(huì)人口學(xué)特征、臨床特征、實(shí)驗(yàn)室檢查指標(biāo)及疾病史和用藥史等。
圖1 %ggBaseline 宏程序生成的基線信息表格示例Table I:兩組;Table Ⅱ:三組及以上;Table Ⅲ:帶標(biāo)化組間差值;Table Ⅳ:?jiǎn)谓M
研究人群的入選排除情況,常用的展示形式是研究人群流程圖,即文中的“圖1”。不同研究設(shè)計(jì)類型在具體的入排流程上有所不同,此前文章中已有提及,也展示過(guò)相應(yīng)實(shí)例[1],此處不再贅述。研究人群基線特征的描述與比較常用基線表格展示,即文中的“表1”?!氨?”在具體展示時(shí),依據(jù)研究情形的不同,有不同形式:干預(yù)性研究中,按實(shí)驗(yàn)組和對(duì)照組分組展示,如PLANTO、CHANCE等大型隨機(jī)對(duì)照臨床試驗(yàn)[3,4];觀察性研究中,按不同的暴露因素分組,如CNSR Ⅱ研究中評(píng)估急性腦卒中合并非瓣膜房顫患者出院使用華法令的影響因素時(shí)按是否房顫分組去描述、比較基線信息[5],或按暴露因素的不同水平分組展示,如CKB研究組在研究肥胖和卒中發(fā)生的關(guān)系時(shí),基線表格里按暴露因素BMI的18.0、20.5、23.0、25.0、27.5、30.0六個(gè)切點(diǎn)分成七組[6]。上述兩種思維均為從因到果的邏輯順序,適用于前瞻性的研究設(shè)計(jì)。若為回顧性研究設(shè)計(jì),則按從果到因的逆向邏輯順序,依據(jù)結(jié)局分“病例”和 “對(duì)照”組,如Fox等在探討冠心病與兒童時(shí)期卒中危險(xiǎn)因素關(guān)系時(shí),以是否患冠心病分為病例組和對(duì)照組來(lái)描述和比較基線信息[7]。若不分組,可將所有研究人群作為單組描述,但這種情形較為少見(jiàn),如跟著指南走(GWTG)的臺(tái)灣登記研究[8]。
研究人群的入選排除,只需統(tǒng)計(jì)每個(gè)排除標(biāo)準(zhǔn)的頻數(shù)和百分比即可,但應(yīng)采用層次排除法,以避免因不同的排除標(biāo)準(zhǔn)統(tǒng)計(jì)的人數(shù)有交叉致使合計(jì)排除人數(shù)與實(shí)際排除人數(shù)不一致。所謂層次排除法即分層次去統(tǒng)計(jì)每一個(gè)排除標(biāo)準(zhǔn)所排除的人數(shù)和百分比。如NRMI2研究中研究急性心?;颊叩募本柔t(yī)療服務(wù)與后續(xù)護(hù)理質(zhì)量時(shí),其人群排除過(guò)程即采用了層次排除法[9]。
基線特征的描述與比較,需依據(jù)變量的不同特性(如連續(xù)變量、分類變量,正態(tài)、非正態(tài)),組別數(shù)(兩組、三組及以上)選擇相應(yīng)的描述形式和檢驗(yàn)方法。連續(xù)變量采用“均數(shù)±標(biāo)準(zhǔn)差”或“中位數(shù)(四分位數(shù)間距)”描述,兩組時(shí)采用t檢驗(yàn)或Wilcoxon秩和檢驗(yàn),三組時(shí)采用方差分析或Kruskal-Wallis檢驗(yàn)。分類變量采用“頻數(shù)(百分比)”描述,卡方檢驗(yàn)評(píng)估組間均衡性。傳統(tǒng)的假設(shè)檢驗(yàn)采用P值評(píng)估協(xié)變量的組間均衡性,但大樣本時(shí)容易出現(xiàn)假陽(yáng)性,且采用P值評(píng)估無(wú)法給出量化的差異,因此大樣本的隨機(jī)對(duì)照臨床試驗(yàn)直接看均數(shù)和百分比,并不報(bào)告組間比較的P值。大樣本的觀察性研究則常采用標(biāo)化的組間差值[10]或Hodges-Lehmann估計(jì)數(shù)[11]評(píng)估兩組間均數(shù)或中位數(shù)的差異,具體統(tǒng)計(jì)方法見(jiàn)表1。
標(biāo)化的組間差值和Hodges-Lehmann估計(jì)數(shù)目前國(guó)內(nèi)的研究者使用較少,在此做一簡(jiǎn)要介紹。連續(xù)變量的標(biāo)化組間差值計(jì)算公式如下:
其中,Pe和Pne分別表示暴露組和非暴露組某分類變量某一水平的組內(nèi)百分占比。標(biāo)化差值的絕對(duì)值超過(guò)10相當(dāng)于傳統(tǒng)假設(shè)檢驗(yàn)的P<0.05,可認(rèn)為兩組間協(xié)變量的差異具有統(tǒng)計(jì)學(xué)意義,小于10可認(rèn)為組間均衡。Hodges-Lehmann估計(jì)數(shù)的想法簡(jiǎn)單,即計(jì)算兩組數(shù)據(jù)配對(duì)后差值的中位數(shù)。
其中Yj,Xi分別表示兩組某變量的觀測(cè)值,n1,n2表示兩組的觀測(cè)個(gè)數(shù)。
研究人群入選流程圖的繪制,可先借助統(tǒng)計(jì)軟件,按層次排除法統(tǒng)計(jì)出各排除標(biāo)準(zhǔn)排除的人數(shù)和百分比,再借助傳統(tǒng)的流程圖繪制軟件(如Visio)或辦公軟件(MS Office/Power point),甚至一些小巧的在線工具如ProcessON(https://www.processon.com/)、draw.io(https://www.draw.io/)等繪制流程圖,再導(dǎo)出合適格式的圖片。
基線特征的描述與比較,借助傳統(tǒng)統(tǒng)計(jì)分析軟件(如SPSS、SAS、R、Stata)的默認(rèn)菜單或者模塊基本上均可實(shí)現(xiàn),但在操作難易度、便利性、可重復(fù)性、代碼留痕等方面各有優(yōu)劣。表2簡(jiǎn)要列舉了SAS里常用的常用基線表格統(tǒng)計(jì)分析工具。此外,還可借助一些基于上述軟件的二次開(kāi)發(fā)工具包更方便快捷的獲得基線統(tǒng)計(jì)表。如SAS軟件平臺(tái)里可借助筆者開(kāi)發(fā)的基線表格宏程序%ggBaseline一鍵式自動(dòng)生成適合學(xué)術(shù)期刊的RTF或PDF格式的統(tǒng)計(jì)表格[12]。%ggBaseline生成的統(tǒng)計(jì)表格,涵蓋單組、多組,用P值或者用標(biāo)化的組間差值/Hodges-Lehmann估計(jì)數(shù)評(píng)估組間均衡性等多種形式,具體樣式如圖1所示。其它軟件平臺(tái),如R的qwraps2軟件包里面的summary_table()函數(shù)亦可嘗試[13]。
表1 基線表格的常用統(tǒng)計(jì)描述指標(biāo)及統(tǒng)計(jì)檢驗(yàn)方法
表2 基線表格的常用統(tǒng)計(jì)描述指標(biāo)及統(tǒng)計(jì)檢驗(yàn)方法的SAS實(shí)現(xiàn)
臨床研究基線信息是研究結(jié)果的重要部分,是研究人群社會(huì)人口學(xué)特征的基本刻畫(huà),是同類研究結(jié)果互相比較的基礎(chǔ),同時(shí)也是對(duì)隨機(jī)對(duì)照研究隨機(jī)化過(guò)程的一種評(píng)價(jià)方法,此外,基線信息組間均衡性的比較也為后續(xù)多因素模型校正的效應(yīng)評(píng)估提供參考依據(jù)。