胡良平,郭辰儀(軍事醫(yī)學科學院科技部生物醫(yī)學統(tǒng)計學咨詢中心,北京100850)
在藥學試驗中,研究者們經(jīng)常遇到觀測的定量指標會隨著時間的推移發(fā)生變化,必須在不同時間點上對同一個受試對象的相應指標進行多次重復觀測的情況。更常見的是需要考察與分析在某一特定條件下,每位受試對象隨時間、部位或時間與部位的組合的改變時,某一定量指標取值的變化規(guī)律。此時,所對應的設計被稱為重復測量設計,其復雜程度取決于獨立試驗分組因素的個數(shù)和與重復測量有關的因素個數(shù)。下面看一個例子。
例1 研究奈哌地爾對高血壓的療效,選擇符合1999年WHO診斷標準的輕、中度高血壓病人96例。入選前收集臨床病史資料,選取符合標準者,并進行隨機分組,采用自身對照,觀察用藥前后血壓變化規(guī)律。所有入選病人停用所有降壓藥物,口服安慰劑2周后開始治療。按藥品說明書推薦初始劑量給藥,25mg/次,bid;兩周后,劑量增加為50mg/次,bid,觀察一個月。本文重點在于描述統(tǒng)計分析方法,因此選用該試驗的其中一項指標收縮壓作為例子,見表1[1]。
上面的例子就是典型的具有一個重復測量的單因素設計定量資料,如果僅僅用治療后2周或4周的收縮壓與治療前相比,沒有考慮到其動態(tài)變化,是比較片面的。而通過資料整體對時間因素做分析,能看出隨著治療時間的推移,病情是否得到有效的緩解,比治療后各時間點分別與治療前相比更有說服力。
表1 奈哌地爾對原發(fā)性高血壓病人收縮壓的影響aTable 1 Effects of naftopidil on systolic blood pressure of patients with primary hypertension
1.1 重復測量設計的定義和特點 重復測量設計是在不同條件下,從同一受試對象重復獲得某定量指標觀測值的一種試驗設計類型。這里所說的不同條件通常是指時間因素取不同水平,也可以指受試者身上的幾個對稱部位或具有可比性的不同部位,有時也指時間因素和對稱部位的各種水平組合。如果不同條件僅與一個因素有關,就叫做具有一個重復測量的M因素設計;如果不同條件與兩個因素的水平組合有關,就叫做具有兩個重復測量的M因素設計。這里的M指試驗中涉及到的全部試驗因素的個數(shù),包括與重復測量有關的試驗因素。與重復測量無關的因素被稱為試驗分組因素,即受試對象被完全隨機地分配到這些因素的水平組合所形成的各小組中去。在某項研究中,若需要了解隨時間推移或部位改變時定量觀測指標的動態(tài)變化情況,就需要運用此設計[2]。本文只研究涉及單因素的重復測量,對于更復雜的涉及其他分組因素的情況,將在后續(xù)的文章中詳細介紹。
1.2 重復測量設計定量資料統(tǒng)計分析方法的合理選用 (1)觀測指標在同一受試對象上重復獲得,這是重復測量設計的基本特點;(2)重復測量設計對于數(shù)據(jù)有正態(tài)性的要求,不滿足此要求的定量資料,一種方法是對數(shù)據(jù)進行一定的變換,如取對數(shù)或開平方根,使其滿足正態(tài)性;另一種方法是采用混合效應方差分析模型處理,該方法事先假定重復測量資料具有某種協(xié)方差結(jié)構(gòu)模型,并用此模型擬合給定的定量資料,考察擬合的效果[3]。在SAS系統(tǒng)的MIXED過程中,設置了30多個不同的協(xié)方差結(jié)構(gòu)模型,其中最常用的有5種,在下文的SAS程序中,“type=”后分別用5個關鍵詞來表示不同的協(xié)方差結(jié)構(gòu)模型。
下面應用SAS軟件分析具有一個重復測量的單因素設計定量資料。例2 沿用例1中的資料,試問受試對象在接受治療后,隨時間推移,病情改善有沒有統(tǒng)計學意義?
對問題的分析與SAS實現(xiàn) 此資料對病人沒有分組,僅涉及一個三水平的試驗因素——時間,在這三個水平下都對同樣的病人做了相應的重復測量,因此該資料為具有一個重復測量的單因素設計定量資料。應用SAS進行分析,程序如下。
程序說明:第1步建立數(shù)據(jù)集,“input”語句表明從cards后的數(shù)據(jù)中讀取每行相應的數(shù)據(jù)賦值給變量。兩個do循環(huán)給每個數(shù)據(jù)標明了病人編號和對應的測量時間點(注:這里的時間并不要求必須是具體的時刻)。第2~6步調(diào)用mixed過程,分別采用ar(1)、vc、cs、sp、un 5種協(xié)方差結(jié)構(gòu)模型對原數(shù)據(jù)進行建模?!皉epeated”聲明是進行重復測量的分析,“type=”后面接對應的協(xié)方差結(jié)構(gòu)模型的類型。ODS html語句用來將統(tǒng)計分析結(jié)果輸出成網(wǎng)頁格式。
上述5種協(xié)方差結(jié)構(gòu)模型主要的區(qū)別在于模型的隨機效應項在不同重復測量水平上的相關性。例如,vc模型考慮不同時間點上同一個病人的隨機效應項沒有關聯(lián)。ar(1)模型,即自回歸模型,隨機效應的相關度隨時間間隔增大而下降。cs模型假設不同時間點的隨機效應項相關度一樣。sp模型根據(jù)不同時間點上各觀測的歐氏距離確定相關度。un模型最復雜,將不同時間點上的隨機效應的相關度都設為獨立的參量,適用范圍最廣,因此有時mixed過程在迭代計算時會不收斂。
研究者在處理數(shù)據(jù)時,可以結(jié)合實際情況只選取一種或幾種協(xié)方差結(jié)構(gòu)模型。本文將5種常用的協(xié)方差結(jié)構(gòu)模型都列出來了。
如果不能確定具體應該采用哪種協(xié)方差結(jié)構(gòu)模型,可以參看擬合度。在SAS的mixed過程輸出結(jié)果中,有-2Res Log Likelihood、AIC、AICC和BIC 4個指標用來評價擬合度。以上指標的數(shù)值越小,表明與該模型的擬合度越好。
對于上面程序的輸出結(jié)果,擬合度最好的是un協(xié)方差結(jié)構(gòu)模型,本文只在此解釋該模型的主要輸出結(jié)果,其他模型結(jié)果類似,此處省略。
模型信息(model information)數(shù)據(jù)集 work reptest應變量 y協(xié)方差結(jié)構(gòu) unstructured受試對象 patient估計方法 REML殘差法 none固定效應標準誤計算方法 model-based自由度估計方法between-within
從上表可以看出,采用協(xié)方差結(jié)構(gòu)模型“unstructured”即“un”,進行迭代計算,見下表。
迭代記錄
經(jīng)過一次迭代計算,已經(jīng)達到收斂標準。注意這里一定要看清楚最后迭代是否收斂。收斂的情況下會顯示“convergence criteria met”,若不收斂則結(jié)果顯示為“warning:did not converge”。表1中的數(shù)據(jù),SAS軟件給出了4種評價指標,結(jié)果分別為:-2Res Log Likelihood=1 853.4,AIC= 1 865.4,AICC=1 865.7,BIC=1 880.8,根據(jù)-2Res Log Likelihood的結(jié)果,橫向比較這5種模型,最終結(jié)果un模型此項指標取值最小,為1 853.4,因此un模型最優(yōu)。
零模型似然比檢驗
這里的零模型即是指vc模型。由于P<0.05,假設檢驗的結(jié)果表明在這里un模型要遠好于協(xié)方差結(jié)構(gòu)為對角陣的vc模型(假設檢驗的原假設是協(xié)方差結(jié)構(gòu)為對角陣,正好是vc模型)。實際在對比擬合度時,也可以直觀地看出un模型要優(yōu)于vc模型(vc模型的-2Res Log Likelihood為2 184.0)。
3型固定效應檢驗
由此可以得到下面的統(tǒng)計結(jié)論:F=1 814.90,P<0.000 1,故按α=0.05的水準,時間效應項對數(shù)據(jù)整體影響具有統(tǒng)計學意義。進一步,可以分別用治療后的數(shù)據(jù)與治療前數(shù)據(jù)相比較,程序如下。
a:使用mixed過程可以進行多種方法的兩兩比較,這里只用到Dunnett’s t檢驗,因此使用“Dunnett”選項。
得到的結(jié)果見表2。由表2可以看到,治療后2周和治療后4周的收縮壓與治療前相比,其差異都具有統(tǒng)計學意義。專業(yè)結(jié)論:治療前、治療后2周和治療后4周的收縮壓分別為(164±12)、(148± 11.25)和(130±9.7)mmHg,隨治療時間的推移,收縮壓降低得越多,治療效果越好。因此可以認為隨著時間的推移,病情得到了明顯的改善。
表2 最小方差離差Table 2 The minimum variance deviation
[1] 胡寶榮,哈 力,劉 璐.奈哌地爾治療高血壓病人的臨床療效[J].藥學服務與研究,2005,5(2):165-166.
Hu BaoRong,Ha Li,Liu Lu.Clinical efficacy of naftopidil in treatment of patients with hypertensive disease[J].Pharm Care Res,2005,5(2):165-166.Chinese with abstract in English.
[2] 郭 晉,趙元科,胡良平,等.如何用SAS軟件正確分析生物醫(yī)學科研資料(Ⅳ.用SAS軟件實現(xiàn)單因素多水平設計一元定量資料的統(tǒng)計分析)[J].中國醫(yī)藥生物技術,2009,4(4):315-319.
Guo Jin,Zhao YuanKe,Hu LiangPing,et al.How to analyze biomedical data with SAS software properly(Ⅳ.Statistical analysis of one unknown quantitative data in single-factor multiple levels design with SAS software)[J].Chin Med Biotechnol,2009,4(4):315-319.Chinese.
[3] 胡良平.醫(yī)學統(tǒng)計學:運用三型理論分析定量與定性資料[M].北京:人民軍醫(yī)出版社,2009:49.
Hu LiangPing.Medical statistics-analysis of quantitative and qualitative data with triple-type theory[M].Beijing:People’s Military Medical Press,2009:49.Chinese.