南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計學(xué)系(510515) 譚旭輝 陳平雁
重復(fù)測量設(shè)計的單獨(dú)效應(yīng)分析
南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計學(xué)系(510515) 譚旭輝 陳平雁△
目的探討重復(fù)測量設(shè)計資料單獨(dú)效應(yīng)的分析方法。方法 分析單獨(dú)效應(yīng)的兩種方法分別為基于一般的配對t檢驗(yàn)和基于局部調(diào)整標(biāo)準(zhǔn)誤的配對t檢驗(yàn)方法,后者使用SPSS軟件中一般線性模型下EMMEANS子句實(shí)現(xiàn)。用模擬方法分別比較兩種方法的整體I型錯誤率。結(jié)果 使用兩種不同標(biāo)準(zhǔn)誤,統(tǒng)計分析結(jié)果存在較大差異。模擬結(jié)果顯示,使用EMMEANS子句的整體I型錯誤率較一般的配對t檢驗(yàn)方法有明顯的降低。結(jié)論 基于局部調(diào)整標(biāo)準(zhǔn)誤的EMMEANS子句分析單獨(dú)效應(yīng)更為合理。
重復(fù)測量 交互作用 單獨(dú)效應(yīng) 一般線性模型
△通訊作者:陳平雁
重復(fù)測量數(shù)據(jù)(repeated measures data)是指每個實(shí)驗(yàn)單位至少接受3次及3次以上的不同處理,或接受相同處理后,至少在3個及3個以上不同時間點(diǎn)進(jìn)行測量,并獲得相應(yīng)次數(shù)的記錄數(shù)據(jù)〔1〕。重復(fù)測量設(shè)計中,將因素分為組間因素和組內(nèi)因素,并進(jìn)行組間效應(yīng)、組內(nèi)效應(yīng)以及兩者之間交互效應(yīng)的分析。通常情況下,如果重復(fù)測量設(shè)計的各因素之間有交互作用時,除分析主效應(yīng)外,還應(yīng)當(dāng)進(jìn)一步的分析各因素的單獨(dú)效應(yīng)。分析單獨(dú)效應(yīng)的方法有兩種,一種是對重復(fù)測量因素進(jìn)行一般的配對t檢驗(yàn),目前較為常用;另一種是基于局部調(diào)整標(biāo)準(zhǔn)誤的配對t檢驗(yàn)。兩種方法究竟哪一種更為合理,本文將對其進(jìn)行比較,以期為將來的應(yīng)用提供依據(jù)。
重復(fù)測量方差分析模型如下:
式中,xijk表示第i組中的第j個體在第k個重復(fù)觀測點(diǎn)所得觀察值;μ表示總體均數(shù);ai表示組間因素A在i水平對應(yīng)變量的附加效應(yīng);δj(i)是第i水平的第j個體的效應(yīng);βk表示組內(nèi)因素B在第k個時間點(diǎn)對應(yīng)變量的附加效應(yīng),(αβ)ik為 A和 B兩者的交互效應(yīng),εijk為個體內(nèi)隨機(jī)誤差項。
重復(fù)測量資料方差變異的分解見表1。
SPSS的一般線性模型(GLM)過程使用最小二乘法對參數(shù)進(jìn)行估計。使用GLM過程對重復(fù)測量資料進(jìn)行分析,首先是對組內(nèi)因素原始變量進(jìn)行M矩陣轉(zhuǎn)換,而對組間因素的轉(zhuǎn)換,則產(chǎn)生變量Average,我們通常對組間因素所做的主效應(yīng)分析就是依賴于該變量。例如,如果組間變量為Y1,Y2,Y3,其 M 矩陣為(/3/3/3)T,即每個元素均為變量個數(shù)平方根的倒數(shù),則Average變量為:(Y1Y2Y3)(/3在GLM的默認(rèn)選項下,也會對原始重復(fù)測量變量產(chǎn)生一組經(jīng)正交多項式變換的變量,其個數(shù)為原始重復(fù)次數(shù)減去1,例如在原始重復(fù)測量變量個數(shù)為3的前提下,其產(chǎn)生Linear和Quadratic兩個變量。
表1 重復(fù)測量資料的方差變異分解
在SPSS的syntax中,GLM過程中的EMMEANS Subcommand命令可用于比較各因素的單獨(dú)效應(yīng)〔2〕,其語法結(jié)構(gòu)如下:
第一句為固定B因素在各個水平下,使用LSD方法比較 A因素的單獨(dú)效應(yīng),也可以通過使用 ADJ(Bonferroni)方法來使用Bonferroni校正;第二句含義為固定A因素在各個水平下,使用LSD方法比較B因素的單獨(dú)效應(yīng)。在這里需要指出的是,在SPSS的syntax中,MANOVA過程的MW ITHIN Subcommand也可以用于分析單獨(dú)效應(yīng)〔3〕。其語法結(jié)構(gòu)如下:
第一句為固定A因素(假定A有2個水平)在各個水平下,比較B因素的單獨(dú)效應(yīng);第二句為固定B因素(假定B有3水平)在各個水平下,比較A因素的單獨(dú)效應(yīng)。
為比較人乳腺癌細(xì)胞(MCF-7)及其經(jīng)基因修飾后的細(xì)胞(T MCF-7)的活性,用MTT法進(jìn)行測定,觀測指標(biāo)為細(xì)胞中線粒體內(nèi)琥珀酸脫氫酶的活性,用光密度值(即OD值)來反映,OD值越大,說明細(xì)胞增殖活性越強(qiáng),其數(shù)據(jù)如表 2〔4〕。
表2 兩種細(xì)胞OD值的測定
此例為1個重復(fù)因素X(OD值)和1個獨(dú)立因素A(細(xì)胞類別)的兩因素設(shè)計,每個標(biāo)本在五個不同的時間下進(jìn)行測定。因此,我們進(jìn)行Repeated Measures ANOVA,通過SPSS的重復(fù)測量分析我們可以看到,其 Mauchly’s Test結(jié)果為W=0.001,P=0.067。方差分析結(jié)果見表3。
表3 Tests of Within-Subjects Effects方差分析結(jié)果
由表3見組間因素與組內(nèi)因素有交互作用,故需進(jìn)一步分析各因素的單獨(dú)效應(yīng)。在SPSS的GLM過程中,我們通過設(shè)定EMMEANS語句來進(jìn)行單獨(dú)效應(yīng)的比較,其編程語句如下:
將固定X在time1水平下,A因素的單獨(dú)效應(yīng)分析結(jié)果如表4;將A固定在1水平下,X的單獨(dú)效應(yīng)分析結(jié)果首先給出總的多元方差結(jié)果(表5),并在此基礎(chǔ)上進(jìn)行兩兩比較(表6),余類推。
在SPSS中,MANOVA過程也可以進(jìn)行重復(fù)測量單獨(dú)效應(yīng)分析,其結(jié)果與GLM過程相同。在MANOVA過程中指定單獨(dú)效應(yīng)的語句如下:
分析結(jié)果見表4~表6。
表4 在time1水平下A因素單獨(dú)效應(yīng)的方差分析結(jié)果
表5 多元方差分析結(jié)果
表6 在A為1水平下,X因素單獨(dú)效應(yīng)部分水平的兩兩比較
順便指出,在SPSS當(dāng)中,如果我們固定A因素為某一水平,比較X因素各水平之間的兩兩差別,即在RM ANOVA的OPTION選項里面選擇X的LSD或者Bonferroni校正,其結(jié)果本質(zhì)上等價于在A的各個水平下,對X的某兩個水平做一般的配對t檢驗(yàn)(一類錯誤為0.05),而Bonferroni校正也是在配對t檢驗(yàn)的基礎(chǔ)上進(jìn)行校正。而使用GLM過程的EMMEANS Subcommand,其使用的標(biāo)準(zhǔn)誤是基于X某兩個水平全部數(shù)據(jù)差值的Estimated Marginal Mean的標(biāo)準(zhǔn)誤。而對于固定X因素的水平,比較A因素之間的兩兩差別,相當(dāng)于固定X因素在某一個水平,對A因素各水平進(jìn)行 One-way ANOVA 分析〔5〕。
為了解該語句對于控制總的第一類錯誤的效果,我們用SAS 9.1進(jìn)行了初步模擬,設(shè)組間因素A為3水平,組內(nèi)因素X為5個水平的重復(fù),總體均數(shù)以及總體方差的設(shè)置見表7,A因素每個水平的樣本量均為3,模擬次數(shù)為100次,產(chǎn)生的數(shù)據(jù)均滿足球?qū)ΨQ假定〔6〕。模擬結(jié)果顯示,組內(nèi)因素A固定在各水平下,在重復(fù)因素X所有水平之間的兩兩比較(共30次)中,使用 EMMEANS語句整體一類錯誤率比使用SPSS默認(rèn)的LSD方法有較為明顯的降低。
表7 兩種方法的整體一類錯誤(FWER)的比較
當(dāng)重復(fù)測量設(shè)計因素間存在交互作用時,很有必要進(jìn)行單獨(dú)效應(yīng)分析。在使用SPSS的GLM過程分析單獨(dú)效應(yīng)的一般應(yīng)用中,若在OPTION選項里面所進(jìn)行的重復(fù)因素單獨(dú)效應(yīng)的比較實(shí)際上就是配對t檢驗(yàn),通過上述模擬結(jié)果可見,其FWER要明顯高于GLM過程的EMMEANS Subcommand處理方法,因此,對于滿足球?qū)ΨQ假定的數(shù)據(jù),使用 EMMEANS Subcommand進(jìn)行單獨(dú)效應(yīng)比較更為合理。
本文僅對重復(fù)測量設(shè)計資料分析單獨(dú)效應(yīng)的SPSS編程進(jìn)行了簡單介紹,并初步做了模擬驗(yàn)證,至于對不滿足球?qū)ΨQ假定的數(shù)據(jù)以及具有一定相關(guān)性的多元正態(tài)數(shù)據(jù)模擬研究,還有待后續(xù)的深入研究。
1.陳平雁.SPSS13.0統(tǒng)計軟件應(yīng)用教程.北京:人民衛(wèi)生出版社,2005:160.
2.SPSS Inc.SPSS 13.0 Command syntax Reference.USA:SPSS Inc,2004:717-718.
3.Field AP.Discovering Statistics Using SPSS.London:SAGE Publication,2005:462.
4.胡良平.現(xiàn)代統(tǒng)計學(xué)與SAS應(yīng)用.北京:軍事醫(yī)學(xué)科學(xué)出版社,2002:130.
5.Keselman HJ.Testing treatment effects in repeated measures designs:An update for psychophysiological researchers.Psychophysiology,1998,35:474-475.
6.Hugo Quené,Huub van den Bergh.Onmulti-level modeling of data from repeated measures designs:a tutorial.Speech Communication,2004,43:105.行的。球坐標(biāo)變換對成分?jǐn)?shù)據(jù)的利用有其獨(dú)特的意義