胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專(zhuān)業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
析因設(shè)計(jì)是一種全因素試驗(yàn)設(shè)計(jì)方法,也就是要在全部試驗(yàn)因素的各種水平組合條件下進(jìn)行2次及以上獨(dú)立重復(fù)試驗(yàn)。通過(guò)此設(shè)計(jì)收集到的定量資料,可以全面反映所有試驗(yàn)因素及其各階交互作用項(xiàng)對(duì)定量觀測(cè)結(jié)果影響的詳細(xì)信息。本文將介紹析因設(shè)計(jì)的特點(diǎn)、具體實(shí)施方法、定量資料一元方差分析的計(jì)算公式和SAS實(shí)現(xiàn)方法。
析因設(shè)計(jì)是安排因素之間存在復(fù)雜交互作用的多因素試驗(yàn)的重要方法[1-2]。具體做法如下:羅列出試驗(yàn)因素的全部水平組合,在每種組合(稱(chēng)為試驗(yàn)點(diǎn))條件下,進(jìn)行2次及以上獨(dú)立重復(fù)試驗(yàn)。
析因設(shè)計(jì)具有以下7個(gè)特點(diǎn)[2]:①試驗(yàn)因素的個(gè)數(shù)≥2;②每個(gè)試驗(yàn)因素的水平數(shù)≥2,且各因素的水平數(shù)可以不等;③不同的試驗(yàn)條件數(shù)(或組合數(shù)或試驗(yàn)點(diǎn)數(shù))等于全部試驗(yàn)因素的水平數(shù)之乘積;④各試驗(yàn)條件下至少進(jìn)行2次獨(dú)立重復(fù)試驗(yàn);⑤全部受試對(duì)象被完全隨機(jī)地分配進(jìn)入任何一個(gè)試驗(yàn)條件組中,各小組中的受試對(duì)象個(gè)數(shù)相等為最佳,但也可以不等;⑥試驗(yàn)時(shí),每次試驗(yàn)都涉及任一試驗(yàn)因素的某個(gè)水平,即全部試驗(yàn)因素同時(shí)施加;⑦進(jìn)行統(tǒng)計(jì)分析時(shí),假定全部試驗(yàn)因素對(duì)觀測(cè)結(jié)果的影響是平等的,即沒(méi)有主次之分。由此可知,析因設(shè)計(jì)的明顯優(yōu)點(diǎn)是可以分析每個(gè)試驗(yàn)因素的主效應(yīng)以及試驗(yàn)因素之間各階交互作用的效應(yīng)大??;缺點(diǎn)在于總試驗(yàn)次數(shù)太多,費(fèi)時(shí)費(fèi)力且增加試驗(yàn)費(fèi)用。
析因設(shè)計(jì)是考察因素之間各階交互作用效應(yīng)的主要方法。高階交互作用效應(yīng)的解釋是非常困難的,現(xiàn)以最常見(jiàn)的一階交互作用(即兩因素之間的交互作用)為例,解釋其含義[3]。
假設(shè)在某項(xiàng)藥物試驗(yàn)研究中,需要將A藥與B藥聯(lián)合使用,若在固定的劑量下,兩藥聯(lián)合使用比單用任何一種藥物的療效更好,則稱(chēng)這兩種藥物具有協(xié)同作用;反之,則稱(chēng)這兩種藥物具有拮抗作用。協(xié)同作用和拮抗作用都不是交互作用。A藥與B藥之間具有交互作用是指當(dāng)A藥分別取不同劑量時(shí),其療效的差別并非一成不變,而是會(huì)隨著與之聯(lián)用的B藥劑量的改變而改變。例如,當(dāng)B藥取低劑量時(shí),A藥取高劑量的療效優(yōu)于A藥低劑量的療效;而當(dāng)B藥取高劑量時(shí),A藥取低劑量的療效優(yōu)于A藥高劑量的療效。在統(tǒng)計(jì)學(xué)上,A藥的劑量與B藥的劑量之間存在交互作用效應(yīng)。至于交互作用效應(yīng)是否有統(tǒng)計(jì)學(xué)意義,則需要通過(guò)假設(shè)檢驗(yàn)來(lái)做出統(tǒng)計(jì)推斷,還需要通過(guò)大樣本臨床試驗(yàn)進(jìn)一步驗(yàn)證。
析因設(shè)計(jì)將二維平面劃分成多行與多列的網(wǎng)狀結(jié)構(gòu),其網(wǎng)格數(shù)就是全部試驗(yàn)因素的水平組合數(shù)。在此網(wǎng)狀結(jié)構(gòu)中,行數(shù)可代表一個(gè)試驗(yàn)因素的全部水平數(shù)或若干個(gè)試驗(yàn)因素的水平組合數(shù),列數(shù)可代表一個(gè)試驗(yàn)因素的全部水平數(shù)或若干個(gè)試驗(yàn)因素的水平組合數(shù)。因篇幅所限,析因設(shè)計(jì)的具體架構(gòu)見(jiàn)后文各表格,此處從略。
由于析因設(shè)計(jì)常用于安排有2~4個(gè)試驗(yàn)因素(因?yàn)橐蛩剡^(guò)多時(shí),各水平組合條件下仍需要做重復(fù)試驗(yàn),故總試驗(yàn)次數(shù)很多,實(shí)際科研工作者一般難以承受)的試驗(yàn)研究場(chǎng)合,因此,其方差分析計(jì)算公式至少有三種。然而,隨著因素個(gè)數(shù)的增加,因素之間的各階交互作用項(xiàng)數(shù)也相應(yīng)增加:當(dāng)有A和B兩個(gè)因素時(shí),只有一個(gè)交互作用項(xiàng)(AB);當(dāng)有A、B、C三個(gè)因素時(shí),有4個(gè)交互作用項(xiàng)(AB、AC、BC、ABC);當(dāng)有A、B、C、D四個(gè)因素時(shí),就有11個(gè)交互作用項(xiàng)(AB、AC、AD、BC、BD、CD、ABC、ABD、ACD、BCD、ABCD)。因篇幅所限,本文僅呈現(xiàn)兩因素析因設(shè)計(jì)定量資料一元方差分析的計(jì)算公式,其他情況下的計(jì)算公式從略。
現(xiàn)以?xún)梢蛩匚鲆蛟O(shè)計(jì)定量資料為例,介紹其總離均差平方和(簡(jiǎn)稱(chēng)“總變異”)的分解方法[1,4]。設(shè)試驗(yàn)因素A有a個(gè)水平,試驗(yàn)因素B有b個(gè)水平,在因素A和因素B各水平組合條件下進(jìn)行r次獨(dú)立重復(fù)試驗(yàn),則受試對(duì)象總數(shù)(即總樣本含量)N=abr,其方差分析表見(jiàn)表1。
表1 兩因素析因設(shè)計(jì)定量資料方差分析表Table 1 Analysis of variance for the quantitative data with two-factor factorial design
表1中各統(tǒng)計(jì)量計(jì)算公式如下:
在以上各式中,i=1,2,…,a;j=1,2,…,b;k=1,2,…,r。
【例1】為了給一種裝置設(shè)計(jì)出一種壽命長(zhǎng)的電池,研究者根據(jù)經(jīng)驗(yàn)確定了兩個(gè)重要試驗(yàn)因素,一個(gè)是制造電池材料的種類(lèi)(因素M),另一個(gè)是研究者設(shè)定的試驗(yàn)溫度(因素T)。因素M取3個(gè)水平,1~3分別代表三種不同的材料;因素T取3個(gè)水平,1~3分別代表15℉、70℉和125℉。為了較好地估計(jì)試驗(yàn)誤差,研究者擬在每種水平組合下進(jìn)行4次獨(dú)立重復(fù)試驗(yàn)。試驗(yàn)安排與試驗(yàn)結(jié)果見(jiàn)表2[1]。試分析各因素及其交互作用項(xiàng)對(duì)電池壽命的影響是否有統(tǒng)計(jì)學(xué)意義。
表2 材料種類(lèi)(M)與試驗(yàn)溫度(T)對(duì)電池壽命影響的試驗(yàn)結(jié)果Table 2 Experimental results of the influence of material type(M)and the experimental temperature(T)on battery life
【例2】某試驗(yàn)同時(shí)涉及A、B、C三個(gè)地位平等的試驗(yàn)因素,A有2個(gè)水平,B有3個(gè)水平,C有4個(gè)水平,觀測(cè)指標(biāo)為OD值,受試對(duì)象為樣品,在不同試驗(yàn)條件下均獨(dú)立地重復(fù)做了2個(gè)樣品,資料見(jiàn)表3[2]。試分析兩因素及其交互作用項(xiàng)對(duì)OD值的影響是否有統(tǒng)計(jì)學(xué)意義。
表3 3個(gè)試驗(yàn)因素作用下OD值的測(cè)量結(jié)果Table 3 Measurement results of OD value under the action of three experimental factors
3.2.1 對(duì)例1的分析與解答
【分析與解答】所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
由兩因素析因設(shè)計(jì)定量資料一元方差分析總模型的檢驗(yàn)結(jié)果可知,總模型具有統(tǒng)計(jì)學(xué)意義(F=11.00,P<0.000 1)。
由兩因素及其交互作用項(xiàng)的輸出結(jié)果可知,材料種類(lèi)(M)(F=7.91,P=0.002 0)、試驗(yàn)溫度(T)(F=28.97,P<0.000 1)及其交互作用項(xiàng)(M*T)(F=3.56,P=0.018 6)對(duì)電池壽命的影響均有統(tǒng)計(jì)學(xué)意義。
材料種類(lèi)(M)與試驗(yàn)溫度(T)之間的交互作用效應(yīng)見(jiàn)圖1。橫軸為材料種類(lèi)(M),分別取1、2、3水平;縱軸為試驗(yàn)結(jié)果電池壽命(Y,單位:h)。圖中從上到下的三條折線對(duì)應(yīng)的試驗(yàn)溫度(T)分別為1、2、3水平。顯然,T=1(即溫度為15℉,低溫)時(shí),用三種材料制造的電池壽命普遍長(zhǎng);隨著溫度逐漸增加,用三種材料制造的電池壽命逐漸縮短。然而,圖中的3條折線的變化趨勢(shì)是不同的(顯然,它們不是互相平行的),當(dāng)M=1時(shí),T=2與T=3兩條折線相交;當(dāng)M=3時(shí),T=1與T=2兩條折線相交。
圖1 材料種類(lèi)(M)與試驗(yàn)溫度(T)交互作用效應(yīng)圖Figure 1 Graph reflecting the interaction effect between the material type(M)and the experimental temperature(T)
以上輸出的是因素M(材料種類(lèi))與因素T(試驗(yàn)溫度)在各種水平組合條件下,試驗(yàn)結(jié)果Y的平均值,并將這9種水平組合編號(hào)為1~9。編號(hào)1~3的均值代表M=1(即在第一種材料的前提條件下)的三種溫度所對(duì)應(yīng)的試驗(yàn)結(jié)果Y的平均值;編號(hào)4~6的均值代表M=2(即在第二種材料的前提條件下)的三種溫度所對(duì)應(yīng)的試驗(yàn)結(jié)果Y的平均值;編號(hào)7~9的均值代表M=3(即在第三種材料的前提條件下)的三種溫度所對(duì)應(yīng)的試驗(yàn)結(jié)果Y的平均值。同理,可理解編號(hào)(1、4、7)、(2、5、8)和(3、6、9)的均值含義,即在同種試驗(yàn)溫度條件下,用三種材料制造的電池的平均壽命的均值。
采用TUKEY法對(duì)因素M與因素T的9種水平組合下的9個(gè)平均值進(jìn)行兩兩比較。因篇幅所限,此部分結(jié)果從略。現(xiàn)將它們之間的比較結(jié)果解釋如下。
在如此多的兩兩比較的結(jié)果中,研究者最關(guān)心的是將兩個(gè)因素中的一個(gè)控制在特定水平上,考察另一個(gè)因素各水平組平均值差異是否有統(tǒng)計(jì)學(xué)意義。例如:在溫度為第3個(gè)水平(即125℉)條件下,三種材料所對(duì)應(yīng)的電池壽命的平均值差異是否有統(tǒng)計(jì)學(xué)意義?可查看編號(hào)為3、6、9的3個(gè)均值(57.500、49.500、85.500)之間對(duì)應(yīng)的P值:編號(hào)3與編號(hào)6之間的P值為1.000 0,編號(hào)3與編號(hào)9之間的P值為0.834 7,編號(hào)6與編號(hào)9之間的P值為0.581 9。三個(gè)P值均大于0.05,說(shuō)明當(dāng)溫度高(T=125℉)時(shí),用三種材料制造的電池的平均壽命差異無(wú)統(tǒng)計(jì)學(xué)意義。
編號(hào)為1、4、7對(duì)應(yīng)的3個(gè)P值分別為0.961 6、0.999 9、0.999 1,說(shuō)明當(dāng)溫度低(T=15℉)時(shí),用三種材料制造的電池的平均壽命差異無(wú)統(tǒng)計(jì)學(xué)意義;而編號(hào)為2、5、8對(duì)應(yīng)的3個(gè)P值分別為0.046 0、0.001 4、0.882 3,說(shuō)明當(dāng)溫度居中(T=70℉)時(shí),第一種材料與第二種材料、第一種材料與第三種材料制造的電池平均壽命(57.250 vs.119.750,57.250 vs.145.750)差異有統(tǒng)計(jì)學(xué)意義,而第二種材料與第三種材料制造的電池平均壽命(119.750 vs.145.750)差異無(wú)統(tǒng)計(jì)學(xué)意義。
相對(duì)來(lái)說(shuō),溫度較低時(shí),用第二種材料制造的電池平均壽命較長(zhǎng)(均值為155.750);溫度居中時(shí),用第三種材料制造的電池平均壽命較長(zhǎng)(均值為145.750);溫度較高時(shí),用第三種材料制造的電池平均壽命較長(zhǎng)(均值為85.500)。
3.2.2 對(duì)例2的分析與解答
【分析與解答】所需要的SAS程序如下:
【SAS程序說(shuō)明】“a|b|c”代表一種簡(jiǎn)化表達(dá)方式,其詳細(xì)寫(xiě)法為[5]:a b c a*b a*c b*c a*b*c。
【SAS輸出結(jié)果及解釋】
由總模型的方差分析結(jié)果可知,總模型無(wú)統(tǒng)計(jì)學(xué)意義(F=1.50,P=0.163 4),說(shuō)明此總模型需要精簡(jiǎn)。
由3個(gè)主效應(yīng)、3個(gè)一級(jí)交互作用項(xiàng)效應(yīng)和1個(gè)二級(jí)交互作用項(xiàng)效應(yīng)的輸出結(jié)果可知,僅交互作用項(xiàng)“b*c”(F=2.67,P=0.039 7)具有統(tǒng)計(jì)學(xué)意義。
若從模型語(yǔ)句中刪除P值大于0.4的前4項(xiàng)后,再運(yùn)行SAS程序,由輸出結(jié)果可知,三項(xiàng)均無(wú)統(tǒng)計(jì)學(xué)意義。
由此可知,在對(duì)多因素析因設(shè)計(jì)定量資料進(jìn)行方差分析過(guò)程中,隨著模型中所包含的因素和交互作用項(xiàng)的改變,對(duì)某個(gè)特定因素或交互作用項(xiàng)而言,其分析的結(jié)果是會(huì)發(fā)生變化的。也就是說(shuō),方差分析的結(jié)果是相對(duì)的。
嚴(yán)格地說(shuō),在對(duì)析因設(shè)計(jì)定量資料進(jìn)行一元方差分析前,也應(yīng)檢查定量資料是否滿(mǎn)足“獨(dú)立性、正態(tài)性和方差齊性”這三個(gè)前提條件[6]。為節(jié)省篇幅,本文假定定量資料已滿(mǎn)足此前提條件。當(dāng)試驗(yàn)因素很多時(shí),采用析因設(shè)計(jì)安排試驗(yàn)是非常耗時(shí)耗力的。一種補(bǔ)救措施是采用分式析因設(shè)計(jì)[1,3]或正交設(shè)計(jì)或均勻設(shè)計(jì)[2]。在析因設(shè)計(jì)的具體實(shí)施過(guò)程中,全部受試對(duì)象被完全隨機(jī)分配到因素的全部水平組合中去。然而,當(dāng)來(lái)自受試對(duì)象的某個(gè)或某些重要非試驗(yàn)因素對(duì)試驗(yàn)結(jié)果的影響不可忽視時(shí),改進(jìn)的做法是將受試對(duì)象按重要非試驗(yàn)因素形成若干個(gè)“區(qū)組”,每個(gè)區(qū)組內(nèi)的受試對(duì)象在重要的非試驗(yàn)因素方面條件最接近、且數(shù)量等于全部試驗(yàn)因素的水平組合數(shù)。于是,就可參照隨機(jī)區(qū)組設(shè)計(jì)的思路來(lái)隨機(jī)分配受試對(duì)象[7]。這樣的安排被稱(chēng)為“含區(qū)組因素的析因設(shè)計(jì)”[2],此設(shè)計(jì)有利于控制區(qū)組因素對(duì)結(jié)果的影響,增加結(jié)論的可信度。
本文介紹了析因設(shè)計(jì)的基本概念、析因設(shè)計(jì)的架構(gòu)以及兩因素析因設(shè)計(jì)定量資料一元方差分析的計(jì)算公式;通過(guò)兩個(gè)實(shí)例并借助SAS軟件實(shí)現(xiàn)了析因設(shè)計(jì)定量資料一元方差分析和關(guān)于交互作用效應(yīng)的多重比較。