谷恒明,胡良平,2*
(1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029
科研方法專題
試驗(yàn)設(shè)計(jì)類型之可以考察全部交互作用的多因素設(shè)計(jì):析因設(shè)計(jì)
谷恒明1,胡良平1,2*
(1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029
本文目的是介紹一種可以考察各級(jí)交互作用的多因素設(shè)計(jì)類型,即析因設(shè)計(jì)。通過(guò)介紹兩個(gè)實(shí)際例子,總結(jié)出析因設(shè)計(jì)的八個(gè)特點(diǎn)及優(yōu)點(diǎn)、缺點(diǎn)。針對(duì)實(shí)際應(yīng)用時(shí)可能面臨的情況或問(wèn)題,人們可能會(huì)對(duì)析因設(shè)計(jì)進(jìn)行改造,由此產(chǎn)生了析因設(shè)計(jì)的三種變形,即“含區(qū)組因素的析因設(shè)計(jì)”“分式析因設(shè)計(jì)”和“多因素非平衡組合試驗(yàn)”。最后一種情形,是實(shí)際工作者常會(huì)使用的,但在對(duì)定量評(píng)價(jià)指標(biāo)進(jìn)行差異性分析時(shí)需要對(duì)原先的分組進(jìn)行合理拆分,再進(jìn)行恰當(dāng)?shù)慕M合,構(gòu)造出多種標(biāo)準(zhǔn)的設(shè)計(jì)類型,以利于分析者選擇正確的統(tǒng)計(jì)分析方法。
試驗(yàn)因素;區(qū)組因素;析因設(shè)計(jì);分式析因設(shè)計(jì);交互作用
具有正常思維和心理的人做任何事都會(huì)通盤考慮,盡可能做到系統(tǒng)全面、有條不紊。然而,對(duì)于一個(gè)事物而言,在眾多的設(shè)計(jì)類型之中,“析因設(shè)計(jì)”就具有前述提及的那種“潛質(zhì)”。
析因設(shè)計(jì)具有多個(gè)特點(diǎn),其中最突出的特點(diǎn)是包括全部的“試驗(yàn)點(diǎn)(即試驗(yàn)因素不同水平組合所決定的每個(gè)特定試驗(yàn)條件)”數(shù)目,是全部擬被考察的試驗(yàn)因素水平的全面組合數(shù)。例如,假定在某項(xiàng)試驗(yàn)研究中共需考察10個(gè)三水平試驗(yàn)因素,若采用析因設(shè)計(jì),則全部試驗(yàn)點(diǎn)數(shù)為310=59 049個(gè)。這個(gè)數(shù)目代表什么含義呢?它相當(dāng)于科研人員習(xí)慣上所稱呼的“試驗(yàn)分組數(shù)”。若每個(gè)試驗(yàn)組僅做一次試驗(yàn)(即無(wú)重復(fù)試驗(yàn)),那這個(gè)數(shù)也可以被叫做“總試驗(yàn)次數(shù)”。但是,此時(shí)的安排不能被稱為“十因素析因設(shè)計(jì)”,而只能被稱為“無(wú)重復(fù)試驗(yàn)的十因素全面組合試驗(yàn)”。因?yàn)橛蛇@樣的安排得出的試驗(yàn)結(jié)果不能全面、真實(shí)地揭示多個(gè)試驗(yàn)因素各自和相互作用對(duì)結(jié)果產(chǎn)生的影響,即使采用某種復(fù)雜的統(tǒng)計(jì)分析方法,也可能會(huì)得出錯(cuò)誤的結(jié)論。原因在于:試驗(yàn)結(jié)果中沒(méi)有包含試驗(yàn)因素對(duì)評(píng)價(jià)結(jié)果的作用規(guī)律,全靠統(tǒng)計(jì)學(xué)或數(shù)學(xué)方法是不可能創(chuàng)造出規(guī)律來(lái)的。
2.1 兩因素析因設(shè)計(jì)實(shí)例
【例1】觀察A、B兩種鎮(zhèn)痛藥物聯(lián)合運(yùn)用在產(chǎn)婦分娩時(shí)的鎮(zhèn)痛效果。A藥取3個(gè)劑量:1.0 mg,2.5 mg,5.0 mg;B藥也取3個(gè)劑量:5 μg,15 μg,30 μg。共9個(gè)處理組。將27名產(chǎn)婦隨機(jī)等分為9組,每組各3名,記錄每名產(chǎn)婦分娩時(shí)的鎮(zhèn)痛時(shí)間,結(jié)果見(jiàn)表1。試分析A、B兩種藥物的聯(lián)合鎮(zhèn)痛效果[1]。
表1 A、B兩種藥物聯(lián)合運(yùn)用的鎮(zhèn)痛時(shí)間(min)
2.2 三因素析因設(shè)計(jì)實(shí)例
【例2】某臨床醫(yī)生收集到如下資料[2],見(jiàn)表2。問(wèn):此資料所對(duì)應(yīng)的試驗(yàn)設(shè)計(jì)類型是什么?
3.1 對(duì)例1的解析
在例1中,有兩個(gè)獨(dú)立于受試對(duì)象(本例中為產(chǎn)婦)的試驗(yàn)因素,分別叫做“A藥劑量”與“B藥劑量”,它們都具有3個(gè)水平。每位產(chǎn)婦均需同時(shí)接受兩種鎮(zhèn)痛藥以減輕分娩時(shí)的疼痛,由基本常識(shí)可知,在使用時(shí),每種鎮(zhèn)痛藥只可能取一個(gè)特定的劑量,于是,兩種鎮(zhèn)痛藥的劑量組合數(shù)就有3×3=9種(即試驗(yàn)點(diǎn)數(shù))。在各種組合(即試驗(yàn)點(diǎn)或稱特定的試驗(yàn)組)下均做了3次獨(dú)立重復(fù)試驗(yàn)(即有三位產(chǎn)婦)。有一個(gè)定量的評(píng)價(jià)指標(biāo),即“鎮(zhèn)痛時(shí)間(min)”,確切地說(shuō),應(yīng)該是“鎮(zhèn)痛保持的時(shí)間(min)”。
臨床醫(yī)生并沒(méi)有聲明:所涉及的兩個(gè)試驗(yàn)因素對(duì)評(píng)價(jià)指標(biāo)的影響是否有主次之分,只能被視為“同等重要或地位平等”。
基于以上的背景,可以比較有把握地判定例1的試驗(yàn)安排屬于“兩因素析因設(shè)計(jì)”。
表2 2 545例糖尿病患者血脂檢測(cè)結(jié)果
注:TC,總膽固醇;TG,甘油三酯;HDL-C,高密度脂蛋白膽固醇;LDL-C,低密度脂蛋白膽固醇
3.2 對(duì)例2的解析
在例2中,表2中的“組別”究竟是一個(gè)8水平的因素,還是多個(gè)因素的組合呢?仔細(xì)觀察“組別”之下的8行內(nèi)容,不難發(fā)現(xiàn):它們是“C高否”“G高否”與“HD低否” 3個(gè)因素各2水平的全面組合而得到的,即這是由3個(gè)2水平試驗(yàn)因素按2×2×2組織起來(lái)的“架構(gòu)”。表2中的后4列為在臨床上可能有聯(lián)系的4個(gè)定量指標(biāo),若需要同時(shí)考察它們的變化情況,就屬于四元統(tǒng)計(jì)分析問(wèn)題,它們不影響對(duì)設(shè)計(jì)類型的判定。
若將表2中的第1列改寫成3列,即把3個(gè)試驗(yàn)因素的名稱及其水平各用一列來(lái)呈現(xiàn),就把一個(gè)貌似“單因素8水平”的“混淆型設(shè)計(jì)架構(gòu)”清楚地“重構(gòu)”了,使其成為一個(gè)“2×2×2”的“設(shè)計(jì)架構(gòu)”,見(jiàn)表3。
此時(shí),僅依據(jù)表3的外表,還不能直接判定其為“三因素析因設(shè)計(jì)”。還必須聲明:這3個(gè)因素對(duì)評(píng)價(jià)指標(biāo)(這里有4個(gè)定量評(píng)價(jià)指標(biāo))的影響是否“地位平等”,僅當(dāng)答案為“以專業(yè)知識(shí)為依據(jù),3個(gè)因素對(duì)所有定量評(píng)價(jià)指標(biāo)的影響地位平等”時(shí),表3所對(duì)應(yīng)的安排才可以被叫做“三因素析因設(shè)計(jì)”或“2×2×2析因設(shè)計(jì)”。后一種稱呼稍好一點(diǎn),因?yàn)樗宄馗嬷x者,每個(gè)因素有幾個(gè)水平。
表3 用三因素及其水平組合取代表2中“組別”±s,mmol/L)
在文獻(xiàn)[3]中,呈現(xiàn)了析因設(shè)計(jì)具有的7個(gè)特點(diǎn)。為嚴(yán)謹(jǐn)起見(jiàn),這里還要補(bǔ)充一點(diǎn),匯總?cè)缦隆?/p>
具備下列8個(gè)特點(diǎn)的多因素試驗(yàn)設(shè)計(jì)可被稱為標(biāo)準(zhǔn)的析因設(shè)計(jì):①試驗(yàn)因素個(gè)數(shù)≥2;②每個(gè)試驗(yàn)因素的水平數(shù)≥2且可以不相等;③試驗(yàn)因素之間不存在“連帶關(guān)系”且獨(dú)立于受試對(duì)象;④不同的試驗(yàn)條件數(shù)(或組合數(shù)、試驗(yàn)點(diǎn)數(shù))等于全部試驗(yàn)因素的水平數(shù)之乘積;⑤各試驗(yàn)條件下至少要做兩次獨(dú)立重復(fù)試驗(yàn);⑥全部受試對(duì)象被完全隨機(jī)地分配到任何一個(gè)試驗(yàn)條件組中去,各小組中的受試對(duì)象個(gè)數(shù)可以不等,但最好相等;⑦試驗(yàn)時(shí),任何一次試驗(yàn)都將涉及到任何一個(gè)試驗(yàn)因素的某個(gè)水平,即全部試驗(yàn)因素同時(shí)施加;⑧進(jìn)行統(tǒng)計(jì)分析時(shí),假定有專業(yè)依據(jù)認(rèn)為:全部試驗(yàn)因素對(duì)觀測(cè)結(jié)果的影響是地位平等的,即沒(méi)有主次之分。
由上述特點(diǎn),決定了析因設(shè)計(jì)具有明顯的優(yōu)點(diǎn)和缺點(diǎn)。優(yōu)點(diǎn):可以分析每個(gè)試驗(yàn)因素的主效應(yīng)和試驗(yàn)因素之間各級(jí)交互作用的效應(yīng)大小。缺點(diǎn):總試驗(yàn)次數(shù)太多,試驗(yàn)費(fèi)用大且費(fèi)時(shí)費(fèi)力。
若嚴(yán)格按上述的8個(gè)特點(diǎn)來(lái)考察,例2不滿足上述的“第三點(diǎn)”和“第六點(diǎn)”。因此,例2中的表3確實(shí)具有“析因設(shè)計(jì)結(jié)構(gòu)”,但算不上“標(biāo)準(zhǔn)的析因設(shè)計(jì)”。相比而言,例1中的表1可稱為“標(biāo)準(zhǔn)的兩因素析因設(shè)計(jì)”。
說(shuō)明:上述“第三個(gè)特點(diǎn)”中的“連帶關(guān)系”是指一個(gè)因素與另一個(gè)因素之間存在內(nèi)在的聯(lián)系,例如,藥物種類(分為A藥、B藥)與“藥物劑量”之間就存在“連帶關(guān)系”。假定在本文例1中,每個(gè)產(chǎn)婦只接受一種特定劑量的鎮(zhèn)痛藥,全部產(chǎn)婦被隨機(jī)分配到6個(gè)試驗(yàn)組,分別為A藥的3個(gè)劑量組與B藥的3個(gè)劑量組。這樣的安排,很容易被判定為2×3析因設(shè)計(jì)(藥物種類有2個(gè)水平,藥物劑量有3個(gè)水平)。若考慮到兩個(gè)因素之間存在“連帶關(guān)系”,將其判定為兩因素嵌套設(shè)計(jì)更為合理。
5.1 含區(qū)組因素的析因設(shè)計(jì)[4]
【例3】有人研究豬食用不同飼料對(duì)體重增加量的影響。A(大豆粉+不同含量的蛋白質(zhì)):A1(加14%蛋白質(zhì))、A2(加12%蛋白質(zhì));B(玉米中己氨酸的含量):B1(含0.6%己氨酸)、B2(缺乏己氨酸),共有4種不同的飼料配方。用24頭豬作為受試對(duì)象,按豬的初始體重由輕到重排序,并形成6個(gè)隨機(jī)區(qū)組,每組中的4只豬體重接近,被隨機(jī)分到4個(gè)飼料組中,在喂養(yǎng)期間,盡可能使每只豬每餐都能吃飽。設(shè)計(jì)格式和資料見(jiàn)表4,該資料所取自的試驗(yàn)設(shè)計(jì)類型為含區(qū)組因素的析因設(shè)計(jì)。
表4 兩種飼料的不同配方對(duì)豬平均日增重量的影響結(jié)果
【分析與解答】在表4中,核心架構(gòu)是由A、B兩個(gè)試驗(yàn)因素組成的2×2析因設(shè)計(jì),在將受試對(duì)象(本例為豬)分組時(shí),將其“原始體重”作為一個(gè)重要的非試驗(yàn)因素。由于“原始體重”是定量因素,又按范圍將其劃分成6段,使其轉(zhuǎn)化成“有序因素”。于是,就派生出一個(gè)所謂的“區(qū)組因素”??紤]區(qū)組因素的目的是盡可能消除“原始體重”對(duì)評(píng)價(jià)指標(biāo)(平均日增重量)的影響,更真實(shí)地顯露出試驗(yàn)因素不同水平組合所決定的試驗(yàn)條件(在本例中,本質(zhì)上是營(yíng)養(yǎng)價(jià)值高低)對(duì)評(píng)價(jià)指標(biāo)的影響大小。
5.2 分式析因設(shè)計(jì)[4-6]
【例4】25-1分式析因設(shè)計(jì):若有5個(gè)2水平試驗(yàn)因素,析因設(shè)計(jì)的水平組合數(shù)為32種,基于5因素的交互作用項(xiàng)的正、負(fù)號(hào),可將32種組合一分為二,取其中一半所對(duì)應(yīng)的水平組合,就稱為分式析因設(shè)計(jì)。
【分析與解答】若設(shè)每個(gè)試驗(yàn)因素的水平分別為-1與1,則在五個(gè)2水平因素的32種水平組合中,取五個(gè)因素的水平連乘積為“+1”或“-1”的部分,即16種水平組合,見(jiàn)圖1(五因素交互作用取“+1”的那部分,圖中Y之下填寫試驗(yàn)結(jié)果)。
OBSYX1X2X3X4X51。111-1-12。-1-1-1-113。1-1-1114。1-1-1-1-15。1-11-116。-111-117。1-111-18。111119。-1111110。-1-1-11-111。-11-1-1-112。-1-11-1-113。-1-111114。11-1-1115。-11-11116。11-11-1
圖1 25-1分式析因設(shè)計(jì)對(duì)應(yīng)的水平組合
同理,25-1分式析因設(shè)計(jì)、25-2分式析因設(shè)計(jì),一般用符號(hào)表示如下:2P-K分式析因設(shè)計(jì),其中P>K,皆為正整數(shù)。
同理,34-1分式析因設(shè)計(jì)、34-2分式析因設(shè)計(jì),一般用符號(hào)表示如下:3P-K分式析因設(shè)計(jì),其中P>K,皆為正整數(shù)。
5.3 不平衡析因設(shè)計(jì)——多因素非平衡組合試驗(yàn)[2]
【例5】沿用例1資料,假定研究者在下列三種條件下,未做試驗(yàn):①:A(1.0)與B(5);②:A(2.5)與B(15);③:A(5.0)與B(30)。
試辨析這是一個(gè)什么試驗(yàn)設(shè)計(jì)類型。
【分析與解答】在一個(gè)析因設(shè)計(jì)中,少做了一組或多組試驗(yàn),其安排就不能被稱為析因設(shè)計(jì)了。從表面上看,它屬于“不平衡析因設(shè)計(jì)”。其實(shí),它已經(jīng)嚴(yán)重偏離了“標(biāo)準(zhǔn)析因設(shè)計(jì)的定義或特點(diǎn)”。它的最確切名稱為“多因素非平衡組合試驗(yàn)”,因?yàn)樗呀?jīng)沒(méi)有“資格”被稱為“設(shè)計(jì)”了。對(duì)基于這種安排而產(chǎn)生的定量評(píng)價(jià)指標(biāo)的數(shù)據(jù)擬做差異性分析之前,首先必須對(duì)全部試驗(yàn)組進(jìn)行合理的拆分;然后再結(jié)合基本常識(shí)、專業(yè)知識(shí)和統(tǒng)計(jì)學(xué)知識(shí)進(jìn)行各種重新組合,這個(gè)過(guò)程相當(dāng)于進(jìn)行“回顧性試驗(yàn)設(shè)計(jì)”。根據(jù)不同的組合判斷其應(yīng)屬于什么試驗(yàn)設(shè)計(jì)類型,再選用相應(yīng)的差異性分析模型對(duì)定量資料進(jìn)行分析,具體方法參見(jiàn)文獻(xiàn)[2-3],此處從略。
[1] 胡良平,王素珍,郭晉. 內(nèi)科科研統(tǒng)計(jì)設(shè)計(jì)與數(shù)據(jù)分析[M]. 北京: 電子工業(yè)出版社,2015: 33-39.
[2] 胡良平. 統(tǒng)計(jì)學(xué)三型理論在實(shí)驗(yàn)設(shè)計(jì)中的應(yīng)用[M]. 北京:人民軍醫(yī)出版社,2006: 152-163.
[3] 胡良平. 科研設(shè)計(jì)與統(tǒng)計(jì)分析[M]. 北京: 軍事醫(yī)學(xué)科學(xué)出版社,2012: 228-264.
[4] 胡良平. 面向問(wèn)題的統(tǒng)計(jì)學(xué)——(1)科研設(shè)計(jì)與統(tǒng)計(jì)基礎(chǔ)[M]. 北京: 人民衛(wèi)生出版社,2012:166-219.
[5] 郭祖超. 醫(yī)用數(shù)理統(tǒng)計(jì)方法[M]. 3版. 北京: 人民衛(wèi)生出版社,1988: 307-341.
[6] Dean A, Voss D. Design and analysis of experiments[M]. New York: Springer, 1999: 483-546.
(本文編輯:吳俊林)
科研方法專題策劃人——胡良平教授簡(jiǎn)介
胡良平,男,1955年8月出生,教授,博士生導(dǎo)師,曾任軍事醫(yī)學(xué)科學(xué)院研究生部醫(yī)學(xué)統(tǒng)計(jì)學(xué)教研室主任和生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心主任、國(guó)際一般系統(tǒng)論研究會(huì)中國(guó)分會(huì)概率統(tǒng)計(jì)系統(tǒng)專業(yè)理事會(huì)常務(wù)理事和北京大學(xué)口腔醫(yī)學(xué)院客座教授;現(xiàn)任世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì)會(huì)長(zhǎng)、中國(guó)生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)會(huì)副會(huì)長(zhǎng),《中華醫(yī)學(xué)雜志》等10余種雜志編委和國(guó)家食品藥品監(jiān)督管理局評(píng)審專家。主編統(tǒng)計(jì)學(xué)專著45部,參編統(tǒng)計(jì)學(xué)專著10部;發(fā)表第一作者學(xué)術(shù)論文220余篇,發(fā)表合作論文130余篇,獲軍隊(duì)科技成果和省部級(jí)科技成果多項(xiàng);參加并完成三項(xiàng)國(guó)家標(biāo)準(zhǔn)的撰寫工作;參加三項(xiàng)國(guó)家科技重大專項(xiàng)課題研究工作。在從事統(tǒng)計(jì)學(xué)工作的30年中,為幾千名研究生、醫(yī)學(xué)科研人員、臨床醫(yī)生和雜志編輯講授生物醫(yī)學(xué)統(tǒng)計(jì)學(xué),在全國(guó)各地作統(tǒng)計(jì)學(xué)學(xué)術(shù)報(bào)告100余場(chǎng),舉辦數(shù)十期全國(guó)統(tǒng)計(jì)學(xué)培訓(xùn)班,培養(yǎng)多名統(tǒng)計(jì)學(xué)專業(yè)碩士和博士研究生。近幾年來(lái),參加國(guó)家級(jí)新藥和醫(yī)療器械項(xiàng)目評(píng)審數(shù)十項(xiàng)、參加100多項(xiàng)全軍重大重點(diǎn)課題的統(tǒng)計(jì)學(xué)檢查工作。歸納并提煉出有利于透過(guò)現(xiàn)象看本質(zhì)的“八性”和“八思維”的統(tǒng)計(jì)學(xué)思想,獨(dú)創(chuàng)了逆向統(tǒng)計(jì)學(xué)教學(xué)法和三型理論。擅長(zhǎng)于科研課題的研究設(shè)計(jì)、復(fù)雜科研資料的統(tǒng)計(jì)分析與SAS實(shí)現(xiàn)、各種層次的統(tǒng)計(jì)學(xué)教學(xué)培訓(xùn)和咨詢工作。
Types of the multifactor experimental designs with all interactions: factorial design
GuHengming1,HuLiangping1,2*
(1.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China; 2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)
The paper aims to introduce a multifactor design type that can examine the interactions at all levels, that is factorial design. By introducing two practical examples, the eight characteristics and advantages and disadvantages of the factorial design are summarized. Facing the situation or the problem in the real application, people may transform the factorial design into the following three forms: factorial design with block factor, fractional factorial design and multifactor unbalanced combination test. The last case is often used by the actual workers. However, the primary task is to reasonable divide the original grouping and then appropriate combination in the difference analysis for quantitative evaluation index. Thus, a variety of standard design types are constructed and facilitate the analysts to select a correct statistical analysis.
Experimental factors; Block factor; Factorial design; Fractional factorial design; Interaction effection
R195.1
A
10.11886/j.issn.1007-3256.2017.03.001
國(guó)家高技術(shù)研究發(fā)展計(jì)劃課題資助(2015AA020102)
2017-06-04)
*通信作者:胡良平,E-mail:lphu812@sina.com)