沈 寧,胡良平,2*
(1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;2.世界中醫(yī)藥聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
?
精神衛(wèi)生科研如何嚴(yán)格遵守試驗設(shè)計四原則之對照原則
沈?qū)?,胡良平1,2*
(1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京100850;2.世界中醫(yī)藥聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京100029*通信作者:胡良平,E-mail:lphu812@sina.com)
明確闡釋在進行精神衛(wèi)生臨床試驗設(shè)計時,應(yīng)正確把握“對照原則”的意義和要領(lǐng)。從基本常識出發(fā),并基于精神衛(wèi)生科研的特點,尋找和發(fā)現(xiàn)在此研究領(lǐng)域中,怎樣做才能被稱為嚴(yán)格遵守了“對照原則”。通過結(jié)合本專業(yè)的特點,并結(jié)合實例,獲得如下的結(jié)果,即在進行精神衛(wèi)生臨床試驗設(shè)計時,必須把握好以下五個方面:①正確選定合適的對照形式;②正確領(lǐng)悟什么是合理的對照組;③必須盡可能設(shè)置合理的對照組;④應(yīng)盡可能避免出現(xiàn)假對照和對照不全等錯誤;⑤應(yīng)正確確定對照的組數(shù)。在如何嚴(yán)格遵守對照原則問題上,正確把握好前述提及的五個方面,就是抓住了問題的本質(zhì),是提高臨床試驗研究質(zhì)量的一個重要環(huán)節(jié)。
精神衛(wèi)生;臨床試驗設(shè)計;對照原則;假對照;對照不全
1.1對照與對照原則的概念
何為對照?對照就是“對比”之意。在試驗研究中,要想得出什么處理或治療效果好,必須交代“與誰比較”,比較至少要在兩個事物之間進行,在統(tǒng)計學(xué)上通常是兩個組(常稱為試驗組與對照組)。設(shè)立對照組實際上就是為試驗組尋找一個參照物或?qū)Ρ鹊幕A(chǔ)。
何為對照原則?對照原則就是強調(diào)在試驗研究中必須設(shè)置合理的對照組。換句話說,任何一個試驗研究項目,若僅依據(jù)一個試驗組得出結(jié)論,則此結(jié)論沒有絲毫說服力。
例如,假定用某藥治療感冒患者100例,結(jié)果是治愈了82例,人們并不能認(rèn)為此藥物對于感冒的治愈率為82%,更不能得出此藥物治療感冒很有效的結(jié)論。因為若換另外一批感冒患者,其治愈率不一定也是82%,況且,有些感冒患者還可以自愈。若自愈率為80%,則表明被試藥物治療感冒的療效并不高;若感冒患者的自愈率僅為40%,而且,兩組(藥物治療組與安慰劑對照組)患者身體健康狀況和感冒的嚴(yán)重程度等方面都非常接近且例數(shù)都在100例左右或更多,通過統(tǒng)計分析,很可能可以得出該藥物治療感冒的效果較好的結(jié)論。這里的“自愈率”意味著什么?意味著設(shè)置了一個“空白對照組”。也就是說,“自愈率”實際上就是測自不服用任何感冒藥的感冒患者(他們形成一個空白對照組)的自然康復(fù)率。由此可知,在試驗研究中,對照原則是不可違背的。不僅應(yīng)當(dāng)有對照組,而且,必須設(shè)置合理的對照組。對照組的“合理性”,不是一兩句話能闡述清楚的,詳見本文第3部分。
1.2對照原則的作用
對照原則的作用是提高試驗的鑒別能力,增強結(jié)論的說服力。有了對照組,可將影響因素給受試對象帶來的效應(yīng)(癥狀、體征或指標(biāo)的改變)與其他因素(如疾病的自然進展、觀察者或患者的期望、其他治療措施等非試驗因素)造成的效應(yīng)區(qū)分開來。出自對照組的試驗效應(yīng)可以告訴人們,在沒有接受研究者關(guān)注的那種特定處理的條件下,受試對象身上發(fā)生了什么情況?!肮抡齐y鳴”和“王婆賣瓜,自賣自夸”等俗語都清楚地說明一個道理:缺乏對照的研究是沒有說服力的。
例如,為探討某種新藥治療急性腦梗死的臨床效果,若只對一組該病患者給予該藥物治療,評價用藥后的療效,雖然有時或許也能觀察到患者病情有所好轉(zhuǎn),但因為沒有與其他現(xiàn)有的藥物作比較,不能判斷是其他非試驗因素產(chǎn)生的效應(yīng)還是此新藥產(chǎn)生的療效,就很難得出這種藥物療效優(yōu)劣的結(jié)論。如果研究者將納入研究的足夠多的患者隨機分為兩組(兩組患者在病情、病程、年齡、性別構(gòu)成、輔助治療等方面非常均衡),一組給予試驗藥物,另一組給予現(xiàn)有的常規(guī)治療藥物,則可以鑒別出該試驗藥物的真實效應(yīng)。
2.1安慰劑對照
它是指外觀與受試藥物相同,且無藥理活性的物質(zhì)。在臨床研究中安慰劑對照常用來代替受試藥物,以排除精神心理等非藥物因素的影響。
2.2空白對照
它是指對照組不接受任何真實的處理??瞻讓φ蘸唵我仔校谝匀藶槭茉噷ο蟮难芯恐锌赡軙霈F(xiàn)下列兩種情形之一:①因為設(shè)置空白對照,在某些實際臨床問題中違反了醫(yī)學(xué)倫理道德,將導(dǎo)致擬開展的臨床試驗研究項目不能獲得有資質(zhì)的倫理委員會的批準(zhǔn);②有時并不違反醫(yī)學(xué)倫理道德,但未采取有效的“盲法”或“遮蔽措施”,容易引起對照組與試驗組中的受試對象在心理和依從性上的差異,從而影響試驗結(jié)果的可靠性。
2.3試驗對照
它是指對對照組不施加與試驗組相同的處理,但施加試驗組也具有的相同基礎(chǔ)處理。由于試驗結(jié)果往往會受到試驗因素和其他非試驗因素影響,設(shè)立試驗對照可以用來排除某種特定的基礎(chǔ)處理所產(chǎn)生效應(yīng)的干擾。
例如,為了評價一種中草藥煙熏劑對空氣中某些細(xì)菌的殺菌效果,此時的處理就是“帶藥性的煙霧”。那么,人們不禁要問,“雜草或木柴燃燒后生成的煙霧”是否也有殺菌效果呢?為了打消人們的疑慮,開展此項試驗研究時,就必須采用無藥物性能的柴草點燃后產(chǎn)生的煙霧作為試驗對照,以抵消“煙霧”本身對殺菌效果造成的影響。
又例如,某研究者擬證明兒童每天上午和下午在課間各吃一個含賴氨酸的面包有助于身體生長發(fā)育,把“吃含賴氨酸面包”的兒童稱為“試驗組”,研究者還必須設(shè)置一組“吃不含賴氨酸面包”的兒童作為“試驗對照組”。這兩組兒童,除了所吃的面包中“含”與“不含”賴氨酸不同外,在其他一切方面(面包的大小、顏色、口味等都完全一樣;在試驗期間兒童在同一所學(xué)校住宿、作息時間相同、飲食結(jié)構(gòu)和量接近、學(xué)習(xí)負(fù)擔(dān)和身體鍛煉情況接近、不接受兒童家長給予的任何物質(zhì)和精神幫助)應(yīng)盡可能一致。
2.4自身對照
對照與試驗在同一受試對象身上進行?!皩φ铡睉?yīng)視為接受“處理1”,而“試驗”應(yīng)視為接受“處理2”。在實踐中,常會出現(xiàn)下面兩種情形,第二種情形要慎用。
第一種情形:“處理1”為空白(即不給予處理)、“處理2”為真實處理。
例如,假定有一組從未服用過降血壓藥物且已被確診為高血壓患者,在給他們服用一種特定劑量的降血壓藥物之前與之后(假定服藥后半小時)分別測定每位患者的收縮壓數(shù)值。將每位患者在這兩個時間點上測得的收縮壓數(shù)據(jù)配成一對,就叫做“自身配對設(shè)計”的一元定量資料。這就是最常見的“自身對照”臨床應(yīng)用的實例。在這個實例里,第1次測定收縮壓數(shù)值時,實際上未服用降血壓的藥物,而第2次測定收縮壓數(shù)值時,已經(jīng)服用降血壓藥物半個小時了(在本質(zhì)上,這是藥物及其作用時間在共同起作用的時間點,“服藥后何時測定收縮壓數(shù)值的時間長度”應(yīng)基于臨床經(jīng)驗或預(yù)試驗的結(jié)果來確定,應(yīng)是此藥物起效的最佳時間)。
注意:第1次測定與第2次測定之間的時間間隔不應(yīng)過長。因為一旦時間間隔過長,隨著時間的推移,指標(biāo)的數(shù)值本身會發(fā)生明顯的改變,其效應(yīng)會與“處理2”產(chǎn)生的效應(yīng)疊加在一起,使得第二次測定的結(jié)果不能真實地反映單純“處理2”的效應(yīng)。
第二種情形:“處理1”為第一種真實處理、“處理2”為第二種真實處理。
例如,假定有一組從未服用過降血壓藥物且已被確診為高血壓的患者,先給他們服用降壓藥A,半小時后測定收縮壓數(shù)值;過半小時后,再給他們服用降壓藥B,半小時后再測定收縮壓數(shù)值。這種“自身對照”設(shè)計是不科學(xué)的,因為第2次測定的收縮壓數(shù)值受到了第1次使用的A藥的影響。即使時間間隔再長一些,也不妥。
注意:若可從每個個體身上取出樣品(如抽取血液樣品),均分成兩份,分別施加不同的藥物或處理,這種自身對照結(jié)果的準(zhǔn)確程度就比上面提及的“第一種情形”更高一些,因為它幾乎不存在“時間(兩次測定指標(biāo)數(shù)值的時間間隔)”的效應(yīng)了。
若是“活體或整體試驗”,兩次都是“真實處理”,與其對應(yīng)的“試驗因素”最好不是“藥物種類”或“劑量大小(不含零劑量)”;若是類似“體溫計種類”、“測重儀種類”這樣的“試驗因素”,其結(jié)果的準(zhǔn)確度就很高;若“試驗因素”是“血壓計種類”,當(dāng)其用于“自身對照”時,其準(zhǔn)確程度介于“藥物種類或劑量大小(不含零劑量)”與“體溫計種類或測重儀種類”之間。
由此可知,在擬選用自身對照設(shè)計時,一定要注意“試驗因素”究竟是什么,關(guān)鍵是要考察它的任何一個水平是否會改變觀測指標(biāo)的取值。若會改變?nèi)纭八幬锓N類”或“劑量大小(不含零劑量)” ,應(yīng)盡可能不采用自身對照形式。
2.5標(biāo)準(zhǔn)對照或設(shè)置金標(biāo)準(zhǔn)
用現(xiàn)有標(biāo)準(zhǔn)方法、常規(guī)方法、標(biāo)準(zhǔn)值或參考值作為對照。試驗研究中常用于某種新方法是否可代替?zhèn)鹘y(tǒng)方法的研究。
例如,在臨床上,常用“病理檢查法”作為標(biāo)準(zhǔn)對照,而用新研究出來的“檢查方法”作為“試驗組”。這是考察“兩種檢測方法”檢測結(jié)果是否一致時,常用的一種對照形式。
2.6中外對照與歷史對照
中外對照是將中國做的某個試驗作為“試驗組”,而將外國做的相同試驗作為“對照組”的研究。歷史對照是將研究者以往的研究結(jié)果或文獻上他人的研究結(jié)果與本次研究結(jié)果作對照。這兩種對照通常意味著試驗組與對照組在“受試對象、環(huán)境、條件、時間、研究者、測定方法和評價方法等”很多方面不一致,“對照組”與“試驗組”之間的可比性差,說服力不強,應(yīng)盡量少用或不用。
3.1何為合理的對照組
在單因素試驗研究場合下,合理的對照組應(yīng)當(dāng)是與其他各組最具有可比性且從倫理學(xué)等方面考量都符合要求的那個組。例如,為了通過臨床試驗回答某種治療婦女更年期綜合征藥物的效果與安全性,假定此藥物只設(shè)置一個特定的劑量,則試驗組就是用該藥的特定劑量組,那么,合理的對照組究竟是什么呢?若使用安慰劑不違反醫(yī)學(xué)倫理道德,則使用“安慰劑組”就是合理的對照組;當(dāng)然,使用目前國際上療效最好、安全性最高的某“陽性藥”也是合理的對照組。
前面僅僅是從“試驗因素的不同水平”角度來談?wù)摗S谩鞍参縿弊鳛閷φ账帟r,試驗因素的名稱可以叫做“藥物種類”,其兩個水平分別叫做“新藥”與“安慰劑”;但試驗因素的更確切名稱為“新藥用否”,其兩個水平分別叫做“用新藥”與“不用新藥”。而用“陽性藥”(注意,“陽性藥”的劑量應(yīng)當(dāng)是其療效最好且安全性又很高的劑量)時,試驗因素的名稱只能叫做“藥物種類”,其兩個水平分別叫做“新藥”與“陽性藥”。事實上,一個對照組究竟能否被稱為“合理的對照組”,除了前面述及的“試驗因素的水平”確定得是否合理以外,還應(yīng)考察對照組中的受試對象在一切非試驗因素的取值上是否盡可能與試驗組中的受試對象一致。所以,一個對照組只有在前面提及的兩個方面都符合要求時,才能被稱為“合理的對照組”。
在多因素試驗研究場合下,怎樣的對照組才能被稱為“合理的對照組”呢?這是一個很難用簡單的語言說清楚的問題。一般來說,應(yīng)從多個試驗因素中,將每個獨立的試驗因素抽提出來,在每個試驗因素的全部水平組中,確定一個水平組作為其“合理的對照組”。有時,將某一個試驗因素的全部水平組視為“互為對照組”,更符合人們的認(rèn)識水平或?qū)嶋H情況。例如,假定“某藥物的劑量”是多個試驗因素中的一個試驗因素,其四個水平分別是“2、4、6、8 mg”。此時,將這四個劑量組視為“互為對照組”更合情合理。
綜上所述,無論在單因素還是多因素的試驗研究場合下,千萬不要機械地去規(guī)定哪個組就一定是“對照組”,其他組就一定是“試驗組”。關(guān)鍵是所做的安排或設(shè)置的全部組,無論從什么角度去挑毛病,都挑不出“硬傷”,那么這個“設(shè)計”就是科學(xué)的、嚴(yán)謹(jǐn)?shù)?。設(shè)置“合理的對照組”只是科學(xué)完善科研設(shè)計方案中的一個“細(xì)微環(huán)節(jié)”,大目標(biāo)實現(xiàn)了即可,不必“小題大作”。
為了使實際工作者在設(shè)置對照組時便于操作,下面總結(jié)出設(shè)置合理對照應(yīng)滿足的一些要求。
3.2合理對照組應(yīng)滿足的基本要求
3.2.1應(yīng)滿足均衡性要求
通過隨機化、盲法等手段,使試驗組與對照組除所考察的試驗因素的水平取值不同外,其他重要的、可控制的、對試驗結(jié)果有影響的試驗因素和非試驗因素所起的作用應(yīng)盡量一致。如,在動物試驗中,動物的來源、種屬、性別、體重、健康狀況應(yīng)盡量相近。在以人為受試對象時,受試對象的年齡、性別、病情、種族等基線資料應(yīng)當(dāng)相同或相近。
3.2.2應(yīng)遵循專設(shè)、同步的要求
所謂專設(shè),是指在臨床試驗中,將合格的受試對象分出部分受試對象作為對照,在試驗結(jié)束時比較兩組的處理效應(yīng)才能達(dá)到對照組所起的“比較鑒別”作用。一般情況下,不宜只觀察試驗組的結(jié)果,將該結(jié)果與研究者本人或他人過去的研究結(jié)果進行比較。
所謂同步,就是要求設(shè)立平行對照組,從與試驗組相同的人群中選擇對照,同時按照各自規(guī)定的方法進行治療。
3.2.3對照形式應(yīng)與研究目的和內(nèi)容相符的要求
例如在藥物臨床試驗中,盡量選擇安慰劑對照或標(biāo)準(zhǔn)對照或陽性藥對照,而不選擇空白對照,只有當(dāng)安慰劑盲法試驗無法執(zhí)行,或執(zhí)行起來非常困難,又沒有合適的標(biāo)準(zhǔn)對照或陽性藥對照,且不會嚴(yán)重違背倫理道德時,才選擇空白對照。
3.2.4對照組應(yīng)是因素的某個稱職水平的要求
若試驗安排中只有一個合理的對照組,那它必須與其他組之間形成一種高度可比的關(guān)系,即全部組共同形成一個“因素”,其中的對照組一定是該因素的一個稱職的水平。也就是說,在只有一個合理的對照組的安排中,它一定是一個標(biāo)準(zhǔn)的單因素設(shè)計類型;若試驗安排中容納了m個合理的對照組,那這個試驗安排中很可能就有m個因素。
4.1問題的提出
很多學(xué)過應(yīng)用統(tǒng)計學(xué)(特別是醫(yī)學(xué)統(tǒng)計學(xué)、衛(wèi)生統(tǒng)計學(xué)、臨床統(tǒng)計學(xué)和生物統(tǒng)計學(xué))的人腦海中似乎都有一個很深的印象:在一個試驗研究問題中,必須設(shè)立一個對照組。因此,無論該試驗研究項目實際上涉及多少個影響因素(包括試驗因素和重要非試驗因素),制訂試驗設(shè)計方案的人一般都只設(shè)立“一個對照組”。問題是這樣的思維觀念和做法何時是正確的、何時又是錯誤的呢?
4.2只設(shè)一個對照組是否總是合理的
試驗設(shè)計中只設(shè)置一個對照組是否總是合理的?應(yīng)視具體情況而定。若研究者的試驗中僅涉及一個試驗因素,一個對照組已足夠。例如,研究一種藥物的一個特定劑量的療效,只要設(shè)置一個空白對照或標(biāo)準(zhǔn)對照或安慰劑對照。若研究者的試驗涉及到多個因素,為了能正確評價因素間的交互作用效應(yīng)大小,往往要求每個試驗因素都有相對應(yīng)的對照組。否則,如果對照設(shè)置不全(即有些組沒有與其對應(yīng)的對照組),某些試驗因素就有可能成為其他試驗因素的“混雜因素”了,從而破壞了那些試驗因素組間的均衡性。下面的兩個實例清楚地說明了這一點。
【例1】某科研工作者做了一項試驗研究,其試驗安排見表1。試問:該研究者僅設(shè)置一個空白對照組是否合適?
表1 一個涉及手術(shù)與用藥的多因素試驗安排
【解說】在表1中,表面上只有一個對照組,即“F組(空白對照組)”或“F組(假手術(shù)對照組)”。但這個對照組有什么意義呢?事實上,這個“F組”僅僅是“D組”與“E組”的“合理對照組”,而沒有資格成為其他組的“對照組”。因為“D、E、F”三組中的動物都沒有服藥,只是接受的手術(shù)方式不同而已,因此,“手術(shù)方式”是這三組的試驗因素,其水平分別為“結(jié)扎(D組)”、“去勢(E組)”和“假手術(shù)(F組)”。在本例中,僅設(shè)立一個對照組出錯的原因在于此項試驗研究不是單因素多水平設(shè)計,而是涉及到三個試驗因素(即“去勢與否”、“結(jié)扎與否”和“用藥與否”)的一種不正確的安排(因為三個因素水平組合不完全),故它沒有資格被稱為一種標(biāo)準(zhǔn)的多因素設(shè)計。
【例2】某科研工作者做了一項試驗研究,其試驗安排見表2。試問:該研究者僅設(shè)置一個試驗對照組是否合適?
表2 一個關(guān)于氧吸服試驗的多因素安排
【解說】在表2中,研究者心理盤算:用第一行上的“吸壓縮空氣的對照組”為基準(zhǔn),從而說明后面的5個試驗組中,哪一個效果最好。這是把整個試驗視為“單因素六水平設(shè)計”了,問題是這個因素的名字叫什么?顯然,只有“組別”或“處理”或“方案”這樣含糊其辭或十分籠統(tǒng)的詞組才能表達(dá)所有組的“含義”。這說明此試驗安排是一個“假單因素多水平設(shè)計類型”,這個“對照組”僅僅是“吸氧3組”的合理對照組,而并非是其他“吸氧組”的對照組。因此,僅設(shè)置這一個“對照組”是不合格的。
值得一提的是,在上面兩個實例中,僅設(shè)立一個“對照組”出錯的根本原因在于:試驗研究項目本身不是一個標(biāo)準(zhǔn)的單因素多水平設(shè)計類型。在本質(zhì)上,涉及到多個試驗因素,而在安排中,既沒有將全部因素的水平進行全面組合,又沒有數(shù)學(xué)根據(jù)地抽取其中的部分組合,從而導(dǎo)致一個“拍著腦袋定方案、隨心所欲搞科研”的“產(chǎn)物”出現(xiàn)。
4.3多種對照形式并存
在一個試驗研究項目中“只設(shè)立一個對照組”的觀念和認(rèn)識在多因素試驗研究場合中必須堅決被擯棄!事實上,有時在同一項試驗研究中,不僅需要設(shè)立多個對照組,而且還同時需要運用多種對照形式,如安慰劑對照和試驗對照同時并存、試驗對照與陽性對照并存。其實,安慰劑對照很可能是某個因素的一個水平;而試驗對照很可能是另一個因素的一個水平。由于人們的習(xí)慣思維,喜歡指定某一個或兩個組為對照組。事實上,在多因素的試驗場合下,一般來說,同一個因素的各水平組之間形成“相互對照”,只是人們不太習(xí)慣這樣認(rèn)識而已。
4.3.1多因素水平組合完全且平衡的安排
【例3】某研究者進行綿馬貫眾及單芽狗脊貫眾飲片的凝血時間對比試驗,取昆明種小鼠80只,雌雄各半,按體重、性別隨機分成8組,分別為綿馬貫眾生品高低劑量組、炭品高低劑量組,單芽狗脊貫眾生品高低劑量組、炭品高低劑量組。各組小鼠連續(xù)灌胃給藥3 d,第3天給藥1 h后以毛細(xì)管法測定小鼠凝血時間。給藥劑量及凝血時間見表3。試問:這是單因素八水平設(shè)計定量資料嗎?
表3 藥物對凝血時間的影響±s,s)
【解說】表3中“組別”下共有8個水平,很多科研人員會想當(dāng)然地認(rèn)為這個定量資料就是單因素八水平設(shè)計定量資料。其實,這樣理解是錯誤的,他們被“假象”蒙住了眼睛?!敖M別”在這里是一種“復(fù)合型因素”的替身,它實質(zhì)上是三個兩水平因素的全面組合,即“藥材”、“劑量”和“炮制類型”。表3是該定量資料的“原型”(將問題本質(zhì)揭示出來的數(shù)據(jù)結(jié)構(gòu)),其標(biāo)準(zhǔn)型(可以直接進行統(tǒng)計分析的數(shù)據(jù)結(jié)構(gòu))見表4。
表4 藥物對凝血時間的影響(n=10)
若有專業(yè)依據(jù),認(rèn)定三個試驗因素對觀察結(jié)果的影響有主次之分時,本定量資料應(yīng)屬嵌套設(shè)計定量資料;若專業(yè)上無法判斷三個試驗因素對觀察結(jié)果的影響是否存在主次之分時,本定量資料應(yīng)屬三因素析因設(shè)計定量資料。
“綿馬貫眾”與“單芽狗脊貫眾”之間形成“相互對照”;“生品”與“炭品”之間形成“相互對照”;而“2.25”與“0.75”(g生藥/kg體重)兩種劑量之間形成“相互對照”。也就是說,只有在同一個試驗因素的不同水平之間,才能談?wù)撃膫€水平是“對照水平”,其他水平是“試驗水平”。更確切的表述是:同一試驗因素全部水平之間形成“相互對照”的關(guān)系。
4.3.2多因素水平組合不完全但平衡的安排
【例4】為優(yōu)化提取板藍(lán)根的工藝條件,取20 g板藍(lán)根飲片,采用正交設(shè)計試驗方法篩選板藍(lán)根中有效成分總有機酸的最佳提取工藝,考察的因素有提取溶劑濃度、溶劑用量、提取次數(shù)、提取時間,因素及其水平數(shù)見表5。選用L9(34)正交表安排試驗,見表6。試問:在此試驗設(shè)計中,有幾個對照組?
表5 總有機酸提取工藝影響因素水平
表6 總有機酸提取正交試驗結(jié)果
【解說】在表6中,反映出4個因素的9種水平組合(即表身中的9行),由于每個因素有3個水平,它們水平的全面組合應(yīng)該有81種,現(xiàn)在實際選用了其中的1/9種組合。表6中的9行所決定的試驗條件被稱為“9個試驗點”,雖然因素的水平組合不完全,但這9個試驗點是依據(jù)“正交原理”挑選出來的,這9個試驗點在空間具有“均勻分散”性;在統(tǒng)計分析時具有“整齊可比”性。這就是為什么在因素之間交互作用不復(fù)雜時,用正交表挑選出來的少數(shù)“試驗點”能比較好地達(dá)到或接近“全部試驗點”的試驗效果的奧秘之所在。
在表6中,有人可能認(rèn)為:第一行上四個因素都取“1水平”,用此行對應(yīng)的條件作為“對照組”,即以低水平組合為對照組。其實,真實情況并非如此。
比較第一行與第二行不難發(fā)現(xiàn),因素A均取“1水平”,而因素B、C、D分別是“1水平”與“2水平”之間的比較。
比較第一行與第三行不難發(fā)現(xiàn),因素A均取“1水平”,而因素B、C、D分別是“1水平”與“3水平”之間的比較。
比較第一行與第四行不難發(fā)現(xiàn),因素B均取“1水平”,而因素A、C分別是“1水平”與“2水平”之間的比較、因素D是“1水平”與“3水平”之間的比較。
第一行與其他行之間的關(guān)系就不逐一細(xì)說了??傊?,不能將第一行視為“對照組”。比較合適的說法是:在多因素試驗設(shè)計場合下,每個因素都以其自身的全部水平進行“相互對照”。沒有必要也不應(yīng)該指定某一種水平組合為其他水平組合的“對照組”。
4.3.3多因素水平組合不完全且不平衡的安排
在上面的表1中,顯然,試驗涉及到“結(jié)扎與否”、“去勢與否”和“用藥與否”這三個因素,但在表1中的安排不是一個某種標(biāo)準(zhǔn)的三因素設(shè)計類型,而只能被冠以一項“多因素非平衡組合試驗”。正確的做法是把三個兩水平因素的水平進行全面組合,共有8種不同的水平組合,也就是原試驗研究者少安排了兩組試驗,它們分別是“去勢+用藥”與“假手術(shù)+用藥”。全部8個組的試驗安排可被稱為“三因素析因設(shè)計”結(jié)構(gòu)或“2×2×2析因設(shè)計”結(jié)構(gòu)。
為什么要加上“結(jié)構(gòu)”兩個字而不直接說成“三因素析因設(shè)計”或“2×2×2析因設(shè)計”呢?那是因為標(biāo)準(zhǔn)的“析因設(shè)計”還需滿足其他條件,此處不便贅述。
在上面的表2中,情況就復(fù)雜得多了。從表面上看,這個安排中似乎也涉及到三個因素,即“吸入物種類(氧氣與壓縮空氣)”、“每天吸的次數(shù)(1、2、3次)”和“療程(3 d與7 d)”。這三個因素水平的全面組合似乎只有2×3×2=12種,但這顯然不符合實際情況。因為“每天吸的次數(shù)(1、2和3次)”是一個“復(fù)合型因素”,其中,每天吸一次又有3個水平,即早、中、晚;而每天吸兩次也有3個水平,即早與中、早與晚、中與晚。
如何將表2中的試驗安排修改成某種標(biāo)準(zhǔn)的多因素試驗設(shè)計類型,需要處置好那個復(fù)合型的因素。正確答案留給讀者去尋找,此處從略。
5對設(shè)置對照組方面存在的不足進行辨析與釋疑
【例5】兩組均給予舍曲林(左洛復(fù),輝瑞公司)治療,初始劑量50 mg/d,1周后加至100 mg/d,根據(jù)療效及耐受情況,調(diào)整劑量至50~200 mg/d,其中研究組平均劑量為(135.84±12.65)mg/d,對照組平均劑量為(139.36±9.46)mg/d,兩組舍曲林平均劑量比較差異無統(tǒng)計學(xué)意義(P>0.05);研究組舍曲林聯(lián)合電針治療,使用電針儀(電量調(diào)至患者感到舒適而穴位局部皮膚肌肉輕微抽動為度,使用疏密波,頻率為80~100 次/min,每次30 min),穴位選取:百會、印堂、內(nèi)關(guān)、足三里,電針治療每日1次,每周5次,兩組均治療4周[4]。
【辨析與釋疑】本例的對照組可以近似視為“標(biāo)準(zhǔn)對照”,即使用舍曲林治療創(chuàng)傷后應(yīng)激障礙。研究組是在用舍曲林治療的基礎(chǔ)上,加用電針治療。問題是:所選用的“標(biāo)準(zhǔn)對照”是否是最合理的對照?關(guān)鍵在于弄清研究組比對照組“多了什么”。表面上看,“多了電針刺激”。但事實上,還多了“選取的穴位”和“患者心理期待”。所以,比較好的對照形式應(yīng)當(dāng)是“試驗對照”,即對照組應(yīng)在使用舍曲林治療的基礎(chǔ)上,也在“百會、印堂、內(nèi)關(guān)、足三里”4個穴位上采用“假針刺”,以最大限度地降低對照組中受試對象對于“針刺”操作可能帶來的“好療效”的“安慰劑效應(yīng)”。從而真正顯露出“舍曲林聯(lián)合電針療法”與“單純舍曲林治療”療效之間的差別大小。
文獻[5]在對照組的設(shè)立上,也存在與本文例5同樣的問題,因篇幅所限,就不展開贅述了;文獻[6]在對照組的設(shè)立上,采取了“假刺激”,從而消除了本文例5中存在的弊端,故可認(rèn)為屬于設(shè)立了“合理的對照組”。
【例6】改良電痙攣治療(MECT)組與藥物組:為2014年2月-7月在解放軍256醫(yī)院住院的精神分裂癥患者(入組標(biāo)準(zhǔn)與排除標(biāo)準(zhǔn)此處從略)。研究期間所選患者行MECT治療的作為MECT組,共入組74人,脫落16人(其他細(xì)節(jié)從略);未行MECT治療的作為藥物組,共入組53人,脫落12人(其他細(xì)節(jié)從略);對照組:為同一時期醫(yī)院健康工作人員(入組標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)此處從略),共計入組82人。觀測的定量指標(biāo)有IL-1(pg/mL)、IL-4(pg/mL)、IL-6(pg/mL)、IL-10(pg/mL)和CRP(mg/L)。對MECT組患者在4個時間點(首次治療前、首次治療后、4次治療后、6次治療后)對上述定量指標(biāo)進行觀測、對藥物組患者在2個時間點(用藥前、用藥2周后)對上述定量指標(biāo)進行觀測、對健康對照組在1個時間點對上述定量指標(biāo)進行觀測[7],見表7。試問:在此項臨床試驗研究中,對照組設(shè)立得是否合理?
表7 各組間及MECT治療前后血清IL-1、 IL-4、 IL-6、 IL-10、CRP水平比較
注:三組間比較,aP<0.05;MECT組前后比較,bP<0.05
【辨析與釋疑】由表7可看出,文獻[7]在對照組的設(shè)立上,存在的問題比較多。在該文中,設(shè)立了3個組,其中,MECT組在4個不同時間點上對定量指標(biāo)進行了觀測、藥物組在兩個不同時間點上對定量指標(biāo)進行了觀測、健康對照組僅在1個時間點上對定量指標(biāo)進行了觀測。對每個定量指標(biāo)而言,相當(dāng)于有“7個組”之間的對比關(guān)系。
第一,應(yīng)當(dāng)明確:將“7個組”同時考察是沒有意義的,因為它不是一個具有7個水平的試驗因素,它屬于“多因素非平衡組合試驗”,必須結(jié)合基本常識和專業(yè)知識將“7個組”拆分開,再重新組合(如何拆分和如何重新組合,因篇幅所限,此處從略)后進行比較,才有意義。
第二,設(shè)立的“健康對照組”似乎意義并不大。假定表7中所觀測的5個定量指標(biāo)是區(qū)分精神分裂癥患者與健康人的特異性指標(biāo),則健康人與此病患者在這些指標(biāo)上的取值肯定會有明顯差別,故“健康對照組”起不到“標(biāo)準(zhǔn)對照”的作用。
第三,“藥物組”只能被視為“標(biāo)準(zhǔn)對照組”,但最好是“試驗對照組”。也就是說,應(yīng)在現(xiàn)在的“藥物組”基礎(chǔ)上加上“未改良電痙攣治療”。只有設(shè)立了這樣的“試驗對照組”,才能與這篇論文希望達(dá)到的試驗研究目的相吻合。當(dāng)然,要符合倫理學(xué)要求。
第四,比較合適的做法是設(shè)計如下的三組:“單純藥物組”、“藥物聯(lián)合未改良電痙攣治療組”和“藥物聯(lián)合改良電痙攣治療組”,并且各組都在“首次治療前、首次治療后、4次治療后、6次治療后”4個時間點上觀測定量指標(biāo)的取值。還應(yīng)對資料采取正確的統(tǒng)計分析(即帶有一個協(xié)變量且具有一個重復(fù)測量因素的兩因素設(shè)計一元或五元協(xié)方差分析)處理,才能得到令人信服的結(jié)論(說明:以“首次治療前”為協(xié)變量)。
[1]胡良平,關(guān)雪.如何正確執(zhí)行對照原則[J].中華腦血管病雜志(電子版),2011,5(2):43-48.
[2]毛瑋,胡良平,王琪.試驗設(shè)計必須遵循對照原則[J].藥學(xué)服務(wù)與研究,2010,10(4):252-255.
[3]胡良平.科研設(shè)計與統(tǒng)計分析[M].北京:軍事醫(yī)學(xué)科學(xué)出版社,2012:136-205.
[4]周平,張瑤,譚慶榮. 電針聯(lián)合舍曲林治療創(chuàng)傷后應(yīng)激障礙的效果觀察[J].四川精神衛(wèi)生,2015,28(6):504-506.
[5]金毅瓊. 帕羅西汀聯(lián)合重復(fù)經(jīng)顱磁刺激治療女性更年期抑郁癥的對照研究[J].四川精神衛(wèi)生,2015,28(6):515-518.
[6]郭新宇,楊媛,田麗. 草酸艾司西酞普蘭聯(lián)合重復(fù)經(jīng)顱磁刺激對改善難治性抑郁癥患者執(zhí)行功能的療效研究[J].四川精神衛(wèi)生,2016,29(1):26-30.
[7]郭永芳,周小東,付華斌,等. 改良電痙攣治療對精神分裂癥患者血清細(xì)胞因子及C-反應(yīng)蛋白水平的影響[J]. 四川精神衛(wèi)生,2015,28(2):119-122.
(本文編輯:吳俊林)
Adherence to four principles in the clinical trial design of mental health: the "control principle"
SHENNing1,HULiang-ping1,2*
(1.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HULiang-ping,E-mail:lphu812@sina.com)
To elaborate how to develop and implement best practice of the "control principle" in the clinical trial design of mental health. In the context of discipline of mental health, the question challenges designers is how to adherence to the "control principle", the essence of which includes whether there is a control group and whether the control group is properly set up. By combining the general features with the examples in the discipline of mental health, the five aspects below should be taken into account in the clinical trial design. ①To correctly choose an appropriate type of control. ②To perceive and determine what is a proper control group. ③To make a proper control group to the best of one's ability. ④To avoid the mistakes of a false control group and an insufficient control group. ⑤To correctly determine the quantity of control groups. Thus,as to adherence to the "control principle", the essence of which requires designers to put the above five aspects into practice, and it's also a pivotal procedure to achieve high-quality findings of clinical trial research.
Mental health;Clinical trial design;Control Principle;False control; Control insufficiency
R195.1
A
10.11886/j.issn.1007-3256.2016.04.002
2016-07-26)