張連成 陶瑩瑩 高淑青
天津體育學(xué)院競技運(yùn)動(dòng)心理與生理調(diào)控重點(diǎn)實(shí)驗(yàn)室(天津301617)
實(shí)驗(yàn)研究的最小單位是變量。實(shí)驗(yàn)研究中涉及的變量主要包括自變量、因變量和額外變量。在控制額外變量的前提下,探討自變量取值的變化對因變量取值變化的影響是實(shí)驗(yàn)研究的主要邏輯所在。自變量取值的變化常需要通過設(shè)置對照條件來實(shí)現(xiàn),因此,設(shè)置有效的對照條件便成為實(shí)驗(yàn)研究中重要的一環(huán)。對照也是實(shí)驗(yàn)設(shè)計(jì)的四大原則之一[1]。通過設(shè)置對照可以為研究提供基線和比較的基礎(chǔ),進(jìn)而幫助實(shí)驗(yàn)設(shè)計(jì)達(dá)到實(shí)驗(yàn)?zāi)康?。科學(xué)實(shí)驗(yàn)中的對照組是把除了自變量以外影響因變量結(jié)果的其余部分加以分開的組,這隔離了自變量以外其他方面對實(shí)驗(yàn)的影響,可以幫助排除實(shí)驗(yàn)結(jié)果的替代解釋,進(jìn)而可以增加實(shí)驗(yàn)的可靠性和有效性[2],尤其是當(dāng)實(shí)驗(yàn)條件復(fù)雜且難以分離時(shí),對照組的價(jià)值就更大。同時(shí),不同的對照類型也將影響實(shí)驗(yàn)結(jié)論的方向性與適切性[3]??梢?,有效的對照可以為科研實(shí)踐以及政策制定提供堅(jiān)固的研究基礎(chǔ)。
綜上,在科學(xué)實(shí)驗(yàn)中,設(shè)置對照組的目的主要在于提高研究結(jié)果的鑒別能力和結(jié)論的說服力,換言之,缺乏對照的研究結(jié)果是沒有說服力的。當(dāng)然,對照不全、對照條件設(shè)置不合理、無效對照的實(shí)驗(yàn)依然是沒有說服力的,導(dǎo)致研究結(jié)論的有效性受到質(zhì)疑,其為實(shí)踐提供的證據(jù)也不可信。對照條件設(shè)置不合理是威脅實(shí)驗(yàn)內(nèi)部效度的重要問題之一[4]。無效對照就是因?yàn)閷φ战M設(shè)置不合理,導(dǎo)致實(shí)驗(yàn)結(jié)果難以歸因于自變量影響的設(shè)計(jì)。本文從實(shí)驗(yàn)內(nèi)部效度可能受到威脅的角度,分析體育科學(xué)實(shí)驗(yàn)研究中對照設(shè)置的常見問題,并著重分析有效設(shè)置對照的策略,避免無效對照,進(jìn)而提高體育科學(xué)實(shí)驗(yàn)研究的有效性。
在實(shí)驗(yàn)設(shè)計(jì)時(shí),我們需要盡可能排除一切無關(guān)因素對實(shí)驗(yàn)研究結(jié)果的影響,進(jìn)而揭示自變量對因變量影響的一一對應(yīng)關(guān)系,這樣的實(shí)驗(yàn)研究才具有較好的內(nèi)部效度。實(shí)驗(yàn)設(shè)計(jì)的一個(gè)重要原則便是對照,只有對照才有比較,有比較才能說明自變量對因變量的影響。然而,體育科學(xué)領(lǐng)域的一些實(shí)驗(yàn)研究缺乏必要的對照組,只是自身前后對照來說明某一干預(yù)療法、某一訓(xùn)練的效益等等,此類研究所獲得的結(jié)論難以讓人信服。例如,某研究想要探討體育游戲?qū)τ變耗承┬睦砟芰Φ挠绊懀芯空邇H是通過16周的體育游戲干預(yù)前后測設(shè)計(jì),沒有設(shè)置相應(yīng)的對照組。這樣的實(shí)驗(yàn)設(shè)計(jì)就難以得出體育游戲干預(yù)可以改善幼兒某些心理能力的結(jié)論。此類實(shí)驗(yàn)設(shè)計(jì)存在的主要問題是:因?yàn)闆]有設(shè)置對照組,僅依據(jù)自身前后測數(shù)據(jù)的比較難以排除實(shí)驗(yàn)過程中自然成熟、練習(xí)、統(tǒng)計(jì)回歸、測試效應(yīng)等等非干預(yù)因素的影響,因此導(dǎo)致無法判斷因變量變化的根源,實(shí)驗(yàn)的內(nèi)部效度也會(huì)受到嚴(yán)重制約[5]。
解決這一問題的策略是在進(jìn)行實(shí)驗(yàn)設(shè)計(jì)時(shí),需要從實(shí)驗(yàn)內(nèi)部效度可能受到的威脅角度,盡可能考慮所有可能會(huì)干擾自變量對因變量影響的因素,并設(shè)置相應(yīng)的對照與控制,進(jìn)而揭示自變量對因變量的確切影響。
對照不全通常是指在實(shí)驗(yàn)中由于缺乏一些對應(yīng)對照組,導(dǎo)致多組之間的均衡性變差,最終導(dǎo)致結(jié)果的解釋性不強(qiáng)的現(xiàn)象。此類問題常見于一些本應(yīng)采用析因?qū)嶒?yàn)設(shè)計(jì)的研究中。例如,某研究為揭示某種營養(yǎng)補(bǔ)劑劑量以及運(yùn)動(dòng)對某種代謝疾病的影響,將64只大鼠隨機(jī)分為8 組(安靜-代謝正常組、安靜-代謝異常組、安靜-代謝異常-營養(yǎng)補(bǔ)劑低組、安靜-代謝異常-營養(yǎng)補(bǔ)劑高組、運(yùn)動(dòng)-代謝正常組、運(yùn)動(dòng)-代謝異常組、運(yùn)動(dòng)-代謝異常-營養(yǎng)補(bǔ)劑低組、運(yùn)動(dòng)-代謝異常-營養(yǎng)補(bǔ)劑高組),并分別接受不同實(shí)驗(yàn)處理。這個(gè)實(shí)驗(yàn)實(shí)際上包含3個(gè)處理因素,分別為運(yùn)動(dòng)與否(安靜、運(yùn)動(dòng))、代謝異常與否(是、否)、營養(yǎng)補(bǔ)劑劑量(無、低、高)。如果是析因?qū)嶒?yàn)設(shè)計(jì),研究中就缺少了其他4 種處理(安靜-代謝正常-營養(yǎng)補(bǔ)給低組、安靜-代謝正常-營養(yǎng)補(bǔ)給高組、運(yùn)動(dòng)-代謝正常-營養(yǎng)補(bǔ)給低組、運(yùn)動(dòng)-代謝正常-營養(yǎng)補(bǔ)給高組),存在對照不全的現(xiàn)象,這將導(dǎo)致實(shí)驗(yàn)中每一個(gè)因素的主效應(yīng)和因素間的交互效應(yīng)難以評價(jià)。
可見,對照不全的研究設(shè)計(jì)違背了實(shí)驗(yàn)設(shè)計(jì)的均衡原則。實(shí)驗(yàn)設(shè)計(jì)的均衡原則是指實(shí)驗(yàn)中某因素各個(gè)水平組中的受試對象所受到的非實(shí)驗(yàn)因素的影響是完全平衡的,即這些組之間的差別完全是由于該因素采取了不同水平所致,而并非其他因素取值不同所造成的影響[6]。如果違反了實(shí)驗(yàn)的均衡原則,就會(huì)出現(xiàn)自變量的混淆,必將導(dǎo)致研究結(jié)果的可比性變差。這提示我們在設(shè)置對照組時(shí),必須考慮對照的完整性問題,以保證要研究因素的主效應(yīng)和因素間的交互作用得以完全體現(xiàn)。
對照過剩是指實(shí)驗(yàn)中設(shè)置的對照組是多余的,在實(shí)驗(yàn)中并未真正起到對照作用。例如,某項(xiàng)研究選用若干只雄性SD 大鼠,隨機(jī)分為假手術(shù)-安靜組、假手術(shù)-運(yùn)動(dòng)組、帕金森-安靜組、帕金森-運(yùn)動(dòng)組,進(jìn)而探討運(yùn)動(dòng)對帕金森病的影響。然而,該研究設(shè)置的假手術(shù)-運(yùn)動(dòng)組的意義是什么?縱觀全文,并未在文章中體現(xiàn)其他三組和假手術(shù)-運(yùn)動(dòng)組比較的意義何在,即通過假手術(shù)-運(yùn)動(dòng)組要說明什么問題,似乎對解釋研究結(jié)果來說并沒有起到實(shí)際意義。另外,此類研究一般是先通過醫(yī)學(xué)造模,然后是采用一種運(yùn)動(dòng)干預(yù)手段來進(jìn)行實(shí)證干預(yù)。為了檢驗(yàn)造模的有效性,可以通過設(shè)置假手術(shù)組來進(jìn)行對照。但是,如果前人研究已經(jīng)開發(fā)了成熟的疾病模型,那么再設(shè)置假手術(shù)組就是多余的。這樣的實(shí)驗(yàn)一般也不符合動(dòng)物實(shí)驗(yàn)學(xué)的“3R”原則,即減少(Reduction)、替代(Replacement)和優(yōu)化(Refinement)原則,造成實(shí)驗(yàn)被試的浪費(fèi)[7]。
綜上,實(shí)驗(yàn)中的對照組需要針對具體研究問題來進(jìn)行設(shè)置。當(dāng)研究問題較為復(fù)雜時(shí),也可以將研究問題分解,通過系列研究來回答[8],進(jìn)而保證研究問題的針對性,實(shí)驗(yàn)對照設(shè)置的有效性。同時(shí),科學(xué)具有繼承性,研究者也需要在前人研究基礎(chǔ)上進(jìn)行更進(jìn)一步的、更高效的實(shí)驗(yàn)設(shè)計(jì)。
對照不當(dāng)是指在實(shí)驗(yàn)設(shè)計(jì)時(shí),對照組的設(shè)置與實(shí)施違背實(shí)驗(yàn)倫理或?qū)嶒?yàn)設(shè)計(jì)原則的現(xiàn)象。在體育科學(xué)實(shí)驗(yàn)中,對照不當(dāng)?shù)谋憩F(xiàn)主要包括空白對照設(shè)置不當(dāng)、因素內(nèi)部對照水平設(shè)置不當(dāng)、自身前后對照不當(dāng)、對照控制不嚴(yán)格等。
空白對照是指未施加任何實(shí)驗(yàn)處理的對照??瞻讓φ罩饕紤]自然、成熟等無關(guān)因素對實(shí)驗(yàn)結(jié)果造成的影響,這樣的對照在以往的科研中比較突出。但是越來越多的研究者發(fā)現(xiàn),空白對照在實(shí)際研究中可能存在問題,很多是無效對照,其原因主要有以下三點(diǎn):
第一,空白對照組與實(shí)驗(yàn)組的差別除了實(shí)驗(yàn)因素外,還有安慰劑效應(yīng)等無關(guān)變量沒有得到控制,這可能會(huì)導(dǎo)致自變量混淆。例如,某研究欲探討某一營養(yǎng)補(bǔ)劑對運(yùn)動(dòng)員機(jī)體狀況的影響,如果僅僅是空白對照,即不給予任何實(shí)驗(yàn)處理,那么此類實(shí)驗(yàn)就難以說明該營養(yǎng)補(bǔ)劑的真實(shí)效果,因?yàn)閷?shí)驗(yàn)中安慰劑效應(yīng)比較明顯。美國食品和藥品管理局曾指出,空白對照組只有在研究結(jié)果完全客觀且不受盲法影響時(shí)才合理[9]??梢姡匀豢茖W(xué)領(lǐng)域的實(shí)驗(yàn)。如,植物光照對葉綠素合成的影響,可以采用空白對照,即不暴露于光照條件。而人類實(shí)驗(yàn)中一般不設(shè)置空白對照組,而設(shè)置安慰劑對照組(placebo control)、積極對照組(positive control)或劑量對照組(dose-response control),動(dòng)物實(shí)驗(yàn)中一般需要設(shè)置假手術(shù)組等來替代空白對照組。
第二,空白對照在一些研究中,被認(rèn)為是不符合實(shí)驗(yàn)或研究倫理的。當(dāng)研究者知道研究參與者患有某種疾病,并存在一些有效治療措施時(shí),不給予任何治療是違背醫(yī)學(xué)倫理的[10]。例如,某研究想要探討某種營養(yǎng)或干預(yù)對運(yùn)動(dòng)員某種病癥發(fā)病次數(shù)的影響時(shí),將運(yùn)動(dòng)員隨機(jī)分為兩組:營養(yǎng)補(bǔ)劑補(bǔ)充組(或運(yùn)動(dòng)干預(yù)組)和空白對照組,然后觀察兩組運(yùn)動(dòng)員發(fā)病次數(shù)的差異。此類研究中的空白對照就是違背研究倫理的,需要避免。
第三,空白對照的意義不明確。與不接受某種處理相比,接受某種處理往往有太多的額外變量混雜其中,難以說明空白對照的確切意義??梢?,空白對照組因?yàn)槿狈γ鞔_的信息,在現(xiàn)實(shí)生活中的有效性和可推廣性也大打折扣[11]。例如,某研究欲探討太極拳鍛煉對老年人積極情緒的獨(dú)特影響,設(shè)置的對照組為空白對照組。那么,此類實(shí)驗(yàn)就難以揭示太極拳鍛煉對老年人積極情緒的獨(dú)特影響,因?yàn)樘珮O拳鍛煉與空白對照組之間,除了運(yùn)動(dòng)與否以外、甚至存在著呼吸、人際互動(dòng)、實(shí)驗(yàn)環(huán)境等因素混雜其中。
綜上,需要在以往空白對照的基礎(chǔ)上,進(jìn)一步考慮設(shè)置安慰劑對照組、積極對照組、劑量對照組等來完善實(shí)驗(yàn),下面將分別舉例闡釋。
第一,設(shè)置安慰劑對照組。安慰劑對照最初是指給予受試者外觀相同但不含藥物成分的治療,進(jìn)而控制安慰劑效應(yīng)[9]。不僅如此,采用安慰劑對照的實(shí)驗(yàn)往往會(huì)采用隨機(jī)雙盲的程序?qū)?shí)驗(yàn)過程進(jìn)行控制,這樣可以排除受試者的期望偏差、檢測偏差以及表現(xiàn)偏差等對實(shí)驗(yàn)效度的影響。
例如,孫華等[12]的研究為觀察蝦青素(astaxanthin,AST)對足球運(yùn)動(dòng)員冬訓(xùn)期血清炎癥因子的影響,將36 名足球運(yùn)動(dòng)員隨機(jī)分為對照組和蝦青素組。蝦青素組每天服用1 粒AST 膠囊(含6 mg AST),對照組每天服用1 粒安慰劑膠囊(含6 mg 氯化鈉),共服用49 天。結(jié)果發(fā)現(xiàn),AST 可有效抑制足球運(yùn)動(dòng)員冬訓(xùn)期血清促炎癥因子的釋放,提高血清炎癥抑制因子的水平,改善炎癥反應(yīng)過程。該研究通過設(shè)置安慰劑對照,揭示了蝦青素對足球運(yùn)動(dòng)員冬訓(xùn)期血清炎癥因子的影響。
不過,隨著醫(yī)學(xué)的不斷發(fā)展,傳統(tǒng)安慰劑對照組越來越被認(rèn)為不符合倫理。在研究設(shè)計(jì)時(shí),善行(beneficence)、公正(justice)與尊敬(respect for persons)是我們必須考慮的三個(gè)倫理道德原則[13]。善性原則提示,在研究設(shè)計(jì)時(shí)要不斷追問自己是否有其他方式在風(fēng)險(xiǎn)更低的情況下獲得相同的知識(shí);公正原則提示,需要注意我們的研究不應(yīng)該是社會(huì)中的一個(gè)群體承擔(dān)研究成本,而另一個(gè)群體從中獲益。尊敬原則提示,需要在實(shí)驗(yàn)中尊重研究參與者的自主性,并給予額外的保護(hù)。美國食品和藥品管理局也曾指出,出于道德原因,存在有效的治療時(shí),不建議僅使用安慰劑對照組[14]。因此,尋找積極對照(positive control),或者與傳統(tǒng)的標(biāo)準(zhǔn)方法進(jìn)行對照,是現(xiàn)在臨床醫(yī)學(xué)研究設(shè)計(jì)的主要方向之一,也將是體育科學(xué)領(lǐng)域?qū)嶒?yàn)設(shè)計(jì)的重要發(fā)展方向。
第二,設(shè)置積極對照組。積極對照組設(shè)計(jì)比安慰劑對照具有更少的倫理困境,特別是當(dāng)預(yù)期新治療至少與現(xiàn)有治療方法一樣好時(shí)。積極對照組是指在空白對照或安慰劑對照的基礎(chǔ)上,結(jié)合現(xiàn)有倫理要求,在對照組身上實(shí)施具有一定干預(yù)效果的措施作為對照。因此,使用積極對照組時(shí),需要關(guān)注臨床科研上重要的結(jié)果,并由此作為積極對照組,進(jìn)而探討新治療方式、新方案的可能效果。當(dāng)新治療方案顯示出優(yōu)于常規(guī)方法的優(yōu)勢時(shí),固然更好。不過,當(dāng)使用積極對照試驗(yàn)證明新治療方案與傳統(tǒng)標(biāo)準(zhǔn)方案相比具有非劣效性時(shí),該研究也具有十分重要的意義,這樣可以為某種治療提供一種新的療法參考。
可見,基于已知可行的標(biāo)準(zhǔn)治療作為積極對照組是避免空白對照產(chǎn)生實(shí)驗(yàn)和倫理問題的有效對策。例如,高艷敏等[15]的研究探討了高強(qiáng)度間歇訓(xùn)練和中等強(qiáng)度有氧運(yùn)動(dòng)對肥胖青年身體形態(tài)、血脂及肥胖性慢性炎癥的影響。該研究將34 名肥胖青年隨機(jī)分為高強(qiáng)度間歇訓(xùn)練組(n=17)和中等強(qiáng)度有氧持續(xù)訓(xùn)練組(n=17),分別進(jìn)行12 周的運(yùn)動(dòng)干預(yù)。結(jié)果發(fā)現(xiàn),與中等強(qiáng)度持續(xù)有氧訓(xùn)練減肥效果相比,高強(qiáng)度間歇訓(xùn)練并沒有體現(xiàn)更好的效果,但是高強(qiáng)度間歇訓(xùn)練對于改善肥胖青年的健康水平具有積極影響,不失為一項(xiàng)有效的運(yùn)動(dòng)干預(yù)方式,尤其是在時(shí)間成本上可能更經(jīng)濟(jì)??梢?,通過設(shè)置積極對照組,進(jìn)而在已有運(yùn)動(dòng)干預(yù)、營養(yǎng)補(bǔ)給等基礎(chǔ)上,探討新方法、新方案的有效性,也將是未來體育科學(xué)研究領(lǐng)域具有潛力的研究方向。
第三,開展劑量對照實(shí)驗(yàn)。劑量對照實(shí)驗(yàn)是指以不同劑量作為相互對照來討論自變量對因變量影響的劑量效應(yīng)。劑量效應(yīng)研究是科學(xué)研究走向精細(xì)化的表現(xiàn)。隨著研究的不斷深入,人們越來越不滿足于定性實(shí)驗(yàn)結(jié)果帶來的證據(jù),如運(yùn)動(dòng)是否有效,而是關(guān)注定量實(shí)驗(yàn)的結(jié)果,例如鍛煉劑量對認(rèn)知效益的影響、不同劑量刺激對運(yùn)動(dòng)康復(fù)效果的影響等。同時(shí),在循證醫(yī)學(xué)領(lǐng)域,劑量效應(yīng)研究的證據(jù)級別也往往會(huì)更高[16]。如前文提到的某研究欲探討太極拳鍛煉對老年人積極情緒的獨(dú)特影響,可以在空白對照的基礎(chǔ)上,將實(shí)驗(yàn)設(shè)計(jì)成劑量對照實(shí)驗(yàn)。例如,將研究參與者隨機(jī)分為每周鍛煉1次、每周鍛煉3次、每周鍛煉5次三組,然后比較太極拳鍛煉劑量對老年人積極情緒的影響。再如,李方暉等[17]的研究將16名健康大學(xué)生分為低水平激光療法(LLLT)劑量0.06 J·cm-2、0.18 J·cm-2、0.3 J·cm-2和安慰劑4 個(gè)組進(jìn)行隨機(jī)、雙盲、安慰劑對照交叉試驗(yàn),進(jìn)而檢驗(yàn)了低水平激光療法(LLLT)對力竭性運(yùn)動(dòng)疲勞后恢復(fù)的劑量效應(yīng)。此類實(shí)驗(yàn),盡管不同劑量之間可能沒有差異,因此在探討藥物或刺激是否有效時(shí),不如安慰劑對照組更具效率,但是其可以提供更好的劑量反應(yīng)信息,尤其是當(dāng)某藥物或刺激存在負(fù)面效應(yīng)時(shí),更具現(xiàn)實(shí)意義,例如,其可以探討鍛煉的最佳劑量區(qū)間,進(jìn)而控制過度鍛煉的負(fù)面作用。
因素內(nèi)部對照水平的設(shè)置應(yīng)該滿足可比性原則。所謂可比性,是指對照組與實(shí)驗(yàn)組之間除了要比較的因素外,其他的條件應(yīng)該一致。即,研究者在設(shè)置因素內(nèi)部對照時(shí),應(yīng)該將因素內(nèi)部多個(gè)水平的比較限定在唯一變化條件下。如果在因素內(nèi)部多水平進(jìn)行比較時(shí),比較的條件多余一個(gè),必然導(dǎo)致實(shí)驗(yàn)的可比性下降。例如,有研究使用單因素實(shí)驗(yàn)設(shè)計(jì)替代析因?qū)嶒?yàn)設(shè)計(jì),導(dǎo)致單因素內(nèi)的多個(gè)水平間對照不當(dāng)。原本是2(運(yùn)動(dòng)與否)×2(治療與否)的析因?qū)嶒?yàn)設(shè)計(jì),如果設(shè)計(jì)成單因素4水平(運(yùn)動(dòng)+治療、運(yùn)動(dòng)+不治療、不運(yùn)動(dòng)+治療、不運(yùn)動(dòng)+不治療)的設(shè)計(jì),將會(huì)導(dǎo)致4個(gè)水平間的可比性下降。尤其是當(dāng)運(yùn)動(dòng)+治療組效果優(yōu)于不運(yùn)動(dòng)+不治療組時(shí),難以解釋是運(yùn)動(dòng)這一因素起的作用,還是治療起的作用,抑或是運(yùn)動(dòng)和治療的聯(lián)合效果。因此,從實(shí)驗(yàn)可比性角度建議此類研究采用析因?qū)嶒?yàn)設(shè)計(jì),這樣既能增加研究的可比性、有效性,也能分析各個(gè)因素的主效應(yīng)以及因素間的交互作用,進(jìn)而提高實(shí)驗(yàn)設(shè)計(jì)的效率。
自身前后對照不當(dāng)?shù)睦又饕w現(xiàn)在實(shí)驗(yàn)組對照組前后測的實(shí)驗(yàn)設(shè)計(jì)中。此類實(shí)驗(yàn)設(shè)計(jì)存在著實(shí)驗(yàn)組與對照組,同時(shí)又存在實(shí)驗(yàn)前后的測試。依據(jù)實(shí)驗(yàn)?zāi)康?,?shí)驗(yàn)的前測主要是用于實(shí)驗(yàn)控制,控制實(shí)驗(yàn)組對照組起點(diǎn)的差異,而不是對照。而實(shí)驗(yàn)組、對照組干預(yù)后成績的比較才是重點(diǎn)。遺憾的是,很多研究將實(shí)驗(yàn)組前后測、對照組前后測進(jìn)行比較,然后來看兩組前后測差異是否顯著,如果實(shí)驗(yàn)組前后測成績差異顯著而對照組前后測成績差異不顯著,就得出實(shí)驗(yàn)組優(yōu)于對照組的結(jié)論。例如,某研究欲觀察健身氣功對帕金森病患者心理健康的影響,將若干名中度帕金森病患者隨機(jī)分為健身氣功鍛煉組和對照組。結(jié)果通過對健身氣功鍛煉組前后測分?jǐn)?shù)的比較存在顯著改善,而對照組前后測得分差異不顯著來獲得健身氣功對帕金森病患者心理健康具有影響的結(jié)論。
依據(jù)實(shí)驗(yàn)組前后測成績差異顯著,對照組前后測成績差異不顯著,來判斷實(shí)驗(yàn)干預(yù)有效的做法是不合理的。這至少有兩個(gè)理由:第一,實(shí)驗(yàn)組前后測成績比較、對照組前后測成績比較需要進(jìn)行兩次統(tǒng)計(jì)檢驗(yàn),統(tǒng)計(jì)檢驗(yàn)次數(shù)越多,犯Ⅰ型統(tǒng)計(jì)錯(cuò)誤的可能性就增加,獲得假陽性結(jié)果的可能性增加;第二,如果對照組前后測成績存在差異時(shí),導(dǎo)致結(jié)果無法解釋。
因此,此類研究應(yīng)該考慮將前測成績作為基礎(chǔ)參照,并進(jìn)行統(tǒng)計(jì)控制(如看作協(xié)變量),然后比較實(shí)驗(yàn)組后測與對照組后測成績的差異(進(jìn)行協(xié)方差分析),進(jìn)而評估實(shí)驗(yàn)干預(yù)的效果。此外,如果前后測分?jǐn)?shù)變化具有一定的實(shí)際意義,亦可以采用獨(dú)立樣本T 檢驗(yàn)對誤差調(diào)整后的前后測分?jǐn)?shù)的差值進(jìn)行統(tǒng)計(jì)檢驗(yàn)。
對照控制的嚴(yán)格性主要考慮的問題是對照組與實(shí)驗(yàn)組在實(shí)驗(yàn)因素以外,其他可能影響實(shí)驗(yàn)結(jié)果的額外因素(如實(shí)驗(yàn)表現(xiàn)、檢測偏差等)是否得到了較好的控制。設(shè)置對照組的一個(gè)最基本原則便是需要滿足可比性這一原則。實(shí)驗(yàn)研究中,常用隨機(jī)法、盲法等進(jìn)行額外變量控制以保證實(shí)驗(yàn)的可比性[18]。
然而,體育科學(xué)領(lǐng)域一些實(shí)驗(yàn)研究盡管設(shè)置了對照組,但是被試是否是隨機(jī)分配到實(shí)驗(yàn)條件或?qū)φ諚l件、是否進(jìn)行了盲法控制以及實(shí)驗(yàn)因素以外其他因素是如何進(jìn)行控制的等考慮不夠,這將影響實(shí)驗(yàn)對照的有效性。例如,某研究欲探討八式太極拳運(yùn)動(dòng)對原發(fā)性高血壓患者血壓水平、血管內(nèi)皮功能及生活質(zhì)量的影響。該研究選取經(jīng)某醫(yī)院確診的84 例原發(fā)性高血壓患者,按照隨機(jī)數(shù)字表法分成觀察組與對照組,每組42 例。對照組患者根據(jù)平時(shí)運(yùn)動(dòng)習(xí)慣進(jìn)行慢跑、快走等有氧運(yùn)動(dòng)鍛煉,觀察組患者則在對照組的基礎(chǔ)上予以八式太極拳運(yùn)動(dòng)干預(yù),干預(yù)時(shí)間均為3 個(gè)月。作者在文中詳細(xì)交代了太極拳組是如何進(jìn)行干預(yù)的,然而對照組是如何控制的不得而知。這就可能導(dǎo)致對照組設(shè)置的有效性受到質(zhì)疑。
再如,某研究將學(xué)生分為內(nèi)部表象組、外部表象組、內(nèi)部表象加外部表象組、對照組四組,并進(jìn)行32學(xué)時(shí)的體育教學(xué),以探討不同教學(xué)方法的效果。那么,在結(jié)果評定時(shí),就應(yīng)該對評定者進(jìn)行設(shè)盲,采用盲法來控制學(xué)習(xí)效果評估的偏差。盲法的使用主要是避免實(shí)驗(yàn)中可能出現(xiàn)的表現(xiàn)偏差[19]和檢測偏差[20]。有研究發(fā)現(xiàn),不使用雙盲控制的實(shí)驗(yàn)比使用雙盲控制的實(shí)驗(yàn)更可能會(huì)夸大臨床效果[19,21]。關(guān)于盲法的設(shè)置,可以參考劉建平等的論文[21]。
綜上,建議研究者在進(jìn)行實(shí)驗(yàn)設(shè)計(jì)時(shí),除了選擇好對照條件外,還要控制好對照條件的實(shí)施過程。例如,隨機(jī)抽樣、隨機(jī)分組、隨機(jī)基礎(chǔ)上的匹配分組以及盲法的使用等,進(jìn)而保證實(shí)驗(yàn)設(shè)計(jì)的有效性和可比性。
實(shí)驗(yàn)法作為解釋變量間因果關(guān)系的最重要方法,其嚴(yán)謹(jǐn)性直接影響實(shí)驗(yàn)效度。而對照條件的設(shè)置是影響實(shí)驗(yàn)內(nèi)部效度的重要因素。基于實(shí)驗(yàn)內(nèi)部效度可能受到威脅的角度,設(shè)置合適的對照組,是體育科學(xué)實(shí)驗(yàn)為實(shí)踐提供循證基礎(chǔ)的重要保證。因此,從課題申請到論文發(fā)表的一系列過程中,研究者都必須去審視對照條件設(shè)計(jì)的有效性如何?Kinser 和Robins[14]曾提出設(shè)置對照組時(shí)需要考慮的4 個(gè)問題,即研究設(shè)計(jì)是否與研究問題匹配?對照組的操控是否可以解決實(shí)驗(yàn)表現(xiàn)、期望和檢測偏差?對照組是否具有倫理可接受性、可行性和吸引力?對照組是否控制了實(shí)驗(yàn)干預(yù)的非特定方面效應(yīng)?據(jù)此,建議體育科學(xué)研究者在實(shí)驗(yàn)設(shè)計(jì)時(shí)需要考慮如下問題:
第一,實(shí)驗(yàn)設(shè)計(jì)中使用的對照組能否幫助我們回答研究問題?此時(shí),研究者需要進(jìn)一步明確實(shí)驗(yàn)要解決的問題,并深入剖析實(shí)驗(yàn)的內(nèi)部效度可能受到的威脅,進(jìn)而檢查設(shè)置的對照條件是否有效。
第二,對照組是如何操控的,整個(gè)過程是否可以控制表現(xiàn)、檢測等偏差。是否采用了隨機(jī)原則來選擇和分配被試,是否使用盲法進(jìn)行實(shí)驗(yàn)控制等,需要在實(shí)驗(yàn)過程控制中給出明確描述。
第三,對照組的設(shè)置是否符合倫理,現(xiàn)實(shí)中是否可行?此時(shí),需要重點(diǎn)考慮倫理要求和現(xiàn)實(shí)可行性,盡可能使用積極對照和劑量對照組。
第四,對照組是否可以控制實(shí)驗(yàn)因素之外的影響因素,如自限性、干預(yù)環(huán)境、干預(yù)持續(xù)時(shí)間、干預(yù)劑量等,以及為何能夠控制非特定因素對研究結(jié)果的影響。