溫忠麟范息濤葉寶娟陳宇帥
(1華南師范大學(xué)心理應(yīng)用研究中心/心理學(xué)院,廣州 510631)(2澳門(mén)大學(xué),澳門(mén))(3江西師范大學(xué)心理學(xué)院,南昌 330022)
國(guó)際上對(duì)心理學(xué)和其他社科領(lǐng)域的方法研究有重要影響的期刊Psychological Methods(2014年影響因子7.34)發(fā)表了Preacher和Kelley(2011)的論文討論中介效應(yīng)量,經(jīng)過(guò)一番評(píng)長(zhǎng)論短,對(duì)當(dāng)時(shí)已有的中介效應(yīng)量都有不滿,最終推薦的是他們新提出的κ作為中介效應(yīng)量。從此κ在國(guó)際上流行開(kāi)來(lái),不僅有論著介紹(Athay,2012;方杰,張敏強(qiáng),邱皓政,2012;Field,2013),而且有許多實(shí)際應(yīng)用(例如,Koletzko,Herrmann,&Brandst?tter,2015;Labelle,Lawlor-Savage,Campbell,Faris,&Carlson,2015;Rivera&Fincham,2015),在互聯(lián)網(wǎng)上也有κ的計(jì)算器(如http://stats.myresearchsurvey.com/kappasquared/),很方便使用。然而,Wen和Fan(2015)通過(guò)邏輯判斷和數(shù)學(xué)推演,證明了κ不僅計(jì)算錯(cuò)誤,而且從定義開(kāi)始就有問(wèn)題。他們的研究結(jié)果終結(jié)了κ作為中介效應(yīng)量的合法性。κ的問(wèn)題出在哪里、又是如何被發(fā)現(xiàn)的?這要從效應(yīng)量的作用和性質(zhì)尋找答案。本文首先介紹效應(yīng)量的相關(guān)知識(shí),如何根據(jù)統(tǒng)計(jì)顯著性和效應(yīng)量作出統(tǒng)計(jì)結(jié)論;接著討論效應(yīng)量應(yīng)當(dāng)具有哪些基本性質(zhì);然后根據(jù)這些性質(zhì)檢視包括κ在內(nèi)的主要中介效應(yīng)量的合理性;最后,討論了如何報(bào)告中介效應(yīng)量以及有待研究的問(wèn)題。
H
)的信心(溫忠麟,吳艷,2010)。不過(guò),單單一個(gè)“顯著性”的結(jié)果,所得結(jié)論是很弱的。以通常的兩組差異檢驗(yàn)為例,差異顯著說(shuō)明“差異在統(tǒng)計(jì)上可以分辨出來(lái)”,但并沒(méi)有指出差異有多大(溫忠麟,侯杰泰,2008)。再以相關(guān)分析為例,相關(guān)顯著說(shuō)明“相關(guān)系數(shù)不是零”,但并沒(méi)有指出相關(guān)有多高。這就不難理解,諸如檢驗(yàn)測(cè)驗(yàn)信度系數(shù)(如重測(cè)信度)的顯著性那樣的統(tǒng)計(jì)分析是沒(méi)有意義的,因?yàn)槿藗兏信d趣的是“信度有多高”,而不是“信度是否為零”。為了彌補(bǔ)顯著性檢驗(yàn)的不足,在統(tǒng)計(jì)分析結(jié)果中報(bào)告效應(yīng)量(effect size)受到重視(Fan&Konold,2010;Thompson,2007;Wilkinson,1999),不僅多數(shù)國(guó)際期刊要求報(bào)告效應(yīng)量,國(guó)內(nèi)不少重要期刊也要求報(bào)告效應(yīng)量。
研究者不滿足于效應(yīng)顯著與否,還想知道效應(yīng)有多大。每種統(tǒng)計(jì)分析都會(huì)有一個(gè)或多個(gè)我們感興趣的量,稱為效應(yīng)。例如,通常的兩組差異分析,效應(yīng)是兩組均值差異;在一元回歸分析中,效應(yīng)是回歸系數(shù),反映了當(dāng)自變量變化一個(gè)單位時(shí),因變量變化了多少個(gè)單位;方差分析中,感興趣的效應(yīng)可能包括因素的主效應(yīng)和交互效應(yīng),通常由效應(yīng)平方和來(lái)衡量。
任何一個(gè)效應(yīng)本身就是一個(gè)數(shù)量,如果涉及的變量有公認(rèn)的量尺和測(cè)量單位,如長(zhǎng)度測(cè)量使用米尺、抽煙數(shù)量以每天抽煙支數(shù)計(jì)算,則效應(yīng)本身就是現(xiàn)成的效應(yīng)量。例如,“男女身高均值差異為0.1米”、“男員工比女員工平均每天多抽2.5支煙”,意義就相當(dāng)明確,同類的不同研究之間也有可比性。而且,這個(gè)基于原始測(cè)量單位的效應(yīng)量與其他變換后的各種效應(yīng)量相比,不僅簡(jiǎn)單,而且更加容易理解。
在物理測(cè)量中,通常都有公認(rèn)的測(cè)量單位,就算測(cè)量單位不同,也可以彼此等值轉(zhuǎn)換(如1米 =100厘米)。然而,心理測(cè)量通常不像物理測(cè)量那樣有通行世界的公制單位,不同的測(cè)量之間也難以等值轉(zhuǎn)換。因?yàn)椴煌难芯靠赡苁褂貌煌牧勘?有不同的測(cè)量單位,所以基于原始測(cè)量單位的效應(yīng)缺少可比性。例如,研究一項(xiàng)英語(yǔ)培訓(xùn)方法的效果,有研究者用雅思(IELTS)測(cè)試成績(jī),發(fā)現(xiàn)培訓(xùn)后平均增加了1.2分;另有研究者用托福(TOEFL)測(cè)試成績(jī),發(fā)現(xiàn)培訓(xùn)后平均增加了9.5分。這時(shí),既不知道IELTS提高1.2分或者TOEFL提高9.5分算是效應(yīng)高還是低,也不知道兩個(gè)研究者的培訓(xùn)效應(yīng)誰(shuí)的較高。這時(shí),需要一種與測(cè)量單位無(wú)關(guān)(scale-free)的指標(biāo)——效應(yīng)量,來(lái)衡量效應(yīng)的大小。
這里我們回顧一下常見(jiàn)統(tǒng)計(jì)方法的效應(yīng)量,方便后面引用。在兩組差異分析中,最常用的效應(yīng)量是Cohen(1988,p.67)的d:
在一元回歸分析中,最常用的效應(yīng)量是復(fù)相關(guān)系數(shù)平方(squared multiple correlation coefficient)R(Cohen,Cohen,West,&Aiken,2003):
在方差分析(ANOVA)中,最常用的效應(yīng)量是η(Cohen,1973;Olejnik&Algina,2000):
其中SS是感興趣的效應(yīng)平方和,SS是總平方和。
給定顯著性水平(通常是0.05),對(duì)一個(gè)效應(yīng)檢驗(yàn)結(jié)果要么顯著,要么不顯著。先看效應(yīng)不顯著的情形:
(1)如果效應(yīng)量小,說(shuō)明效應(yīng)既無(wú)統(tǒng)計(jì)意義也無(wú)實(shí)際意義,通常都可以認(rèn)為效應(yīng)不存在。
(2)如果效應(yīng)量達(dá)中上大小,需要看檢驗(yàn)力高低,如果檢驗(yàn)力高,可以認(rèn)為效應(yīng)是由抽樣誤差引起;否則還不能下結(jié)論,應(yīng)當(dāng)增加被試提高檢驗(yàn)力,重新做統(tǒng)計(jì)分析。一般地說(shuō),對(duì)于中等以上的效應(yīng)量,只要樣本容量足夠大(因而檢驗(yàn)力足夠高),效應(yīng)都會(huì)顯著。
再看效應(yīng)顯著的情形:
(1)如果效應(yīng)量小,除非有理由說(shuō)明小的效應(yīng)量也會(huì)引起嚴(yán)重后果,否則通常都認(rèn)為沒(méi)有實(shí)際意義。就是說(shuō),效應(yīng)量小的時(shí)候,顯著也沒(méi)有實(shí)際意義。
(2)如果效應(yīng)量達(dá)中上大小,已經(jīng)有理?yè)?jù)做出結(jié)論,效應(yīng)在統(tǒng)計(jì)上和實(shí)際上都有意義。
效應(yīng)量多大算小、中或大,要看具體的效應(yīng)量是什么,在不同的研究領(lǐng)域通常會(huì)有約定俗成的大致標(biāo)準(zhǔn)。例如Cohen(1969)提出,d=0.2、d=0.5和d=0.8分別對(duì)應(yīng)于小、中、大的效應(yīng)量,是心理學(xué)科很多人引用的標(biāo)準(zhǔn)。不同研究可能考慮的效應(yīng)量可參考鄭昊敏、溫忠麟和吳艷(2011)的文章。有關(guān)檢驗(yàn)力與效應(yīng)量、樣本容量的關(guān)系,可參考吳艷和溫忠麟(2011)的文章。
表1總結(jié)了如何根據(jù)檢驗(yàn)的統(tǒng)計(jì)顯著性與效應(yīng)量得出統(tǒng)計(jì)結(jié)論。不論檢驗(yàn)結(jié)果是否顯著,計(jì)算和報(bào)告效應(yīng)量總是需要的,結(jié)合顯著性和效應(yīng)量才能得到適當(dāng)?shù)慕y(tǒng)計(jì)結(jié)論。但并不是任何時(shí)候都要考慮檢驗(yàn)力。當(dāng)檢驗(yàn)結(jié)果是顯著時(shí),不用考慮檢驗(yàn)力高 低,因?yàn)榇藭r(shí)可能犯的錯(cuò)誤是第一類錯(cuò)誤。只有當(dāng)檢驗(yàn)結(jié)果是不顯著時(shí),才需要考慮檢驗(yàn)力(相當(dāng)于報(bào)告第二類錯(cuò)誤率)。不過(guò),如果效應(yīng)量小,通常都沒(méi)有必要看檢驗(yàn)力高低,可以直接作出沒(méi)有效應(yīng)的結(jié)論;如果效應(yīng)量中上,檢驗(yàn)不顯著會(huì)令人懷疑是檢驗(yàn)力不夠高所致,文章投稿難以被接受,此時(shí)適當(dāng)增加樣本容量,通常都會(huì)得到顯著結(jié)果。所以,雖然研究者需要有檢驗(yàn)力的概念,知道增加樣本容量是提高檢驗(yàn)力的途徑,但是可以說(shuō)在文章中是不必報(bào)告檢驗(yàn)力的。
表1 根據(jù)統(tǒng)計(jì)顯著性和效應(yīng)量作出統(tǒng)計(jì)結(jié)論
一個(gè)統(tǒng)計(jì)量應(yīng)當(dāng)具有哪些性質(zhì)才能成為一個(gè)效應(yīng)量呢?目前似乎未見(jiàn)有文獻(xiàn)做專門(mén)的討論,盡管Kelley和Preacher(2012)在極其寬泛的效應(yīng)量定義下,提到了好的效應(yīng)量應(yīng)當(dāng)有的性質(zhì)(也見(jiàn)Preacher&Kelley,2011)。他們說(shuō)的性質(zhì)是針對(duì)一個(gè)效應(yīng)量好不好而言,而本文說(shuō)的效應(yīng)量應(yīng)當(dāng)有的性質(zhì),是針對(duì)一個(gè)統(tǒng)計(jì)量能不能作為效應(yīng)量而言。這里我們嘗試從引入效應(yīng)量的動(dòng)機(jī)和效應(yīng)量的作用思考效應(yīng)量應(yīng)當(dāng)有的性質(zhì)。
在基于原始測(cè)量單位的效應(yīng)之外,還要引入效應(yīng)量的一個(gè)動(dòng)機(jī)是避免測(cè)量單位的影響,所以,“與測(cè)量單位無(wú)關(guān)”應(yīng)當(dāng)是效應(yīng)量的重要性質(zhì),缺少這個(gè)性質(zhì)的效應(yīng)量就算被定義出來(lái),遲早會(huì)被別的有這個(gè)性質(zhì)的效應(yīng)量取代。
怎樣知道一個(gè)效應(yīng)量與測(cè)量單位無(wú)關(guān)呢?如果一個(gè)效應(yīng)量用原始分?jǐn)?shù)和Z分?jǐn)?shù)(與測(cè)量單位無(wú)關(guān))計(jì)算結(jié)果相同,那么這個(gè)效應(yīng)量就與測(cè)量單位無(wú)關(guān)。有兩種做法都可以產(chǎn)生與測(cè)量單位無(wú)關(guān)的效應(yīng)量,一種做法是對(duì)效應(yīng)進(jìn)行標(biāo)準(zhǔn)化,Cohen的d
屬于這一種。另一種做法是將效應(yīng)量定義為一種比例,回歸分析和方差分析中的效應(yīng)量屬于這一種。效應(yīng)量是用來(lái)衡量效應(yīng)的大小的,如果保持其他條件不變,效應(yīng)(絕對(duì)值)越大,效應(yīng)量(絕對(duì)值)也應(yīng)當(dāng)越大。就是說(shuō),相對(duì)于效應(yīng)而言,效應(yīng)量應(yīng)當(dāng)具有單調(diào)性(monotonicity)。缺乏了這個(gè)性質(zhì)的效應(yīng)量會(huì)難以理解,也不符合邏輯。所以單調(diào)性是一個(gè)效應(yīng)量應(yīng)當(dāng)有的性質(zhì)。
如何判斷一個(gè)效應(yīng)量具有單調(diào)性呢?如果一個(gè)效應(yīng)量與效應(yīng)(研究者感興趣的量)成正比,那么該效應(yīng)量有單調(diào)性。一般地,如果一個(gè)效應(yīng)量(絕對(duì)值)是效應(yīng)(絕對(duì)值)的單調(diào)上升函數(shù),那么該效應(yīng)量有單調(diào)性,下面看幾個(gè)例子(Wen&Fan,2015)。
s
和s
保持不變時(shí),由公式(3)可知,R
是|b
|(b
與–b
效應(yīng)相同,方向相反)的單調(diào)上升函數(shù),所以,效應(yīng)量R
有單調(diào)性。在方差分析中,當(dāng)總平方和SS
保持不變時(shí),由公式(4)可知η顯然與SS
成正比,所以η有單調(diào)性。t
檢驗(yàn)統(tǒng)計(jì)量為t
統(tǒng)計(jì)量受到樣本容量的影響。為了容易理解,看看n
=n
=n
的特殊情形,此時(shí)t
會(huì)系統(tǒng)地變大,只要被試人數(shù)足夠多,很小的差異都會(huì)得到顯著性結(jié)果,這是很多讀者都知道的事實(shí)。因此,t
不能作為效應(yīng)量,這是在有了與測(cè)量單位無(wú)關(guān)的t
值后,還要定義和報(bào)告效應(yīng)量的原因。怎么知道一個(gè)效應(yīng)量不受樣本容量的影響呢?以d
為例,一方面是通過(guò)統(tǒng)計(jì)知識(shí)可以推理出來(lái),因?yàn)橛晒?1)可知,分子是兩組均值之差,分母是總體的混合標(biāo)準(zhǔn)差的估計(jì),都不受樣本容量的影響。另一方面是大量的經(jīng)驗(yàn)可以知道,d
不像t
那樣會(huì)隨著樣本的增加而系統(tǒng)地變大。在回歸分析中,R
作為相關(guān)系數(shù)的平方,不受樣本容量的影響。在方差分析中,η可以由統(tǒng)計(jì)量F
轉(zhuǎn)換得到(Cohen,1965):k
是組數(shù),n
是各組被試總和,F
的自由度是(k
–1,n
–k
)。大量經(jīng)驗(yàn)告訴我們,η不受樣本容量的影響。R
和方差分析中的η都有非負(fù)性、有界性和正規(guī)性,但差異分析中的效應(yīng)量d
有可能是負(fù)值、也可能無(wú)界、更沒(méi)有正規(guī)性??紤]到非負(fù)的效應(yīng)量容易理解,在不考慮效應(yīng)的方向或者將方向另外考慮后,總可以將效應(yīng)量定義為非負(fù)值,一個(gè)簡(jiǎn)單的方法是只考慮效應(yīng)量的絕對(duì)值,這也是通常默認(rèn)的做法,例如Cohen(1969)提出,d
=0.2、d
=0.5和d=
0.8分別對(duì)應(yīng)于小、中、大的效應(yīng)量,顯然只是考慮絕對(duì)值。只要一個(gè)效應(yīng)量有有界性,總可以通過(guò)一個(gè)線性變換將其變到[0,1]上,成為有規(guī)范性的效應(yīng)量。但效應(yīng)量d
做不到這一點(diǎn),因?yàn)樗菬o(wú)界的。X
對(duì)因變量Y
的影響,如果X
通過(guò)影響變量M
而對(duì)Y
產(chǎn)生影響,則稱M
為中介變量(Baron&Kenny,1986;Judd&Kenny,1981;溫忠麟,葉寶娟,2014)。為了簡(jiǎn)便起見(jiàn),假設(shè)所有變量都已經(jīng)中心化(均值為0)或者標(biāo)準(zhǔn)化(均值為0,標(biāo)準(zhǔn)差為1),可用下列回歸方程來(lái)描述變量之間的關(guān)系(圖1是相應(yīng)的路徑圖):c
為自變量X
對(duì)因變量Y
的總效應(yīng);方程(10)的系數(shù)a
為自變量X
對(duì)中介變量M
的效應(yīng);方程(11)的系數(shù)b
是在控制了自變量X
的影響后,中介變量M
對(duì)因變量Y
的效應(yīng);系數(shù)c
¢是在控制了中介變量M
的影響后,自變量X
對(duì)因變量Y
的直接效應(yīng);e
~e
是回歸殘差。對(duì)于這樣的簡(jiǎn)單中介模型,中介效應(yīng)等于間接效應(yīng)(indirect effect),即等于系數(shù)乘積ab
,它與總效應(yīng)和直接效應(yīng)有下面關(guān)系(MacKinnon,Warsi,&Dwyer,1995):圖1 中介模型示意圖
ab
。最常用的中介效應(yīng)量是間接效應(yīng)占總效應(yīng)的比例(Alwin&Hauser,1975;MacKinnon,2008;MacKinnon&Dwyer,1993;Preacher&Kelley,2011):P
與測(cè)量單位無(wú)關(guān)。因?yàn)?p>P只涉及回歸系數(shù),所以不會(huì)受到樣本容量的影響。如果只考慮絕對(duì)值,當(dāng)總效應(yīng)c
固定時(shí),P
與ab
成正比,因而有單調(diào)性。傳統(tǒng)中介模型中,間接效應(yīng)ab
與直接效應(yīng)c
¢有相同的符號(hào)(即所謂的一致中介模型,consistent mediation model),因而都與總效應(yīng)有相同的符號(hào),此時(shí)P
不僅有界,還是正規(guī)的,取值在[0,1]上。對(duì)于不一致中介模型(inconsistent mediation model,MacKinnon,Krull,&Lockwood,2000),間接效應(yīng)ab
與直接效應(yīng)c
¢有相反的符號(hào),此時(shí)P
雖然還是有單調(diào)性,但是無(wú)界的(Preacher&Kelley,2011)。順便說(shuō)明一下,有文獻(xiàn)將一致中介模型稱為互補(bǔ)中介模型(complementary mediation),而將不一致中介模型稱為競(jìng)爭(zhēng)中介模型(competitive mediation models,Zhao,Lynch,&Chen 2010)。P
一樣的是,R
也與測(cè)量單位無(wú)關(guān),而且不會(huì)受到樣本容量的影響。不同的是,R
只對(duì)傳統(tǒng)中介模型有單調(diào)性。在傳統(tǒng)中介模型中,不妨假設(shè)所有系數(shù)都是非負(fù)的,當(dāng)總效應(yīng)固定時(shí),由c
=ab
+c
¢可知,隨著ab
的上升,c
¢下降,因而R
是ab
的單調(diào)上升函數(shù)。但對(duì)于不一致中介模型,R
沒(méi)有單調(diào)性。例如,假設(shè)給定c
=0.3,當(dāng)ab
分別等于–0.2,0.4和0.6時(shí),對(duì)應(yīng)的c
¢分別等于0.5,–0.1和–0.3, 結(jié)果是R
分別為–0.4,–4,–2。所以當(dāng)總效應(yīng)固定時(shí)(c
=0.3),無(wú)論是R
還是其絕對(duì)值,都不是ab
的單調(diào)函數(shù)(Wen&Fan,2015)。不難看出,無(wú)論是傳統(tǒng)的中介模型還是不一致中介模型,R
都是無(wú)界的。M
)和結(jié)果變量(Y
)的變異解釋率。但這個(gè)指標(biāo)相當(dāng)復(fù)雜,他們最后并未推薦,而是建議作為補(bǔ)充指標(biāo)使用。另一個(gè)是κ,定義為間接效應(yīng)與間接效應(yīng)的最大可能值之比:m
(ab
)是在給定總效應(yīng)c
后,在X
、M
和Y
的相關(guān)矩陣是非負(fù)定的條件下,間接效應(yīng)ab
的最大值。κ是他們最終推薦使用的中介效應(yīng)量,具有如下性質(zhì):(i)非負(fù),(ii)取值在[0,1]上,(iii)與測(cè)量單位無(wú)關(guān),(iv)可以構(gòu)造bootstrap置信區(qū)間,(v)不受樣本容量的影響(Preacher&Kelley,2011)。細(xì)心的讀者或許已經(jīng)注意到,上面列出的κ的多個(gè)性質(zhì)中,缺少了重要的單調(diào)性。Wen和Fan(2015)正是通過(guò)考察κ的單調(diào)性發(fā)現(xiàn)它有問(wèn)題。為了展示κ沒(méi)有單調(diào)性,他們使用兩個(gè)數(shù)據(jù)例子。
在第一個(gè)例子中,固定總效應(yīng)為c
=0.190,a
=0.291,b
=0.478,c
¢= 0.051,ab
=(0.291)(0.478)=0.139,κ=0.143。在第二個(gè)例子中,還是固定總效應(yīng)為c
=0.190,a
=0.250,b
= 0.545,c
¢=0.054,a
b
=(0.250)(0.545)=0.136,κ=0.146(Wen&Fan,2015)。上面兩個(gè)數(shù)據(jù)例子中的總效應(yīng)相同,都是0.190。但當(dāng)中介效應(yīng)ab
從0.139降到0.136時(shí),κ卻從0.143升至0.146。這說(shuō)明,κ沒(méi)有單調(diào)性。m
(ab
)是滿足某種條件下的最大值,是與a
無(wú)關(guān)且與b
也無(wú)關(guān)的一個(gè)常數(shù),因而κ應(yīng)當(dāng)與ab
成正比。為什么κ沒(méi)有單調(diào)性呢?Wen和Fan(2015)發(fā)現(xiàn),問(wèn)題出在Preacher和Kelley(2011)錯(cuò)誤地用m
(ab
)=m
(a
)m
(b
)來(lái)計(jì)算m
(ab
),其中m
(a
)是給定c
和b
后系數(shù)a
的最大值;m
(b
)是給定c
和a
后系數(shù)b
的最大值。因而,在給定c
后,m
(a
)與b
有關(guān),而m
(b
)與a
有關(guān),結(jié)果是m
(a
)m
(b
)與a
和b
都有關(guān),說(shuō)明m
(ab
)=m
(a
)m
(b
)是不成立的。隨著ab
的上升,m
(a
)m
(b
)可能上升也可能下降,導(dǎo)致κ沒(méi)有單調(diào)性。Wen和Fan給出一個(gè)簡(jiǎn)單的數(shù)據(jù)例子,用來(lái)說(shuō)明為什么κ沒(méi)有單調(diào)性。m
(ab
)=m
(a
)m
(b
)不成立,那么m
(ab
)該如何計(jì)算?Wen和Fan(2015)用初等代數(shù)證明了m
(ab
)其實(shí)是無(wú)窮大(可以理解為比任何一個(gè)正整數(shù)都大),這一點(diǎn)肯定出乎Preacher和Kelley(2011)的意外。因?yàn)槿魏螖?shù)除以無(wú)窮大等于0,所以κ的定義本身就有問(wèn)題,就是說(shuō),在定義中將m
(ab
)用來(lái)做分母是不對(duì)的。P
外,值得考慮的是R
型中介效應(yīng)量,其他一些定義復(fù)雜、計(jì)算繁瑣、解釋困難的中介效應(yīng)量則不擬涉及。r
表示Y
與M
的相關(guān)系數(shù)(平方后就是Y
的方差被M
解釋的比例),R
表示Y
對(duì)X
和M
的回歸(11)得到的R
(即Y
的方差被X
和M
解釋的比例),r
表示在消除了X
影響后Y
與M
的偏相關(guān)(partial correlation)系數(shù)。De Heus(2012)提出了改良版的R
,將偏相關(guān)系數(shù)r
用部分相關(guān)(part4.6correlation)系數(shù)r
代替:R
型中介效應(yīng)量全部都沒(méi)有單調(diào)性(Lachowicz,2015;Wen&Fan,2015),并且也不像R
那樣可以理解為方差被解釋的比例(Lachowicz,2015;Preacher&Kelley,2011)。r
)平方后(就是R
)作為效應(yīng)量,就是因變量的方差被解釋的比例,有明確的統(tǒng)計(jì)意義并且方便推廣到多個(gè)自變量的情形。但現(xiàn)在將中介效應(yīng)進(jìn)行平方,解釋上已經(jīng)成問(wèn)題,推廣到多重中介模型更加難以解釋,還不如直接使用標(biāo)準(zhǔn)化的中介效應(yīng)大小容易解釋和推廣。P
有單調(diào)性,但如果僅僅報(bào)告P
其實(shí)反映不出來(lái)中介效應(yīng)的大小。例如,如果一個(gè)研究的總效應(yīng)c
=0.6,另一個(gè)研究的總效應(yīng)c
=0.3,那么同樣都是P
=0.5,前一個(gè)研究的中介效應(yīng)比后一個(gè)研究的強(qiáng)多了。所以,單單看一個(gè)P
,研究之間缺少可比性。另一個(gè)常見(jiàn)的中介效應(yīng)量R
沒(méi)有單調(diào)性,所以不建議用作中介效應(yīng)量,但作為一個(gè)統(tǒng)計(jì)結(jié)果還是可以報(bào)告的,讓讀者了解間接效應(yīng)與直接效應(yīng)的相對(duì)大小??梢哉f(shuō)沒(méi)有一個(gè)現(xiàn)有的中介效應(yīng)量能令人滿意,或者說(shuō),沒(méi)有哪個(gè)單個(gè)的中介效應(yīng)量能擔(dān)當(dāng)衡量中介效應(yīng)大小的作用。那該如何報(bào)告中介效應(yīng)量呢?Wen和Fan(2015)的建議是同時(shí)報(bào)告多個(gè)統(tǒng)計(jì)量。首先應(yīng)當(dāng)同時(shí)報(bào)告總效應(yīng)的原始估計(jì)(如果有意義)和標(biāo)準(zhǔn)化估計(jì)(與測(cè)量單位無(wú)關(guān))。前者反映了當(dāng)X
變化一個(gè)單位時(shí),Y
將變化多少個(gè)單位。后者反映了當(dāng)X
變化一個(gè)標(biāo)準(zhǔn)差時(shí),Y
將變化多少個(gè)標(biāo)準(zhǔn)差。然后報(bào)告間接效應(yīng)ab
和直接效應(yīng)c
¢的原始估計(jì)和標(biāo)準(zhǔn)化估計(jì)。當(dāng)ab
和c
¢符號(hào)一致時(shí),報(bào)告P
是有意義的,說(shuō)明了中介效應(yīng)占總效應(yīng)的比例。例如,如果c
=0.5,間接效應(yīng)ab
=0.2,直接效應(yīng)c
¢=0.3(都是標(biāo)準(zhǔn)化估計(jì)),可以做如下解釋:當(dāng)X
變化一個(gè)標(biāo)準(zhǔn)差時(shí),Y
將變化0.5個(gè)標(biāo)準(zhǔn)差,其中0.2是X
通過(guò)中介變量M
對(duì)Y
起作用,而余下的0.3則是X
直接對(duì)Y
起作用。中介效應(yīng)占了總效應(yīng)的40%(=0.2/0.5)。上述這些統(tǒng)計(jì)量,不僅容易計(jì)算,而且容易解釋??傊?只要ab
和c
¢符號(hào)一致(此時(shí)ab
不超過(guò)總效應(yīng)c
),事情就好辦,在有了標(biāo)準(zhǔn)化估計(jì)的ab
和中介效應(yīng)量P
后,中介效應(yīng)的絕對(duì)大小和相對(duì)大小都已經(jīng)明確了。對(duì)于不一致的中介模型(ab
和c
¢符號(hào)相反),標(biāo)準(zhǔn)化估計(jì)的ab
是沒(méi)有界的,P
也沒(méi)有界。此時(shí),無(wú)論看著標(biāo)準(zhǔn)化估計(jì)的ab
還是中介效應(yīng)量P
,對(duì)中介效應(yīng)大小可能都沒(méi)有譜,不知道多少算大,多少算小?;蛟S通過(guò)同類研究的元分析,可以提供中介效應(yīng)大小幅度的一個(gè)參照系(Wen&Fan,2015)。除了報(bào)告標(biāo)準(zhǔn)化估計(jì)的ab
和P
外,是否還有什么指標(biāo)可用來(lái)作為中介效應(yīng)量呢?如果有,是否也可以作為不一致的中介模型的中介效應(yīng)量?都是有待研究的問(wèn)題。Alwin,D.F.,&Hauser,R.M.(1975).The decomposition of effects in path analysis.American Sociological Review,40
,37–47.Athay,M.M.(2012).Satisfaction with Life Scale(SWLS)in caregivers of clinically-referred youth: Psychometric properties and mediation analysis.Administrationand PolicyinMentalHealthandMentalHealthServices Research,39
,41–50.Baron,R.M.,& Kenny,D.A.(1986).The moderator–mediator variable distinction in social psychological research:Conceptual,strategic,and statistical considerations.Journal of Personality and Social Psychology,51
,1173–1182.Cohen,J.(1965).Some statistical issues in psychological research.In B.B.Wolman(Ed.),Handbook of clinical psychology
.New York:McGraw-Hill.Cohen,J.(1969).Statistical power analysis for the behavioral sciences
.New York:Academic Press.Cohen,J.(1973).Eta-squared and partial eta-squared in fixed factor ANOVA designs.Educational and Psychological Measurement,33
,107–112.Cohen,J.(1988).Statistical power analysis for the behavioral sciences
(2nd ed.).New York:Erlbaum.Cohen,J.,Cohen,P.,West,S.G.,&Aiken,L.S.(2003).Applied multiple regression/correlation analysis for the behavioralsciences
(3rd ed.).
Mahwah,New Jersey:Lawrence Erlbaum Associates,Inc.De Heus,P.(2012).R squared effect-size measures and overlap between direct and indirect effect in mediation analysis.Behavior Research Methods,44
,213–221.Fairchild,A.J.,Mackinnon,D.P.,Taborga,M.P.,&Taylor,A.B.(2009).R
effect-size measures for mediation analysis.Behavior Research Methods,41
,486–498.Fan,X.,&Konold,T.R.(2010).Statistical significance versus effect size.In P.Peterson,E.Baker,and B.McGaw(Eds.),International encyclopedia of education
(3rd ed.,Vol.7,pp.444–450).Oxford:Elsevier.Fang,J.,Zhang,M.Q.,&Chiou,H.J.(2012).Mediation analysisand effectsize measurement:Retrospectand prospect.Psychological Development and Education,28
,105–111.[方杰,張敏強(qiáng),邱皓政.(2012).中介效應(yīng)的檢驗(yàn)方法和效果量測(cè)量:回顧與展望.心理發(fā)展與教育,28
,105–111.]Field,A.(2013).Discovering statisticsusing IBMSPSS statistics
(pp.408–419).London:SAGE.Judd,C.M.,& Kenny,D.A.(1981).Processanalysis:Estimating mediation in treatment evaluations.Evaluation Review,5
,602–619.Kelley,K.,& Preacher,K.J.(2012).On effectsize.Psychological Methods,17
,137–152.Koletzko,S.H.,Herrmann,M.,&Brandst?tter,V.(2015).Unconflicted goal striving:Goal ambivalence as a mediator between goal self-concordance and well-being.Personality and Social Psychology Bulletin,41
,140–156.Labelle,L.E.,Lawlor-Savage,L.,Campbell,T.S.,Faris,P.,&Carlson,L.E.(2015).Does self-report mindfulness mediate the effect of Mindfulness-Based Stress Reduction(MBSR)on spirituality and posttraumatic growth in cancer patients?.The Journal of Positive Psychology,10
,153–166.Lachowicz,M.(2015).A novel measure of effect size for mediationanalysis
(Unpublished master's thesis).Vanderbilt University.MacKinnon,D.P.(2008).Introduction to statistical mediation analysis.
Mahwah,NJ:Erlbaum.MacKinnon,D.P.,& Dwyer,J.H.(1993).Estimating mediated effects in prevention studies.Evaluation Review,17
,144–158.MacKinnon,D.P.,Krull,J.L.,&Lockwood,C.M.(2000).Equivalence of the mediation,confounding and suppression effect.Prevention Science,1
,173–181.MacKinnon,D.P.,Warsi,G.,&Dwyer,J.H.(1995).A simulation study of mediated effect measures.Multivariate Behavioral Research,30
,41–62.Olejnik,S.,&Algina,J.(2000).Measures of effect size for comparative studies:Applications,interpretations,and limitations.Contemporary Educational Psychology,25
,241–286.Preacher,K J.,&Kelley,K.(2011).Effect size measures for mediation models:Quantitative strategies for communicating indirect effects.Psychological Methods
,16
,93–115.Rivera,P.M.,& Fincham,F.(2015).Forgivenessas a mediator of the intergenerational transmission of violence.Journal of Interpersonal Violence,30
,895–910.Sobel,M.E.(1982).Asymptotic confidence intervals for indirecteffects in structuralequation models.In S.Leinhardt(Ed.),Sociological methodology
(pp.290–312).Washington,DC:American Sociological Association.Thompson,B.(2007).Effect sizes,confidence intervals,and confidence intervals for effect sizes.Psychology in the Schools,44
,423–432.Wen,Z.,&Fan,X.(2015).Monotonicity of effect sizes:Questioning kappa-squared as mediation effect size measure.Psychological Methods,20
,193–203.Wen,Z.,&Hau,K.-T.(2008).Cutoff values for testing:How great the difference between the true and the false makes them distinguishable?Acta Psychologica Sinica,40
,119–124.[溫忠麟,侯杰泰.(2008).檢驗(yàn)的臨界值:真?zhèn)尾罹喽啻蟛拍鼙鎰e?心理學(xué)報(bào),40
,119–124.]Wen,Z.,&Wu,Y.(2010).Misuses and misunderstandings in statistics by psychologists.Journal of South China Normal University(Social Science Edition),
(1),47–54.[溫忠麟,吳艷.(2010).屢遭誤用和錯(cuò)批的心理統(tǒng)計(jì).華南師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),
(1),47–54.]Wen,Z.,&Ye,B.(2014).Analyses of mediating effects:The development of methods and models.Advancesin Psychological Science,22
,731–745.[溫忠麟,葉寶娟.(2014).中介效應(yīng)分析:方法和模型發(fā)展.心理科學(xué)進(jìn)展,22
,731–745.]Wilkinson,L.(1999).Statistical methods in psychology journals:Guidelines and explanations.American Psychologist,54
,594–604.Wu,Y.,&Wen,Z.(2011).The statistical analysis procedure involving null hypothesis significance testing.Psychological Science,34
,230–234.[吳艷,溫忠麟.(2011).與零假設(shè)檢驗(yàn)有關(guān)的統(tǒng)計(jì)分析流程.心理科學(xué),34
,230–234.]Zhao,X.,Lynch,J.G.,&Chen,Q.(2010).Reconsidering Baron and Kenny:Mythsand truthsaboutmediation analysis.Journal of Consumer Research,37
,197–206.Zheng,H.,Wen,Z.,&Wu,Y.(2011).The appropriate effect sizes and theircalculationsin psychologicalresearch.Advances in Psychological Science,19
,1868–1878.[鄭昊敏,溫忠麟,吳艷.(2011).心理學(xué)常用效應(yīng)量的選用與分析.心理科學(xué)進(jìn)展,19
,1868–1878.]