湖州師范學(xué)院醫(yī)學(xué)院(313000)
王麗娜△ 李莎莎
結(jié)構(gòu)方程模型在修正和中介作用分析中的誤區(qū)和對策*
湖州師范學(xué)院醫(yī)學(xué)院(313000)
王麗娜△李莎莎
結(jié)構(gòu)方程模型(structural equation modeling,SEM)作為多變量資料統(tǒng)計分析技術(shù)之一,其在營銷學(xué)、心理學(xué)、管理學(xué)、社會及行為科學(xué)等領(lǐng)域的量化研究上已成為主流分析技術(shù)。近5年,在生物-心理-社會醫(yī)學(xué)模式的指導(dǎo)下,SEM在醫(yī)學(xué)相關(guān)領(lǐng)域的科研工作中應(yīng)用活躍,包括醫(yī)療糾紛、職業(yè)倦怠感、心理健康狀況、自我管理行為等變量的成因分析或中介機(jī)制的探索,以及量表結(jié)構(gòu)效度評定的驗證性因素分析。本文在廣泛參閱國內(nèi)外SEM相關(guān)著作及文獻(xiàn)的基礎(chǔ)上,對SEM在科研工作中的應(yīng)用誤區(qū)進(jìn)行剖析,以減少SEM的分析判斷失誤,提高其統(tǒng)計分析質(zhì)量,使各學(xué)科研究過程更為科學(xué)、規(guī)范。
1975年瑞典統(tǒng)計學(xué)家J?reskog[1]首次開發(fā)了用于分析多指標(biāo)變量之間復(fù)雜關(guān)系結(jié)構(gòu)的多元統(tǒng)計分析方法SEM。該技術(shù)是結(jié)合證實性因素分析與回歸分析或路徑分析而形成。根據(jù)不同的統(tǒng)計分析目的,SEM的功能可劃分為:(1)陳述、估計以及檢驗變量之間線性關(guān)系與非線性關(guān)系的假設(shè)[2];(2)檢驗觀察變量與潛變量之間關(guān)系的假設(shè)[3];(3)同步檢驗一組觀察變量或潛在變量之間的直接效果及間接效果的假設(shè)[4]。SEM統(tǒng)計分析的目的與回歸分析相似,但由于其在使用上同時考慮了模型的交互作用、非線性關(guān)系、自變量相關(guān)、測量誤差、測量誤差相關(guān)、多指標(biāo)的外生潛在變量及多指標(biāo)的內(nèi)生潛在變量,因此SEM的統(tǒng)計分析過程更為嚴(yán)謹(jǐn),結(jié)果更具有說服力,尤其適用于科學(xué)研究中以問卷或量表測量為手段的研究變量間關(guān)系的分析。
SEM作為第二代統(tǒng)計技術(shù),其與SPSS/SAS等第一代統(tǒng)計技術(shù)相比,具有2個顯著的優(yōu)勢。
1.SEM較SPSS/SAS更為嚴(yán)謹(jǐn)
SPSS/SAS只能分析觀察變量,對于潛在變量的分析,將通過各維度題目加總后再代入多元回歸方程[5]。各維度分?jǐn)?shù)加總即承認(rèn)了每個題目的信度均為100%的假設(shè),鑒于隨機(jī)誤差及系統(tǒng)誤差的存在,這種假設(shè)是不切實際的,特別是通過問卷量表、測評獲取的資料。同時,SPSS/SAS只能分析變量之間的直接效果,無法分析間接效果。在可能存在間接效果的模型中,需要執(zhí)行兩次回歸才能完整分析出所有變量之間的關(guān)系。同一模型進(jìn)行兩次統(tǒng)計推斷,將導(dǎo)致I型錯誤的增加。SEM考慮了觀察變量的估計殘差,能夠反應(yīng)樣本資料的真實情況,因此估計的偏差較小,結(jié)果更為嚴(yán)謹(jǐn)。
2.SEM圖形輸出簡潔,易于理解
SEM可以根據(jù)模型圖上的執(zhí)行結(jié)果迅速判讀變量(觀察變量或潛在變量)之間的相關(guān)程度及影響方向,并可以直觀地顯示中介效果或干擾效果。SPSS將多個變量納入回歸方程,統(tǒng)計結(jié)果缺少圖形呈現(xiàn)功能,此時,多數(shù)學(xué)者的做法是通過繪制路徑分析圖加以呈現(xiàn)各變量間的影響方向,但路徑分析圖忽略了自變量間的共線性。Raykov[6]認(rèn)為,當(dāng)多個自變量同時估計因變量時,自變量之間不可能完全獨立。因此,Raykov團(tuán)隊在制定SEM模型估計準(zhǔn)則時強(qiáng)調(diào):自變量間的共變是結(jié)構(gòu)方程模型估計的參數(shù),如果自變量間的共變性被忽略,將造成估計上的偏差。
“結(jié)構(gòu)方程模型”、“影響因素”、“中介效應(yīng)/機(jī)制”、“探索性因素分析”及“驗證性因素分析”檢索近5年科研文獻(xiàn),通過專家咨詢及文獻(xiàn)佐證,本研究共總結(jié)3點SEM的使用誤區(qū)。
1.模型修正過程中對修正指數(shù)的指導(dǎo)作用尚不明確
通過樣本數(shù)據(jù)構(gòu)建的結(jié)構(gòu)方程模型不一定均符合研究的預(yù)期或理論假設(shè)。此時,研究者需進(jìn)行模型修正。模型修正可依據(jù)既往研究的理論基礎(chǔ),增加或刪減變量,以實現(xiàn)模型和數(shù)據(jù)的擬合;或通過SEM軟件產(chǎn)生的參考指標(biāo)對配適度不良的模型加以修正。修正指數(shù)(modification indices,MI)是模型修正的常用參考指標(biāo),一般SEM軟件均可提供。MI利用資料驅(qū)動的方式,改變指標(biāo)之間的關(guān)系以達(dá)到改善配適度的目的。MI主要提供兩個修正檢驗值:變量之間的相關(guān)及殘差獨立的相關(guān)。因此,MI值將建議增加相關(guān)以達(dá)到改善模型的目的。既往科研文獻(xiàn)呈現(xiàn)的結(jié)構(gòu)模型圖常存在同一潛變量下觀察變量間殘差獨立相關(guān),或不同潛變量的觀察變量間殘差獨立相關(guān)。
這種做法有2點質(zhì)疑之處:如果修正的模型中潛變量下的觀察變量間殘差獨立相關(guān),即承認(rèn)了觀察變量間的相關(guān)性,那么,研究者為何在理論假設(shè)模型構(gòu)建之初沒有考慮到這種相關(guān)性;(2)按照MI增加相關(guān)的建議,模型依據(jù)某一特定的樣本進(jìn)行修正后,修訂后的模型是否穩(wěn)定,即是否同樣適合于研究總體中抽取的其他隨機(jī)樣本?這便引發(fā)模型是否是隨機(jī)產(chǎn)生的問題。因此,模型修正不能僅靠模型估計復(fù)雜化的手段以改善模型配適度[7]。正如Diamantopoulos[8]在其評論中強(qiáng)調(diào),除非存在清晰而具體的理論基礎(chǔ)提供支持,否則,無論MI提供增加相關(guān)的建議多誘人,都應(yīng)加以嚴(yán)格拒絕。在此背景下,Hu[9]提議,進(jìn)行量表結(jié)構(gòu)效度檢驗時,參照MI建議的增設(shè)相關(guān),可以認(rèn)定同一構(gòu)面(即一個維度或因子所包含的條目形成一個構(gòu)面,或一個潛變量所包含的數(shù)個觀察變量形成一個構(gòu)面)的兩個題目較為相似,建議刪除其中一個題目。這一提議,為模型修正提供了一條科學(xué)的路徑,并在后期多項研究中得到了廣泛運(yùn)用[10-11]。
2.研究變量間中介作用/效果的顯著性缺乏科學(xué)的統(tǒng)計推斷
中介變量是社會科學(xué)領(lǐng)域中研究變量間關(guān)系時重點關(guān)注的一個因素。其意義在于:(1)中介變量意味著自變量對因變量影響的一種內(nèi)在機(jī)制,能夠解釋兩個變量之間“如何”及“為何”發(fā)生關(guān)系的過程;(2)如中介效果顯著,便可通過中介變量尋找更多影響中介變量的自變量,這將有助于對因變量進(jìn)行更為全面而深入的研究;(3)以實務(wù)統(tǒng)計角度分析,對中介變量的調(diào)整及操控,可以對因變量發(fā)揮預(yù)測及控制作用。
自變量X對因變量Y的作用包括直接效果(c′)、間接效果(a×b)和總效果(c),其中直接效果及間接效果的識別是中介效果檢驗的主要工作。自SEM方法引入科學(xué)研究以來,中介效果的統(tǒng)計推斷技術(shù)大體經(jīng)歷了3種方法的變革。
(1)因果法(B-K method)
Baron和Kenny[12]最早提出了中介作用的因果檢驗法。該方法通過建立三個回歸方程式,憑借回歸系數(shù)對中介作用的顯著性進(jìn)行判定。Me中介作用檢驗的具體操作過程:
(1)Me=aX+ε……1→a≠0 且顯著;
(2)Y=cX+ε……2→c≠0 且顯著(總效果);
(3)Y=bMe+c′X+ε…3→b≠0 且顯著,
如c′≠0 為部分中介效果,c′=0 為完全中介效果
a、b均顯著,表明中介效果存在,c′如顯著,則中介變量發(fā)揮部分中介作用,如不顯著,則發(fā)揮完全中介作用。在某些學(xué)科的科研中,一些研究者多憑借路徑分析技術(shù),在因果法原理的指導(dǎo)下檢驗中介效果的顯著性。伴隨著SEM應(yīng)用技術(shù)的日趨成熟,因果法的局限性逐漸暴露,包括:(1)因果法檢驗中介效果的必要前提為c顯著,但在一些實際情況中,由于抑制效應(yīng)的存在[13],盡管c不顯著,仍然存在實際意義上的中介效果;(2)X對Me的作用(a)顯著,Me對Y的作用(b)顯著,但卻無法保證X通過Me對Y的作用(a×b)顯著。實際上,因果法并沒有對中介效應(yīng)(a×b)的顯著性進(jìn)行檢驗。
(2)系數(shù)乘積法(sobel test)
基于因果法無法實現(xiàn)a×b顯著性檢驗的功能,針對a×b顯著性檢驗的系數(shù)乘積法[14]應(yīng)用而生,即系數(shù)乘積法。具體操作過程為:Sobel 檢驗統(tǒng)計量為z值,計算公式z=ab/SEab,
其中,a與b均為非標(biāo)準(zhǔn)化系數(shù),SEa及SEb分別為a與b的標(biāo)準(zhǔn)誤,在α=0.05的檢驗水準(zhǔn)下,z值>±1.96即為中介效果顯著。然而,系數(shù)乘積法最大的缺陷在于其在使用條件上要求樣本服從正態(tài)分布。在多數(shù)情況下,即使a和b均服從正態(tài)分布,a×b通常多不符合正態(tài)分布的要求[15-16]。同時,|z|值>1.96在實務(wù)上并不代表一定顯著,中介效果在0.05的置信區(qū)間上是否顯著,仍有待于檢驗[17]。經(jīng)回顧,既往多數(shù)科研文獻(xiàn)中尚未發(fā)現(xiàn)系數(shù)乘積法技術(shù)的應(yīng)用。
(3)置信區(qū)間法(bootstrapping method)
為解決因a×b非正態(tài)分布導(dǎo)致的中介效果顯著性檢驗失效的問題,Hayes[18]提出了bootstrapping技術(shù)。該技術(shù)的運(yùn)用原理是以研究樣本作為抽樣總體,經(jīng)多次重復(fù)抽樣(通常為2000次),重新建立起足以代表總體分布特征的新樣本(自舉樣本)。對于一個研究樣本,只能計算某個統(tǒng)計量(例如均值)的一個取值,無法獲知均值統(tǒng)計量的分布情況。但通過bootstrapping技術(shù)可以模擬出均值統(tǒng)計量的近似分布。有了這種數(shù)據(jù)分布便可計算相應(yīng)的統(tǒng)計量(Z值),用以推測實際總體的情況。同時,bootstrapping技術(shù)亦可呈現(xiàn)Z值的置信區(qū)間,可進(jìn)一步用于假設(shè)檢驗(a×b的置信區(qū)間如不包含0,表明間接效果成立)。
bootstrapping技術(shù)比上述2種中介效果檢驗法具備更強(qiáng)的統(tǒng)計功效。隨著Amos軟件功能的不斷拓展,bootstrapping抽樣法對中介效果的檢驗得到了廣泛應(yīng)用。然而,近5年的醫(yī)學(xué)相關(guān)學(xué)科,甚至是某些人文社會學(xué)科的科研文獻(xiàn)中,鮮見bootstrapping技術(shù)的運(yùn)用與報道。鑒于bootstrapping技術(shù)精準(zhǔn)的統(tǒng)計分析質(zhì)量,有必要在某些學(xué)科的科研中,特別是中介效應(yīng)探索的研究中進(jìn)行推廣。
3.忽略多因子無因果中介模型的中介效果檢驗過程
bootstrapping技術(shù)僅用于驗證單因子中介效果,對于多因子無因果中介模型的中介效果檢驗?zāi)壳皯?yīng)用最為廣泛的技術(shù),即Preacher等[19]提出的SPSS Syntax語法編輯技術(shù),分別評估不同中介變量遠(yuǎn)程特定的間接效果。既往醫(yī)學(xué)相關(guān)學(xué)科的科研文獻(xiàn)中(亦包括某些人文社會科學(xué)文獻(xiàn)),雖有雙因子無因果中介模型的構(gòu)建,但尚未采用任何技術(shù)對各項中介因子的間接效果進(jìn)行單獨剖析,從而無法純化單一中介因子對因變量變異的貢獻(xiàn)程度。
SEM技術(shù)在各學(xué)科科研中的應(yīng)用日趨廣泛,其在潛變量與觀察變量間的結(jié)構(gòu)分析中以及潛變量間的關(guān)系分析中顯示了強(qiáng)大而精準(zhǔn)的統(tǒng)計優(yōu)勢。在SEM的應(yīng)用過程中,應(yīng)妥善處理MI的建議,并按照相應(yīng)的統(tǒng)計程序?qū)χ薪樽饔眠M(jìn)行顯著性檢驗,從而強(qiáng)化SEM技術(shù)的規(guī)范化使用,以提高其在科研中的統(tǒng)計判斷效能。
[1]J?reskog KG,Goldberger AS.Estimation of a model with multiple indicators and multiple causes of a single latent variable.Journal of the American Statistical Association,1975,70(351):631-639.
[2]Rigdon EE.Structural equation modeling:In modern methods for business research quantitative methodology.New Jersey:Lawrence Erlbaum Associates,1998:251-294.
[3]Hoyle RH,Panter AT.Writing about structural equation models,in structural equation modeling:concepts,issues,and applications.California:Sage publications,1995:158-176.
[4]MacCallum RC,Austin JT.Applications of structural equation modeling in psychological research.Annual Review of Psychology,2000,51:201-226.
[5]Hair JF,Anderson RE,Tatham RL,et al.Multivariate data analysis 5nd ed.New Jersey:Prentice Hall,1998:224-238.
[6]Raykov T,Marcoulides GA.A first course in structural equation modeling.New Jersey:Lawrence Erlbaum Associates,2006,210-224.
[7]MacCallum RC,Roznowski M,Nwcowitz LB.Model modifications in covariance structure analysis:The problem of capitalization on change.Psychological Bulletin,1992,111:490-504.
[8]Diamantopoulos A,Siguaw JA.Introducing LISREL:a guide for the uninitiated.California:Sage publications,2000:148-157.
[9]Hu L,Bentler PM.Cutoff criteria for fit indices in covariance structure analysis:Conventional criteria versus new alternatives.Structural Equation Modeling,1999,6(1):51-55.
[10]Jennifer CE,Kate BC,Lori AF.Development of a decisional balance scale for young adult marijuana use.Psychology Addict Behavior,2011,25(1):90-100
[11]Watt T,Groenvold M,Deng N,et al.Confirmatory factor analysis of the thyroid-related quality of life questionnaire ThyPRO.Health Quality Life Outcomes,2014,12:126.
[12]Baron RM,Kenny DA.The moderator-mediator variable distinction in social psychological research:Conceptual,strategic,and statistical considerations.Journal of Personality and Social Psychology,1986,51(6),1173-1182.
[13]Mackinnon DP,Kbull JL,Lockwood CM.Equivalence of the mediation,confounding and suppression effect.Prevention Science,2000,1(4):173-181.
[14]Sobel ME.Asymptotic intervals for indirect effects in structural equations models.San Francisco:Jossey-Bass,1982:290-312.
[15]Bollen KA,Stine R.Direct and indirects:Classical and bootstrap estimates of variability.Sociological Methodology,1990,20(1):150-140.
[16]Stone CA,Sobel ME.The robustness of total indirect effects in covariance structure models estimated with maximum likelihood.Psychometrika,1990,55(2):337-352.
[17]Mackinnon DP,Lockwood CM,Williams J.Confidence limits for the indirect effect:Distribution of the product and resampling methods.Multivariate Behavioral Research,2004,39(1):99-128.
[18]Hayes AF.Beyond Baron and Kenny:Statistical mediation analysis in the new millennium.Journal of Communication Monographs,2009,76(4):408-420.
[19]Preacher KJ,Hayes AF.Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models.Behavior Research Models,2008,40(3):879-891.
(責(zé)任編輯:劉 壯)
* 本文獲國家社會科學(xué)基金項目資助(項目編號:13CRK009)
△ 通信作者:王麗娜,E-mail:aring2000@163.com