劉 近, 周躍進(jìn)
(安徽理工大學(xué)數(shù)學(xué)與大數(shù)據(jù)學(xué)院,安徽 淮南 232001)
因果中介分析是揭示變量間因果機(jī)制的一個(gè)有效的分析工具,其廣泛用于心理學(xué)、行為學(xué)、流行病學(xué)、生物醫(yī)學(xué)的研究。2001年,Pearl基于反事實(shí)框架提出了直接效應(yīng)和間接效應(yīng)的定義?;诜词聦?shí)框架的優(yōu)點(diǎn)在于直接效應(yīng)和間接效應(yīng)的定義不需要基于模型的假定。在Pearl(2001)的方法中,因果中介效應(yīng)具有可加性,自然直接效應(yīng)和間接效應(yīng)之和等于總效應(yīng)。在一定的假設(shè)下,這些因果效應(yīng)能被識(shí)別,從而獲得估計(jì),并在Pearl(2009)中進(jìn)行全面的闡述。本文研究當(dāng)中介變量具有測(cè)量誤差時(shí)考慮無(wú)交互作用和有交互作用兩種情形下,分別通過(guò)建立邏輯回歸和線性回歸模型,估計(jì)出直接效應(yīng)和間接效應(yīng)。
因果中介分析研究自變量是否通過(guò)中介變量影響結(jié)果變量的因果機(jī)制,其一般關(guān)系如圖1所示,其中A表示自變量,M表示中介變量,C表示混雜變量,Y表示結(jié)果變量。
圖1 因果中介分析路徑圖
當(dāng)C=c時(shí),自變量從a到a*時(shí),總效應(yīng)被定義為:
類似地,可以定義基于優(yōu)勢(shì)比的直接效應(yīng)和間接效應(yīng)。自然直接效應(yīng)定義為:
中介變量固定在M a*時(shí),自變量從水平a變化到水平a*的效應(yīng)。自然間接效應(yīng)定義為:
總效應(yīng)可分解為自然間接效應(yīng)和自然直接效應(yīng)的乘積,即
考慮中介變量具有測(cè)量誤差的因果效應(yīng)估計(jì)問(wèn)題。觀察值與真實(shí)值之間的關(guān)系為:
M*=M+μ,則路徑圖為圖2:
圖2 具有測(cè)量誤差的因果中介分析路徑圖
其中假設(shè)條件為:
建立logistic回歸和線性回歸模型,即如下所示。
然而,在考慮中介變量具有誤差的情形下,logistic回歸和線性回歸結(jié)構(gòu)方程表示為:
自然直接效應(yīng)OR NDEa,a*|c(a*)表示為:
在假設(shè)結(jié)果變量稀疏性假定下,自然直接效應(yīng)和間接效應(yīng)近似解析表達(dá)式為:
對(duì)模型中參數(shù)可由極大似然估計(jì)方法獲得其估計(jì),從而估計(jì)自然直接效應(yīng)和間接效應(yīng)。
模型為:
在稀疏結(jié)果的假定下,則自然直接效應(yīng)和間接效應(yīng)的解析表達(dá)式分別為:
可由極大似然估計(jì)方法獲得模型參數(shù)估計(jì),從而估計(jì)自然直接效應(yīng)和間接效應(yīng)。
在無(wú)交互作用情形下,為了進(jìn)行模擬研究,模型參數(shù)分別設(shè)置為:03;對(duì)模型誤差分布考慮三種情形,分別服從N(0,1),N(1,1)和N(1,4),對(duì)每一種模擬情形,重復(fù)500次。獲得自然直接效應(yīng)和間接效應(yīng)的偏差,標(biāo)準(zhǔn)差和置信區(qū)間。模擬結(jié)果如表1所示。
表1 無(wú)交互作用時(shí)效應(yīng)估計(jì)
當(dāng)自變量服從各種模擬情形時(shí),估計(jì)的偏差、標(biāo)準(zhǔn)差和置信區(qū)間都較小,表明提出的方法表現(xiàn)良好。
考慮在有交互作用的情形時(shí),模擬結(jié)果如表2所示。
表2 有交互作用時(shí)效應(yīng)估計(jì)
從表2中可得,對(duì)于模型誤差服從三種不同分布,真實(shí)值與估計(jì)值的差別很小,這表明我們提出的方法表現(xiàn)良好。
本文研究了當(dāng)中介變量具有測(cè)量誤差時(shí),考慮利用優(yōu)勢(shì)比定義了中介效應(yīng),通過(guò)建立邏輯回歸和線性回歸模型的結(jié)構(gòu)方程,估計(jì)出直接效應(yīng)和間接效應(yīng)。在有限樣本下用R語(yǔ)言進(jìn)行模擬分析,結(jié)果表明提出的方法具有良好表現(xiàn)。本文在推導(dǎo)過(guò)程中都假定結(jié)果變量是稀疏的,從而獲得效應(yīng)估計(jì)的近似解析表達(dá)式。在未來(lái)的工作中,將進(jìn)一步地考慮結(jié)果變量非稀疏性假定時(shí),中介因果效應(yīng)估計(jì)的精確解析表達(dá)式。
佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版)2022年2期