張建軍 孫成金 呂海燕
摘 要:因果推斷一直是經(jīng)濟學(xué)領(lǐng)域關(guān)注的重點,由Fisher創(chuàng)立的對照試驗法是進(jìn)行因果推斷的黃金標(biāo)準(zhǔn),然而,在許多領(lǐng)域,特別是社會科學(xué)研究中,公共政策很難實現(xiàn)隨機對照試驗,得到的往往是觀察性數(shù)據(jù)。因此,采用反事實測評技術(shù)獲得對照組,是解決社會科學(xué)研究領(lǐng)域因果效應(yīng)問題的關(guān)鍵。筆者利用截面數(shù)據(jù)間存在的共同驅(qū)動因素,采用逐步回歸方法研究了因果推斷的反事實測評技術(shù),并以河南省公共政策為例,計算得到了政策執(zhí)行后的凈效應(yīng),為評估公共政策效應(yīng)提供了量化評價方法。
關(guān)鍵詞:因果推斷;公共政策;反事實;逐步回歸;測評
中圖分類號:F224.9 ? ? 文獻(xiàn)標(biāo)志碼:A ? ? 文章編號:1003-5168(2022)5-0145-04
DOI:10.19968/j.cnki.hnkj.1003-5168.2022.05.033
The Counterfactual Evaluation Technology Based on Causal Inference
ZHANG Jianjun ? ?SUN Chengjin ? ?LYU Haiyan
(Collage of Information and Management Science of Henan Agricultural University, Zhengzhou 450002,China)
Abstract: Causal inference has always been the focus of attention in the field of economics, The control experiment founded by Fisher is the gold standard for causal inference. However, it is difficult for public policy to realize randomized controlled trials especially in social science research, and the results are often observational data. Therefore, the use of counterfactual evaluation technology to obtain the control group is the key to solve the problem of causal effect in the field of social science research. This paper studies the counterfactual evaluation technology of causal inference based on the common driving factors between cross-sectional data and stepwise regression method. The author calculates the net effect after the implementation of the policy taking the public policy of Henan Province as an example, to provide a quantitative evaluation method for evaluating the policy effect.
Keywords: causal inference;public policy; counterfactual; stepwise regression; evaluation
0 引言
因果效應(yīng)起源于對新藥治療效果的評價,后來被用于評估公共政策實施后的效果。因果效應(yīng)的評估一般采用簡單差分法,即通過比較受影響的群體和沒有受影響群體的差異來評估政策效果。然而,由于在對象選擇上的偏差,計算的結(jié)果往往與真實情況存在一定偏差。例如,考察農(nóng)村經(jīng)濟合作社產(chǎn)生的減貧效應(yīng),對單個農(nóng)戶而言,處理效應(yīng)就是參與合作社的收入減去假如沒有參與合作社的收入。事實上,參與和不參與只能選其一,所以無法得到單個個體的因果效應(yīng)。Rubin建立了一種潛在結(jié)果模型,即每個個體存在兩個潛在結(jié)果,不同個體潛在結(jié)果不同,所以可以將潛在結(jié)果視為來自二維總體的一次隨機抽樣,處理組總體均值減去對照組總體均值被定義為平均因果效應(yīng),這樣就從總體期望的角度定義了平均因果效應(yīng)[1]。針對社會科學(xué)研究中的因果效應(yīng)問題,相關(guān)文獻(xiàn)主要圍繞兩個方面展開研究。一方面,通過傾向得分匹配(PSM)消除選擇性偏差,如張淑輝等采用山西省和甘肅省的調(diào)研數(shù)據(jù),基于傾向得分匹配和logit模型,對參與農(nóng)村新型合作組織的農(nóng)戶收入變化進(jìn)行分析[2];舒揚等采用傾向得分方法研究了霧霾是否促進(jìn)旅游消費問題[3]。另一方面,利用雙重差分法(DID)消除時間增量影響。該方法借助處理組和對照組的觀察結(jié)果開展研究,不需要建立處理對象的反事實結(jié)果。具體過程是,先將處理組政策干預(yù)前后的目標(biāo)值差分,但是沒有消除由于時間變化而產(chǎn)生的增量影響,再將對照組也做差分處理,最后,將處理組的差分結(jié)果減去對照組的差分結(jié)果,這樣就剔除了政策干預(yù)效果中時間產(chǎn)生的增量。例如,鄧蓉蓉等運用雙重差分方法實證研究了國家低碳試點對試點城市碳排放績效的影響效應(yīng)[4];范紅忠等采用雙重差分方法估計了高新區(qū)建設(shè)對城市技術(shù)進(jìn)步的影響[5]。
通過對文獻(xiàn)的梳理不難看出,因果推斷已經(jīng)被廣泛應(yīng)用于社會科學(xué)研究領(lǐng)域的各個領(lǐng)域,而且越來越受到政府部門和研究者的重視,但仍存在一些問題,如公共政策評估有時候只關(guān)注一個地區(qū)、一個城市或國家的干預(yù)效果,此時其他任何控制個體都與干預(yù)個體存在較大差異,無法通過匹配的方法確立對照組。為了解決這一問題,筆者通過合成控制法,借助多元逐步回歸建立了處理對象的反事實預(yù)測模型,并以河南省扶貧公共政策為例進(jìn)一步實證分析。本研究的先進(jìn)性體現(xiàn)在解決了社會科學(xué)研究領(lǐng)域因果效應(yīng)推斷中的關(guān)鍵技術(shù)問題,建立了政策實踐效果量化評價模型與算法,研究成果將為政策實踐績效評價提供理論基礎(chǔ)。
1 反事實測評技術(shù)的理論分析
1.1 基本假定
對于面板數(shù)據(jù),所有橫截面單元之間存在一些共同的驅(qū)動因素,盡管它們對每個橫截面單元的影響程度可能不同,卻讓同一截面的個體之間產(chǎn)生相關(guān)性,因此借助這些相關(guān)性,可以建立處理組對象的反事實測評模型[6]。
模型基本假定如下,設(shè)[y0it]表示沒有政策干預(yù)下,第i個單元在t時刻的結(jié)果,[y1it]表示接受政策干預(yù)的結(jié)果,假定這些潛在結(jié)果的生成過程為多元因子模型,用式(1)表示。
[y0it=bi′ft+αi+εit(i=1,2,...,N,t=1,2,...,T)] ?(1)
式中:[ft]表示橫截面單元個體之間隨時間變化的共同因素向量,[bi′]為不隨時間變化但可能隨個體變化的常數(shù),[αi]為個體固定效應(yīng),[εit]為隨機擾動項,滿足[E(εit)=0]。
將[t]時刻同一截面的[N]個單元數(shù)據(jù)寫成向量,令[y0t=(y01t,y02t,...,y0Nt)],[α=(α1,α2,...,αN)],[εt=(ε1t,ε2t,...,εNt)],共同因子系數(shù)矩陣[B=(b1,b2,...,bN)],得到方程矩陣形式(2)。
[y0t=Bft+α+εt] ? ? (2)
式(2)表明,個體結(jié)果由兩部分構(gòu)成:影響所有個體結(jié)果的事變共同因子[ft],個體固定效應(yīng)[α]以及個體擾動項[εt]。模型存在一些假設(shè):一是個體特質(zhì)部分之間是不相關(guān)的,個體結(jié)果之間的相關(guān)性主要是由共同因子造成的,但是共同因子對個體的影響可以不同;二是截面?zhèn)€體數(shù)大于共同因子數(shù),并且除共同因子之外,個體之間沒有溢出效應(yīng)。
根據(jù)式(2)基本假定,第i個單元在t時刻的處理效應(yīng)定義為:[Δit=y1it-y0it],然而,不能同時觀察到兩個潛在結(jié)果[y0it]和[y1it],實際觀測結(jié)果[yit=ωity1it+(1-ωit)y0it]。
其中,變量[ωit=]0或1,[ωit=]1表示第i個單元在t時刻受到政策干預(yù),否則取0。假設(shè)時間[T1]之前沒有政策干預(yù),則容易看出[yit=y0it][(t=1,2,...,T1)],從時間[T1+1]開始,第[p]個單元受到政策干預(yù),則[ypt=y1pt][(t=T1+1,...,T)],并且假定其余[N-1]個單元沒有受到這一政策的干預(yù),即[yit=y0it][(i=1,...,p-1,p+1,...,N, t=1,...,T)]。
如果能識別出模型中的[bi、ft]、[αi ],則可以利用該模型預(yù)測政策干預(yù)后的反事實結(jié)果。然而,個體固定效應(yīng)和共同因子都是不可觀測的,無法直接估計干預(yù)組個體事后的政策效應(yīng)。由于所有個體受到時變共同因子的影響,事后共同因子的影響將體現(xiàn)在控制組的觀測結(jié)果中,故可以從事后控制組的觀測結(jié)果中反推出時變因子,并利用事前干預(yù)組觀測結(jié)果與控制組事前觀測結(jié)果之間受共同因子影響而造成的相關(guān)關(guān)系,估計出事后如果干預(yù)組個體沒有受到政策干預(yù)的反事實結(jié)果。政策實施后,由于潛在結(jié)果[y0pt][(t=T1+1,...,T)]的數(shù)據(jù)缺失,需要對這一時期政策沒有干預(yù)下的數(shù)據(jù)進(jìn)行預(yù)測,利用同一個橫截面上的單元受到共同因素的驅(qū)動,基于[T1+1]到[T]時段沒有政策干預(yù)的數(shù)據(jù)[yit=y0it][(i≠p)],對目標(biāo)對象反事實結(jié)果進(jìn)行建模,如果模型擬合效果較好,則可以使用該擬合模型對缺失數(shù)據(jù)進(jìn)行預(yù)測。
1.2 模型建立
建立最優(yōu)的回歸方程是實現(xiàn)回歸合成法的關(guān)鍵,這里的最優(yōu)通常指模型中包含所有對目標(biāo)變量影響顯著的解釋變量,剔除影響不顯著的變量,實現(xiàn)這一目標(biāo)通常有兩種方法,一種是全子集法;另一種是最優(yōu)子集的變量篩選法。2012年Hsiao提出了一種兩步法,首先,一次選擇[1,2,...,N]個控制組個體進(jìn)入模型,利用擬合優(yōu)度值來選擇模型;然后,利用模型選擇標(biāo)準(zhǔn),選擇最優(yōu)的模型,選擇標(biāo)準(zhǔn)定義為[AIC(p)=T0lne′0e0T0+2(p+2)],其中[p]為模型中包含的控制組個體數(shù),[e0]為回歸殘差向量。如果有[m]個控制組進(jìn)入模型時,共需要估計[CmN]個模型。從計算過程可以看出,該方法屬于全子集法的一種,但是計算量很大,而且忽視了變量間的多重共線性[7]。
鑒于此,本研究與現(xiàn)有研究文獻(xiàn)不同,采用逐步回歸法代替全子集法,研究社會科學(xué)領(lǐng)域政策評估中的反事實測評技術(shù),并以河南省扶貧政策為例進(jìn)行了實證分析,從定量評價視角,為政策效應(yīng)的合理評估提供理論支撐。
2 反事實測評技術(shù)的應(yīng)用研究
2.1 建立逐步回歸方程
本研究以河南省扶貧政策效應(yīng)為例,基于反事實測評技術(shù)進(jìn)行因果效應(yīng)的實證分析。首先,選取遼寧省、山東省、廣東省、福建省、江蘇省、浙江省6個沒有貧困縣的省份為對照組控制組,并以河南省農(nóng)村居民純收入為被解釋變量,這六省農(nóng)村居民純收入為解釋變量,基于1978年到2003年時段數(shù)據(jù),建立數(shù)學(xué)模型,數(shù)據(jù)來源于河南省統(tǒng)計年鑒。然后,采用多元線性回歸進(jìn)行分析,結(jié)果發(fā)現(xiàn)解釋變量間存在多重共線性,回歸系數(shù)不滿足顯著性要求。為了解決這一問題,本研究引入逐步回歸數(shù)學(xué)模型,逐步回歸是將解釋變量逐個引入模型,對入選的變量再進(jìn)行t檢驗,確保每次引入變量回歸方程中始終包含顯著性變量,最后得到最優(yōu)的解釋變量集。借助SPSS軟件,剔除不顯著變量,得到顯著性檢驗結(jié)果,如表1所示。
根據(jù)表1中的檢驗結(jié)果,容易得到擬合方程(3)。
[y=7.223+0.712x1-0.227x2+0.332x3] (3)
式中:[y]為河南省農(nóng)村居民人均純收入,[x1]、[x2]和[x3]分別表示山東、浙江和福建的農(nóng)村居民人均純收入。
2.2 政策的因果效應(yīng)
將1978—2003年解釋變量的數(shù)值代入模型,得到各年份河南省農(nóng)村居民人均純收入的擬合值(見圖1),計算得到平均相對誤差僅為0.023 53,模型擬合精度較高,因此,可以用該模型預(yù)測河南省2004—2018年農(nóng)村居民人均純收入的反事實數(shù)據(jù),并計算各年份因果效應(yīng),具體結(jié)果見表2。
圖2是2004年以來河南省農(nóng)村居民人均純收入減去合成河南省人均收入得到的政策效應(yīng),從變化曲線可以看出,河南省扶貧政策效應(yīng)整體呈現(xiàn)平穩(wěn)提升態(tài)勢,并逐步放大,特別是2012到2014年,政策扶貧效應(yīng)變化率最大,出現(xiàn)加速上漲,原因是多方面的,2012年國務(wù)院發(fā)布了《關(guān)于大力實施促進(jìn)中部地區(qū)崛起戰(zhàn)略的若干意見》加大了對中原地區(qū)的政策支持,河南省的經(jīng)濟發(fā)展迎來了前所未有的戰(zhàn)略發(fā)展期。2016年河南省連續(xù)發(fā)布了《河南省電網(wǎng)脫貧專項方案》《河南省水利脫貧專項方案》以及《河南省困難殘疾人生活補貼和重度殘疾人護(hù)理補貼實施辦法》。隨著這些扶貧方案的實施,2016—2018年河南省的扶貧政策處理效應(yīng)繼續(xù)呈現(xiàn)加速上揚。但是,這一政策效應(yīng)在統(tǒng)計上是否顯著呢?筆者將采用類似于隨機置換檢驗方法,進(jìn)一步證明效應(yīng)評估在政策上的顯著性。
2.3 政策效應(yīng)的顯著性檢驗
為了檢驗估計的政策效應(yīng)是否顯著,參考Abadie等提出的類似于置換檢驗的推斷方法[8],從控制組逐一選出作為偽干預(yù)對象,接著利用同樣的回歸合成控制法計算政策效應(yīng),可以得到類似于圖3的政策效應(yīng)路徑。對于控制組的6個省份,共得到6個政策效應(yīng)路徑。然后觀察河南省在圖中的分布位置,如果非常極端,說明估計的政策效應(yīng)是顯著的。從圖3中可以看出,福建、山東、廣東和江蘇4個省份扶貧政策出現(xiàn)負(fù)效應(yīng),而河南省的政策效應(yīng)位于所有路徑分布的極端位置,特別是2014年以后,對照組中沒有一個省份的效應(yīng)路徑在河南省上方,因而,可以否定沒有政策效應(yīng)的原假設(shè),證明了河南省扶貧政策效應(yīng)是顯著的。
3 結(jié)語
因果效應(yīng)的評估廣泛應(yīng)用在社會、教育和健康項目實踐效果的評估問題上,但是在這些領(lǐng)域很難實現(xiàn)隨機對照試驗?;诖耍P者利用橫截面單元個體之間隨時間變化的共同因素,研究了因果效應(yīng)評估的反事實測評技術(shù),建立了該領(lǐng)域問題的量化評價模型與算法。并以河南省扶貧公共政策為例,進(jìn)行實證分析,驗證了研究方法的有效性和可行性,研究成果將為政策實踐績效評價提供理論支撐。
參考文獻(xiàn):
[1] RUBIN D B. Estimating causal effects of treatments in randomized and nonrandomized studies[J]. Journal of Educational Psychology,1974,66(5):688-701.
[2] 張淑輝,沈宇丹,高雷虹.合作經(jīng)濟組織扶貧的農(nóng)戶收入效應(yīng):基于傾向得分匹配法的實證分析[J].華東經(jīng)濟管理,2018,32(9):165-172.
[3] 舒揚,伍津釗.霧霾污染促進(jìn)了城市旅游消費嗎:基于澳門博彩旅游和PSM方法的證據(jù)[J].經(jīng)濟研究參考,2018(1):30-40.
[4] 鄧蓉蓉,詹晶.低碳試點促進(jìn)了試點城市的碳減排績效嗎:基于雙重差分方法的實證[J].系統(tǒng)工程,2017,35(11):68-73.
[5] 范紅忠,陳洲.高新區(qū)建設(shè)推動了城市技術(shù)進(jìn)步嗎:基于雙重差分方法的驗證[J].金融與經(jīng)濟,2018(5):63-66.
[6] HSIAO C H, STEVE C, SHUI K W. A panel data approach for program evaluation: Measuing the benefits of political and economic integration of Hongkong with mainland China[J].Journal of Applied Econometrics,2012,27(5):705-740.
[7] ALBERTO A, ALEXIS D, JENS H. Synthetic control methods for comparative case studies estimating the effect of california’s tobacco control program[J].Journal of the American Statistical Association, 2010,105(490):493-505.