亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        權(quán)數(shù)對基于模型推斷的影響分析

        2022-03-25 03:06:00金勇進劉曉宇
        統(tǒng)計與信息論壇 2022年3期
        關(guān)鍵詞:權(quán)數(shù)估計量總體

        金勇進,劉曉宇

        (中國人民大學 a.應用統(tǒng)計科學研究中心;b.統(tǒng)計學院;c.調(diào)查技術(shù)研究所,北京 100872)

        一、引言

        在實際抽樣調(diào)查中,常需要對總體的一些參數(shù)進行推斷,如總值、均值、比例等。對這些總體參數(shù)的推斷途徑主要分為兩種:一種是傳統(tǒng)基于抽樣設計的推斷,以入樣概率為基礎(chǔ),根據(jù)從有限總體中進行的隨機抽樣對有限總體特征進行推斷;另一種是基于模型的推斷,假定有限總體是超總體模型的一次隨機實現(xiàn),通過估計超總體的模型參數(shù)來推斷有限總體特征。

        長久以來,基于設計和基于模型推斷之間存在廣泛的討論?;谠O計的推斷僅在調(diào)查設計階段要求對總體進行一些假設,例如依據(jù)中心極限定理,當樣本量足夠大時樣本統(tǒng)計量服從正態(tài)分布等,這些假設通常比較寬松,在大樣本情況下能夠得到可靠的估計?;谀P偷耐茢嘣趩我怀闃臃椒ㄏ?存在最優(yōu)估計量理論并得到相對有效的目標量估計。事實上,兩種途徑各有利弊,基于設計的推斷在存在非抽樣誤差或總體結(jié)構(gòu)存在線性趨勢等情況下,估計結(jié)果低效甚至無效;而基于模型的推斷對模型的識別敏感、模型的錯誤識別可能會造成推斷失效。對基于設計和基于模型推斷,有比較優(yōu)劣的研究,有探索關(guān)聯(lián)的研究,也有模型輔助的估計[1],但鮮有文獻涉及二者的結(jié)合,在充分考慮調(diào)查數(shù)據(jù)概率特征的基礎(chǔ)上進行建模分析[2-3]。基于設計和基于模型推斷的結(jié)合不僅缺乏理論研究,在實際應用中同樣缺乏指導。導致這種情況的主要原因是,調(diào)查設計和數(shù)據(jù)分析通常是由不同的人來執(zhí)行,數(shù)據(jù)分析人員能夠掌握的現(xiàn)場調(diào)查信息受到限制,例如抽樣框、抽樣設計和原始數(shù)據(jù)的某些復雜特征可能被隱藏。同時,抽樣設計相關(guān)的方法集中在基于設計的推斷體系上,與許多主流應用統(tǒng)計常用的建模分析完全不同,會對習慣基于模型推斷體系的數(shù)據(jù)分析人員造成混淆。

        權(quán)數(shù)在基于設計推斷中起著核心作用,它與入樣概率相關(guān),是樣本推斷總體的擴張系數(shù)用于衡量各樣本單元的變量值在總體中的作用大小。將權(quán)數(shù)引入基于模型的推斷,可以使得基于模型的分析結(jié)果反映樣本的概率特征,具有總體代表性,實現(xiàn)兩種推斷體系優(yōu)勢的組合。本文創(chuàng)新性地將權(quán)數(shù)引入基于模型的推斷,針對因果推斷問題探究權(quán)數(shù)對模型推斷效果的影響,將權(quán)數(shù)納入模型擬合,構(gòu)造處理效應的雙重穩(wěn)健估計;一方面從估計的角度討論權(quán)數(shù)的功能,旨在獲得更準確、穩(wěn)健的估計結(jié)果;另一方面為實際應用提供參考,說明設計權(quán)數(shù)對于模型推斷的重要性,強調(diào)在對調(diào)查數(shù)據(jù)分析時應充分考慮抽樣設計的影響。

        二、基于設計與基于模型的推斷框架分析

        (一)基于設計的推斷思路

        主流抽樣教科書中介紹的估計方法均以隨機化為基礎(chǔ),被稱作基于設計的推斷方法,也稱作基于隨機化的推斷方法,例如HT估計、HH估計等?;谠O計的推斷只研究有限總體的特征,生成數(shù)據(jù)的模型雖然可能存在,但是不需要知道模型的具體形式,也不依賴于任何模型假設。

        (1)

        (2)

        (3)

        如果估計量的期望值等于真實值,則估計量是無偏的。如果偏差和方差都隨著樣本量的增加而趨近于0,則估計量是一致的。根據(jù)以上分析可知,通過設計權(quán)數(shù)將樣本信息還原到總體,HT估計量具有無偏性和一致性。權(quán)數(shù)在基于設計的推斷中發(fā)揮著重要作用。

        (二)基于模型的推斷思路

        在社會科學領(lǐng)域的研究中,常需要對調(diào)查數(shù)據(jù)進行建模分析,這種途徑被稱作基于模型的推斷方法。該方法假定有限總體是來自一個無限超總體的樣本,通過樣本尋找一個生成總體的模型,并估計模型參數(shù)。與基于設計的“估計”相比,基于模型的方法側(cè)重于“預測”,通過對目標變量Y的分布建模,預測總體中未入樣單元,估計量的性質(zhì)取決于模型假設,與抽樣設計和樣本選擇無關(guān)。Royall在線性回歸模型下對有限總體估計進行了研究,被認為是基于模型推斷體系初步形成的標志[5]。

        現(xiàn)以一個簡單的超總體模型為例,分析基于模型估計量的性質(zhì)。假定總體中的所有單元k=1,2,…,N服從如下模型:

        μ=EM(yk),vM(yk)=σ2

        (4)

        (5)

        (6)

        (三)方法評述

        基于設計與基于模型的推斷是兩類重要的抽樣推斷體系,二者各有特色?;谠O計的推斷更側(cè)重“描述”,基于模型的推斷更具有“分析性”,因此后者在經(jīng)濟學、社會學等領(lǐng)域的應用更為廣泛。事實上,基于模型可以規(guī)避基于設計估計時存在的一些缺陷,具體包括以下幾點:第一,方差估計問題。實際抽樣設計通常較復雜,難以獲得準確的πkl值,此時無法通過式(3)計算基于設計估計量的方差,需借助其他近似方法或重抽樣方法,且在不放回抽樣中可能出現(xiàn)Δkl<0的情況,致使式(3)的計算值為負,這有悖于方差的含義。而基于模型估計量的方差取決于yk,與包含概率無關(guān),不受抽樣設計的影響,不存在失效的風險。第二,樣本量問題。基于設計的方法需要較大的樣本量來保證估計量的漸近性質(zhì),若實際樣本量無法達到要求,尤其是在對于總體估計時,估計精度將大打折扣。而基于模型的推斷效果與樣本量無關(guān),當模型選擇合適時,僅通過小樣本就可以得到總體的優(yōu)良估計。第三,估計量的穩(wěn)健性問題?;谠O計估計量的性質(zhì)可能會受到其他因素的影響,例如總體結(jié)構(gòu)中存在的線性趨勢、周期波動和自相關(guān)問題、非抽樣誤差以及離群值等,而基于模型的方法可以依據(jù)對總體分布的認識,靈活設置超總體模型,進而避免這些因素的影響。

        然而,基于模型推斷總體的一大局限性在于,若選擇了不恰當?shù)某傮w模型,可能會得到比基于設計方法更差的推斷結(jié)果。且當樣本的入樣過程不具有無信息性時,總體單元是否入樣與目標變量的取值有關(guān),此時基于模型的推斷結(jié)果存在選擇性偏差。由于基于模型推斷淡化了抽樣設計,導致該方法對樣本概率特征的反映并不是很敏感,那么,在模型確定的情況下,是否可以通過引入權(quán)數(shù),改善基于模型的推斷效果,組合兩種推斷途徑的優(yōu)勢,既能保留對總體的代表性,又能得到精度高且效果穩(wěn)定的估計結(jié)果,本文以因果推斷問題為背景,對此展開討論。

        三、權(quán)數(shù)在因果推斷中的使用

        從觀測數(shù)據(jù)中推斷因果效應常借助傾向得分實現(xiàn),目前大部分研究在實際推斷時忽略了抽樣設計的影響,少數(shù)學者嘗試將權(quán)數(shù)納入推斷過程,但尚未形成統(tǒng)一結(jié)論[6-8]。在基于傾向得分對處理效應進行模型估計時,涉及傾向得分模型和預測模型兩個模型,本部分在分析權(quán)數(shù)功能的基礎(chǔ)上,討論如何在估計過程中利用權(quán)數(shù)構(gòu)造雙穩(wěn)健估計,并對其中涉及的一些問題進行思考,作為后續(xù)模擬研究的基礎(chǔ)。

        (一)基于傾向得分的因果推斷法

        在科學研究中,經(jīng)常需要識別不同處理對于結(jié)果變量的影響,即進行因果推斷。研究因果關(guān)系的黃金法則是隨機化試驗。然而在實際研究中,無論是出于執(zhí)行成本和執(zhí)行難度,還是道德和倫理的限制,無法實施隨機化試驗,而借助觀測數(shù)據(jù)開展的因果推斷研究得以發(fā)展。在實際中,個體一旦處于某種狀態(tài),將無法回到原始狀態(tài),更無法得到其處于其他狀態(tài)下的結(jié)果,也就是說,研究者永遠無法同時觀測到一個特定個體的兩個潛在結(jié)果,處理組的個體只能看到處理后的狀態(tài),對照組的個體只能看到未處理的狀態(tài)。但是,如果能夠知道潛在結(jié)果,或者是對潛在結(jié)果進行一些合理的假設,便可估計處理效應,這是利用觀測數(shù)據(jù)進行因果推斷所依據(jù)的主要思想。在基于觀測數(shù)據(jù)的因果推斷研究中,如何控制混雜變量造成的偏差至關(guān)重要。混雜變量會同時影響個體是否接受處理和結(jié)果變量,若不加以控制,將無法確定結(jié)果變量的差異是來自不同處理還是混雜變量。

        傾向得分理論最早由美國統(tǒng)計學家Rosenbaum和Rubin提出[9],是控制潛在混雜對推斷造成的影響的常用方法。傾向得分法是指在控制了協(xié)變量后,觀測樣本中的單元被分配至處理組的概率。假設每個樣本單元的觀測值為{yi,ti,xi;i∈s},其中y為待研究變量,t為示性變量,ti=1時表示第i個觀測樣本單元被分配至處理組,ti=0時表示第i個觀測樣本單元被分配至對照組,x為混雜因素,定義傾向得分為ei=P(ti=1|x,y;γ,γ0),其中γ、γ0是未知參數(shù),分別表示真實模型中x、y的系數(shù)。傾向得分法的假設如下:

        (1)?i∈s,滿足P(ti=1|x,y;γ)=P(ti=1|x;γ,γ0)

        (2)?i∈s,0

        (3)?i∈s,P(ti=1|x;γ)=P(ti=1|xi;γ)

        Rubin對傾向得分的性質(zhì)進行了研究,結(jié)果表明,通過傾向得分不僅有效控制了混雜因素,使得處理組與對照組的待研究變量具有可比性,還能實現(xiàn)協(xié)變量的充分降維,得到的處理效應估計具有無偏性[9]。傾向得分可與傳統(tǒng)方法如匹配、分層、回歸等相結(jié)合,在此基礎(chǔ)上Hirano等提出了利用傾向得分進行逆概率加權(quán)的方法估計因果效應[10]。

        (二)權(quán)數(shù)的功能

        假設樣本量為n,對于每個樣本單元i∈s;ti為示性變量,ti=1時表示單元i被分配至處理組,ti=0時表示單元i被分配至對照組;xi為混雜因素,f(x|t=1)表示處理組的混雜變量分布,f(x|t=0)表示對照組的混雜變量分布;y0i表示對照組的潛在結(jié)果變量,y1i表示處理組的潛在結(jié)果變量,二者只有一個可以觀測到。

        因果推斷要求處理的分配是隨機的,此時處理組和對照組的混雜變量分布相同,即f(x|t=1)和f(x|t=0)相同。而實際上,二者并不相同。為實現(xiàn)隨機化的要求和樣本對總體的代表性,需對兩分布構(gòu)造一個權(quán)數(shù)w(x),使得f(x|t=1)=w(x)f(x|t=0,s=1),根據(jù)貝葉斯公式有:

        (7)

        其中1/f(s=1|t=0,x)為樣本的設計權(quán)數(shù),f(t=1|x)/[1-f(t=1|x)]為從處理組出發(fā)估計的風險比。若隨機樣本與總體的處理分配不同,即f(t=1|x)≠f(t=1|x,s=1),那么w(x)將無法使處理組和對照組的混雜達到平衡,僅基于樣本處理的分布f(t=1|x,s=1)對總體處理的分布f(t=1|x)進行推斷,可能無法準確刻畫總體的分布特征。因此在估計f(t=1|x)時,需充分考慮樣本與總體的關(guān)系,發(fā)揮權(quán)數(shù)的作用。

        根據(jù)以上分析可知,在基于調(diào)查數(shù)據(jù)進行因果推斷時,權(quán)數(shù)的使用包括兩步:一是在對f(t=1|x)進行估計時納入權(quán)數(shù);二是無論基于設計還是基于模型推斷,應在處理效應的估計中考慮權(quán)數(shù)。

        (三)權(quán)數(shù)的使用

        1.回歸模型中的權(quán)數(shù)

        眾所周知,標準線性回歸是典型的基于模型推斷的方法,一般采用普通最小二乘法(OLS)或極大似然法進行擬合。對于OLS法,在進行擬合時需要假定殘差的方差恒定,當殘差不滿足方差齊性時,將單元i殘差的方差表示為σ2/ui,其中ui是一個已知常數(shù),那么可以通過加權(quán)最小二乘法(WLS)得到更好的推論,即回歸模型中樣本單元i與ui成比例進行加權(quán)。WLS同樣是基于模型的推斷方法。若要在基于模型的推斷中結(jié)合基于設計的推斷,加權(quán)方法則會出現(xiàn)完全不同的形式。在基于設計的推斷中,設計權(quán)數(shù)di是根據(jù)抽樣方案確定的,代表樣本在總體中的相對重要程度。此時,在模型推斷中考慮抽樣的隨機性,應根據(jù)權(quán)數(shù)di進行加權(quán)最小二乘法的估計,將包含概率的倒數(shù)加入最小二乘方程。由于每個樣本i代表總體的1/πi個單元,所以它在回歸中的權(quán)數(shù)與1/πi成正比。兩種加權(quán)方式都是合理的,但它們的思路完全不同,對y的分布的建模導致利用ui加權(quán),隨機抽樣導致利用1/πi加權(quán)。

        對于極大似然法,假設超總體模型的形式為g(E[Y|X=x])=g(μ)=η=x′β,方差v[Y|X=x]=σ2V(μ),示性變量Ii表示單元是否入樣,若單元i入樣,則Ii為1,否則為0,那么參數(shù)估計通過求解如下的得分方程得到:

        (8)

        當考慮抽樣設計時,極大似然法演變?yōu)閭螛O大似然法,得分方程變?yōu)?

        (9)

        根據(jù)大數(shù)定律和中心極限定理,若正確地指定了超總體模型,偽極大似然法得到的參數(shù)估計值具有漸近正態(tài)性和一致性。接下來考慮更加復雜的情形,針對基于傾向得分的因果推斷,利用權(quán)數(shù)構(gòu)造雙穩(wěn)健估計。

        2.雙穩(wěn)健估計中的權(quán)數(shù)

        雙穩(wěn)健估計采用兩種關(guān)系模型估計待估參數(shù),即使其中一個模型被錯誤指定,所得的估計量仍具有一致性。通過傾向得分可以保證處理分配機制的可忽略性,通過預測模型可以進行參數(shù)估計。如何利用權(quán)數(shù)構(gòu)造兩個估計模型,實現(xiàn)處理效應的雙穩(wěn)健估計,是本部分討論的重點。

        (1)傾向得分的估計

        傾向得分模型常采用通過Logistic或者Probit回歸擬合,屬于概率估計模型,處理作為因變量,其他混雜因素作為自變量。為了實現(xiàn)對背景變量的平衡、減少選擇性偏差和控制估計量的方差,傾向得分模型應包含與處理和結(jié)果變量均相關(guān)的變量,通過控制這些變量排除它們對結(jié)果變量的影響,使結(jié)果變量的差異僅來自不同處理。若納入與處理有關(guān)而與結(jié)果變量無關(guān)的變量,無法控制估計量的方差;若納入與處理無關(guān)但與結(jié)果變量相關(guān)的變量,無法排除混雜的影響,消除選擇性偏差[11]。

        根據(jù)調(diào)查數(shù)據(jù)進行因果分析,需同時考察樣本選擇機制和處理分配機制,識別影響樣本選擇的變量,以及這些變量與傾向得分模型中的協(xié)變量的包含關(guān)系。傾向得分模型涉及處理分配機制。假設變量z影響樣本選擇機制,傾向得分模型根據(jù)協(xié)變量x建立,ei=f(t=1|xi),總體治療組的平均處理效應ATT的估計為:

        (10)

        對于式(10)的前半部分,根據(jù)貝葉斯公式計算可得:

        =E(y1|t=1)

        (11)

        對于式(10)的后半部分,根據(jù)貝葉斯公式以及傾向得分的性質(zhì),即對協(xié)變量x取條件后t與y0獨立,分子為:

        dy0dxdz

        (12)

        分母的計算類似,可得

        (13)

        欲使式(13)是E(y0|t=1)的一致估計,需要f(y0,x,s|t)=f(y0,x|t)f(s|t)成立。然而,由于變量z影響樣本選擇機制,(y0,x)與s的獨立性難以保證,而在傾向得分模型中引入權(quán)數(shù)獲得f(t=1|x)的一致估計,在一定程度上能彌補由此造成的推斷誤差[6]。引入的方式可分為兩種:一種是將權(quán)數(shù)作為協(xié)變量擬合模型;另一種是保留權(quán)數(shù)的原始含義,采用偽極大似然法進行估計。具體效果如何,將在模擬部分予以討論。

        (2)處理效應的估計

        (14)

        (15)

        利用權(quán)數(shù)構(gòu)造雙穩(wěn)健估計,理論上能得到性質(zhì)優(yōu)良的估計結(jié)果。然而,實際情況更為復雜,具體應用效果如何需要從以下幾個方面進行考察:第一,權(quán)數(shù)與因果推斷的結(jié)合涉及樣本選擇機制和處理分配機制,影響二者的變量包含關(guān)系如何,是重疊還是獨立,均有可能影響推斷效果,實際中完整找到這兩類變量并判斷其關(guān)系并不容易,通過權(quán)數(shù)構(gòu)造的雙穩(wěn)健估計能否在不同情況下保持優(yōu)良性質(zhì)有待研究。第二,由于無法得知真實模型,若傾向得分模型沒有包含與樣本選擇機制有關(guān)的變量,或錯誤指定了模型形式時,設計權(quán)數(shù)的加入是否能彌補由此造成的誤差值得探討。第三,受資料的限制,研究中往往需要將兩個不同調(diào)查的數(shù)據(jù)集進行融合分析,此時具有相同抽樣權(quán)數(shù)的受訪者不具有相同特征,利用權(quán)數(shù)構(gòu)造雙穩(wěn)健估計的方法是否適用有待研究。下文的模擬研究將依據(jù)以上三點設計不同情形,對所提出方法的準確性和穩(wěn)定性進行探究。

        四、模擬研究

        結(jié)合第三部分的分析,本部分通過設置不同情形模擬實際應用,探究前文所述方法的準確性和穩(wěn)定性。

        (一)數(shù)據(jù)生成與模型設置

        模擬樣本的生成方式如下:假設總體共有10 000個單元,根據(jù)x劃分為5層,每層2 000個;一維協(xié)變量x~N(0.25j-0.75,1),j=1,2,3,4,5,一維協(xié)變量z~N(0.5,0.5);潛在結(jié)果y0、y1服從正態(tài)分布,根據(jù)x生成y0~N(1+x,0.5),y1~N(y0+0.2+0.1x,0.5);t為是否接受處理的示性變量。樣本由分層抽樣得到,每層抽取的樣本量分別為100、150、200、250、300。

        為比較不同情況下權(quán)數(shù)對傾向得分法推斷結(jié)果的影響,分別用符號s和符號t代表樣本選擇機制和處理分配機制,在以下五個不同s與t的關(guān)系下進行模擬。情形1,s與t均與x相關(guān),這是較理想的情況,在控制x后,s與t的影響均得到控制,理論推斷效果好;情形2,s與x無關(guān),t與x有關(guān),與情形1相同,理論推斷效果好;情形3,s與z有關(guān),t與x有關(guān),此時傾向得分模型沒有包含與樣本選擇機制有關(guān)的變量z,用以研究權(quán)數(shù)對由此造成誤差的彌補情況;情形4,在已知t的情況下,s與x有關(guān),t與x有關(guān),人為將控制組的權(quán)數(shù)擴大1.8倍,處理組不變,使得兩組中權(quán)數(shù)相同的單元特征及其在總體中的相對重要程度均不同,此情形用以研究來自不同調(diào)查的樣本;情形5,s與t均與x相關(guān),但形式不同,假設s與x呈線性關(guān)系,t與x呈非線性關(guān)系,此情形用以研究傾向得分模型識別錯誤時的估計效果。以上情形的具體生成形式見表1。

        表1 樣本選擇機制和處理分配機制的生成

        模擬部分根據(jù)利用權(quán)數(shù)構(gòu)造的雙穩(wěn)健估計對ATE進行推斷。對于傾向得分模型的擬合采用Logistic回歸進行,為研究權(quán)數(shù)在傾向得分法中的效果,考慮如下四種方式:模型1,不進行傾向得分建模,直接比較兩組結(jié)果變量的差異;模型2,根據(jù)協(xié)變量x擬合模型,不考慮權(quán)數(shù)的影響;模型3,將權(quán)數(shù)作為協(xié)變量,根據(jù)協(xié)變量x和權(quán)數(shù)d擬合模型;模型4,將權(quán)數(shù)作為樣本單元相對重要程度的度量,可看作將樣本單元做d倍的復制,根據(jù)協(xié)變量x擬合模型。此外,傾向得分模型僅涉及x項,不涉及x2項。預測模型采用線性形式,分別采用不考慮權(quán)數(shù)的極大似然法和考慮權(quán)數(shù)的偽極大似然法,擬合y~t以及y~(t、x)的關(guān)系。

        (二)模擬與結(jié)果分析

        模擬過程共進行1 000次重復試驗,評價方法采用協(xié)變量的平衡性、估計值的均方誤差根和真實參數(shù)的覆蓋率。

        通過傾向得分可平衡處理組和對照組的協(xié)變量,因此,對協(xié)變量的平衡性檢驗可以評價傾向得分模型的效果,不同情況下協(xié)變量的標準化均數(shù)差(SMD)的數(shù)值見表2。

        表2 協(xié)變量平衡檢查結(jié)果

        由表2可見,傾向得分法有利于協(xié)變量的平衡;若傾向得分模型中未考慮權(quán)數(shù),在一些情況下會使協(xié)變量的差異更大,甚至劣于不進行傾向得分建模(見情形5);若在傾向得分模型中將權(quán)數(shù)作為協(xié)變量使用,協(xié)變量得到了一定程度的平衡,但在樣本選擇機制和處理分配機制較復雜時效果一般(見情形3~5);若在傾向得分模型中將權(quán)數(shù)作為樣本單元相對重要程度的度量,與其他方法相比,協(xié)變量的平衡性最好且效果穩(wěn)定。

        均方誤差根可以綜合評價方法的準確性,出于篇幅考慮僅展示部分結(jié)果,具體數(shù)值見表3。

        表3 估計量的均方誤差根

        對比表3不同行的數(shù)據(jù)可知,總體而言,當預測模型不考慮權(quán)數(shù)時,估計值的均方誤差根增大,推斷效果變差(對比1~4行與9~12行)。比較不同預測模型自變量對估計的影響,當自變量是x、t時,估計值的均方誤差根較小,推斷效果更優(yōu)(對比1~4行與5~8行),其原因是x、t可以更好地刻畫待研究變量y的特征。當合理指定了預測模型且加入權(quán)數(shù)時(對應1~4行),不同傾向得分模型對均方誤差根的影響不大,雖然不采用傾向得分模型的估計均方誤差根不大(見1行),但其對協(xié)變量的平衡效果差,不符合因果推斷的要求,此外,加入權(quán)數(shù)的傾向得分模型表現(xiàn)更穩(wěn)定且相對更優(yōu)(見4行);當預測模型的指定有所偏離但加入權(quán)數(shù)時(對應5~8行),采用加入權(quán)數(shù)的傾向得分模型進行估計,得到的估計標準誤最小,推斷效果最好且表現(xiàn)穩(wěn)定(見8行)。

        表4是估計量95%置信區(qū)間對真實參數(shù)覆蓋率的部分結(jié)果,由于預測模型不使用權(quán)數(shù)的方法得到的預測準確度低且穩(wěn)定性差,相關(guān)數(shù)據(jù)未予展示。

        由表4可知,當傾向得分模型和預測模型均使用權(quán)數(shù)時,95%置信區(qū)間對真實參數(shù)的覆蓋率最高,且在不同的樣本選擇機制和處理分配機制下表現(xiàn)穩(wěn)定。

        表4 真實參數(shù)覆蓋率

        (三)總結(jié)評價

        模擬研究對前文的理論分析展開了進一步驗證,分別將權(quán)數(shù)納入傾向得分模型和預測模型,構(gòu)造ATE的雙穩(wěn)健估計。通過設置不同情形研究估計量的性質(zhì),相關(guān)結(jié)論如下:第一,無論影響樣本選擇機制的變量與影響處理分配機制的變量是相互重疊還是彼此獨立,利用權(quán)數(shù)構(gòu)造的雙穩(wěn)健估計量均具有高的精確度;第二,當傾向得分模型在變量和形式指定上有所偏誤時,設計權(quán)數(shù)的加入能夠彌補由此造成的誤差,提高推斷效果;第三,對于不同來源的數(shù)據(jù)集,在數(shù)據(jù)融合后所述方法仍然適用且估計量性質(zhì)穩(wěn)定。

        總體而言,在采用傾向得分法進行調(diào)查數(shù)據(jù)的因果推斷時,應充分考慮調(diào)查設計對樣本的影響,分別在傾向得分和處理效應的估計中加入權(quán)數(shù),且保留權(quán)數(shù)的原本含義,體現(xiàn)樣本對總體還原。據(jù)此方法得到的協(xié)變量平衡性最好,估計量的均方誤差根更小,估計量更準確且表現(xiàn)穩(wěn)定。

        五、實證分析

        本文采用2017年CGSS(China General Social Survey)調(diào)查數(shù)據(jù),進行處理效應的估計。CGSS調(diào)查始于2003年,是中國最早的全國性、綜合性、連續(xù)性學術(shù)調(diào)查項目,全面收集了社會、社區(qū)、家庭、個人多個層次的數(shù)據(jù),由中國人民大學調(diào)查與數(shù)據(jù)中心組織實施。調(diào)查的目標總體范圍涵蓋了全國31個省、自治區(qū)、直轄市(不含港澳臺)的所有城市、農(nóng)村家庭戶,并通過分層三階段抽樣的方式獲取了全國層面的代表性樣本。

        經(jīng)濟學中的人力資本理論將勞動者收入差異主要歸結(jié)為勞動者人力資本的不同,教育水平是影響人力資本的重要因素。教育可以提高人的知識和技能,進而提高生產(chǎn)能力,增加個人收入,進一步使得個人工資和薪金結(jié)構(gòu)發(fā)生變化,理論上來看,受教育程度與個人年收入之間存在因果關(guān)系[12],這也潛在影響了人口流動[13]。因此,實證部分對個人年收入和是否接受高等教育之間的因果關(guān)系進行研究。

        選取來自CGSS調(diào)查的2 000個樣本,個人年收入作為待研究變量,估計總體的平均處理效應(ATE),涉及的其他變量有性別、年齡、城鄉(xiāng)劃分、受教育程度、父親受教育程度、母親受教育程度、婚姻狀況、政治面貌和民族等。樣本中個人年收入的均值為996 930.5元,接受過高等教育的個人年收入均值為1 106 653元,未接受過高等教育的個人年收入均值為933 178.6元。傾向得分采用Logistic模型擬合。由于實證部分的目的并非研究個人年收入與其他變量的關(guān)系,因此為了對自變量的選擇和模型形式的指定進行探討,假定預測模型為線性形式,模型中僅包含協(xié)變量的一次項。

        現(xiàn)估計教育造成的收入差異,受教育程度按照是否接受過高等教育劃分處理組和對照組,其他變量作為協(xié)變量,分別采用四種估計方法檢查協(xié)變量的平衡情況:方法1,不采用傾向得分模型且預測模型不加入權(quán)數(shù),直接計算兩組協(xié)變量的差異;方法2,不采用傾向得分模型但預測模型加入權(quán)數(shù);方法3,采用不加入權(quán)數(shù)的傾向得分模型和加入權(quán)數(shù)的預測模型;方法4,采用加入權(quán)數(shù)的傾向得分模型和加入權(quán)數(shù)的預測模型。8個協(xié)變量平衡情況的具體結(jié)果見圖1,8條折線分別代表8個變量對應的標準化均數(shù)差數(shù)值變化情況。

        圖1 協(xié)變量的平衡情況

        由圖1可以看到,整體來看采用方法4估計時處理組和對照組的協(xié)變量差異最小。四種方法下得到ATE的估計值及p值分別為46 219.286(p>0.5)、45 700.433(p>0.1)、37 023.474(p<0.001)、36 638.211(p<0.001)。可以看到,第一,不采用傾向得分模型會忽略其他因素對收入的影響,造成估計量被高估且不具有顯著性,此時在預測模型建模時加入權(quán)數(shù)有利于改善估計效果。第二,在預測模型加入權(quán)數(shù)的情況下,傾向得分模型是否加入權(quán)數(shù)對估計的影響不大,估計量均具有高度顯著性,但加入權(quán)數(shù)的傾向得分模型對協(xié)變量的平衡效果更好,因此有理由認為由該方法得到的結(jié)果可信度更高。第三,綜合考慮協(xié)變量的平衡性和估計量的顯著程度,本例表明應同時在傾向得分模型和預測模型中引入權(quán)數(shù)。采用不同方法進行因果推斷會得到不同的結(jié)果,未平衡混雜變量或未合理使用權(quán)數(shù)均會造成估計值的偏離,在實際研究中應充分考慮抽樣設計對樣本造成的影響,將權(quán)數(shù)引入推斷的各個過程。

        六、討論

        基于設計和基于模型的推斷各有優(yōu)劣?;谠O計的推斷理論完善,但它僅根據(jù)一次抽樣結(jié)果進行推斷,受到樣本量、非抽樣誤差和總體分布等因素的影響,估計效率較低;基于模型的推斷則能根據(jù)實際情況選用不同模型,更充分地利用各類輔助信息,提高估計效率,但對于模型識別較敏感。實際抽樣調(diào)查多采用復雜抽樣,基于模型的推斷在復雜樣本中具有更重要的現(xiàn)實價值,它能更好地利用先驗信息和輔助信息,解決如小樣本推斷、小域估計、誤差分析和缺失值處理等實際問題,因此具有更廣泛的應用前景。

        本研究從因果推斷入手,嘗試將基于設計與基于模型推斷結(jié)合,通過引入權(quán)數(shù)提高基于模型推斷的準確度和穩(wěn)定性,提出了利用權(quán)數(shù)構(gòu)造雙穩(wěn)健估計的方法。結(jié)合理論分析與模擬研究,指出應將設計權(quán)數(shù)同時加入傾向得分模型和預測模型中,具體優(yōu)勢體現(xiàn)在以下幾點:第一,在該方法下協(xié)變量的平衡性最好;第二,通過該方法估計的處理效應均方誤差根最小,準確度最高;第三,該方法效果穩(wěn)定,即使傾向得分模型在變量和形式指定上有所偏誤,該方法仍能得到準確度高的估計結(jié)果。實證部分將所述方法應用于收入的推斷中,對不同方法的估計效果進行了分析,這為其他社會科學領(lǐng)域進行因果關(guān)系研究提供了參考價值,具有較大的現(xiàn)實意義。值得一提的是,對于不同來源的數(shù)據(jù)集,在數(shù)據(jù)融合后所述方法仍然可行且推斷效果好,由此拓展了各類調(diào)查數(shù)據(jù)的使用范圍,使得一些科學研究成為可能。事實上,不僅是因果推斷,凡是基于調(diào)查數(shù)據(jù)的問題研究,研究者都應對抽樣設計的影響予以重視,嘗試將權(quán)數(shù)納入分析。

        兩種推斷途徑的結(jié)合有利于發(fā)揮各自的優(yōu)點,既能實現(xiàn)樣本對總體還原,又能綜合各方面的信息提高估計效率,靈活解決各種推斷問題,還能提高估計的穩(wěn)健性。本文的討論僅以因果推斷為切入點,作為此類研究的一個范例,對于如何在其他具體問題中將基于設計和基于模型相結(jié)合,達到更好的估計效果,還存在廣泛的探討空間。

        猜你喜歡
        權(quán)數(shù)估計量總體
        用樣本估計總體復習點撥
        2020年秋糧收購總體進度快于上年
        微觀調(diào)查數(shù)據(jù)抽樣權(quán)數(shù)的可忽略性檢驗及實證研究
        豬肉在CPI中的權(quán)數(shù)被調(diào)低了嗎?
        豬肉在CPI中的權(quán)數(shù)被調(diào)低了嗎?
        外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
        中國外匯(2019年6期)2019-07-13 05:44:06
        權(quán)數(shù)可靠性的假設檢驗探討
        直擊高考中的用樣本估計總體
        淺談估計量的優(yōu)良性標準
        基于配網(wǎng)先驗信息的諧波狀態(tài)估計量測點最優(yōu)配置
        電測與儀表(2015年6期)2015-04-09 12:00:50
        三级网站亚洲三级一区| 老熟妇乱子伦av| 五月婷婷六月丁香久久综合| 欧美国产激情18| 本道天堂成在人线av无码免费 | 国产免费99久久精品| 中文亚洲第一av一区二区| 久久精品中文字幕有码| 成年人一区二区三区在线观看视频 | 国产精品久久久福利| 十四以下岁毛片带血a级| 免费a级毛片无码| 少妇高潮惨叫正在播放对白| 亚洲精品一二区| 日韩在线中文字幕一区二区三区| 丝袜av乱码字幕三级人妻| 色窝窝亚洲av网在线观看| 免费人成年激情视频在线观看| 久久国产亚洲高清观看| 中文字幕精品无码一区二区| 国产亚洲欧美另类第一页| 一区二区三区四区国产亚洲| 亚洲午夜经典一区二区日韩| 不卡av网站一区二区三区| 中文乱码字字幕在线国语| av无码av天天av天天爽| 欧美俄罗斯乱妇| 亚洲综合网一区二区三区| 尤物蜜桃视频一区二区三区| 久久人人爽人人爽人人片av高请 | 国产人妻熟女高跟丝袜| 亚洲中文字幕久久无码精品| 久久精品国产亚洲AV成人公司 | 日本中文字幕一区二区高清在线 | 日韩人妻无码精品久久免费一| 国产午夜无码视频免费网站| 免费人成黄页网站在线观看国产| 在线观看国产激情视频| 熟妇熟女乱妇乱女网站| 国产露脸精品产三级国产av| 极品美女尤物嫩模啪啪|