王伶鑫,周 皓
(1.清華大學(xué)社會(huì)學(xué)系,北京100084;2.北京大學(xué)社會(huì)學(xué)系,北京100871)
自雷文斯坦[1]發(fā)表《遷移規(guī)則》以來,流動(dòng)人口的選擇性一直是其研究的重要內(nèi)容,重點(diǎn)在于回答“誰在遷移”這一問題。尤其是正處在特殊社會(huì)轉(zhuǎn)型時(shí)期的中國,人口流動(dòng)既是一個(gè)重要的社會(huì)現(xiàn)象,更是社會(huì)轉(zhuǎn)型的重要?jiǎng)恿碓?,?duì)這一問題的回答有著重要的社會(huì)意義。眾多研究已說明我國人口遷移與流動(dòng)在年齡、教育、婚姻狀況等特征方面存在著顯著的選擇性[2-13]。近年來,有關(guān)選擇性的討論擴(kuò)展到了健康問題[14-18]。所謂健康選擇性是指越健康的人更有可能流動(dòng)。在中國的社會(huì)情境下,移民的健康選擇性是否存在及這種選擇性是否會(huì)隨著時(shí)間、特別是人口遷移與流動(dòng)的普遍而消亡等問題仍在討論中,并未獲得一致的結(jié)論。如同鈺瑩等[14]認(rèn)為隨著社會(huì)發(fā)展,流動(dòng)人口的健康選擇性逐步隨著時(shí)間而消亡;而有些研究則持相反意見,認(rèn)為流動(dòng)人口仍存在健康選擇性。本文關(guān)心的第一個(gè)問題是利用新的調(diào)查數(shù)據(jù)檢驗(yàn)流動(dòng)人口的健康選擇性是否存在。個(gè)體健康會(huì)受到來自社會(huì)經(jīng)濟(jì)地位、行職業(yè)及個(gè)人特征等多方面的影響。因此,流動(dòng)人口的健康選擇性可能與其他選擇性相重合,或被其他各類選擇性所替代,從而使分析結(jié)果表現(xiàn)為不存在健康選擇性,但這并不能說明健康選擇性無作用或者消失。因此,如果想要真正地討論健康與流動(dòng)之間的關(guān)系,線性回歸或Logistic回歸方法可能會(huì)由于內(nèi)生性問題而得到有偏的結(jié)果,需要利用其他方法來討論或解決。因此本文想要討論的第二個(gè)問題是內(nèi)生性是否會(huì)導(dǎo)致健康選擇性的消失。
本研究將利用“中國家庭追蹤調(diào)查”兩輪跟蹤數(shù)據(jù),通過對(duì)比流動(dòng)(特別是新增流動(dòng)人口)與非流動(dòng)人口,真正檢驗(yàn)了健康選擇性在人口流動(dòng)中的作用。首先,從因果的時(shí)間順序看,截面數(shù)據(jù)中原因與結(jié)果通常都在一個(gè)時(shí)間點(diǎn)上,從而無法真正判斷兩者在因果關(guān)系中的時(shí)間順序;而本文利用跟蹤調(diào)查數(shù)據(jù),以前一期的健康作為原因,探討其對(duì)是否流動(dòng)的影響,才有可能真正討論流動(dòng)人口的健康選擇性;其次,健康一般具有較強(qiáng)的時(shí)點(diǎn)性(即遷移或流動(dòng)時(shí)刻的健康狀況對(duì)其流動(dòng)的影響),本研究利用兩輪調(diào)查之間新增的流動(dòng)人口,而不是所有流動(dòng)人口,其優(yōu)點(diǎn)在于:既避免了由于在流入地居住時(shí)間不同而產(chǎn)生的子群體差異(及由此帶來的其他選擇性),也避免居留時(shí)長帶來的健康損耗問題[19];再次,本文在討論過程中利用各種方法控制了健康的內(nèi)生性問題,進(jìn)而相對(duì)有效地保證了估計(jì)的無偏性,有助于更好地理解流動(dòng)人口的健康選擇性。因此,本研究在因果關(guān)系、樣本選擇等方面都具新穎之處,分析結(jié)果可以檢驗(yàn)以往某些理論與實(shí)證研究結(jié)論,因而具有重要的理論與現(xiàn)實(shí)意義。
(一)研究綜述
國際移民研究中發(fā)現(xiàn)了移民的健康悖論現(xiàn)象(Hispanic Health Paradox或 Epidemiologic Para?dox)[20],即移民雖然社會(huì)經(jīng)濟(jì)地位較低,但其健康狀況要優(yōu)于流入地本地居民。這種悖論現(xiàn)象不僅存在于墨西哥-美國移民群體以及其他國家中[21-25],而且在人群死亡率、嬰兒死亡率、自評(píng)健康、ADL等不同的健康指標(biāo)[20][24][26-30]上亦有所體現(xiàn)。
對(duì)這種悖論的理論解釋主要有兩種視角:一是移民的健康選擇性,即健康移民假說(Healthy Migrant Hypothesis),即移民是經(jīng)過正向健康選擇的一批人,能夠克服移民過程中的艱苦環(huán)境、適應(yīng)流入地的工作生活環(huán)境以及高強(qiáng)度高體力的勞動(dòng);健康選擇機(jī)制使得只有在流出地更健康的人才有可能進(jìn)入遷移人口的行列。另一種是三文魚偏誤假設(shè)(Salmon Bias Hypothesis),即在人口遷移過程中,那些健康狀況明顯惡化的人往往無法長期滯留在遷入地,出于生活成本、社會(huì)保障需求等方面的考慮,這些人更可能返回遷出地[15][17]。
國內(nèi)有關(guān)流動(dòng)人口健康問題的研究都試圖檢驗(yàn)健康移民假設(shè)和三文魚偏誤假設(shè)兩種視角對(duì)中國流動(dòng)人口健康選擇的解釋,總體上為中國流動(dòng)人口的健康選擇機(jī)制研究提供了基礎(chǔ)[14-15][17][31]。研究結(jié)果基本都表明:中國人口流動(dòng)存在較明顯的“健康移民”和“三文魚偏誤”選擇效應(yīng)[15][17][31],且城鄉(xiāng)流動(dòng)對(duì)農(nóng)村常住人口的總體健康狀況具有重要影響[16]。
從流動(dòng)人口的社會(huì)背景看,中國流動(dòng)人口主要是從農(nóng)村流向城市,以務(wù)工性流動(dòng)為主,在城市中主要從事技術(shù)含量較低的體力勞動(dòng),面臨著收入較低、工作風(fēng)險(xiǎn)較高、健康保障較差的現(xiàn)狀[32-33]。高強(qiáng)度的體力勞動(dòng)及較差的生活環(huán)境[32][34],對(duì)勞動(dòng)者的身體素質(zhì)有較高的要求,身體狀況較差的流動(dòng)人口將無法適應(yīng)這類勞動(dòng),從而無法在城市中獲得穩(wěn)定的勞動(dòng)收入。已有研究也表明:自評(píng)更健康的人,在流動(dòng)后其自評(píng)健康指標(biāo)仍優(yōu)于城鎮(zhèn)居民[14-18]。這些背景與研究結(jié)果都表明健康選擇性的存在。同時(shí),亦有研究指出,隨著流動(dòng)時(shí)間的延長,流動(dòng)人口的健康存在損耗[35];健康耗損嚴(yán)重的農(nóng)村外出務(wù)工人員回到農(nóng)村的概率更高,造成了當(dāng)前在城市務(wù)工的農(nóng)村人員與城市本地工作人員相比看上去并未出現(xiàn)更為嚴(yán)重的健康耗損的假象[19]。這從另一方面說明了“三文魚偏誤”效應(yīng)。
但也有研究指出,中國流動(dòng)人口健康選擇機(jī)制的效應(yīng)會(huì)隨時(shí)期的變化而逐步消失;這種變化可能與中國經(jīng)濟(jì)改革背景下劇烈的社會(huì)經(jīng)濟(jì)、政策變動(dòng)有關(guān),因此流動(dòng)人口健康選擇機(jī)制的研究需要加入社會(huì)經(jīng)濟(jì)背景變遷等宏觀維度因素的考察[14]。而且,流動(dòng)人口與流入地居民之間在長期健康狀況上差異的顯著性遠(yuǎn)遠(yuǎn)高于在近期健康狀況上差異的顯著性;不同健康指標(biāo)的選取對(duì)實(shí)驗(yàn)結(jié)果的影響大于控制變量對(duì)結(jié)果的影響[18]①易龍飛等[18]與同鈺瑩等[14]的文章雖然使用的都是CHNS數(shù)據(jù),但差異主要在以下三點(diǎn):一、調(diào)查時(shí)點(diǎn)不同,前者使用了2006、2009和2011三輪數(shù)據(jù);而后者則使用了1997~2009的五期數(shù)據(jù);二、研究對(duì)象的年齡范圍不同,前者是18~64歲,后者規(guī)定在16~35歲;三、健康的定義不同,前文使用各種客觀指標(biāo),后者則只使用自評(píng)健康。因此從某種意義上,兩篇文章說明的是各自的問題,而結(jié)果無法比較。但本文同意易文中提出的健康選擇性依然存在的結(jié)論。。
(二)研究評(píng)述
綜上所述,可見盡管國內(nèi)學(xué)術(shù)界已對(duì)健康與人口流動(dòng)的關(guān)系有了較多的研究,當(dāng)前在討論流動(dòng)人口的健康選擇性時(shí)仍存在以下幾點(diǎn)問題:
第一,數(shù)據(jù)問題。盡管已有很多流動(dòng)人口(或農(nóng)村勞動(dòng)力轉(zhuǎn)移)的調(diào)查數(shù)據(jù),但各種來源的抽樣調(diào)查數(shù)據(jù),在抽樣過程(如某些調(diào)查僅針對(duì)部分省份展開)與樣本代表性(各種結(jié)構(gòu)性偏差)等都需要予以檢驗(yàn)與討論,而不能“拿來主義”。且有關(guān)流動(dòng)人口的調(diào)查不論是在流入地還是在流出地進(jìn)行,由于涉及到研究組與參照組的選擇而未必能正確地探討流動(dòng)與健康間的關(guān)系。
第二,時(shí)間順序問題。盡管已有研究注意到了健康與流動(dòng)在因果關(guān)系上的時(shí)間順序問題而采用滯后一期的健康測(cè)量結(jié)果[14][31],但仍有部分研究是利用截面調(diào)查數(shù)據(jù)進(jìn)行的分析。截面數(shù)據(jù)的問題就在于:原因與結(jié)果通常都在一個(gè)時(shí)間點(diǎn)上,從而無法在識(shí)別與判斷因果關(guān)系時(shí)保證原因與結(jié)果在時(shí)間上的先后順序。既無法判斷原因的結(jié)果,也無法考察結(jié)果的真正原因。
第三,研究組與參照組的選擇。這個(gè)問題既與調(diào)查數(shù)據(jù)有關(guān),且也與因果的時(shí)間順序相聯(lián)系,從而影響到正確判斷流動(dòng)與健康間的關(guān)系。首先需要說明,從研究對(duì)象看,在討論流動(dòng)人口健康選擇性時(shí),應(yīng)該以t-1時(shí)刻的非流動(dòng)人口為基礎(chǔ),將t-1時(shí)刻至t時(shí)刻間新產(chǎn)生的流動(dòng)人口作為研究組,相應(yīng)的t時(shí)刻仍然是非流動(dòng)的人口作為參照組,這才有可能檢驗(yàn)健康對(duì)流動(dòng)的選擇性;而在討論三文魚效應(yīng)時(shí),研究對(duì)象應(yīng)是t-1時(shí)刻的流動(dòng)人口,其中參照組是t-1時(shí)刻和t時(shí)刻均為流動(dòng)的人口,研究組則是在t-1至t時(shí)刻之間返遷的原流動(dòng)人口。即分析時(shí)應(yīng)保證研究組與參照組都來自于同一群研究對(duì)象,這對(duì)樣本就提出了很高的要求。
相應(yīng)的,從調(diào)查數(shù)據(jù)來看,調(diào)查地點(diǎn)是獲得合適的研究對(duì)象的重要基礎(chǔ)。流入地調(diào)查的樣本只包括了當(dāng)前的流動(dòng)人口和流入地的本地人口,但既沒包括流出地的非流動(dòng)人口,也沒包括那些返遷的流動(dòng)人口,因此,從某種意義上它無法說明流動(dòng)人口的健康選擇性。同樣的,流出地調(diào)查盡管包括了返遷人口,卻無法捕獲已流出的人口(現(xiàn)有的流動(dòng)人口),亦無法說明三文魚現(xiàn)象。如果想要討論流動(dòng)與健康的關(guān)系,就必須結(jié)合流出地與流入地的調(diào)查,以保證研究組與參照組來自于同一群體。部分研究將所有的流動(dòng)人口作為研究對(duì)象,將其與城市或農(nóng)村常住人口相比較。這種比較顯然不滿足于上述對(duì)研究組與參照組的要求。
其四,健康選擇性的時(shí)點(diǎn)性。任何人的健康狀態(tài)都會(huì)隨時(shí)間而發(fā)生變化,因此,要想真正討論健康選擇性,最理想的應(yīng)該是測(cè)量流動(dòng)人口在流動(dòng)時(shí)刻(或返遷人口在返遷時(shí)刻)的健康狀況。顯然這并不現(xiàn)實(shí)。因此,在研究中會(huì)使用前一期的測(cè)量結(jié)果作為流動(dòng)/返遷時(shí)的健康狀態(tài)。這只是一個(gè)近似結(jié)果,且仍然會(huì)要求前后兩期測(cè)量的時(shí)間間隔不能太長。
同時(shí),流動(dòng)人口的健康隨著在流入地居留時(shí)長而有所損耗[19][35],因此,如果選擇當(dāng)前所有的流動(dòng)人口作為研究對(duì)象時(shí),一方面返遷人口存在健康的“三文魚效應(yīng)”,從而使流動(dòng)人口的健康水平被高估(亦低估了非流動(dòng)人口健康的平均水平);另一方面,計(jì)算所得的健康是以居留時(shí)長為權(quán)重的均值,而并非是真正的流動(dòng)決策時(shí)的健康狀況。也就無法有效準(zhǔn)確地估計(jì)健康選擇性。
上述四個(gè)問題主要是從樣本與健康作用的時(shí)點(diǎn)性來看的,但目前已有的研究在方法(如內(nèi)生性與因果推論間的關(guān)系)和理論(研究結(jié)論的理論概括)等方面仍然需要繼續(xù)深入。
(三)研究假設(shè)
綜上所述,本文將主要討論以下兩個(gè)方面:首先,作為流動(dòng)人口選擇性的重要維度之一,健康選擇性會(huì)長期存在并影響到人口的流動(dòng)。盡管在控制了個(gè)體特征以后,健康對(duì)于流動(dòng)的影響作用似乎并不存在,但有可能是因?yàn)榻】颠x擇性被其他因素的選擇性所掩蓋,而并不是說健康選擇性不存在。其次,由于自評(píng)健康本身可能存在選擇性,從而使分析過程中自評(píng)健康的系數(shù)可能產(chǎn)生選擇性偏差(selection bias)。只有解決以上兩個(gè)問題,才有可能對(duì)流動(dòng)人口的健康選擇性進(jìn)行系統(tǒng)的檢驗(yàn)。因此本文的研究假設(shè)是:流動(dòng)人口存在健康選擇性,即越健康的人越有可能流動(dòng)。
本文將使用有全國代表性的中國家庭追蹤調(diào)查(China Family Panel Studies,CFPS)①有關(guān)該調(diào)查的詳細(xì)情況請(qǐng)參見:http://www.isss.edu.cn/cfps/。2010年和2012年兩輪數(shù)據(jù)。
(一)變量的操作化定義
因變量:本文的因變量是個(gè)體的流動(dòng)狀態(tài)。我國的相關(guān)研究中,流動(dòng)人口一般被定義為:在現(xiàn)居住地居住半年以上、且居住地不同于戶口所在地的人。CFPS2010數(shù)據(jù)中只詢問了戶口所在地,但并沒有詢問在本地的居住時(shí)間長度。因此,2010年的“流動(dòng)人口”定義為:現(xiàn)居住地與戶籍登記地不同的人,而未考慮時(shí)間因素。在2012年的跟蹤調(diào)查中,增加了流出時(shí)間的問題。因此,2012年的“流動(dòng)人口”定義在2010年的基礎(chǔ)上加入了流出時(shí)間限制。在兩輪調(diào)查數(shù)據(jù)處理中,分別對(duì)當(dāng)年的“流動(dòng)人口”標(biāo)記為1;“非流動(dòng)人口”標(biāo)記為0;“新增流動(dòng)”定義為10年調(diào)查時(shí)未流動(dòng)而12年調(diào)查時(shí)為流動(dòng)的人口(具體情況請(qǐng)見表1)。
表1 關(guān)鍵變量的描述性統(tǒng)計(jì)量
自變量:
自評(píng)健康作為一個(gè)綜合性的評(píng)價(jià)指標(biāo),能代表較為全面的個(gè)人健康狀況,因此本文將使用自評(píng)健康這一指標(biāo)作為研究自變量①本文在建立模型的過程中曾利用其他指標(biāo),包括身體健康(BMI、兩周病傷和慢性病等)和心理健康(抑郁指數(shù))等。但結(jié)果與自評(píng)健康基本相同。因此本文最終僅選擇自評(píng)健康作為研究變量。。該變量對(duì)應(yīng)問卷中的問題“您覺得自己的健康狀況如何”。在10年的數(shù)據(jù)中,將一般、比較不健康、不健康和非常不健康歸為“不健康”(參照組),將“健康”歸為一類;由此構(gòu)造成一個(gè)二分變量。在12年的回答中,將非常健康、很健康和比較健康歸類合并為“健康”,將差和一般歸為“不健康”(參照組)。
控制變量的選擇包括個(gè)體和家庭兩個(gè)層面,設(shè)置基本與同鈺瑩文相同。個(gè)體層次的變量包括:人口學(xué)特征(年齡和性別)、受教育水平、職業(yè)類型、居住地點(diǎn)等;家庭層次包括:父母年齡、配偶是否同住、是否有12歲以下孩子需要照顧、家庭規(guī)模、家庭年收入對(duì)數(shù)以及家庭人均收入等。同時(shí)為了控制地區(qū)間的差異對(duì)流動(dòng)的影響,基于個(gè)人所在地省份設(shè)置了地區(qū)變量。
關(guān)鍵變量②由于篇幅所限,這里僅展示關(guān)鍵變量的描述性統(tǒng)計(jì)結(jié)果,完整結(jié)果可聯(lián)系作者。的描述性統(tǒng)計(jì)量請(qǐng)見表1。
(二)研究思路
本文將利用全國代表性追蹤數(shù)據(jù),討論流動(dòng)人口的健康選擇性問題,并期與以往研究對(duì)話。因此,本文將首先從截面數(shù)據(jù)的角度,分別利用CFPS2010和2012兩輪調(diào)查,考察調(diào)查時(shí)點(diǎn)的個(gè)體健康對(duì)其當(dāng)時(shí)的流動(dòng)狀態(tài)的影響。
其次,為了說明健康對(duì)流動(dòng)在時(shí)間上的因果順序,建立滯后效應(yīng)(lag effect)模型,從2010年非流動(dòng)人口的跟蹤樣本中,挑選出在2010年至2012年間新增加的流動(dòng)人口(標(biāo)記為1),以2010年和2012年均為非流動(dòng)人口的跟蹤樣本為參照組;并以2010年時(shí)的變量為自變量,討論2010年的健康狀況對(duì)是否成為新增流動(dòng)人口的影響作用。
上述兩個(gè)步驟過程中,為了能夠與以往結(jié)果對(duì)比,本文將首先設(shè)定與同文基本一致的模型;然后在此基礎(chǔ)上加入年齡范圍和年齡與健康的交互項(xiàng)建立模型,并與原模型進(jìn)行比較,以說明兩種模型間在結(jié)果上的差異。再次,將使用不同模型來檢驗(yàn)流動(dòng)人口健康選擇性是否被內(nèi)生性問題影響或其他選擇性掩蓋而產(chǎn)生偏差。最后,將自評(píng)健康視為實(shí)驗(yàn)變量,在控制自評(píng)健康的內(nèi)生性問題的基礎(chǔ)上,利用傾向得分匹配方法討論自評(píng)健康對(duì)流動(dòng)的影響作用。
(三)分析方法
本文所用的方法主要包括Logistic回歸、對(duì)應(yīng)于稀少事件(rare event)的firthlogit回歸、以及傾向得分匹配方法。
所謂稀少事件,是指在一定的樣本規(guī)模下事件發(fā)生的案例數(shù)極少、比例極低的現(xiàn)象。Logistic回歸一般要求事件發(fā)生(因變量=1)的比例至少高于5%。一旦這種比例小于5%,Logistic回歸的合理運(yùn)用,不僅與事件發(fā)生比例有關(guān),且也與樣本總規(guī)模有關(guān):如果樣本總規(guī)模過少(如只有幾十人),就不能用Logistic回歸;如果樣本總規(guī)模較大,則需要看發(fā)生事件數(shù)(絕對(duì)規(guī)模)。如果1000個(gè)樣本中只有20個(gè)發(fā)生案例,那么Logistic回歸就會(huì)有問題;如果是10000個(gè)樣本中有200個(gè)發(fā)生案例(事件發(fā)生比例仍然只有2%),則Logistic回歸是可以接受的;如果100000個(gè)案例中有2000個(gè)發(fā)生案例(比例仍然沒變),那么Logistic回歸的結(jié)果就沒有任何問題[36]。回應(yīng)本文的樣本情況,在2010年的25025個(gè)非流動(dòng)人口中,只有246個(gè)新增流動(dòng)人口,占比僅為0.98%。這個(gè)結(jié)果遠(yuǎn)小于上述經(jīng)驗(yàn)案例情況。因此,利用Logistic回歸和最大似然估計(jì)方法可能會(huì)產(chǎn)生一定的偏差,需要利用懲罰性似然估計(jì)方法(penalized likelihood)及其對(duì)應(yīng)的firthlog?it方法來估計(jì)(該方法可詳細(xì)參閱King&Zeng[36])。
表2 歷次普查中流動(dòng)人口的年齡結(jié)構(gòu)變動(dòng)
傾向得分匹配方法已成為基于反事實(shí)因果推論、解決內(nèi)生性問題后有效評(píng)估實(shí)驗(yàn)效應(yīng)的重要方法之一(可詳細(xì)參閱相關(guān)文獻(xiàn)[37-41])。
(一)流動(dòng)人口的年齡結(jié)構(gòu)及其變動(dòng)
同鈺瑩等[14]在討論健康選擇性時(shí),分析對(duì)象是16~35歲的人口。本文認(rèn)為,盡管16~35歲組的流動(dòng)人口占整個(gè)流動(dòng)人口的比重確實(shí)較大,但事實(shí)上近年來流動(dòng)人口的內(nèi)部結(jié)構(gòu)正逐步發(fā)生變化。流動(dòng)人口不僅“流而不動(dòng)”[42],在城市中長期居留不再回到農(nóng)村[43];更重要的是內(nèi)部年齡結(jié)構(gòu)發(fā)生變化,流動(dòng)人口的年齡中位數(shù)從1982年的23歲上升到2010年的29歲,且2000至2010年間,35歲及以上流動(dòng)人口的增長率遠(yuǎn)高于較低年齡組[43]。表2展現(xiàn)了第四、第五和第六次人口普查中流動(dòng)人口年齡結(jié)構(gòu)及其變動(dòng)狀況。由表中的數(shù)據(jù)可看到,我國流動(dòng)人口的平均年齡與年齡中位數(shù)都在不斷提高;同時(shí),35歲以上的流動(dòng)人口比例也從1990年的20%左右,提高到2010年的35.7%(占16歲及以上人口的40.39%)。這一點(diǎn)也同樣反映在CFPS的數(shù)據(jù)中。因此,從年齡結(jié)構(gòu)來看,將年齡結(jié)構(gòu)限定在16~35歲,絕不是“相對(duì)很少的流動(dòng)人口”,而是可能遺漏了一大批的流動(dòng)人口①本文同意同鈺瑩等人關(guān)于提高年齡上限可能出現(xiàn)由于人口返遷及三文魚現(xiàn)象的偏誤問題的判斷。。而且,這種年齡結(jié)構(gòu)的變化本身就體現(xiàn)了社會(huì)變遷的作用。因此,本文將分析擴(kuò)展到全年齡段,但不同年齡段流動(dòng)人口的遷移與流動(dòng)的原因可能完全不同。
(二)截面數(shù)據(jù)與跟蹤數(shù)據(jù)的分析結(jié)果
本部分使用2010年和2012年截面數(shù)據(jù),以及跟蹤樣本數(shù)據(jù),討論流動(dòng)人口的健康選擇性問題。有關(guān)結(jié)果請(qǐng)見表3和表4。
表 3中的模型(1)和模型(3)的設(shè)置(年齡與變量)與同鈺瑩等[14]的文章完全相同;模型(2)和模型(4)將年齡擴(kuò)展到全部年齡,并在變量設(shè)置中加入了年齡的平方項(xiàng)、年齡與自評(píng)健康的交互項(xiàng)②注意:2012年截面模型中,由于職業(yè)分類不同于2010年及中國健康與營養(yǎng)調(diào)查(CHNS),因此,在2012年的模型中未加入職業(yè)變量。。表4則是對(duì)跟蹤樣本的分析,其中的模型(5)的設(shè)置與同文相同,在后續(xù)模型中逐步擴(kuò)展至全部年齡段,并加入年齡與自評(píng)健康的交互項(xiàng)。由于兩期合并后的追蹤樣本中流動(dòng)人口所占比例過低(共246人,占0.98%),無法使用常規(guī)的Logistic回歸,因此代之以firthlogit回歸方法。
2010年和2012年截面數(shù)據(jù)的分析結(jié)果都表明,在控制了各種其他因素以后,流動(dòng)人口的自評(píng)健康均不顯著。但這一結(jié)果尚未真正說明流動(dòng)人口的健康選擇性的不存在,因?yàn)榻孛鏀?shù)據(jù)的原因變量與結(jié)果變量是在同一個(gè)時(shí)點(diǎn)上的,違背了因果關(guān)系的時(shí)間順序。
表3 截面數(shù)據(jù)分析結(jié)果
表4 2010~2012年新增流動(dòng)人口的firthlogit分析結(jié)果
為了改進(jìn)這一問題,表4中的模型利用2010年的自變量,解釋2010年至2012年間新增流動(dòng)人口的決策機(jī)制。在表4的模型(5)和模型(6)中自評(píng)健康仍然是不顯著的,說明作為原因的2010年健康狀況不會(huì)影響2010至2012年間的流動(dòng)決策,即流動(dòng)人口的健康選擇性不存在,這一結(jié)果與同鈺瑩等相同。但是模型(7)顯示,在加入年齡與自評(píng)健康的交互項(xiàng)以后,不僅自評(píng)健康這一變量變成顯著的,而且年齡與自評(píng)健康的交互項(xiàng)也是顯著的。在模型(7)中,自評(píng)健康是正向的,即自評(píng)健康好的人,他們流動(dòng)的可能性是不健康的人群的2.5128倍,相對(duì)高出了1.5倍;而年齡與自評(píng)健康的交互項(xiàng)則呈現(xiàn)出負(fù)向顯著,即:在相同的健康狀況下,年齡越大,越不會(huì)流動(dòng)。這一結(jié)論可以說明,健康與年齡可能共同決定了個(gè)體的流動(dòng)決策。因此健康選擇性可能仍然是存在的。
此外,模型(6)和模型(7)中的其他變量也呈現(xiàn)出一定的差異。例如加入交互項(xiàng)后,年齡變量的負(fù)向作用仍然存在但是顯著性消失,這也進(jìn)一步說明年齡與自評(píng)健康的共同作用機(jī)制。性別變量一直呈現(xiàn)負(fù)向顯著,即女性比男性更易于流動(dòng);婚姻狀況在16~35歲人群中具有的顯著性,在全年齡段中則呈現(xiàn)出不顯著;教育的選擇性呈現(xiàn)出穩(wěn)定的作用,即受教育水平越高,越容易流動(dòng);個(gè)人職業(yè)、家庭結(jié)構(gòu)及經(jīng)濟(jì)收入等均不顯著。這些結(jié)果,有些與以往的研究結(jié)論相符(如受教育水平等),有些卻是相悖的(如性別、婚姻狀況等)①為節(jié)約篇幅,本文主要關(guān)注自評(píng)健康與年齡這兩變量。對(duì)模型中的其他變量不再予以特別的解釋。。
這一結(jié)果引發(fā)的思考是②同時(shí)可能影響結(jié)果的另一個(gè)問題來自于樣本。由于兩次調(diào)查之間的樣本規(guī)模較小,使其對(duì)兩年間的新增流動(dòng)人口的代表性較低。由于CFPS是全國代表性數(shù)據(jù),因此,本文在此不再討論有關(guān)樣本問題。:流動(dòng)人口的健康選擇性是否可能被其他因素所替代,還是由于自評(píng)健康可能存在內(nèi)生性問題影響結(jié)果呢?因此接下來將討論健康選擇性的替代問題。
(三)健康選擇性的替代問題
表5 2010~2012年新增流動(dòng)人口影響因素的分步firthlogit回歸結(jié)果(全部流動(dòng)人口)
為了討論流動(dòng)人口健康選擇性的替代問題,我們通過逐步回歸的方法重構(gòu)表4中的模型(7)。具體結(jié)果請(qǐng)見表5。僅使用自評(píng)健康進(jìn)行單變量回歸時(shí),結(jié)果呈現(xiàn)出高度的正向顯著,即表示自評(píng)越健康的人,其成為流動(dòng)人口的概率是不健康者的1.7倍。如果不考慮其他因素,則健康選擇性是成立的。在此基礎(chǔ)上,加入年齡變量后則自評(píng)健康不再顯著,而年齡卻呈現(xiàn)出負(fù)向的作用,即年齡每增加一歲,成為流動(dòng)人口的概率會(huì)下降7%左右(1-exp(-0.0656))①要注意年齡的階段性作用,即不同年齡段,其作用可能是不同的。這里既有代際(如老一代流動(dòng)人口與新生代流動(dòng)人口)的關(guān)系問題,也有不同年齡段對(duì)應(yīng)不同的流動(dòng)原因與結(jié)果的可能。因此,年齡的作用尚需要進(jìn)一步的討論。。這兩個(gè)模型之間的差異,說明健康對(duì)流動(dòng)的作用可能會(huì)被年齡所解釋.如果再考察健康與年齡之間的關(guān)系,則可以發(fā)現(xiàn),年齡對(duì)于自評(píng)健康有著顯著的負(fù)向關(guān)系,年齡越大,自評(píng)健康狀況越差。這一方面說明自評(píng)健康可能會(huì)有內(nèi)生性問題,另一方面則說明年齡可能存在著替代健康的選擇性問題。
加入年齡與自評(píng)健康的交互項(xiàng)以后,自評(píng)健康的作用不僅顯著性發(fā)生變化,而且方向也發(fā)生了變化,由模型(9)中的負(fù)向不顯著,變成了模型(10)中的正向顯著,進(jìn)一步說明了健康選擇性的存在。該交互項(xiàng)在模型(10)呈現(xiàn)出負(fù)向顯著的作用,即在自評(píng)健康較好的人群中,年齡越大越不容易流動(dòng)。但如果要考察在相同年齡之下自評(píng)健康的作用時(shí),就需要將該交互項(xiàng)的系數(shù)與自評(píng)健康這一變量的系數(shù)相加(即0.8484-0.0264=0.8220),則相對(duì)于而言,自評(píng)健康越好的人成為流動(dòng)人口的可能性是自評(píng)不健康的人的2.2750倍,即高出將近1.3倍。
此后的幾個(gè)模型中,自評(píng)健康以及自評(píng)健康與年齡的交互項(xiàng)這兩個(gè)變量的作用幾乎沒有發(fā)生任何實(shí)質(zhì)性的變化,都呈現(xiàn)出顯著的作用,且方向一致。但在模型(12)和(13)中加入家庭層次的變量以后,年齡的作用卻變得不顯著了。這種情況有可能是因?yàn)槟挲g存在著與教育類似的階段性的影響作用[44]。
之所以在模型(11)的基礎(chǔ)上,繼續(xù)加入了自評(píng)健康與地帶的交互項(xiàng),希望考察健康選擇性的地區(qū)差異。結(jié)果表明存在地區(qū)異質(zhì)性作用,在健康的人群中,東部地帶的人更不容易流動(dòng)(=-0.9306);而中西部地帶則未呈現(xiàn)出顯著的選擇性。
(四)自評(píng)健康對(duì)流動(dòng)的平均實(shí)驗(yàn)效應(yīng)的估計(jì)
以上分析結(jié)果對(duì)本文提出的研究假設(shè)提供了支持,即在社會(huì)的變遷和流動(dòng)人口群體內(nèi)部結(jié)構(gòu)變化的背景下,流動(dòng)人口的健康選擇性依然存在。但自評(píng)健康變量內(nèi)生性導(dǎo)致的估計(jì)偏誤還沒有被討論。因此,本文將以自評(píng)健康為實(shí)驗(yàn)變量,利用傾向得分方法,解決內(nèi)生性偏誤后再考察流動(dòng)與自評(píng)健康間的關(guān)系問題。分析結(jié)果請(qǐng)見表6。該表包括了兩個(gè)部分,左側(cè)部分是各種參數(shù)設(shè)置之下的平均實(shí)驗(yàn)效應(yīng)的分析結(jié)果;右側(cè)則是在各種參數(shù)設(shè)置之下Stata按回歸分析方法輸出的結(jié)果(由于在各種設(shè)置之下的結(jié)果基本相同,因此,此處僅給出一個(gè)結(jié)果作為代表)。其中,用于構(gòu)建自評(píng)健康傾向得分的協(xié)變量包括:年齡、性別、是否已婚、教育、行業(yè)、居住地、個(gè)體收入、家庭收入、地帶、BMI指數(shù)、肥胖狀況以及精神健康狀況。
表6 利用傾向得分匹配方法的估計(jì)結(jié)果(全部流動(dòng)人口)
首先看右側(cè)結(jié)果。該結(jié)果表明,不論何種匹配方法,在控制了自評(píng)健康的內(nèi)生性問題以后,平均實(shí)驗(yàn)效應(yīng)仍然是顯著的正向作用,即越健康的人越容易流動(dòng)。而且這一結(jié)果在各種參數(shù)設(shè)置條件下都是相同的。
其次,再來看左側(cè)不同參數(shù)設(shè)置條件下的分析結(jié)果。這些結(jié)果都表明,自評(píng)健康對(duì)于流動(dòng)的實(shí)驗(yàn)效應(yīng)都是顯著的正向:在缺省設(shè)置的條件下,估計(jì)的平均實(shí)驗(yàn)效應(yīng)為0.004219;而在其后的兩種設(shè)置下,其實(shí)驗(yàn)效應(yīng)則分別為0.003393和0.003628,其中的差異主要來自于匹配案例數(shù)的不同。在半徑匹配中,該實(shí)驗(yàn)效應(yīng)則為0.005980,且顯著性增加。
如果將這些系數(shù)與前兩部分的分析結(jié)果中的系數(shù)對(duì)比(盡管Logit回歸分析中各模型間的系數(shù)可能無法對(duì)比[45-46]),可以看到,平均實(shí)驗(yàn)效應(yīng)明顯下降,從原來的0.9214下降為現(xiàn)在的0.006。這種較大幅度的下降,其根源還是在于自評(píng)健康的選擇性。即如果不考慮logistic回歸中的特殊性問題,那么在上述回歸分析中關(guān)于自評(píng)健康對(duì)流動(dòng)的影響作用可能會(huì)由于自評(píng)健康的內(nèi)生性問題而導(dǎo)致偏差。同時(shí),這一結(jié)果也說明流動(dòng)人口健康選擇性的存在。
本文利用中國家庭動(dòng)態(tài)調(diào)查數(shù)據(jù),利用各種方法討論并回答流動(dòng)人口健康選擇性是否存在這一問題。分析結(jié)果表明:(1)流動(dòng)人口內(nèi)部年齡結(jié)構(gòu)正在發(fā)生變化,這既是社會(huì)變遷的結(jié)果,也是流動(dòng)人口健康選擇性時(shí)需要考慮的問題;(2)在排除了變量的時(shí)間因果順序后,跟蹤樣本中的新增流動(dòng)人口仍存在健康選擇性;(3)健康選擇性可能與年齡選擇性同時(shí)存在,從而可能會(huì)使年齡選擇性(或其他可能的選擇性)掩蓋了健康選擇性的真實(shí)存在;(4)即使剔除了自評(píng)健康的內(nèi)生性(或選擇性)問題以后,自評(píng)健康對(duì)流動(dòng)決策的實(shí)驗(yàn)效應(yīng)仍然是正向的,這說明健康選擇性仍存在于流動(dòng)人口的流動(dòng)決策之中。研究結(jié)果說明流動(dòng)人口的健康選擇性并未隨著社會(huì)環(huán)境與背景的變化而消失,相反,在考慮了社會(huì)變遷(如調(diào)查時(shí)點(diǎn)的變化和流動(dòng)人口年齡結(jié)構(gòu)的變化)以及自評(píng)健康的內(nèi)生性問題后,健康選擇性依然存在;越健康的個(gè)體越有可能進(jìn)行流動(dòng)。這在某種程度上說明,健康,類似于某些人口學(xué)(如年齡)或社會(huì)特征(如婚姻、教育等),總是存在選擇性的。只是這種選擇性可能會(huì)與其他選擇性特征或是重合或是替代,從而在實(shí)證分析結(jié)果中呈現(xiàn)出不顯著的作用。但這種統(tǒng)計(jì)上的不顯著,并不能夠真正地說明健康選擇性的消失。有可能的是,不論在何種社會(huì)背景之下,其作用呈現(xiàn)出的強(qiáng)弱之分,或是顯性或隱性之分。因此,重新回到遷移的選擇性理論中,則健康同樣是遷移與流動(dòng)的選擇性的重要維度之一。
當(dāng)然上述結(jié)果仍是階段性的,其中樣本、分析過程與分析方法等都還有進(jìn)一步商榷的地方。
首先,本文中所考察的樣本是針對(duì)所有年齡段的人口,結(jié)果表明流動(dòng)人口的健康選擇性是存在的。但如果僅對(duì)16~35歲的人群,健康選擇性并不存在。這一點(diǎn)與同鈺瑩等的結(jié)果是相同的。這兩個(gè)完全不同的結(jié)果告訴我們應(yīng)該用變遷的眼光看待這種健康的選擇性問題。一方面,社會(huì)變遷提高了所有年齡段人群的流動(dòng)強(qiáng)度(即流動(dòng)人口的年齡結(jié)構(gòu)發(fā)生的變化),特別是大于35歲年齡組的人群的流動(dòng)率,從而使原有的年齡分組有所局限;并使健康的選擇性可以擴(kuò)展并適用于所有年齡段。另一方面則是社會(huì)變遷使得16~35歲的人群普遍健康與普遍流動(dòng),年齡的選擇性從某種意義上掩蓋了健康的選擇性,從而使該年齡段的健康選擇性似乎不存在了;即健康選擇性被年齡選擇性所掩蓋,但并不能說健康選擇性消失了。
其次,從樣本的角度看,本研究盡管利用了跟蹤樣本,且從跟蹤樣本的非流動(dòng)人口中尋找出兩次調(diào)查期間的新增流動(dòng)人口。但分析過程并未判斷這些新增流動(dòng)人口的流出地,而是以2010年的全部非流動(dòng)人口作為參照組。這時(shí)的參照組可能是流出地人群和流入地人群這兩個(gè)部分的混合,而并非真正的“潛在流動(dòng)人口”。當(dāng)然這是從嚴(yán)格意義上說的。在實(shí)際操作中,流出地與流動(dòng)地總是相對(duì)的(有部分人流入本地,而有部分人從本地流出),從總體上很難判斷哪個(gè)是流出地,哪個(gè)是流入地。因此,從某種意義上,這種健康的選擇性又可以被看成是健康悖論的一種,即流動(dòng)人口在更惡劣的環(huán)境(包括居住環(huán)境、從業(yè)環(huán)境以及家庭環(huán)境等)之下,其健康狀況仍然優(yōu)于本地人口。同時(shí),限于樣本規(guī)模的問題,我們無法真正做到對(duì)流出地與流入地的判斷,進(jìn)而更嚴(yán)格地區(qū)分流出地的“潛在流動(dòng)人口”和流入地的“本地人口”。這將是今后研究中需要十分強(qiáng)調(diào)的問題之一。
再次,本文未討論健康對(duì)流動(dòng)距離的影響。事實(shí)上,流動(dòng)距離的長短必然會(huì)與其健康狀況有關(guān),但本文僅考察了全部跨縣域及以上的流動(dòng)人口,而未包括縣內(nèi)流動(dòng)人口;同樣也因篇幅與樣本量問題而未給出省際與省內(nèi)流動(dòng)之間的差異。這同樣也是將來有關(guān)健康與流動(dòng)關(guān)系研究中的重要問題之一。本文顯然沒有考慮這些新增流動(dòng)人口的以往流動(dòng)歷史。
最后是研究方法問題。本文運(yùn)用了firthlogit模型,主要是考慮到樣本(特別是新增流動(dòng)人口的)規(guī)模,且這種方法可以作為今后類似問題的處理方法。但從研究自變量的角度來看,本文選擇自評(píng)健康作為健康的代表性測(cè)量指標(biāo),一方面其測(cè)量本身可能存在差異性與內(nèi)生性問題(如測(cè)量錨點(diǎn)與評(píng)價(jià)標(biāo)準(zhǔn)等),進(jìn)而使目前的研究結(jié)果仍然存在偏誤(測(cè)量的內(nèi)生性問題可能無法剔除);另一方面,以自評(píng)健康作為實(shí)驗(yàn)(treatment),來考察自評(píng)健康對(duì)流動(dòng)的實(shí)驗(yàn)效應(yīng),是否可行仍然可能值得商榷。除了測(cè)量問題以外,諸如流動(dòng)本身的比率較低、難以捕捉真正的實(shí)驗(yàn)效應(yīng)、自評(píng)健康的多分類等都是需要進(jìn)一步考慮的。
因此,本文的結(jié)論仍是初步的,還需要今后更深入地討論。?