余穎雅,聶鳳英※,董海軍,黃佳琦
(1.中國農業(yè)科學院農業(yè)信息研究所,北京 100081;2.赤峰市人民政府駐北京聯絡處,北京 100078)
20世紀90年代開始,中國勞動力市場發(fā)生劇烈變化,大批農民工涌入城鎮(zhèn)務工。據國家統(tǒng)計局調查顯示, 20世紀90年代后,農民工數量逐年上升, 2011年開始總量增速持續(xù)回落,截止2015年年底,農民工總量2.77億人,比2014年增長1.3%,其中外出農民工*外出農民工:指在戶籍所在鄉(xiāng)鎮(zhèn)地域外從業(yè)的農民工有1.688 4億人,較2014年增加0.4%[1]。據中國農村貧困監(jiān)測報告顯示,全國扶貧重點縣勞動力外出人數也逐年增加。從2002年的14.5%到2010年的20.8%,增量較大[2]。外出務工同樣也是學術研究界的熱點,學者們從各種角度進行挖掘,涉及經濟學、農業(yè)經濟學、社會學、人口學、心理學等領域。研究論題也非常廣泛,包括外出務工的影響因素[3-6],外出務工對農民的收入[7-8]、農業(yè)生產[9-10]、貧困[11-12]、消費[13-14]的影響,民工返鄉(xiāng)潮[15-16]、留守兒童[17-20]和老人[21]問題,外出務工者的婚姻狀況[22]、貧困[23]、食物消費[24-26]等。
近年來,我國居民消費結構升級,糧食消費量減少,動物性食品的消費需求明顯增加。這一變化趨勢引起學者們對食物消費的關注,開始研究食物消費變化趨勢[27]以及其結構變化的影響因素[28-31],包括收入、價格、生計資本、地域等。外出務工也逐漸成為學者研究食物消費的新切入點,重點研究外出務工對在家成員食物消費的影響。目前,國內鮮有將外出務工直接聚焦到食物消費層面的研究,研究主要集中在外出務工對農村消費結構、農民消費觀念和消費傾向改變上,有少部分在消費傾向的研究中涉及到食物消費。時紅艷[13]利用在陜西省安康市的農戶調查數據研究發(fā)現,外出務工對農戶食品消費傾向、人力資本消費傾向、社會資本消費傾向、生產性消費傾向均呈負的顯著關系。袁國方等[14]對欠發(fā)達地區(qū)(陜西省)的調查研究發(fā)現,外出務工人員的流動性對食品消費傾向有顯著的負效應; 外出務工收入對食品消費傾向的影響不顯著。國外學者通過不同角度,對外出務工與食物消費和營養(yǎng)的關系進行研究,但是目前的結論也沒有達成一致。Wendy R.Karamba等[32]通過對2005—2006年加納的調查數據研究發(fā)現,外出務工會增加農戶整體食物消費,也導致農戶對于不營養(yǎng)食物(如糖,飲料等)消費的增加。Minh Cong Nguyen等[33]利用2004年和2006年越南調查數據,從外出務工人員外出持續(xù)時間上對農戶的食物消費和營養(yǎng)進行研究,發(fā)現無論是短期還是長期,外出務工對農戶人均食物支出、人均熱量消耗和食物多樣性都有正向影響,而短期的影響更加顯著。S.Chandrasekhar等[34]使用印度農村調查數據,并使用工具變量的方法研究短期外出務工對家庭消費支出的影響。研究結果發(fā)現,短期外出務工的家庭的每月人均消費支出和每月人均食物消費支出相對較低。
針對國外外出務工對農戶食物消費的研究發(fā)現,外出務工主要從以下幾個方面對農戶食物消費產生影響,一是外出務工人員帶來的匯款收入會增加農戶對食物、健康相關產品和服務的支出,從而提高獲取營養(yǎng)食物的能力[32]。二是外出務工人員帶來的信息和經驗可以豐富農戶在營養(yǎng)、健康和生產技能方面的知識,同樣也會改變農戶食物消費習慣,由此帶來的影響可能是有利于食物消費狀況的改善,但也有可能帶來不利影響[32]。三是外出務工使得農戶消費人口減少,消費量減少,家庭消費需求減少,但同時勞動力也相應減少,家庭收入減少,因此由此帶來的影響有利有弊[32, 35]。
目前,國內外研究外出務工對農戶食物消費影響的普遍較少,國內幾乎空白,國外采取的數據都較為久遠,無法反應現階段的影響情況。此外,隨著精準扶貧的提出,貧困地區(qū)的食物消費情況也得到了廣泛關注。研究發(fā)現,貧困縣的食物消費水平和食物安全狀況都低于我國農村平均水平[36],那么外出務工對貧困地區(qū)食物消費狀況是進一步惡化還是改善。綜上所述,文章決定從外出務工角度研究西部貧困地區(qū)在家成員的食物消費情況以及其帶來的影響。而外出務工變量具有內生性,許多學者采用工具變量模型[21, 37]控制其內生性,但是目前沒有發(fā)現特別合理的工具變量,同時是否外出務工這兩組樣本的初始條件不完全相同,存在選擇偏差[20]。因此,為了厘清貧困地區(qū)外出務工對農戶食物消費的影響,該文利用2015年我國陜西省、貴州省和云南省的6個貧困縣的調查數據,采用傾向得分匹配法(Propensity Score Matching,PSM)調整樣本的選擇性偏差,降低內生性導致的估計偏誤,單獨將處理因素——外出務工從影響農戶食物消費的因素中分離出來并分析其影響效果。
研究使用的數據來源于“中國農村食物安全與貧困綜合調查”課題組2015年對陜西省鎮(zhèn)安縣和洛南縣、云南省武定縣和會澤縣、貴州省正安縣和盤縣所進行的入戶調研,研究采用多階段抽樣方法確定樣本的農戶。第一階段,采用按照人口加權的抽樣方法(PPS)在各縣抽取19個村,人口越多的村抽到的概率越大。第二階段,采用隨機抽樣的方法,在每個樣本村中隨機抽取12個農戶。這樣,每個縣抽取19個村228戶, 6個縣共抽取114個村1 368農戶。問卷內容包括家庭基本情況、住房和生活條件、家庭財產與財務狀況、農業(yè)、生計、支出、食物來源和消費以及沖擊和應對策略等內容。其中,食物消費調查采用1個月回顧法,即農戶回顧過去1個月各類食物消費的情況。調研時間為2015年7—8月,不是收獲或者缺糧季節(jié),也沒有大型傳統(tǒng)節(jié)日,是正常月份,保證了調研數據的代表性以及平滑性[28]。由于有一戶全家外出務工,沒有在家人員的食物消費狀況,故剔除,最終獲得有效問卷1 367份。
2015年調研縣年人均食物總消費為3 895.06元/人·年,占總體消費的34.1%。農戶食物消費以糧食類為主,人均支出為957.555元/人·年,占總食物消費的30.1%,動物性食品和蔬菜水果消費較少,煙酒茶飲料消費卻不低,占總食物消費的15.0%(表1)。
表1 農戶食物消費情況
表2 外出務工分類的人均食物消費支出情況
將農戶按照是否外出務工分為兩類,進行均值T檢驗,如表2。雖然是否外出務工兩類農戶的人均食物消費總支出差異不顯著,但糧食、蔬菜水果、調味品和在外用餐食物消費具有顯著差異。糧食和調味品,有外出務工的農戶人均食物消費支出明顯高于無外出務工農戶,而在外用餐的人均消費支出,無外出務工的農戶顯著較高。由此看出,兩類農戶的部分食物消費有顯著差異,這一差異很可能來自于外出務工對農戶食物消費的改變。
如該文所述,為了降低外出務工的內生性以及較好的控制樣本選擇偏差,文本采用傾向得分匹配方法研究外出務工對農戶食物消費的影響。傾向得分匹配方法的基本思想是將控制組和處理組的可觀測特征相同或相似的樣本進行匹配,以觀察實驗產生的效應,社會實驗通過控制多元變量以達到滿意的匹配效果非常困難[20]。傾向得分匹配的優(yōu)勢在于可以通過一定的方法將多元變量濃縮為一個指標——傾向得分(PS)值,然后根據該值將控制組和處理組進行配對,從而在有效降低自選擇以及內生性偏誤的條件下得到更可信的處理效應。
基于此,該文將樣本分為兩大類,處理組——有外出務工的農戶個體樣本,控制組——無外出務工的農戶個體樣本。兩組樣本由于都生活在貧困地區(qū),故其生活偏好、消費習慣以及家庭環(huán)境可能都較為類似。對于處理組,無法同時獲得有外出務工和沒有外出務工的效用,為了獲得反事實的處理組樣本,即沒有外出務工的效應,E(Y0i|Di= 1)構建傾向得分匹配模型,設定如下:
第一步,構建農戶食物消費影響因素的模型:
Yi=α+β1Di+β2X1i+β3X2i+ε
(1)
式(1)中,Y為被解釋變量,表示農戶的食物消費狀況;Di為處理變量,表示外出務工狀況,即該農戶是否有外出務工;Xi為影響農戶食物消費狀況的一系列因素,其中,X1i為只影響農戶食物消費的因素,X2i為同時影響農戶食物消費和外出務工的因素;ε為擾動項,α為常數項。該模型表示了外出務工及其他影響農戶食物消費因素的共同作用。
第二步,計算每戶農戶外出務工的傾向得分(PS)值。
首先,構建影響農戶外出務工選擇的模型:
Di=α+β2X2i+ε
(2)
根據式(1)和(2)通過Logit模型估計構建傾向得分模型,計算處理組的PS值:
(3)
式(3)中,Xi為影響農戶食物消費狀況的一系列因素,同時作為傾向得分模型中的協變量;β為對應的估計系數。根據此模型計算得出處理組和控制組的平均傾向得分。
第三步,進行傾向得分匹配,采用3種常用的匹配方法(最近鄰匹配法、半徑匹配法和核匹配法)進行處理組和控制組樣本間的匹配。
第四步,根據匹配后樣本,計算平均處理效應(ATT):
ATT=EY1i-Y0i|Di=1=EEY1i-Y0i|Di=1,pXi
=EEY1i|Di=1,pXi-EY1i|Di=0,pXi|Di=1
(4)
式(4)中,Y1i、Y0i分別表示樣本農戶在處理組和控制組兩種不同的情形下的食物消費狀況。
傾向得分匹配法的特點是創(chuàng)造隨機試驗條件以進行處理組及控制組的比較分析,其必須滿足兩個假設。第一是條件獨立假設。假定存在一系列可以觀測的協變量X,既影響農戶外出務工的決策,又影響農戶的食物消費狀況,但反過來不會受到外出務工決策的影響??刂屏诉@組協變量后,是否外出務工在樣本中的分配則是隨機的; 第二是共同支撐假設。該假設要求具有某些協變量特征的樣本個體,同時具有外出務工和無外出務工的正向概率,即農戶有外出務工和無外出務工的傾向得分必須有重疊的部分。滿足共同支撐假設可以提高樣本匹配的質量。
該文將年人均食物消費總支出的對數作為因變量,反映農戶整體食物消費水平。處理變量是農戶是否外出務工。根據文獻研究發(fā)現,農戶家庭特征、戶主特征、種養(yǎng)殖特征這些變量影響農戶外出務工選擇[3-6]和食物消費[28, 30-31],但不受外出務工選擇的影響,故該文選取農戶家庭特征、戶主特征、種養(yǎng)殖特征和地理位置等因素作為協變量。其中,農戶家庭特征變量包括:教育水平、收入水平、是否有嬰幼兒、是否遭遇自然災害、是否為少數民族、是否有人住院和市場距離; 戶主特征包括:戶主年齡、戶主婚姻兩個變量; 種養(yǎng)殖特征包括:農戶是否在房前屋后種植、是否種地、是否養(yǎng)殖和耕地面積3個變量。
該文隨后采用Logit模型逐步引入協變量進行傾向得分估算,選擇既滿足傾向得分平衡性檢驗,又有最大Pseudo-R2值的變量組合作為本模型的協變量。初步選擇變量如表3。
表3 初步選擇變量及描述
表4 變量的描述性統(tǒng)計結果
調研縣農戶年人均食物消費總支出的對數為8.068,有外出務工人員的農戶占總體的52.2%。調研縣戶主平均年齡52.1歲,戶主婚姻狀況以已婚為主,占總體的91.4%。勞動力平均受教育年限為5.5年,表明調研縣農戶平均文化程度為小學,低于全國農村平均水平; 農戶人均年收入為1.525 7萬元。調研縣少數民族戶較少,僅占總體的14%; 有嬰幼兒的家庭比例為22.2%; 加入合作社的極少,僅占總體的8.4%。調研縣有負債的農戶較多,占總體的60.5%; 2014年遭遇自然災害的農戶較多,占總體的61.7%; 有家庭成員住院的占總體的41.5%。此外,種養(yǎng)殖特征變量表明大部分農戶家里都有種養(yǎng)殖行為,耕地面積平均0.3hm2。市場距離變量的均值為6.553km,表明農戶與市場的距離較遠。變量的描述性統(tǒng)計結果具體見表4。
通過Logit模型逐漸引入協變量進行傾向得分回歸,同時檢驗處理組以及控制組的傾向得分平衡性,并檢查模型的Pseudo-R2值,選擇既滿足平衡性又使得Pseudo-R2值最大的變量組合。且多重共線性遠小于10,最大的為1.47,故不存在多重共線性[38]。變量最終選擇及Logit模型結果見表5。
表5 傾向匹配得分的Logit模型估算結果
(a)匹配前核密度函數 (b)最近鄰匹配后核密度函數
(c)半徑匹配后核密度函數 (d)核匹配后核密度函數圖1 匹配前后PS值的核密度函數
通過Logit模型計算傾向得分,因變量為是否外出務工?;貧w結果顯示,戶主年齡、教育水平、房前屋后、市場距離以及地域變量對農戶外出務工有顯著影響,除教育水平之外,其余變量都具有顯著正向影響。
3.3.1 平衡性檢驗
經過傾向得分匹配后,需要檢查處理組和控制組之間的平衡性問題,即經過匹配后,樣本組之間除了農戶的食物消費存在差異外,協變量不應該存在顯著的系統(tǒng)差異[17]。以最近鄰匹配法為例,對是否外出務工兩個樣本組傾向得分匹配前后的平衡性檢驗結果如表6。匹配前,大部分變量的處理組和控制組的標準偏誤都較大,且通過T檢驗顯示大部分變量都有顯著性差異。通過最近鄰匹配之后,除了收入水平之外,其余所有變量的處理組和控制組的標準偏誤都出現了不同程度的消減,兩組的均值更加接近,標準偏誤的絕對值都在10%以內,且T檢驗之后都沒有顯著差異。雖然兩組的收入水平偏誤略有增大,但是其標準偏誤的絕對值還是在10%以內,且T檢驗顯示依然沒有顯著差異。由此得出,經過匹配后,處理組和控制組變量的差異得以控制,之間已沒有統(tǒng)計差別,基本達到了類似于隨機試驗的效果,這說明已大大削弱自選擇所導致的估計偏誤。
表6 傾向得分匹配前后變量平衡性檢驗(最近鄰匹配法)
表7 不同匹配方法的匹配質量檢驗
3.3.2 匹配質量
根據是否外出務工兩組的傾向得分,采用最近鄰匹配法、半徑匹配法和核匹配法分析比較兩組的食物消費水平差異并檢驗穩(wěn)健性。表7列出了不同匹配方法的匹配質量情況。
從Pseudo-R2值看,不同方法進行匹配后,Pseudo-R2值均有不同程度的減少,匹配前變量的Pseudo-R2值為0.0585,采用最近鄰匹配法、半徑匹配法和核匹配法后,Pseudo-R2值分別降到0.002、0.005、0.006,說明匹配后變量消除了系統(tǒng)差異。
從平均標準偏差看,匹配前,變量的平均標準偏差為15.3,通過不同的匹配方法完成匹配后,平均標準偏差都有不同程度的減少。最近鄰匹配法的匹配后,匹配質量大大提高,平均標準偏差下降到了2.9,這說明匹配過程能夠很好地匹配處理組和控制組的樣本特征。設置0.01卡尺范圍的半徑匹配法以及核匹配法匹配之后,匹配質量也有所提高,平均標準偏差分別下降到了4.1和4.3。
從t-檢驗看,匹配前變量均值的t檢驗結果為110.54,通過不同匹配方法進行匹配后,t檢驗結果都大幅減少。t檢驗結果越小,說明處理組和控制組的變量均值在匹配后的差異越小,匹配效果越好。最近鄰匹配法、半徑匹配法和核匹配法的t檢驗結果分別為4.81、9.75和10.90,較110.54有較大的減少。
圖1顯示了不同匹配方法前后的農戶PS值核密度函數,更加直觀地反映了匹配前后的效果??梢钥闯?,在匹配前處理組和控制組的PS值概率分布存在較為明顯的差異。顯然,如果直接比較處理組和控制組之間的農戶食物消費差異,所得到的統(tǒng)計結果必定是有偏的,而較多研究往往忽視了這一問題。相比之下,利用不同的匹配方法完成匹配后,兩組樣本的PS值概率分布都已非常接近,表明兩組的個體特征也非常接近。同時也表明經共同支持檢驗之后,實驗組和控制組之間存在重疊,匹配效果較好。
采用平均處理效應(ATT)分析外出務工對農戶食物消費的處理效應。運用最近鄰匹配法、半徑匹配法和核匹配法估計樣本的平均處理效應,并采用自抽樣法(Bootstrap)反復抽樣500次估計樣本的標準誤,如表8??梢钥闯?,采用3種不同的匹配方法后,外出務工對于農戶的食物消費支出有顯著的正向作用,即外出務工的農戶食物消費支出顯著高于非外出務工農戶。不同匹配方法的平均處理效應的方向和趨勢是一致的,但是估算結果存在著較小的差異,最近鄰匹配法、半徑匹配法和核匹配法的平均處理效應分別為0.081、0.077和0.060。出現上述結果的原因主要是不同匹配方法的共同支撐區(qū)域是不同的,使得不同匹配方法的樣本產生差異。
表8 平均處理效應
匹配前,外出務工農戶與非外出務工農戶的人均食物消費總支出的對數分別為8.064和8.072,且兩者沒有顯著差異,其平均處理效應為-0.008。通過3種不同匹配方法匹配后,平均處理效應均有提高,方向變?yōu)檎颍姨幚斫M和控制組在10%顯著水平下有顯著差異。采用最近鄰匹配法后,農戶的人均食物消費總支出的對數分別為8.068和7.987,平均處理效應為0.081,即在5%顯著水平下,外出務工農戶的人均食物消費總支出的對數比非外出務工的農戶顯著高0.081個點; 采用半徑匹配法后,農戶的人均食物消費總支出的對數分別為8.068和7.990,平均處理效應為0.077,即在1%顯著水平下,外出務工農戶的人均食物消費總支出的對數比非外出務工的農戶顯著高0.077個點; 采用核匹配法后,農戶的人均食物消費總支出的對數分別為8.072和8.013,平均處理效應為0.060,即在10%顯著水平下,外出務工農戶的人均食物消費總支出的對數比非外出務工的農戶顯著高0.060個點。這表明,考慮了外出務工的選擇性偏誤和內生性問題后,外出務工會提高農戶的食物消費支出,這對于改善農戶的食物消費狀況具有重要作用。
通過不同匹配方法的結果可以看出, 3種匹配方法雖然有所不同,但是結果相似,這也說明了結果是穩(wěn)健的,不依賴于具體的方法。從而表明從影響農戶食物消費支出的諸多因素中將外出務工單獨提取出來,以考察其對食物消費的影響效應具有一定的可信度與說服力。
外出務工對貧困地區(qū)農戶食物消費的影響是熱點問題也是重要問題,然而,國內對于這方面的研究少之又少。該文以西部貧困地區(qū)在家成員為研究對象,運用傾向得分匹配方法降低外出務工的內生性并控制樣本選擇偏差以分析外出務工對農戶食物消費的影響。
(1)研讀文獻發(fā)現,外出務工主要通過收入變化、外來的信息或經驗和人口變化這3方面影響農戶的食物消費。(2)調研地區(qū)農戶食物消費以主食為主,動物性食品和蔬菜水果消費不多,煙酒茶飲料消費卻不低; 是否有外出務工兩類農戶的糧食、蔬菜水果、調味品和在外用餐食物消費都有顯著差異。(3)調研地區(qū)農戶外出務工能提高農戶的食物消費水平。傾向得分匹配后,在控制樣本其他特征條件一致的情況下,外出務工使農戶的人均食物消費總支出的對數最多提高0.081,最少提高0.060。不同的匹配方法形成的匹配集不同而產生了不同的共同支撐區(qū)域,從而導致了平均處理效應具有不同程度的損失,但其效應的方向和趨勢是一致的,證實了外出務工對農戶食物消費的正效應,且具有穩(wěn)健性。外出務工提高農戶的食物消費水平,這一結論與Karamba W R等[32]和Nguyen M C等[33]的研究結論較為一致,但與時紅艷[13]、袁國方[14]的研究結論有一定差異,他們的研究結果顯示外出務工對于食品消費傾向具有負向影響或無顯著影響,可能的原因:首先,樣本選擇的差異,該文的樣本是陜西省、云南省、貴州省的6個貧困縣,而時紅艷和袁國方采用的是陜西省的農村居民數據,不針對貧困地區(qū); 其次,數據的差異,該文的食物消費數據為上月食物總消費,幾乎包含了所有食物,較為全面,而時紅艷和袁國方學者研究整體消費,不單針對食物消費,食物消費的數據僅包含經常食用的,不全面; 最后,研究內容的差異,該文僅研究外出務工對食物消費的影響,而時紅艷和袁國方學者研究的是外出務工對消費傾向的影響,食物消費僅是其中一項,相對于其他消費來說,食物消費受到的影響較小,甚至為負向。
首先,從實證結果看,外出務工顯著提高農戶的食物消費水平,但是外出務工影響了農戶哪些食物的消費; 深入到營養(yǎng)層面,到底是改善了貧困地區(qū)農戶的營養(yǎng)狀況還是惡化了呢,這些也是值得深入思考和研究的問題,而且對改善貧困地區(qū)農戶食物消費與營養(yǎng)狀況的政策制定能提供相關理論依據。其次,應該更進一步研究外出務工是如何影響農戶食物消費的,是外出帶來的收入、外出人員的性別、外出的地點、還是在外的持續(xù)時間等因素影響了農戶食物消費,這樣才能真正厘清兩者的影響機制,以期從不同的角度改善農戶的食物消費狀況。再者,由于數據的局限性,沒有將在家人員的消費進行細分,如對兒童食物消費的影響,對老人的影響等。若將人口進行細分,能更好地判斷出外出務工到底對哪方面人群的食物消費產生較為重要的影響,也有利于政策的更好瞄準。這也是下一步需要探索的方向。最后,在進一步實施精準扶貧中應加大對貧困地區(qū)食物消費與營養(yǎng)的政策性傾斜研究,關注其食物消費與營養(yǎng)狀況,有針對性地采取措施增加貧困地區(qū)農民的可支配收入,改善貧困地區(qū)農戶的食物消費結構,提高食物安全與營養(yǎng)水平。