蔡超 王樂華
(山東工商學(xué)院統(tǒng)計(jì)學(xué)院,山東 煙臺 264005)
家庭財(cái)富積累是一個(gè)家庭生活和發(fā)展的物質(zhì)基礎(chǔ),關(guān)系著家庭福利水平的高低。改革開放以來,中國居民家庭財(cái)富大幅增加[1],但居民家庭財(cái)富差距較大且呈上升趨勢[2-3]。黨的二十大報(bào)告要求“著力促進(jìn)全體人民共同富裕,堅(jiān)決防止兩極分化”,實(shí)現(xiàn)共同富裕的核心是縮小家庭財(cái)富差距。要想縮小家庭財(cái)富差距,首先需要明晰家庭財(cái)富的積累路徑。因此,有必要研究家庭財(cái)富積累的主要影響因素,尋找促進(jìn)家庭財(cái)富積累持續(xù)增長、縮小財(cái)富差距的新動力。
已有文獻(xiàn)基于微觀數(shù)據(jù)實(shí)證研究了家庭投資和人口特征對家庭財(cái)富積累的影響。如Heo和Grable等(2017)[4]、宋寶琳(2021)[5]的研究表明風(fēng)險(xiǎn)投資不但能夠增加居民家庭財(cái)富積累,還能為家庭提供更多的生活保障。尹志超和張?zhí)枟潱?017)[6]、胡振(2018)[7]的研究表明居民金融素養(yǎng)的提升能夠顯著促進(jìn)家庭財(cái)富增長。羅楚亮(2012)[8]的研究表明收入增長能夠促進(jìn)居民財(cái)富增長。
已有研究發(fā)現(xiàn)個(gè)體的行為和決策易受群體中其他個(gè)體行為決策的影響[9-10],將這種他人行為或思想對個(gè)體行為決策的影響稱為鄰里效應(yīng)。眾多學(xué)者展開對鄰里效應(yīng)的研究,如余麗甜和詹宇波(2018)[11]指出家庭教育支出存在鄰里效應(yīng),學(xué)歷水平的1/5可歸因于社區(qū)鄰里效應(yīng)。岳華和王海燕等(2021)[12]指出家庭風(fēng)險(xiǎn)金融投資存在鄰里效應(yīng)。謝堊和宋顏群(2021)[13]研究了收入的社區(qū)鄰里效應(yīng),指出鄰里效應(yīng)對居民收入的影響程度較大。社區(qū)鄰里效應(yīng)對家庭教育、家庭風(fēng)險(xiǎn)投資、個(gè)體收入等都有重要影響,而家庭教育、家庭風(fēng)險(xiǎn)投資和個(gè)體收入等對家庭財(cái)富積累至關(guān)重要,因此,本文推斷家庭財(cái)富積累也可能存在鄰里效應(yīng)。
然而,目前少有文獻(xiàn)從家庭財(cái)富積累是否存在鄰里效應(yīng)這個(gè)角度展開研究。中國是典型的關(guān)系型社會,人與人之間、家庭與家庭之間的交流比較頻繁,使中國居民的家庭投資、支出等行為易受他人行為的影響[14-15]。家庭財(cái)富積累的鄰里效應(yīng)可能來源于以下三種機(jī)制:一是家庭投資理財(cái)觀念在與其他家庭交流過程中會受到影響,其投資理財(cái)?shù)姆绞脚c群體中其他家庭趨同。二是人都具有從眾心理,家庭投資理財(cái)行為會模仿社區(qū)中其他家庭,從而產(chǎn)生從眾效應(yīng)或跟風(fēng)效應(yīng)[16]。三是財(cái)富積累正逐漸成為劃分各個(gè)社會群體的重要指標(biāo)[17]??梢姡瑹o論哪種機(jī)制,都會使我國居民家庭的財(cái)富積累與群體平均財(cái)富積累表現(xiàn)出正相關(guān)關(guān)系。
基于以上分析,本文從家庭財(cái)富積累是否存在鄰里效應(yīng)這一視角展開研究。謝堊和宋顏群(2020)[18]指出鄰里效應(yīng)具有非線性特征,因此本文在探究鄰里效應(yīng)對家庭財(cái)富積累的影響時(shí),采用分位數(shù)回歸梯度提升樹模型這一非線性回歸模型進(jìn)行分析。分位數(shù)回歸梯度提升樹模型一是能夠利用其非線性回歸模型優(yōu)勢,挖掘鄰里效應(yīng)對家庭財(cái)富積累的非線性影響;二是克服了線性分位數(shù)回歸模型估計(jì)性能差的局限,增強(qiáng)了鄰里效應(yīng)對家庭財(cái)富積累的估計(jì)能力。
與現(xiàn)有文獻(xiàn)相比,本文的邊際貢獻(xiàn)如下:一是從家庭財(cái)富積累是否存在鄰里效應(yīng)這一新角度開展研究,豐富了家庭財(cái)富積累的相關(guān)研究。二是采用前沿的分位數(shù)回歸梯度提升樹模型,規(guī)避了傳統(tǒng)線性分位數(shù)回歸模型的缺陷,更好地探究鄰里效應(yīng)和家庭財(cái)富積累之間的非線性關(guān)系。
線性分位數(shù)回歸模型由Koenker和Bassett(1978)[19]提出,其描述了解釋變量與響應(yīng)變量之間在不同分位點(diǎn)下的線性關(guān)系。線性分位數(shù)回歸模型不需要滿足最小二乘回歸模型設(shè)定的假定條件,具有更強(qiáng)的穩(wěn)健性,是一種流行且有效的統(tǒng)計(jì)分析方法。假設(shè)有訓(xùn)練集,其中yi為響應(yīng)變量,為解釋變量,在τ(0<τ<1)分位點(diǎn)處,線性分位數(shù)回歸模型可以由下式求解:
其中,β為系數(shù)向量,ρτ(u)=u(τ-I(u<0)),I(·)為示性函數(shù)。
Zheng(2012)[20]和Yuan(2015)[21]提出的分位數(shù)回歸梯度提升樹模型(QRGBT,QuantileRegressionGradient Boosting Trees)是梯度提升樹模型在分位數(shù)回歸框架下的擴(kuò)展,是一種準(zhǔn)確有效的非線性回歸模型。分位數(shù)回歸梯度提升樹模型通過不斷迭代,利用損失函數(shù)的負(fù)梯度來擬合生成多個(gè)分位數(shù)回歸樹,最終將所有分位數(shù)回歸樹的結(jié)果線性相加得到分位數(shù)回歸梯度提升樹模型。生成分位數(shù)回歸梯度提升樹模型的算法具體步驟如下:
步驟2:對于m=1,2,…,n
(a)計(jì)算負(fù)梯度
步驟3:重復(fù)步驟2,共迭代M次,f[M](τ|xi)即為分位數(shù)回歸梯度提升樹模型的最終估計(jì)值。
為增強(qiáng)分位數(shù)回歸梯度提升樹模型的可解釋性,本文采用變量相對重要性測度來進(jìn)一步挖掘模型背后的經(jīng)濟(jì)學(xué)內(nèi)涵。變量相對重要性測度是度量解釋變量對響應(yīng)變量的影響程度。Friedman(2001)[22]指出如果在模型中改變某個(gè)變量的值,其他變量不變時(shí)模型的擬合能力變化較大,則其相對重要性較大。記,…,xi,j=x,…,xi,p)為第j個(gè)變量為正常數(shù)據(jù)時(shí)分位數(shù)回歸梯度提升樹模型的估計(jì)值為第j個(gè)變量為擾動數(shù)據(jù)時(shí)分位數(shù)回歸梯度提升樹模型的估計(jì)值,定義下式為第j個(gè)變量的重要性測度:
為減少隨機(jī)性影響,計(jì)算100次式(3)的均值作為第j個(gè)變量的重要性測度值。本文通過計(jì)算變量相對重要性來測度鄰里效應(yīng)對家庭財(cái)富積累的影響程度。
本文還希望基于分位數(shù)回歸梯度提升樹模型的估計(jì)挖掘出一些解釋性意義,因此進(jìn)一步引入偏相依關(guān)系來度量解釋變量在不同水平下對響應(yīng)變量的影響方向和大小,同時(shí)揭示變量之間的非線性關(guān)系。第j個(gè)變量Xj的偏相依關(guān)系測度的方法為:剔除Xj的重復(fù)值并按照升序排列,記為,并將其依次代入下式計(jì)算Xj在不同取值下的偏相依關(guān)系值:
本文數(shù)據(jù)來自2018年中國家庭追蹤調(diào)查數(shù)據(jù)(CFPS),樣本覆蓋31個(gè)?。▍^(qū)、市)。刪除主要變量缺失的樣本后,最終得到9321個(gè)有效家庭樣本。
將家庭總資產(chǎn)定義為家庭財(cái)富積累,并計(jì)算家庭財(cái)富積累的鄰里效應(yīng)(以下簡稱“鄰里效應(yīng)”)。根據(jù)中國家庭追蹤調(diào)查數(shù)據(jù)中的社區(qū)編碼,將居住在同一農(nóng)村或同一城市社區(qū)的家庭都?xì)w類為同一社區(qū),將鄰里效應(yīng)定義為同社區(qū)家庭平均財(cái)富規(guī)模(不包括相應(yīng)的家庭)。
除此之外,本文還控制了一系列可能影響家庭財(cái)富積累的其他因素,包括家庭收入、家庭人口規(guī)模、家庭居住地(城鎮(zhèn)=1,農(nóng)村=0)、家庭所在地區(qū)(東部=1,中西部=0)、戶主年齡、戶主性別(男性=1,女性=0)和戶主受教育程度(文盲=0、小學(xué)=6、初中=9、高中、中專及技校=12、大學(xué)???15,大學(xué)本科=16、研究生及以上=19)。表1報(bào)告了變量含義及描述統(tǒng)計(jì)結(jié)果。從表1可知,家庭財(cái)富積累為尖峰右偏數(shù)據(jù),且離散程度較大,這說明我國家庭財(cái)富積累存在較大差距。
表1 變量含義及描述性統(tǒng)計(jì)
本文首先構(gòu)建了只包含家庭財(cái)富積累和家庭、個(gè)人特征但不含鄰里效應(yīng)的基準(zhǔn)模型(以下簡稱“基準(zhǔn)模型”)。其次,在基準(zhǔn)模型的基礎(chǔ)上,加入了鄰里效應(yīng),構(gòu)建鄰里效應(yīng)模型(以下簡稱“鄰里效應(yīng)模型”)。兩個(gè)模型的構(gòu)建如表2所示。
表2 模型構(gòu)建
基于上述模型,首先,使用線性分位數(shù)回歸模型(LQR)和分位數(shù)回歸梯度提升樹模型(QRGBT)分別對兩個(gè)模型進(jìn)行擬合。其次,由擬合結(jié)果計(jì)算分位數(shù)平均絕對誤差(QAAE)和擬合優(yōu)度R1,一是評估分位數(shù)回歸梯度提升樹模型是否比線性分位數(shù)回歸模型更能提升估計(jì)性能,二是評估鄰里效應(yīng)模型是否比基準(zhǔn)模型更能提升估計(jì)性能。
表3報(bào)告了線性分位數(shù)回歸模型和分位數(shù)回歸梯度提升樹模型分別對基準(zhǔn)模型和鄰里效應(yīng)模型進(jìn)行擬合的結(jié)果。由表3可知,第一,無論是基準(zhǔn)模型還是鄰里效應(yīng)模型,在五個(gè)分位點(diǎn)處,分位數(shù)回歸梯度提升樹模型的QAAE值都小于線性分位數(shù)回歸模型,且分位數(shù)回歸梯度提升樹模型的R1值都大于線性分位數(shù)回歸模型,說明分位數(shù)回歸梯度提升樹模型更能提升估計(jì)性能。第二,在五個(gè)分位點(diǎn)處,鄰里效應(yīng)模型的擬合優(yōu)度都大于基準(zhǔn)模型,且鄰里效應(yīng)模型的估計(jì)誤差也都小于基準(zhǔn)模型。說明鄰里效應(yīng)模型對家庭財(cái)富積累的估計(jì)能力遠(yuǎn)遠(yuǎn)大于基準(zhǔn)模型,其原因可能為同一社區(qū)居民的金融素養(yǎng)、教育偏好、信息獲取渠道等因素存在相似性,使同一社區(qū)居民的投資行為、財(cái)富積累模式等也存在相似性,因此,鄰里效應(yīng)模型對家庭財(cái)富積累的估計(jì)能力優(yōu)于基準(zhǔn)模型。
表3 主要擬合結(jié)果
表4報(bào)告了解釋變量對家庭財(cái)富積累影響的重要程度。由表4可知,第一,鄰里效應(yīng)對家庭財(cái)富積累的影響程度最大、家庭收入次之,而其他諸如家庭人口規(guī)模、居住地、地區(qū)、年齡、性別、受教育程度等變量的權(quán)重較小??赡茉蛟谟冢紫龋瑢τ诙鄶?shù)普通居民來說,現(xiàn)階段財(cái)富積累的載體仍以住房為主,同一社區(qū)的居民所處地段環(huán)境與房產(chǎn)價(jià)格相似,因此鄰里效應(yīng)對家庭財(cái)富積累的影響是最強(qiáng)的。其次,工資收入的儲蓄是家庭財(cái)富積累的主要途徑,因此工資收入對家庭財(cái)富的積累是非常關(guān)鍵的因素。第二,從不同分位點(diǎn)上看,在低分位點(diǎn)處,鄰里效應(yīng)的相對重要性程度較高,而在中分位點(diǎn)、高分位點(diǎn)處,鄰里效應(yīng)的相對重要性程度降低,即在家庭財(cái)富積累較少時(shí)鄰里效應(yīng)的影響更大。其原因可能是財(cái)富較少的家庭會面臨更大的資源限制和經(jīng)濟(jì)機(jī)會不足,鄰里效應(yīng)對這些家庭來說可能更為重要,鄰居之間的相互支持和資源共享可以提供更多的經(jīng)濟(jì)機(jī)會和資源,幫助他們改善經(jīng)濟(jì)狀況。相比而言,財(cái)富較多的家庭已經(jīng)擁有更多的經(jīng)濟(jì)資源和機(jī)會,對鄰里效應(yīng)的依賴相對較小。
表4 各變量相對重要性權(quán)重(%)
基于變量的重要性分析,繼續(xù)探究鄰里效應(yīng)和家庭財(cái)富積累的具體關(guān)聯(lián),采用偏相依關(guān)系圖來考察鄰里效應(yīng)對家庭財(cái)富積累的影響。圖1展示了在不同分位點(diǎn)處鄰里效應(yīng)對家庭財(cái)富積累的影響,其中橫軸為鄰里效應(yīng),縱軸為家庭財(cái)富積累。
圖1 偏相依關(guān)系圖
從圖1可以看出,鄰里效應(yīng)對家庭財(cái)富積累的影響具有明顯的非線性特征。第一,當(dāng)鄰里效應(yīng)逐漸增加時(shí),前期(鄰里效應(yīng)為0—450萬元)家庭財(cái)富積累增長較快,但后期(鄰里效應(yīng)為450萬元—900萬元)逐漸趨于平穩(wěn)。這可能是由于財(cái)富積累較少時(shí)更需要鄰里之間的相互支持和資源共享,而隨著家庭財(cái)富的不斷增加,更依賴個(gè)人的資源和能力來積累財(cái)富。第二,不同分位點(diǎn)處,鄰里效應(yīng)對家庭財(cái)富積累的影響不同。在中高分位點(diǎn)處,鄰里效應(yīng)對家庭財(cái)富積累的影響較強(qiáng);在低分位點(diǎn)處,鄰里效應(yīng)對家庭財(cái)富積累的影響較弱。其原因可能是財(cái)富積累較高的家庭往往具有較強(qiáng)的社交關(guān)系和社會資本網(wǎng)絡(luò),鄰里之間的互動和信息共享可能更有利于家庭財(cái)富的積累;相反,財(cái)富較少的家庭往往存在較弱的社會資本網(wǎng)絡(luò)和社交關(guān)系,這可能限制了鄰里效應(yīng)對財(cái)富積累的影響。
將數(shù)據(jù)按照家庭財(cái)富積累的升序進(jìn)行排列,刪除家庭財(cái)富積累值前5%和后5%的數(shù)據(jù),對數(shù)據(jù)進(jìn)行縮尾處理后再進(jìn)行估計(jì)。表5報(bào)告了數(shù)據(jù)縮尾處理后估計(jì)誤差和擬合優(yōu)度的結(jié)果。由表5可知,對數(shù)據(jù)縮尾處理后,分位數(shù)回歸梯度提升樹模型仍優(yōu)于線性分位數(shù)回歸模型,鄰里效應(yīng)模型仍優(yōu)于基準(zhǔn)模型,通過了穩(wěn)健性檢驗(yàn)。
表5 數(shù)據(jù)縮尾處理后主要擬合結(jié)果
分位數(shù)回歸森林(QRF,Quantile Regression Forest)同樣是基于樹的集成方法,采用這一方法進(jìn)行穩(wěn)健性檢驗(yàn)。表6報(bào)告了更換機(jī)器學(xué)習(xí)方法后的估計(jì)誤差和擬合優(yōu)度結(jié)果。由表6可知,相較于線性分位數(shù)回歸模型,分位數(shù)回歸森林模型的估計(jì)能力有所提高,這與QRGBT的表現(xiàn)基本一致,表明模型是穩(wěn)定的。
表6 更換機(jī)器學(xué)習(xí)方法后主要擬合效果
本文基于2018年中國家庭追蹤調(diào)查數(shù)據(jù),采用分位數(shù)回歸梯度提升樹模型研究鄰里效應(yīng)對家庭財(cái)富積累的非線性影響,討論了鄰里效應(yīng)能否較大程度地估計(jì)家庭財(cái)富積累,分析了鄰里效應(yīng)對家庭財(cái)富積累的影響程度及影響模式。研究發(fā)現(xiàn):第一,在不同分位點(diǎn)處,鄰里效應(yīng)都能更好地估計(jì)家庭財(cái)富積累;第二,在眾多解釋變量中,鄰里效應(yīng)對家庭財(cái)富積累的影響最強(qiáng),且鄰里效應(yīng)在財(cái)富積累較少的家庭里影響更大;第三,鄰里效應(yīng)和家庭財(cái)富積累之間的關(guān)系呈現(xiàn)出非線性特點(diǎn),且在財(cái)富積累較多的家庭里非線性特征更為明顯。本文不僅從鄰里效應(yīng)這個(gè)全新視角對中國家庭財(cái)富積累的影響因素進(jìn)行研究,豐富了家庭財(cái)富積累這一領(lǐng)域的文獻(xiàn),而且采用前沿的分位數(shù)回歸梯度提升樹方法規(guī)避了傳統(tǒng)線性模型的缺陷,更加適用于分析變量之間的非線性和交互關(guān)系?!?/p>