蔡超 王樂華
(山東工商學(xué)院統(tǒng)計學(xué)院,山東 煙臺 264005)
家庭財富積累是一個家庭生活和發(fā)展的物質(zhì)基礎(chǔ),關(guān)系著家庭福利水平的高低。改革開放以來,中國居民家庭財富大幅增加[1],但居民家庭財富差距較大且呈上升趨勢[2-3]。黨的二十大報告要求“著力促進全體人民共同富裕,堅決防止兩極分化”,實現(xiàn)共同富裕的核心是縮小家庭財富差距。要想縮小家庭財富差距,首先需要明晰家庭財富的積累路徑。因此,有必要研究家庭財富積累的主要影響因素,尋找促進家庭財富積累持續(xù)增長、縮小財富差距的新動力。
已有文獻基于微觀數(shù)據(jù)實證研究了家庭投資和人口特征對家庭財富積累的影響。如Heo和Grable等(2017)[4]、宋寶琳(2021)[5]的研究表明風險投資不但能夠增加居民家庭財富積累,還能為家庭提供更多的生活保障。尹志超和張?zhí)枟潱?017)[6]、胡振(2018)[7]的研究表明居民金融素養(yǎng)的提升能夠顯著促進家庭財富增長。羅楚亮(2012)[8]的研究表明收入增長能夠促進居民財富增長。
已有研究發(fā)現(xiàn)個體的行為和決策易受群體中其他個體行為決策的影響[9-10],將這種他人行為或思想對個體行為決策的影響稱為鄰里效應(yīng)。眾多學(xué)者展開對鄰里效應(yīng)的研究,如余麗甜和詹宇波(2018)[11]指出家庭教育支出存在鄰里效應(yīng),學(xué)歷水平的1/5可歸因于社區(qū)鄰里效應(yīng)。岳華和王海燕等(2021)[12]指出家庭風險金融投資存在鄰里效應(yīng)。謝堊和宋顏群(2021)[13]研究了收入的社區(qū)鄰里效應(yīng),指出鄰里效應(yīng)對居民收入的影響程度較大。社區(qū)鄰里效應(yīng)對家庭教育、家庭風險投資、個體收入等都有重要影響,而家庭教育、家庭風險投資和個體收入等對家庭財富積累至關(guān)重要,因此,本文推斷家庭財富積累也可能存在鄰里效應(yīng)。
然而,目前少有文獻從家庭財富積累是否存在鄰里效應(yīng)這個角度展開研究。中國是典型的關(guān)系型社會,人與人之間、家庭與家庭之間的交流比較頻繁,使中國居民的家庭投資、支出等行為易受他人行為的影響[14-15]。家庭財富積累的鄰里效應(yīng)可能來源于以下三種機制:一是家庭投資理財觀念在與其他家庭交流過程中會受到影響,其投資理財?shù)姆绞脚c群體中其他家庭趨同。二是人都具有從眾心理,家庭投資理財行為會模仿社區(qū)中其他家庭,從而產(chǎn)生從眾效應(yīng)或跟風效應(yīng)[16]。三是財富積累正逐漸成為劃分各個社會群體的重要指標[17]??梢?,無論哪種機制,都會使我國居民家庭的財富積累與群體平均財富積累表現(xiàn)出正相關(guān)關(guān)系。
基于以上分析,本文從家庭財富積累是否存在鄰里效應(yīng)這一視角展開研究。謝堊和宋顏群(2020)[18]指出鄰里效應(yīng)具有非線性特征,因此本文在探究鄰里效應(yīng)對家庭財富積累的影響時,采用分位數(shù)回歸梯度提升樹模型這一非線性回歸模型進行分析。分位數(shù)回歸梯度提升樹模型一是能夠利用其非線性回歸模型優(yōu)勢,挖掘鄰里效應(yīng)對家庭財富積累的非線性影響;二是克服了線性分位數(shù)回歸模型估計性能差的局限,增強了鄰里效應(yīng)對家庭財富積累的估計能力。
與現(xiàn)有文獻相比,本文的邊際貢獻如下:一是從家庭財富積累是否存在鄰里效應(yīng)這一新角度開展研究,豐富了家庭財富積累的相關(guān)研究。二是采用前沿的分位數(shù)回歸梯度提升樹模型,規(guī)避了傳統(tǒng)線性分位數(shù)回歸模型的缺陷,更好地探究鄰里效應(yīng)和家庭財富積累之間的非線性關(guān)系。
線性分位數(shù)回歸模型由Koenker和Bassett(1978)[19]提出,其描述了解釋變量與響應(yīng)變量之間在不同分位點下的線性關(guān)系。線性分位數(shù)回歸模型不需要滿足最小二乘回歸模型設(shè)定的假定條件,具有更強的穩(wěn)健性,是一種流行且有效的統(tǒng)計分析方法。假設(shè)有訓(xùn)練集,其中yi為響應(yīng)變量,為解釋變量,在τ(0<τ<1)分位點處,線性分位數(shù)回歸模型可以由下式求解:
其中,β為系數(shù)向量,ρτ(u)=u(τ-I(u<0)),I(·)為示性函數(shù)。
Zheng(2012)[20]和Yuan(2015)[21]提出的分位數(shù)回歸梯度提升樹模型(QRGBT,QuantileRegressionGradient Boosting Trees)是梯度提升樹模型在分位數(shù)回歸框架下的擴展,是一種準確有效的非線性回歸模型。分位數(shù)回歸梯度提升樹模型通過不斷迭代,利用損失函數(shù)的負梯度來擬合生成多個分位數(shù)回歸樹,最終將所有分位數(shù)回歸樹的結(jié)果線性相加得到分位數(shù)回歸梯度提升樹模型。生成分位數(shù)回歸梯度提升樹模型的算法具體步驟如下:
步驟2:對于m=1,2,…,n
(a)計算負梯度
步驟3:重復(fù)步驟2,共迭代M次,f[M](τ|xi)即為分位數(shù)回歸梯度提升樹模型的最終估計值。
為增強分位數(shù)回歸梯度提升樹模型的可解釋性,本文采用變量相對重要性測度來進一步挖掘模型背后的經(jīng)濟學(xué)內(nèi)涵。變量相對重要性測度是度量解釋變量對響應(yīng)變量的影響程度。Friedman(2001)[22]指出如果在模型中改變某個變量的值,其他變量不變時模型的擬合能力變化較大,則其相對重要性較大。記,…,xi,j=x,…,xi,p)為第j個變量為正常數(shù)據(jù)時分位數(shù)回歸梯度提升樹模型的估計值為第j個變量為擾動數(shù)據(jù)時分位數(shù)回歸梯度提升樹模型的估計值,定義下式為第j個變量的重要性測度:
為減少隨機性影響,計算100次式(3)的均值作為第j個變量的重要性測度值。本文通過計算變量相對重要性來測度鄰里效應(yīng)對家庭財富積累的影響程度。
本文還希望基于分位數(shù)回歸梯度提升樹模型的估計挖掘出一些解釋性意義,因此進一步引入偏相依關(guān)系來度量解釋變量在不同水平下對響應(yīng)變量的影響方向和大小,同時揭示變量之間的非線性關(guān)系。第j個變量Xj的偏相依關(guān)系測度的方法為:剔除Xj的重復(fù)值并按照升序排列,記為,并將其依次代入下式計算Xj在不同取值下的偏相依關(guān)系值:
本文數(shù)據(jù)來自2018年中國家庭追蹤調(diào)查數(shù)據(jù)(CFPS),樣本覆蓋31個?。▍^(qū)、市)。刪除主要變量缺失的樣本后,最終得到9321個有效家庭樣本。
將家庭總資產(chǎn)定義為家庭財富積累,并計算家庭財富積累的鄰里效應(yīng)(以下簡稱“鄰里效應(yīng)”)。根據(jù)中國家庭追蹤調(diào)查數(shù)據(jù)中的社區(qū)編碼,將居住在同一農(nóng)村或同一城市社區(qū)的家庭都歸類為同一社區(qū),將鄰里效應(yīng)定義為同社區(qū)家庭平均財富規(guī)模(不包括相應(yīng)的家庭)。
除此之外,本文還控制了一系列可能影響家庭財富積累的其他因素,包括家庭收入、家庭人口規(guī)模、家庭居住地(城鎮(zhèn)=1,農(nóng)村=0)、家庭所在地區(qū)(東部=1,中西部=0)、戶主年齡、戶主性別(男性=1,女性=0)和戶主受教育程度(文盲=0、小學(xué)=6、初中=9、高中、中專及技校=12、大學(xué)???15,大學(xué)本科=16、研究生及以上=19)。表1報告了變量含義及描述統(tǒng)計結(jié)果。從表1可知,家庭財富積累為尖峰右偏數(shù)據(jù),且離散程度較大,這說明我國家庭財富積累存在較大差距。
表1 變量含義及描述性統(tǒng)計
本文首先構(gòu)建了只包含家庭財富積累和家庭、個人特征但不含鄰里效應(yīng)的基準模型(以下簡稱“基準模型”)。其次,在基準模型的基礎(chǔ)上,加入了鄰里效應(yīng),構(gòu)建鄰里效應(yīng)模型(以下簡稱“鄰里效應(yīng)模型”)。兩個模型的構(gòu)建如表2所示。
表2 模型構(gòu)建
基于上述模型,首先,使用線性分位數(shù)回歸模型(LQR)和分位數(shù)回歸梯度提升樹模型(QRGBT)分別對兩個模型進行擬合。其次,由擬合結(jié)果計算分位數(shù)平均絕對誤差(QAAE)和擬合優(yōu)度R1,一是評估分位數(shù)回歸梯度提升樹模型是否比線性分位數(shù)回歸模型更能提升估計性能,二是評估鄰里效應(yīng)模型是否比基準模型更能提升估計性能。
表3報告了線性分位數(shù)回歸模型和分位數(shù)回歸梯度提升樹模型分別對基準模型和鄰里效應(yīng)模型進行擬合的結(jié)果。由表3可知,第一,無論是基準模型還是鄰里效應(yīng)模型,在五個分位點處,分位數(shù)回歸梯度提升樹模型的QAAE值都小于線性分位數(shù)回歸模型,且分位數(shù)回歸梯度提升樹模型的R1值都大于線性分位數(shù)回歸模型,說明分位數(shù)回歸梯度提升樹模型更能提升估計性能。第二,在五個分位點處,鄰里效應(yīng)模型的擬合優(yōu)度都大于基準模型,且鄰里效應(yīng)模型的估計誤差也都小于基準模型。說明鄰里效應(yīng)模型對家庭財富積累的估計能力遠遠大于基準模型,其原因可能為同一社區(qū)居民的金融素養(yǎng)、教育偏好、信息獲取渠道等因素存在相似性,使同一社區(qū)居民的投資行為、財富積累模式等也存在相似性,因此,鄰里效應(yīng)模型對家庭財富積累的估計能力優(yōu)于基準模型。
表3 主要擬合結(jié)果
表4報告了解釋變量對家庭財富積累影響的重要程度。由表4可知,第一,鄰里效應(yīng)對家庭財富積累的影響程度最大、家庭收入次之,而其他諸如家庭人口規(guī)模、居住地、地區(qū)、年齡、性別、受教育程度等變量的權(quán)重較小??赡茉蛟谟?,首先,對于多數(shù)普通居民來說,現(xiàn)階段財富積累的載體仍以住房為主,同一社區(qū)的居民所處地段環(huán)境與房產(chǎn)價格相似,因此鄰里效應(yīng)對家庭財富積累的影響是最強的。其次,工資收入的儲蓄是家庭財富積累的主要途徑,因此工資收入對家庭財富的積累是非常關(guān)鍵的因素。第二,從不同分位點上看,在低分位點處,鄰里效應(yīng)的相對重要性程度較高,而在中分位點、高分位點處,鄰里效應(yīng)的相對重要性程度降低,即在家庭財富積累較少時鄰里效應(yīng)的影響更大。其原因可能是財富較少的家庭會面臨更大的資源限制和經(jīng)濟機會不足,鄰里效應(yīng)對這些家庭來說可能更為重要,鄰居之間的相互支持和資源共享可以提供更多的經(jīng)濟機會和資源,幫助他們改善經(jīng)濟狀況。相比而言,財富較多的家庭已經(jīng)擁有更多的經(jīng)濟資源和機會,對鄰里效應(yīng)的依賴相對較小。
表4 各變量相對重要性權(quán)重(%)
基于變量的重要性分析,繼續(xù)探究鄰里效應(yīng)和家庭財富積累的具體關(guān)聯(lián),采用偏相依關(guān)系圖來考察鄰里效應(yīng)對家庭財富積累的影響。圖1展示了在不同分位點處鄰里效應(yīng)對家庭財富積累的影響,其中橫軸為鄰里效應(yīng),縱軸為家庭財富積累。
圖1 偏相依關(guān)系圖
從圖1可以看出,鄰里效應(yīng)對家庭財富積累的影響具有明顯的非線性特征。第一,當鄰里效應(yīng)逐漸增加時,前期(鄰里效應(yīng)為0—450萬元)家庭財富積累增長較快,但后期(鄰里效應(yīng)為450萬元—900萬元)逐漸趨于平穩(wěn)。這可能是由于財富積累較少時更需要鄰里之間的相互支持和資源共享,而隨著家庭財富的不斷增加,更依賴個人的資源和能力來積累財富。第二,不同分位點處,鄰里效應(yīng)對家庭財富積累的影響不同。在中高分位點處,鄰里效應(yīng)對家庭財富積累的影響較強;在低分位點處,鄰里效應(yīng)對家庭財富積累的影響較弱。其原因可能是財富積累較高的家庭往往具有較強的社交關(guān)系和社會資本網(wǎng)絡(luò),鄰里之間的互動和信息共享可能更有利于家庭財富的積累;相反,財富較少的家庭往往存在較弱的社會資本網(wǎng)絡(luò)和社交關(guān)系,這可能限制了鄰里效應(yīng)對財富積累的影響。
將數(shù)據(jù)按照家庭財富積累的升序進行排列,刪除家庭財富積累值前5%和后5%的數(shù)據(jù),對數(shù)據(jù)進行縮尾處理后再進行估計。表5報告了數(shù)據(jù)縮尾處理后估計誤差和擬合優(yōu)度的結(jié)果。由表5可知,對數(shù)據(jù)縮尾處理后,分位數(shù)回歸梯度提升樹模型仍優(yōu)于線性分位數(shù)回歸模型,鄰里效應(yīng)模型仍優(yōu)于基準模型,通過了穩(wěn)健性檢驗。
表5 數(shù)據(jù)縮尾處理后主要擬合結(jié)果
分位數(shù)回歸森林(QRF,Quantile Regression Forest)同樣是基于樹的集成方法,采用這一方法進行穩(wěn)健性檢驗。表6報告了更換機器學(xué)習(xí)方法后的估計誤差和擬合優(yōu)度結(jié)果。由表6可知,相較于線性分位數(shù)回歸模型,分位數(shù)回歸森林模型的估計能力有所提高,這與QRGBT的表現(xiàn)基本一致,表明模型是穩(wěn)定的。
表6 更換機器學(xué)習(xí)方法后主要擬合效果
本文基于2018年中國家庭追蹤調(diào)查數(shù)據(jù),采用分位數(shù)回歸梯度提升樹模型研究鄰里效應(yīng)對家庭財富積累的非線性影響,討論了鄰里效應(yīng)能否較大程度地估計家庭財富積累,分析了鄰里效應(yīng)對家庭財富積累的影響程度及影響模式。研究發(fā)現(xiàn):第一,在不同分位點處,鄰里效應(yīng)都能更好地估計家庭財富積累;第二,在眾多解釋變量中,鄰里效應(yīng)對家庭財富積累的影響最強,且鄰里效應(yīng)在財富積累較少的家庭里影響更大;第三,鄰里效應(yīng)和家庭財富積累之間的關(guān)系呈現(xiàn)出非線性特點,且在財富積累較多的家庭里非線性特征更為明顯。本文不僅從鄰里效應(yīng)這個全新視角對中國家庭財富積累的影響因素進行研究,豐富了家庭財富積累這一領(lǐng)域的文獻,而且采用前沿的分位數(shù)回歸梯度提升樹方法規(guī)避了傳統(tǒng)線性模型的缺陷,更加適用于分析變量之間的非線性和交互關(guān)系?!?/p>