曹程澤
摘要:人民幸福感的提升是社會發(fā)展與進步的一個重要方面,因此不斷提升國民的幸福感尤為重要。本文基于2015年度中國綜合社會調(diào)查的相關數(shù)據(jù),利用決策樹和隨機森林的模型,對城鎮(zhèn)居民的主觀幸福感影響因素進行預測,并分析影響城鎮(zhèn)居民主觀幸福感的因素,發(fā)現(xiàn)隨機森林模型的預測結(jié)果更好。研究分析表明,公共服務滿意度對城鎮(zhèn)居民主觀幸福感的影響最大;全年家庭總收入,平均空閑時間,政府工作滿意度以及心情抑郁或沮喪的頻繁程度對城鎮(zhèn)居民主觀幸福感的影響也較為顯著。因此國家應該努力發(fā)展經(jīng)濟,提高人均收入水平,應該堅持為人民服務的工作原則,以人為本,從而提高城鎮(zhèn)居民主觀幸福感。
關鍵詞:城鎮(zhèn)居民 主觀幸福感 決策樹 隨機森林 Python
一、引言
新中國建立后,在中國共產(chǎn)黨的領導下,經(jīng)過全體人民的共同努力及奮斗,中國取得了舉世矚目的成績,我國社會主要矛盾已經(jīng)轉(zhuǎn)化為人民日益增長的美好生活需要和不平衡不充分的發(fā)展之間的矛盾。2016年,習近平總書記在全民國家安全教育日上強調(diào),要不斷提高人民群眾的安全感和幸福感??梢?,幸福感作為反映民生的指標,在理論研究和實踐中都值得關注。隨著中國城鎮(zhèn)化不斷提升,城鎮(zhèn)居民以及居住在城鎮(zhèn)的居民比例逐步提升,其主觀幸福感對全體社會的穩(wěn)定、和諧發(fā)展起著至關重要的作用。城鎮(zhèn)居民的主觀幸福感的影響因素的研究對于宏觀政策的制定、實施,不斷提升國民的幸福感具有非常重要、積極的社會意義。
主觀幸福感是個體對目前生活總體質(zhì)量進行積極評價的程度,即個體對自己生活的喜歡程度。自Easterlin提出“收入一幸福悖論”以來,個體主觀幸福感的影響因素及幸福感提升問題引起了眾多經(jīng)濟學家的興趣。不同國家與地區(qū)的學者針對某一集合范圍內(nèi)的幸福感進行了大量的研究,由于發(fā)展階段不同,某一區(qū)域貧富分布不同,居民的文化背景、宗教影響的巨大差異,同樣一個重要因素,比如收入對幸福感的影響,不同的研究對象群體,得出的結(jié)論往往是相互矛盾的。Biswas-Diener和Diener研究發(fā)現(xiàn),印度加爾各答貧民窟居民的主觀幸福感通常要比富裕的對照群體強。Binder和Coad發(fā)現(xiàn),英國居民家庭的絕對收入對其主觀幸福感具有顯著的正向提升作用,但對幸福程度較高居民的影響則不顯著。國內(nèi)針對幸福感的研究從絕度收入、相對收入以及收入結(jié)構逐步發(fā)展到關注家庭收入,養(yǎng)老收入對個體幸福感的研究。萬佳樂和李超偉等人認為中國居民的幸福感不僅存在著顯著的相對收入效應與絕對收入結(jié)構效應,而且具有顯著的城鄉(xiāng)異質(zhì)性,兩種效應存在著顯著不同。從絕對收入結(jié)構效應來講,起關鍵作用的是經(jīng)營性收入、轉(zhuǎn)移性收入和財產(chǎn)性收入,三種收入的增加,可以顯著提升居民家庭的幸福感。閏靜,彭代彥等人認為家庭養(yǎng)老顯著降低了中國居民的幸福感,且這種負面影響隨家庭人均收入的增加而減弱,家庭養(yǎng)老對中年群體的負面影響最大。
主觀幸福感常常與多種復雜因素有關,中國正處于城鎮(zhèn)化劇烈碰撞過程中,二十年來改革開放物質(zhì)生活的快速提升與文化生活的固有規(guī)律之間的不平衡:南北東西區(qū)域發(fā)展的不均衡:社會階層形成初步固化趨勢,中國居民的傳統(tǒng)家國天下文化與實用文化之間的不平衡;網(wǎng)絡文化的迅速擴張等等因素,都對居民的個體幸福感有著重要的影響,因此不能只用經(jīng)濟收入和生活質(zhì)量衡量。本文通過調(diào)查數(shù)據(jù),全面考慮多種因素,通過建立決策樹模型和隨機森林模型等數(shù)學模型的方法對預測城鎮(zhèn)居民主管幸福感進行預測,然后尋找影響主觀幸福感的因子,從而為國家提高人民的幸福感提出更好的建議。
二、模型介紹
(一)決策樹模型
決策樹是一種基本的分類方法,該方法通常包含三個步驟:特征選擇、決策樹的生成和決策樹的剪枝。決策樹的算法的本質(zhì)是遞歸選擇最優(yōu)特征,并根據(jù)該特征進行分割。這一過程對應著決策樹的構建,也對應著特征空間的劃分,使得劃分之后的各個子集能夠被基本分類,那么構建葉節(jié)點;否則繼續(xù)遞歸劃分。其具體步驟為:
第一,確定根節(jié)點,求出對應的熵,從而得到信息熵,計算信息增益或信息增益率,從而確定根節(jié)點;信息熵的具體公式為:
第二,重復第一步計算信息增益的計算公式,遞歸算法構造出決策樹;
第三,決策樹構造完成后,進行剪枝,然后評價決策樹的好壞。
(二)隨機森林模型
隨機森林的核心思想是就是由多棵決策樹構成的集成模型。對于任意一棵樹,該樹的訓練集是從總的訓練集中有放回隨機采樣得到的。訓練過程可以總結(jié)如下:
第一,給定訓練集s,測試集T,確定所需要的樹的個數(shù)t和每棵樹的深度d。
第二,從s中有放回的抽取訓練集,訓練集的個數(shù)t,從根節(jié)點開始訓練。
第三,根據(jù)回歸樹的思想構建決策樹,對每棵樹進行評價。
第四,所以決策樹都被訓練過,根據(jù)少數(shù)服從多數(shù)的思想進行投票分類。
三、數(shù)據(jù)獲取
本文分析數(shù)據(jù)選取中國綜合社會調(diào)查(CGSS)2015年度調(diào)查得到的城鎮(zhèn)居民的樣本(http://cgss ruc edu cn/),樣本為2391個。通過從多方面多角度對影響城鎮(zhèn)居民主觀幸福感因素的分析,在社區(qū)內(nèi)進行調(diào)查,以及從網(wǎng)上查閱資料,本文選取了以下指標作為參考因素:性別、最高教育程度、身體健康狀況、心情抑郁或沮喪的頻繁程度、戶口登記狀況、空閑時間、生活是否幸福、社會保障項目、全年家庭總收入、家庭經(jīng)濟狀況在所在地屬于哪一檔、幾處房產(chǎn)、社會經(jīng)濟地位、關于社會公平的討論、政府工作滿意度以及公共服務滿意度等指標,統(tǒng)計結(jié)果如表1。
性別不僅僅是生理劃分,其也是社會發(fā)展過程中非常重要的角色定義。男性和女性對于幸福感的判斷具有相當大的主觀差異,是幸福感衡量的一個重要因子。身體健康,心理健康是居民幸福感衡量的基礎因素。全年家庭總收入、家庭經(jīng)濟狀況在所在地屬于哪一檔、幾處房產(chǎn)、社會經(jīng)濟地位等因素都是居民幸福感的重要的經(jīng)濟基礎因素以及由此而帶來的社會認知因素。關于社會公平的討論、政府工作滿意度以及公共服務滿意度等指標是居民對社會生活滿意度的反映,隨著我國人民物質(zhì)生活水平的不斷提升,居民參政議政的意愿也逐步增強,這也符合馬斯洛的需求層次理論。休閑時間在某種程度上是個體之所以為個體的一個表現(xiàn)。戶口登記情況則關系到居民的社區(qū)歸屬感以及在當前情況下同居民子女的教育強相關,同樣是其主觀幸福感的重要因素。而居民不同的教育程度對上述物質(zhì)的、精神方面以及社會責任實現(xiàn)等方面的權重,有著顯而易見的影響。