亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        “80后”職業(yè)人群二孩生育行為預(yù)測(cè)及影響因素分析
        ——基于隨機(jī)森林算法

        2021-04-01 06:28:36侯麗艷邱紅燕
        關(guān)鍵詞:模型研究

        張 浩,侯麗艷,馬 萍,邱紅燕

        (1.寧夏醫(yī)科大學(xué)公共衛(wèi)生與管理學(xué)院,銀川 750004;2.大連醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,大連 116044)

        為應(yīng)對(duì)老齡化問(wèn)題,2016年國(guó)家實(shí)施“全面二孩”政策。2016—2019年全國(guó)出生率依次為12.95%、12.43%、10.94%、10.48%[1],并未達(dá)到政策預(yù)期。經(jīng)濟(jì)收入[2]、文化程度[3]及幸福感[4]等都可影響生育行為。目前,基于數(shù)據(jù)挖掘的機(jī)器學(xué)習(xí)方法已廣泛應(yīng)用于自然科學(xué)及社會(huì)科學(xué)領(lǐng)域,其對(duì)于分類(lèi)數(shù)據(jù)的判斷和預(yù)測(cè)具有良好的效果。相關(guān)研究表明,基于隨機(jī)森林算法建立的預(yù)測(cè)模型其準(zhǔn)確率、預(yù)測(cè)價(jià)值均優(yōu)于當(dāng)前所使用的其他方法[5]。因此,本文選擇隨機(jī)森林算法對(duì)生育行為進(jìn)行建模和預(yù)測(cè),以期為二孩政策的完善與實(shí)施提供科學(xué)依據(jù)。

        1 對(duì)象與方法

        1.1 研究對(duì)象

        采用現(xiàn)況研究設(shè)計(jì),綜合考慮單位性質(zhì)、員工構(gòu)成及研究的可及性,于2016年11月—2017年11月在銀川市、大連市和北京市分別選擇5家事業(yè)單位和5家企業(yè)共10家單位作為研究現(xiàn)場(chǎng),共發(fā)放問(wèn)卷3988份,回收3665份,應(yīng)答率為91.9%,其中有效問(wèn)卷3454份,有效率為94.24%。排除非“80后”、未婚、調(diào)查問(wèn)卷關(guān)鍵信息填寫(xiě)不全及實(shí)際生育數(shù)量超過(guò)兩個(gè)者,最終共納入1857例調(diào)查對(duì)象,均為已婚、育1~2個(gè)孩子,所有調(diào)查對(duì)象均經(jīng)寧夏醫(yī)科大學(xué)醫(yī)學(xué)倫理委員會(huì)批準(zhǔn)(寧醫(yī)大倫理第2016-166號(hào)),并自愿簽署知情同意書(shū)。

        1.2 調(diào)查方法

        本研究采用自行設(shè)計(jì)的調(diào)查問(wèn)卷進(jìn)行現(xiàn)場(chǎng)調(diào)查,內(nèi)容主要包括個(gè)人及家庭基本情況、生育行為相關(guān)情況、生育意愿相關(guān)情況、生育計(jì)劃相關(guān)情況、物質(zhì)主義價(jià)值觀、社會(huì)支持、工作壓力、生活滿(mǎn)意度以及主觀幸福感經(jīng)濟(jì)等信息。采用現(xiàn)場(chǎng)發(fā)放、當(dāng)場(chǎng)填寫(xiě)、當(dāng)場(chǎng)回收問(wèn)卷的方式(部分不能集中填寫(xiě)的單位,則現(xiàn)場(chǎng)發(fā)放問(wèn)卷,約定時(shí)間收回)。調(diào)查問(wèn)卷盡量當(dāng)場(chǎng)審核,不足或遺漏的部分及時(shí)補(bǔ)充。調(diào)查結(jié)束后對(duì)問(wèn)卷再次進(jìn)行核查,以保證調(diào)查結(jié)果的準(zhǔn)確性和真實(shí)性。

        1.3 變量定義

        1.3.1 物質(zhì)價(jià)值觀 采用Richins和Dawson編制的物質(zhì)價(jià)值觀量表(material values scale,MVS)測(cè)量,該量表共有13個(gè)條目,包括以財(cái)物定義成功、以獲取財(cái)物為中心、以獲得財(cái)物來(lái)追求幸福3個(gè)維度。每題分為5個(gè)等級(jí):非常不同意、不同意、不確定、比較同意、非常同意。得分越高,表明物質(zhì)主義水平越高[6]。本研究中物質(zhì)價(jià)值觀量表的克朗巴哈系數(shù)(Cronbach'sα)為0.764,Kaiser-Meyer-Olkin(KMO)值為0.805。

        1.3.2 工作壓力 采用工作內(nèi)容問(wèn)卷(job content questionnaire,JCQ)和付出-回報(bào)失衡問(wèn)卷(effort reward imbalance questionnaire,ERIQ)。JCQ量表共22個(gè)條目,包括工作要求、工作自主和社會(huì)支持3個(gè)維度,每題4個(gè)等級(jí),分別為非常不同意、不同意、同意和非常同意,本文在評(píng)估職業(yè)人群工作壓力時(shí),以三個(gè)模塊得分的均數(shù)為臨界點(diǎn)將它們劃分成高低水平組[7]。

        ERIQ量表共23個(gè)條目,包括付出、回報(bào)和超負(fù)荷3個(gè)維度,每題分為5個(gè)等級(jí):不同意、完全不困擾、有點(diǎn)困擾、困擾和非常困擾。計(jì)算付出-獲得不平衡指數(shù)(ERI ratio),ERI ratio=付出因子得分/(回報(bào)因子得分×C),C為付出項(xiàng)目個(gè)數(shù)與獲得項(xiàng)目個(gè)數(shù)的比值,即6/11。如果研究對(duì)象的ERI ratio>1.00,則認(rèn)為其存在職業(yè)緊張;若ERI ratio≤1.00,則表示其無(wú)職業(yè)緊張[8]。本研究中工作內(nèi)容量表的Cronbach'sα為0.890,KMO值為0.893;付出-回報(bào)失衡量表的Cronbach'sα為0.886,KMO值為0.896。

        1.3.3 社會(huì)支持 采用肖水源和楊德森(1987)編制的社會(huì)支持評(píng)定量表(SSRS)進(jìn)行測(cè)量,評(píng)估個(gè)體所獲得的社會(huì)支持水平。量表共10個(gè)條目,包括客觀支持、主觀支持和對(duì)社會(huì)支持的利用度3個(gè)維度。量表總分?jǐn)?shù)越高,表示獲得的社會(huì)支持度越高[9]。本研究中社會(huì)支持量表的KMO值為0.892。

        1.3.4 生活滿(mǎn)意度 采用生活滿(mǎn)意度量表(satisfaction with life scale,SWLS)中文版,量表包括5個(gè)題目,每個(gè)項(xiàng)目有7個(gè)判斷等級(jí),從“非常不符合”到“非常符合”分別用數(shù)字1~7表示。被調(diào)查者在回答量表題目時(shí)按照每個(gè)題目與自己實(shí)際情況相符合的程度選擇1個(gè)等級(jí)選項(xiàng),計(jì)算量表題目的得分均數(shù),高于均數(shù)為生活滿(mǎn)意度高水平,低于均數(shù)為低水平[10]。本研究中生活滿(mǎn)意度量表的Cronbach'sα為0.807,KMO值為0.821。

        1.3.5 主觀幸福感 采用Campbell幸福感指數(shù)量表(index of well-being,index of general affect)來(lái)評(píng)估個(gè)體幸福的狀態(tài)。該量表共9個(gè)條目,分為總體情感指數(shù)和生活滿(mǎn)意度兩部分,前者由8個(gè)情感項(xiàng)目組成,后者由1個(gè)滿(mǎn)意度項(xiàng)目組成,為7級(jí)計(jì)分??傮w情感指數(shù)的平均得分與生活滿(mǎn)意度得分(權(quán)重為1.1)相加即為總體幸福感指數(shù),其范圍為2.1(最不幸福)~14.7(最幸福)。得分越高,表明越幸福[11]。本研究中總量表的KMO值為0.860。

        1.4 統(tǒng)計(jì)學(xué)方法

        1.4.1 數(shù)據(jù)處理方法采用Epi Data 3.1軟件對(duì)所有調(diào)查問(wèn)卷進(jìn)行雙錄入核查,采用SPSS 24.0進(jìn)行異常值的刪除及缺失值的填補(bǔ);采用R-4.0.2進(jìn)行統(tǒng)計(jì)分析,建立隨機(jī)森林模型,以3∶1的比例將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,采用訓(xùn)練集建立預(yù)測(cè)模型并進(jìn)行變量重要性排序,采用測(cè)試集檢驗(yàn)?zāi)P偷念A(yù)測(cè)效果,采用十折交叉驗(yàn)證篩選最優(yōu)變量數(shù);采用多因素Logistic回歸分析最優(yōu)變量對(duì)生育行為的影響及程度。檢驗(yàn)水準(zhǔn)α=0.05。

        1.4.2方法說(shuō)明 隨機(jī)森林算法:隨機(jī)森林是由很多決策樹(shù)組成的,每一棵決策樹(shù)之間沒(méi)有關(guān)聯(lián)。決策樹(shù)的數(shù)量并非越多越好,應(yīng)先設(shè)置一個(gè)較大的決策樹(shù)進(jìn)行試探,根據(jù)結(jié)果進(jìn)行調(diào)試,找出多少棵樹(shù)時(shí)模型最優(yōu)。在得到森林之后,當(dāng)對(duì)一個(gè)新的樣本進(jìn)行判斷或預(yù)測(cè)時(shí),讓森林中的每一棵分類(lèi)樹(shù)分別進(jìn)行判斷,并看這個(gè)樣本應(yīng)該屬于哪一類(lèi)(分類(lèi)算法),根據(jù)分類(lèi)樹(shù)的投票結(jié)果確定測(cè)試樣本的分類(lèi)結(jié)果;根據(jù)袋外誤差評(píng)價(jià)分類(lèi)的準(zhǔn)確性;根據(jù)基尼(Gini)指數(shù)判斷變量對(duì)分類(lèi)樹(shù)中每個(gè)節(jié)點(diǎn)觀測(cè)值的異質(zhì)性。平均Gini值下降越多,說(shuō)明變量越重要[12]。

        十折交叉驗(yàn)證:十折交叉驗(yàn)證將樣本數(shù)據(jù)隨機(jī)分為10份,每次隨機(jī)選擇9份作為訓(xùn)練集,剩下的1份作為測(cè)試集。當(dāng)這一輪完成后,重新隨機(jī)選擇9份來(lái)訓(xùn)練數(shù)據(jù)。若干輪(<10次)之后,選擇損失函數(shù)評(píng)估最優(yōu)的模型和參數(shù)[13]。

        模型評(píng)價(jià):采用混淆矩陣和ROC曲線評(píng)價(jià)生育行為預(yù)測(cè)模型的預(yù)測(cè)價(jià)值,計(jì)算特異度、靈敏度、預(yù)測(cè)準(zhǔn)確率、約登指數(shù)及ROC曲線下面積(AUC)。AUC值越高,表明模型預(yù)測(cè)價(jià)值越大。

        2 結(jié)果

        2.1 一般人口學(xué)情況

        本次研究共納入調(diào)查對(duì)象1857例,平均年齡為(32.7+3.3)歲。其中男性占27.4%;漢族占87.6%;本地人口占70.4%;文化程度以本科學(xué)歷者比例最高,為47.4%;月收入以3000~5000元者最多,占56.1%;非獨(dú)生子女者占55.1%;事業(yè)單位職工占52.2%;工勤技能崗職工占49.4%,見(jiàn)表1。

        表1 調(diào)查對(duì)象一般人口學(xué)特征描述

        2.2 賦值

        對(duì)人口學(xué)特征、生育行為及相關(guān)變量進(jìn)行賦值,見(jiàn)表2。

        2.3 變量重要性排序

        利用訓(xùn)練集建立基于隨機(jī)森林模型的生育行為風(fēng)險(xiǎn)預(yù)測(cè)模型,利用隨機(jī)森林分類(lèi)器獲得變量重要性排名,由高到低分別為:生育計(jì)劃、一孩經(jīng)歷對(duì)生活的影響、一孩經(jīng)歷是否符合預(yù)期、主觀幸福感、年齡、社會(huì)支持、照顧孩子時(shí)間、文化程度、意愿子女?dāng)?shù)、性別偏好、孩子三歲前由誰(shuí)照顧、一孩年撫養(yǎng)支出、理想子女性別構(gòu)成、工作單位、獨(dú)生子女、工作崗位、月收入、戶(hù)籍、工作要求、性別、生活滿(mǎn)意度、以獲取財(cái)物為中心、工作支持、以財(cái)物定義成功、工作自主、ERI ratio、民族、通過(guò)獲取財(cái)物追求幸福,見(jiàn)圖1。

        2.4 模型評(píng)價(jià)

        2.4.1 混淆矩陣 利用混淆矩陣評(píng)價(jià)模型效果。結(jié)果顯示,預(yù)測(cè)為“一個(gè)孩子”錯(cuò)誤的概率為0.03,預(yù)測(cè)為“兩個(gè)孩子”錯(cuò)誤的概率為0.17,見(jiàn)表3。根據(jù)混淆矩陣結(jié)果計(jì)算,模型整體判斷準(zhǔn)確率為95.4%,預(yù)測(cè)準(zhǔn)確率為97.3%,靈敏度為97.4%,特異度為82.2%。

        表2 變量賦值情況表

        圖1 變量重要性排序

        表3 混淆矩陣情況

        2.4.2 ROC曲線 采用隨機(jī)森林算法在訓(xùn)練集建立二孩生育行為預(yù)測(cè)模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),AUC值為0.913,特異度為0.981,靈敏度為0.845,預(yù)測(cè)一致率為0.949,約登指數(shù)為0.826,見(jiàn)圖2。

        圖2隨機(jī)森林模型ROC曲線

        2.5 篩選最佳變量個(gè)數(shù)

        采用十折交叉驗(yàn)證篩選最佳變量個(gè)數(shù)。結(jié)果顯示,變量個(gè)數(shù)為4~9時(shí)交叉驗(yàn)證錯(cuò)誤率最低。根據(jù)變量重要性排序,選擇前9個(gè)變量作為最佳變量,依次為生育計(jì)劃、一孩經(jīng)歷對(duì)生活的影響、一孩經(jīng)歷是否符合預(yù)期、主觀幸福感、年齡、社會(huì)支持、照顧孩子時(shí)間、文化程度和意愿子女?dāng)?shù),見(jiàn)圖3。

        圖3 十折交叉驗(yàn)證

        2.6 邏輯回歸

        由于生育計(jì)劃、一孩經(jīng)歷對(duì)生活的影響和一孩經(jīng)歷是否符合預(yù)期這3個(gè)變量分布的差異過(guò)大,導(dǎo)致進(jìn)入Logistic回歸后OR值過(guò)大,因此不考慮納入。進(jìn)一步根據(jù)隨機(jī)森林變量重要性排序順次選擇主觀幸福感、社會(huì)支持、年齡、照顧孩子時(shí)間、文化程度、意愿子女?dāng)?shù)作為自變量,生育行為作為因變量進(jìn)行多因素Logistic回歸(賦值:一個(gè)孩子=0,兩個(gè)孩子=1)。結(jié)果顯示,社會(huì)支持、文化程度、意愿子女?dāng)?shù)對(duì)生育行為的影響均有統(tǒng)計(jì)學(xué)意義(P均<0.05),社會(huì)支持得分越高,生育二孩的可能性越大,OR值為1.03(95%CI=1.01~1.05);大專(zhuān)、本科、研究生及以上學(xué)歷者生育二孩的可能性分別是高中及以下學(xué)歷者的0.56倍(95%CI=0.37~0.85)、0.45倍(95%CI=0.33~0.62)和0.25倍(95%CI=0.12~0.52);意愿子女?dāng)?shù)為兩個(gè)孩子以上者生育二孩的可能性是不要孩子者的7.89倍(95%CI=2.29~27.15),見(jiàn)表4。

        3 討論

        生育行為直接反映了二孩政策的實(shí)施效果,提高育齡人群的生育行為是解決我國(guó)老齡化問(wèn)題的最根本途徑。關(guān)于生育行為影響因素的研究,目前應(yīng)用最廣泛的方法是多因素Logistic回歸分析。由于影響因素很多,某些不顯著因素的綜合作用可能對(duì)生育行為產(chǎn)生較大影響,但只有顯著變量才可以引入Logistic回歸模型中,因此Logistic回歸方法不一定能夠準(zhǔn)確地對(duì)生育行為進(jìn)行判別和預(yù)測(cè)。本研究運(yùn)用隨機(jī)森林算法建立模型對(duì)生育行為進(jìn)行預(yù)測(cè),找出影響生育行為的最主要因素,為政策的制定和完善提供更為準(zhǔn)確的方向和依據(jù),從而促進(jìn)人口出生率的提高。

        表4 生育行為影響因素的多因素Logistic回歸分析

        隨機(jī)森林算法作為一種以決策樹(shù)為基學(xué)習(xí)器的集成學(xué)習(xí)算法,簡(jiǎn)單、易于實(shí)現(xiàn),本身精度明顯優(yōu)于大多數(shù)單一算法,優(yōu)于其“兩個(gè)隨機(jī)性”,能夠很好地避免過(guò)擬合問(wèn)題,解決了描述性統(tǒng)計(jì)分析難以避免的變量間的相互作用。本次研究對(duì)隨機(jī)森林模型的評(píng)價(jià)采用混淆矩陣和ROC曲線兩種方法。混淆矩陣結(jié)果顯示,模型預(yù)測(cè)一個(gè)孩子和兩個(gè)孩子的分類(lèi)錯(cuò)誤均較低,模型整體判斷準(zhǔn)確率、預(yù)測(cè)準(zhǔn)確率、靈敏度及特異度均較高。ROC曲線結(jié)果顯示,模型的靈敏度、預(yù)測(cè)一致率、約登指數(shù)均達(dá)到滿(mǎn)意程度,AUC值為0.913。兩種評(píng)價(jià)方法評(píng)價(jià)結(jié)果差別不大,均顯示模型預(yù)測(cè)精度較高。李冬領(lǐng)等[14]比較了隨機(jī)森林模型與Logistic回歸模型對(duì)二孩生育意愿的預(yù)測(cè)效果,發(fā)現(xiàn)隨機(jī)森林模型的正確率、查準(zhǔn)率、查全率、AUC值均高于Logistic回歸模型。另外,隨機(jī)森林算法無(wú)法解釋變量的作用方向及其影響程度,因此,結(jié)合多因素Logistic回歸模型進(jìn)行分析,可以得到更加準(zhǔn)確和完善的結(jié)果。

        本次研究結(jié)果顯示,社會(huì)支持、文化程度和意愿子女?dāng)?shù)是二孩生育行為的主要影響因素。首先,獲得的社會(huì)支持越高,二孩生育率越高。一項(xiàng)探討有妊娠經(jīng)歷育齡青年女性二孩生育意愿的研究顯示,主觀社會(huì)支持對(duì)有妊娠經(jīng)歷的年經(jīng)女性的二孩生育意愿具有正向影響,該人群的心理彈性對(duì)生育意愿的影響則受社會(huì)支持利用度的調(diào)節(jié)[15]。另一項(xiàng)研究[16]表明,女性選擇生育二孩的原因可以分為主要選擇和被動(dòng)選擇兩種。無(wú)論是主動(dòng)還是被動(dòng),女性選擇生育二孩都受到良好的夫妻感情、較好家庭的經(jīng)濟(jì)情況、長(zhǎng)輩的幫助及親朋好友支持的影響,生育二孩的女性絕大多數(shù)都獲得了較高的社會(huì)支持,與本文研究結(jié)論一致。其次,文化程度越高,二孩生育率越低。一項(xiàng)針對(duì)廣西省不同職業(yè)婦女生育水平的研究[17]顯示,隨著女性文化程度的提升,初婚、初育年齡產(chǎn)生了明顯的后移,這可能是導(dǎo)致高文化程度伴隨低生育水平的主要原因。另外一項(xiàng)研究[18]認(rèn)為,文化程度較高的女性擁有較高的職業(yè)追求和精神生活追求,主觀上并不希望多生、多育,此外職業(yè)追求勢(shì)必造成晚婚及晚育,推遲了初育年齡,錯(cuò)過(guò)了生育旺盛期,降低了生育二孩的機(jī)會(huì)。因此,文化程度通過(guò)不同方面的作用對(duì)生育行為產(chǎn)生間接影響。最后,意愿子女?dāng)?shù)高的人群更有可能生育二孩。意愿子女?dāng)?shù)是個(gè)人對(duì)生育子女?dāng)?shù)量的理想態(tài)度,反映人群的生育意愿。研究[19]表明,二孩政策實(shí)施后,生育意愿與生育行為產(chǎn)生了明顯的悖理現(xiàn)象,較高的生育意愿與較低的生育行為,表明了我國(guó)正在面臨低生育率陷阱的高度風(fēng)險(xiǎn)[20]。主觀的生育意愿對(duì)生育行為的影響不可忽視。本文研究中,已生育二孩的人群,其意愿子女?dāng)?shù)為兩個(gè)以上者所占的比例最高。

        隨機(jī)森林算法對(duì)大樣本量的數(shù)據(jù)具有更好的預(yù)測(cè)效果。本次研究存在一定局限性,即樣本量相對(duì)較少,導(dǎo)致某些變量的分布存在一定的偏差,下一步增加樣本量可有效提高模型的準(zhǔn)確率和精確度。

        猜你喜歡
        模型研究
        一半模型
        FMS與YBT相關(guān)性的實(shí)證研究
        2020年國(guó)內(nèi)翻譯研究述評(píng)
        遼代千人邑研究述論
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        EMA伺服控制系統(tǒng)研究
        新版C-NCAP側(cè)面碰撞假人損傷研究
        3D打印中的模型分割與打包
        狠狠色噜噜狠狠狠狠97首创麻豆| 日本精品视频一视频高清| 日本道免费一区日韩精品| 一区二区三区在线视频观看| 性按摩xxxx在线观看| 欧美巨大xxxx做受中文字幕| 久久一日本道色综合久久大香| 亚洲精品中文字幕乱码3| 亚洲熟妇av一区二区三区| 亚洲欧美激情精品一区二区| 91人妻无码成人精品一区91| 在线免费午夜视频一区二区| 亚洲精品人成中文毛片| 97在线观看| 亚洲欧美日韩国产精品一区| 久久久免费精品国产色夜| 国产成人精品免费视频大全软件| 中文字幕亚洲欧美日韩2019| 国产在线拍偷自拍偷精品| 国产影院一区二区在线| 免费国产黄网站在线观看视频| 亚洲精品无码不卡av| 无码成年性午夜免费网站蜜蜂| 日本在线观看一二三区| 免费成人在线电影| 欧美极品第一页| 一区二区三区在线日本| 人人妻人人澡人人爽精品日本| 人妻暴雨中被强制侵犯在线| 国产成人av在线影院无毒| 96中文字幕一区二区| 无码熟妇人妻av影音先锋| 国产思思99re99在线观看| 在线观看免费人成视频国产| 亚洲免费国产中文字幕久久久| 久久久久女人精品毛片| 国产午夜无码精品免费看动漫| 国产精品毛片一区二区三区| 国产精品成人免费视频一区| 国产毛片网| 91国产视频自拍在线观看|