亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        隨機(jī)森林在甘肅省農(nóng)村貧困戶識(shí)別中的應(yīng)用

        2018-05-14 17:05:45李佳容
        關(guān)鍵詞:精準(zhǔn)扶貧

        李佳容

        [摘 要]本文根據(jù)甘肅省農(nóng)村入戶調(diào)查資料,利用隨機(jī)森林分類方法對(duì)其進(jìn)行貧困戶識(shí)別,經(jīng)過(guò)研究發(fā)現(xiàn)隨機(jī)森林分類在貧困戶識(shí)別的中表現(xiàn)出了其在離散變量中的優(yōu)勢(shì),識(shí)別正例的命中率達(dá)到71%。因此,在貧困戶識(shí)別方法上可以有所借鑒。

        [關(guān)鍵詞]貧困戶;隨機(jī)森林;識(shí)別方法;精準(zhǔn)扶貧

        [中圖分類號(hào)]F323.8 [文獻(xiàn)標(biāo)識(shí)碼]A

        自改革開放以來(lái),雖然甘肅已取得了顯著的減貧效果,但2011年國(guó)家提高貧困線(2300元)以后,甘肅的貧困覆蓋面增大,據(jù)2013年的統(tǒng)計(jì)數(shù)據(jù),甘肅共有552.2萬(wàn)貧困人口,貧困發(fā)生率為26.5%。因此,實(shí)現(xiàn)“精準(zhǔn)扶貧”是當(dāng)前需要解決的重要問題。本文結(jié)合目前應(yīng)用廣泛的隨機(jī)森林方法,嘗試精準(zhǔn)識(shí)別貧困,為今后在貧困戶識(shí)別方法上提供借鑒。

        1 隨機(jī)森林的應(yīng)用及理論背景介紹

        隨機(jī)森林算法是Leo Breiman和Adele Cutler在2001年提出的一種集成學(xué)習(xí)算法,它是通過(guò)將bagging和隨機(jī)特征選擇結(jié)合起來(lái),對(duì)決策樹模型添加額外的多樣性。即每次隨機(jī)選擇一些特征變量,獨(dú)立建立決策樹模型,不斷重復(fù)。而且,需要確保每次建樹時(shí),特征變量等可能的被選擇,這樣在樹的集成產(chǎn)生之后,使用投票的方法來(lái)組合預(yù)測(cè)結(jié)果。在隨機(jī)森林被提出到現(xiàn)在,在生物學(xué)、經(jīng)濟(jì)、金融等很多領(lǐng)域都有廣泛的應(yīng)用。從隨機(jī)森林算法提出至今,人們對(duì)隨機(jī)森林算法進(jìn)行了深入的研究,作出多種優(yōu)化改進(jìn)策略并取得了良好的效果。

        2 隨機(jī)森林模型識(shí)別貧困戶

        2.1 數(shù)據(jù)介紹與清洗

        本文采用隨機(jī)森林的方法對(duì)2015年甘肅省86個(gè)縣(區(qū))入戶調(diào)查資料進(jìn)行貧困戶識(shí)別實(shí)證研究。數(shù)據(jù)信息包括住戶基本信息、主要固定資產(chǎn)信息和期末耐用商品信息。因?yàn)檎{(diào)查戶從業(yè)類型的不同,資產(chǎn)擁有情況也有明顯的差異。由于本研究是對(duì)農(nóng)村貧困戶的識(shí)別挖掘,因此重點(diǎn)研究調(diào)查戶中農(nóng)業(yè)戶的家庭情況。農(nóng)村最低生活保障(簡(jiǎn)稱“低?!保┲贫仁侵刚畬?duì)家庭年人均純收入低于當(dāng)?shù)剞r(nóng)村居民最低生活保障標(biāo)準(zhǔn)的農(nóng)村常住居民家庭實(shí)行的基本生活救助制度。所以領(lǐng)取低保的農(nóng)業(yè)戶通常是經(jīng)濟(jì)基礎(chǔ)較差,生活有困難的住戶,可以視為貧困戶。

        農(nóng)業(yè)戶調(diào)查數(shù)據(jù)主要包括住戶基本信息、主要固定資產(chǎn)信息和期末耐用商品信息等,共有27個(gè)變量信息??傮w描述如表1:

        將原始調(diào)查數(shù)據(jù)經(jīng)過(guò)簡(jiǎn)單的處理,主要為了方便導(dǎo)入R軟件進(jìn)行分析重新命名變量,然后導(dǎo)入到R軟件中。對(duì)數(shù)據(jù)處理的步驟如下:對(duì)空值處理;對(duì)變量標(biāo)準(zhǔn)化;處理缺失值;處理異常值;對(duì)數(shù)據(jù)量非常少的變量處理。經(jīng)過(guò)數(shù)據(jù)清洗整理,數(shù)據(jù)集共有12個(gè)屬性變量、3296條記錄。其中領(lǐng)取低保的農(nóng)業(yè)戶有722戶,占所有調(diào)查的農(nóng)業(yè)戶的28%。

        2.2 貧困戶分類

        首先將整理后數(shù)據(jù)集按70%和30%劃分為訓(xùn)練集和測(cè)試集,并經(jīng)過(guò)Kolmogorov-Smirnov(柯爾莫哥洛夫-斯莫洛夫)同質(zhì)性檢驗(yàn),通過(guò)R語(yǔ)言中的函數(shù)ks.test()實(shí)現(xiàn),由檢驗(yàn)結(jié)果可知訓(xùn)練集與測(cè)試集具有同質(zhì)性。

        2.2.1 模型的構(gòu)建過(guò)程

        本文采用的是R語(yǔ)言中的party包中的cforest(函數(shù)訓(xùn)練的隨機(jī)森林模型,具體模型構(gòu)建過(guò)程:(1)通過(guò)party包中的cforest(函數(shù)對(duì)數(shù)據(jù)集train構(gòu)建隨機(jī)森林;(2)根據(jù)選取不同的樹的數(shù)量值,構(gòu)建隨機(jī)森林,確定最優(yōu)的樹的數(shù)量。這里根據(jù)每次預(yù)測(cè)值計(jì)算的auc值來(lái)評(píng)價(jià)分類器的優(yōu)劣,最終確定最優(yōu)樹數(shù)量是220棵;(3)將測(cè)試集test代入構(gòu)建好的隨機(jī)森林,并用predict函數(shù)進(jìn)行預(yù)測(cè),并繪制箱線圖可視化結(jié)果;(4)繪制混淆矩陣,展示預(yù)測(cè)值的情況,并直觀顯示預(yù)測(cè)值與真實(shí)值之間的差距,來(lái)說(shuō)明模型的準(zhǔn)確性;(5)繪制ROC曲線圖,來(lái)評(píng)價(jià)模型的適用性。

        2.2.2 模型的結(jié)果及檢驗(yàn)

        根據(jù)模型在測(cè)試集預(yù)測(cè)結(jié)果建立混淆矩陣如下:

        可以看出,預(yù)測(cè)的正確率為(410+157)/(410+356+65+157)= 58%;正例的覆蓋率為157/(157+356)=31%,正例的命中率為157/(65+157)=71%??梢娬拿新时容^高,說(shuō)明對(duì)貧困戶識(shí)別的正確率比較高。

        再次,對(duì)模型性能進(jìn)行評(píng)價(jià),繪制ROC曲線圖(見圖1)。根據(jù)評(píng)估結(jié)果,可以看出,隨機(jī)森林模型表現(xiàn)得比較好。

        3 總結(jié)與展望

        精準(zhǔn)扶貧在政府和學(xué)術(shù)界一直都是關(guān)注的重點(diǎn),經(jīng)濟(jì)發(fā)展到今天,我們國(guó)家已經(jīng)脫離了貧窮落后走向了繁榮富強(qiáng),但是由于經(jīng)濟(jì)發(fā)展的不平衡,在一些地區(qū)仍然有貧困現(xiàn)象,那么如何在龐大的人群中準(zhǔn)確地找到他們,是現(xiàn)在面臨的一個(gè)難題。因此,本文嘗試應(yīng)用隨機(jī)森林對(duì)甘肅省入戶調(diào)查數(shù)據(jù)進(jìn)行貧困戶識(shí)別的實(shí)證研究。實(shí)證分析選擇缺失數(shù)據(jù)較少的農(nóng)業(yè)戶生產(chǎn)性固定資產(chǎn)和期末耐用商品的擁有情況數(shù)據(jù)作為研究樣本數(shù)據(jù)。由隨機(jī)森林預(yù)測(cè)結(jié)果可知,正例命中率到達(dá)71%。因此對(duì)比邏輯回歸方法,在相同數(shù)據(jù)集中,隨機(jī)森林表現(xiàn)較好。

        對(duì)于本次研究來(lái)說(shuō),由于數(shù)據(jù)集選取的是農(nóng)業(yè)戶的生產(chǎn)性固定資產(chǎn)和期末耐用商品的情況,無(wú)法全面得描述農(nóng)業(yè)戶家庭的整體情況,這也對(duì)分類分析造成一定的局限。為了得到更好的貧困戶識(shí)別的準(zhǔn)確性,在以后的研究里可以將更多的家庭情況考慮進(jìn)來(lái)。因此,希望在今后的研究中可以有所借鑒。

        [參考文獻(xiàn)]

        [1] 汪三貴.論中國(guó)的精準(zhǔn)扶貧[J].貴州社會(huì)科學(xué),2015(05).

        [2] 汪三貴,王姮,王萍萍.中國(guó)農(nóng)村貧困家庭的識(shí)別[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2007(01).

        [3] 李昊源,崔琪琪.農(nóng)村居民家庭貧困的特征與原因研究[J].上海經(jīng)濟(jì)研究,2015(04).

        [4] 韓旭峰,豆紅玉.甘肅省農(nóng)村最低生活保障標(biāo)準(zhǔn)測(cè)算與分析——基于擴(kuò)展線性支出模型[J].西北人口,2017(01).

        猜你喜歡
        精準(zhǔn)扶貧
        精確理解“精準(zhǔn)扶貧”
        民生周刊(2016年20期)2016-11-11 13:39:21
        淺析全面建設(shè)小康社會(huì)中的精準(zhǔn)扶貧問題
        人間(2016年28期)2016-11-10 21:29:58
        貴陽(yáng)實(shí)施精準(zhǔn)扶貧之農(nóng)村電商研究
        人間(2016年28期)2016-11-10 21:22:47
        芻議智慧金融下的精準(zhǔn)扶貧
        普惠金融視角下大學(xué)生返鄉(xiāng)創(chuàng)業(yè)與精準(zhǔn)扶貧現(xiàn)狀分析
        論高?!爸菐?kù)”扶貧工程的實(shí)施及推廣
        人間(2016年26期)2016-11-03 16:15:11
        精準(zhǔn)扶貧背景下山區(qū)貧困縣脫貧路徑選擇
        精準(zhǔn)審計(jì)的現(xiàn)狀研究
        商(2016年27期)2016-10-17 05:42:30
        “精準(zhǔn)扶貧”視角下的高校資助育人工作
        科技視界(2016年20期)2016-09-29 12:23:49
        亚洲精品久久无码av片软件| 精品人妻69一区二区三区蜜桃| 亚洲国产精品无码一线岛国| 国产精成人品日日拍夜夜免费| 国产一区视频在线免费观看| 亚洲高清中文字幕精品不卡| 激情五月开心五月av| 亚洲中字幕日产av片在线| 亚洲男人第一无码av网站| 久久久久久中文字幕有精品| 综合图区亚洲偷自拍熟女| 免费久久99精品国产| 精品少妇人妻av无码久久| 亚洲AV秘 无码一区二区三区臀| 免费一区二区三区av| 娇小女人被黑人插免费视频| 无码人妻av免费一区二区三区| 一国产区在线观看| 久久精品人妻嫩草av蜜桃| 精品国产一区二区三区三级 | 中文成人无字幕乱码精品区| 中文字幕在线观看国产双飞高清 | 精品无码一区二区三区小说| 精品一区二区三区a桃蜜| 妺妺窝人体色www看人体| 中文字幕+乱码+中文字幕无忧| 亚洲一区二区免费日韩| 国产成人精品一区二三区孕妇| 亚洲精品午夜无码专区| 无码AV高潮喷水无码专区线| 最新中文字幕乱码在线| 波多野结衣在线播放| 一个人在线观看免费视频www| 国产亚洲无码1024| 精品亚洲第一区二区三区 | 日韩精品中文字幕一区二区| 免费va国产高清大片在线| 99热免费精品| 日韩一级精品亚洲一区二区精品| 电影内射视频免费观看| 亚洲欧美国产双大乳头|