亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于決策樹的精準(zhǔn)幫扶模型研究

        2021-12-08 05:39:02吳朝霞常慶麗
        科海故事博覽 2021年33期
        關(guān)鍵詞:分類信息模型

        吳朝霞 常慶麗 王 偉

        (安陽工學(xué)院,河南 安陽 455000)

        在習(xí)近平總書記提出堅決打贏脫貧攻堅戰(zhàn)后,為響應(yīng)國家的號召,各個地區(qū)開始投入資源,推進扶貧工作的實行。而傳統(tǒng)的扶貧工作存在一些問題,如信息查詢不夠方便、人工采集容易出錯等。因此需要一款針對精準(zhǔn)扶貧工作的系統(tǒng)來進行輔助,使扶貧信息管理更加細化,提升扶貧信息管理的效率,滿足扶貧機構(gòu)的相關(guān)工作需求。[1]

        為了使系統(tǒng)能夠進行精準(zhǔn)識別,可以在高校精準(zhǔn)扶貧系統(tǒng)中添加決策樹算法,利用決策樹算法實現(xiàn)趨勢分析、提供輔助決策等功能,并建立相應(yīng)的信息化支撐體系。

        1 決策樹算法

        決策樹就是數(shù)據(jù)結(jié)構(gòu)中的樹,每一個葉子節(jié)點都是一種選擇的結(jié)果,而每個分叉路代表該特征的具體內(nèi)容。決策樹算法是根據(jù)離散函數(shù)值進行分析的方法,是一種分類算法。[2]對數(shù)據(jù)進行預(yù)處理,然后歸納總結(jié)出一個可讀的規(guī)則和決策樹,根據(jù)總結(jié)的決策樹對新的數(shù)據(jù)進行預(yù)測分析,推測新數(shù)據(jù)的決策結(jié)果。本質(zhì)上決策樹就是通過數(shù)據(jù)特征歸納出的規(guī)則對數(shù)據(jù)進行分類的過程。

        預(yù)測模型分類結(jié)果是決策樹其中一個用途。決策樹中的每個非葉子節(jié)點都是根據(jù)不同的分類算法在所有的特征中相互比較得出的,從根節(jié)點到葉子節(jié)點,其中的每一條路徑都是一條分類規(guī)則,決策樹就是把這些規(guī)則都統(tǒng)計組合在一起,用來進行預(yù)測。[3]

        2 決策精準(zhǔn)扶貧模型

        2.1 數(shù)據(jù)的預(yù)處理

        本研究采用的是以某高校經(jīng)濟困難學(xué)生數(shù)據(jù)為模型構(gòu)建的數(shù)據(jù)訓(xùn)練集。訓(xùn)練集共包含計算機科學(xué)與技術(shù)400人,獲得補助的有50人,涉及的分類屬性分別是“是否建檔立卡”、“是否最低生活保障學(xué)生”、“是否特困救助學(xué)生”、“是否孤兒”、“是否事實撫養(yǎng)兒童”、“是否烈士子女”、“是否殘疾學(xué)生”、“是否殘疾人子女”(如表1家庭情況調(diào)查表所示)。

        表1 家庭情況調(diào)查表

        2.2 數(shù)據(jù)模型的構(gòu)建

        常用的決策樹實現(xiàn)算法有下述三種。

        2.2.1 ID3算法

        ID3算法是選出信息增益最小的屬性作為最佳劃分屬性進行劃分,信息增益是用來度量兩種概率分布的差異,其計算公式是g(D,A)=H(D)-H(D|A),其實H(D)是集合D的熵,H(D|A)是給定條件下D的條件熵。[4]熵表示某種結(jié)果可能出現(xiàn)的程度:設(shè)Y是有限離散隨機變量,其概率為:P(Y=xi)=pi,i=1,2,3…則隨機變量Y的熵例如:一個硬幣拋10次,其中6次正面朝上,4次反面朝上,則硬幣朝上的熵為:[5]

        2.2.2 C4.5算法

        C4.5算法是對ID3算法進行了改進,如果X是一個連續(xù)型隨機變量,此時采用ID3算法就無法計算了,而C4.5

        算法把連續(xù)型隨機變量用區(qū)間表示,這樣就可以使用ID3算法的計算過程進行計算,并在此基礎(chǔ)上計算出信息增益比來進行比較,信息增益比的計算公式:

        2.2.3 CART算法

        CART算法是選出基尼指數(shù)選出最大的屬性作為最佳分裂屬性進行劃分,假設(shè)有K種分類,樣本點屬于第k類的概率為pk,基尼指數(shù)為如果樣本集合D根據(jù)特征被劃分為D1和D2兩部分,此時集合D的基尼指數(shù)

        由于本研究的數(shù)據(jù)不存在連續(xù)性,因此采用ID3算法進行模型的構(gòu)建。首先計算集合整體的熵[8]然后計算各個分類的條件熵和信息增益,計算結(jié)果如表2特征信息增益表所示。

        表2 特征信息增益表

        然后選出信息增益最大的作為根節(jié)點,根據(jù)根節(jié)點的特征取值,繼續(xù)選出下一節(jié)點。[9]直到特征值取完為止,最后生成決策樹,結(jié)果如圖1所示。決策者可以利用圖1生成的決策信息對學(xué)生進行精準(zhǔn)資助。

        圖1 生成的決策樹結(jié)果圖

        3 結(jié)論

        本文通過對高校資助學(xué)生的基礎(chǔ)數(shù)據(jù)進行研究,結(jié)合機器學(xué)習(xí)的決策樹算法,經(jīng)過大量的樣本訓(xùn)練,最后基于ID3的決策樹算法生成了基于高校精準(zhǔn)扶貧的決策樹模型。[10]為高校的扶貧資助工作提供參考,為扶貧工作的量化估計提供了解決方案。

        猜你喜歡
        分類信息模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        3D打印中的模型分割與打包
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        图图国产亚洲综合网站| 国语自产偷拍在线观看| 撕开奶罩揉吮奶头视频| 国产综合色在线视频| 国产精品女同一区二区久| 亚洲熟女一区二区三区250p| 三年的高清电影免费看| 亚洲av第一成肉网| 亚洲色偷偷偷综合网另类小说| 亚洲丰满熟女一区二亚洲亚洲| 久久久久成人精品无码中文字幕 | 久久国产精品亚洲我射av大全| 国产av精品一区二区三| 国产又黄又大又粗的视频| 国产老妇伦国产熟女老妇高清| 人妻少妇中文字幕专区| 亚洲精品乱码久久久久蜜桃| 8ⅹ8x擦拨擦拨成人免费视频| 在线观看一区二区女同| 亚洲av综合日韩精品久久| 国内少妇毛片视频| av无码精品一区二区三区四区| 日本国产在线一区二区| 亚洲精品视频1区2区| 狠狠综合久久av一区二区| 久久久久亚洲AV无码专| 国产精品日本一区二区三区在线| 无码一区二区三区| 亚洲va在线∨a天堂va欧美va| 欧美h久免费女| 亚洲国产精品国自产拍性色| 美女把尿囗扒开让男人添| 中文字幕一区二区三区乱码不卡 | 亚洲人成网线在线播放va蜜芽| 国产黄a三级三级三级av在线看| 国产精品一区二区三区不卡| 二区免费在线视频观看| 无码免费一区二区三区| 国内成人精品亚洲日本语音| 亚洲av调教捆绑一区二区三区| 国产人妻人伦精品1国产|