亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        決策樹在就業(yè)數(shù)據(jù)分析中的應(yīng)用

        2019-08-21 01:17:16彭少芬
        大經(jīng)貿(mào) 2019年6期

        彭少芬

        【摘 要】 在就業(yè)中,有許多因素決定著你最終就業(yè)單位的性質(zhì)。為了能有效的分析就業(yè)因素的具體影響,在這里采用決策樹算法,先利用信息熵和各個屬性的信息增益找到劃分點,依次類推直至屬性無法再劃分,在進(jìn)行分析。

        【關(guān)鍵詞】 決策樹 ID3算法 信息熵 信息增益

        1.前 言

        自各大高校對于研究生進(jìn)行擴(kuò)招以來,畢業(yè)生數(shù)量急劇攀升。就業(yè)競爭越來越大,就業(yè)問題也日益突出,必須解決,否則不僅影響到學(xué)生的本身利益,也會影響到經(jīng)濟(jì)和社會的可持續(xù)發(fā)展,學(xué)校一般都建立了學(xué)生管理系統(tǒng),保存有大量的學(xué)生就業(yè)歷史數(shù)據(jù),我們通過分析這些數(shù)據(jù),從中找出影響就業(yè)的主要因素。從而為各大高校和學(xué)生就業(yè)培養(yǎng)提供有效建議。

        2.決策樹算法

        決策樹學(xué)習(xí)的目的是產(chǎn)生一棵泛化能力強(qiáng),即處理未知樣本能力強(qiáng)的決策樹。決策樹屬性劃分原則是希望隨著劃分過程的進(jìn)行,決策樹的分支結(jié)點所包含的樣本盡可能屬于同一類別,即結(jié)點的純度越來越高。

        構(gòu)造樹的步驟:

        訓(xùn)練樣本的信息值。

        第一棵樹,屬性,各葉節(jié)點的信息值。

        第一棵樹,屬性,導(dǎo)致的信息增益。

        依次,計算每棵樹導(dǎo)致的信息增益。

        選擇獲得最大信息增益的屬性進(jìn)行劃分。

        以此類推,遞歸,繼續(xù)劃分

        當(dāng)所有葉節(jié)點都是純的,劃分過程終止

        屬性停止劃分條件:

        當(dāng)前結(jié)點所包含的樣本屬于同一類,無需劃分。

        當(dāng)前屬性集為空,或所有樣本在所有屬性上取值相同,無法劃分

        當(dāng)前結(jié)點包含的樣本集合為空,不能劃分。

        3.決策樹算法的實際運(yùn)用

        3.1相關(guān)數(shù)據(jù)及說明

        我們找到最能影響就業(yè)的主要因素有:專業(yè)成績,政治面貌,獎勵情況,社會實踐經(jīng)驗、科研能力。在這里將就業(yè)單位作為決策變量。

        就業(yè)單位分為企業(yè)和事業(yè)單位。

        專業(yè)成績?nèi)∑骄?,成績低?0分為差,60-80分為一般,80分以上為優(yōu)良。

        獎勵情況分為三個等級,多(獲得多次科研或?qū)W習(xí)等相關(guān)獎學(xué)金),少(獲得少數(shù)獎項),無(沒有獲得過任何獎項)。

        科研能力分為兩個等級,優(yōu)秀(發(fā)表過多篇文章等),少(發(fā)表少量文章等)

        社會實踐經(jīng)驗分為三個等級,多(在外實習(xí)次數(shù)多等)、少(偶爾在校做小項目),無(無任何實習(xí)經(jīng)驗)。

        隨機(jī)抽取了某班10個畢業(yè)研究生就業(yè)信息情況并對數(shù)據(jù)做了處理得到下表:

        3.2訓(xùn)練樣本的信息值(基于類的劃分)

        訓(xùn)練樣本(用來創(chuàng)建樹的數(shù)據(jù)集)在包含4個事業(yè)單位和6個企業(yè)的根節(jié)點上,對應(yīng)于信息熵為:

        3.3屬性信息增益值

        然后,我們要計算出當(dāng)前4個屬性的每個屬性的信息增益值,用“專業(yè)成績”劃分之后所獲得的三個分支節(jié)點的信息熵為:

        于是根據(jù)公式算出屬性“專業(yè)成績”的信息增益為:

        類似的,我們可計算出其他三個屬性的信息增益:

        顯然,屬性“科研能力”的信息增益最大,于是它被選為劃分屬性,下圖是基于“科研能力”對根節(jié)點進(jìn)行劃分的結(jié)果,各分支結(jié)點所包含的樣例子集顯示在結(jié)點中。

        然后,決策樹學(xué)習(xí)算法將對每個分支結(jié)點做進(jìn)一步劃分,以上圖科研能力少的樣例集合為例,里面有{甲,乙,戊,己,庚,葵}6個樣例,可用屬性集合為{專業(yè)成績,獎勵情況,社會實踐經(jīng)驗}?;诳蒲心芰ι儆嬎愠龈鲗傩缘男畔⒃鲆?。首先算出專業(yè)成績的信息增益。

        基于科研能力少的專業(yè)成績信息熵:

        所以可算出基于科研能力少的專業(yè)成績信息增益為:

        同理,我們可計算出其他屬性基于科研能力少的信息增益。

        3.4決策樹的生成

        “專業(yè)成績”取得了最大的信息增益,可選專業(yè)成績作為劃分屬性。類似的,對每個分直節(jié)點進(jìn)行上述操作,最終得到的決策樹如下圖所示。

        3.5結(jié)論

        從上面的決策樹我們可以看出,科研能力優(yōu)秀的人基本都進(jìn)了事業(yè)單位,因為事業(yè)單位比較注重科研能力,專業(yè)成績對就業(yè)單位也有影響,專業(yè)成績差和一般的更多進(jìn)入企業(yè),社會經(jīng)驗豐富的學(xué)生進(jìn)企業(yè)的多。學(xué)生要是畢業(yè)后更傾向于進(jìn)入事業(yè)單位,應(yīng)側(cè)重加強(qiáng)專業(yè)素養(yǎng)和科研能力的培養(yǎng),如果要是想到企業(yè)發(fā)展,應(yīng)多多側(cè)重專業(yè)成績,好好學(xué)習(xí)專業(yè)知識,側(cè)重社會實踐經(jīng)驗的培養(yǎng),學(xué)校可以根據(jù)學(xué)生的傾向制定相應(yīng)的培養(yǎng)方案,提高就業(yè)率。

        4.結(jié)語

        在目前就業(yè)形勢嚴(yán)峻的環(huán)境下,本文提出了基于ID3算法來構(gòu)造決策樹的方法。實驗表明,該算法所構(gòu)造的決策樹結(jié)構(gòu)簡單、更加準(zhǔn)確使用,而且具有較高的可理解性。具有很好的實際利用價值。為我們作出最終決策和制定有效措施提供了非常有利的參考依據(jù)。

        【參考文獻(xiàn)】

        [1] 安瑞鈺,郝琪,基于ID3決策樹算法的學(xué)科競賽參賽學(xué)生選拔——以天津農(nóng)學(xué)院數(shù)學(xué)建模競賽為例[J].信息與電腦(理論版).2019,(11),24-25.

        [2] 韓松來,張輝,周華平.基于關(guān)聯(lián)度函數(shù)的決策樹分類算法[J].計算機(jī)應(yīng)用,2005(11):2655-2657.

        [3] 王子京,劉毓,決策樹ID3新屬性選擇方法[J].現(xiàn)代電子技術(shù).2018,41(23),9-12.

        亚洲成av人片在线观看麦芽| 成人男性视频在线观看 | 99精品国产99久久久久久97| 99热这里只有精品4| 国产av乳头久久一区| 日韩肥臀人妻中文字幕一区| 熟女少妇精品一区二区| 久久无码人妻一区二区三区午夜 | 亚洲第一女人av| 乱人伦中文无码视频在线观看| 人妻少妇不满足中文字幕| 在线观看人成网站深夜免费| 国产亚洲一区二区三区| 国产美女在线精品免费观看| 久久99精品久久久久久齐齐百度 | 欧美 亚洲 国产 日韩 综AⅤ| 日韩日本国产一区二区 | 亚洲熟女熟妇另类中文| 国内精品久久久久久久97牛牛 | 美利坚合众国亚洲视频| 少妇被爽到高潮喷水久久欧美精品 | 巨臀精品无码AV在线播放| 亚洲国产人成综合网站| 网禁拗女稀缺资源在线观看| 丁香综合网| 国产成版人性视频免费版| 大奶白浆视频在线观看| 国产精品久久久久久久免费看| 亚洲av高清在线观看三区| 国产毛片视频一区二区三区在线 | 玩中年熟妇让你爽视频| 亚洲国产成人久久一区www妖精| 亚洲av一区二区网址| 成年女人免费v片| 国产成人久久精品77777综合| 无码AV无码免费一区二区| 日本视频一区二区三区在线观看| 黑色丝袜秘书夹住巨龙摩擦| 成黄色片视频日本秘书丝袜 | 91九色视频在线国产| 狠狠噜天天噜日日噜无码|