易倩文
◆摘? 要:為了能夠深入的挖掘和剖析影響當(dāng)前高校大學(xué)生畢業(yè)求職就業(yè)的關(guān)鍵影響因素,找到當(dāng)前大學(xué)生就業(yè)選擇因素之間的相互作用原因,筆者對(duì)重慶工程學(xué)院2021屆畢業(yè)生進(jìn)行了關(guān)于“后疫情期間就業(yè)情況調(diào)研”的問(wèn)卷調(diào)查,然后以數(shù)據(jù)挖掘分類(lèi)技術(shù)為支撐設(shè)計(jì)出C4.5算法對(duì)各種影響重慶工程學(xué)院畢業(yè)生就業(yè)選擇的因素針對(duì)性的進(jìn)行分析,以此來(lái)得出影響應(yīng)屆畢業(yè)生就業(yè)選擇的決策模型,根據(jù)這一算法模型,幫助以后的大學(xué)生更好的在大學(xué)期間完善自己的專(zhuān)業(yè)技能,強(qiáng)化自己的綜合能力,提高自己的社會(huì)競(jìng)爭(zhēng)力,為以后走出校園,在求職就業(yè)上有更多的選擇,提高應(yīng)屆畢業(yè)生的就業(yè)率。而這一算法模型的運(yùn)用對(duì)于高校在后疫情時(shí)期面對(duì)嚴(yán)峻的就業(yè)形勢(shì)以及社會(huì)經(jīng)濟(jì)發(fā)展趨勢(shì)下,能夠起到有效的就業(yè)指導(dǎo)效果,通過(guò)算法模型能夠最大程度的幫助高校了解就業(yè)形式,實(shí)現(xiàn)在就業(yè)指數(shù)上的多項(xiàng)比較,以此來(lái)針對(duì)性的改進(jìn)教學(xué)計(jì)劃,刺激高校畢業(yè)生就業(yè)率的不斷提高。
◆關(guān)鍵詞:決策樹(shù);大學(xué)生就業(yè)指導(dǎo);重慶工程學(xué)院
運(yùn)用決策樹(shù)來(lái)保證在后疫情時(shí)期高校大學(xué)生的就業(yè)率能夠有效提高,其本身是基于決策樹(shù)分類(lèi)法能夠深度的挖掘高校畢業(yè)生的相關(guān)就業(yè)數(shù)據(jù),借助數(shù)據(jù)分析去找到畢業(yè)生潛在的就業(yè)規(guī)律,以此來(lái)得出影響高校畢業(yè)生就業(yè)率的關(guān)鍵因素,從而幫助高校更好的對(duì)應(yīng)屆畢業(yè)生進(jìn)行就業(yè)上的分類(lèi)指導(dǎo)、精準(zhǔn)服務(wù),這樣不僅有助于提高高校在就業(yè)指導(dǎo)工作上的效率,還能夠幫助高校打出知名度,提升教育信譽(yù)度。在這個(gè)后疫情時(shí)期,能夠降低疫情對(duì)于高校畢業(yè)生就業(yè)的影響,能夠提高畢業(yè)生的就業(yè)率以及就業(yè)質(zhì)量。
1決策樹(shù)分類(lèi)法所運(yùn)用到的C4.5算法
C4.5算法其實(shí)是對(duì)ID3算法的一種優(yōu)化,它是以數(shù)據(jù)增益率為標(biāo)準(zhǔn)來(lái)選擇決策樹(shù)的節(jié)點(diǎn)屬性的一種算法,其本身默認(rèn)選擇的是當(dāng)前分支節(jié)點(diǎn)下數(shù)據(jù)增益率最高屬性作為當(dāng)下的節(jié)點(diǎn)測(cè)試屬性,因此C4.5算法本身能夠極大的減少對(duì)于樣本分類(lèi)所需要的數(shù)據(jù)量,同時(shí)也能夠保證數(shù)據(jù)本身的最小隨機(jī)性或者說(shuō)“不純性”。因此C4.5算法能夠降低調(diào)研難度,測(cè)試數(shù)目可以達(dá)到最小化,因此基于C4.5算法可以設(shè)計(jì)出最簡(jiǎn)單的一棵決策樹(shù)。
2數(shù)據(jù)挖掘?qū)ο笠约皼Q策樹(shù)分析目標(biāo)
本文是將重慶工程學(xué)院2021屆畢業(yè)生作為數(shù)據(jù)挖掘的對(duì)象,以他們作為研究對(duì)象,通過(guò)對(duì)他們的就業(yè)意向進(jìn)行調(diào)查,獲取到他們的專(zhuān)業(yè)成績(jī)、英語(yǔ)水平、計(jì)算機(jī)技能以及就業(yè)選擇等多項(xiàng)相關(guān)個(gè)人能力因素,并且通過(guò)調(diào)查報(bào)告去確定他們期望的上班時(shí)間、薪資范圍、福利待遇以及期望得到的就業(yè)指導(dǎo)內(nèi)容等多個(gè)影響個(gè)人就業(yè)選擇的因素,以此來(lái)幫助重慶工程學(xué)院獲得相關(guān)的畢業(yè)生就業(yè)數(shù)據(jù),通過(guò)決策樹(shù)分類(lèi)法幫助重慶工程學(xué)院學(xué)生工作委員會(huì)以及就業(yè)指導(dǎo)中心掌握相關(guān)的就業(yè)指導(dǎo)課程改進(jìn)以及課程安排,為就業(yè)指導(dǎo)教學(xué)的開(kāi)展提供了數(shù)據(jù)理論的支撐。
3數(shù)據(jù)采集
要想借助C4.5算法來(lái)進(jìn)行數(shù)據(jù)的深入挖掘,首先需要確定的是具體可查的研究對(duì)象,需要對(duì)可能影響高校畢業(yè)生就業(yè)選擇的諸多因素進(jìn)行系統(tǒng)的準(zhǔn)確的數(shù)據(jù)收集,可以說(shuō)整個(gè)數(shù)據(jù)收集的準(zhǔn)確度在一定程度上決定著整個(gè)C4.5算法對(duì)于結(jié)果分析上的準(zhǔn)確性,而越是準(zhǔn)確的結(jié)果分析也才越是具有參考的價(jià)值。
基于這一點(diǎn),我們對(duì)于重慶工程學(xué)院2021屆的畢業(yè)生都進(jìn)行了就業(yè)意向調(diào)查統(tǒng)計(jì),我們首先從學(xué)院中的學(xué)生學(xué)籍管理系統(tǒng)中獲取了2021屆畢業(yè)生的學(xué)生基本信息,包括他們的院系、專(zhuān)業(yè)、班級(jí)、姓名、學(xué)號(hào)、性別、籍貫、政治面貌以及身份證號(hào)等。其次我們還從學(xué)校的“成績(jī)查詢(xún)服務(wù)網(wǎng)站”中獲取到了2021屆畢業(yè)生的學(xué)習(xí)成績(jī),包括各科成績(jī)、專(zhuān)業(yè)績(jī)點(diǎn)、學(xué)分等。然后從這些數(shù)據(jù)中心抽取相應(yīng)的部分畢業(yè)生信息作為這次研究分析的對(duì)象,一次來(lái)保證數(shù)據(jù)信息本身的準(zhǔn)確性以及隨機(jī)性。
4構(gòu)造決策樹(shù)
在后疫情時(shí)期,影響學(xué)生進(jìn)行就業(yè)選擇的因素更多,而疫情對(duì)于學(xué)生就業(yè)選擇的影響也是當(dāng)前高校在進(jìn)行就業(yè)指導(dǎo)過(guò)程中不可忽視的一點(diǎn)。而因?yàn)槲覀冞x的研究對(duì)象是重慶工程學(xué)院2021屆的所有畢業(yè)生,因此所涉及到的信息數(shù)量是十分巨大的,而任務(wù)采集也足足花費(fèi)了將近一年的時(shí)間,采集任務(wù)重,耗時(shí)長(zhǎng),所涉及到的數(shù)據(jù)信息如果想要完全處理,難度極大,因此我們?yōu)榱吮WC數(shù)據(jù)本身的有效性,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)數(shù)據(jù)集成以及屬性歸納的方式對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。同時(shí)通過(guò)運(yùn)用C4.5算法獲得的決策樹(shù),往往也是十分龐大復(fù)雜的,要想凸顯主要的影響因素,提高整個(gè)決策樹(shù)的實(shí)用性,我們需要去除掉決策樹(shù)中對(duì)于實(shí)際就業(yè)情況影響不大的因素,對(duì)決策樹(shù)進(jìn)行必要的修剪,這就需要使用到悲觀后剪枝法。
通過(guò)對(duì)重慶工程學(xué)院2021屆畢業(yè)生進(jìn)行信息數(shù)據(jù)的調(diào)查以及分析我們發(fā)現(xiàn),所有學(xué)生對(duì)于自己畢業(yè)之后的第一份工作都是十分重視的,但是在針對(duì)就業(yè)單位的選擇上考慮的點(diǎn)卻有很大的區(qū)別,在薪資方面,40%以上的畢業(yè)生希望在月薪5000元以上,可見(jiàn)現(xiàn)在年輕人對(duì)于薪資待遇還是十分重視的。其次就是45%的畢業(yè)生都不太關(guān)注專(zhuān)業(yè)是否對(duì)口的問(wèn)題,只看中行業(yè)未來(lái)的發(fā)展?jié)摿σ约白约何磥?lái)的發(fā)展機(jī)會(huì)。當(dāng)然對(duì)于就業(yè)單位所能夠提供的福利待遇則是很多畢業(yè)生都關(guān)注的問(wèn)題,95%的畢業(yè)生都有強(qiáng)烈的五險(xiǎn)一金意識(shí),其次對(duì)于周末雙休、帶薪休假、進(jìn)修培訓(xùn)以及包吃住等也都十分重視。而更多的畢業(yè)生是希望能夠通過(guò)第一份工作獲得寶貴的經(jīng)驗(yàn)以及清晰的職業(yè)規(guī)劃的。這些調(diào)查對(duì)于重慶工程學(xué)院構(gòu)建出清晰的畢業(yè)生決策樹(shù)是有很大的幫助的,對(duì)于該校以后進(jìn)行就業(yè)指導(dǎo)也有很大的幫助。
5疫情影響下決策樹(shù)在畢業(yè)生就業(yè)指導(dǎo)的應(yīng)用
在構(gòu)造決策樹(shù)之后,就需要依據(jù)決策樹(shù)所提供的數(shù)據(jù)信息從決策樹(shù)的根結(jié)點(diǎn)到葉結(jié)點(diǎn)進(jìn)行分類(lèi)規(guī)則的歸納生成。而基于后疫情時(shí)期的高校畢業(yè)生就業(yè)選擇所涉及到的相關(guān)研究文獻(xiàn)比較缺乏,因此需要在不斷的自我總結(jié)和深度研究的過(guò)程中去探索關(guān)于疫情對(duì)于高校畢業(yè)生就業(yè)選擇影響的因素,同時(shí)搭建針對(duì)新冠疫情影響的決策樹(shù)理論框架,以及相對(duì)應(yīng)的數(shù)據(jù)調(diào)查方法,從而嘗試性的探究決策樹(shù)在后疫情時(shí)期對(duì)于大學(xué)生就業(yè)指導(dǎo)工作的應(yīng)用研究。
參考文獻(xiàn)
[1]楊斷利,張銳,王文顯.基于模糊決策樹(shù)的高校就業(yè)數(shù)據(jù)挖掘研究[J].河北農(nóng)業(yè)大學(xué)學(xué)報(bào),2012,35(2):111-114.
[2]麥曉冬,賈萍,翁建榮,等.基于多尺度粗糙集模型的決策樹(shù)在高校就業(yè)數(shù)據(jù)分析中的應(yīng)用[J].華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),201,46(4):31-36.
[3]李冬梅,路春艷,張雅惠:決策樹(shù)分類(lèi)方法在大學(xué)生就業(yè)指導(dǎo)中的應(yīng)用[J].統(tǒng)計(jì)與咨詢(xún),2017(06):29-32.