摘 ?要:根據(jù)大學(xué)生就業(yè)的歷史數(shù)據(jù)創(chuàng)建就業(yè)模型并預(yù)測(cè)未來的就業(yè)變化及趨勢(shì),可以為學(xué)校管理者和人才培養(yǎng)方案制定者提供有價(jià)值的信息和參考依據(jù)。本文結(jié)合學(xué)者們針對(duì)高校畢業(yè)生就業(yè)預(yù)測(cè)的研究成果和研究脈絡(luò),從就業(yè)預(yù)測(cè)數(shù)據(jù)源、就業(yè)預(yù)測(cè)算法、就業(yè)預(yù)測(cè)要素及就業(yè)預(yù)測(cè)結(jié)論四個(gè)方面詳細(xì)介紹相關(guān)研究成果及代表文獻(xiàn),為研究人員提供參考和借鑒。
關(guān)鍵詞:高等學(xué)校;就業(yè)預(yù)測(cè);算法分析
中圖分類號(hào):TP311.13 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)12-0086-03
Abstract:Based on the historical data of college studentsemployment,establishing employment model and predicting employment changes and trends in future,which can provide valuable information and reference for school administrators and personnel training program makers. Based on the research results and research veins of the employment prediction of college graduates,this paper makes an analysis from four aspects:the data source of employment prediction,the employment prediction algorithm,the elements of employment prediction and the conclusion of employment prediction,and introduces detailed the relevant research results and representative literatures,so as to provide reference for researchers.
Keywords:institutions of higher learning;employment prediction;algorithms analysis
0 ?引 ?言
高校畢業(yè)生的就業(yè)情況及相關(guān)數(shù)據(jù)在一定的程度上反映出高校的人才培養(yǎng)方案對(duì)接行業(yè)需求的吻合度、高校畢業(yè)生的工作能力滿足企業(yè)發(fā)展的需要以及高校在服務(wù)地方經(jīng)濟(jì)發(fā)展與社會(huì)貢獻(xiàn)方面的能力。為了較好地服務(wù)地方經(jīng)濟(jì)發(fā)展,提升高校的社會(huì)貢獻(xiàn)度,依據(jù)區(qū)域經(jīng)濟(jì)特色、行業(yè)需求和企業(yè)需要,適時(shí)制定和修訂專業(yè)人才培養(yǎng)方案,打造與培育技術(shù)能力強(qiáng)、職業(yè)素養(yǎng)高的高校畢業(yè)生是高校的辦學(xué)使命。因此,有必要根據(jù)歷年的就業(yè)數(shù)據(jù)創(chuàng)建就業(yè)模型來預(yù)測(cè)未來的就業(yè)變化和就業(yè)趨勢(shì),為高校管理者制定行業(yè)需要、企業(yè)滿意、社會(huì)反饋良好的專業(yè)人才培養(yǎng)方案提供有價(jià)值的信息和參考。
為此,本文根據(jù)學(xué)者們針對(duì)高校畢業(yè)生就業(yè)預(yù)測(cè)的研究成果和研究脈絡(luò),對(duì)相關(guān)文獻(xiàn)進(jìn)行整理和分析,分別從就業(yè)預(yù)測(cè)數(shù)據(jù)源、就業(yè)預(yù)測(cè)算法、就業(yè)預(yù)測(cè)要素及就業(yè)預(yù)測(cè)結(jié)論四個(gè)方面進(jìn)行,并詳細(xì)介紹了四個(gè)方面的相關(guān)研究成果。
1 ?高校畢業(yè)生就業(yè)預(yù)測(cè)數(shù)據(jù)源分析
文獻(xiàn)[1]以廣西教育學(xué)院2012屆畢業(yè)生就業(yè)分析樣本數(shù)據(jù)集為研究樣本,并將研究樣本分為“畢業(yè)生就業(yè)方向?yàn)榻處煹臉颖緮?shù)據(jù)集”“畢業(yè)生就業(yè)方向?yàn)槠髽I(yè)單位的樣本數(shù)據(jù)集”“畢業(yè)生就業(yè)方向?yàn)槭聵I(yè)/機(jī)關(guān)單位的樣本數(shù)據(jù)集”進(jìn)行了就業(yè)預(yù)測(cè)分析。
文獻(xiàn)[2]研究的數(shù)據(jù)源為南京工程高等職業(yè)學(xué)校的就業(yè)管理系統(tǒng),數(shù)據(jù)跨度為2010至2012年,以4500名畢業(yè)生相關(guān)數(shù)據(jù)為研究樣本,并將這將這些研究樣本分為“學(xué)生基本信息數(shù)據(jù)”“學(xué)生成績(jī)信息數(shù)據(jù)”“學(xué)生就業(yè)情況”等樣本數(shù)據(jù)集。
文獻(xiàn)[3]以福建省2006年至2011年招生計(jì)劃數(shù)與畢業(yè)生人數(shù)為研究樣本,依據(jù)學(xué)生就業(yè)單位的類型(國(guó)企、外企和私企),抽取相同數(shù)量的就業(yè)數(shù)據(jù)作為樣本進(jìn)行分析。
文獻(xiàn)[4]從150所大學(xué)中選擇100個(gè)大學(xué)生就業(yè)數(shù)據(jù)作為研究樣本。
文獻(xiàn)[5]采集了昆山市的兩個(gè)鄉(xiāng)鎮(zhèn)中的100家企業(yè)提供的2006年至2009年的44條數(shù)據(jù)作為研究數(shù)據(jù)。
文獻(xiàn)[6]從本校畢業(yè)生中抽取歷年畢業(yè)生在校的一些信息作為研究樣本,每條研究樣本包括性別、英語水平、政治面貌、綜合測(cè)評(píng)成績(jī)、擔(dān)任過學(xué)生干部、是否為“三好學(xué)生”、參與社會(huì)實(shí)踐、就業(yè)的期望值、獲得學(xué)位、畢業(yè)論文成績(jī)、就業(yè)作為等項(xiàng)目。
文獻(xiàn)[7]研究對(duì)象為某高校近三年的畢業(yè)生就業(yè)信息。
文獻(xiàn)[8]以近三年的信息類專業(yè)畢業(yè)學(xué)生的就業(yè)數(shù)據(jù)為研究樣本,創(chuàng)建了就業(yè)薪酬的預(yù)測(cè)模型。
……
從以上研究數(shù)據(jù)源來看,研究者使用的數(shù)據(jù)來源不同,范圍上存在一定的差異,時(shí)間跨度也不盡相同,但數(shù)據(jù)上有一個(gè)共同的特點(diǎn):研究的數(shù)據(jù)樣本范圍較窄,樣本數(shù)量有限,這易造成研究結(jié)果的片面性。
2 ?高校畢業(yè)生就業(yè)預(yù)測(cè)算法分析
因?yàn)檠芯繑?shù)據(jù)樣本不同,高校畢業(yè)生就業(yè)預(yù)測(cè)算法的選擇也各不相同。
文獻(xiàn)[1]分析了畢業(yè)生就業(yè)數(shù)據(jù)中的關(guān)聯(lián)規(guī)則,根據(jù)數(shù)據(jù)抽樣組建了“畢業(yè)就業(yè)信息數(shù)據(jù)倉(cāng)庫(kù)”。又因畢業(yè)生的就業(yè)信息較多、數(shù)據(jù)復(fù)雜,且有不確定性的特點(diǎn),選用了基于劃分的Apriori優(yōu)化算法來預(yù)測(cè)畢業(yè)生的就業(yè)狀況。采用Apriori算法思想尋找每個(gè)數(shù)據(jù)劃分因素的頻繁項(xiàng)集,計(jì)算這些項(xiàng)集的支持度,挖掘出各項(xiàng)因素與就業(yè)方向之間的關(guān)聯(lián)規(guī)則,并指出“專業(yè)成績(jī)、英語等級(jí)、社會(huì)實(shí)踐”在畢業(yè)生就業(yè)方向上影響較大。
文獻(xiàn)[2]選用C4.5算法創(chuàng)建高職院校畢業(yè)決策樹數(shù)據(jù)模型,重點(diǎn)關(guān)注研究樣本數(shù)據(jù)的6個(gè)重要屬性:基礎(chǔ)課程成績(jī)、專業(yè)課成績(jī)、英語成績(jī)、是否擔(dān)當(dāng)學(xué)生干部、入學(xué)成績(jī)和期望就業(yè)單位屬性(事業(yè)單位、國(guó)有企業(yè)和私營(yíng)企業(yè)),然后選取決策屬性,構(gòu)造決策樹,創(chuàng)建提取規(guī)則,得出專業(yè)課成績(jī)?nèi)匀皇怯绊憣W(xué)生就業(yè)的最主要的因素,而入學(xué)成績(jī)與預(yù)測(cè)就業(yè)基本無關(guān)。
文獻(xiàn)[3]選用最鄰近(KNN)分類算法,從畢業(yè)生數(shù)據(jù)中提取特征數(shù)據(jù),如:專業(yè)課成績(jī)、是否擔(dān)任班干部、英語水平、計(jì)算機(jī)水平、企業(yè)實(shí)習(xí)經(jīng)歷、實(shí)踐課程成績(jī)和獲獎(jiǎng)情況等,接著對(duì)這些數(shù)據(jù)進(jìn)行數(shù)值化處理,將其轉(zhuǎn)化為特征向量,通過KNN算法計(jì)算樣本數(shù)據(jù)與所有樣本之間的距離,進(jìn)而預(yù)測(cè)出學(xué)生的就業(yè)方向。
文獻(xiàn)[4]對(duì)收集的大學(xué)生就業(yè)數(shù)據(jù)進(jìn)行歸一化處理,考慮灰色模型和神經(jīng)網(wǎng)絡(luò)各自的特點(diǎn),提出利用灰色模型和神經(jīng)網(wǎng)絡(luò)的組合方法對(duì)就業(yè)樣本數(shù)據(jù)進(jìn)行處理,并從不同角度根據(jù)大學(xué)生就業(yè)數(shù)據(jù)創(chuàng)建預(yù)測(cè)模型,從而在灰色模型和神經(jīng)網(wǎng)絡(luò)組合的情況下獲得可靠的預(yù)測(cè)結(jié)果。
文獻(xiàn)[6]采用聚類分析技術(shù)中基于模型的統(tǒng)計(jì)方法,使用COBWEB這種簡(jiǎn)單的增量概念聚類算法,使用分類效用CU來指導(dǎo)分類樹的構(gòu)建。將數(shù)據(jù)的10個(gè)屬性值(性別、政治面貌、是否擔(dān)任學(xué)生干部、是否是“三好學(xué)生”、英語水平、平均綜合成績(jī)、畢業(yè)論文成績(jī)、社會(huì)實(shí)踐、對(duì)就業(yè)的期望和是否取得學(xué)位)進(jìn)行量化,建立數(shù)據(jù)庫(kù)和分類樹,從而建立模型進(jìn)行評(píng)估和驗(yàn)證,得出英語水平高的畢業(yè)生就業(yè)能力強(qiáng)、就業(yè)率高。
文獻(xiàn)[7]也利用C4.5算法進(jìn)行就業(yè)信息的數(shù)據(jù)挖掘,通過決策樹創(chuàng)建數(shù)據(jù)提取,進(jìn)而創(chuàng)建畢業(yè)生的就業(yè)預(yù)測(cè)規(guī)則和模型。計(jì)算數(shù)據(jù)中的屬性值(性別、綜合成績(jī)、計(jì)算機(jī)等級(jí)、外語水平、學(xué)生身份和城鄉(xiāng)情況)之間的信息增益和信息增益比,組建17條分類規(guī)則。以267份樣本數(shù)據(jù)作為測(cè)試樣本對(duì)預(yù)測(cè)模型進(jìn)行有效性驗(yàn)證,得出該預(yù)測(cè)模型預(yù)測(cè)的正確率大于81%,再次有效地證明了決策樹模型在畢業(yè)生就業(yè)預(yù)測(cè)方面具有較高的可靠度與準(zhǔn)確度。
文獻(xiàn)[8]以影響畢業(yè)生就業(yè)的18個(gè)可觀測(cè)量作為影響大學(xué)生就業(yè)薪酬高低的因子,建立基于因子分析法的畢業(yè)生模型,創(chuàng)建樣本特征向量,利用自然鄰居分類對(duì)畢業(yè)生薪酬期望等級(jí)進(jìn)行預(yù)測(cè),并用十折交叉驗(yàn)證的方法證明了該預(yù)測(cè)的精度和準(zhǔn)確率,為大學(xué)畢業(yè)生建立合理的就業(yè)預(yù)期和就業(yè)薪酬計(jì)劃具有一定的指導(dǎo)意義。
文獻(xiàn)[9]通過分析勞動(dòng)力就業(yè)市場(chǎng)的現(xiàn)狀,以某生產(chǎn)公司的28個(gè)就業(yè)樣本數(shù)據(jù),采用BP神經(jīng)網(wǎng)絡(luò)創(chuàng)建就業(yè)預(yù)測(cè)模型。通過仿真實(shí)驗(yàn)得出,基于BP神經(jīng)網(wǎng)絡(luò)的就業(yè)預(yù)測(cè)模型能較為準(zhǔn)確地預(yù)測(cè)各企業(yè)對(duì)短期用工的需求量,并建議企業(yè)可以根據(jù)訂單的數(shù)量來確定招聘員工的數(shù)量。
文獻(xiàn)[10]基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的分類算法,將決策樹ID3算法運(yùn)用到高職生就業(yè)的預(yù)測(cè)分析中,對(duì)數(shù)據(jù)集的特征屬性值(考生類別、入學(xué)總分、考生地域、應(yīng)往屆一、年齡、性別、綜合成績(jī)、單位地址、專業(yè)相關(guān)度)進(jìn)行量化處理,對(duì)學(xué)生是否能順利畢業(yè)進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)證明,基于ID3算法生成的高職院校學(xué)生就業(yè)預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確度較高。
文獻(xiàn)[5]基于AR模型對(duì)昆山區(qū)域的某企業(yè)公司的就業(yè)進(jìn)行了預(yù)測(cè)和分析,文獻(xiàn)[11]提出運(yùn)用Kmeans聚類算法和CBR案例推理方法對(duì)高校學(xué)生就業(yè)趨向進(jìn)行預(yù)測(cè)。
3 ?高校畢業(yè)生就業(yè)預(yù)測(cè)要素分析
在對(duì)高校畢業(yè)生就業(yè)進(jìn)行預(yù)測(cè)的過程中,學(xué)者們以畢業(yè)生的相關(guān)屬性為切入點(diǎn),如性別、政治面貌、學(xué)生干部、獲獎(jiǎng)情況、外語水平(沒有明確外語水平的考級(jí)情況)、專業(yè)成績(jī)、綜合表現(xiàn)成績(jī)、參與社會(huì)實(shí)踐、畢業(yè)論文(設(shè)計(jì))、計(jì)算機(jī)水平(未明確計(jì)算機(jī)考證情況)、是否取得學(xué)位、對(duì)薪酬的期望、城鄉(xiāng)情況(考生地域)、年齡、入學(xué)成績(jī)、應(yīng)往屆生、單位地址等。這些屬性中,使用頻率較高的有性別、專業(yè)成績(jī)、英語水平、計(jì)算機(jī)水平和薪酬期望等,使用較少的屬性有入學(xué)成績(jī)、應(yīng)往屆、城鄉(xiāng)情況、單位地址等。
在上述列舉的畢業(yè)生的相關(guān)屬性中,性別、外語水平、參與社會(huì)實(shí)踐和專業(yè)成績(jī)對(duì)畢業(yè)生就業(yè)的影響較大,這些屬性成為就業(yè)預(yù)測(cè)的關(guān)鍵要素。針對(duì)高職院校畢業(yè)生就業(yè)預(yù)測(cè)來說,專業(yè)成績(jī)、參與社會(huì)實(shí)踐、計(jì)算機(jī)水平這些屬性對(duì)就業(yè)預(yù)測(cè)的準(zhǔn)確度有較大的影響,或者可以說專業(yè)成績(jī)好的、參與過社會(huì)實(shí)踐的,以及掌握計(jì)算機(jī)操作技能的學(xué)生就業(yè)能力強(qiáng)、就業(yè)率高。針對(duì)本科院校畢業(yè)生就業(yè)預(yù)測(cè)來說,外語水平高的學(xué)生容易就業(yè)。就業(yè)預(yù)測(cè)過程中,性別、城鄉(xiāng)情況、入學(xué)成績(jī)、應(yīng)往屆生等屬性對(duì)就業(yè)預(yù)測(cè)的影響較小。
4 ?結(jié) ?論
通過對(duì)上述的研究結(jié)論進(jìn)行分析,在一定程度上可以得知,大學(xué)生在學(xué)校所掌握的專業(yè)技能、外語水平與計(jì)算機(jī)水平直接影響其就業(yè)情況,高校在制定人才培養(yǎng)方案和培育高素質(zhì)學(xué)生的同時(shí),要因勢(shì)利導(dǎo),加強(qiáng)學(xué)生專業(yè)學(xué)習(xí)方面的培養(yǎng)和提高學(xué)生在社會(huì)實(shí)踐活動(dòng)方面的參與度,做好、做實(shí)學(xué)生實(shí)習(xí)、實(shí)訓(xùn)環(huán)節(jié),在課程設(shè)置方面既要考慮學(xué)生的專業(yè)課程的學(xué)習(xí),也要把計(jì)算機(jī)操作技能、外語技能融入課程體系中,注重專業(yè)知識(shí)的理論學(xué)習(xí),強(qiáng)化操作技能的訓(xùn)練,與考證結(jié)合起來。高校畢業(yè)生就業(yè)預(yù)測(cè)為大學(xué)生指引了學(xué)習(xí)的方向,也讓大學(xué)生在個(gè)人就業(yè)方向上有了更加明確的目標(biāo)。
參考文獻(xiàn):
[1] 覃永貞,顧平.Apriori算法在高校畢業(yè)生就業(yè)預(yù)測(cè)中的應(yīng)用分析 [J].輕工科技,2014,30(7):93-94+97.
[2] 王賽男.C4.5分類算法在高職就業(yè)預(yù)測(cè)中的應(yīng)用 [J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2014(23):21-25.
[3] 吳靜.KNN算法在就業(yè)預(yù)測(cè)模型中的應(yīng)用 [J].莆田學(xué)院學(xué)報(bào),2013,20(2):60-63.
[4] 李想.大學(xué)生就業(yè)的建模與預(yù)測(cè)研究 [J].現(xiàn)代電子技術(shù),2017,40(21):109-111+116.
[5] 王靈均.基于AR模型的昆山就業(yè)預(yù)測(cè)及分析 [J].科學(xué)大眾(科學(xué)教育),2009(10):126-127.
[6] 楊霞玲,聶永紅.聚類分析在畢業(yè)生就業(yè)預(yù)測(cè)中的應(yīng)用 [J].廣西工學(xué)院學(xué)報(bào),2005(4):82-84+91.
[7] 蔡麗艷,馬弘偉.數(shù)據(jù)挖掘技術(shù)在高校就業(yè)預(yù)測(cè)分析中的應(yīng)用 [J].微計(jì)算機(jī)信息,2012,28(8):101-103.
[8] 朱慶生,高璇.應(yīng)用自然鄰居分類算法的大學(xué)生就業(yè)預(yù)測(cè)模型 [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(8):190-194.
[9] 吳振磊,劉孝趙.一種基于BP神經(jīng)網(wǎng)絡(luò)的就業(yè)分析預(yù)測(cè)模型 [J].輕工科技,2016,32(9):70-71+104.
[10] 孫曉璇,楊家娥,李雅峰.基于決策樹ID3算法的高職生就業(yè)預(yù)測(cè)分析 [J].電腦編程技巧與維護(hù),2015(2):15-16+35.
[11] 廖珣.基于Kmeans和CBR方法的高校就業(yè)預(yù)測(cè)模型應(yīng)用研究 [J].人力資源管理,2010(3):79-80.
作者簡(jiǎn)介:陳君濤(1981-),男,漢族,湖北天門人,副教授,碩士,研究方向:計(jì)算機(jī)應(yīng)用、職業(yè)教育。