李佳林
?
基于BP神經(jīng)網(wǎng)絡(luò)對(duì)大學(xué)生就業(yè)率預(yù)測(cè)模型研究——以四川衛(wèi)生康復(fù)職業(yè)學(xué)院為例
李佳林
四川衛(wèi)生康復(fù)職業(yè)學(xué)院人文社科部,四川 自貢 643000
針對(duì)近年來(lái)大學(xué)生就業(yè)發(fā)展問(wèn)題,以四川衛(wèi)生康復(fù)職業(yè)學(xué)院2000~2015年就業(yè)率為依據(jù),采用LMBP算法,構(gòu)建人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,使用MATLAB實(shí)驗(yàn)仿真,預(yù)測(cè)大學(xué)畢業(yè)生的就業(yè)率。通過(guò)該網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)可知,該網(wǎng)絡(luò)的最大誤差為1.72%,滿足預(yù)期要求;最后通過(guò)該模型預(yù)測(cè)了2016~2018年就業(yè)率分別為91.8659%、92.7938%、93.8210%,就業(yè)率預(yù)測(cè)模型研究為大學(xué)畢業(yè)生的就業(yè)指導(dǎo)提供了技術(shù)和理論依據(jù),同時(shí)為政府和高校提供科學(xué)的決策依據(jù)。
大學(xué)畢業(yè)生;就業(yè)率;LMBP算法;BP神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)
大學(xué)生就業(yè)問(wèn)題與專業(yè)性、行業(yè)性、綜合性有關(guān),而BP神經(jīng)網(wǎng)絡(luò)又具有非線性特性和自學(xué)習(xí)、自組織、自適應(yīng)能力,因此本文以BP神經(jīng)網(wǎng)絡(luò)的LM(Levenberg-Marquadt)反傳算法[1],結(jié)合四川衛(wèi)生康復(fù)職業(yè)學(xué)院近16年的畢業(yè)生的就業(yè)率的數(shù)據(jù)統(tǒng)計(jì),構(gòu)建了基于LMBP神經(jīng)網(wǎng)絡(luò)的大學(xué)畢業(yè)生就業(yè)預(yù)測(cè)模型,并預(yù)測(cè)了未來(lái)3年大學(xué)生的就業(yè)率,為高校提供了可靠的決策依據(jù)和就業(yè)指導(dǎo)意義。
1.1 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)也稱為誤差反向傳播網(wǎng)絡(luò)(Back Propagation Network),是1986年由Rumelhart和McCelland等科學(xué)家提出一種由非線性變換單元組成的前饋網(wǎng)絡(luò),是目前人工神經(jīng)網(wǎng)絡(luò)中使用最為廣泛的學(xué)習(xí)算法之一[2]。
結(jié)構(gòu)上,BP神經(jīng)網(wǎng)絡(luò)是一種典型的多層網(wǎng)絡(luò),分別是輸入層、隱含層、輸出層,層與層之間采用全鏈接方式,同一層單元之間無(wú)連接。輸入層和輸出層的節(jié)點(diǎn)數(shù)一般由實(shí)際的要求確定,而隱含層的節(jié)點(diǎn)數(shù)根據(jù)多次試驗(yàn)來(lái)確定。
1.2 就業(yè)率預(yù)測(cè)模型
一個(gè)隱含層的BP網(wǎng)絡(luò)可以逼近任意一個(gè)連續(xù)函數(shù),三層的BP網(wǎng)絡(luò)可以完成任意的n維到m維的映射。
為此,本文采用三層BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)大學(xué)畢業(yè)生的就業(yè)率,學(xué)習(xí)和訓(xùn)練已有的數(shù)據(jù),找到輸入與輸出一種內(nèi)在關(guān)系,從而建立起一種網(wǎng)絡(luò)預(yù)測(cè)模型。如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
設(shè)計(jì)每層網(wǎng)絡(luò)的神經(jīng)元個(gè)數(shù),由于是基于時(shí)間順序的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,將前3年數(shù)據(jù)作為一組輸入向量,第4年作為輸出向量,為此輸入層的神經(jīng)元個(gè)數(shù)確定為3,相應(yīng)的輸出層的神經(jīng)元個(gè)數(shù)為1。對(duì)于隱元層神經(jīng)元個(gè)數(shù)的確定,目前還沒(méi)有統(tǒng)一確定的設(shè)計(jì)方法,目前普遍是根據(jù)經(jīng)驗(yàn)和多次反復(fù)試驗(yàn)選擇[3]。
根據(jù)經(jīng)驗(yàn)選擇如下公式進(jìn)行設(shè)計(jì):
本次就業(yè)率預(yù)測(cè)模型中,輸入層到隱含層采用S型傳遞函數(shù)tan-sigmod,該函數(shù)能將隱含層網(wǎng)絡(luò)輸出映射到-1~1,且可微。隱含層到輸出層采用線性函數(shù)purelin,拓寬網(wǎng)絡(luò)輸出。由于該預(yù)測(cè)網(wǎng)絡(luò)訓(xùn)練采用LM反轉(zhuǎn)學(xué)習(xí)算法,為此選用trainlm作為訓(xùn)練函數(shù),加快收斂速度。
1.3 LMBP算法
傳統(tǒng)的BP算法的修正權(quán)值是采用等量梯度算法,其收斂速度相對(duì)較慢,為此采用改進(jìn)型的LMBP算法達(dá)到快速收斂。LMBP算法是利用二階導(dǎo)數(shù)信息進(jìn)行搜索,既具有擬牛頓算法的快速收斂,同時(shí)具有梯度算法的整體收斂性;該算法的改進(jìn)大大提高了BP算法的學(xué)習(xí)效率,其修正式
式中:JJ=H,是網(wǎng)絡(luò)誤差函數(shù)對(duì)權(quán)值和閾值一階導(dǎo)數(shù)的雅可比矩陣(Jacobi),是網(wǎng)絡(luò)誤差向量[6]。
2.1 樣本采集與預(yù)處理
本次研究的樣本采集是依據(jù)四川衛(wèi)生康復(fù)職業(yè)學(xué)院近16年畢業(yè)生就業(yè)率,樣本如表1所示。
為了適應(yīng)網(wǎng)絡(luò)輸出,減少網(wǎng)絡(luò)層之間的權(quán)值調(diào)整,提高網(wǎng)絡(luò)的收斂速度,從而將樣本進(jìn)行如下歸一化預(yù)處理:
表1 2000-2015畢業(yè)生就業(yè)率
本次設(shè)計(jì)的就業(yè)率預(yù)測(cè)模型中,前3年作為輸入,第4年作為輸出,為此將歸一化后數(shù)據(jù)建立如下的樣本,如表2所示:
表2 樣本建立
2.2 建立訓(xùn)練預(yù)測(cè)模型
在樣本中,以2000~2012年的數(shù)據(jù),建立10組作為學(xué)習(xí)樣本P,相應(yīng)地建立10個(gè)監(jiān)督目標(biāo)樣本T[7]。利用MATLAB的newff函數(shù)創(chuàng)建BP網(wǎng)絡(luò)模型,源代碼如下:
Net1=newff(minmax(P),[5,1],{‘tansig’,’ purelin’},’trainlm’);
網(wǎng)絡(luò)訓(xùn)練的參數(shù)如下:
net1.trainParam.show=100;
net1.trainParam.epoch=1000;
net1.trainParam.goal=1e-4;
net1=train(net1,P,T);
2.3 網(wǎng)絡(luò)學(xué)習(xí)
通過(guò)MATLAB的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,圖2可以看到該預(yù)測(cè)模型結(jié)構(gòu)以及訓(xùn)練過(guò)程的不同參數(shù),同時(shí)在圖3的誤差變化曲線圖中發(fā)現(xiàn),經(jīng)過(guò)6次迭代以后就達(dá)到了性能要求1e-4。
圖2 預(yù)測(cè)模型與訓(xùn)練參數(shù)圖
圖3 誤差變化曲線圖
2.4 網(wǎng)絡(luò)仿真與檢驗(yàn)
網(wǎng)絡(luò)訓(xùn)練后,利用2013~2015年的3個(gè)樣本來(lái)檢驗(yàn)該預(yù)測(cè)網(wǎng)絡(luò):
Ptest=[0.9203-0.2717-0.5036
-0.27170.5036-0.5942
-0.5036-0.5942-0.5217];
相應(yīng)的目標(biāo)樣本,即:
Ttest=[-0.5942-0.5217-0.4239];
利用MATLAB中仿真函數(shù)sim()檢驗(yàn)預(yù)測(cè)網(wǎng)絡(luò)模型,圖4是實(shí)際值與預(yù)測(cè)值的誤差曲線圖。
其中“-+”表示真實(shí)數(shù)據(jù),“-o”表示預(yù)測(cè)數(shù)據(jù),從圖3 中可以發(fā)現(xiàn),2013~2015年的實(shí)際值與預(yù)測(cè)值的最大誤差為1.7%,達(dá)到了均方誤差的要求,說(shuō)明該預(yù)測(cè)模型保證可靠的預(yù)測(cè)精度。
從圖4的回歸曲線中也可看到該預(yù)測(cè)模型就有很好的數(shù)據(jù)擬合能力。
圖4 預(yù)測(cè)回歸圖
2.5 就業(yè)率預(yù)測(cè)
利用檢驗(yàn)好的預(yù)測(cè)模型,分別對(duì)2016~2018年的大學(xué)畢業(yè)生的就業(yè)率進(jìn)行預(yù)測(cè),預(yù)測(cè)的結(jié)果為91.865 9%、92.793 8%、93.821 0%,可以看出就業(yè)率在逐年緩慢升高,其原因目前醫(yī)療行業(yè)還處于需求醫(yī)務(wù)人員狀態(tài),該領(lǐng)域畢業(yè)生的就業(yè)情況相對(duì)較好。
由于大學(xué)畢業(yè)生就業(yè)率問(wèn)題具有非線性特點(diǎn),提出了基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法。根據(jù)四川衛(wèi)生康復(fù)職業(yè)學(xué)院近年來(lái)學(xué)生的就業(yè)率,使用了MATLAB進(jìn)行仿真預(yù)測(cè),通過(guò)已有的數(shù)據(jù)建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,經(jīng)學(xué)習(xí)和檢驗(yàn),該預(yù)測(cè)就業(yè)率模型達(dá)到了預(yù)定性能指標(biāo),滿足要求;同時(shí)通過(guò)該模型,預(yù)測(cè)了2016~2018年學(xué)院的就業(yè)率。由于大學(xué)生就業(yè)率問(wèn)題與專業(yè)、行業(yè)背景等因素有關(guān),在后續(xù)的工作研究中會(huì)加入這些因素,從而能更加客觀地評(píng)價(jià)大學(xué)生就業(yè)率問(wèn)題。
[1]張德豐.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2011.
[2]傅薈璇.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2010.
[3]馬丹丹,于占龍,劉越.BP神經(jīng)網(wǎng)絡(luò)在大學(xué)畢業(yè)生就業(yè)率預(yù)測(cè)中的研究與應(yīng)用[J].佳木斯大學(xué)學(xué)報(bào),2014,32(5):751-753.
Research on College Students’ Employment Rate Prediction Model based on BP Neural Network——a Case Study of Sichuan Health and Rehabilitation Career Academy
Li Jialin
Department of Humanities and Social Sciences, Department of Humanities and Social Sciences, Career Academy, Sichuan Zigong 643000
For the employment of university graduates in recent years development, in Sichuan Vocational College of health and rehabilitation 2000-2015 employment rate as the basis by LMBP algorithm, artificial neural network prediction model is constructed, using MATLAB simulation to predict the employment rate of university graduates. Know learning through the training of the network, the maximum error of the network was 1.72%, meet the expected requirements. Finally through the model predicted 2016~2018 employment rate respectively 91.8659%, 92.7938%, 93.8210%, employment rate prediction model research for university graduates employment guidance provides technical and theoretical basis, at the same time as the government and Colleges and universities to provide scientific basis for decision making.
college graduates; employment rate; LMBP algorithm; BP neural network; prediction
F249.2;TP183
A
1009-6434(2016)08-0097-03