李翔 黨曉楠 王清雯
摘要:本文以鎮(zhèn)江市高等??茖W校醫(yī)藥與化材學院畢業(yè)生的就業(yè)質(zhì)量為預測目標,采用單雙隱層神經(jīng)網(wǎng)絡作為預測模型,通過比較模型訓練時的預測精度,模型仿真時的預測時間及精度,比較單雙隱層的預測能力。實驗結(jié)果表明,對于較小輸入層神經(jīng)元數(shù)的BP神經(jīng)網(wǎng)絡模型而言,采用單隱層是較為合理的,預測精度也較高。采用雙隱層模型將會導致模型運算復雜化,預測精度反而降低。
關(guān)鍵詞:就業(yè)質(zhì)量;神經(jīng)網(wǎng)絡;貢獻率;預測
中圖分類號:G642.0;TP393 文獻標志碼:A 文章編號:1674-9324(2018)29-0037-03
一、引言
高職院校學生的就業(yè)質(zhì)量一直是社會普遍關(guān)注的焦點,如何有效地對大學生的就業(yè)質(zhì)量進行預判,是當前社會研究的熱點。目前,有大量的研究采用反向傳播(Back Propagation)神經(jīng)網(wǎng)絡對大學生的就業(yè)率、就業(yè)能力、就業(yè)情況進行分析,取得了令人滿意的研究成果。但目前關(guān)于采用BP神經(jīng)網(wǎng)絡對高職院校大學生就業(yè)質(zhì)量的分析研究仍然較少。同時,影響高職院校大學生就業(yè)質(zhì)量的因素眾多,如知識因素、個人因素等,如果將眾多的因素量化并建立數(shù)據(jù)庫時,數(shù)據(jù)庫便顯得龐大繁雜。模型結(jié)構(gòu)及參數(shù)的設(shè)定可能就會對模型的訓練速度及精度有所影響,最終對就業(yè)質(zhì)量的預測精度造成影響。因此,需要對模型的結(jié)構(gòu)及參數(shù)的設(shè)定進行探討,尋找到預測高職院校大學生就業(yè)質(zhì)量的最佳模型。
因此,本文嘗試采用兩種不同結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡模型對大學生的就業(yè)質(zhì)量進行分析,對不同隱層數(shù)的模型的預測精度進行比較分析。
二、BP神經(jīng)網(wǎng)絡
BP網(wǎng)絡(Back Propagation)是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡,是目前應用最為廣泛的神經(jīng)網(wǎng)絡模型之一。BP網(wǎng)絡能學習和存貯大量的輸入-輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學方程。該網(wǎng)絡主要包括了一個輸入層和一個輸出層,中間包含了一個或者多個隱含層。每層都具有一定數(shù)量的神經(jīng)元,輸入層的神經(jīng)元數(shù)目對應著影響目標值的各因素數(shù)目。層與層之間的神經(jīng)元存在著權(quán)值和閾值,具體的計算公式可參考文獻。
三、研究方法
1.模型數(shù)據(jù)庫的建立。對醫(yī)藥與化材學院的近三年畢業(yè)生采取問卷調(diào)查形式,問卷調(diào)查內(nèi)容涵蓋了影響大學生就業(yè)質(zhì)量的知識因素及個人因素,例如知識因素中的專業(yè)知識因素主要包含了外語過級情況、畢業(yè)生在校期間的班級排名等,個人因素包含了“自我自覺性評價”“自我實踐能力評價”“自我表達能力評價”“自我抗壓能力評價”“自我創(chuàng)新性評價”等。建立模型時需將各個因素進行量化,如“自我實踐能力評價”分為“很強”“較強”“一般”“弱”四個選項,在建立數(shù)據(jù)庫時分別設(shè)定值為“0.99”“0.75”“0.5”“0.25”,將“目前工作的滿意度及未來發(fā)展前景”作為大學生就業(yè)質(zhì)量的最終評價標準,其選項中“非常滿意”“滿意”“一般”“不滿意”分別設(shè)定值為“0.99”“0.75”“0.5”“0.25”。將各個因素有規(guī)律的量化是建立數(shù)據(jù)庫的基本要求,部分訓練樣本的數(shù)據(jù)如表1所示。10個樣本的就業(yè)質(zhì)量目標值量化后分別對應0.75、0.5、0.5、0.75、0.75、0.5、0.5、0.75、0.5、0.75。整個調(diào)查問卷過程回收有效問卷85份,任意選擇75份樣本數(shù)據(jù)建立數(shù)據(jù)庫以供模型訓練,剩余10樣本數(shù)據(jù)作為“驗證組”,將與模型的“預測組”進行比較,判斷模型的預測精度。
2.模型主要參數(shù)的確定。
(1)傳遞函數(shù)及訓練函數(shù)的確定。BP神經(jīng)網(wǎng)絡建模過程可直接采用MATLAB工具箱實現(xiàn),MATLAB提供了神經(jīng)網(wǎng)絡工具箱,網(wǎng)絡設(shè)計者可根據(jù)自己的需求直接調(diào)用工具箱中有關(guān)神經(jīng)網(wǎng)絡的設(shè)計及訓練程序。神經(jīng)網(wǎng)絡工具箱提供了建立神經(jīng)網(wǎng)絡的專用函數(shù)newff ( ),該函數(shù)的調(diào)用格式為:net=newff(PR,[S1 S2 … SN],{TF1 TF2 … TFN},BTF,BLF,PF),其中PR為數(shù)據(jù)的取值范圍,通常原始數(shù)據(jù)都要經(jīng)過歸一化處理,處理后其值范圍在[-1,1]之間。Si為第i層的神經(jīng)元數(shù),總共N層,TFi為第i層的傳遞函數(shù),本文單、雙隱層的傳遞函數(shù)都設(shè)定為“tansig”,輸出層的傳遞函數(shù)設(shè)為“purelin”。同時,訓練函數(shù)選擇“traingdm”函數(shù),該函數(shù)采用了有動量的梯度下降法,具有較高的訓練精度。
(2)單隱層BP神經(jīng)網(wǎng)絡隱含層神經(jīng)元數(shù)的確定。本文隱含層神經(jīng)元數(shù)的確定參考高大啟提供的一個經(jīng)驗公式:
S=0.51+■(1)
式中,m為輸入層神經(jīng)元數(shù),n為輸出層神經(jīng)元數(shù),S為隱含層神經(jīng)元數(shù),本文輸入層神經(jīng)元數(shù)為9,輸出層神經(jīng)元數(shù)為1,通過計算可得隱含層神經(jīng)元數(shù)為6,因此,本文嘗試大的隱含層神經(jīng)元數(shù)分別為4、5、6、7。
(3)雙隱層BP神經(jīng)網(wǎng)絡隱含層神經(jīng)元數(shù)的確定。參考單隱層BP神經(jīng)網(wǎng)絡的隱含層神經(jīng)元數(shù),雙隱層第一層神經(jīng)元數(shù)分別為5、6、7,第二層神經(jīng)元數(shù)分別為5、6、7,因此共有九個不同結(jié)構(gòu)的雙隱層神經(jīng)網(wǎng)絡。
(4)學習率及其他訓練參數(shù)的確定。本文的學習率設(shè)定為0.1,精度設(shè)定為0.02,訓練步數(shù)設(shè)定為200000,訓練步長設(shè)定為1000。
(5)Matlab的主要程序。
單隱層BP模型引用程序為:
net=newff(minmax(P),[X,1],{'tansig','purelin'},'traingdm');
雙隱層BP模型引用程序為:
net=newff(minmax(P),[X,Y,1],{'tansig','tansig','purelin'},'traingdm');
其中,P為用于訓練的樣本各因素量化后的數(shù)據(jù)庫,X與Y分別為第一層與第二層隱含層的神經(jīng)元數(shù)目,T為用于訓練的樣本目標量化后的數(shù)據(jù),Pn為用于模型驗證的原始數(shù)據(jù)。
四、BP神經(jīng)網(wǎng)絡模型的仿真
本文采用了75個樣本建立數(shù)據(jù)庫用于BP神經(jīng)網(wǎng)絡模型的訓練,10個樣本數(shù)據(jù)用于模型性能的預測,實驗結(jié)果如表2與表3所示。本文的預測目標是大學生的就業(yè)質(zhì)量,采用的是“目前工作的滿意度以及未來發(fā)展前景”作為就業(yè)質(zhì)量的評價標準。因為本文采用了統(tǒng)計學模型進行數(shù)據(jù)分析,因此模型仿真后的值為具體數(shù)值,需要進一步對應其滿意度,轉(zhuǎn)化后的預測滿意度與實際滿意度如表3所示。例如當單隱含層的神經(jīng)元數(shù)為6時,樣本4的預測值為0.6216,相比較0.75,0.6216更加接近0.5,因此對應的滿意度為“一般”,與實際值相同。
從表3可以看出,當隱含層數(shù)為一層,隱含層神經(jīng)元數(shù)為5時,模型預測的精確度達到了90%,其他結(jié)構(gòu)模型的預測精度都低于該模型。特別是對于雙隱層BP神經(jīng)網(wǎng)絡而言,當隱含層節(jié)點數(shù)為6/6時,模型的預測精度為80%,可以看出,單隱層神經(jīng)網(wǎng)絡模型的預測精度要高于雙隱層神經(jīng)網(wǎng)絡模型。這就從側(cè)面說明單隱層BP神經(jīng)網(wǎng)絡是具備了高精度的預測性能。
對于單隱層的BP神經(jīng)網(wǎng)絡模型而言,隨著隱含層神經(jīng)元數(shù)的增加,模型的預測精度呈現(xiàn)了一個先增加后降低的趨勢,說明當采用BP神經(jīng)網(wǎng)絡模型進行預測時,隱含層神經(jīng)元數(shù)的選擇對預測精度有重大影響。合理選擇隱含層神經(jīng)元可提高模型的預測精度。
五、結(jié)論
本文采用了單、雙隱含層的BP神經(jīng)網(wǎng)絡對大學生的就業(yè)質(zhì)量進行了預測,當隱含層神經(jīng)元數(shù)為6時,模型的預測精度達到了90%,說明該模型具有非常高的預測精度,模型具備了很強的適用性。當對小樣本數(shù)據(jù)進行訓練時,可以采用單隱層的BP神經(jīng)網(wǎng)絡。
參考文獻:
[1]馬丹丹,于占龍,劉越.BP神經(jīng)網(wǎng)絡在大學畢業(yè)生就業(yè)率預測中的研究與應用[J].佳木斯大學學報(自然科學版),2014,32(5):751-753.
[2]楊光軍.灰色理論和BP神經(jīng)網(wǎng)絡在大學生就業(yè)信心指數(shù)預測中的應用[J].數(shù)學的實踐與認識,2013,15(6):62-67.
[3]吳振磊,劉孝趙.一種基于BP神經(jīng)網(wǎng)絡的就業(yè)分析預測模型[J].輕工科技,2016,(9):70-71.
[4]陳立俊,王克強.基于人工神經(jīng)網(wǎng)絡方法的大學生就業(yè)問題探析[J].教育發(fā)展研究,2013,13-14.
[5]佘其平,鄧娟,李慶.基于BP神經(jīng)網(wǎng)絡的大學生就業(yè)情況分析[J].現(xiàn)代商貿(mào)工業(yè),2015,36(25),139-141.
[6]童輝杰,楊雅婕,呂航.應用神經(jīng)網(wǎng)絡模型對大學畢業(yè)生就業(yè)質(zhì)量的預測[J].人類工效學,2012,(3):20-23.
[7]周勇.大學生就業(yè)對我國經(jīng)濟的現(xiàn)實影響及建議[J].唐山學院學報,2016,28(1):100-104.
[8]葉斌,雷燕.關(guān)于BP網(wǎng)中隱含層數(shù)及節(jié)點數(shù)選取方法淺析[J].商丘職業(yè)技術(shù)學院學報,2004,3(15):52-53.