王小龍 穆蕓菲 朱玥祺 寇子若 謝佳美 李涓涓 郭曉明
摘要:為了更好地分析利用校友經(jīng)濟(jì)新形勢下的就業(yè)數(shù)據(jù),建立了影響大學(xué)生就業(yè)因素的加權(quán)隨機(jī)森林模型。首先對影響就業(yè)的因素進(jìn)行排序,然后通過加權(quán)隨機(jī)森林模型,準(zhǔn)確預(yù)測在校生未來就業(yè)情況,在此基礎(chǔ)上充分利用校友資源并搭建平臺(tái)為學(xué)生就業(yè)創(chuàng)造機(jī)遇,加強(qiáng)與校友之間的聯(lián)系,有效推進(jìn)大學(xué)生就業(yè)工作。以某大學(xué)部分校友數(shù)據(jù)為實(shí)例,得到構(gòu)建的模型預(yù)測準(zhǔn)確率為82.3%。
關(guān)鍵詞:校友資源;加權(quán)隨機(jī)森林;算法實(shí)現(xiàn);就業(yè)預(yù)測;小程序
中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)01-0081-04
在當(dāng)今就業(yè)形勢越發(fā)嚴(yán)峻,及我國社會(huì)主義市場經(jīng)濟(jì)體系下,高校也逐漸形成以市場為向?qū)?、畢業(yè)生與用人單位之間的雙向選擇[1]。在校生就業(yè)經(jīng)驗(yàn)不足,且信息素質(zhì)較低,如何判斷信息真?zhèn)涡?、有效性及如何分析整合信息,對在校生是巨大考?yàn),而畢業(yè)校友分布于各行各業(yè)中,恰好能夠提供高效資源[2]。為充分利用校友資源,考慮互聯(lián)網(wǎng)成本低、及時(shí)性、范圍廣的特點(diǎn),采用網(wǎng)絡(luò)作為交流手段,為高校人才交流大大降低成本[3]。
如何提高校友數(shù)據(jù)利用水平,對于高校人才培養(yǎng)和發(fā)展建設(shè),校友關(guān)系網(wǎng)建設(shè)與學(xué)校的可持續(xù)建設(shè)具有重要的現(xiàn)實(shí)意義。近幾年關(guān)于大學(xué)生就業(yè)預(yù)測的研究中,主要使用的方法有Logistic回歸模型[4]、基于決策樹算法[5-6]、數(shù)據(jù)挖掘技術(shù)[7-8]和層次聚類等機(jī)器學(xué)習(xí)方法[9-10],對就業(yè)影響因素進(jìn)行一系列分析,為在校學(xué)生的發(fā)展和畢業(yè)去向提供可靠參考。
受上述方法啟發(fā),本文收集到某高校4000份畢業(yè)生就業(yè)數(shù)據(jù),通過數(shù)據(jù)處理后分析其中553名畢業(yè)生特征及就業(yè)情況,在隨機(jī)森林算法的基礎(chǔ)上,提出采用加權(quán)隨機(jī)森林對大學(xué)生就業(yè)因素進(jìn)行分析及預(yù)測,可有效提高預(yù)測準(zhǔn)確率,并搭建小程序平臺(tái),將預(yù)測結(jié)果與校友資源聯(lián)系,提供高效資源,拓寬就業(yè)途徑。
數(shù)據(jù)挖掘任務(wù)可以是描述性的或預(yù)測性的,描述性數(shù)據(jù)挖掘通常使用關(guān)聯(lián)規(guī)則挖掘、聚類等技術(shù)來發(fā)現(xiàn)及分析隱藏在大數(shù)據(jù)集中的信息,幫助智能決策;預(yù)測數(shù)據(jù)挖掘使用規(guī)則集、決策樹、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等構(gòu)建模型來預(yù)測新數(shù)據(jù)集的類別。
本文通過建立校友的信息庫,包括學(xué)籍、專業(yè)、成績及科研競賽能力指標(biāo)及就業(yè)等信息智能動(dòng)態(tài)[4],利用邏輯推導(dǎo)、機(jī)器學(xué)習(xí)、分析量化,完善數(shù)據(jù)庫中的校友信息,同時(shí)對校友的專業(yè)、從事行業(yè)及薪資目標(biāo)等相關(guān)信息行為進(jìn)行挖掘與需求分析,構(gòu)建出符合在校學(xué)生需求的行為模式,對其可能從事的工作及活動(dòng)進(jìn)行預(yù)測,并基于預(yù)測結(jié)果進(jìn)行精準(zhǔn)校友信息推送。
1 數(shù)據(jù)處理
本文以西安某高校部分畢業(yè)生的就業(yè)數(shù)據(jù)和基本信息為研究對象,從2000—2020年畢業(yè)生中按年份隨機(jī)抽取,再對數(shù)據(jù)進(jìn)行清理,消除缺失值的數(shù)據(jù),更正不一致的數(shù)據(jù),識(shí)別異常值以及刪除重復(fù)數(shù)據(jù)后,共提取553條有效記錄。主要使用學(xué)位、學(xué)校類型、專業(yè)類型、成績及科研競賽能力、家庭背景、戶口性質(zhì)、單位類型、發(fā)展前景、是否專業(yè)對口、是否達(dá)到薪資期望10類對擇業(yè)影響較大的屬性。
由于數(shù)據(jù)項(xiàng)目各屬性間不是簡單的映射關(guān)系, 因此為了便于模型的建立, 將定性數(shù)據(jù)均改為數(shù)值型數(shù)據(jù)。考慮到本文中屬性種類較多,因此采用一種比one-hot法更為緊湊的編碼方式,如對于學(xué)歷屬性, 00表示學(xué)士學(xué)位、01表示碩士學(xué)位, 10表示博士學(xué)位。根據(jù)上述規(guī)則, 處理所有屬性的結(jié)果如表1:
其中,專業(yè)類別描述如表2:
同理,對于戶口性質(zhì):A7=0表示該學(xué)生為農(nóng)村戶口,A7=1表示城市戶口。對于家庭背景:A8=0表示該學(xué)生家庭背景較差即家庭人均年收入1.5萬元以下,A8=1表示家庭背景較好即家庭人均年收入1.5萬元以上。對于成績及科研競賽能力:A9=1表示該學(xué)生成績處于專業(yè)前50%或在各類競賽中取得過較高獎(jiǎng)項(xiàng),A9=0表示成績較差且不曾在科研競賽中取得成果或獎(jiǎng)項(xiàng)。
對于即就業(yè)情況屬性進(jìn)行定義及處理:
其中,專業(yè)對口描述如下:
基于行業(yè)和專業(yè)的定義,判斷從事行業(yè)或職位于專業(yè)是否相關(guān),即學(xué)生在學(xué)校學(xué)習(xí)的專業(yè)類別與之后從事行業(yè)所需要專業(yè)技能,是否存在直接相關(guān)性。例如,本科學(xué)習(xí)的是信息技術(shù)類專業(yè),之后進(jìn)入計(jì)算機(jī)行業(yè)從事技術(shù)開發(fā)人員便為行業(yè)與專業(yè)相關(guān),反之若進(jìn)入經(jīng)濟(jì)行業(yè),從事工商管理工作,則為行業(yè)與專業(yè)不相關(guān)。即R1=0表示該學(xué)生就業(yè)后從事行業(yè)或職位與專業(yè)不相關(guān);R1=1表示從事行業(yè)或職位與專業(yè)相關(guān)。
發(fā)展前景描述如下:
發(fā)展前景是一個(gè)崗位能賦予個(gè)人提升的空間,依據(jù)當(dāng)下普遍情況對所收集數(shù)據(jù)中的崗位進(jìn)行劃分,例如,某中小企業(yè)普通員工或管培生,該崗位能賦予個(gè)人提升的空間較小,因此定義為發(fā)展空間較小。即R2=0表示該生所在行業(yè)為或職位可發(fā)展空間較??;R2=1表示所在行業(yè)為或職位有較好前景。
單位性質(zhì)描述如下:
龍頭企業(yè)是指對于同行業(yè)其他企業(yè)具有深刻影響力、召喚力、一定示范作用和指導(dǎo)作用,并對本地區(qū)、本行業(yè)、本國做出較為突出貢獻(xiàn)的企業(yè)。例如,數(shù)據(jù)中的京東物流、華為技術(shù)有限公司等。反之,通過企查查及天眼查等平臺(tái)調(diào)研,將營業(yè)收入500萬元以下的定義為小微型企業(yè),例如,數(shù)據(jù)中某西安留學(xué)機(jī)構(gòu)或某小型自媒體公司。即R3=0表示該學(xué)生從事自由職業(yè)或所在單位為小型公司,較不穩(wěn)定;R3=1表示所在單位為國企或某行業(yè)龍頭企業(yè),較為穩(wěn)定。
薪資期望描述如下:
預(yù)期薪資則是新人在步入行業(yè)之初,對于因向所在的組織或企業(yè)提供勞務(wù)而獲得的各種形式的酬勞的期望,如果所給薪資達(dá)到或者超于期望,則表示預(yù)期薪資達(dá)標(biāo)。即R4=0表示不能達(dá)到預(yù)期薪金期望;R4=1表示可以達(dá)到預(yù)期薪金期望。
2 加權(quán)隨機(jī)森林模型
在基于機(jī)器學(xué)習(xí)模型的研究中,關(guān)于數(shù)據(jù)分類及數(shù)據(jù)挖掘的研究有很多,但針對將高校學(xué)生求職相關(guān)行為數(shù)據(jù)與校友資源聯(lián)系的探討較少。在查閱相關(guān)文獻(xiàn)后,通過對基本分類算法的對比和分析[15],發(fā)現(xiàn)隨機(jī)森林(Random Forest,RF)模型對于本研究數(shù)據(jù)集具有較優(yōu)的分類準(zhǔn)確率。
梯度提升技術(shù)常被用于機(jī)器學(xué)習(xí)中的回歸和分類問題,其原理為:如果預(yù)測模型每個(gè)步驟的損失函數(shù)都是基于梯度產(chǎn)生的,那么它每個(gè)步驟產(chǎn)生預(yù)測模型稱為弱預(yù)測模型(例如決策樹模型),然后將弱預(yù)測模型以集合的形式再次生成預(yù)測模型,該過程稱為梯度提升技術(shù)。即如果一個(gè)問題有一個(gè)弱預(yù)測模型,那么通過升級(jí)技術(shù)可以得到一個(gè)強(qiáng)預(yù)測模型[16]。
本文主要采用基于Bagging策略的加權(quán)隨機(jī)森林算法[17],其原理為:首先,用Bootstrap采樣法從樣本集中生成n個(gè)訓(xùn)練樣本集,并分別在每一個(gè)訓(xùn)練樣本集中隨機(jī)選擇K個(gè)屬性,其次從這K個(gè)屬性中選擇出最佳的 [k≤K]個(gè)屬性作為分割屬性,以這些選出的分割屬性為節(jié)點(diǎn),創(chuàng)建決策樹(單訓(xùn)練樣本集的結(jié)果如圖1所示),最后由n棵決策樹生成隨機(jī)森林。由于在隨機(jī)森林構(gòu)建的過程中,各決策樹之間沒有相關(guān)關(guān)系,所以對每棵決策樹的葉節(jié)點(diǎn)進(jìn)行加權(quán)處理,再并行處理上述步驟,直至可以形成權(quán)重達(dá)標(biāo)的隨機(jī)森林模型。
3.1 加權(quán)隨機(jī)森林預(yù)測過程
本文將根據(jù)分類能力設(shè)定相應(yīng)決策樹的權(quán)重,通過二次訓(xùn)練構(gòu)造改進(jìn)的加權(quán)隨機(jī)森林模型。其訓(xùn)練流程圖如圖2所示。
加權(quán)隨機(jī)森林的構(gòu)建流程為:首先將訓(xùn)練樣本集引入,并用Bootstrap自助法在這些訓(xùn)練樣本集中有放回隨機(jī)抽取k個(gè)樣本集,組成k棵決策樹,同時(shí),若存在未被抽取的樣本,則用其構(gòu)建單棵決策樹;如果最終形成的決策樹個(gè)數(shù)等于集合數(shù),則對該決策樹進(jìn)行二次訓(xùn)練,否則選擇新的決策樹個(gè)數(shù),再重復(fù)上述步驟直至個(gè)數(shù)達(dá)標(biāo)。二次訓(xùn)練時(shí),首先設(shè)置每個(gè)葉節(jié)點(diǎn)的投票權(quán)重初始值為0.5,隨后將一組完整訓(xùn)練樣本集輸入到每個(gè)決策樹中;當(dāng)樣本到達(dá)葉節(jié)點(diǎn)后,再根據(jù)正確樣本數(shù)與總樣本數(shù)的比值再一次調(diào)整葉節(jié)點(diǎn)權(quán)重;重復(fù)上述步驟直至葉節(jié)點(diǎn)權(quán)重達(dá)標(biāo)。最后由生成的決策樹及其達(dá)標(biāo)權(quán)重構(gòu)成加權(quán)隨機(jī)森林,再運(yùn)用生成的加權(quán)隨機(jī)森林對待分類樣本進(jìn)行分類或預(yù)測。
3.2 結(jié)果分析
本文對于專業(yè)類別、學(xué)歷、戶口性質(zhì)、家庭背景及成績及科研競賽能力五個(gè)學(xué)生自身屬性利用隨機(jī)森林算法進(jìn)行計(jì)算,其中樹的數(shù)量這一參數(shù)設(shè)置為1000,得到特征重要性評(píng)分:專業(yè):0.120961;學(xué)歷:0.345027;家庭背景:0.223205;戶口性質(zhì):0.078136;成績及科研競賽能力:0.226671。其類似決策樹回溯的取值,從葉子收斂到根,根部重要程度高于葉子。
可以看出特征選擇分?jǐn)?shù)從高到低排列為學(xué)歷、成績及科研競賽能力、家庭背景、專業(yè)類別、戶口性質(zhì),將各特征重要性結(jié)果進(jìn)行可視化后得到圖3。
首先對數(shù)據(jù)進(jìn)行預(yù)處理,使得數(shù)據(jù)更加有效的被模型或者評(píng)估器識(shí)別。按照特征重要性進(jìn)行排序,此處選擇前三的特征,并將每個(gè)特征值歸一化;將原始數(shù)據(jù)進(jìn)行線性變換到[0,1]區(qū)間,進(jìn)行標(biāo)準(zhǔn)化處理以加速收斂,并開始對模型進(jìn)行訓(xùn)練。根據(jù)其特征對專業(yè)對口、薪金期望等利用RF算法進(jìn)行預(yù)測。將處理后的576組數(shù)據(jù)劃分訓(xùn)練、實(shí)驗(yàn)、測試集進(jìn)行訓(xùn)練后,得到模型的準(zhǔn)確率為: RandomForest: 0.823, 即輸入個(gè)人特征后, 通過該加權(quán)隨機(jī)森林模型得到的未來就業(yè)屬性具有82.3%的準(zhǔn)確率。
通過上述模型得到結(jié)論: 首先,學(xué)生的學(xué)歷對于未來就業(yè)時(shí)所在單位類型、能否專業(yè)對口、具有良好發(fā)展前景且達(dá)到薪資期望影響最大,具體來說,學(xué)歷越高則越有可能在專業(yè)對口領(lǐng)域就業(yè)于國企或龍頭企業(yè),且具有良好發(fā)展前景容易達(dá)到薪資期望。其次,成績及科研競賽能力和家庭背景的影響較大,良好的成績或優(yōu)秀的科研競賽經(jīng)歷更容易爭取到優(yōu)質(zhì)就業(yè)崗位,而良好的家庭背景在學(xué)生就業(yè)抉擇時(shí)可以給予一定的外部支持和機(jī)遇;然后,專業(yè)對于未來就業(yè)影響所占比重較?。蛔詈?,戶口性質(zhì)影響最小。
隨著后續(xù)數(shù)據(jù)量的增加,預(yù)測的準(zhǔn)確率也將逐步提升。例如,輸入個(gè)人特征:新傳類專業(yè)、碩士學(xué)歷、城市戶口、家庭背景較好、成績及科研競賽能力較強(qiáng),則通過模型訓(xùn)練得到就業(yè)屬性的預(yù)測結(jié)果:未來能夠在專業(yè)對口領(lǐng)域就業(yè)、達(dá)到薪資期望,所在單位更可能是國企或龍頭企業(yè),具有較好發(fā)展前景,其結(jié)果如圖4。
通過實(shí)驗(yàn)分析及結(jié)果可以看出,基于加權(quán)隨機(jī)森林的分析方法完成了對學(xué)生就業(yè)情況的預(yù)測,結(jié)果與現(xiàn)實(shí)情況較為符合,學(xué)生可以根據(jù)自身的屬性得到自己未來最有可能的就業(yè)情況,有針對性地進(jìn)行自我提升。
3.3 加權(quán)隨機(jī)森林模型評(píng)價(jià)
對于分類問題,應(yīng)用隨機(jī)森林不僅可以評(píng)估各個(gè)特征在分類問題上所占權(quán)重,即反應(yīng)各屬性的重要程度,而且數(shù)據(jù)中的異常值或缺失值對隨機(jī)森林的影響并不明顯,具有較好的分類結(jié)果;但當(dāng)訓(xùn)練數(shù)據(jù)噪聲較大時(shí),容易產(chǎn)生過度擬合現(xiàn)象。本論文使用了加權(quán)隨機(jī)森林算法,通過引入二次訓(xùn)練對投票權(quán)重進(jìn)行修正,進(jìn)而使得分類器的分類性能更加高效,具有更高的準(zhǔn)確率。
為直觀展示本文中加權(quán)隨機(jī)森林方法的預(yù)測性能,隨機(jī)森林方法及決策樹方法進(jìn)行對比,采用三種方法的預(yù)測高校學(xué)生就業(yè)屬性的準(zhǔn)確率如圖5。對比結(jié)果有效驗(yàn)證采用加權(quán)隨機(jī)森林方法的結(jié)果相比于另兩種方法與實(shí)際情況更接近,具有更優(yōu)越的預(yù)測性能。
3.4 校友行為大數(shù)據(jù)關(guān)聯(lián)及交互
此外,還可以根據(jù)校友特征進(jìn)行數(shù)據(jù)挖掘,以此實(shí)現(xiàn)更加精準(zhǔn)的推薦和校友關(guān)系網(wǎng)的相關(guān)構(gòu)建;并且采用聚合的方法提取較復(fù)雜校友信息中的主要特征,然后對這些特征進(jìn)行深層次、多屬性的聚合和挖掘,構(gòu)建校友關(guān)系網(wǎng)絡(luò);同時(shí)還可以將相關(guān)企業(yè)的人事招聘信息、產(chǎn)品信息以及優(yōu)秀畢業(yè)校友的相關(guān)活動(dòng)信息及時(shí)地并且精準(zhǔn)地推薦給用戶。未來還可以進(jìn)行針對性的引導(dǎo)、消息推送和跟蹤服務(wù),增強(qiáng)校友之間工作的廣度和深度。
通過初期的需求分析,平臺(tái)選用了微信小程序這一成熟的體系開發(fā),同時(shí)建立相應(yīng)的微信公眾號(hào)來方便平臺(tái)推廣和用戶使用。該平臺(tái)在前端交互頁面設(shè)有條件篩選、質(zhì)量分析、校友互通、趨勢研判這四大核心功能模塊,用戶可以提供學(xué)號(hào)、入學(xué)畢業(yè)年份、姓名等個(gè)人信息完成初始化,以此使用相應(yīng)的信息智能篩選、分析和預(yù)測服務(wù)。其中趨勢研判模塊可以基于用戶的初始化信息來預(yù)測未來的發(fā)展前景、就業(yè)單位是否穩(wěn)定以及能否獲得期望薪資。
與其他類似平臺(tái)相比,本平臺(tái)基于微信小程序、公眾號(hào)這一套成熟的體系開發(fā),既方便積累用戶和快速傳播,又降低了開發(fā)和維護(hù)的成本。與一般就業(yè)平臺(tái)相比,本平臺(tái)基于機(jī)器學(xué)習(xí)對海量校友資源信息進(jìn)行智能分析并訓(xùn)練預(yù)測模型,提高了用戶搜尋信息的效率,還可以讓用戶評(píng)估個(gè)人狀態(tài),預(yù)測未來就業(yè)狀況,幫助用戶明確當(dāng)下的學(xué)習(xí)和發(fā)展的方向,提高未來的就業(yè)成功率。就平臺(tái)發(fā)展性而言,本平臺(tái)會(huì)在用戶允許的前提下收集信息,擴(kuò)充校友資源數(shù)據(jù)庫增強(qiáng)評(píng)估的全面性,并訓(xùn)練相應(yīng)模型提高預(yù)測的準(zhǔn)確率。就平臺(tái)影響而言,本平臺(tái)可以充分調(diào)動(dòng)和利用校友資源為學(xué)生就業(yè)創(chuàng)造機(jī)遇,加強(qiáng)在校生與校友之間的聯(lián)系,提高學(xué)校的知名度和影響力,前景可觀。
4 結(jié)論
現(xiàn)有的大學(xué)生就業(yè)預(yù)測較少有使用隨機(jī)森林算法,且沒有與校友資源聯(lián)系并進(jìn)一步通過平臺(tái)實(shí)現(xiàn)。本文采用加權(quán)隨機(jī)森林模型,提高了算法預(yù)測準(zhǔn)確性,對就業(yè)影響因素進(jìn)行一系列分析,為在校學(xué)生的發(fā)展和畢業(yè)去向提供可靠參考。同時(shí)并搭建小程序平臺(tái),將預(yù)測結(jié)果與校友資源聯(lián)系,提供高效資源,拓寬在校生就業(yè)途徑,促進(jìn)在校生求職方向的明確。
未來將通過小程序平臺(tái)繼續(xù)收集信息,進(jìn)一步擴(kuò)充校友資源數(shù)據(jù)庫,通過增加屬性標(biāo)簽改進(jìn)模型預(yù)測精度,增強(qiáng)評(píng)估的全面性。
參考文獻(xiàn):
[1] 沈華榮,林琰旻.新形勢下構(gòu)建母校與校友發(fā)展共同體促進(jìn)就業(yè)新模式探討——以浙江大學(xué)校友企業(yè)總部經(jīng)濟(jì)園為例[J].科教文匯(下旬刊),2020(4):15-16.
[2] 楊敬超,楊彩霞,楊旻諦,等.大數(shù)據(jù)背景下校友資源智能共享平臺(tái)建設(shè)[J].辦公自動(dòng)化,2020,25(18):62-64.
[3] 封志彬.基于發(fā)揮校友作用拓寬就業(yè)途徑的思考[J].產(chǎn)業(yè)與科技論壇,2022,21(1):212-213.
[4] 鄭蘭,劉翎雁,秦昔蘭.基于Logistic回歸模型的數(shù)學(xué)專業(yè)大學(xué)生擇業(yè)就業(yè)對比分析[J].考試周刊,2016(55):55-56.
[5] 桑海風(fēng),姜鳴地,路鐘喬,等.基于決策樹的大學(xué)生職位晉升影響因素?cái)?shù)據(jù)挖掘算法[J].北華大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,20(6):836-840.
[6] 張光榮.基于決策樹算法和關(guān)聯(lián)規(guī)則分析方法的學(xué)生就業(yè)數(shù)據(jù)分析[D].西安:陜西師范大學(xué),2014.
[7] 李亞東.數(shù)據(jù)挖掘技術(shù)在高職院校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用研究[J].創(chuàng)新創(chuàng)業(yè)理論研究與實(shí)踐,2019,2(17):149-150.
[8] 黃博宇.數(shù)據(jù)挖掘的大學(xué)畢業(yè)生就業(yè)預(yù)測研究[J].微型電腦應(yīng)用,2021,37(11):171-173.
[9] 谷月.基于機(jī)器學(xué)習(xí)算法的高校學(xué)生就業(yè)去向預(yù)測[J].微型電腦應(yīng)用,2022,38(2):172-175.
[10] 李路瑤.基于層次聚類的大學(xué)生就業(yè)去向短期預(yù)測系統(tǒng)[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2022,40(1):64-70.
[11] 宋家琦,邵忠剛.“校友推薦”就業(yè)平臺(tái)的研發(fā)及其前景分析[J].信息通信,2018,31(11):263-264.
[12] 楊敬超,楊彩霞,楊旻諦,等.大數(shù)據(jù)背景下校友資源智能共享平臺(tái)建設(shè)[J].辦公自動(dòng)化,2020,25(18):62-64.
[13] 熊露露,王方士.高職學(xué)生就業(yè)因素分析與就業(yè)預(yù)測模型構(gòu)建[J].現(xiàn)代計(jì)算機(jī),2021,27(33):39-43.
[14] 羅雪梅,韓存鴿,卓杰.關(guān)于高校就業(yè)預(yù)測模型應(yīng)用研究[J].長江信息通信,2021,34(11):102-104.
[15] 徐秀娟,白玉林,徐璐,等.惡劣天氣情況下基于隨機(jī)森林算法的交通流量預(yù)測[J].陜西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,48(2):25-31.
[16] 王宇燕,王杜娟,王延章,等.改進(jìn)隨機(jī)森林的集成分類方法預(yù)測結(jié)直腸癌存活性[J].管理科學(xué),2017,30(1):95-106.
[17] 楊飚,尚秀偉.加權(quán)隨機(jī)森林算法研究[J].微型機(jī)與應(yīng)用,2016,35(3):28-30.
【通聯(lián)編輯:李雅琪】