秦玥 朱繼威 董哲清
摘? 要:國家教育事業(yè)發(fā)展迅猛,畢業(yè)生人數(shù)連年攀升。尤其是受疫情影響,就業(yè)形勢嚴(yán)峻,給畢業(yè)生帶來了巨大的挑戰(zhàn)。因此,了解企業(yè)招聘要求,實時獲取招聘信息十分關(guān)鍵。本文采用hadoop集群作為數(shù)據(jù)清洗的環(huán)境搭建大數(shù)據(jù)平臺,Tomcat服務(wù)器,Vue作為前端框架設(shè)計了一套基于互聯(lián)網(wǎng)大數(shù)據(jù)的招聘數(shù)據(jù)智能分析平臺,對主流企業(yè)的招聘信息進(jìn)行分析和整理,并利用可視化技術(shù)展示幫助畢業(yè)生們能夠了解互聯(lián)網(wǎng)行業(yè)的趨勢和要求,提供適合的崗位。
關(guān)鍵詞:招聘;大數(shù)據(jù);智能分析;可視化
引言
據(jù)教育部統(tǒng)計,2020屆高校畢業(yè)人數(shù)高達(dá)874萬人,再創(chuàng)歷史新高[1,2]。尤其是受到新冠肺炎,經(jīng)濟(jì)下滑等多種因素的影響,就業(yè)形勢十分嚴(yán)峻,畢業(yè)生們面臨著巨大的就業(yè)壓力。值得注意的是,在《2020應(yīng)屆生畢業(yè)生春招求職報告》,中我們了解到,在各行業(yè)新增的應(yīng)屆畢業(yè)生人數(shù)來看,互聯(lián)網(wǎng)行業(yè)應(yīng)屆生占比最高,無疑加大了互聯(lián)網(wǎng)行業(yè)人才市場的競爭,解決高校畢業(yè)生就業(yè)成為了一個熱點問題。
隨著網(wǎng)絡(luò)時代的到來,每天都有海量的信息鋪天蓋地而來。一方面為人們提供了大量選擇的機(jī)會,但另一方面,信息的冗余也增大了人們篩選的難度[3]。傳統(tǒng)招聘的數(shù)據(jù)采集和分析光靠人工收集并采用普通的方式進(jìn)行分析十分的浪費人力和物力,效率不高,用戶體驗效果不好。
針對上述問題,本文設(shè)計了一套基于互聯(lián)網(wǎng)大數(shù)據(jù)而招聘數(shù)據(jù)智能分析平臺,運(yùn)用大數(shù)據(jù)技術(shù),對當(dāng)前主流企業(yè)的招聘信息進(jìn)行分析和整理,提煉出畢業(yè)生最關(guān)心最感興趣的部分,并利用可視化技術(shù)將這些內(nèi)容以一種簡潔清晰的方式展現(xiàn)出來。在此平臺,畢業(yè)生們能夠了解到當(dāng)前互聯(lián)網(wǎng)各行業(yè)的趨勢以及當(dāng)前企業(yè)對畢業(yè)生的期望和要求;同時還能根據(jù)自身的條件,獲取到適合自己的崗位信息。
1系統(tǒng)設(shè)計框架
本系統(tǒng)主要采用hadoop集群搭建大數(shù)據(jù)平臺,并將事先采集到的數(shù)據(jù)加載到Mapreduce中清洗,再載入至hive數(shù)據(jù)表中,對其進(jìn)行統(tǒng)計和分析,并將結(jié)果通過hive表保存至hbase中。再通過tomcat服務(wù)器訪問獲取hbase中的數(shù)據(jù)打包成json格式,通過前端頁面展示出來,具體設(shè)計框架如圖1所示:
2具體實現(xiàn)方案
2.1 數(shù)據(jù)分析
在hadoop大數(shù)據(jù)集群環(huán)境搭建完畢后,進(jìn)入數(shù)據(jù)處理的階段。首先將csv數(shù)據(jù)文件裝載到hdfs文件系統(tǒng)中并編寫相應(yīng)的MapReduce進(jìn)行數(shù)據(jù)的初步清洗。將初步的清洗結(jié)果通過hdfs文件系統(tǒng)載入至hive表格當(dāng)中進(jìn)行數(shù)據(jù)的統(tǒng)計與分析。并將統(tǒng)計結(jié)果存入hive表。
2.2 數(shù)據(jù)展示
在處理好數(shù)據(jù)后,創(chuàng)建web項目。通過啟動tomcat服務(wù)器訪問hbase獲取hive統(tǒng)計好的數(shù)據(jù),并打包成json格式,方便前端實時訪問數(shù)據(jù)。當(dāng)前端獲取到數(shù)據(jù)后,對其進(jìn)行解析利用echarts可視化工具進(jìn)行展示。在前端頁面展示中主要通過“工作薪資”,“地區(qū)”,“招聘所學(xué)技能點”,“招聘影響因素”等方面進(jìn)行展示。
2.3 職位推薦
根據(jù)用戶對相關(guān)知識技能的專業(yè)程度對用戶進(jìn)行畫像,再根據(jù)職位對用戶的相關(guān)知識技能的專業(yè)程度要求對職位進(jìn)行畫像。在前面的大數(shù)據(jù)分析過程中,已經(jīng)分析出了各職位標(biāo)簽分類的技術(shù)熱詞以及數(shù)量,利用大數(shù)據(jù)分析結(jié)果,對每個專業(yè)領(lǐng)域的技能要求進(jìn)行重要程度的分析,再根據(jù)不同職位所屬大類對各種不同知識技能的重要程度的分析,利用層次分析法計算在用戶和職位中不同知識技能所占的比重,利用這個比重衡量用戶畫像和職位畫像的和適度,和適度前幾位的職位信息將被推薦給用戶。
3系統(tǒng)測試
本文主要是針對算法和主要功能點進(jìn)行測試,通過設(shè)計測試用例判斷程序的邏輯、功能是正確實現(xiàn)。測試結(jié)果與分析如表1所示:
4總結(jié)展望
本系統(tǒng)充分利用了大數(shù)據(jù)技術(shù)解決了傳統(tǒng)數(shù)據(jù)采集和分析所帶來的不便,通過前端可視化的展示讓用戶直觀了解招聘信息,為畢業(yè)生提供了一定的就業(yè)幫助。但是仍有不足的地方需要改進(jìn),在之后的工作中,我們將采集更多的招聘信息,優(yōu)化推薦算法,為高校畢業(yè)生提供更精確的推薦服務(wù)。
參考文獻(xiàn)
[1]楊紫,劉凱,王樂樂.后疫情時代高校畢業(yè)生就業(yè)意愿的變化分析及對策研究[J].中國商論,2021(08):187-189.
[2]黃宇飛.大學(xué)生就業(yè)現(xiàn)狀及對策研究[J].青年與社會,2020(17):130-131.
[3]馬曉超.“互聯(lián)網(wǎng)+”時代高校人才招聘新思考[J].科技經(jīng)濟(jì)導(dǎo)刊,2020,28(24):163-164.