宋文杰
(青島工學(xué)院, 信息工程學(xué)院, 山東, 青島 266000)
大數(shù)據(jù)對大學(xué)生就業(yè)形勢的分析、政策的制定、就業(yè)效勞與就業(yè)指導(dǎo)、大學(xué)生職業(yè)開展規(guī)劃等方面具有深遠的影響,對促進當(dāng)代大學(xué)生充分就業(yè)具有重要意義。本文依托互聯(lián)網(wǎng)平臺,運用大數(shù)據(jù)技術(shù),構(gòu)建了以大數(shù)據(jù)信息采集為基礎(chǔ)的“互聯(lián)網(wǎng)+求職招聘、互聯(lián)網(wǎng)+就業(yè)分析”系列分析方法,可有效幫助大學(xué)生利用就業(yè)數(shù)據(jù)信息,提升自身就業(yè)籌碼,有助于高校通過聯(lián)動數(shù)據(jù)信息完善就業(yè)效勞體系,助力我國建立大型就業(yè)數(shù)據(jù)庫,精準(zhǔn)制定就業(yè)政策。[1]
網(wǎng)絡(luò)招聘[2]是效果最快而且成本最低的一種招聘渠道。因此,對網(wǎng)絡(luò)招聘信息進行分析研究,了解企業(yè)崗位需求特點 與趨勢,對大學(xué)生求職與就業(yè)指導(dǎo)有著非常重要的意義。利用爬蟲技術(shù)可以很好地進行數(shù)據(jù)分析。這里以BOSS直聘網(wǎng)為實例,對如何使用網(wǎng)絡(luò)爬蟲技術(shù)高效地獲取信息進行深入探討與研究[3]。
首先從招聘網(wǎng)頁面中獲取每一頁的崗位名稱、薪資、學(xué)歷、經(jīng)驗、工作地點、公司、公司類型等基本信息。
本文在爬取BOSS直聘網(wǎng)時,通過循環(huán)的方式爬取不同的頁面。
通過for循環(huán)的方式爬取不同頁面的思路為首先輸入想要爬取的頁數(shù),然后網(wǎng)頁通過requests庫獲取源代碼,對獲取到的網(wǎng)頁源代碼通過lxml庫中的Xpath對每個目標(biāo)字段進行解析,最后將獲取的字段信息存儲至MySQL數(shù)據(jù)庫中[4]。代碼設(shè)計思路如圖1所示。
圖1 獲取BOSS直聘網(wǎng)全國職位的爬取思路
獲取存儲在數(shù)據(jù)庫中的數(shù)據(jù),通過DataFrame()來對獲取到的數(shù)據(jù)進行分析與處理[5]。圖2為獲取數(shù)據(jù)庫中的數(shù)據(jù)及處理數(shù)據(jù)的方法[6]。
圖2 連接數(shù)據(jù)庫及DataFrame數(shù)據(jù)處理方法
設(shè)計好爬取流程后,將對BOSS直聘網(wǎng)中北京、廣州、杭州、上海等熱門城市的所有職位進行信息采集,共獲得60 516條數(shù)據(jù),爬取的部分數(shù)據(jù)如表1所示。
表1 全國熱門城市職位數(shù)據(jù)部分截圖
根據(jù)BOSS直聘網(wǎng)中的熱門城市,畫出其相對應(yīng)所在省的招聘人數(shù)分布圖,如圖3所示。
圖3 全國熱門地區(qū)其所在省/市招聘人數(shù)分布圖
從圖3中可以看出,招聘人數(shù)最多的地方,主要分布在浙江省、北京市。雖然只是對其中的一個城市進行分析,但作為直轄市或省的核心城市,可以很好地對工作崗位招聘人數(shù)進行分析。一個省或直轄市中核心城市的發(fā)展,必然會對直轄市或省帶來高效快速的發(fā)展。
通過詞頻統(tǒng)計的方法對全國熱門地區(qū)排名前50崗位進行分析,如圖4所示。
圖4 全國熱門城市排名前50職位餅圖
從圖4中可以看出,Java、Java開發(fā)工程師、前端開發(fā)工程師、測試開發(fā)工程師是急需的,高校應(yīng)該開設(shè)這方面的課程,以培養(yǎng)企業(yè)與國家所需要的人才。
薪資是當(dāng)代大學(xué)生選擇崗位的首選,圖5是BOSS直聘網(wǎng)-熱門城市排名前15崗位薪資的情況分析。
圖5 全國熱門城市排名前15崗位薪資情況折線圖
從圖5中可以看出,全國熱門城市排名前15崗位薪資在22~50 K/月范圍之間,而且排名前15的大部分是工程師。
學(xué)歷是企業(yè)招聘人才的第一個選擇因素,把握好新時代各企業(yè)招聘的學(xué)歷要求是很有必要的。圖6為全國熱門城市學(xué)歷分析的情況。
圖6 全國熱門城市排名前25學(xué)歷要求漏斗圖
從圖6中可以看出,崗位招聘要求經(jīng)驗與學(xué)歷在3~5年本科的占比最高,在校/應(yīng)屆本科處于中等水平,要想在全國熱門城市中找到一個崗位,門檻是比較高的,高校應(yīng)該在加強當(dāng)代大學(xué)生學(xué)好專業(yè)知識的基礎(chǔ)上多開展一些校企合作,培養(yǎng)當(dāng)代大學(xué)生的實踐能力。
為了清晰地看出當(dāng)前熱門的崗位,圖7為全國熱門城市職位熱詞情況分析。
圖7 全國熱門城市職位熱詞
從圖7中可以看出,工程師崗位在全國熱門城市中的需求占比較大,對于這種崗位需求,建議當(dāng)代大學(xué)生多參加資格證的考試,多做一些實戰(zhàn)的項目,從這些項目中不斷地提升自己,完善自己。
通過對一些企業(yè)招聘大學(xué)生相關(guān)崗位的調(diào)查,發(fā)現(xiàn)了在招聘崗位的過程中,工程師崗位所對應(yīng)的薪資是最高的;而且對調(diào)查中的所有數(shù)據(jù)做一個綜和分析排名,并將排名前6的崗位所對應(yīng)的薪資做了條形圖(見圖8),這樣能夠更加直觀的看出崗位與薪資之間的對應(yīng)關(guān)系。
圖8 實習(xí)生招聘崗位待遇
通過對中國大學(xué)慕課中對工程師崗位的分析,統(tǒng)計了各大學(xué)在2021年開展該崗位相關(guān)的課程,圖8為大學(xué)慕課中高校開展該崗位的相關(guān)課程數(shù)的分析。
從圖9中可以看出,各名牌大學(xué)更加的注重技術(shù)手段方面的研究性人才及培養(yǎng)大學(xué)生的動手實操能力。
圖9 高校及工程師相關(guān)課程開課數(shù)量
大學(xué)生就業(yè)一直是社會關(guān)注的熱點問題。隨著社會的不斷發(fā)展和技術(shù)的迅速進步,大學(xué)生在就業(yè)市場上面臨著新的挑戰(zhàn)和機遇。以下幾點建議希望能夠更好地幫助大學(xué)生就業(yè)。
第一:注重技能的培養(yǎng)。大學(xué)生在就業(yè)市場上需要具備實際的技能和知識。在本文圖中可以看出,工程師等技術(shù)崗位的需求相對較高。因此,高校應(yīng)該加強技術(shù)類課程的開設(shè),為學(xué)生提供必要的技能培訓(xùn)。關(guān)于技能培養(yǎng)應(yīng)該從以下幾個關(guān)鍵要點出發(fā)。
(1) 專業(yè)知識和實踐技能培訓(xùn)。高校應(yīng)該確保他們的課程涵蓋最新的行業(yè)趨勢和技術(shù),以確保學(xué)生獲得實際工作所需的技能和知識。
(2) 實習(xí)和實踐機會。學(xué)生應(yīng)該有機會參與實際項目、實習(xí)和研究,以將理論知識轉(zhuǎn)化為實際經(jīng)驗。這有助于他們更好地適應(yīng)職業(yè)生涯。
(3) 資格證書考試??既∨c自己領(lǐng)域相關(guān)的資格證書可以增加競爭力,因此高校應(yīng)鼓勵學(xué)生參加相關(guān)考試。
(4) 編程思維和解決問題能力。技術(shù)類崗位通常需要學(xué)生具備優(yōu)秀的編程思維和解決問題能力,因此高校可以開展編程競賽和培訓(xùn),幫助學(xué)生培養(yǎng)這些重要技能。
第二:做好職業(yè)導(dǎo)向。除了技能培養(yǎng),大學(xué)生還需要明確的職業(yè)導(dǎo)向,以更好地規(guī)劃他們的職業(yè)生涯。關(guān)于職業(yè)導(dǎo)向應(yīng)該從以下幾個關(guān)鍵要點出發(fā)。
(1) 職業(yè)咨詢和指導(dǎo)。高校可以提供職業(yè)咨詢服務(wù),幫助學(xué)生了解各種職業(yè)選擇,并根據(jù)個人興趣和能力制定職業(yè)規(guī)劃。
(2) 實習(xí)和實踐經(jīng)驗。學(xué)生應(yīng)該有機會參與實際項目和實習(xí),以更好地了解他們感興趣的領(lǐng)域,并確認自己的職業(yè)興趣。
(3) 就業(yè)展會和招聘活動。高??梢远ㄆ诮M織就業(yè)展會和招聘活動,使學(xué)生能夠與潛在雇主建立聯(lián)系并了解不同公司的需求。
(4) 校企合作。與企業(yè)的合作可以為學(xué)生提供實際項目機會,并幫助他們建立職業(yè)網(wǎng)絡(luò)。
第三:注重綜合發(fā)展。綜合發(fā)展是培養(yǎng)當(dāng)代大學(xué)生的重要方面,不僅要培養(yǎng)他們的技術(shù)能力,還要關(guān)注他們的綜合素養(yǎng)。關(guān)于綜合發(fā)展應(yīng)該從以下幾個關(guān)鍵要點出發(fā)。
(1) 綜合素質(zhì)教育。高校應(yīng)該鼓勵學(xué)生參與綜合素質(zhì)教育項目,如文化、體育、志愿服務(wù)等,以培養(yǎng)學(xué)生的全面素養(yǎng)。
(2) 領(lǐng)導(dǎo)力和團隊合作。學(xué)生應(yīng)該有機會參與領(lǐng)導(dǎo)團隊或合作項目,培養(yǎng)領(lǐng)導(dǎo)力和團隊合作能力。
(3) 創(chuàng)新和創(chuàng)業(yè)。高校可以鼓勵學(xué)生參與創(chuàng)新和創(chuàng)業(yè)項目,培養(yǎng)創(chuàng)新精神和創(chuàng)業(yè)技能。
(4) 跨學(xué)科學(xué)習(xí)。學(xué)生可以嘗試跨學(xué)科學(xué)習(xí),了解不同領(lǐng)域的知識和技能,以拓寬視野。
第四:加強政府、高校和企業(yè)的協(xié)作。關(guān)于加強政府、高校和企業(yè)的協(xié)作應(yīng)該從以下幾個關(guān)鍵要點出發(fā)。
(1) 政府政策支持。政府可以通過政策和資金支持高校的職業(yè)發(fā)展和創(chuàng)新項目。
(2) 高校與企業(yè)合作。高校可以積極尋求與企業(yè)的合作機會,為學(xué)生提供實際項目和實習(xí)機會。
(3) 就業(yè)培訓(xùn)。政府和企業(yè)可以提供就業(yè)培訓(xùn)和導(dǎo)向服務(wù),以幫助大學(xué)生更好地準(zhǔn)備職業(yè)生涯。
(4) 就業(yè)數(shù)據(jù)分析。政府和高??梢怨餐M行就業(yè)市場數(shù)據(jù)分析,以了解市場需求和趨勢,為學(xué)生提供有針對性的建議。
總之,大學(xué)生的就業(yè)幫助需要綜合考慮技能培養(yǎng)、職業(yè)導(dǎo)向和綜合發(fā)展,以及政府、高校和企業(yè)的合作。通過這些努力,我們可以更好地為當(dāng)代大學(xué)生提供就業(yè)支持,幫助他們在競爭中找到屬于自己的天地。
本次爬蟲項目以BOSS直聘網(wǎng)的互聯(lián)網(wǎng)模塊的招聘信息為例,進行了基于Python的網(wǎng)站爬取以及對應(yīng)的數(shù)據(jù)分析,對于這個職業(yè)的各地區(qū)分布情況分析和薪資情況進行分析,目的是分析各地數(shù)據(jù),將互聯(lián)網(wǎng)行業(yè)的招聘信息進行可視化展示,為以后大學(xué)生的就業(yè)進行了基礎(chǔ)鋪墊,可以少走應(yīng)聘彎路。
項目主要工作是通過requests庫和lxml庫進行爬取數(shù)據(jù)以及利用Pyecharts庫來進行分析,最終實現(xiàn)可視化的數(shù)據(jù)分析。
在實驗過程中,還有許多不足的地方,比如爬蟲的部分可以通過Scarpy框架來完成,可以更加的專業(yè)化,解析的字段可以增加一些,這樣更加利于后期的數(shù)據(jù)分析,讓數(shù)據(jù)分析的結(jié)果更加有說服力。
在做完整個項目后,不僅對爬蟲的技術(shù)有了更加牢固的掌握,真切感受到數(shù)據(jù)分析的重要性,數(shù)據(jù)分析就是對某一數(shù)據(jù)進行詳細的分析,即用適當(dāng)?shù)慕y(tǒng)計分析方法對所收集來的大量數(shù)據(jù)進行分析,從而提取有用信息,從而形成結(jié)論并對數(shù)據(jù)加以更為詳細的研究和概括總結(jié)。數(shù)據(jù)分析工作在企業(yè)運營的時候還能夠及時的發(fā)現(xiàn)出企業(yè)自身的問題,對于業(yè)務(wù)運營過程中可能會出現(xiàn)的問題作預(yù)警,還能對企業(yè)未來發(fā)展方向的預(yù)測,這都是十分重要的。