毛朝選 何甜
摘 要 為了更好地了解統(tǒng)計學(xué)人才缺口,本文從目前市面上常用招聘網(wǎng)站爬取招聘數(shù)據(jù),利用Python分析統(tǒng)計學(xué)相關(guān)就業(yè)崗位信息,通過對市場上統(tǒng)計學(xué)相關(guān)就業(yè)崗位的要求、需求人數(shù)及工資水平等方面進(jìn)行研究,發(fā)現(xiàn):第一,用人單位對統(tǒng)計學(xué)專業(yè)的學(xué)生要求主要集中于數(shù)據(jù)分析與處理上,就業(yè)崗位主要是分析員或者分析師、統(tǒng)計以及工程師。第二,由于統(tǒng)計學(xué)人才嚴(yán)重短缺,企業(yè)不斷降低工作經(jīng)驗門檻。第三,統(tǒng)計學(xué)相關(guān)職位的工資大約在5000至15000之間,但具有較大的上升空間。
關(guān)鍵詞 網(wǎng)絡(luò)爬蟲 數(shù)據(jù)分析 可視化
一、研究背景
2015年國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》后,從事數(shù)據(jù)分析的高級專門人才成為稀缺資源。
為了更好地了解統(tǒng)計學(xué)人才缺口,本文從目前市面上常用招聘網(wǎng)站爬取招聘數(shù)據(jù),利用Python分析統(tǒng)計學(xué)相關(guān)就業(yè)崗位信息,期望找到統(tǒng)計學(xué)專業(yè)背后火爆的原因以及就業(yè)市場對統(tǒng)計學(xué)人才的實際能力要求,為學(xué)校培養(yǎng)統(tǒng)計學(xué)人才提供借鑒。
二、研究意義
通過對市場上統(tǒng)計學(xué)相關(guān)就業(yè)崗位的要求、需求人數(shù)及工資水平的研究,可以在一定程度上了解當(dāng)今市場對統(tǒng)計學(xué)專業(yè)學(xué)生的需求缺口和實際能力需求。對于高校統(tǒng)計學(xué)專業(yè)的教育者而言,可以更具有針對性地開設(shè)課程,相關(guān)專業(yè)的學(xué)生可以了解目標(biāo)職位要求,從而提升自己,以更加切合市場需要。
三、數(shù)據(jù)說明
經(jīng)過查找“統(tǒng)計”“專業(yè)”的關(guān)鍵詞,并剔除主要不相關(guān)崗位,最后得到997條要求招收統(tǒng)計學(xué)專業(yè)人才的崗位信息,具體描述如表1所示:
本文首先對experience,job_des,people_num和salary進(jìn)行數(shù)據(jù)清洗。
第一,對于工作經(jīng)驗experience,提取文本中的數(shù)字并取最小值,得到最低工作經(jīng)驗min_exp,對于“不限”“無經(jīng)驗要求”等數(shù)據(jù)填充為0。第二,對于需求人數(shù)people_num,提取數(shù)字,對于“若干人”等數(shù)據(jù)對其填充缺失值,得到demand_num。第三,對于工資salary,提取最高工資和最低工資并分為兩列min_salary和max_salary,數(shù)據(jù)以“千”為單位。
四、數(shù)據(jù)分析
(一)職位描述
通過對職位描述的分詞和詞頻統(tǒng)計得到詞云圖(圖1)。
從圖1中可以看出,主要用人單位對統(tǒng)計學(xué)專業(yè)的學(xué)生要求主要集中于數(shù)據(jù)分析與處理上,并希望求職者具有一定的工作經(jīng)驗,能迅速熟悉業(yè)務(wù),具有團隊精神和抗壓意識,并善于溝通和組織。
通過對職位名稱的分詞和詞頻統(tǒng)計得到詞云圖(圖2)。
從圖2中可以看出,用人單位對統(tǒng)計學(xué)專業(yè)學(xué)生的崗位要求主要是做各種分析員或者分析師、統(tǒng)計以及工程師,具體包括數(shù)據(jù)處理、數(shù)據(jù)分析、量化、開發(fā)、算法、建模等方向。整體來講,統(tǒng)計學(xué)專業(yè)的學(xué)生就業(yè)崗位與專業(yè)鍥合度很高,屬于有一定技術(shù)含量和門檻的崗位。
(二)工作經(jīng)驗
首先對不同最低工作經(jīng)驗要求進(jìn)行匯總統(tǒng)計,得到工作經(jīng)驗要求的不同公司數(shù)量。發(fā)現(xiàn)大部分公司主要招收無工作經(jīng)驗或有3年內(nèi)工作經(jīng)驗的求職者,部分原因是統(tǒng)計學(xué)人才嚴(yán)重短缺,迫使企業(yè)不斷降低工作經(jīng)驗門檻,甚至不惜從零培養(yǎng)人才。
其次,對于不同工作經(jīng)驗要求的公司需求人數(shù)進(jìn)行匯總,得到不同工作經(jīng)驗要求的總需求人數(shù),發(fā)現(xiàn)相關(guān)公司對無經(jīng)驗求職者的需求最大。
最后,查看工作經(jīng)驗和工資的關(guān)系,發(fā)現(xiàn)無工作經(jīng)驗的崗位平均工資在6000至9000之間,隨著工作經(jīng)驗的增加,平均工資也在逐步上升,其中最低工資在20000元/月趨于平穩(wěn),最高工資則有較大的增長空間。
(三)需求人數(shù)
招聘10人的公司數(shù)量最多,達(dá)到307家,其次是招聘1人的公司,有296家。大部分公司的需求數(shù)量均在5人以下。
發(fā)現(xiàn)一般而言,需求人數(shù)越多的公司,平均工資相對較低,而需求人數(shù)較少的公司,平均工資相對較高。可以猜測這是因為初創(chuàng)公司有較大的人才需求量,但自身資金有限,平均工資較低。而穩(wěn)定成熟的公司需求較少,工資也相對較高。
(四)崗位工資
首先查看最低工資和最高工資的分布直方圖(圖3)。
去除部分異常值后的箱形圖如圖3,整體工資水平在5000到15000元之間。
接下來分析相關(guān)軟件技能對工資的影響。本文選取了14個主要軟件技能:Excel,Stata,Matlab,Spark,EViews,SPSS,R,Java,Scala,SAS,Python,SQL,Hadoop和C。對職位描述job_des中提及上述軟件的次數(shù)進(jìn)行詞頻統(tǒng)計,發(fā)現(xiàn)Python,SQL及Excel是最多被提及的軟件技能。
接下來查看對各軟件有要求的職位的平均工資,如圖4。
發(fā)現(xiàn)掌握Spark,Hadoop和Scala的職位平均工資最高,且增長空間非常大。其次是Java,Python等和計算機相關(guān)的編程語言,Excel的平均工資最低。
五、總結(jié)建議
經(jīng)過上文的分析研究,發(fā)現(xiàn)市場對相關(guān)專業(yè)的求職者相對友好,大部分都接受無工作經(jīng)驗的申請,同時可以看到工作經(jīng)驗與工資有較明顯的正相關(guān)關(guān)系。一般而言,成熟穩(wěn)定的公司對統(tǒng)計學(xué)相關(guān)專業(yè)的職位需求較小,但給出的工資較高。部分公司對統(tǒng)計學(xué)相關(guān)崗位的需求較大,但工資較低。就工資整體情況而言,統(tǒng)計學(xué)相關(guān)職位的工資大約在5000至15000之間,并且具有較大的上升空間。對相關(guān)軟件技能的分析顯示,掌握一門或多門軟件技術(shù)對工資具有較明顯的提升作用。綜合上述分析,給出如下建議:第一,高校統(tǒng)計專業(yè)的教育者可更多開設(shè)軟件操作等實操性課程,提升學(xué)生的實際數(shù)據(jù)處理能力。第二,學(xué)習(xí)中可更多以小組形式來完成項目,增強和提升學(xué)生的團隊意識和溝通能力。第三,為學(xué)生提供更多實習(xí)機會,豐富工作經(jīng)歷。第四,學(xué)生應(yīng)主動學(xué)習(xí)計算機相關(guān)知識,鍛煉編程能力,提升自身水平。
(作者單位為上海立信會計金融學(xué)院)
參考文獻(xiàn)
[1] 董曉萌.基于多元線性回歸的統(tǒng)計學(xué)專業(yè)滿意度影響因素分析[J].價值工程,2019,38(36):276-277.
[2] 潘雪萍,陳麗蓮.福州市“四區(qū)疊加”視域下經(jīng)濟統(tǒng)計學(xué)人才需求研究[J].科技經(jīng)濟市場,2018(04):150-152.
[3] 朱莎莎.淺析經(jīng)濟統(tǒng)計學(xué)發(fā)展前景和就業(yè)分析[J].經(jīng)貿(mào)實踐,2017(20):55.
[4] 南江霞.一級學(xué)科背景下統(tǒng)計專業(yè)建設(shè)的探討與實踐[J].數(shù)學(xué)學(xué)習(xí)與研究,2015(03):5+7.