亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的信息專業(yè)相關(guān)職位畫像研究

        2019-09-10 23:24:04尹浩翔華昕玥王瑞楠楊彩霞
        電子商務(wù) 2019年2期
        關(guān)鍵詞:文本挖掘數(shù)據(jù)挖掘

        尹浩翔 華昕玥 王瑞楠 楊彩霞

        摘要:從求職者角度看,若能從浩如煙海的網(wǎng)絡(luò)招聘信息中提取出有價(jià)值的、精準(zhǔn)的信息,將對(duì)個(gè)人的專業(yè)知識(shí)構(gòu)建、職業(yè)素養(yǎng)的形成等具有重大的指引作用。本文從職位需求角度出發(fā),以信息管理與信息系統(tǒng)專業(yè)為例,對(duì)前程無憂網(wǎng)相關(guān)數(shù)據(jù)進(jìn)行收集,并利用數(shù)據(jù)挖掘、文本挖掘和數(shù)據(jù)可視化等大數(shù)據(jù)挖掘和分析技術(shù)實(shí)現(xiàn)較為精準(zhǔn)的信息專業(yè)12類職位畫像的構(gòu)建和分析,旨在提供更詳盡清晰的職位需求信息,可以為高校人才培養(yǎng)提供社會(huì)需求信息,也可以為求職者提供更有針對(duì)性的學(xué)習(xí)導(dǎo)向,具有重要的實(shí)際應(yīng)用價(jià)值。

        關(guān)鍵詞:數(shù)據(jù)挖掘;文本挖掘;信息專業(yè);職位畫像;網(wǎng)絡(luò)招聘

        引言

        大數(shù)據(jù)時(shí)代,人們可以透過海量的數(shù)據(jù)信息洞察數(shù)據(jù)背后事物的特點(diǎn)、行為,總結(jié)規(guī)律并能夠預(yù)測(cè)未來,從而指導(dǎo)人們的各項(xiàng)決策。畢業(yè)生在求職中最困擾的因素是,對(duì)崗位要求的專業(yè)知識(shí)和技能掌握不夠、自身定位不明確…。由于傳統(tǒng)招聘方法因其自身的效率低、成本高等弊端,許多企業(yè)逐漸采用網(wǎng)絡(luò)招聘方式[2]。一方面,我們可以從網(wǎng)絡(luò)招聘渠道獲取一些職位的市場(chǎng)需求信息[3];另一方面,多渠道、多信息的環(huán)境下也帶來面對(duì)海量的招聘信息時(shí),求職者往往會(huì)感覺無所適從等新問題[4]。因此,如何能對(duì)現(xiàn)有海量的結(jié)構(gòu)化和非結(jié)構(gòu)化的網(wǎng)絡(luò)崗位招聘信息進(jìn)行有效分析至關(guān)重要[5]。本文以哈爾濱理工大學(xué)信息管理與信息系統(tǒng)專業(yè)(以下簡(jiǎn)稱信息專業(yè))為例,對(duì)該專業(yè)的對(duì)口職位信息進(jìn)行分析以構(gòu)建全面的職位畫像。通過對(duì)相關(guān)崗位清晰、全面地展示和從多角度多維度進(jìn)行分析,幫助在校學(xué)生及求職者更為直觀、全面地了解相關(guān)職位需求信息,把握行業(yè)發(fā)展動(dòng)向,為學(xué)校教學(xué)和學(xué)生進(jìn)行針對(duì)性地學(xué)習(xí)提供科學(xué)的指導(dǎo)。

        1、信息專業(yè)相關(guān)職位畫像設(shè)計(jì)

        1.1 職位畫像設(shè)計(jì)原則

        職位畫像是圍繞海量數(shù)據(jù)進(jìn)行深度挖掘、分析,形成職位信息各種特征信息的全景視圖,進(jìn)而實(shí)現(xiàn)職位畫像的指導(dǎo)性作用,職位畫像的結(jié)果需盡可能的客觀有效,畫像的構(gòu)建過程應(yīng)遵循以下的四種原則:

        (1)基于業(yè)務(wù)模型。畫像的構(gòu)建不是沒有目的性的、盲目的構(gòu)建,而是需要以業(yè)務(wù)需要為指導(dǎo)進(jìn)行針對(duì)性的構(gòu)建。

        (2)全面原則?;跇I(yè)務(wù)模型構(gòu)建職位畫像,維度的選取應(yīng)盡可能多方位的、全面的,不可有所偏重。但也并不代表標(biāo)簽是越多越好的,而是要基于業(yè)務(wù)模型的,選用有價(jià)值的標(biāo)簽去定義職位。

        (3)真實(shí)原則。在數(shù)據(jù)采集過程中,數(shù)據(jù)的收集需要基于前程無憂中真實(shí)存在的職位信息,并且要對(duì)數(shù)據(jù)去空、去重,但不可過度加工。

        (4)時(shí)效性原則。在數(shù)據(jù)采集過程中,要保證采集的數(shù)據(jù)是真實(shí)并且是新發(fā)布的數(shù)據(jù)信息。

        1.2 職位畫像維度設(shè)計(jì)

        職位畫像的字段決定了構(gòu)建畫像過程中的數(shù)據(jù)表現(xiàn)方式,進(jìn)而決定了數(shù)據(jù)挖掘模型的有效性和信息量。本文在進(jìn)行數(shù)據(jù)爬取時(shí)包含字段如表1所示,本文研究除了針對(duì)基礎(chǔ)字段的統(tǒng)計(jì)分析之外,還包括對(duì)維度之間的關(guān)聯(lián)關(guān)系進(jìn)行分析。

        1.3 職位信息的選擇范圍

        首先,根據(jù)我校信息專業(yè)人才培養(yǎng)和人才輸出的去向進(jìn)行分類,大致分為技術(shù)類、管理類和技術(shù)與管理交叉類。其次,在三大門類的基礎(chǔ)上對(duì)于職位進(jìn)行細(xì)分,技術(shù)類分為后端開發(fā)、移動(dòng)開發(fā)、前端開發(fā)、測(cè)試、運(yùn)維、DBA、大數(shù)據(jù)這7種職位方向,管理類分為IT管理、信息系統(tǒng)管理、物流供應(yīng)鏈管理這3種職位方向,技術(shù)和管理交叉類分為電子商務(wù)、ERP這2種職位方向,基于以上的12個(gè)職位關(guān)鍵詞進(jìn)行檢索,設(shè)置搜索范圍為“全國(guó)”及“全職”。

        2、信息專業(yè)相關(guān)職位數(shù)據(jù)獲取

        2.1 數(shù)據(jù)源的選擇

        2018年4月,中國(guó)品牌評(píng)級(jí)權(quán)威機(jī)構(gòu)Chnbrand發(fā)布了2018年第八屆中國(guó)品牌力指數(shù)(C-BPI),前程無憂以716.4分的絕對(duì)優(yōu)勢(shì)榮獲中國(guó)品牌力指數(shù)招聘門戶網(wǎng)站行業(yè)品牌力第一名,綜合性招聘網(wǎng)站的代表性平臺(tái)——前程無憂具有信息海量且品類齊全的特點(diǎn),涵蓋的企業(yè)知名度較高、職位數(shù)目可觀,企業(yè)的資料豐富度高,由此本文選擇對(duì)前程無憂(51Job)相關(guān)數(shù)據(jù)進(jìn)行收集。

        2.2 數(shù)據(jù)抓取過程

        (1)開發(fā)環(huán)境: Windows 10 64bit、Python3.6、Scropyl.5、Visual Studio Code

        (2)開發(fā)過程:首先,創(chuàng)建一個(gè)新的爬蟲工程;其次,在items.py文件中定義要解析具體數(shù)據(jù)的ltem結(jié)構(gòu),在pipelines.py中對(duì)數(shù)據(jù)的存儲(chǔ)功能進(jìn)行實(shí)現(xiàn),并將收集到的數(shù)據(jù)保存在.excel文件中;最后,在51Job.py中通過css選擇器獲取網(wǎng)頁中的所需數(shù)據(jù)。

        2.3 數(shù)據(jù)抓取結(jié)果

        本文以信息專業(yè)為例,對(duì)該專業(yè)的對(duì)口職位信息進(jìn)行分析以構(gòu)建全面的職位畫像。具體爬取的項(xiàng)目及條數(shù)如表2所示。

        3、職位畫像實(shí)現(xiàn)及結(jié)果分析

        3.1 維度之間相關(guān)關(guān)系設(shè)計(jì)

        (1)職位一學(xué)歷要求一經(jīng)驗(yàn)要求一技能。通過分析不同職位信息的學(xué)歷要求和經(jīng)驗(yàn)要求,得到該崗位更看重學(xué)歷、經(jīng)驗(yàn)還是均看重,并得到不同類型崗位對(duì)技能的要求情況。

        (2)職位一城市分布一平均薪資。通過分析不同職位信息的城市分布情況,得到不同職位哪些城市的需求量較大并且薪資分布情況如何。

        (3)公司類型一平均薪資。通過統(tǒng)計(jì)不同類型公司的平均月薪,分析出公司類型和公司規(guī)模對(duì)于平均月薪的影響情況。

        (4)職位類型一平均薪資。通過統(tǒng)計(jì)不同類型職位的平均月薪,分析出職位類型對(duì)于平均月薪的影響情況。

        (5)各類職位的占比分布。統(tǒng)計(jì)出三大類職位的招聘數(shù)目以及三大類下屬的各小類職位的招聘數(shù)目,可從此看出哪類崗位需求量較大。

        (6)行業(yè)類型分布。統(tǒng)計(jì)出信息專業(yè)所有對(duì)口職位的公司行業(yè)類型,分析出主要行業(yè)類型分布。

        (7)公司類型分布。統(tǒng)計(jì)出信息專業(yè)所有對(duì)口職位的公司類型,分析出主要公司類型分布。

        3.2 技術(shù)類職位畫像結(jié)果展示與分析

        (1)職位類型一平均薪水。技術(shù)類職位中細(xì)分為前端開發(fā)、移動(dòng)開發(fā)、后端開發(fā)、測(cè)試、運(yùn)維、DBA和大數(shù)據(jù)7種崗位,將維度字段設(shè)置為職位類別,將數(shù)值字段設(shè)置為平均薪水,分析職位類型與平均薪水之間的相關(guān)關(guān)系。分析結(jié)果如圖1所示,通過雷達(dá)圖展示出職位類型與平均薪水之間的相關(guān)關(guān)系,可以看出DBA方向、大數(shù)據(jù)方向、移動(dòng)開發(fā)方向的平均薪資較高。

        (2)公司類型一平均薪水設(shè)置維度字段為公司類型,數(shù)據(jù)字段為平均薪水。通過餅圖展示出公司類型與平均薪水之間的相關(guān)關(guān)系,由圖2可知事業(yè)單位、國(guó)企、外資(歐美)等公司類型的平均薪水較高。

        (3)學(xué)歷要求分布通過匯總統(tǒng)計(jì)技術(shù)類全部崗位的學(xué)歷要求,再通過柱形圖展示出技術(shù)類崗位對(duì)于學(xué)歷的要求情況,由圖3可知,技術(shù)類崗位更青睞于本科和大專的求職者,且二者分布幾乎不相上下,對(duì)于高學(xué)歷求職者并沒有表現(xiàn)出太多的偏好。

        (4)經(jīng)驗(yàn)要求分布通過匯總統(tǒng)計(jì)技術(shù)類全部崗位的經(jīng)驗(yàn)要求,再通過柱形圖展示出技術(shù)類崗位對(duì)于經(jīng)驗(yàn)的要求情況,由圖4可知,技術(shù)類崗位對(duì)工作經(jīng)驗(yàn)沒有太多要求,對(duì)于具備8-9年以及2年的求職者也表現(xiàn)出了一定偏好。

        (5)技能要求分布本部分研究采用Python中自帶的分詞工具jieba分詞進(jìn)行文本挖掘,以后端開發(fā)、測(cè)試、前端開發(fā)、DBA、運(yùn)維和移動(dòng)開發(fā)相關(guān)職位數(shù)據(jù)作為樣本,提取出職位要求中的技能關(guān)鍵詞,并統(tǒng)計(jì)其權(quán)重,最后通過樹圖進(jìn)行數(shù)據(jù)展示,以后端開發(fā)崗位為例,結(jié)果如圖5所示。

        后端開發(fā)類崗位技能要求排行為:web>javo>jovascript>js>css。

        (6)技術(shù)類職位綜合畫像通過分析技術(shù)類職位類別一平均薪水、公司類型一平均薪水、學(xué)歷要求分布、經(jīng)驗(yàn)要求分布、技能要求分布構(gòu)建出技術(shù)類職位綜合畫像,如圖6所示。 4、結(jié)論

        本文以信息管理與信息系統(tǒng)專業(yè)為例,通過數(shù)據(jù)挖掘技術(shù)將相關(guān)崗位的結(jié)構(gòu)化數(shù)據(jù)信息進(jìn)行收集、預(yù)處理和分析,得到各類職位信息中薪資水平、工作年限要求和崗位數(shù)量等數(shù)據(jù)的波動(dòng)情況,并預(yù)測(cè)短時(shí)間內(nèi)的發(fā)展趨勢(shì)。通過文本挖掘技術(shù)對(duì)眾多相關(guān)崗位非結(jié)構(gòu)化的文本信息進(jìn)行收集、整理并分析,挖掘出相關(guān)職位對(duì)應(yīng)聘者知識(shí)和技能的需求,包括對(duì)基本職業(yè)能力、專業(yè)技能、學(xué)位及學(xué)科背景知識(shí)的要求等,研究結(jié)果將對(duì)個(gè)人的專業(yè)知識(shí)構(gòu)建、職業(yè)素養(yǎng)的形成等具有重要的指引作用。

        參考文獻(xiàn):

        [l]杜華云.電子商務(wù)專業(yè)人才培養(yǎng)定位行業(yè)企業(yè)調(diào)研與分析[J].電子商務(wù),2018,(07):59-62,84.

        [2]劉庸.互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代國(guó)有大型文化企業(yè)招聘轉(zhuǎn)型研究[J].人力資源管理,2018,(03):272-273.

        [3]蔡文杰,李悅,王偉軍,丁潔蘭.信息管理與信息系統(tǒng)專業(yè)本科人才市場(chǎng)需求分析——基于網(wǎng)上招聘的內(nèi)容分析[J].圖書館學(xué)刊,2009,31(08):18-20.

        [4]夏立新,楚林,王忠義,等.基于網(wǎng)絡(luò)文本挖掘的就業(yè)知識(shí)需求關(guān)系構(gòu)建[J].圖書情報(bào)知識(shí),2016,(01):94-100.

        [5] MACELI M. What Technology Skills Do Developers Need?A Text Analysis of Job Listings in Library and InformationScience (LIS) from Jobs.code41ib.org[A]. InformationTechnology&Libraries,September 2015,34(3):8-21.

        猜你喜歡
        文本挖掘數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
        基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        文本數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站個(gè)性化推薦中的應(yīng)用
        商(2016年34期)2016-11-24 16:28:51
        從《遠(yuǎn)程教育》35年載文看遠(yuǎn)程教育研究趨勢(shì)
        慧眼識(shí)璞玉,妙手煉渾金
        文本觀點(diǎn)挖掘和情感分析的研究
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        97人人超碰国产精品最新o| 精品一区二区av天堂色偷偷| 国精品人妻无码一区二区三区性色| 亚洲 暴爽 av人人爽日日碰| 日本高清不在线一区二区色| 国产精品高清免费在线| 狠狠色噜噜狠狠狠狠97首创麻豆| 少妇性饥渴bbbbb搡bbbb| 亚洲aⅴ无码日韩av无码网站| 国内人妖一区二区在线播放| 婷婷久久国产综合精品| 99久久久无码国产精品6| 亚洲AV伊人久久综合密臀性色| 国产三级精品三级在线| 国产午夜激无码av毛片不卡| 夜夜未满十八勿进的爽爽影院| 久久久国产精品福利免费| 国产高清在线精品一区不卡| 日日摸夜夜添夜夜添高潮喷水 | 欧美日韩中文国产一区 | 色噜噜色哟哟一区二区三区| 色天使久久综合网天天| 中文字幕人妻丝袜乱一区三区| 久久精品中文字幕久久| 男女互舔动态视频在线观看| 国产精品毛片一区二区三区| 天天爱天天做天天爽| 亚洲av色香蕉一区二区三区蜜桃| 亚洲综合一区中文字幕| 久久久久久国产精品无码超碰动画| 91爱爱视频| 中文字幕人乱码中文字幕乱码在线| 日韩日韩日韩日韩日韩日韩| 欧美成人形色生活片| 一区二区三区视频在线免费观看| 色偷偷激情日本亚洲一区二区| 午夜精品久久久久久久久久久久| 久99久精品免费视频热77| 国产精品人妻熟女男人的天堂| 少妇人妻大乳在线视频不卡| 亚洲国产精品自产拍久久蜜AV|