亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)視域下網(wǎng)絡(luò)招聘數(shù)據(jù)信息挖掘的研究

        2021-04-26 04:13:12張長(zhǎng)華
        科學(xué)技術(shù)創(chuàng)新 2021年10期
        關(guān)鍵詞:福利待遇分詞公式

        張長(zhǎng)華

        (河北建材職業(yè)技術(shù)學(xué)院,河北 秦皇島066000)

        信息技術(shù)的快速發(fā)展,改變了傳統(tǒng)崗位招聘模式,從線下招聘逐漸向網(wǎng)絡(luò)招聘方向發(fā)展,大部分企業(yè)的招聘信息均借助網(wǎng)絡(luò)平臺(tái)發(fā)布[1]。隨著時(shí)間的推移,網(wǎng)絡(luò)招聘數(shù)據(jù)越來(lái)越多。目前,部分高校通過(guò)對(duì)招聘數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)分析,設(shè)計(jì)人才培養(yǎng)決策方案[2-3]。為了加深對(duì)招聘數(shù)據(jù)信息的剖析,各大高校陸續(xù)引入數(shù)據(jù)挖掘技術(shù)展開探究。本文以數(shù)據(jù)分析類崗位為例,對(duì)該崗位招聘特征信息挖掘進(jìn)行研究。

        1 數(shù)據(jù)獲取

        本研究對(duì)我國(guó)多家招聘網(wǎng)站進(jìn)行調(diào)研,選擇網(wǎng)站在招聘行業(yè)的權(quán)威性、崗位招聘相關(guān)信息數(shù)據(jù)量、數(shù)據(jù)抓取難度等指標(biāo)作為指標(biāo)進(jìn)行綜合對(duì)比,最終確定本次研究數(shù)據(jù)來(lái)源,包括前程無(wú)憂、獵聘網(wǎng)、智聯(lián)招聘、拉勾網(wǎng)。采用數(shù)據(jù)挖掘技術(shù),在這4個(gè)網(wǎng)絡(luò)平臺(tái)中挖掘與崗位招聘特征相關(guān)的信息,如果某條信息符合特征信息標(biāo)準(zhǔn),則立即抓取,并生成信息抓取統(tǒng)計(jì)表[4]。該表中含有崗位所在城市、工作經(jīng)驗(yàn)、全職/兼職、最低學(xué)歷要求、崗位領(lǐng)域、福利待遇、崗位標(biāo)簽、職位描述等關(guān)鍵詞及其相關(guān)信息。

        2 研究方法

        本研究根據(jù)數(shù)據(jù)字段特點(diǎn),對(duì)崗位描述文字進(jìn)行劃分,形成多個(gè)分詞詞集,經(jīng)過(guò)聚類分析和詞頻統(tǒng)計(jì),為TF-IDF 計(jì)算和數(shù)據(jù)可視化處理提供可靠數(shù)據(jù)。如圖1 所示,為崗位招聘特征信息挖掘研究思路。

        圖1 崗位招聘特征信息挖掘研究思路

        3 實(shí)驗(yàn)設(shè)計(jì)

        3.1 數(shù)據(jù)預(yù)處理

        數(shù)據(jù)預(yù)處理是決定了數(shù)據(jù)挖掘結(jié)果精準(zhǔn)度的重要環(huán)節(jié),為了盡可能提高挖掘結(jié)果精準(zhǔn)度,本研究在此環(huán)節(jié)構(gòu)建了詞匯庫(kù),將設(shè)定的信息挖掘關(guān)鍵詞匯添加到這個(gè)詞匯庫(kù)中,從而避免數(shù)據(jù)在預(yù)處理期間分解。以下為數(shù)據(jù)預(yù)處理具體流程:

        第一步,添加自定義停用詞詞典。根據(jù)崗位招聘調(diào)整情況,在詞典中定義已經(jīng)停止招聘的崗位、企業(yè)等相關(guān)信息對(duì)應(yīng)的詞匯,在自定義功能欄中完成。

        第二步,添加自定義詞典。根據(jù)崗位招聘調(diào)整情況,在詞典中定義新增加的崗位名稱、企業(yè)等相關(guān)信息對(duì)應(yīng)的詞匯。

        第三步,分詞去停用詞。根據(jù)崗位招聘調(diào)整情況,去除崗位描述修改詞匯,避免專業(yè)短語(yǔ)在分詞過(guò)程中出現(xiàn)詞匯分解情況。

        第四步,根據(jù)詞性不同,分別標(biāo)注。

        3.2 崗位福利待遇權(quán)重

        本研究在分析崗位描述性關(guān)鍵詞在文本集中的重要程度時(shí),選取TF-IDF 算法作為研究工具,通過(guò)數(shù)據(jù)計(jì)算,得出結(jié)論。其中,TF 計(jì)算數(shù)值為詞頻,一般情況下,對(duì)此部分?jǐn)?shù)據(jù)采取歸一化處理。假設(shè),關(guān)鍵詞為ti,則任一詞匯對(duì)應(yīng)的TF 數(shù)值計(jì)算方法如下:

        公式(1)中,mk,j代表中文經(jīng)過(guò)分詞處理以后出現(xiàn)的頻率總和;mi,j代表關(guān)鍵詞出現(xiàn)的頻率。模型中,IDF 數(shù)值表示反文檔頻率,該項(xiàng)指標(biāo)計(jì)算公式如下:

        公式(2)中,|{j:ti∈di}|代表文件數(shù)目,且文件中含有關(guān)鍵詞;|D|代表文件總數(shù),其中文件來(lái)自文本集。

        利用公式(1)和公式(2)計(jì)算獲取TF 數(shù)值和IDF 數(shù)值以后,計(jì)算崗位招聘關(guān)鍵詞對(duì)應(yīng)的TF-IDF 數(shù)值,計(jì)算方法:兩數(shù)值的乘積。

        采用上述計(jì)算方法完成數(shù)據(jù)預(yù)處理,分別統(tǒng)計(jì)崗位招聘福利待遇字段相關(guān)信息,在詞頻統(tǒng)計(jì)端輸入這部分信息,而后計(jì)算TF-IDF 數(shù)值。按照數(shù)值大小排序,選擇排名前21 名關(guān)鍵詞作為分析指標(biāo)。為了掌握各個(gè)招聘網(wǎng)站崗位招聘特征基本情況,創(chuàng)建4 個(gè)文件,用來(lái)存儲(chǔ)各個(gè)招聘網(wǎng)站信息,形成福利待遇基本信息文件系統(tǒng)。

        3.3 網(wǎng)絡(luò)招聘崗位描述

        本研究對(duì)招聘崗位描述的探究,以相似性原理作為研究基礎(chǔ),綜合對(duì)比多種崗位描述方法,最終選擇K-means 算法,主要原因是該方法的描述結(jié)果比較客觀,支持文本向量化處理。

        K-means 算法在本次研究中的應(yīng)用,主要用于崗位需求詞匯的聚類分析。在應(yīng)用之前,構(gòu)建Word2Vec 模型,量化文本。而后,按照關(guān)鍵詞向量值不同,開啟崗位需求詞匯聚類分析模式。

        依據(jù)相似性原理,選擇各個(gè)關(guān)鍵詞之間的向量間距作為判據(jù),對(duì)相關(guān)詞匯進(jìn)行聚類分析。其中,向量間距的計(jì)算,本研究應(yīng)用歐式距離計(jì)算方法,設(shè)計(jì)以下計(jì)算公式:

        分類中心的定位決定了聚類分析精準(zhǔn)度,為了盡可能精準(zhǔn)定位,本研究增加了迭代處理次數(shù),采用動(dòng)態(tài)迭代方法加以處理。其中,下一次迭代處理建立在上一次迭代聚類計(jì)算結(jié)果基礎(chǔ)上,依據(jù)調(diào)整后的mean 數(shù)值,確定分類中心。關(guān)于類簇中心的計(jì)算公式如下:

        公式(4)中,Ck代表編號(hào)為k 的類簇,該類簇?cái)?shù)據(jù)總和記為|Ck|。

        當(dāng)算法應(yīng)用達(dá)到一定迭代次數(shù)以后,需要停止迭代。目前,應(yīng)用比較多的方法有兩種:一種為設(shè)置固定的迭代次數(shù),在已知迭代處理次數(shù)需求情況下應(yīng)用,不適合應(yīng)用至本研究。另外一種迭代方法集準(zhǔn)則函數(shù)、誤差平方為一體,通過(guò)構(gòu)建以下函數(shù)模型:

        公式(5)中,K 代表類簇?cái)?shù)量。利用此公式計(jì)算聚類數(shù)值時(shí),向設(shè)定參數(shù)σ,對(duì)比數(shù)值σ 與數(shù)值ΔJ 數(shù)值大小,如果ΔJ<σ,那么當(dāng)前公式(5)計(jì)算結(jié)果為最終聚類計(jì)算結(jié)果。依據(jù)此計(jì)算數(shù)值,準(zhǔn)確劃分崗位描述詞匯的類別。

        4 實(shí)驗(yàn)結(jié)果分析

        4.1 崗位福利待遇統(tǒng)計(jì)

        關(guān)于崗位福利待遇信息的挖掘,采用TF-IDF 統(tǒng)計(jì)法挖掘數(shù)據(jù)并計(jì)算,從而掌握崗位福利待遇在權(quán)重分布情況。本次研究選取21 個(gè)關(guān)鍵詞作為信息挖掘指標(biāo),利用公式計(jì)算TF-IDF數(shù)值,結(jié)果如表1 所示。

        表1 福利待遇權(quán)重統(tǒng)計(jì)表

        4.2 崗位聚類分析

        本次應(yīng)用測(cè)試,在操作界面上自定義詞典,分詞去除停用詞,對(duì)“數(shù)據(jù)分析崗位”詞頻進(jìn)行統(tǒng)計(jì),選擇頻率出現(xiàn)比較高的關(guān)鍵詞作為分析指標(biāo),輸入K-means 算法中,有效劃分崗位需求類型。其中,類別數(shù)量設(shè)定為5 類,同時(shí)在數(shù)據(jù)挖掘界面展示高頻排名前15 關(guān)鍵詞。如圖2 所示為聚類分析結(jié)果。

        圖2 中,第一類聚類分析結(jié)果涵蓋了崗位業(yè)務(wù)能力,以產(chǎn)品運(yùn)營(yíng)能力為首,對(duì)分析報(bào)告、需求分析提出了一定要求。第二類聚類分析結(jié)果以學(xué)歷、專業(yè)、專業(yè)課程為主。第三類分析結(jié)果以崗位技能掌握情況作為招聘核心。第四類和第五類分析結(jié)果分別統(tǒng)計(jì)了個(gè)人能力、招聘企業(yè)信息。

        5 結(jié)論

        大數(shù)據(jù)時(shí)代的到來(lái),為招聘數(shù)據(jù)信息統(tǒng)計(jì)提供了有利工具,利用數(shù)據(jù)信息挖掘軟件,開發(fā)招聘數(shù)據(jù)信息統(tǒng)計(jì)方案,使得數(shù)據(jù)信息得以最大化利用,幫助各大高校明確當(dāng)前市場(chǎng)招聘情況。本文以“數(shù)據(jù)分析崗位”招聘信息為例,提出招聘信息統(tǒng)計(jì)研究。統(tǒng)計(jì)結(jié)果表明,此類崗位對(duì)從業(yè)經(jīng)驗(yàn)1 年至3 年的人才需求量較大,福利待遇方面,當(dāng)前公司給予的條件與人才需求基本相符,對(duì)求職者的業(yè)務(wù)能力、個(gè)人綜合素質(zhì)、崗位技能等要求較高。

        猜你喜歡
        福利待遇分詞公式
        組合數(shù)與組合數(shù)公式
        排列數(shù)與排列數(shù)公式
        等差數(shù)列前2n-1及2n項(xiàng)和公式與應(yīng)用
        結(jié)巴分詞在詞云中的應(yīng)用
        例說(shuō):二倍角公式的巧用
        人口老齡化問(wèn)題的分析及研究對(duì)策
        黨組織的溫暖更多了
        人民論壇(2017年5期)2017-03-07 20:35:52
        值得重視的分詞的特殊用法
        珠三角外來(lái)務(wù)工人員教育程度對(duì)法律意識(shí)(自我維權(quán))、家庭收入影響分析
        商(2016年6期)2016-04-20 09:50:18
        企業(yè)人力資源管理中福利項(xiàng)目需求預(yù)測(cè)機(jī)制研究
        小鲜肉自慰网站| 久久久精品国产亚洲av网麻豆 | 午夜精品一区二区三区无码不卡| 丰满少妇一区二区三区专区| 一区二区在线视频免费蜜桃| 国精品人妻无码一区免费视频电影| 伴郎粗大的内捧猛烈进出视频观看| 囯产精品无码一区二区三区AV | 免费无遮挡禁18污污网站| 午夜片无码区在线| 日韩精品一区二区三区在线观看的 | 成年女人a毛片免费视频| 亚洲av无码成人精品区天堂 | 久久免费网站91色网站| 给我看免费播放的视频在线观看| 99精品国产丝袜在线拍国语| 狠狠人妻久久久久久综合| 久久久9色精品国产一区二区三区| 中文字幕乱码亚洲在线| 四虎影视成人永久免费观看视频 | 免费a级作爱片免费观看美国| 久久国产偷| 国产成人精品一区二区日出白浆| 日韩精品人妻中文字幕有码在线| 成年无码av片在线| Y111111国产精品久久久| 蜜桃视频成年人在线观看| 80s国产成年女人毛片| 日本又黄又爽gif动态图| 色婷婷狠狠97成为人免费| 国产性色av一区二区| 欧美xxxx做受欧美| 国产91中文| 丝袜美腿av免费在线观看| 亚洲成在人线视av| 成av人片一区二区三区久久| 国产精品亚洲综合天堂夜夜| 风流熟女一区二区三区| 一本色道久久88精品综合 | 97中文字幕在线观看| 美女被强吻并脱下胸罩内裤视频 |