禤 鮮
(柳州城市職業(yè)學(xué)院,廣西 柳州 545036)
大數(shù)據(jù)在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通信等行業(yè)早有運(yùn)用。近年來,大數(shù)據(jù)技術(shù)廣泛滲透于人們生活的方方面面。大數(shù)據(jù)技術(shù)通過對海量數(shù)據(jù)的挖掘、獲取、篩選、分析,能夠更精準(zhǔn)地進(jìn)行決策。目前,我國的大數(shù)據(jù)技術(shù)走在國際前沿,成為全球大數(shù)據(jù)應(yīng)用的先鋒。大數(shù)據(jù)技術(shù)作為決策參考已逐漸應(yīng)用到商業(yè)運(yùn)行中,全國各大招聘網(wǎng)站在自己內(nèi)部實(shí)現(xiàn)了大數(shù)據(jù)決策,但大多是以企業(yè)視角、基于數(shù)據(jù)統(tǒng)計(jì)的方法分析人才資源,例如分析求職者的數(shù)量、求職意向、薪資意向、工作技能等,使用大數(shù)據(jù)技術(shù)分析后得出求職者“畫像”,方便用人單位做人力資源規(guī)劃。但從地區(qū)人力資源儲(chǔ)備與規(guī)劃視角、高校人才培養(yǎng)視角、求職者精準(zhǔn)求職視角去分析人力資源信息的做法相對較少,面對各類人才資源網(wǎng)站的數(shù)據(jù),政府決策層無法從此類招聘網(wǎng)站中獲得崗位需求分析、崗位技能分析等可以進(jìn)行人力資源投資規(guī)劃和人才培養(yǎng)決策的數(shù)據(jù)分析結(jié)果,求職者也無法從求職招聘網(wǎng)站獲得相關(guān)信息,造成巨大的資源浪費(fèi)。大數(shù)據(jù)技術(shù)在異構(gòu)數(shù)據(jù)庫的基礎(chǔ)上,使用聯(lián)機(jī)分析處理(OLAP)的多維分析方法,分析數(shù)據(jù)倉庫中的相關(guān)數(shù)據(jù),能夠獲得相關(guān)信息,以輔助決策。
目前,招聘網(wǎng)站都是營利性網(wǎng)站,大多數(shù)是為企業(yè)和求職者服務(wù)的。大數(shù)據(jù)時(shí)代下,企業(yè)依托大數(shù)據(jù)技術(shù),人力資源管理部門可以對企業(yè)崗位設(shè)置有清晰全面的定位,以及整理出企業(yè)發(fā)展所需要的崗位信息和人員數(shù)目、崗位所具備的能力,以簡化招聘流程。大數(shù)據(jù)技術(shù)在近兩年開始應(yīng)用到招聘系統(tǒng)中,其建立起的生態(tài)模型主要是作為一個(gè)交流的平臺,為求職和招聘服務(wù)。但即便是應(yīng)用了大數(shù)據(jù)技術(shù),也大多僅涉及數(shù)據(jù)統(tǒng)計(jì)技術(shù),用于“用戶畫像”、人才需求多元分析等為企業(yè)服務(wù)的業(yè)務(wù)、網(wǎng)站系統(tǒng)生態(tài)數(shù)據(jù)信息的收集、分析也限于企業(yè)招聘。而對政府或企業(yè)決策層所需的一些人才趨勢報(bào)告、人才流動(dòng)報(bào)告、行業(yè)崗位人才需求分析、專業(yè)領(lǐng)域薪酬分析等分析結(jié)果,仍然依靠“領(lǐng)英”“麥可思”等專業(yè)的調(diào)研公司單獨(dú)調(diào)研,沒有形成規(guī)模以上的招聘網(wǎng)站信息收集、大數(shù)據(jù)分析一體化智能系統(tǒng),使用聯(lián)機(jī)分析處理(OLAP)技術(shù)對崗位進(jìn)行分析并輔助上層機(jī)構(gòu)對人力資源進(jìn)行決策的軟件也并不多見。
輔助決策系統(tǒng)可以由政府人力資源部門主導(dǎo),也可以是高校管理部門,比如教育廳招標(biāo)投標(biāo)系統(tǒng)建設(shè)。系統(tǒng)建成后,組織單位企業(yè)在上面發(fā)布招聘信息,求職者在互聯(lián)網(wǎng)上注冊使用,企業(yè)填寫招聘信息時(shí),可以獲得企業(yè)崗位需求數(shù)據(jù),求職者填寫求職信息時(shí),可獲得求職者信息,通過對供需雙方的大數(shù)據(jù)分析,可以獲得某時(shí)、某區(qū)域內(nèi)某行業(yè)領(lǐng)域的供需關(guān)系,或者某區(qū)域、某崗位技能要求,政府在人力資源政策制定、高校建設(shè)、行業(yè)資源投入時(shí)參考分析結(jié)果,能得到較為準(zhǔn)確的行業(yè)人力資源供需信息。高校在專業(yè)建設(shè)時(shí),參考區(qū)域崗位供求關(guān)系、崗位技能要求占比等可影響人才培養(yǎng)方案制訂,快速準(zhǔn)確地獲得課程內(nèi)容、教學(xué)要求。綜上所述,研究招聘網(wǎng)站中的聯(lián)機(jī)分析處理技術(shù)(OLAP)和大數(shù)據(jù)技術(shù)有積極作用。
隨著大數(shù)據(jù)技術(shù)的發(fā)展,大數(shù)據(jù)逐漸成為人們獲取對事物和問題更深層次認(rèn)知的決策資源,特別是人工智能技術(shù)與大數(shù)據(jù)的深度融合,為復(fù)雜決策的建模和分析提供了強(qiáng)有力的工具。利用大數(shù)據(jù)分析能夠總結(jié)經(jīng)驗(yàn)、發(fā)現(xiàn)規(guī)律、預(yù)測趨勢,這些都可以為輔助決策服務(wù)。掌握的數(shù)據(jù)信息越多,決策才能更加科學(xué)、精確、合理。在人力資源儲(chǔ)備、管理上,同樣可以通過崗位大數(shù)據(jù)的多維分析,提升管理、決策水平,提升社會(huì)效益、經(jīng)濟(jì)效益。
目前覆蓋面甚廣的招聘網(wǎng)站不能僅僅是一個(gè)用人單位與人才的交流平臺,而應(yīng)當(dāng)成為人力資源信息大數(shù)據(jù)分析的數(shù)據(jù)來源,以原生招聘網(wǎng)站為主,結(jié)合網(wǎng)絡(luò)招聘網(wǎng)站進(jìn)行數(shù)據(jù)抓捕收集,通過聯(lián)機(jī)分析技術(shù)和大數(shù)據(jù)技術(shù)對信息進(jìn)行分析和處理,獲得人力資源投資規(guī)劃分析數(shù)據(jù),輔助政府或高校進(jìn)行決策。因此,在對招聘網(wǎng)站做系統(tǒng)設(shè)計(jì)時(shí),不能僅僅考慮用人單位和應(yīng)聘個(gè)人的信息需求,而應(yīng)當(dāng)以大數(shù)據(jù)分析的角度,設(shè)計(jì)招聘系統(tǒng)及數(shù)據(jù)倉庫,獲取有助于數(shù)據(jù)分析的數(shù)據(jù),以人力資源市場決策者的視角進(jìn)一步分析、盤活數(shù)據(jù),并將分析結(jié)果可視化,根據(jù)分析結(jié)果,獲得人力資源管理、規(guī)劃、培養(yǎng)的決策參考意見。同時(shí),招聘網(wǎng)站與崗位信息數(shù)據(jù)分析相輔相成,構(gòu)建可持續(xù)的生態(tài)系統(tǒng)有利于整合盤活招聘網(wǎng)站數(shù)據(jù),充分利用數(shù)據(jù)分析結(jié)果指導(dǎo)人才培養(yǎng)規(guī)劃、定制。
崗位信息多維分析輔助決策系統(tǒng)是集招聘功能與崗位信息大數(shù)據(jù)分析功能為一體的平臺。系統(tǒng)不僅提供給企業(yè)和個(gè)人招聘和應(yīng)招的功能,招聘信息還會(huì)成為崗位信息大數(shù)據(jù)分析的數(shù)據(jù)來源,對招聘網(wǎng)站進(jìn)行數(shù)據(jù)抓捕收集,對數(shù)據(jù)進(jìn)行分析和處理,獲得人力資源投資規(guī)劃分析信息,輔助政府或高校進(jìn)行決策。因此,在做系統(tǒng)功能設(shè)計(jì)時(shí),以大數(shù)據(jù)分析的角度設(shè)計(jì)招聘系統(tǒng),除分析求職者的數(shù)量、求職意向、薪資意向、工作技能外,還可以進(jìn)一步分析年齡與薪資關(guān)系、工作熟練度與薪資關(guān)系、地域與崗位供求關(guān)系,同一領(lǐng)域不同崗位內(nèi)各技能點(diǎn)重合情況、各技能點(diǎn)熟練度、需求分布及職業(yè)教育人才培養(yǎng)與市場供需關(guān)系等,以多維視角對崗位數(shù)據(jù)進(jìn)行分析。以人力資源市場決策者的立場進(jìn)一步分析、盤活數(shù)據(jù),并將分析結(jié)果可視化,根據(jù)分析結(jié)果,獲得人力資源管理、規(guī)劃、培養(yǎng)的決策參考意見。同時(shí),招聘網(wǎng)站與崗位信息數(shù)據(jù)分析相輔相成,構(gòu)建可持續(xù)的生態(tài)系統(tǒng)平臺。
基于OLAP技術(shù)的崗位信息多維分析輔助決策系統(tǒng)總體設(shè)計(jì)如圖1所示,系統(tǒng)的數(shù)據(jù)來源由兩部分構(gòu)成:第一部分是系統(tǒng)自帶的招聘網(wǎng)站中的用戶信息;第二部分則是較大型的招聘網(wǎng)站數(shù)據(jù),此部分可通過企業(yè)協(xié)議、網(wǎng)絡(luò)合法抓捕獲取。此時(shí)獲得的數(shù)據(jù)庫需要建模重組,依據(jù)模型進(jìn)行數(shù)據(jù)篩選、清洗、轉(zhuǎn)換,才能進(jìn)入數(shù)據(jù)倉庫,成為有效數(shù)據(jù)。數(shù)據(jù)倉庫中的數(shù)據(jù)此時(shí)尚不能成為決策參考,需經(jīng)過OLAP技術(shù)處理,建立多維數(shù)據(jù)模型,然后根據(jù)用戶需求,經(jīng)過鉆取、切片、切塊等技術(shù),轉(zhuǎn)化為可視化圖表,提供給用戶以輔助決策。
圖1 基于OLAP技術(shù)的崗位信息多維分析輔助決策系統(tǒng)總體設(shè)計(jì)圖
3.2.1 用戶角色
頁面用戶包括招聘企業(yè)、應(yīng)聘個(gè)人、決策機(jī)構(gòu)3種角色,面對不同的用戶,系統(tǒng)呈現(xiàn)出不同的功能。面向招聘企業(yè)和應(yīng)聘個(gè)人角色時(shí),該系統(tǒng)就是一個(gè)招聘系統(tǒng)。不同的是,系統(tǒng)提供更為智能化的功能,通過各種維度的分析使得企業(yè)和個(gè)人獲得精準(zhǔn)信息,能夠影響招聘結(jié)果的判斷,提高招聘效率。而對于決策機(jī)構(gòu)來說,該系統(tǒng)主要提供分析后的數(shù)據(jù),以備各類人力資源管理、培訓(xùn)機(jī)構(gòu)作為決策參考。
根據(jù)角色需求,設(shè)計(jì)了不同的功能界面?!皯?yīng)聘個(gè)人”角色包括填寫個(gè)人信息、求職信息、簡歷編寫、崗位信息收藏、我的消息、虛擬面試官、查看數(shù)據(jù)分析等。用戶可以在平臺中查看招聘信息、發(fā)送求職信息;在“我的消息”中與企業(yè)聯(lián)系人直接對話,使用多維數(shù)據(jù)分析入口查看崗位各類信息分析結(jié)果,并使用“虛擬面試官”功能進(jìn)行云面試?!罢衅钙髽I(yè)”角色設(shè)計(jì)了簡歷收集、歷史招聘、共享面試官、多維數(shù)據(jù)分析入口等功能,在平臺中可以填寫企業(yè)相關(guān)信息、發(fā)布招聘崗位信息、與用戶交流并通過數(shù)據(jù)分析入口查看應(yīng)聘人員相關(guān)歷史資料?!皼Q策機(jī)構(gòu)”角色主要包括政府人力資源管理機(jī)構(gòu)、教育管理機(jī)構(gòu)、各類面向職業(yè)的中高等學(xué)校。決策機(jī)構(gòu)通過查看各崗位分析,了解人力資源配置情況。
3.2.2 人力資源大數(shù)據(jù)分析模塊
人力資源大數(shù)據(jù)分析模塊,主要是對崗位信息、崗位技能、崗位薪酬及相關(guān)崗位人力資源的儲(chǔ)備進(jìn)行多維分析,以可視化的形式展示給客戶。
(1)崗位需求分析。崗位需求分析包括崗位類別分析和崗位數(shù)量分析。在該功能中,可以看到崗位的分類和每類崗位不同時(shí)間、不同地點(diǎn)的需求數(shù)量、薪資情況、技能要求、資歷要求等。多個(gè)不同維度的崗位數(shù)據(jù)分析可以作為企業(yè)招聘方案的參考,提高招聘效率,幫助求職者了解區(qū)域崗位情況,提高入職成功率。
(2)崗位技能分析。崗位技能分析是針對某崗位所需技能進(jìn)行多維可視化分析。例如,統(tǒng)計(jì)某地區(qū)2022年Java軟件開發(fā)工程師崗位所要求的技能,95%的崗位提到j(luò)ava語言,80%的崗位提到開源框架Spring和Spring-Boot,70%的崗位提到SQL數(shù)據(jù)庫,65%企業(yè)提到VueJS技術(shù)等。系統(tǒng)將這些分析數(shù)據(jù)用柱狀圖的形式呈現(xiàn)出來,求職者能清晰了解各區(qū)域的技能要求,有針對性地選擇區(qū)域企業(yè)和崗位。如果分析時(shí)加上時(shí)間維度,對比不同歷史時(shí)期某個(gè)崗位所需技術(shù)的占比,總結(jié)出該崗位技術(shù)要求的歷史趨勢,有助于決策機(jī)構(gòu)把握人力資源投資方向,也有利于高校制訂人才培養(yǎng)方案。
(3)崗位薪酬分析。崗位薪酬分析包括區(qū)域薪酬、領(lǐng)域薪酬、崗位薪酬、資歷薪酬的數(shù)據(jù)分析。通過不同區(qū)域維度、時(shí)間維度、崗位類別維度、工作資歷維度的分析,可以看到薪資變化,有助于招聘企業(yè)和求職者共同協(xié)商,給出符合實(shí)際情況的薪酬。相關(guān)部門也可通過分析結(jié)果對人力資源市場薪酬情況有精準(zhǔn)的了解。
(4)人力資源分析。人力資源分析主要是針對求職者信息進(jìn)行分析,包括區(qū)域人才分析、領(lǐng)域人才分析、人才技能分析等功能。通過統(tǒng)計(jì)分析,獲得某區(qū)域或某領(lǐng)域人才的數(shù)量、年齡、技能、資歷數(shù)據(jù),分析數(shù)據(jù)加上時(shí)間維度后,還可以獲得人才流動(dòng)趨勢,這類信息對政府決策機(jī)構(gòu)在人力資源分配、人才引進(jìn)政策導(dǎo)向、區(qū)域高校人才培養(yǎng)專業(yè)配置等方面有參考意義。
(5)人力資源儲(chǔ)備分析。人力資源儲(chǔ)備分析針對高校人才培養(yǎng)方案給出參考意見。主要通過求職者所填信息及高校作為決策者注冊用戶后所填信息分析人力資源儲(chǔ)備情況。包括區(qū)域高校分析、專業(yè)分布分析、人才培養(yǎng)方案分析、就業(yè)趨勢分析。人才培養(yǎng)機(jī)構(gòu)通過地點(diǎn)維、時(shí)間維數(shù)據(jù)分析,可以獲得某區(qū)域高校分布、專業(yè)分布、高校學(xué)生就業(yè)趨勢等動(dòng)態(tài)數(shù)據(jù)作為人才儲(chǔ)備、培養(yǎng)政策參考。
3.2.3 崗位信息與其他維度分析匯總模塊
除了針對崗位和人才信息的分析可以獲得決策支持,崗位信息與其他維度分析同樣能夠提供決策參考意見。多維分析能夠使數(shù)據(jù)獲得最大限度的利用。在崗位信息的基礎(chǔ)上,系統(tǒng)還設(shè)計(jì)了企業(yè)與求職需求數(shù)據(jù)分析、區(qū)域與求職需求數(shù)據(jù)分析、薪資與人才資歷數(shù)據(jù)分析、各崗位技能點(diǎn)分布、高校專業(yè)設(shè)置與崗位需求供需平衡數(shù)據(jù)分析、崗位勝任能力模型分析、企業(yè)(個(gè)人)招聘成功率分析等不同維度的分析。這些分析將在崗位招聘、個(gè)人求職、人才政策制度、人才培養(yǎng)方面提供決策參考。
大數(shù)據(jù)多維分析輔助決策系統(tǒng)的核心是數(shù)據(jù)倉庫及用何種工具算法進(jìn)行訪問。在崗位多維分析決策支持系統(tǒng)中,數(shù)據(jù)倉庫用于數(shù)據(jù)的存儲(chǔ)和組織,它從應(yīng)用系統(tǒng)中抽取相關(guān)數(shù)據(jù),同時(shí)對數(shù)據(jù)進(jìn)綜合、集成、轉(zhuǎn)換后,提供面向全局的數(shù)據(jù)視圖;OLAP則可視為數(shù)據(jù)庫訪問工具,主要負(fù)責(zé)數(shù)據(jù)的分析。在本案例中,數(shù)據(jù)來源有兩個(gè):一是本系統(tǒng)中用戶注冊信息,企業(yè)和求職者使用本系統(tǒng)作為求職應(yīng)聘的平臺。在用戶使用過程中,系統(tǒng)即可獲得各類崗位相關(guān)信息。二是通過各類協(xié)議和網(wǎng)絡(luò)爬蟲,在合法合規(guī)的基礎(chǔ)上,獲得其他同類網(wǎng)站的崗位相關(guān)數(shù)據(jù)信息。
由于數(shù)據(jù)來源不同,形成異構(gòu)的數(shù)據(jù)庫系統(tǒng),而對于決策制定,只需關(guān)心宏觀的、全局模式所描述的信息,所以本案例中,數(shù)據(jù)倉庫可以以崗位信息多維分析系統(tǒng)的數(shù)據(jù)庫模式作為基本模式,從異構(gòu)數(shù)據(jù)庫系統(tǒng)中收集信息,并建立統(tǒng)一的全局模式。同時(shí)收集的數(shù)據(jù)還支持對歷史數(shù)據(jù)的訪問,用戶通過數(shù)據(jù)倉庫提供的統(tǒng)一數(shù)據(jù)接口進(jìn)行決策支持的查詢。
與關(guān)系數(shù)據(jù)庫相比,多維數(shù)據(jù)庫增加了一個(gè)時(shí)間維,它的優(yōu)勢在于可以提高數(shù)據(jù)處理速度,加快反應(yīng)時(shí)間,提高查詢效率。OLAP查詢引擎的概念模型可以看作數(shù)據(jù)倉庫的多維視圖,在多維數(shù)據(jù)模型中,有一組信息作為分析對象的數(shù)字度量方式。在本系統(tǒng)中,崗位分類、崗位數(shù)量、崗位技能、資歷要求、區(qū)域名稱都可以看成數(shù)字度量方式。多維數(shù)據(jù)把一個(gè)度量視為維的多維空間內(nèi)的一個(gè)值,每維由一系列屬性來描述,崗位維可以由4種屬性組成:分類、區(qū)域、時(shí)間、數(shù)量。崗位名稱可通過維的層次關(guān)系與分類和區(qū)域?qū)傩韵嚓P(guān)聯(lián)。這種數(shù)據(jù)組織方式消除了大量數(shù)據(jù)庫表中由于空穴造成的空間浪費(fèi),以及在每個(gè)元組中存儲(chǔ)的外鍵信息,它由統(tǒng)一的維與數(shù)組的對應(yīng)系數(shù)限定數(shù)據(jù),大大減少了存儲(chǔ)空間。
聯(lián)機(jī)分析處理OLAP是一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個(gè)方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information)特征,即共享多維信息的快速分析的特征。根據(jù)上述用戶分析的功能進(jìn)行應(yīng)用分割,例如崗位信息分析、崗位技能分析、就業(yè)趨勢分析等,每個(gè)分析就是一個(gè)OLAP應(yīng)用,所有的OLAP應(yīng)用實(shí)際上是所建立的數(shù)據(jù)倉庫系統(tǒng)的一部分。
OLAP的基本多維分析操作有鉆取、切片、切塊、旋轉(zhuǎn)等。鉆取是改變維的層次,變換分析的粒度。它包括向下鉆?。―rill-down)和向上鉆取(Drill-up)/上卷(Roll-up)。Drill-up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而Drill-down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。圖2是一個(gè)崗位信息模型,向下鉆取和上卷的過程。此數(shù)據(jù)模型由崗位分類維、時(shí)間維、地區(qū)維構(gòu)成,數(shù)據(jù)上卷后,減少了地區(qū)維,所看到的僅為江蘇某時(shí)間崗位情況。
圖2 使用OLAP對崗位信息數(shù)據(jù)模型進(jìn)行鉆取、上卷、切片操作
切片和切塊是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有2個(gè),則是切片;如果有3個(gè)或以上,則是切塊。旋轉(zhuǎn)是變換維的方向,即在表格中重新安排維的放置。崗位信息數(shù)據(jù)模型切塊和旋轉(zhuǎn)操作后如圖3所示,其意義在于更為細(xì)致地剖析崗位數(shù)據(jù),獲得更多的信息資源。
圖3 使用OLAP技術(shù)對崗位信息數(shù)據(jù)模型進(jìn)行切塊、旋轉(zhuǎn)操作
本文對基于OLAP技術(shù)的崗位信息多維分析輔助決策系統(tǒng)設(shè)計(jì)進(jìn)行了探討。論述了相關(guān)系統(tǒng)的現(xiàn)狀,分析了系統(tǒng)角色分類、系統(tǒng)需求,對系統(tǒng)功能進(jìn)行了詳細(xì)設(shè)計(jì);探討了數(shù)據(jù)倉庫建設(shè)方法,并對基于OLAP技術(shù)的崗位數(shù)據(jù)分析做了剖析。有利于指導(dǎo)企業(yè)建立基于OLAP技術(shù)的崗位信息分析系統(tǒng),以O(shè)LAP為基本框架的決策支持系統(tǒng)有助于企業(yè)、求職者、政府決策機(jī)構(gòu)、高校從更廣泛、更全面的視角對崗位信息和人力資源數(shù)據(jù)進(jìn)行有效、快速的分析,幫助決策者了解情況,掌握有效、精準(zhǔn)的決策信息,提高決策水平。