徐鵬
(焦作大學(xué)人文學(xué)院,河南焦作 454150)
大數(shù)據(jù)時(shí)代高校就業(yè)信息網(wǎng)絡(luò)體系的構(gòu)建
徐鵬
(焦作大學(xué)人文學(xué)院,河南焦作 454150)
利用現(xiàn)代網(wǎng)絡(luò)數(shù)字科技所帶來的高效、便捷性,構(gòu)建高校就業(yè)信息網(wǎng)絡(luò)體系,已是促進(jìn)高校畢業(yè)生就業(yè)的必然趨勢(shì)?;诖?,結(jié)合目前高校就業(yè)信息網(wǎng)絡(luò)系統(tǒng)中存在的問題,探討構(gòu)建高校就業(yè)信息網(wǎng)絡(luò)系統(tǒng)的框架和對(duì)策。
大數(shù)據(jù);高校就業(yè);網(wǎng)絡(luò)體系;服務(wù)模式
隨著第3次IT浪潮的到來,“云計(jì)算”帶來的虛擬化技術(shù)改變了人們獲取、處理、保存、提取信息的方式,實(shí)現(xiàn)了托夫勒“大數(shù)據(jù)”概念的設(shè)想,世界各國(guó)紛紛出臺(tái)戰(zhàn)略規(guī)劃和采取舉措加快大數(shù)據(jù)在國(guó)民經(jīng)濟(jì)中的應(yīng)用,我國(guó)也充分肯定了大數(shù)據(jù)的價(jià)值,并預(yù)計(jì)在2018年底前建成國(guó)家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái)[1]。高校就業(yè)信息網(wǎng)絡(luò)體系作為平臺(tái)建設(shè)的組成部分,利用大數(shù)據(jù)分析技術(shù)進(jìn)行數(shù)據(jù)共享,不僅能夠?qū)μN(yùn)含在其中的海量就業(yè)信息進(jìn)行搜集匯總、挖掘分析,還能夠形成一個(gè)動(dòng)態(tài)反映就業(yè)市場(chǎng)、政策和動(dòng)向的信息數(shù)據(jù)流,從而更為客觀有效地服務(wù)于高校畢業(yè)生的就業(yè)指導(dǎo)工作。
大數(shù)據(jù)是體量大到以PB甚至EB等級(jí)為計(jì)量單位的數(shù)據(jù)資產(chǎn)集,在總量、響應(yīng)速度、類型、辨識(shí)度和價(jià)值等5個(gè)方面,具有傳統(tǒng)數(shù)據(jù)無法比擬的挑戰(zhàn)。因此,使用何種數(shù)據(jù)挖掘算法,構(gòu)建科學(xué)和快速的處理數(shù)據(jù)模型,正是當(dāng)今大數(shù)據(jù)分析的難點(diǎn)。為了應(yīng)對(duì)大數(shù)據(jù)處理上的困難,實(shí)現(xiàn)數(shù)據(jù)的預(yù)測(cè)性分析,以谷歌、Linkedin、微軟、百度和Facebook等為代表的互聯(lián)網(wǎng)企業(yè),通過云計(jì)算實(shí)現(xiàn)對(duì)結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù)進(jìn)行系統(tǒng)異構(gòu)的采集和動(dòng)態(tài)處理方式,放棄絕對(duì)的精準(zhǔn)和因果的分析,實(shí)現(xiàn)分析效率與相關(guān)的預(yù)測(cè)的平衡。
就業(yè)信息大數(shù)據(jù)具有數(shù)據(jù)總量大、更新速度快、時(shí)效性強(qiáng)和來源眾多等特點(diǎn),利用傳統(tǒng)的SAS、SPSS、Stata、CHISS和PEMS等數(shù)據(jù)分析工具,只能夠在某一平臺(tái)下對(duì)單一服務(wù)器中的結(jié)構(gòu)性數(shù)據(jù)進(jìn)行分析統(tǒng)計(jì),其滯后的數(shù)據(jù)表達(dá)也無法對(duì)多行業(yè)、大規(guī)模的就業(yè)趨勢(shì)進(jìn)行實(shí)時(shí)的科學(xué)預(yù)判,更無法針對(duì)個(gè)體提供可擴(kuò)展性的就業(yè)信息篩選。在數(shù)據(jù)管理與分析范式發(fā)生革命性轉(zhuǎn)變的今天,利用大數(shù)據(jù)分析處理系統(tǒng)中的批量數(shù)據(jù)分析系統(tǒng)和在線實(shí)時(shí)處理系統(tǒng),在整合集成就業(yè)信息數(shù)據(jù)的基礎(chǔ)上,為實(shí)現(xiàn)信息數(shù)據(jù)的共享與交互,在海量的數(shù)據(jù)信息中進(jìn)行有效數(shù)據(jù)的篩檢和遴選,構(gòu)造就業(yè)數(shù)據(jù)分析網(wǎng)絡(luò)模式具有十分重要的現(xiàn)實(shí)價(jià)值。
根據(jù)《教育部關(guān)于做好2001年普通高校畢業(yè)生就業(yè)工作的通知》中的要求,各大高校開始將計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)應(yīng)用于高校畢業(yè)生就業(yè)工作中。經(jīng)過十幾年的努力,我國(guó)的高校就業(yè)信息網(wǎng)絡(luò)在形式上經(jīng)歷了從“高校就業(yè)網(wǎng)站建設(shè)”到“政府就業(yè)網(wǎng)站建設(shè)”,再到“社會(huì)力量就業(yè)網(wǎng)站建設(shè)”3個(gè)階段,從以“獨(dú)立高校發(fā)布信息”到“政府整合就業(yè)信息”再到“第三方平臺(tái)豐富就業(yè)信息”;在手段上,也實(shí)現(xiàn)了從“單一的網(wǎng)站建設(shè)”,到“網(wǎng)站平臺(tái)的聯(lián)通”,再到“網(wǎng)站與新媒介的共融”的階段。目前,我國(guó)大致形成了以高校就業(yè)網(wǎng)站和政府就業(yè)指導(dǎo)中心網(wǎng)站為主體,輔以第三方社會(huì)力量網(wǎng)絡(luò)平臺(tái)、企事業(yè)單位網(wǎng)絡(luò)平臺(tái)和新媒介的高校就業(yè)信息化網(wǎng)絡(luò)。但目前我國(guó)就業(yè)信息網(wǎng)絡(luò)建設(shè)還存在著以下不足。
2.1 網(wǎng)絡(luò)系統(tǒng)基本完善與信息整合程度低下的矛盾
目前我國(guó)已經(jīng)形成了政府機(jī)構(gòu)、高校、社會(huì)組織、用工單位等多方平臺(tái)組成的就業(yè)信息網(wǎng)絡(luò),但大量數(shù)據(jù)均在各自服務(wù)器中貯存,畢業(yè)生信息、用工單位信息、薪資水平、求職條件等由于缺乏溝通和互聯(lián),均采用封閉運(yùn)行的模式,只能作為求職或供職信息的發(fā)布平臺(tái)存在。
2.2 就業(yè)信息量庫(kù)存巨大與信息分析不足的矛盾
各大網(wǎng)絡(luò)平臺(tái)上貯存了數(shù)量龐大的求職信息數(shù)據(jù)和供職信息數(shù)據(jù),甚至包括網(wǎng)頁(yè)駐留時(shí)間、點(diǎn)擊次數(shù)等信息,這些以PB等級(jí)存儲(chǔ)的數(shù)據(jù)由于缺乏大數(shù)據(jù)思維模式的分析,通常只作為歷史數(shù)據(jù)統(tǒng)計(jì)的回顧之用,極少用于即時(shí)性的動(dòng)態(tài)數(shù)據(jù)分析,缺少對(duì)當(dāng)前就業(yè)形勢(shì)的預(yù)測(cè)研判,更無法為畢業(yè)生個(gè)體提供有針對(duì)性的就業(yè)信息推送。
2.3 信息網(wǎng)絡(luò)平臺(tái)功能單一與個(gè)性化網(wǎng)絡(luò)信息需求的矛盾
從現(xiàn)實(shí)情況看,我國(guó)高校就業(yè)信息網(wǎng)絡(luò)目前還只是一套信息發(fā)布為主的資源平臺(tái),采用的是以高校、政府、用人單位三者發(fā)布意愿為中心的服務(wù)模式,無法根據(jù)畢業(yè)生興趣愛好、特長(zhǎng)能力為其提供更為可行的就業(yè)崗位信息推送。而且崗位供需雙方一般采用線下溝通的方式,極大地影響了擇業(yè)效率。
因此,建立全國(guó)性的高校畢業(yè)生人才數(shù)據(jù)庫(kù),豐富就業(yè)網(wǎng)絡(luò)平臺(tái)的服務(wù)功能,并在兩者對(duì)接的基礎(chǔ)上實(shí)現(xiàn)雙向選擇的就業(yè)模式,就具有了現(xiàn)實(shí)的依據(jù)。
3.1 數(shù)據(jù)共享原則
數(shù)據(jù)共享是大數(shù)據(jù)進(jìn)行數(shù)據(jù)分析的前提。就業(yè)信息平臺(tái)的數(shù)據(jù)分享就是將現(xiàn)有網(wǎng)絡(luò)體系中的各平臺(tái)實(shí)現(xiàn)數(shù)據(jù)庫(kù)的互通。一來可以通過就業(yè)信息的相互交換實(shí)現(xiàn)就業(yè)信息的高效傳播,二來可以在網(wǎng)絡(luò)環(huán)境下對(duì)整體的就業(yè)信息資源進(jìn)行動(dòng)態(tài)化分析。
3.2 人本原則
搭建高校就業(yè)信息網(wǎng)絡(luò)的初衷就是為了實(shí)現(xiàn)高校畢業(yè)生就業(yè)的高效化,其服務(wù)主體就是高校畢業(yè)生。因此,在進(jìn)行高校畢業(yè)生制定就業(yè)策略和決定,以及風(fēng)險(xiǎn)管理的過程中,都應(yīng)根據(jù)畢業(yè)生的實(shí)際需求出發(fā),從平臺(tái)設(shè)計(jì)、形勢(shì)研判、信息推送等多方面將畢業(yè)生作為考慮的重點(diǎn),體現(xiàn)出人性的設(shè)計(jì)和特色的服務(wù)。
3.3 互利平等原則
互利平等原則是目前網(wǎng)絡(luò)體系中各方平臺(tái)主體共享數(shù)據(jù)分析成果的直接驅(qū)動(dòng)力。政府及高校就業(yè)信息平臺(tái)建設(shè)的目標(biāo)是實(shí)現(xiàn)大學(xué)生更好的就業(yè),第三方就業(yè)信息平臺(tái)建設(shè)的目標(biāo)是擴(kuò)大潛在客戶群體,提高品牌收益,雙方在大數(shù)據(jù)分析成果上是具有共同需求的。因此,只有保證各方主體均共享大數(shù)據(jù)帶來的科技成果,才能保障信息資源的持續(xù)共享。
4.1 就業(yè)信息網(wǎng)絡(luò)體系總框架
國(guó)家建立就業(yè)信息大數(shù)據(jù)分析總站,下設(shè)各地市級(jí)數(shù)據(jù)采集分站,與具有云計(jì)算能力的互聯(lián)網(wǎng)公司協(xié)作處理大數(shù)據(jù),如圖1所示。
圖1 就業(yè)信息網(wǎng)絡(luò)體系總框架
國(guó)家就業(yè)信息大數(shù)據(jù)分析總站在同具有云計(jì)算能力的互聯(lián)網(wǎng)公司協(xié)作下共同完成對(duì)全國(guó)范圍內(nèi)數(shù)據(jù)的分析,并將分析結(jié)果反饋至下級(jí)平臺(tái);區(qū)域就業(yè)信息數(shù)據(jù)分析平臺(tái)分站一般以省級(jí)或經(jīng)濟(jì)圈為劃分依據(jù),將本區(qū)域內(nèi)的就業(yè)數(shù)據(jù)協(xié)同互聯(lián)網(wǎng)公司進(jìn)行就業(yè)數(shù)據(jù)的云計(jì)算分析,將篩選后的數(shù)據(jù)分析結(jié)果上傳至國(guó)家就業(yè)信息數(shù)據(jù)分析總站,供其研究分析;地市高校就業(yè)信息數(shù)據(jù)分析采集分站將高校在校生從入學(xué)以來的姓名、籍貫、愛好、特長(zhǎng)、專業(yè)、成績(jī)和兼職經(jīng)歷等信息進(jìn)行錄入,供區(qū)域就業(yè)信息數(shù)據(jù)分析平臺(tái)分析篩選;第三方區(qū)域就業(yè)信息分析分站是指以社會(huì)力量建立的商業(yè)化就業(yè)網(wǎng)站,可將就業(yè)信息、瀏覽量、登錄次數(shù)、網(wǎng)頁(yè)駐留時(shí)間和瀏覽習(xí)慣等數(shù)據(jù)進(jìn)行初級(jí)過濾分析,然后上傳至國(guó)家就業(yè)信息大數(shù)據(jù)平臺(tái);行業(yè)就業(yè)信息大數(shù)據(jù)分析分站是指以行業(yè)進(jìn)行劃分建立的就業(yè)信息網(wǎng)絡(luò)平臺(tái),如東北高師就業(yè)聯(lián)盟等,可將行業(yè)內(nèi)的就業(yè)信息、瀏覽量、登錄次數(shù)等信息進(jìn)行初級(jí)過濾篩選分析,上傳至國(guó)家就業(yè)信息大數(shù)據(jù)平臺(tái)。此外,新媒介平臺(tái)上的就業(yè)信息網(wǎng)絡(luò)也可以作為大數(shù)據(jù)就業(yè)信息網(wǎng)絡(luò)分析平臺(tái)的有機(jī)組成部分。
4.2 就業(yè)信息大數(shù)據(jù)分析體系框架
在大數(shù)據(jù)的分析結(jié)構(gòu)中,高校畢業(yè)生既是大數(shù)據(jù)信息的來源,同時(shí)是大數(shù)據(jù)分析結(jié)果所服務(wù)的對(duì)象。數(shù)據(jù)分析的基本框架向下延伸,最初從畢業(yè)生開始,由業(yè)務(wù)系統(tǒng)、數(shù)據(jù)采集、數(shù)據(jù)倉(cāng)庫(kù)、分析、商業(yè)智能、數(shù)據(jù)挖掘、人工智能、洞察、決策、行為和價(jià)值,再最終回到畢業(yè)生結(jié)束。在這個(gè)大數(shù)據(jù)分析體系框架中,越貼近底層占用時(shí)間越多,而框架頂端的決策耗時(shí)卻很短;從價(jià)值頻率來講,頂端低頻次、高價(jià)值,底層是高頻次、低價(jià)值。因此,就業(yè)分析體系大數(shù)據(jù)技術(shù)的一個(gè)重要發(fā)展方向是,效率低的部分實(shí)現(xiàn)全方位自動(dòng)化,并且實(shí)現(xiàn)一站式的大數(shù)據(jù)服務(wù)[2]。
4.2.1 就業(yè)數(shù)據(jù)源的采集階段。畢業(yè)生信息是高校就業(yè)信息大數(shù)據(jù)最重要的來源,圍繞畢業(yè)生的一切數(shù)據(jù)是最為重要的原始數(shù)據(jù)。畢業(yè)生的相關(guān)信息數(shù)據(jù)廣泛存在于學(xué)校內(nèi)部各類業(yè)務(wù)系統(tǒng)中,如教務(wù)系統(tǒng)、學(xué)籍管理系統(tǒng)等。但這些業(yè)務(wù)系統(tǒng)由于設(shè)計(jì)目的不同造成架構(gòu)各異,且數(shù)量眾多。所以,搜集整理畢業(yè)生群體的信息,就必須通過國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)制定統(tǒng)一的數(shù)據(jù)接口協(xié)議,由“大數(shù)據(jù)采集平臺(tái)”對(duì)畢業(yè)生所有相關(guān)原始數(shù)據(jù)的采集。目前,主要有四大數(shù)據(jù)采集平臺(tái)的架構(gòu)——Apache Flume、Fluentd、Logstash、Splunk Forwarder。由于以上數(shù)據(jù)搜集平臺(tái)均是開源設(shè)計(jì)框架,利用分布式網(wǎng)絡(luò)連接,均可以實(shí)現(xiàn)可靠和高擴(kuò)展的數(shù)據(jù)收集。
4.2.2 數(shù)據(jù)的初級(jí)過濾分析。在前期數(shù)據(jù)采集基礎(chǔ)上,需要對(duì)這些海量的數(shù)據(jù)進(jìn)行“清洗”識(shí)別,處理數(shù)據(jù)中的錯(cuò)誤信息和缺失信息。因?yàn)樵跀?shù)據(jù)采集平臺(tái)中的數(shù)據(jù)是從多個(gè)業(yè)務(wù)系統(tǒng)中抽取而來,并且包含諸多歷史數(shù)據(jù),不可避免會(huì)出現(xiàn)數(shù)據(jù)錯(cuò)誤和數(shù)據(jù)沖突,這就需要按照規(guī)則對(duì)殘缺數(shù)據(jù)進(jìn)行補(bǔ)全,對(duì)錯(cuò)誤數(shù)據(jù)進(jìn)行修正,對(duì)重復(fù)數(shù)據(jù)進(jìn)行剔除,從而節(jié)約存儲(chǔ)空間為接下來的數(shù)據(jù)轉(zhuǎn)換和加載奠定基礎(chǔ)。在數(shù)據(jù)轉(zhuǎn)換和加載環(huán)節(jié),傳統(tǒng)的數(shù)據(jù)處理是將原來非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化轉(zhuǎn)化之后再進(jìn)行數(shù)據(jù)的壓縮,這必將造成存儲(chǔ)、計(jì)算、傳輸成本過高,無法實(shí)現(xiàn)及時(shí)響應(yīng)。所以,在這個(gè)環(huán)節(jié)中如果能夠?qū)⒓虞d和轉(zhuǎn)化的順序進(jìn)行對(duì)調(diào),首先進(jìn)行轉(zhuǎn)換為可供分析的數(shù)據(jù)之后,再通過數(shù)據(jù)轉(zhuǎn)換接口將數(shù)據(jù)寫入二級(jí)信息分析分站中的DW(數(shù)據(jù)倉(cāng)庫(kù))中,必將大幅節(jié)約數(shù)據(jù)處理時(shí)間,以供其進(jìn)行結(jié)構(gòu)化存儲(chǔ)、處理和分析引擎等服務(wù)。
4.2.3 數(shù)據(jù)的高級(jí)分析。畢業(yè)生相關(guān)數(shù)據(jù)經(jīng)過初級(jí)分析后進(jìn)入到高級(jí)分析階段,其中包括統(tǒng)計(jì)分析(Analy?sis)和商業(yè)智能(BI)2個(gè)階段。統(tǒng)計(jì)分析一般通過多維度的聯(lián)機(jī)線上分析技術(shù)(OLAP),以多樣化的統(tǒng)計(jì)展示就業(yè)形勢(shì)預(yù)期,在人機(jī)交互中為畢業(yè)生提供崗位選擇的判斷幫助;商業(yè)智能主要是以分析技術(shù)和工具直接挑選出具有價(jià)值的數(shù)據(jù),采用諸如報(bào)表等形象化的展示,實(shí)現(xiàn)數(shù)據(jù)的透視和展現(xiàn),快速完成數(shù)據(jù)表樣式和統(tǒng)計(jì)圖展示,從而更好地輸出給其他應(yīng)用程序或者Html形式表現(xiàn)和保存,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的擴(kuò)大化。這樣可以大大提高數(shù)據(jù)分析部門工作效率,滿足數(shù)據(jù)分析的即時(shí)化需求[3]。
4.2.4 數(shù)據(jù)價(jià)值的發(fā)揮。在經(jīng)過數(shù)據(jù)的高級(jí)分析之后,便進(jìn)入到如何將數(shù)據(jù)價(jià)值發(fā)揮出來的階段。這個(gè)階段主要包括數(shù)據(jù)挖掘(DM)、人工智能(AI)、洞察、決策、行動(dòng)和價(jià)值等環(huán)節(jié)。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取隱藏于其中的規(guī)律,將畢業(yè)生信息分析之后的相關(guān)數(shù)據(jù)通過分類、聚類、關(guān)聯(lián)、預(yù)測(cè)等方式進(jìn)行分組,得到畢業(yè)生個(gè)體特征綜合數(shù)據(jù),并從中發(fā)現(xiàn)變化規(guī)律,建立個(gè)體職業(yè)發(fā)展模型,以此預(yù)測(cè)個(gè)體未來就業(yè)特征等內(nèi)容。人工智能的交互性價(jià)值是其在自動(dòng)化學(xué)習(xí)的基礎(chǔ)上,為信息需求者提供有價(jià)值的發(fā)現(xiàn),并且根據(jù)這些發(fā)現(xiàn)給出決策建議、行動(dòng)建議,最終幫助平臺(tái)管理實(shí)現(xiàn)個(gè)人化、人性化的就業(yè)指導(dǎo)服務(wù),實(shí)現(xiàn)平臺(tái)實(shí)現(xiàn)價(jià)值,滿足高校畢業(yè)生的求職需求。
大數(shù)據(jù)分析體系框架,最終應(yīng)著眼于幫助就業(yè)信息網(wǎng)絡(luò)體系為高校畢業(yè)生提供有價(jià)值的就業(yè)信息指導(dǎo),不能僅局限于技術(shù)本身和就業(yè)信息的發(fā)布,只有很好地實(shí)現(xiàn)了就業(yè)形勢(shì)的分析、就業(yè)決策的指導(dǎo)、就業(yè)行為的規(guī)范,最終才能真正實(shí)現(xiàn)就業(yè)信息的大數(shù)據(jù)價(jià)值,達(dá)到通過大數(shù)據(jù)提升就業(yè)效率增長(zhǎng)的目的。
[1]新華網(wǎng).促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要[EB/OL].(2015-09-15)[2016-12-15].http://news.xinhuanet.com/finance/2015-09/05/ c_1116464516.htm.
[2]趙志學(xué),周軍軍.大數(shù)據(jù)背景下大學(xué)生就業(yè)信息化建設(shè)探析[J].煤炭高等教育,2015(2):67-69.
[3]程學(xué)旗,靳小龍,王元卓,等.大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J].軟件學(xué)報(bào),2014(9):1889-1908.
Construction of University Employment Information Network System in the Era of Big Data
Xu Peng
(Faculty of Humanities,Jiaozuo University,Jiaozuo Henan 454150)
It is an inevitable trend to promote the employment of college graduates by constructing the employment in?formation network system of colleges and universities with the high efficiency and convenience brought by modern network digital technology.therefor,based on the existing problems in the employment information network system, this paper discussed the frame and countermeasures of constructing the employment information network system.
Big Data;university employment;network system;service model
G647.38;TP311.13
:A
:1003-5168(2017)01-0054-03
2016-12-18
河南省教育廳大中專院校就業(yè)創(chuàng)業(yè)課題(JYB2016010)。
徐鵬(1982-),男,碩士,講師,研究方向:大學(xué)生就業(yè)創(chuàng)業(yè)。