鄭 娜
(河北農(nóng)業(yè)大學(xué) 河北 保定 071000)
關(guān)鍵字:大數(shù)據(jù);人社;信息化平臺;監(jiān)管決策
隨著我國社會保障事業(yè)的快速發(fā)展,已經(jīng)初步建成了社保公共服務(wù)體系,社保的覆蓋范圍迅速擴(kuò)大,參保的人數(shù)和資金也不斷增長。但是人社數(shù)據(jù)信息整合力度不高,統(tǒng)計(jì)調(diào)查力度有限,統(tǒng)計(jì)數(shù)據(jù)信息公開力度不夠,數(shù)據(jù)對服務(wù)決策、服務(wù)管理、服務(wù)社會的巨大潛力并沒有開發(fā)[1]。因此,建設(shè)統(tǒng)一共享的人社數(shù)據(jù)平臺具有非常現(xiàn)實(shí)的意義。
人社大數(shù)據(jù)平臺的建設(shè),主要是利用大數(shù)據(jù)技術(shù)、GIS技術(shù)和手機(jī)通信數(shù)據(jù),進(jìn)一步挖掘數(shù)據(jù)的更深層次的價(jià)值,如可以對于勞動(dòng)力的遷徙、就業(yè)、居住等情況進(jìn)行目標(biāo)性、區(qū)域性的監(jiān)控、跟蹤和預(yù)警,從而推進(jìn)社會公共服務(wù)信息化的發(fā)展,進(jìn)而提升整個(gè)社會的信息化水平,提升人社部門的服務(wù)水平以及監(jiān)管決策能力。
大數(shù)據(jù)在各個(gè)行業(yè)的應(yīng)用與服務(wù)已經(jīng)成為了趨勢,通過數(shù)據(jù)之間的共享和價(jià)值再造以及數(shù)據(jù)之間的進(jìn)一步挖掘,可以提升統(tǒng)計(jì)分析的功能和準(zhǔn)確率。由于通訊公司的信令數(shù)據(jù)與人力資源與保障廳的數(shù)據(jù)的格式以及信息化程度都不盡相同,對于數(shù)據(jù)的融合和挖掘需要逐步進(jìn)行,要先對相關(guān)數(shù)據(jù)進(jìn)行篩選,對數(shù)據(jù)格式進(jìn)行統(tǒng)一制定,并且對數(shù)據(jù)業(yè)務(wù)應(yīng)用進(jìn)行統(tǒng)一建模。
1.1 大數(shù)據(jù)平臺人員責(zé)任分析。人社大數(shù)據(jù)平臺建立主要涉及的人員是人社部門的技術(shù)人員以及通信公司的技術(shù)人員,這些人員負(fù)責(zé)對人社數(shù)據(jù)以及通信數(shù)據(jù)進(jìn)行加密、傳輸、建模以及分析輸出結(jié)果。
人社廳技術(shù)人員負(fù)責(zé)將數(shù)據(jù)進(jìn)行加密和傳輸,然后通過通訊部門的專線進(jìn)行傳輸,運(yùn)用雙方約定好的方式進(jìn)行解密;通信公司技術(shù)人員進(jìn)行通信信令的采集,將數(shù)據(jù)進(jìn)行存儲或傳輸。雙方根據(jù)業(yè)務(wù)需求進(jìn)行建模,根據(jù)模型數(shù)據(jù)進(jìn)行分析,分析結(jié)果可視化展示,展示方式可以是圖表、圖標(biāo)、熱力圖等。人社大數(shù)據(jù)平臺的系統(tǒng)構(gòu)成圖如圖1所示。
圖1 人社大數(shù)據(jù)平臺系統(tǒng)構(gòu)成圖
1.2 大數(shù)據(jù)平臺的功能性分析
1.2.1 功能需求。利用人社部門提供的人員身份信息,例如籍貫、年齡、參保、應(yīng)往屆畢業(yè)生等,結(jié)合通訊公司的位置信息等數(shù)據(jù),根據(jù)業(yè)務(wù)模型分析出省內(nèi)人口遷徙、勞動(dòng)力來源、大學(xué)生就業(yè)分布等情況。
1.2.2 維度分析。根據(jù)需求,可以從多個(gè)維度進(jìn)行分析。例如,可以根據(jù)年齡數(shù)據(jù),分析遷徙人口的年齡分布;根據(jù)性別數(shù)據(jù),分析遷徙人口的性別分布;根據(jù)ARUP值(用于衡量電信運(yùn)營商業(yè)務(wù)收入利潤的指標(biāo)),分析遷徙人口的消費(fèi)分布。
1.2.3 建模需求。該系統(tǒng)平臺是以業(yè)務(wù)需求為驅(qū)動(dòng)力,借助于通訊公司的用戶位置數(shù)據(jù)、資料數(shù)據(jù)、消費(fèi)數(shù)據(jù)等,利用身份數(shù)據(jù)進(jìn)行關(guān)聯(lián),使得通訊數(shù)據(jù)和人社數(shù)據(jù)進(jìn)行初步融合、統(tǒng)一建模,建立起針對人口遷徙、人口流動(dòng)、大學(xué)生就業(yè)的分析模型。結(jié)合過往的歷史數(shù)據(jù),實(shí)現(xiàn)對重點(diǎn)地區(qū)、行業(yè)、企業(yè)的用工趨勢分析,為勞動(dòng)力的就業(yè)趨勢提供預(yù)測,為就業(yè)者提供就業(yè)機(jī)會,為政府以及用工市場提供決策依據(jù)[2]。
人社大數(shù)據(jù)平臺的數(shù)據(jù)主要來源于人社部門的基礎(chǔ)數(shù)據(jù)以及通訊公司的信令數(shù)據(jù)兩部分。
2.1 人社部門的數(shù)據(jù)采集。對于人社數(shù)據(jù)的采集,可以分成兩種情況,一是通過人社部門提供的FTP服務(wù)器,數(shù)據(jù)平臺負(fù)責(zé)從指定的接口進(jìn)行采集,采集后的數(shù)據(jù)加密后存放在指定的接口機(jī);二是通過人社信息系統(tǒng)在通信公司指定的FTP機(jī)器上存放文件,然后從FTP機(jī)器上采集文件進(jìn)行機(jī)密存放[3]。
2.2 通信公司的數(shù)據(jù)采集。通訊公司將相關(guān)用戶的身份及位置信息生成文件,并將文件進(jìn)行加密存放在指定的接口機(jī),這樣,接口機(jī)上的所有數(shù)據(jù)文件都是加密存放的。接口機(jī)和FTP服務(wù)器,都要求通過申請?jiān)L問來確保信息的保密性。為了數(shù)據(jù)采集時(shí)的安全,在整個(gè)數(shù)據(jù)采集過程中可以采用三層數(shù)據(jù)處理。
2.2.1 確保接口機(jī)安全。人社數(shù)據(jù)資料和通訊公司用戶身份等信息資料通過加密后存放在接口機(jī),該接口機(jī)的秘鑰需由專人統(tǒng)一掌握,接口機(jī)不允許私人訪問,非管理人員必須通過申請?jiān)L問[4];接口機(jī)上可以允許處理數(shù)據(jù)程序,進(jìn)行解密以及人社數(shù)據(jù)和通訊公司數(shù)據(jù)的匹配。
2.2.2 接口機(jī)處理安全。匹配成功后人社資料信息直接加密入庫人社存儲專區(qū),通過MD5不可逆進(jìn)行加密[5]。匹配失敗的人社資料信息直接傳遞給通訊公司的指定接口機(jī)。集團(tuán)客戶查詢返回用戶資料入庫到通信公司的資料庫。
2.2.3 數(shù)據(jù)訪問安全。關(guān)鍵字段進(jìn)行MD5加密。視圖權(quán)限可以放給人社存儲專區(qū)庫用戶。人社數(shù)據(jù)存儲的專區(qū)庫相對獨(dú)立,需要的訪問權(quán)限相對較高。
數(shù)據(jù)解密過程可以由下圖進(jìn)行描述:
以人口流動(dòng)分析模型為例,分析的結(jié)果是身份信息為本省不同人群的遷徙特征,按照勞動(dòng)力的組成進(jìn)行分類,從而整體分析人口流動(dòng)的遷徙情況,并將最終的分析結(jié)果通過GIS等圖表的形式呈現(xiàn)出來,通過這樣直觀的數(shù)據(jù)分析來及時(shí)更新重點(diǎn)區(qū)域的勞動(dòng)力組成以及不同人群的遷徙情況。
3.1 人口流動(dòng)分析模型的建立。根據(jù)全省整體人口的遷徙特征主要分析屬于某省份戶口的人員外遷情況,根據(jù)該省份的通訊公司采集到的信令數(shù)據(jù),分析人員的位置、遷徙軌跡、長期居住地、工作地以及在各地區(qū)的居住時(shí)長。
利用省人社部門提供的用戶社保信息,以及該用戶的通訊位置信息,分析該省繳納社保用戶在全國其他地區(qū)的分布情況,這可以非常方便的查詢該省向其他地區(qū)的遷徙情況,并將這些信息以報(bào)表和GIS地圖的形式進(jìn)行形象的展示。
3.2 人口流動(dòng)模型數(shù)據(jù)處理流程分析。人口流動(dòng)的平臺處理流程見圖2所示,首先選取常駐信令6個(gè)月的相關(guān)數(shù)據(jù),從該數(shù)據(jù)中提取出去過同一個(gè)城市或者地區(qū)3次以上用戶的用戶編碼、工作地點(diǎn),然后提取去過研究區(qū)域3次以上的用戶的信息,將提取出的兩種用戶信息進(jìn)行關(guān)聯(lián),得到該人群的年齡區(qū)間、性別、消費(fèi)層,再通過用戶資料表來提取用戶的身份信息,從而在相關(guān)的地區(qū)表上提取對應(yīng)的地市區(qū)號。
圖2 人社平臺數(shù)據(jù)處理流程分析
在大數(shù)據(jù)的背景下,本文提出了一種利用人社數(shù)據(jù)以及通訊信令數(shù)據(jù)進(jìn)行整合分析,設(shè)計(jì)建立人社大數(shù)據(jù)分析平臺的設(shè)計(jì)思路。該思路具有一定的創(chuàng)新性和實(shí)用性,但在實(shí)際系統(tǒng)搭建時(shí),還要對硬件設(shè)備、系統(tǒng)潛能、系統(tǒng)進(jìn)行更進(jìn)一步的優(yōu)化,對關(guān)鍵算法和代碼進(jìn)行深一步的探討,對數(shù)據(jù)庫設(shè)計(jì)進(jìn)行規(guī)范,以合理搭建高效運(yùn)行的系統(tǒng)平臺。