胡霖
摘 要: 針對(duì)大數(shù)據(jù)下的人力流動(dòng)區(qū)域的估算問(wèn)題,提出基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型。引進(jìn)了K近鄰非參數(shù)估計(jì)仿真模型,對(duì)大數(shù)據(jù)背景下的人力流動(dòng)區(qū)域進(jìn)行標(biāo)準(zhǔn)估算。同時(shí)能夠?qū)值進(jìn)行預(yù)留計(jì)算,避免大數(shù)據(jù)干擾的發(fā)生,優(yōu)化了分類近鄰子集生成模塊,有效地提高了估算能力以及估算的范圍,對(duì)人力流動(dòng)區(qū)域的估算準(zhǔn)確性有極大的幫助。并進(jìn)行實(shí)驗(yàn)分析,由實(shí)驗(yàn)分析可知,提出的方法能夠準(zhǔn)確地對(duì)人力流動(dòng)的區(qū)域進(jìn)行系統(tǒng)的估算。
關(guān)鍵詞: 大數(shù)據(jù)分析; 人力流動(dòng)區(qū)域; 估計(jì)模型仿真; K近鄰非參數(shù)估計(jì)
中圖分類號(hào): TN911?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)24?0074?03
Abstract: In allusion to the estimation problem of human resource flow region under the background of big data, an estimation simulation model based on big data analysis is proposed for human resource flow region. The K?nearest neighbor nonparametric estimation simulation model is introduced to perform standard estimation of human resource flow region under the background of big data. The K value is reserved for calculation to avoid the occurrence of big data interference. The classified nearest neighbor subset generation module is optimized to effectively improve the estimation capability and estimation range, which is of great help to the estimation accuracy of human resource flow region. The experiment was carried out. The experimental analysis results show that the proposed simulation model can perform systematic estimation of human resource flow region accurately.
Keywords: big data analysis; human resource flow region; estimation model simulation; K?nearest neighbor nonparametric estimation
0 引 言
人力資源在區(qū)域內(nèi)流動(dòng)可以推進(jìn)該區(qū)域的經(jīng)濟(jì)發(fā)展以及城市化建設(shè),而人力資源的流動(dòng)過(guò)程又會(huì)產(chǎn)生一定的流動(dòng)副產(chǎn)品[1?2],人力資源的流動(dòng)可以提高區(qū)域勞動(dòng)力以及區(qū)域的文化交融水平,極大地刺激了物質(zhì)文化的各個(gè)領(lǐng)域。所以,需要利用大數(shù)據(jù)分析的方法對(duì)區(qū)域人力資源的流動(dòng)情況進(jìn)行預(yù)計(jì)以及估算[3?4],這樣可以有效地根據(jù)人力資源的流動(dòng)情況進(jìn)行資源的預(yù)計(jì)調(diào)配以及優(yōu)化使用。
在人力資源的流動(dòng)過(guò)程中,人力資源本身是一種資源的數(shù)據(jù)概括量,具有很大的流動(dòng)性以及不確定性。通過(guò)使用大數(shù)據(jù)的分析方法能夠?qū)θ肆Y源的流動(dòng)進(jìn)行屬性定位以及條件限制[5],這樣便可以使用對(duì)應(yīng)的數(shù)據(jù)估算方法進(jìn)行系統(tǒng)的預(yù)算[6?7]。傳統(tǒng)的數(shù)據(jù)模型由于使用過(guò)程中需要對(duì)數(shù)據(jù)采集分量進(jìn)行設(shè)置,所以使用起來(lái)比較復(fù)雜。因此,提出基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型系統(tǒng),使用K近鄰非參數(shù)估計(jì)仿真模型對(duì)人力資源的流動(dòng)進(jìn)行估算,避免了使用數(shù)據(jù)采集分量的可能性。為了檢驗(yàn)本文設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型的有效性,設(shè)計(jì)了對(duì)比仿真試驗(yàn),通過(guò)實(shí)驗(yàn)可以證明,改進(jìn)的估計(jì)仿真模型,能夠有效準(zhǔn)確地對(duì)區(qū)域人力資源的流動(dòng)進(jìn)行估計(jì)。
1 人力流動(dòng)區(qū)域估計(jì)模型設(shè)計(jì)方案
1.1 仿真模型硬件設(shè)置
本文設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型,其硬件設(shè)計(jì)的結(jié)構(gòu)主要有三層,由于人力資源數(shù)據(jù)是一個(gè)非線性序列,設(shè)計(jì)的三層結(jié)構(gòu)可以對(duì)非線性序列進(jìn)行一定的處理計(jì)算。第一層是人力資源大數(shù)據(jù)的采集層,為了減少計(jì)算的復(fù)雜程度,運(yùn)用SIYB采集系統(tǒng);第二層為數(shù)據(jù)運(yùn)算處理層;第三層為數(shù)據(jù)存儲(chǔ)層。除此三層結(jié)構(gòu)以外,仿真模型中還包括電源系統(tǒng)、控制系統(tǒng)、顯示模塊、入錄模塊以及認(rèn)證識(shí)別模塊。設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型結(jié)構(gòu)圖如圖1所示。
1.2 引進(jìn)K近鄰非參數(shù)估計(jì)仿真模型
基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真系統(tǒng)適用于K值近鄰參數(shù)的估算方法,可提高數(shù)據(jù)采集的準(zhǔn)確程度,同時(shí)避免了采集過(guò)程中采集分量設(shè)置。近鄰參數(shù)公式如下:
式中: 為大數(shù)據(jù)的趨勢(shì)度;為大數(shù)據(jù)的采集分量;為采集數(shù)據(jù)的規(guī)模參量;為規(guī)劃數(shù)據(jù)參量;為預(yù)處理的假使參量。通過(guò)近鄰參數(shù)的計(jì)算可以達(dá)到采集數(shù)據(jù)的條件限制,對(duì)大數(shù)據(jù)的參量進(jìn)行估算前還需要對(duì)大數(shù)據(jù)的變量進(jìn)行趨勢(shì)預(yù)測(cè),公式為:
式中:為恒定參數(shù);為高趨勢(shì)的起始量;為高趨勢(shì)的終止量;是大數(shù)據(jù)的突變幾率。經(jīng)過(guò)上述的處理便可以進(jìn)行K值的近鄰非參數(shù)的估算,公式為:
式中:表示數(shù)據(jù)的流動(dòng)變化參量;表示數(shù)據(jù)特征的附屬函數(shù);是限制數(shù)據(jù)的坐標(biāo)參量;表示數(shù)據(jù)預(yù)計(jì)結(jié)果;是數(shù)據(jù)的軸向系數(shù);為數(shù)據(jù)的采集走勢(shì)。endprint
1.3 近鄰子集的優(yōu)化設(shè)計(jì)
為了保證本文設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型計(jì)算的準(zhǔn)確性,優(yōu)化了近鄰子集。近鄰子集是對(duì)數(shù)據(jù)使用條件限制,能夠有效解決數(shù)據(jù)干擾的問(wèn)題,優(yōu)化過(guò)程為:
式中:為殘差序列;為限定誤差修正項(xiàng);反映變量之間的數(shù)位差;是衡量變化大小的參數(shù)。對(duì)近鄰子集的誤差修正為:
式(5)是為大數(shù)據(jù)進(jìn)行一階差分計(jì)算。這樣可以對(duì)人力流動(dòng)的區(qū)域進(jìn)行選集的設(shè)定,引入了修正后的子集時(shí)間,保證計(jì)算的準(zhǔn)確性,公式為:
經(jīng)過(guò)優(yōu)化的鄰近子集滿足時(shí)間條件的限制,能夠提高計(jì)算的準(zhǔn)確性,同時(shí)完善了本文設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型的限定能力。
1.4 構(gòu)建F統(tǒng)計(jì)量
構(gòu)建F統(tǒng)計(jì)量能夠保證仿真模型的估算過(guò)程中不會(huì)受到參數(shù)的過(guò)度限制,這樣有助于本文設(shè)計(jì)的仿真模型的參量計(jì)算,由于大數(shù)據(jù)區(qū)域估算具有一定的隨機(jī)性,因此構(gòu)建了F統(tǒng)計(jì)量。預(yù)處理過(guò)程為:
式中:為F值波動(dòng)起始量;為數(shù)據(jù)的隨機(jī)參量;為模型適應(yīng)參量。若系統(tǒng)模型的數(shù)據(jù)接收量的極限為,則模型接納能力飽和。若為空集,那么模型將無(wú)法計(jì)算。F統(tǒng)計(jì)量集合限定條件為:
對(duì)集合進(jìn)行限定,是保證設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真模型能夠在計(jì)算的過(guò)程中正常運(yùn)行,對(duì)運(yùn)行矩陣進(jìn)行限定是保證數(shù)據(jù)采集準(zhǔn)確性的關(guān)鍵,限定條件為:
式中:為人力流動(dòng)飽和總量;為估計(jì)仿真模型的特征函數(shù);為人力流動(dòng)臨近矩陣;為模型限定參數(shù);為人力流動(dòng)數(shù)據(jù)權(quán)重;為模型調(diào)整參數(shù);為隨機(jī)干擾函數(shù)。
根據(jù)不同情況需要對(duì)計(jì)算參量進(jìn)行調(diào)整,參量變化條件是由決定,參量調(diào)整條件為:
通過(guò)上述的公式調(diào)整能夠保證數(shù)據(jù)的有效性,通過(guò)對(duì)使用條件的限定保證了設(shè)計(jì)的模型能夠正常的運(yùn)作,限定的使用條件保證計(jì)算的準(zhǔn)確性,參量的限定保證了設(shè)計(jì)過(guò)程能夠更加精準(zhǔn)地對(duì)人力流動(dòng)區(qū)域進(jìn)行計(jì)算。
2 仿真模型的實(shí)現(xiàn)
2.1 參數(shù)設(shè)定
根據(jù)上述仿真設(shè)定的參量以及環(huán)境設(shè)定,進(jìn)行實(shí)驗(yàn),結(jié)果分析如下。
2.2 結(jié)果分析
實(shí)驗(yàn)結(jié)果如表1所示。
分析表1結(jié)果得知,本文設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真系統(tǒng),避免了采集分量的限制,能夠通過(guò)大數(shù)據(jù)分析出人力資源的變化趨勢(shì)。
3 結(jié) 語(yǔ)
本文設(shè)計(jì)的基于大數(shù)據(jù)分析的人力流動(dòng)區(qū)域估計(jì)仿真系統(tǒng),引進(jìn)了K近鄰非參數(shù)估計(jì)仿真模型,對(duì)大數(shù)據(jù)背景下的人力流動(dòng)區(qū)域進(jìn)行標(biāo)準(zhǔn)估算,避免大數(shù)據(jù)干擾的發(fā)生,同時(shí)優(yōu)化了分類近鄰子集生成模塊,有效地對(duì)人力流動(dòng)區(qū)域進(jìn)行劃分,保證了人力流動(dòng)區(qū)域的分配更加的完整,解決了傳統(tǒng)估算方法的局限性。通過(guò)實(shí)驗(yàn)的數(shù)據(jù)可以證明本文設(shè)計(jì)的仿真模型能夠準(zhǔn)確的進(jìn)行區(qū)域人力流動(dòng)的估算。
參考文獻(xiàn)
[1] 高昭昇,曹晉軍,馮柳,等.基于大數(shù)據(jù)的傳染病爆發(fā)、預(yù)測(cè)和預(yù)警等應(yīng)用分析[J].中國(guó)衛(wèi)生事業(yè)管理,2016,33(4):270?272.
[2] 王雪蓉,萬(wàn)年紅.基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量動(dòng)態(tài)預(yù)測(cè)模型[J].計(jì)算機(jī)應(yīng)用,2017,37(4):1038?1043.
[3] 朱軼婷,李霖,韓玉巧.基于大數(shù)據(jù)分析的多館制圖書館文獻(xiàn)資源典藏策略研究[J].圖書館工作與研究,2016,1(4):77?82.
[4] 王勇,董恒新.大數(shù)據(jù)背景下中國(guó)季度失業(yè)率的預(yù)測(cè)研究:基于網(wǎng)絡(luò)搜索數(shù)據(jù)的分析[J].系統(tǒng)科學(xué)與數(shù)學(xué),2017,37(2):460?472.
[5] 牛方曲,劉衛(wèi)東.基于互聯(lián)網(wǎng)大數(shù)據(jù)的區(qū)域多層次空間結(jié)構(gòu)分析研究[J].地球信息科學(xué)學(xué)報(bào),2016,18(6):719?726.
[6] 蔣小榮,汪勝蘭.中國(guó)地級(jí)以上城市人口流動(dòng)網(wǎng)絡(luò)研究:基于百度遷徙大數(shù)據(jù)的分析[J].中國(guó)人口科學(xué),2017(2):35?46.
[7] 鄧中亮,張森杰,焦繼超,等.CCF BigData 2015+222基于高精度室內(nèi)位置感知的大數(shù)據(jù)研究與應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2016,36(2):295?300.endprint