高秀艷+郝艷榮
摘 要 在互聯(lián)網(wǎng)與云計(jì)算高速發(fā)展的今天,大數(shù)據(jù)技術(shù)正以其在數(shù)據(jù)收集與處理上的優(yōu)越性引領(lǐng)著新一輪的信息變革。在高校畢業(yè)生就業(yè)情況調(diào)查中,采用就業(yè)質(zhì)量系數(shù)作為評(píng)價(jià)標(biāo)準(zhǔn),使用大數(shù)據(jù)的數(shù)據(jù)挖掘等技術(shù),從海量調(diào)查樣本中獲取有效數(shù)據(jù),建立模型并對(duì)數(shù)據(jù)進(jìn)行分析處理,從而得到合理的就業(yè)效果反饋。
關(guān)鍵詞 大數(shù)據(jù);高校畢業(yè)生;就業(yè)質(zhì)量系數(shù)
中圖分類(lèi)號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2017)184-0065-02
1 大數(shù)據(jù)技術(shù)
1.1 大數(shù)據(jù)的概念與特點(diǎn)
“大數(shù)據(jù)”(big data)的概念始于20世紀(jì)80年代,如今已被人熟知并成為一項(xiàng)熱門(mén)技術(shù)而深得學(xué)術(shù)界、IT行業(yè)以及政府的重視。目前對(duì)于“大數(shù)據(jù)”,普遍認(rèn)可的是維基百科給出的如下概念:大數(shù)據(jù)指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營(yíng)決策目的的資訊[1-2]。
通常,大數(shù)據(jù)具有“4V”特征,即:規(guī)模大(volume)、種類(lèi)多(variety)、流動(dòng)速度快(velocity)、價(jià)值密度低(value)?;诖髷?shù)據(jù)的以上特點(diǎn),其核心的操作在于如何從海量數(shù)據(jù)中提取有價(jià)值的部分,通過(guò)特定的數(shù)據(jù)處理算法,建立符合實(shí)際要求的數(shù)據(jù)模型,進(jìn)而通過(guò)模型對(duì)數(shù)據(jù)樣本進(jìn)行分析處理得到有實(shí)際使用價(jià)值的結(jié)論。
1.2 大數(shù)據(jù)的相關(guān)處理技術(shù)
在信息爆炸的自媒體時(shí)代,數(shù)據(jù)來(lái)源廣,數(shù)量多,這就導(dǎo)致了大數(shù)據(jù)的絕對(duì)數(shù)據(jù)與有用信息量不成比例增長(zhǎng),因此在實(shí)際使用互聯(lián)網(wǎng)大數(shù)據(jù)時(shí),對(duì)數(shù)據(jù)的處理才是關(guān)鍵。當(dāng)今大數(shù)據(jù)的主要處理技術(shù)主要有以下幾種[ 3 ]。
1.2.1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術(shù)旨在對(duì)數(shù)據(jù)進(jìn)行有效處理,目的是從海量數(shù)據(jù)中通過(guò)去噪、轉(zhuǎn)換、凈化、挖掘提取等過(guò)程篩選出有價(jià)值的部分。在處理過(guò)程中經(jīng)常借助多處理階段模型、機(jī)器學(xué)習(xí)、支持向量機(jī)等算法。
1.2.2 遺傳算法
遺傳算法是借鑒了達(dá)爾文生物進(jìn)化論的一種獲得最優(yōu)解的算法。其基本思想是從給定的候選解中,使用根據(jù)適應(yīng)條件計(jì)算出的適應(yīng)度對(duì)其進(jìn)行遞歸淘汰,直至得到最優(yōu)解。遺傳算法是對(duì)大量數(shù)據(jù)進(jìn)行篩選提取有用信息的重要手段。
1.2.3 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是源自于生物神經(jīng)結(jié)構(gòu)及運(yùn)作方式的數(shù)據(jù)處理模型。在神經(jīng)網(wǎng)絡(luò)的工具中,較為常用的是NeuroSolutions,其良好的網(wǎng)絡(luò)設(shè)計(jì)界面,先進(jìn)的學(xué)習(xí)程序以及優(yōu)化的遺傳算法,在快捷、有效地實(shí)現(xiàn)信息獲取方面發(fā)揮了重要作用。
2 大數(shù)據(jù)技術(shù)在就業(yè)質(zhì)量評(píng)價(jià)體系中的應(yīng)用
2.1 就業(yè)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)建立
目前,各教育相關(guān)機(jī)構(gòu)及高校在就業(yè)質(zhì)量評(píng)價(jià)方面都已做出了大量研究,并建立了自己的就業(yè)質(zhì)量評(píng)價(jià)體系,這些評(píng)價(jià)體系所依據(jù)的數(shù)據(jù)往往是調(diào)查所得到的絕對(duì)數(shù)據(jù),因此所得到的評(píng)價(jià)體系其應(yīng)用的可拓展性受到限制。就業(yè)質(zhì)量系數(shù)的計(jì)算解決了不同區(qū)域、不同等級(jí)、不同專(zhuān)業(yè)、不同年份調(diào)查結(jié)果的差異帶來(lái)的評(píng)價(jià)體系不準(zhǔn)確的問(wèn)題。通過(guò)分析畢業(yè)生就業(yè)崗位與專(zhuān)業(yè)的關(guān)聯(lián)程度、就業(yè)區(qū)域、就業(yè)薪資、以及薪資與當(dāng)?shù)仄骄べY的關(guān)系,并根據(jù)以上數(shù)據(jù)計(jì)算出的就業(yè)質(zhì)量系數(shù)可以更全面的反應(yīng)畢業(yè)生就業(yè)情況,從而使就業(yè)評(píng)價(jià)更準(zhǔn)確。畢業(yè)生的就業(yè)質(zhì)量系數(shù)的計(jì)算基于以下元素。
2.1.1 崗位專(zhuān)業(yè)相關(guān)度(Z)
對(duì)于畢業(yè)生調(diào)查反饋中的專(zhuān)業(yè)相關(guān)度,根據(jù)非常相關(guān)、一般相關(guān)、不相關(guān)確定Z的值。
2.1.2 就業(yè)區(qū)域系數(shù)(D)
根據(jù)畢業(yè)生工作所在地為一線城市、二線城市、三線城市、四線城市或其他,確定其就業(yè)區(qū)域系數(shù)D的取值。
2.1.3 薪資系數(shù)(S)
由于畢業(yè)生所在地域經(jīng)濟(jì)條件差距較大,且不同年份的經(jīng)濟(jì)水平也不一致,因此單純的比較其畢業(yè)薪資并不具備良好的說(shuō)服力。參考畢業(yè)生所在城市的區(qū)域系數(shù)D,用畢業(yè)生薪資St與該等級(jí)區(qū)域當(dāng)年的平均工資Sa的比值作為薪資系數(shù)S,即S=St/Sa。
2.1.4 就業(yè)質(zhì)量系數(shù)(J)
根據(jù)評(píng)價(jià)目的和學(xué)校及專(zhuān)業(yè)實(shí)際情況,確定以上各元素在就業(yè)質(zhì)量系數(shù)中所占的比重權(quán)值,計(jì)算最終的就業(yè)質(zhì)量系數(shù)如下:
J=Z*Wz+S*Ws
2.2 使用大數(shù)據(jù)技術(shù)對(duì)就業(yè)反饋數(shù)據(jù)進(jìn)行有效處理
在得到的畢業(yè)生就業(yè)反饋信息中,首要的是篩選出有效數(shù)據(jù),盡可能減少冗余數(shù)據(jù)的干擾,從而使分析結(jié)果更準(zhǔn)確。采用數(shù)據(jù)挖掘中的多處理階段模型可以實(shí)現(xiàn)信息的初步處理[ 4 ]。處理過(guò)程如圖1所示。
在對(duì)數(shù)據(jù)的處理過(guò)程中,正確的模型選取對(duì)結(jié)果有著重要的作用,因此,在對(duì)模型的訓(xùn)練過(guò)程中應(yīng)確保訓(xùn)練數(shù)據(jù)的科學(xué)性及有效性。同時(shí),對(duì)于不同的系數(shù),可以選取不同的訓(xùn)練樣本及不同的訓(xùn)練模型。
3 大數(shù)據(jù)處理過(guò)程中的挑戰(zhàn)與困難
大數(shù)據(jù)及相關(guān)技術(shù)為當(dāng)前的各項(xiàng)工作帶來(lái)了方便,也提高了信息的傳播與利用效率,但在使用過(guò)程中仍然面臨著各種挑戰(zhàn)與困難,具體表現(xiàn)在以下方面。
1)對(duì)硬件設(shè)備的挑戰(zhàn):由于大數(shù)據(jù)的信息量大,其對(duì)硬件設(shè)備尤其是存儲(chǔ)設(shè)備提出了更高的要求,其存儲(chǔ)容量及讀取速度都對(duì)大數(shù)據(jù)的應(yīng)用效果有著至關(guān)重要的影響。
2)對(duì)軟件的挑戰(zhàn):鑒于龐大的信息量,在信息處理過(guò)程中,數(shù)據(jù)算法的選取、模型的構(gòu)建以及數(shù)據(jù)處理軟件的速度都是影響計(jì)算結(jié)果的關(guān)鍵因素。
3)數(shù)據(jù)安全的挑戰(zhàn):由于大數(shù)據(jù)廣泛存在于云存儲(chǔ)設(shè)備上,信息傳播快,另一方面,數(shù)據(jù)價(jià)值密度低導(dǎo)致大量數(shù)據(jù)被隨意丟棄,這都對(duì)數(shù)據(jù)安全造成了潛在的危險(xiǎn)。因此,如何在充分利用大數(shù)據(jù)的同時(shí)保證數(shù)據(jù)的安全也是對(duì)大數(shù)據(jù)應(yīng)用的挑戰(zhàn)。
4 結(jié)論
在高校教育工作中,有效的就業(yè)調(diào)查反饋及對(duì)反饋數(shù)據(jù)的合理、準(zhǔn)確分析,并使用大數(shù)據(jù)及相關(guān)算法,采取適合評(píng)價(jià)目標(biāo)的算法模型,基于此獲得有參考價(jià)值的就業(yè)質(zhì)量評(píng)價(jià)系數(shù),不僅能對(duì)高校的就業(yè)工作起到有效的指導(dǎo)作用,還可對(duì)高校的專(zhuān)業(yè)設(shè)置、課程開(kāi)設(shè)、教學(xué)質(zhì)量及就業(yè)服務(wù)等方面做出合理正確的反饋,從而促使高校針對(duì)問(wèn)題采取策略,不斷提高辦學(xué)水平。
參考文獻(xiàn)
[1]甘曉,李國(guó)杰.大數(shù)據(jù)成為信息科技新關(guān)注點(diǎn)[N].中國(guó)科學(xué)報(bào),2012-06-27.
[2]李國(guó)杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通信,2012,8(9):8-15.
[3]尚光龍,張澤鋒.大數(shù)據(jù)技術(shù)在信息管理中的應(yīng)用[J].河北北方學(xué)院學(xué)報(bào),2016,5(5):30-34.
[4]張敏.云計(jì)算環(huán)境下的并行數(shù)據(jù)挖掘策略研究[D].南京:南京郵電大學(xué),2011.