呂亞娟 吳英 杜秋
【摘要】? ? 本論文的研究視角是當(dāng)前比較熱門的高校專業(yè)技術(shù)人員考核問題,針對高校這一特殊的群體,提出了基于apriori算法的關(guān)聯(lián)規(guī)則在專業(yè)技術(shù)人員考核中應(yīng)用方法,為高校校長和決策機(jī)構(gòu)、機(jī)關(guān),提供科學(xué)的決策依據(jù)。
【關(guān)鍵字】? ? apriori算法? ? 高校專業(yè)技術(shù)人員? ? 考核
引言
高校專業(yè)技術(shù)人員考核系統(tǒng),主要包括對專業(yè)技術(shù)人員進(jìn)行年度和任期考核??己耸橇私庹莆諏I(yè)技術(shù)人員情況的一個(gè)重要手段,同時(shí)也是正確實(shí)施獎(jiǎng)懲和選拔使用專業(yè)技術(shù)人員的必要前提。各個(gè)高校每年都要進(jìn)行專業(yè)技術(shù)人員考核工作,該工作的組織與實(shí)施是由學(xué)校人事部門來完成。專業(yè)技術(shù)人員考核的實(shí)施可以對專業(yè)技術(shù)人員的教育、管理工作起到了良好的推進(jìn)作用,同時(shí)也為人事部門提拔使用專業(yè)技術(shù)人員提供了科學(xué)的依據(jù)。從人事干部數(shù)據(jù)庫和職稱考核數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)挖掘,找出專業(yè)技術(shù)人員工作績效與其職稱、學(xué)歷、年齡、學(xué)緣結(jié)構(gòu)、任職經(jīng)歷、工作經(jīng)歷等方面的關(guān)聯(lián)。找到專業(yè)技術(shù)人員成長進(jìn)步和人員整體素質(zhì)的關(guān)系,從而做到合理安排專業(yè)技術(shù)人員,使其始終保持積極向上的工作狀態(tài),為高校校長和決策機(jī)構(gòu)、機(jī)關(guān)提供科學(xué)的決策依據(jù)。
一、apriori關(guān)聯(lián)規(guī)則算法
在算法的選擇方面,因?yàn)槲覀円獜娜耸赂刹繑?shù)據(jù)庫和職稱考核數(shù)據(jù)庫中挖掘出專業(yè)技術(shù)人員工作績效與干部屬性的關(guān)聯(lián)性,所以應(yīng)該選用關(guān)聯(lián)規(guī)則算法。典型的關(guān)聯(lián)規(guī)則挖掘算法是R.Agralwal等人提出的apriori算法,它有效解決了傳統(tǒng)關(guān)聯(lián)規(guī)則算法中候選項(xiàng)目集大、計(jì)算量大等問題,現(xiàn)行的關(guān)聯(lián)規(guī)則算法大多是以apriori為核心,或是其變體,或是其擴(kuò)展[1]。但是,因?yàn)閍priori算法在挖掘過程中需要多次掃描數(shù)據(jù)庫,還是會(huì)產(chǎn)生大量的候選項(xiàng)目集,針對專業(yè)技術(shù)人員考核的特殊性,提出apriori算法在專業(yè)技術(shù)人員考核中應(yīng)用的改進(jìn)算法。
二、apriori關(guān)聯(lián)規(guī)則算法及其在人員考核系統(tǒng)中的改進(jìn)
Apriori關(guān)聯(lián)規(guī)則算法采用apriori-gen函數(shù)產(chǎn)生候選集的方法大大減少了候選項(xiàng)目集的數(shù)量,減少了關(guān)聯(lián)規(guī)則挖掘的計(jì)算量,極大地提高了數(shù)據(jù)挖掘的效率,但是對于海量的挖掘數(shù)據(jù)來說,apriori關(guān)聯(lián)規(guī)則算法所帶來的計(jì)算量也是驚人的,特別是當(dāng)事務(wù)和候選項(xiàng)集的數(shù)目非常大時(shí),這種計(jì)算方法還是非常昂貴的,例如:假設(shè)算法得到的1項(xiàng)頻繁集的數(shù)量是104,則根據(jù)apriori算法將會(huì)產(chǎn)生107個(gè)2項(xiàng)候選集,由于2項(xiàng)候選集沒有剪枝,所以所有這些候選集都需要校驗(yàn),由此帶來的計(jì)算量是驚人的。Apriori算法在大量候選集產(chǎn)生的情況下基本很難運(yùn)行。
將apriori關(guān)聯(lián)規(guī)則算法應(yīng)用到高校專業(yè)技術(shù)人員考核系統(tǒng)中的目標(biāo)是找出專業(yè)技術(shù)人員工作績效與人員的職稱、學(xué)歷、年齡、學(xué)緣結(jié)構(gòu)、任職經(jīng)歷等方面的關(guān)聯(lián)。如果將apriori算法簡單地應(yīng)用到這些關(guān)聯(lián)規(guī)則的挖掘上面,不僅給挖掘工作帶來了驚人的計(jì)算量,并且將會(huì)產(chǎn)生很多我們不想關(guān)注的關(guān)聯(lián)規(guī)則,例如:
三、結(jié)論
改進(jìn)后的apriori算法之所以能夠大大減少關(guān)聯(lián)規(guī)則挖掘的計(jì)算量,在于它極大地減少了候選頻繁項(xiàng)集的數(shù)量,也就是將大量我們并不想關(guān)注的頻繁項(xiàng)集忽略掉,而只考慮我們關(guān)注的頻繁項(xiàng)集。因?yàn)槲覀円页鰧I(yè)技術(shù)人員工作績效與人員的職稱、學(xué)歷、年齡、學(xué)緣結(jié)構(gòu)、任職經(jīng)歷等方面的關(guān)聯(lián),所以在候選集以及頻繁項(xiàng)集的生成過程中將考核成績項(xiàng)it作為所有頻繁項(xiàng)集和候選集(除1-項(xiàng)集以外)的子集。下面我們將結(jié)合人員管理數(shù)據(jù)庫使用apriori關(guān)聯(lián)規(guī)則的改進(jìn)算法對高校專業(yè)技術(shù)人員考核系統(tǒng)進(jìn)行關(guān)聯(lián)規(guī)則分析。
參? 考? 文? 獻(xiàn)
[1] (美)Olivia Parr Rud著.朱楊勇等譯.數(shù)據(jù)挖掘?qū)嵺`[M].北京:機(jī)械工業(yè)出版社,2003.
[2] 蔣孝明. 基于LINQ的人事檔案管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 計(jì)算機(jī)與現(xiàn)代化. 2014(03)
[3] 邱瑾,吳丹.協(xié)同信息檢索用戶行為研究方法綜述[J].信息資源管理學(xué)報(bào),2012,(01): 74-81,97.
[4]王培吉,趙玉琳,呂劍峰.基Apriori算法的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘研究[J]. 統(tǒng)計(jì)與決策. 2011(23)