[摘要] 人力資源管理系統(tǒng)因其能提高人力資源管理工作效率、提高管理水平、為決策提供信息支持而備受企業(yè)的青睞。通過對決策樹方法用于發(fā)現(xiàn)其中有價值的數(shù)據(jù)模式,尋找其中存在的關系和規(guī)則,以期幫助企業(yè)對這一系統(tǒng)能夠有更全面地認識,促進企業(yè)人力資源管理水平實現(xiàn)跨越式提升。
[關鍵詞] 人力資源管理 信息技術 數(shù)據(jù)挖掘 決策樹分類方法
一、人力資源管理信息化的發(fā)展史
進入21世紀后,市場競爭加劇,企業(yè)生存壓力增大,越來越多的企業(yè)認識到,現(xiàn)代企業(yè)的競爭其實質上就是人才戰(zhàn)略的競爭。因此,企業(yè)對人力資源管理的關注達到了一個空前的程度。同時,人力資源管理在企業(yè)管理中的地位,也被提升到了戰(zhàn)略決策支持的高度。企業(yè)人力資源管理已經經歷了三個發(fā)展階段:人事管理、人力資源管理、人力資源開發(fā)與經營。企業(yè)的人力資源管理正在經歷著從事務性管理角色向戰(zhàn)略合作伙伴的轉型,借助于信息化系統(tǒng),是轉型的必由之路。
隨著人力資源管理思想以及信息化技術的不斷發(fā)展革新,人力資源管理信息化系統(tǒng)也在不斷的發(fā)展和完善。總體而言,我們可以將人力資源管理信息化的發(fā)展歷程劃分為四個階段:基礎計算工具階段、信息數(shù)據(jù)存儲階段、全面業(yè)務管理階段、戰(zhàn)略決策支持階段。而數(shù)據(jù)挖掘技術的產生與應用。第四代的人力資源管理信息化系統(tǒng)除了要繼承前幾代信息化系統(tǒng)的優(yōu)點之外,還必須提供強大的數(shù)據(jù)挖掘和分析功能,并且能夠將分析結果數(shù)據(jù)靈活、多樣、便捷的進行展現(xiàn),以真正做到對企業(yè)經營決策的有力支持。
二、數(shù)據(jù)挖掘技術在人力資源管理系統(tǒng)中的應用
數(shù)據(jù)挖掘(Data Mining),又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn) (Knowledge Discovery In Database,KDD),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡的及有潛在應用價值的信息或模式,它是數(shù)據(jù)庫研究中的一個很有應用價值的新領域,融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學等多個領域的理論和技術。數(shù)據(jù)挖掘是進行數(shù)據(jù)查詢,它能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進信息的傳遞。數(shù)據(jù)挖掘工具能夠對將來的趨勢和行為進行預測,發(fā)現(xiàn)其中有價值的數(shù)據(jù)模式,尋找其中存在的關系和規(guī)則,從而很好地支持人們的決策。
數(shù)據(jù)挖掘可以結合企業(yè)信息化環(huán)境特點,對現(xiàn)代人力資源管理中的主要管理業(yè)務流程進行了優(yōu)化和重組。本文中提出了一種基于數(shù)據(jù)挖掘的信息論的綜合評價方法,該方法中利用決策樹、分類器概念以及相關性分析,先對初選的數(shù)據(jù)進行篩選.再進行建樹,然后進行修剪樹,進而得出了綜合評價模型并同時給出了相應的算法。
決策樹是一個樹形的結構,內部節(jié)點上選用一個屬性進行分割,每個交叉都是分割的一部分;每個葉子節(jié)點表示一個分布。決策樹最基本的生成算法是貪心算法,它采用自上而下而治之的方法。開始時,所有的數(shù)據(jù)都在根節(jié)點,屬性都是種類字段(如果是連續(xù)的,將其離散化),然后所有記錄用所選屬性遞歸的進行分割,屬性的選擇是基于一個啟發(fā)式規(guī)則或者一個統(tǒng)計的度量。當一個節(jié)點上的數(shù)據(jù)都是屬于同一個類別或者沒有屬性可以再由于對數(shù)據(jù)進行分割時,則停止分割并生成一個葉節(jié)點。因此,決策樹的生成關鍵是在每個節(jié)點上分類屬性的選擇。在本例中選擇經典的ID3算法,即利用基于熵的最高信息增益法選擇屬性,信息增益法的簡單介紹如下:
設S是有s個數(shù)據(jù)庫樣本的集合。假定類標號屬性具有m個不同的值,定義m個不同類Ci(I=1,2,…m)。設si是類Ci中的樣本數(shù)。對一個給定的樣本分類所需要的期望信息由下式給出:
其中pi是任意樣本屬于Ci的概率,一般用si/s估計代替pi。
設屬性A有v個不同值{a1,a2,…,ay}??梢愿鶕?jù)屬性值將S劃分為v個子集{s1,s2,…,sv}:sij是子集Sj中類Ci的樣本數(shù)。由A劃分成子集的熵(期望信息)為:
則以A分枝將獲得的信息增益是:
Gain(A)=I(s1,s2,…, sm)-E(A)
在選擇好數(shù)據(jù)挖掘的技術和方法后,下面就要對其建立模型,這是數(shù)據(jù)挖掘的核心環(huán)節(jié)。不同的技術方案產生的結果模型有很大不同,而且模型結果的可理解性也存在較大差異。例如,用決策樹方法產生模型結果就比用神經網(wǎng)絡技術的結果易于理解。另外,對結果的分析和描述(即進行知識發(fā)現(xiàn))也很關鍵,不恰當?shù)拿枋鰰斐烧`導。 通過上面的處理之后,就會得到一系列的分析結果和模式,它們是對目標問題的多側面的描述,這時需要對它們進行驗證和評價,以得到合理的完備的決策信息??梢圆捎玫姆椒ㄓ兄苯邮褂迷瓉斫⒛P偷臉颖緮?shù)據(jù)進行檢驗,或另找一批數(shù)據(jù)對其進行檢驗,也可以在實際運行中取出新鮮數(shù)據(jù)進行檢驗。
這種方法的優(yōu)越性具體體現(xiàn)在:
1.決策樹方法所用時間少,技術上合理,經濟上合算,成效高,可避免決策失誤與各類偏差。
2.它是從實際出發(fā),分析主、客觀條件以及發(fā)展過程中可能發(fā)生的變化及結果的利弊,經過精密的計算和科學的預測后作出的決策。
3.選優(yōu)的條件是不僅有一個合理的科學標準,而且還有一個科學的選擇方法,具有很高的科學性。
三、結束語
數(shù)據(jù)挖掘技術及其應用是目前國際上的一個研究熱點,并在許多行業(yè)中得到了很好的應用,尤其是在市場營銷中獲得了成功,初步體現(xiàn)了其優(yōu)越性和發(fā)展?jié)摿?。在人力資源信息管理領域,綜合應用數(shù)據(jù)挖掘技術和人工智能技術,將是實現(xiàn)人力資源開發(fā)與經營的必經之路。
參考文獻:
[1]鄔錦雯:人力資源管理信息化.清華大學出版社, 2006.3
[2]高翔彭正龍:淺析信息技術下的企業(yè)人力資源管理模式. 經濟與管理, 2003.4
[3]王預:數(shù)據(jù)挖掘的應用研究.中國信息導報, 2007.1
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。