● 王淑珍 馬馨蕊
■責編 韓樹杰 Tel:010-68345891 E-mail:hrdhsj@126.com
員工績效是組織成功的關鍵,每一個組織都有自己的績效評估體系。通常,績效評估指標體系包括兩類,一類是硬性指標,是相對客觀的指標,是依據相關業(yè)務的客觀數據進行的評估;另一類是軟性指標,它具有主觀性,是由績效評估者進行評估的。硬性指標最大的特點是便于量化和標準化,可避免主觀人為因素的干擾,其過程和結果都比較客觀公正,而軟性指標的績效評估易于受到評估主體對指標的理解、個體偏好、員工以往績效水平、人際關系等主觀因素的影響。由于軟性績效指標的主觀性,很多情況下員工和管理者都認為績效評估是浪費時間與資源,不能增加組織的價值。有研究顯示,盡管90%以上的組織都開展了正式的績效管理,但只有30%的員工認為績效評估能夠改善他們的績效(Aguinis et al.,2011), 員工常感到績效評估不公平,經常報怨有些人通過非正當渠道獲得高績效的評估結果(Lu et al.,2009)。有些研究提示在軟性指標的評估中,評估者的評估行為常常出現偏差,對績效評估的有效性與公平性的影響不可忽視(陳晶瑛,2009)。
關于績效評估偏差的早期理論是認知評估理論,該理論把績效評估看作一個信息加工的過程。雖然該理論的內容與動機是好的,但該理論把評估者看作是一個被動的信息加工系統,排除了評估者個人的動機,認為即使研究者能夠理解評估者的錯誤和偏差,也無法糾正,任何糾正的嘗試都無法保證不受操控的影響 (Spence et al.,2011)。 由此可見,早期的認知評估理論對如何提高人力資源實踐中評估的信度與效度不僅沒有促進作用,而且還會為持續(xù)存在的評估偏差和低效提供支持。
與認知評估理論不同,Spence等(Spence et al.,2011)認為績效評估者是具有動機、情感及認知局限的個體,他們的情緒、動機與認知能力對績效評估效果產生影響,這一現象被稱為 “有意評估扭曲(Conscious rating distortion)”。 Spence 等認為有意評估扭曲的主要因素包括政治因素、印象管理、寬容評估和動機四類。 Dreher等(Dreher et al.,2001;Woehr et al.,1994)持有相似的觀點,認為績效評估主體的主要偏差包括暈輪效應、寬容評價偏差、集中趨勢、近因效應、第一印象、自我相似性等?,F有的文獻表明,評估者常常存在有意操縱績效評估的行為。
績效管理的學術研究與實踐操作領域已開始嘗試對績效評估主體的行為偏差進行干預與管理,特別是對操縱評估結果的有意評估扭曲現象。一些評估者認為,績效評估的偏差不能歸于他們個人的因素,而是緣于缺乏技術和相應的知識等。有學者研究了培訓績效評估者的作用 (Woehr et al.,1994),但關注的仍然是評估者的認知因素,對于有意評估扭曲現象無任何干預作用。在實踐中,360度評估等多元評估法在一定程度上能減小評估者動機與偏好的影響,但其主觀性卻是不可回避的;強制分布法可用來克服主觀績效評估區(qū)分度不高的缺陷(李飛霞等,2008),但其本身同樣也存在主觀誤差的問題等(龔文等,2011)。
目前,對于績效管理中評估者的評估偏差問題在理論上尚未開展系統性的研究,對如何糾正評估偏差、減少、消除或控制評估者操縱評估的行為研究甚少;在實踐操作上,現有的績效管理實踐對績效評估主體行為的約束力非常有限。因此,該問題已成為績效管理領域亟待解決的問題。本文基于信號檢測理論的分析框架,對績效評估主體的評估有效性進行分析。
信號檢測理論最初應用在通訊工程領域,專門處理噪音背景下對信號進行有效分離的問題。該理論被引入個體心理與行為分析領域后,其基本思想和假設成為分離個體在對信息識別加工中感覺敏感性與反應偏向(或反應標準)兩個過程的分析框架。該理論目前已被用于多個領域,但尚未檢索到應用于績效評估者的行為分析之中。
信號檢測理論將刺激分為“信號加噪音”與“噪音”兩類,將反應分為“有信號”和“無信號”兩類,共同形成個體的四種反應(見表1),當“信號加噪音”條件下反應為“有信號”時為“擊中”;當“信號加噪音”條件下反應為“無信號”時為“漏報”;當“噪音”條件下反應為“有信號”時為“虛報”;當“噪音”條件下反應為“無信號”時為“正確拒斥”。
表1 信號檢測理論中個體的四種反應
信號檢測理論包括兩個指標,一個是感覺辨別力指標d’,即感覺敏感性,該指標不受情緒、期望、動機等因素的影響,d’值不是一個恒定的值,受先驗概率和獎懲辦法而變動。另一個是判斷標準,即個體的反應偏向,常用似然比標準β來衡量。β值隨著信號和噪音的先驗概率和判定結果的獎懲辦法而變動,并受個體的動機、態(tài)度、利害關系等心理因素的影響(郭秀艷,2004)。上述兩個指標的計算公式如下:
d’=Z擊中-Z虛驚
其中,Z擊中和Z虛驚是通過“擊中”和“虛驚”概率,再根據PZO轉換表分別求得“擊中”概率和“虛驚”概率的Z值。一般認為在反應個體非常敏感的情況下,當信號與噪音存在時,常常出現“肯定”,即擊中概率較高,當噪音單獨存在時,評估者很少做出“肯定”,即虛驚概率較低;在評估者鑒別力降低時,“擊中”和“虛驚”概率分布兩者相互接近;在評估者相對不敏感,或刺激相對較弱時,擊中概率下降,而虛驚概率則上升。
β=O擊中/O虛驚
其中,O擊中和 O虛驚是通過“擊中”和“虛驚”概率,再根據PZO轉換表分別求得“擊中”概率和“虛驚”概率的O值。一般認為β大于1時反映個體掌握的標準較嚴,擊中與虛驚的概率均較低;β靠近或等于1時反映個體掌握的標準適中,擊中概率較高,而虛驚概率則較低;β小于1時反映個體掌握的標準較寬松,擊中與虛驚的概率均較高。
基于信號檢測理論的基本思想,將員工的真實績效水平分為高績效和低績效,而績效評估者的評估結果同樣分為高績效和低績效,這樣就形成了一個2×2的矩陣(見表2):客觀的高績效、漏報的績效、虛報的績效、客觀的低績效。
表2 信號檢測理論在績效評估中的支付矩陣
信號檢測理論的辨別力d’和反應偏向β兩個指標用于績效評估主體行為分析時含義如下:
對于辨別力指標d’來說,一般認為在評估者非常敏感的情況下,當高績效者存在時,常常做出“客觀的高績效”的判斷,即擊中概率較高,當低績效者單獨存在時,評估者很少做出“客觀的高績效”的判斷,即虛驚概率較低;在評估者鑒別力降低時,“客觀的高績效”和“虛報的績效”概率分布兩者相互接近;在評估者相對不敏感,員工績效不突出或印象不深刻時,“客觀的高績效”概率下降,而“虛報的績效”概率則上升。
對于反應偏向指標β來說,一般認為β大于1時評估者掌握的績效標準較嚴格,“客觀的高績效”(擊中)與“虛報的績效”(虛驚)的概率均較低;β靠近或等于1時評估者掌握的績效標準適中,“客觀的高績效”概率較高,而“虛報的績效”概率則較低;β小于1時評估者掌握的績效標準較寬松,“客觀的高績效”與“虛報的績效”概率均較高。
假設某一部門有20名員工,有5位經理對員工實施績效評估,評估總分為100分?;谛盘枡z測理論對績效評估者的行為評估需要計算辨別力d’和反應偏向β兩個指標值,具體的計算過程包括以下5個步驟:
第一步:計算每一位員工績效評估的平均分數,確定員工的績效評估結果。5位經理對每一位員工打分的平均分數為該員工的最后評估結果。20位員工的評估平均分數見表3。
第二步:比較每一位經理對員工評估結果與平均分數間的差異,形成評估者的反應矩陣。
績效評估的強制等級分布按照30∶70的比例將員工分為高績效者與一般績效者,按照平均分數,大于等于86分為高績效者,低于86分為一般績效者,即高績效者占30%,一般績效者占70%。當某一經理的評估分數大于等于86分,且該員工的平均數也大于等于86分為擊中;當某一經理的評估分數大于等于86分,而平均數則小于86分為虛驚;當某一經理的評估分數小于86分,而平均數則大于等于86分為漏報;當某一經理的評估分數小于86分,且平均數也小于86分為正確拒斥。以經理E為例,經理E與平均數的比較結果見表4。
第三步:進行PZO轉換,計算該經理的辨別力指標與反應偏向指標。該經理的辨別力指標為:
d’=Z擊中-Z虛驚=0.96–(-0.18)=1.14
通過PZO轉換表,上式中的數值0.96是擊中概率0.83的Z值,上式中的數值-0.18是虛驚概率0.43的Z值。
由計算結果可見,該經理的d’值為1.14,說明該經理的敏感性較低或鑒別力較差,“擊中”概率下降,而“虛驚”概率則上升。
該經理的反應偏向指標為:
β=O擊中/O虛驚=0.25/0.39=0.64
通過PZO轉換表,上式中的數值0.25是擊中概率0.83的O值,上式中的數值0.39是虛驚概率0.43的O值。
由計算結果可見,β小于1,該經理掌握的評估標準比較寬松。
第四步:對不同評估者的辨別力與反應偏向指標進行排序,辨別力按照從大到小的順序依次排列,數值越大,排序越??;反應偏向按照│β-1│的大小依次排序,數值越小,排序越小。按照5位經理的d’值和│β-1│值的大小進行排序(見表5),可以看出鑒別力最高和最低的經理,以及判斷標準最嚴格和最寬松的經理。
第五步:綜合分析不同評估者的辨別力與反應偏向指標的排序,區(qū)分有效評估與無效評估,即兩者相加得分最小者為最有效,得分最大者為最無效,其他依次類推。
表3 20名員工績效評估結果(5位經理評估的平均數)
表4 經理E對員工績效評估與平均數的比較
表5 5位經理評估指標d'值和β值的排序結果
綜合考慮d’值和β值,d’值越大,評估者的敏感性越高,反之敏感性越低,β值越接近1表明判斷標準的松緊越恰當,越大于1表明標準越嚴格,越小于1表明標準越寬松。按照d’值和“β值與1的差值的絕對值(│β-1│)”大小進行排序,表5中的結果顯示,評估最有效的是經理C與經理D,兩者的d’值排序與│β-1│排序之和均為3;評估比較有效的是經理A、經理B與經理E,三者的d’值排序與│β-1│排序之和均為8,因此,三者的評估有效性不及經理C與經理D,評估行為比較有效。
在實際工作中,綜合分析辨別力d’和反應偏向β兩個指標,績效評估主體的行為可根據實際的d’值排序與│β-1│排序之和進行區(qū)分,如果評估主體較多,也可根據實際需要、基于綜合排序的結果將評估主體的評估行為劃分為不同的等級。同時,辨別力d’和反應偏向β兩個指標還能進一步提示每一個評估者的優(yōu)點及有待完善的方面等相關信息,為績效評估者的管理提供比較客觀的依據。
綜上所述,一個設計良好的績效管理體系不僅包括績效考核體系中的一系列指標和操作流程,還應包括對績效評估主體的評估。基于信號檢測理論的績效管理,擴展了績效評估體系的內涵,將績效評估主體的行為評估納入績效評估體系之中,使績效評估主體的行為評估成為績效評估必不可少的組成部分。信號檢測理論視角的績效評估主體的行為評估不僅方法簡便,而且具有指導性、可操作性與鑒別性,能使績效評估真正成為改善員工績效的管理工具與方法。因此,信號檢測理論在管理績效評估主體方面是一個具有潛在應用前景的理論。
本研究是一個理論設想,為了計算過程的簡潔明了,沒有探討當評估主體事先已知評估的概率分布與未知評估的概率分布情況下評估主體評估行為的有效性。今后該領域的研究應當在實踐層面進一步展開,可比較已知與未知評估概率分布條件下實踐中的個體的辨別力d’與反應偏向β兩個指標的變化規(guī)律,或以實證數據驗證該方法的有用性,促進績效評估的公平性與有效性的不斷提高。
1.Aguinis,H.,Joo,H.,Gottfredson,R.K.Why we hate performance management–And why we should love it[J].Business Horizons,2011,54(6):503-507.
2.Dreher,G.,Dougherty,T.Human resource strategy:A behavioral perspective for the general manager[M].McGraw-Hill/Irwin,2001,142-157.
3.Lu,H.,Gu,Q.Performance appraisal:what’s the matter with you?[J].Procedia Earth and Planetary Science 1,2009,(1):1751–1756.
4.Rudolph,C.W.,Wells,C.L.,Weller,M.D.,et al.A meta-analysis of empirical studies of weight-based bias in the workplace[J].Journal of Vocational Behavior,2009,74(1):1–10.
5.Spence,J.R.,Keeping,L.Conscious rating distortion in performance appraisal:A review,commentary,and proposed framework for research [J].Human Resource Management Review,2011,21(2):85–95.
6.Woehr, D.J., Huffcut, A.I. Rater training for performance appraisal:A quantitative review [J].Journal of Occupational and Organizational Psychology,1994,67(3):189–205.
7.陳晶瑛:《績效評估公平性對員工的企業(yè)態(tài)度和工作績效的影響》,載《中國人力資源開發(fā)》,2009年第1期。
8.李飛霞、姚兆銘、喬云霞:《員工主觀性績效評價的部門主導強制分布方法修正》載《經濟管理》,2008年第13期。
9.龔文、陳鍇:《績效評估中的強制分布問題研究》,載《中國人力資源開發(fā)》,2011年第5期。
10.郭秀艷:《實驗心理學》,《人民教育出版社》,2004 版。