摘 要:博弈理論是當代主流經(jīng)濟學發(fā)展最迅速和影響最大的分支學科之一。其中,進化博弈理論由于引入了“進化穩(wěn)定策略”(ESS)的概念,有效解決了博弈雙方有限理性的現(xiàn)實問題,在解釋經(jīng)濟管理現(xiàn)象時更具說服力和生命力。本文結(jié)合人民銀行實際,通過構(gòu)建進化博弈理論的復制動態(tài)模型,試述人民銀行員工激勵路徑的選擇及機制設(shè)計的有關(guān)問題。
關(guān)鍵詞:人民銀行;激勵路徑;機制設(shè)計;進化博弈;分析
中圖分類號:F832.31 文獻標識碼:A 文章編號:1003-9031(2008)03-0013-04
一、引言
博弈理論是當代主流經(jīng)濟學發(fā)展最迅速和影響最大的分支學科之一。經(jīng)典博弈理論的假設(shè)前提是博弈雙方的“完全理性”,然而,完全理性比新古典主義經(jīng)濟學的“理性經(jīng)濟人假設(shè)”所要求的理性程度還要高。完全理性人所具有的“理性的共同知識”要求決策者近乎“全知全能”,這顯然是不現(xiàn)實的,也制約了博弈理論的進一步發(fā)展及應用。20世紀70年代以來,基于進化生物學發(fā)展而來的進化博弈理論引入了“進化穩(wěn)定策略”(Evolutionary Stable Strategy,ESS)的概念,運用有限理性假設(shè)來解釋經(jīng)濟現(xiàn)象,使博弈理論的應用獲得了重大突破。
在有限理性假設(shè)的前提下,進化博弈與生物進化的過程十分相似,同樣內(nèi)含了兩種可能的演化機制——選擇機制(Selection Mechanism)和突變機制(Mutation Mechanism)。主要表現(xiàn)為:一方面,博弈雙方在反復博弈的過程中,往往不會一開始就找到最優(yōu)策略,而是通過不斷學習、模仿,來尋求一個較好的策略,并達到動態(tài)均衡。這意味著均衡是不斷調(diào)整和改進的,而不是一次性選擇的結(jié)果。另一方面,均衡在達到后仍可能由于“突變者”的出現(xiàn)而再次偏離,但最終這部分“突變者”會通過不斷地學習、調(diào)整,恢復到原有的均衡策略上。這意味著均衡在受到干擾后仍具有“自我恢復”的調(diào)節(jié)功能。顯然,進化博弈理論比傳統(tǒng)博弈理論具有更強的現(xiàn)實性和適用性,在解釋經(jīng)濟管理現(xiàn)象時更具生命力和說服力。[1]
近年來,如何進一步完善人民銀行激勵機制建設(shè)已成為各級人民銀行所高度關(guān)注的問題。為此,本文擬用進化博弈的相關(guān)理論及模型試述人民銀行員工激勵路徑的選擇及機制設(shè)計的相關(guān)問題。
二、博弈模型的構(gòu)建
根據(jù)期望理論,一種行為傾向的強度取決于個體對于這種行為可能帶來的結(jié)果的期望強度以及這種結(jié)果對行為者的吸引力。因此,要有效激勵員工,組織必須高度重視針對員工的實際需求而進行差別化激勵的重要性。[2]這既是激勵效用最大化的關(guān)鍵一環(huán),同時也是以人為本原則在激勵機制中的具體體現(xiàn)。結(jié)合人民銀行當前實際,人民銀行員工按崗位性質(zhì)基本可劃分為:管理類、專業(yè)技術(shù)類和工勤技能類。為討論方便,本文僅將側(cè)重專業(yè)技能發(fā)展的員工,即專業(yè)技術(shù)類和工勤技能類員工統(tǒng)稱為專家型人才,而將側(cè)重綜合管理能力提升的員工,統(tǒng)稱為管理型人才,兩類人才群體進行兩兩隨機配對重復博弈。同時作以下分析及假定:
1.鑒于人民銀行員工數(shù)量較多,學習、調(diào)整、向優(yōu)勢策略轉(zhuǎn)變是一個漸進的過程,而不是所有博弈方同時調(diào)整的行為,因此,根據(jù)有限理性進化博弈的類別,其隨機配對的反復博弈適用進化博弈中的復制動態(tài)予以模擬。
2.為達到人盡其材、才盡其用,設(shè)組織為管理型人才和專家型人才構(gòu)建兩條相互平行的職業(yè)發(fā)展通道,運用晉升激勵和薪酬激勵兩種手段,促使管理型人才憑借職位晉升獲取激勵(簡稱晉升激勵,下同),而專家型人才憑借專業(yè)技能的提升獲取以薪酬為主的激勵(簡稱薪酬激勵,下同)。[3]
3.設(shè)晉升激勵的綜合收益為I1; 薪酬激勵的綜合收益為I2。
4.基于有限理性假設(shè)及當前人民銀行員工職業(yè)生涯規(guī)劃尚未建立,故并非每位員工均有能力為自己準確定位并最優(yōu)決策。因此,設(shè)管理型人才及專家型人才“順位發(fā)展”(即選擇適合自己職業(yè)發(fā)展道路)所需付出的成本均為Q1;而“錯位發(fā)展”(即選擇不適合自己的職業(yè)發(fā)展道路)所需付出的成本均為Q2。一般而言,Q1< Q2。
5.結(jié)合人民銀行當前實際,設(shè)博弈雙方皆順位發(fā)展或皆錯位發(fā)展均能成功,即成功的機率均為100%;而一方順位發(fā)展,另一方錯位發(fā)展,由于目標的一致造成職位擠占和競爭加劇,故雙方成功的機率均為50%,如圖1所示。
圖1 博弈雙方的得益矩陣
該博弈的納什均衡取決于I1、I2、Q1、Q2的具體(或相對)取值。
三、博弈模型的復制動態(tài)和進化穩(wěn)定策略
假定在管理型人才這一群體中,選擇“晉升”策略的博弈方比例為x,則選擇“薪酬”策略的博弈方比例為1-x;另假定在專家型人才這一群體中,選擇“薪酬”策略的博弈方比例為y,選擇“晉升”道路的博弈方比例為1-y。則管理型人才中采取“晉升”、“薪酬”兩類策略的博弈方的期望得益U1晉、U1薪和群體平均得益U1分別為:
其中,dx/dt表示:管理型人才中,選擇“晉升”策略的博弈方比例隨時間的變化率,反映管理型人才在經(jīng)歷重復博弈后,對“晉升”策略的學習、調(diào)整速度。該復制動態(tài)方程有兩個不動點,即兩個可能的穩(wěn)定狀態(tài),分別是X* =0和X*=1。
同理可得,對于專家型人才而言,其復制動態(tài)微分方程為:
dx/dt=y(tǒng)(1-y) [(I2-Q1)(1+x)/2-(I1- Q2)(1-x/2)]……(8)
同樣地,dy/dt表示:專家型人才中,選擇“薪酬”策略的博弈方比例隨時間的變化率,反映專家型人才在經(jīng)歷重復博弈后,對“薪酬”策略的學習、調(diào)整速度。該復制動態(tài)方程也有兩個不動點,即兩個可能的穩(wěn)定狀態(tài),分別是Y*=0和Y*=1。
1.x的進化穩(wěn)定性分析
當y>[2(I2-Q2)-(I1-Q1)]/ [(I1-Q1)+(I2-Q2)]時,由微分方程的“穩(wěn)定性定理”及進化穩(wěn)定策略的定義可知,X*=1是管理型人才的進化穩(wěn)定策略(ESS),其相位圖及動態(tài)趨勢如圖2所示。由于動態(tài)方程表示的是管理型人才中選擇“晉升”策略的博弈方比例隨時間的變化率。因此,由圖2可知,在滿足一定條件的情況下,若管理型人才起初都不選擇“晉升”策略,而少數(shù)“變異者”在后續(xù)的博弈中選擇“晉升”策略,則反復博弈最終仍會使管理型人才趨于都選擇“晉升”策略的均衡狀態(tài)。同樣,若管理型人才起初都選擇“晉升”策略,即使有少數(shù)“變異者”在后來的博弈中選擇“薪酬”策略,則反復博弈最終仍會促使管理型人才趨于都選擇“晉升”策略的均衡狀態(tài)。
當y<[2(I2-Q2)-(I1-Q1)]/ [(I1-Q1)+(I2-Q2)]時,X*=0 是管理型人才的進化穩(wěn)定策略(ESS),其相位圖及動態(tài)趨勢如圖3所示。同上分析可知,在滿足前提條件的情況下,無論初始狀態(tài)為何,在經(jīng)歷反復博弈后,管理型人才最終仍會趨向選擇“薪酬”策略的均衡狀態(tài)。
2.y的進化穩(wěn)定性分析
當X>[2(I1-Q2)-(I2-Q1))/[(I2-Q1)+(I1-Q2))時,Y*=1是專家型人才的進化穩(wěn)定策略(ESS),其相位圖及動態(tài)趨勢如圖4所示。同上分析可知,在滿足前提條件的情況下,無論初始狀態(tài)為何,在經(jīng)歷反復博弈后,專家型人才最終仍會趨向選擇“薪酬”策略的均衡狀態(tài)。
當X<[2(I1-Q2)-(I2-Q1)]/[(I2-Q1)+(I1-Q2)]時,Y*=0是專家型人才的進化穩(wěn)定策略(ESS),其相位圖及動態(tài)趨勢如圖5所示。同上分析可知,在滿足前提條件的情況下,無論初始狀態(tài)為何,在經(jīng)歷反復博弈后,專家型人才最終仍會趨向選擇“薪酬”策略的均衡狀態(tài)。
3.綜合穩(wěn)定性分析
進一步地,把上述兩個群體類型比例變化的復制動態(tài)關(guān)系用一個坐標平面圖予以表示,如圖6所示。
運用箭頭法,根據(jù)圖6中箭頭所示方向不難看出,只有X*=0、Y*=0和X*=1、Y*=1是這個博弈真正的進化穩(wěn)定策略(ESS),而其他所有點實質(zhì)上都不是復制動態(tài)中收斂和抗干擾的穩(wěn)定策略。這也就意味著,在經(jīng)歷反復博弈后,隨著學習和模仿行為的發(fā)生,有限理性的博弈雙方會穩(wěn)定在兩種均衡狀態(tài):一是管理型人才選擇“薪酬”策略、同時專家型人才選擇“晉升”策略,對應圖6中的C區(qū)域;二是管理型人才選擇“晉升”策略,同時專家型人才選擇“薪酬”策略,對應圖6中的B區(qū)域。顯然地,前一種均衡狀態(tài)是一種低效的均衡狀態(tài),并不是組織所樂意接受的,因為其違背了人盡其材、才盡其用的初衷,而只有后一種均衡狀態(tài)才是最為理想的狀態(tài)。
四、博弈模型的兩點啟示
1.構(gòu)建雙通道激勵路徑是破解“千軍萬馬同擠獨木橋”困境的有效手段
雖然人民銀行,尤其是各級分支行一直以來均十分重視員工專業(yè)技術(shù)能力的發(fā)展,不斷完善專業(yè)技術(shù)職稱的管理工作。但由于體制上的限制,目前專業(yè)技術(shù)職稱對員工的激勵作用發(fā)揮得仍然不夠充分。主要表現(xiàn)為:一是專業(yè)技術(shù)職稱與行政管理職務交叉并行,而各自均受嚴格的編制限制,既模糊了員工的努力方向,又造成了專業(yè)技術(shù)職稱與職務編制的相互擠占。二是員工專業(yè)技術(shù)能力提升所能獲得的薪酬激勵遠不如職務晉升所能得到的綜合收益。據(jù)不完全測算,在地市中支層級,同樣一個員工,其若具有高級技術(shù)職稱而沒有任何行政職務,則其薪酬僅及中支管理層的60%左右,而且尚未包括晉升為員工所能帶來的其他心理報酬??梢姡钐炱降膬A斜造成了職務晉升成為了“千軍萬馬同擠獨木橋”的目標指向,不利于引導及激勵那些缺乏管理潛質(zhì)但卻具備專業(yè)技術(shù)能力的員工發(fā)揮個人專長,提升專業(yè)技術(shù)能力。
由前述博弈模型可知,若組織為員工構(gòu)建兩條相互平行的激勵路徑,最明顯的一個作用就是可引導員工,在多次重復博弈后,使得博弈的均衡穩(wěn)定狀態(tài)遠離A區(qū)和D區(qū)(A、D區(qū)對應的正好是博弈雙方一方“順位發(fā)展”,而另一方“錯位發(fā)展”的策略),即員工各自選擇發(fā)展道路,而不是相互擠占,無序競爭。
為此,筆者認為,須重新梳理適合人民銀行各專業(yè)、各崗位的技術(shù)能力認定標準,構(gòu)建較目前初、中、高級三級職稱體制更多層級的專業(yè)技術(shù)能力發(fā)展階梯,并賦予其與職務晉升激勵效果相約、以專業(yè)能力為導向的薪酬激勵體系,如借鑒現(xiàn)代薪酬激勵的新模式——寬帶薪酬體系,引導廣大央行員工結(jié)合自身實際情況,塑造“能力型”人格,激發(fā)其“不唯晉職而要盡職”的觀念。[4]
2.合理的機制設(shè)計是減少低效率均衡狀態(tài)發(fā)生概率的關(guān)鍵
當然,從上述博弈模型也可看出,均衡也有可能呈現(xiàn)低效率的狀態(tài),即管理型人才選擇“薪酬”策略,同時專家型人才選擇“晉升”策略。為此,應盡量縮小圖6中C區(qū)域發(fā)生的概率,而增大B區(qū)域發(fā)生的概率,令m→0,q→0,分別得:2(I2-Q2)→(I1-Q1),2(I1-Q2)→(I2-Q1)。其表達的經(jīng)濟含義為:博弈的任何一方一旦“錯位發(fā)展”,則其凈收益僅為“順位發(fā)展”的一半。當滿足此條件的時候,經(jīng)歷多次重復博弈后,博弈模型的均衡狀態(tài)將最大限度地向B區(qū)域傾斜,即管理型人才的絕大部分將選擇“晉升”策略,同時專家型人才的絕大部分也將選擇“薪酬”策略,員工和組織充分實現(xiàn)了人盡其材、才盡其用的理想狀態(tài)。
結(jié)合人民銀行的具體實際,筆者認為,一是引入員工職業(yè)生涯規(guī)劃及管理的有關(guān)技術(shù),使員工充分認識自我、發(fā)展自我??山梃b國外人力資源開發(fā)的成功經(jīng)驗,如德國中央銀行每位員工均參與人才評價中心測評,測評自身能力傾向,明辨自身強弱項,選擇適合自身的職業(yè)發(fā)展方向,而組織為員工的發(fā)展選擇提供必要的指引、輔導和訓練,據(jù)以實現(xiàn)組織和員工的雙贏互利。二是切實增大員工“錯位發(fā)展”的額外成本(Q2-Q1),如在專業(yè)技術(shù)能力等級和薪酬層級獲得較大豐富的前提下,提升各類專業(yè)技術(shù)能力的考量和認定標準,并增大職務晉升時對管理能(潛)力的考量比重等,確保員工將主要精力投入到適合自身能力傾向的事業(yè)上。這樣,既有利于引導員工技能的提升及管理水平的提高,同時也令組織人力資源開發(fā)的效果和管理效能獲得最大化。
參考文獻:
[1] 謝識予.經(jīng)濟博弈論(第二版)[M].上海:復旦大學出版社,2002.
[2] [美]斯蒂芬·P·羅賓斯.組織行為學(第7版)[M].北京:中國人民大學出版社,1999.
[3][4] 何裕鍇.寬帶薪酬 央行激勵機制重塑的現(xiàn)實選擇[J].南方金融,2007,(1).
Game Analysis of Prompting System on Stuff in People’s Bank
HE Yu-kai
(Guangzhou Branch ,The People’s Bank of China, Guangzhou 510120, China)
Abstract: Game Theory is one of the branch disciplines of the fastest developing and the most influencing mainstream economics. Among them, as Evolutionary Game Theory imports the concept of Evolutionary Stable Strategy, effectively settling both sides of Game’s practical problem of finity, it has more persuasion and vitality to explain the phenomena of economy and management.Based on the reality of People's Bank of China , the article discusses something about how to choose the way of stimulating employees and how to design the proper mechanism by constructing Replicator Dynamics Model.
Key Words: People's Bank of China;Way of Stimulating; Design of Mechanism ; Evolutionary Game
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文?!?/p>