李素文
摘要:行為經濟學的禮物交換博弈、信任博弈的試驗實證結果及囚徒困境博弈的理論分析揭示了收入分配規(guī)則對人類行為進行規(guī)范的基礎:建立公平正義的收入分配規(guī)則是人類本性的要求,否則的話會制約人類的合作傾向,非帕累托效率將取代帕累托效率。具體到現實經濟中對“做大蛋糕”與“分好蛋糕”的不休爭論,我們認為要“做大蛋糕”,必須堅持先“分好蛋糕”的原則。
關鍵詞:收入分配規(guī)則禮物交換博弈信任博弈囚徒困境
中圖分類號:F019 文獻標識碼:A
經濟學建立在功利主義的哲學基礎之上,功利主義大師John S. Mill認為:“功利主義要求,行為者在他自己的幸福與他人的幸福之間,應當像一個公正無私的仁慈的旁觀者那樣,做到嚴格的不偏不倚。功利主義倫理學的全部精神,可見之于拿撤勒的耶穌所說的為人準則?!核?,施于人,‘愛鄰如愛己,構成了功利主義道德的完美理想。”(2008)[1](p17)
依照功利主義,只有兩個假設成立,分配才不會影響效率:首先,物質和精神資源在整個社會是極其豐富且分布均勻,人們對資源能各取所需;其次,由于所有人對資源能各取所需,故人們不在乎分配差別,更對如何制定分配規(guī)則和規(guī)則的具體內容不關心。但實際現實情況是,物質和精神資源永遠都是稀缺和分布不均的,因此人們必定會將其在社會生產中付出的努力和貢獻與資源的分配比例進行對比,即會表現出對分配規(guī)則是否公平的強烈關注;并且,還會根據不同的分配規(guī)則不斷調整其在社會生產中的努力和貢獻。也就是說,分配規(guī)則自始至終影響生產效率。禮物博弈和信任博弈這兩個行為經濟學的經典實驗實證了這個結論。我們還可以由行為經濟學所實證的人們的社會性公平偏好推導出囚徒博弈的合作解,并由此走出囚徒困境,實現社會的帕累托效率。文章最后給出了政策建議:建立公平正義的收入分配規(guī)則是人類本性的要求,否則的話會制約人類的合作傾向,非帕累托效率將取代帕累托效率;故在經濟發(fā)展中,我們認為要“做大蛋糕”,必須堅持先“分好蛋糕”的原則
一、禮物交換博弈試驗及其模型化
1.禮物交換博弈試驗
諾貝爾經濟學獎獲得者Akerlof作為行為經濟學的領軍人物,最先開展了禮物交換博弈實驗(1982)[2],瑞士的Fehr等也先后設計了系列試驗(Fehr, Kirchsteiger and Reidl, 1993;Fehr, Gachter and Kirchsteiger, 1997;Fehr and Gachter, 2000;Falk, Fehr and Fischbacher,2003)[3—6]進行檢驗。
該系列實驗中,首先公司作為提議者給予不變工資W,且W處于[W1,W2]區(qū)間。如果作為職員的接受者不予接受的話,則兩方收益均為零;如果作為職員的接受者愿意接受這個工資條件的話,則他要付出一定的工作努力度e,且e處于[e1,e2]區(qū)間,如果再假定職員工作努力度e的邊際生產率為i、職員工作努力度e的成本為c(e)的話,v1=ie—W構成公司的收益,v2=W—c(e)則為職員的收益。由于純粹自利偏好為新古典經濟學的基本假設,面對不變工資W,職員付出最低工作努力度e1才符合這一假設,按照新古典博弈理論的逆向推導,公司給予最低工資W1為其最優(yōu)選擇。也就是說,根據新古典經濟學的基本假設在理論上得出的結論是,職員工作努力程度e與公司給予的不變工資W間不具有相關性。
然而,Akerlof和Fehr等人的長期行為經濟學試驗都表明:作為提議者的公司付給的工資均高于W1,處于[W1,W2]之間,而作為接受者的職員的工作努力程度也均高于e1,處于[e1,e2]之間。聲譽模型是否能解釋這個結果呢?對此Akerlof和Fehr等人進行了篩除,因為他們在試驗中作了特別規(guī)定:作為提議者的公司與作為接受者的職員之間既不能訂立長久雇傭合同,公司也不能要求職員向其提供個人方面的詳細信息,故作為聲譽博弈的基礎重復博弈在禮物交換實驗中被剔除了,聲譽模型不適合用來解釋以上實驗結果。這種主動給予更高工資和主動付出更多努力的行為現象的原因,人們具有公平偏好是更有力的解釋。并且此處的公平偏好特指收入分配規(guī)則公平偏好。由于收入分配的大小是職員所看重的,且在公司里職員收入分配的大小主要通過工資的高低來反映,故工資的高低必然影響職員的工作努力程度,一般來說,職員工作的高努力程度是與高工資相對應的;另一方面,公司管理層也知道人們具有收入分配規(guī)則公平偏好,故一開始就給予較高工資待遇以激勵職員努力工作。
因此,公司給予的更高工資將促使職員在生產中付出更大的努力程度,這必然導致經濟效率的提高,否則將降低經濟效率。收入分配規(guī)則公平對經濟效率的影響通過生產函數表現出來。
2.模型化禮物博弈試驗
葛新權、王國成(2007)[7](p40—51) 根據Holmstrom和Milgrom(1987)[8]建立的經典委托代理模型所得到的委托人期望收益公式為起點,模型化了禮物博弈試驗。首先令:
(1)
上式中,委托人的期望收益為 ,代理人的最低工資用 表示,其成本系數用 表示,并且假設 (其中, 為代理人的努力程度, 為努力成本),其絕對風險規(guī)避度用 表示,并且假定 〉0, 是隨機變量方差,為正態(tài)分布。
假定公平互惠偏好均是代理人和委托人的行為動機。即相對于新古典經濟學理性假定的最優(yōu)努力程度,代理人在生產中所付出的努力會更大,設其差額為e*;并且,代理人從委托人處得到的不變工資比在原經典模型中要高,若設x為其差額,那么 +z( )為代理人的不變工資。這是互惠公平偏好假設下的行為,委托人給予代理人的互惠公平大小由x反映,與之相應,代理人既然從委托人處得到了恩惠,也會對等給予委托人較大的互惠回報,即 。設w為在原經典模型中委托人確定的最優(yōu)不變工資,可推導出:
(2)
其中,代理人的績效工資因子為 ,代理人的風險支出為 ,其含義為代理人要得到不變工資必須在總產出中少得到 大小的份額,即 等同于代理人支付保險的費用。據此可推導出:
(3)
因為僅僅假設代理人不變收入被委托人改變,故績效工資因子與原模型相比沒有變化,同為:
(4)
將(4)式引入(3)式后化簡為:
(5)
當z
(6)
在(6)中對x微分,得最大化條件:
(7)
化簡為:
(8)
因為x>z,所以可計算出委托人的最大期望收益是:
(9)
當>z時,Ev* > Ev,這說明委托人與原經典模型中最優(yōu)狀態(tài)下所得相比,獲得了更大的期望收益,其原因在于委托人和代理人的行為都具有公平互惠偏好。
所以,在x >0,z >0時,如果代理人和委托人都立足于互惠公平而簽訂報酬合同的話,他們的收益都將比在原經典模型里更高。故立足于收入分配規(guī)則公平的報酬合同改善了整體經濟效率。
二、走出囚徒博弈困境
1.從囚徒博弈到信任博弈
新古典博弈論的看法是,個人理性與團體理性是普遍存在矛盾的,即個體如果都按自身利益最大化的原則決策的話,不但結果會偏離自身的最大利益得到較小的利益,還會導致整個團體利益的減少而遠遠偏離最優(yōu)狀態(tài),廣為人知的囚徒博弈困境中的納什均衡就是對這種情形的描述:
圖1囚徒博弈
圖1所示的支付矩陣清楚表明了囚徒們的困境。如果兩個囚徒選擇合作的話,他們的收益將是8,這是他們的最優(yōu)選擇。但由于信任不可置信,他們的占優(yōu)戰(zhàn)略是背叛,(背叛,背叛)成為納什均衡解,他們的占優(yōu)戰(zhàn)略給他們帶來的收益是4,明顯比8的收益低,處于無效率狀態(tài)。這種立足于新古典經濟學的理性假設而純粹從理論上推導出的囚徒困境普遍存在于現實社會中嗎?也就是說,“信任是不可置信的”普遍存在于現實社會中嗎?為得到實際答案,行為經濟學家們進行了系列信任博弈實驗。
Camerer和Weigelt(1988)[9]最先設計了試驗,之后Berg、Dickhaut和McCabe(1995)[10],Van Huyck、Battalio和Walters (1995)[11],Ortmann、Fitzgerald和Boeing (2000)[12]等也開展了廣泛、長期的行為實驗,他們的結論基本相同。
在此系列試驗中,主持人無償地將W美元贈送給第一順序受惠人,之后由第一順序受惠人選擇是否從W美元中分出L美元經主持人再無償贈送給第二順序受惠人。如果第一順序受惠人愿意分出L美元的話,則主持人把第一順序受惠人分出的L美元擴大N(2 這種單次進行的信任博弈完全再現了囚徒困境博弈的情形,按照新古典博弈理論推導,第二順序受惠人將N*L美元完全占有為其占優(yōu)戰(zhàn)略,由于預知到第二順序受惠人的這一占優(yōu)戰(zhàn)略,第一順序受惠人完全獨占W美元也構成其占優(yōu)戰(zhàn)略,故(背叛,背叛)同樣是他們之間的納什均衡。但廣泛、長期的試驗結果卻是,絕大部分第一順序受惠人并未獨占W美元而是分出了L美元贈送給第二順序受惠人,絕大部分第二順序受惠人也未完全占有N*L美元而是從中分出了R美元回贈給第一順序受惠人,并且L與R之間表現出明顯的正相關。囚徒困境的納什均衡(背叛,背叛)在系列實驗中極少出現,絕大部分第一順序受惠人與第二順序受惠人的均衡戰(zhàn)略為(合作,合作)。 人們的行為動機是完全自利的還是具有公平偏好,成為純粹理論推導和實際試驗結果大相徑庭的根本原因。正是由于人們具有公平互惠偏好,追求收入分配規(guī)則公平,第二順序受惠人才會增加回贈來報答第一順序受惠人的贈與,而第一順序受惠人也將心比心地預測到了第二順序受惠人的回贈選擇,故一開始就會給予較高的贈與份額。 如果將囚徒困境博弈和信任博弈雙方決策時所面臨的糾結進行對比的話,那么囚徒困境博弈將等同于信任博弈:作為囚徒困境中的第一行為者,與信任博弈中的第一順序受惠人在決策時面臨著同樣的糾結,即如果其選擇合作的話就有可能失去所有收益,而信任博弈中的第一順序受惠人如果選擇分出L美元的話也有可能失去L美元;既然兩個博弈中第一行為者面臨的糾結都是一樣的,那么他們的行為在統計學意義上就不應該有差別;也就是說,在實際的信任博弈中絕大部分第一順序受惠人相信第二順序受惠人會采取合作作為回報,并且絕大部分第二順序受惠人也確實采取合作回贈了第一順序受惠人,那么囚徒困境中的第一行為者也應該相信第二行為者會選擇合作作為回報,那么第二行為者在實際試驗中也確實會選擇合作戰(zhàn)略。有關囚徒困境的經驗數據證實了這一推測,著名行為經濟學家Thaler對其多次試驗進行了總結:“即使是在單次博弈和重復博弈的最后階段,當合作不再是自利人的最佳理性選擇時,合作的概率也不會降到零?!保?007)[13](p13) 如果在囚徒博弈中將公平互惠假設代替狹隘的自利假設,即便從理論上純粹推導,納什均衡解還會是(背叛,背叛)嗎? 2.囚徒博弈的合作解 行為經濟學已經證實,公平感本身就能直接提高或降低博弈者的效用水平(Rabin,1993;Fehr and Schmidt,1999;Henrich,Boyd,Bowles et al.,2001;Dominique,Fischbacher,Treyer et al.,2004)[14—17]。因此,對囚徒博弈中的兩個行為者我們可作這樣的設定:(1)如果一方選擇背叛而對方卻以合作為策略的話,則選擇背叛的一方會因良心不安而降低其效用;(2)始終堅持合作的一方會由于自己道德的高尚而深懷自豪感,這能提高其效用。
先列出第一個假定下的囚徒博弈支付矩陣:
圖2囚徒博弈的合作解(1)
在以上的博弈矩陣中,行為者由于背叛而導致的良心不安減少的效用用Y表示,假設Y能大到比2還大的話,其因背叛而在物質方面提高的效用會被由于良心不安而導致的精神方面的負效用而抵減,這時合作成其占優(yōu)戰(zhàn)略,(合作,合作)構成納什均衡,囚徒們走出了困境,大大提高了整體效率。
再列出后一個假定下的囚徒博弈支付矩陣:
圖3囚徒博弈的合作解(2)
在以上的博弈矩陣中,行為者由于自己道德高尚而深懷自豪感所增加的效用用Y表示,與前一樣,假設Y能大到比2還大的話,則其因另一方背叛而在物質方面降低的效用會被自己道德高尚深懷自豪感而在精神方面提高的效用所補償,這時合作也會成其占優(yōu)戰(zhàn)略,(合作,合作)同樣構成納什均衡,囚徒們同樣走出了困境,大大提高了整體效率。
三、結論
禮物交換博弈、信任博弈的試驗實證結果及囚徒困境博弈的理論分析揭示了收入分配規(guī)則對人類行為進行規(guī)范的基礎:建立公平正義的收入分配規(guī)則是人類本性的要求,否則的話會制約人類的合作傾向,非帕累托效率將取代帕累托效率。
具體到我們現實經濟中對“做大蛋糕”與“分好蛋糕”的不休爭論,“做大蛋糕”無疑是個效率問題,而“分好蛋糕”則首先涉及按什么標準分的問題,即收入分配規(guī)則的問題,從我們以上的理論分析可知,收入分配規(guī)則決定效率,也即只有“分好蛋糕”才能“做大蛋糕”。并且,從我們改革開放的歷史來看,農村經濟體制改革正是采用“包產到戶”這種分配規(guī)則,解決了怎樣分配蛋糕才能使廣大農民滿意的問題,才做大了我國農村經濟的這塊蛋糕,促進了農村經濟的發(fā)展。故無論是理論的邏輯還是歷史的邏輯,我們要“做大蛋糕”,必須堅持先“分好蛋糕”的原則。
參考文獻:
[1][英]約翰·穆勒著. 徐大建譯. 功利主義[M]. 上海:上海世紀出版集團,2008.
[2]Akerlof, George. Labor Contracts as Partial Gift Exchange[J]. Quarterly Journal of Economics,1982,97: 543—569.
[3]Fehr, Ernst, Georg Kirchsteiger, and Arno Reidl. Does Fairness Prevent Market Clearing?An Experimental Investigation[J]. Quarterly Journal of Economics,1993,108: 437—460.
[4]Fehr, Ernst, Simon Gachter,and Georg Kirchsteiger. Reciprocity as a contract enforcement device[J]. Econometrica,1997,65: 833—860.
[5]Fehr, Ernst, and Simon Gachter. Fairness and Retaliation:The Economics of Reciprocity[J]. Journal of Economic Perspectives,2000,14: 159—181.
[6]Falk, Armin, Ernst Fehr, and Urs Fischbacher. On the Nature of Fair Behavior[J]. Economic Inquiry,2003,41(1): 20—26.
[7]葛新權、王國成. 博弈試驗研究[M]. 北京:社會科學文獻出版社,2007.
[8]Holmstrom, B. and Paul Milgrom. Aggregation and Linearity in the Provision of Intertemporal Incentives[J]. Econometrica,1987,55: 303—328.
[9]Camerer, Colin F. and Keith Weigelt. Experimental Tests of a Sequential Equilibrium Reputation Model[J]. Econometrica,1988,56: 1—36.
[10] Berg, Joyce E. , John Dickhaut and Kevin McCabe. Trust, Reciprocity, and Social History[J]. Games and Economic Behavior,1995,10: 122—142.
[11] Van Huyck, John B., Raymond C. Battalio and Mary F. Walters. Commitment Versus Discretion in Peasant—dictator Game[J]. Games and Economic Behavior,1995,10: 143—170.
[12] Ortmann, Andreas, John Fitzgerald and Garl Boeing. Trust, Reciprocity, and Social History: A Re—examination[J]. Experimental Economics,2000,3: 81—100.
[13] [美]理查德·H·泰勒著. 陳宇峰等譯. 贏者的詛咒——經濟生活中的悖論與反常現象 [M]. 北京:中國人民大學出版社,2007.
[14] Rabin, Matthew. Incorporating Fairness into Game Theory and Economics[J]. American Economic Review, 1993, 83:1281—1302.