李盼道, 李雙雙
(德州學(xué)院 歷史與社會(huì)管理學(xué)院,山東 德州 253023)
《皇帝的新裝》是丹麥著名童話作家安徒生的代表作之一。整個(gè)故事以騙子建立的規(guī)則(任何愚蠢或不稱職的人都看不見新衣)為主線,講述了一個(gè)愚蠢的國王受兩個(gè)騙子的愚弄,光著身子舉行大典的滑稽鬧劇。不少國內(nèi)外學(xué)者從多個(gè)角度對(duì)這篇經(jīng)典童話進(jìn)行了研究,眾多研究為人們?nèi)妗⑸钊氲乩斫膺@篇童話故事提供了有益參考。然而,其不足之處在于,截至目前尚未有一篇文章以《皇帝的新裝》中上自國王下至百姓,幾乎人人都選擇違背良心而稱贊新衣漂亮這一現(xiàn)象為線索,對(duì)“皇帝新裝”困境中博弈均衡的誘導(dǎo)機(jī)制進(jìn)行研究?;诖耍P者力圖運(yùn)用博弈論的基本分析范式,通過分析參與主體之間的博弈行為及均衡結(jié)果的達(dá)成,以闡釋“皇帝新裝”困境中博弈均衡的誘導(dǎo)機(jī)制,并提出打破該“說謊的均衡”的治理對(duì)策。
博弈論是一門研究相互影響著的局中人進(jìn)行策略選擇的行為科學(xué)[1]。根據(jù)博弈論的基本分析范式,從博弈的約束性條件出發(fā),可以將“皇帝新裝”困境中參與主體之間的博弈劃分為三種類型:完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息動(dòng)態(tài)博弈。筆者擬在不同類型的博弈狀態(tài)下,借助不同的分析方法,探討參與主體之間博弈行為及均衡結(jié)果的達(dá)成,闡釋“皇帝新裝”困境中博弈均衡的誘導(dǎo)機(jī)制。老大臣、官員、國王和群眾之間的博弈分析方法如表1所示。
表1 “皇帝新裝”困境中博弈均衡誘導(dǎo)機(jī)制的分析方法
本部分中,筆者基于完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈與不完全信息動(dòng)態(tài)博弈三種博弈類型,采用不同的分析方法,對(duì)“誠實(shí)”的老大臣與官員之間、國王與文武百官和群眾之間以及群眾之間的博弈行為及均衡結(jié)果的達(dá)成進(jìn)行分析,以闡釋“皇帝新裝”困境中博弈均衡的誘導(dǎo)機(jī)制。
完全信息靜態(tài)博弈是指參與主體同時(shí)決策,且所有參與者對(duì)博弈中各種情況下的策略及收益都完全了解。但這里要求的“同時(shí)”并不意味著參與主體要在同一時(shí)刻一起行動(dòng),即使行動(dòng)有先后順序,但只要保證每一位參與者在行動(dòng)時(shí)并不知道其他參與者的行動(dòng),其效果仍等價(jià)于他們?cè)谕瑫r(shí)行動(dòng)[2]。本部分中,筆者通過建立博弈樹以及采用重復(fù)剔除嚴(yán)格劣戰(zhàn)略、有限次與無限次重復(fù)博弈等方法,對(duì)“誠實(shí)”的老大臣和官員之間的博弈行為及均衡結(jié)果的達(dá)成進(jìn)行分析。
1. 基于博弈樹的老大臣與官員間的博弈及Nash均衡的達(dá)成
在行動(dòng)之前,國王先后派出兩位大臣前去騙子那里了解新衣制作的情況,他們分別是“誠實(shí)”的老大臣(用字母A表示)和“誠實(shí)”的官員(用字母B表示)。游戲開始時(shí),參與者A和B依次行動(dòng),且滿足參與者B行動(dòng)時(shí)并不清楚參與者A的行動(dòng),然后依據(jù)兩位參與者策略選擇的特定組合決定每一位參與者的博弈結(jié)果(收益或損失)。建立如圖1所示的博弈樹對(duì)上述博弈問題進(jìn)行描述。
圖1 老大臣與官員的博弈樹
由圖1可知,每一位參與者均有兩種可供選擇的戰(zhàn)略:說真話、說假話。在一組特定的戰(zhàn)略組合被選定后,兩人的收益均由圖1所示的博弈樹中列舉的相關(guān)字母來表示。需要說明的是,圖例中參與者A的收益放在兩個(gè)字母的最前面,參與者B的收益置于其后。在排除其他因素干擾的情況下,圖1中a、b、c、d的大小關(guān)系決定了參與者顯示何種偏好?,F(xiàn)在分析以下幾種情況:
(1) 當(dāng)d>b、d>c、a>b、a>c時(shí),若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B則選擇說假話。此時(shí)該博弈存在唯一一個(gè)Nash均衡,即(說假話,說假話)。
(2) 當(dāng)d>b、d>c、a>b、a (3) 當(dāng)d>b、d>c、a (4) 當(dāng)dc、a (5) 當(dāng)dc、a>b、a>c時(shí),若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時(shí)該博弈存在兩個(gè)Nash均衡,即(說假話,說假話)與(說真話,說真話)。 (6) 當(dāng)db、a>c時(shí),若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時(shí)該博弈存在兩個(gè)Nash均衡,即(說假話,說假話)與(說真話,說真話)。 (7) 當(dāng)dc、ac時(shí),若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時(shí)該博弈存在兩個(gè)Nash均衡,即(說假話,說假話)與(說真話,說真話)。 (8) 當(dāng)db、a (9) 當(dāng)dc時(shí),若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時(shí)該博弈存在兩個(gè)Nash均衡,即(說假話,說假話)與(說真話,說真話)。 (10) 當(dāng)d>b、d (11) 當(dāng)d>b、d (12) 當(dāng)d>b、d (13) 當(dāng)d 由此可見,在排除其他因素干擾的情況下,a、b、c、d的大小關(guān)系(即參與者的效用)決定了博弈的結(jié)果。而在“皇帝新裝”困境中,所有的參與者都是在騙子建立的規(guī)則(看見新衣意味著稱職或聰明,看不見新衣意味著不稱職或愚蠢)下進(jìn)行博弈的,這意味著參與者選擇說假話給自己帶來的效用總要大于選擇說真話,即a、b、c、d的大小關(guān)系滿足:a>b、d>c、a>c、d>b。通過上述分析不難知道,當(dāng)a>b、d>c、a>c、d>b時(shí),該博弈存在唯一一個(gè)Nash均衡,即(說假話,說假話)。結(jié)果也就出現(xiàn)了“誠實(shí)”的老大臣與官員都選擇說假話的現(xiàn)象。 2. 基于重復(fù)剔除嚴(yán)格劣戰(zhàn)略的老大臣與官員間的博弈及Nash均衡的達(dá)成 基于理性人不會(huì)選擇嚴(yán)格劣戰(zhàn)略這一基本決策的原則,我們可以運(yùn)用“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的方法進(jìn)一步求證(說假話,說假話)就是此博弈唯一的Nash均衡。 圖2 老大臣與官員博弈的雙變量矩陣 由圖2可知,參與者A和B均有兩種可供選擇的戰(zhàn)略:說真話、說假話。假定參與者A是理性的,他就可以把“說真話”從參與者B的戰(zhàn)略空間中剔除,即將圖2所示博弈視同圖3所示博弈。 在圖3中,對(duì)于參與者A來講,“說真話”相對(duì)于“說假話”來說依然是嚴(yán)格劣戰(zhàn)略。因此,假定參與者A是理性的,他是不會(huì)選擇說真話的。那么,如果參與者B知道參與者A是理性的,并且參與者B知道參與者A知道參與者B是理性的,參與者B就可以把“說真話”從參與者A的戰(zhàn)略空間中剔除,即將圖3所示博弈視同圖4所示博弈。 圖3 老大臣與官員博弈的雙變量矩陣 圖4 老大臣與官員博弈的雙變量矩陣 由圖4可知,(說假話,說假話)就是此博弈唯一一個(gè)Nash均衡,結(jié)果也就出現(xiàn)了“皇帝新裝”困境中“誠實(shí)”的老大臣與官員都顯示虛假偏好的現(xiàn)象。 3. 基于有限次與無限次重復(fù)博弈的老大臣與官員間的博弈 有限重復(fù)博弈就是階段博弈重復(fù)實(shí)施有限次[3]。先不妨令T=2,考慮如圖5所示的“誠實(shí)”的老大臣與官員間的博弈。 圖5 老大臣與官員博弈的雙變量矩陣 通過上文分析可知,在騙子建立的規(guī)則下,a、b、c、d的大小關(guān)系滿足:a>b、d>c、a>c、d>b,此時(shí)老大臣與官員的博弈存在唯一一個(gè)Nash均衡解(說假話,說假話)。假定將該博弈實(shí)施兩次,兩階段重復(fù)博弈中每一位參與者的效用等價(jià)于第一階段的效用加上δ倍的第二階段的效用(考慮到第二階段可能存在折扣因子δ)。借助后退歸納法,顯然第二階段博弈的唯一Nash均衡仍為(說假話,說假話),效用向量是(a,a)。因此,如果該博弈存在子博弈完美均衡解,其第二階段博弈的結(jié)果必定是(說假話,說假話),所得效用的現(xiàn)實(shí)值為(aδ,aδ)。無論子博弈完美中第一階段博弈的結(jié)果如何,該結(jié)果的效用向量加上(aδ,aδ)就是參與者的子博弈完美均衡效用。因此,可以在圖5的效用矩陣的各個(gè)結(jié)局中加上(aδ,aδ),得到如圖6所示的新效用矩陣。 圖6 參與者的子博弈完美均衡效用 圖6中的博弈也有四種結(jié)局,而每個(gè)任意結(jié)局(m,n)對(duì)應(yīng)了兩個(gè)階段重復(fù)博弈的行動(dòng)系列中的一個(gè)行動(dòng):{(m,n),(說假話,說假話)},相應(yīng)于圖6中(m,n)的效用向量就是參與者在第二階段博弈中的所得。累次取優(yōu)法表明(說假話,說假話)是唯一的Nash均衡,因此也就得到了唯一的子博弈完美Nash均衡:{(說假話,說假話),(說假話,說假話)}。 兩階段重復(fù)博弈的上述結(jié)論很容易推廣到任意有限次重復(fù)博弈,其效用矩陣相當(dāng)于把重復(fù)博弈的效用矩陣中各元素?cái)U(kuò)大到(a+aδ+aδ2+……+aδT)倍。而最新一次的博弈,其Nash均衡仍為(說假話,說假話)。這也就說明T階段重復(fù)博弈有唯一的子博弈完美Nash均衡:{(說假話,說假話),……,(說假話,說假話)}。 假設(shè)將這場博弈無限次地重復(fù),(說假話、說假話)仍然是子博弈完美均衡。因?yàn)樵诿恳淮尾┺闹?在給定對(duì)手已取得均衡策略的條件下,沒有任何一位參與者會(huì)主動(dòng)偏離均衡策略?;蛟S人們會(huì)認(rèn)為,在無限水平博弈中,前一階段的博弈結(jié)果會(huì)影響到后面階段的選擇,而這里的子博弈完美Nash均衡的確是唯一一個(gè)具有這樣性質(zhì)的均衡:每一階段的行動(dòng)并不會(huì)隨著以前階段所采取行動(dòng)的變化而變化。 總之,通過以上對(duì)完全信息靜態(tài)博弈狀態(tài)下“誠實(shí)”的老大臣與官員的博弈行為及所產(chǎn)生的均衡結(jié)果的分析,筆者認(rèn)為在排除其他因素干擾的情況下,參與者的效用決定了其究竟顯示何種偏好。換言之,“皇帝新裝”困境中誘使博弈群體顯示其虛假偏好的誘導(dǎo)機(jī)制是博弈效用中的參數(shù)。 完全信息動(dòng)態(tài)博弈是指博弈中信息是完全的,但是行動(dòng)有先后順序,后行動(dòng)的參與者可以觀察到先行動(dòng)的參與者的所有信息[4-5]。本部分中,筆者通過建立博弈樹,對(duì)國王與文武百官和群眾之間的博弈行為及均衡結(jié)果的達(dá)成進(jìn)行分析。以國王與文武百官之間的博弈為例。 當(dāng)國王帶著一幫特別圈定的文武百官親自到兩個(gè)狡猾的騙子那里了解新衣的制作情況時(shí),此時(shí)國王與文武百官之間將進(jìn)行一場博弈。需要說明的是,國王與文武百官之間的行動(dòng)是有先后順序的,即國王(用1表示)首先行動(dòng),文武百官(用2表示)先觀察國王的行動(dòng),然后再行動(dòng),以此類推,直至博弈結(jié)束。建立如圖7所示的博弈樹,對(duì)上述博弈問題進(jìn)行描述。 圖7 國王與文武百官之間的博弈樹 由圖7可知,國王有兩個(gè)純策略,S1={(說真話),(說假話)};文武百官有4個(gè)純策略,S2={(說真話,說真話),(說真話,說假話),(說假話,說真話),(說假話,說真話)}。依據(jù)國王與文武百官的純策略構(gòu)成純策略剖面如下: (1) {說真話,(說真話,說真話)},路徑為(1,2(說真話),(b、b))。屬于文武百官的信息集有“說真話”與“說假話”2個(gè),此處分別將它們記作2(說真話)與2(說假話),節(jié)點(diǎn)結(jié)以收益向量表示,指出該剖面的各參與者的收益,下同。 (2) {說真話,(說真話,說假話)},路徑為{1,2(說真話),(b、b)}。 (3) {說真話,(說假話、說真話)},路徑為{1,2(說假話),(c,d)}。 (4) {說真話,(說假話,說假話)},路徑為{1,2(說假話),(c,d)}。 (5) {說假話,(說真話,說真話)},路徑為{1,2(說真話),(d,c)}。 (6) {說假話,(說真話,說假話)},路徑為{1,2(說假話),(d,c)}。 (7) {說假話,(說假話,說真話)},路徑為{1,2(說真話),(a,a)}。 (8) {說假話,(說假話,說假話)},路徑為{1,2(說假話),(a,a)}。 從上述羅列的情況中能夠發(fā)現(xiàn),不同的純策略剖面可以有相同的路徑和結(jié)局,例如(1)與(2)、(5)與(7)等。上述8種情況可列成如圖8所示的盈利矩陣。 圖8 國王與文武百官之間的博弈 不難發(fā)現(xiàn),圖8相當(dāng)于圖7展開型博弈的策略型表示。圖8蘊(yùn)含著國王與文武百官在行動(dòng)之前都會(huì)預(yù)先作出一個(gè)全面的應(yīng)急計(jì)劃之意。例如,(說假話,說假話)可能就是文武百官考慮到國王“說假話”或“說真話”時(shí)他的一個(gè)反應(yīng),再加上(說真話,說真話)、(說真話,說假話)、(說假話,說真話),則使整場博弈中每一種應(yīng)該考慮的可能情況全部被列入計(jì)劃。而本質(zhì)上,同樣的博弈表示成圖7那種展開形式,文武百官在決定自己究竟選擇“說假話”與“說真話”兩個(gè)行動(dòng)中的哪一個(gè)時(shí),要等到信息集h2(即參與者2在選擇行動(dòng)前,他所了解的有關(guān)國王的行動(dòng))已獲得,然后依據(jù)h2=“說真話”還是h2=“說假話”再作出相應(yīng)決策。對(duì)于國王來講,在騙子建立的規(guī)則下,考慮到a、b、c、d的大小關(guān)系滿足:a>b、d>c、a>c、d 總之,通過以上對(duì)完全信息動(dòng)態(tài)博弈狀態(tài)下國王與文武百官之間的博弈行為及其所產(chǎn)生的均衡結(jié)果的分析,筆者認(rèn)為,“皇帝新裝”困境中誘使博弈群體顯示其虛假偏好的誘導(dǎo)機(jī)制是博弈效用中的參數(shù)。 不完全信息動(dòng)態(tài)博弈是指博弈中的每一個(gè)參與者都知道其他參與者有哪幾種類型以及各種類型出現(xiàn)的概率,即知道“自然”參與者的不同類型與相應(yīng)選擇之間的關(guān)系[6-7],但參與者并不知道其他參與者具體屬于哪一種類型[8-9]。本部分中,筆者借助信號(hào)博弈的方法對(duì)群眾之間的博弈行為及均衡結(jié)果的達(dá)成進(jìn)行分析。 信號(hào)博弈是兩個(gè)參與者之間的非完全信息動(dòng)態(tài)博弈[10]:信號(hào)發(fā)送者(S)和信號(hào)接收者(R)。博弈時(shí)序規(guī)定如下: 1. 自然按照概率分布p(ti)為發(fā)送者S從一個(gè)可行類型空間T={t1,t2}中選取類型ti(新衣不存在),其中p(ti)≥0對(duì)每一個(gè)i都成立,且p(t1)+p(t2)=1。 2. 發(fā)送者S觀察到ti(新衣不存在)后,從一個(gè)可行信號(hào)集M={m1(國王的新衣真漂亮),m2(國王沒有穿新衣)}中選取一個(gè)信號(hào)mj。 3. 接收者R觀察到mj,然后從可行行動(dòng)集A={a1(說真話),a2(說假話)}中選取行動(dòng)ak。 4. 發(fā)送者S與接收者R的盈利函數(shù)分別為US=(ti,mj,ak)。 圖9 群眾之間的信號(hào)博弈 在該信號(hào)博弈中,N表示自然,T={t1,t2},M={m1,m2},A={a1,a2},[p]與[1-p]表示自然選擇類型時(shí)的概率分布。在騙子建立的規(guī)則下,a、b、c、d的大小關(guān)系滿足a>b、d>c、a>c、d>b,e、f、g、h的大小關(guān)系滿足e>f、h>g、e>g、h>f,并且a>f、a>g、d>g,e>b、e>c、h>b、h>c。 圖9中發(fā)送者S的純策略: S(1)若自然抽取t1,則取m1(國王的新衣真漂亮);若自然抽取t2,仍取m1(國王的新衣真漂亮)。 S(2)若自然抽取t1,則取m1(國王的新衣真漂亮);若自然抽取t2,則取m2(國王沒有穿新衣)。 S(3)若自然抽取t1,則取m2(國王沒有穿新衣);若自然抽取t2,則取m1(國王的新衣真漂亮)。 S(4)若自然抽取t1,則取m2(國王沒有穿新衣);若自然抽取t2,仍取m2(國王沒有穿新衣)。 接收者R的純策略: R(1)若S發(fā)出m1(國王的新衣真漂亮),則取a1(說真話);若S發(fā)出m2(國王沒有穿新衣),仍取a1(說真話)。 R(2)若S發(fā)出m1(國王的新衣真漂亮),則取a1(說真話);若S發(fā)出m1(國王沒有穿新衣),則取a2(說假話)。 R(3)若S發(fā)出m1(國王的新衣真漂亮),則取a2(說假話);若S發(fā)出m2(國王沒有穿新衣),則取a2(說真話)。 R(4)若S發(fā)出m1(國王的新衣真漂亮),則取a2(說假話);若S發(fā)出m2(國王沒有穿新衣),仍取a2(說假話)。 現(xiàn)在從發(fā)送者S的四個(gè)純策略出發(fā),分別分析該信號(hào)博弈完美Bayes均衡。 第一,共用m1。 第二,共用m2。 第三,分離:類型t1發(fā)出信號(hào)m1,類型t2發(fā)出信號(hào)m2。 假設(shè)發(fā)送者S的純策略是(m1,m2),那么接受者R的兩個(gè)信息集都在均衡路徑上,因此兩個(gè)信念均可由Bayes法則與發(fā)送者S的策略確定。例如對(duì)p而言: p=u(t1|m1)=p(t1)/p(t1)=1;同理可得: 1-q=u(t2|m2)=p(t2)/p(t2)=1,即q=0。在給定信念p=1的情況下,接受者R的最優(yōu)反應(yīng)是a2;而在給定信念q=0的情況下,接受者R的最優(yōu)反應(yīng)仍是a2。此時(shí),屬于類型t1與t2的發(fā)送者S獲得的效用分別為a與g。在給定接受者R策略(a1,a2)下,發(fā)送者S的純策略(m1,m2)是否最優(yōu)?根據(jù)圖9可知,屬于類型t2的發(fā)送者S如果偏離這個(gè)策略,不取信號(hào)m2而取信號(hào)m1,此時(shí)由于接受者R的反應(yīng)為a2,而使得類型t2的發(fā)送者S獲得效用e。這要優(yōu)于他取信號(hào)m2獲得的效用g。因此,在給定接受者R策略(a2,a2)下,發(fā)送者S有可能會(huì)主動(dòng)偏離(m1、m2)這一策略,故發(fā)送者S的純策略(m1,m2)不可能是均衡策略。 第四,分離:類型t1發(fā)出信號(hào)m2,類型t2發(fā)出信號(hào)m1。 假設(shè)發(fā)送者S的純策略為(m2,m1),如(3)所示,則可以確定接受者R的兩個(gè)信念:p=0與q=1。在給定p=0與q=1這兩個(gè)信念的情況下,接受者R的最優(yōu)反應(yīng)是(a2,a2),從而屬于類型t1與t2的發(fā)送者S獲得的效用分別為c與e。在給定接受者R策略(a2、a2)下,發(fā)送者S的純策略(m2、m1)是否最優(yōu)?根據(jù)圖9可知,屬于類型t1的發(fā)送者S如果偏離這個(gè)策略,不取信號(hào)m2而取信號(hào)m1,此時(shí),由于接受者R的反應(yīng)為a2,而使得類型t1的發(fā)送者S獲得效用a。這要優(yōu)于他取信號(hào)m2獲得的效用c。因此,在給定接受者R策略(a2,a2)下,發(fā)送者S有可能會(huì)主動(dòng)偏離(m2,m1)這一策略,故發(fā)送者S的純策略(m2、m1)不可能是均衡策略。 總之,通過從發(fā)送者S的四個(gè)純策略出發(fā),分別對(duì)該信號(hào)博弈的完美Bayes均衡進(jìn)行分析,發(fā)現(xiàn)在騙子建立的規(guī)則下,只有(m1,m1)和(a2,a2)是博弈的共用完美Bayes均衡。結(jié)果也就出現(xiàn)了“皇帝新裝”困境中博弈群體在不能確定彼此所屬具體類型的情況下均選擇顯示其虛假偏好的現(xiàn)象。很顯然,在整個(gè)博弈過程中,決定博弈群體采取何種動(dòng)作為其最優(yōu)策略的誘導(dǎo)機(jī)制是博弈效用中的參數(shù)。 站在局中人的角度,身為行動(dòng)的執(zhí)行者,在裁縫建立的規(guī)則(任何愚蠢或不稱職的人都看不見新衣)下,沒有人會(huì)質(zhì)疑裁縫是否是騙子。因此,局中人會(huì)把自己沒有看到新衣歸因于自己是愚蠢的,而當(dāng)聽到其他人對(duì)新衣贊不絕口時(shí),局中人會(huì)得出兩個(gè)結(jié)論:其他人是聰明的,所以他們真的看到了新衣;其他人和自己一樣沒有看到新衣,在說謊。因此,每個(gè)人雖然能確定自己沒有看到新衣,但不能確定其他人是否真的看到新衣??傊?為鼓勵(lì)博弈群體顯示其真實(shí)偏好,從而達(dá)到所有參與主體均選擇說真話的一種新的均衡狀態(tài),筆者提出以下幾點(diǎn)治理對(duì)策,詳細(xì)情況見表2。 表2 “皇帝新裝”困境中博弈均衡誘導(dǎo)機(jī)制的治理對(duì)策 騙子之所以能夠拿自己的生命與所有人下賭注,這里有一個(gè)前提,即騙子能夠建立一種規(guī)則,使所有人都活在這種規(guī)則之下。在這種規(guī)則下,根本就不會(huì)有人質(zhì)疑騙子說的是謊言,更談不上揭發(fā)謊言,因?yàn)橐坏┯腥藨岩?這個(gè)故事就會(huì)立即被終結(jié),最初的邏輯世界被破壞,整個(gè)童話故事就會(huì)變得毫無意義。因此,在這種前提下,每個(gè)人都不敢相信自己看到的事實(shí)——“看到”和“相信”是兩碼事?,F(xiàn)在我們假設(shè)p=F(“說假話的人數(shù)”/“對(duì)國王的新衣發(fā)表看法的所有人數(shù)”),F=xa(x代表說假話的人群占比,a代表“不從眾系數(shù)”)。這里的F因不同的人存在異質(zhì)性,我們很容易得到F(0)=0、F(1)=1。但需要注意的是,0-1中間的部分會(huì)隨著a的不同而有所不同,因此只要保證a稍微大些,即使只有1%的人站出來說真話,F也會(huì)距離1較遠(yuǎn),此時(shí)他就會(huì)非常相信自己的眼睛,從而發(fā)出真實(shí)信號(hào)。所以可以通過以下幾種方法來確?!安粡谋娤禂?shù)a”盡可能大些,換句話說,就是最大限度地打破博弈群體的從眾心理,誘導(dǎo)其顯示真實(shí)偏好。首先,可以對(duì)博弈群體進(jìn)行思想道德教育,使其能夠相信自己的眼睛,忠于自己的本心,敢于將生死置之度外,說出自己看到的事實(shí)。其次,在排除效用等因素干擾的情況下,也可以對(duì)博弈群體進(jìn)行“隔離”,即讓他們依次行動(dòng),以確保每個(gè)人在行動(dòng)時(shí)都不知道其他人的選擇,從根源上避免從眾心理起作用。最后,也可以大膽地質(zhì)疑騙子,結(jié)果是博弈群體無須從眾,大膽地說出新衣不存在,打破原來博弈群體都“說謊的均衡”,兩個(gè)狡猾的騙子也會(huì)受到嚴(yán)厲的法律制裁。 博弈論研究的博弈中的參與者總是被假定為理性的和自利的,而決定參與者究竟采取何種行動(dòng)的誘導(dǎo)機(jī)制或激勵(lì)機(jī)制之一就是他自己的效用。因此,在排除其他因素干擾的情況下,只有改變博弈效用,才能誘使參與主體作出符合社會(huì)價(jià)值標(biāo)準(zhǔn)的策略選擇。通過上文分析可知,a、b、c、d的大小關(guān)系一共有13種情況,相對(duì)應(yīng)的博弈結(jié)果可以歸納為3種:一是參與主體都說假話,二是參與主體都說真話,三是一半人說真話,一半人說假話(假設(shè)參與主體人數(shù)N是偶數(shù))。 在整個(gè)博弈過程中,因?yàn)楹笮袆?dòng)的參與者只知道先于他行動(dòng)的參與者要么選擇說真話,要么選擇說假話,但不知道先于他行動(dòng)的參與者究竟會(huì)在“說真話”或“說假話”中到底選擇哪一個(gè)。現(xiàn)在,在后行動(dòng)的參與者“不完美”的信息集上賦予一個(gè)概率分布(p,1-p)作為信念,繪制博弈樹如圖10所示。 圖10 依次行動(dòng)的參與者之間博弈的博弈樹 一旦給定后行動(dòng)的參與者在“不完美”信息集上的信念,就可以計(jì)算出他的期望效用。如果后行動(dòng)的參與者取“說真話”,期望效用為: p×b+(1-p)×c=p(b-c)+c; 如果后行動(dòng)的參與者取“說假話”,期望效用為: p×d+(1-p)×a=p(d-a)+a。 我們知道,在騙子建立的規(guī)則下,a、b、c、d的大小關(guān)系滿足:a>b、a>c、d>b、d>c。 1. 當(dāng)b-c=d-a時(shí),后行動(dòng)的參與者的最佳選擇是說假話; 2. 當(dāng)b-c 3. 當(dāng)b-c>d-a時(shí),后行動(dòng)的參與者的最佳選擇是說真話。 因此,在騙子建立的規(guī)則下,排除其他因素的干擾,只要能夠保證b-c>d-a,也就保證了所有參與者都選擇說真話。 在一個(gè)群體的行動(dòng)中,如果公共知識(shí)改變了,群體的均衡也會(huì)發(fā)生改變。故事最初達(dá)到了一種均衡,即所有參與者出于對(duì)個(gè)人利弊的權(quán)衡而選擇掩蓋事實(shí)真相,紛紛稱贊國王新衣漂亮。倘若我們是局中人,在給定的先決條件(任何愚蠢或不稱職的人都看不見新衣)下,對(duì)于每一位參與者來講,他們都清楚新衣不存在,但他們會(huì)認(rèn)為或許是因?yàn)樽约河薮?、不稱職而沒有看到新衣。所以他們是不能肯定其他參與者是否真的看到新衣。這時(shí),“新衣根本就不存在”僅僅構(gòu)成參與者的私人信息,而小孩子一語道破了事實(shí)的真相。小孩子是真誠的、天真無邪的,他不會(huì)像其他參與者那樣權(quán)衡利弊得失。確切地說,小孩其實(shí)屬于非理性的參與者,即使他發(fā)現(xiàn)周圍的人什么都不說或者都在稱贊國王的新衣,他也會(huì)童言無忌地說出真相:國王什么也沒穿?!捌鋵?shí)國王什么也沒有穿”便瞬間成為所有參與者之間的公共知識(shí),這時(shí)大家才開始勇敢地顯示自己的真實(shí)偏好。此時(shí)人們經(jīng)過交流達(dá)成通識(shí),私人信息外部轉(zhuǎn)化為公共知識(shí),否則每一位理性參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。 此外,還可以通過改變國王的行為來鼓勵(lì)大家勇敢地說出真話。國王身為一國之君,理應(yīng)率先示范,當(dāng)場拆穿謊言,并給予騙子嚴(yán)厲的懲罰,以捍衛(wèi)一國之君的尊嚴(yán)。而故事中的國王之所以沒能及時(shí)戳穿騙子的謊言,也與他多年來的“不務(wù)正業(yè)”有關(guān)。當(dāng)他沒有看到新衣時(shí),他不敢說出來,因?yàn)樗睦锴宄约翰皇且粋€(gè)稱職的國王,他缺乏自信。因此,倘若國王一直都是兢兢業(yè)業(yè),不僅國王自己對(duì)自己有足夠的信心,而且大臣、百姓都會(huì)對(duì)其有足夠的信心,在面對(duì)裁縫設(shè)置的騙局時(shí)大家就一定能夠戮力同心、齊心協(xié)力地揭穿騙子。 總之,本部分基于對(duì)“皇帝新裝”困境中博弈均衡的誘導(dǎo)機(jī)制進(jìn)行的理論分析,通過采取相應(yīng)的治理對(duì)策,包括改變博弈效用參數(shù)、加強(qiáng)行為互動(dòng)等來鼓勵(lì)博弈群體作出符合社會(huì)價(jià)值標(biāo)準(zhǔn)的策略選擇,從而達(dá)到博弈群體均選擇說真話的一種新的均衡狀態(tài)。 基于上述分析,筆者提出以下幾點(diǎn)治理對(duì)策:應(yīng)對(duì)博弈群體進(jìn)行思想道德教育或?qū)⒉┺娜后w“隔離”以打破從眾心理;改變博弈效用,保證a、b、c、d的大小關(guān)系始終滿足b-c>d-a;建立健全信息交換共享平臺(tái),拓寬信息溝通渠道,以加強(qiáng)行為互動(dòng)。 [ 1 ] 劉康興,李海.關(guān)于博弈論在人力資源管理中的應(yīng)用綜述[J].時(shí)代金融,2007(4):42-44. [ 2 ] 吉本斯.博弈論基礎(chǔ)[M].北京:中國社會(huì)科學(xué)出版社,1999:7. [ 3 ] 施錫銓.博弈論[M].上海:上海財(cái)經(jīng)大學(xué)出版社,1999:97-99. [ 4 ] 王艷梅,趙希男,孫世敏.基于動(dòng)態(tài)博弈的橫向監(jiān)督與團(tuán)隊(duì)激勵(lì)的關(guān)系研究[J].管理工程學(xué)報(bào),2017(2):162-168. [ 5 ] 張立凡,程楠,朱恒民.基于動(dòng)態(tài)博弈的媒體參與下網(wǎng)絡(luò)輿情機(jī)制分析[J].情報(bào)科學(xué),2017 (1):144-147. [ 6 ] 王康,孫健,周欣. 不完全信息動(dòng)態(tài)博弈視角下的食品安全責(zé)任保險(xiǎn)問題研究——基于參與主體之間的KMRW聲譽(yù)博弈[J].江西財(cái)經(jīng)大學(xué)學(xué)報(bào),2017(2):70-76. [ 7 ] 趙熒梅,郭本海,劉思峰.不完全信息下產(chǎn)品質(zhì)量監(jiān)管多方博弈模型[J].中國管理科學(xué),2017 (2):111-120. [ 8 ] 易凱凱,朱建軍,張明,等.基于不完全信息動(dòng)態(tài)博弈模型的大型客機(jī)主制造商-供應(yīng)商協(xié)同合作策略研究[J].中國管理科學(xué),2017(5):125-134. [ 9 ] 鄭君君,邵祥民,韓笑,等.認(rèn)知層次與信念更新對(duì)博弈合作行為影響研究[J].系統(tǒng)工程理論與實(shí)踐,2016(1):113-120. [10] 吳文靜,王占中,馬芳武.從眾心理影響下的行人群體行為演化博弈的仿真分析——以行人過街為例[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2017(1):92-96.(二) 基于完全信息動(dòng)態(tài)博弈的國王與文武百官和群眾之間的博弈
(三) 基于不完全信息動(dòng)態(tài)博弈的群眾間的博弈
二、 “皇帝新裝”困境中博弈均衡誘導(dǎo)機(jī)制的治理對(duì)策
(一) 打破從眾心理,誘導(dǎo)博弈群體顯示其真實(shí)偏好
(二) 改變博弈效用,鼓勵(lì)博弈群體作出符合社會(huì)價(jià)值標(biāo)準(zhǔn)的策略選擇
(三) 加強(qiáng)行為互動(dòng),誘使私人信息外部化為公共知識(shí)