王洪梅 王東琪 王晨 李佳鑫
摘 要:隨著團隊協(xié)作形式在學(xué)習(xí)、工作中的普遍運用,團隊間的協(xié)作博弈也成為必然現(xiàn)象。由于一些不合理的獎懲規(guī)則導(dǎo)致的智豬博弈均衡是常見結(jié)果之一,運用博弈論的基本原理,結(jié)合現(xiàn)實情況,構(gòu)建小組協(xié)作學(xué)習(xí)的博弈模型,分析了小組合作均衡、智豬博弈均衡及惡化成為囚徒困境的條件,提出了三種預(yù)防智豬博弈惡化以及促進合作均衡實現(xiàn)的策略,希望能對用博弈論分析和解決教學(xué)領(lǐng)域中的問題起到拋磚引玉的作用。
關(guān)鍵詞:團隊協(xié)作 合作均衡 智豬博弈 囚徒困境 策略設(shè)計
引言
1.選題背景
協(xié)作學(xué)習(xí)是一種利用團隊形式組織學(xué)生合作學(xué)習(xí),提高學(xué)習(xí)效率的學(xué)習(xí)方式,研究證明:“目前協(xié)作學(xué)習(xí)要比競爭學(xué)習(xí)、個人學(xué)習(xí)更能提高學(xué)業(yè)成績。”[1]小組協(xié)作學(xué)習(xí)是一項團隊活動,在團隊成員之間會存在理念、觀點和原則等差異,若這些差異處理得當(dāng),團隊的凝聚力就能夠得到加強。反之,則影響團隊合作和目標(biāo)實現(xiàn)。[2]為了分析小組合作的具體情況,構(gòu)建相關(guān)博弈論矩陣,分析得到3種具體的協(xié)作情況:合作均衡(小組內(nèi)各成員均積極合作)、智豬博弈均衡(搭便車)以及囚徒困境(個人最優(yōu)導(dǎo)致集體非最優(yōu))。
在運用中,智豬博弈均衡較為常見,由于不合理的獎勵機制,使積極合作的人獲得的獎勵與消極怠工的人差距不大,消極怠工的人可以坐享漁翁之利,導(dǎo)致能力強的人積極參與,能力弱的人消極怠工,智豬博弈均衡產(chǎn)生。同時為了獲得與勞動相匹配或更高的收益,參與者產(chǎn)生博弈心態(tài),若積極合作收益小于消極怠工收益,將不愿合作,小組協(xié)作陷入囚徒困境,即所有人都消極怠工。這無益于協(xié)作學(xué)習(xí)模式的發(fā)展和學(xué)生能力的提高。因此,本文利用構(gòu)建的協(xié)作學(xué)習(xí)博弈模型,探討智豬博弈均衡存在的條件、提出了防止其演變成囚徒困境的建議,這將促進更有效率的合作均衡實現(xiàn)。
2.博弈論在協(xié)作學(xué)習(xí)中的運用
李京杰等運用 “智豬博弈”與“囚徒困境” 模型對協(xié)作學(xué)習(xí)中的合作與競爭問題進行研究,發(fā)現(xiàn)協(xié)作學(xué)習(xí)中存在“搭便車”現(xiàn)象。[3]史忠翠等運用“智豬博弈”模型,從“師生博弈”和“生生博弈”兩方面研究了小組合作學(xué)習(xí)。[4]在團隊合作中,有時由于個人對團體有依賴,產(chǎn)生惰性,降低了個體積極性,導(dǎo)致整體成效較低。[5]雖然這些研究分析了在組內(nèi)協(xié)作中組員間的“搭便車”現(xiàn)象,即智豬博弈情況,卻忽略了智豬博弈后的惡化反應(yīng),為了解決這一不足,本文將深入討論智豬博弈惡化(即囚徒困境均衡)的具體情況,并就此提出改進方案。
一、小組協(xié)作學(xué)習(xí)博弈模型的構(gòu)建及分析
1.一個簡單博弈模型的構(gòu)建
為了簡化問題,設(shè)定參與人為A和B兩人,構(gòu)建一個簡單的小組協(xié)作學(xué)習(xí)博弈模型。博弈過程中存在兩種基本狀態(tài)——積極合作與消極怠工。博弈基本性質(zhì)為: ①組內(nèi)成員具有“理性”且“理性”為共同知識;②完全信息靜態(tài)博弈;③非零和博弈;
(1)符號說明與模型假設(shè)
為了便于模型分析,假設(shè)一些符號表示模型。A:能力強者;B:能力弱者;I:小組總投入;a:A的投入占比;b:B的投入占比;l:A的能力系數(shù);k:積極合作效應(yīng);k1:A的獨立效應(yīng);k2:B的獨立效應(yīng);p:A積極合作的概率;1- p:A消極怠工的概率;q:B積極合作的概率;1-q:B消極怠工的概率。
為了方便計算博弈收益情況,提出以下模型假設(shè)。
①假設(shè)成員能力不同,A為該組成績較優(yōu)者,B為成績較差者,設(shè)B的能力系數(shù)為1,A的能力系數(shù)l>1。
②合作效應(yīng)或獨立效應(yīng)指合作或獨立作業(yè)產(chǎn)生的其他可能影響成績的特殊效果,如由于合作或者獨立時的環(huán)境因素或心態(tài)因素而產(chǎn)生的效益或損失。沒有合作或獨立效應(yīng)時,標(biāo)準(zhǔn)效應(yīng)為1,k>0,k1>0,k2>0。
③A、B合作完成小組作業(yè),每一次合作的總投入為I (包括精力、時間等要素的投入) ,A投入占比為a,B投入占比為b,a+b=1,0<a<1,0<b<1。
④小組總收益與總投入I和效應(yīng)k成正比。當(dāng)A、B積極合作時,小組總收益與總投入I和合作效應(yīng)k正相關(guān),A積極合作而B消極怠工時,其總評成績與k1、投入aI正相關(guān)。當(dāng)B積極合作而A消極怠工時,總評成績與k2和投入bI正相關(guān)。但合作收益超過獨立作業(yè)的收益。同時A、B消極怠工時,即無合作,無任何收益,值為0。
(2)小組協(xié)作學(xué)習(xí)模型的構(gòu)建
根據(jù)以上說明,構(gòu)造出A、B協(xié)作學(xué)習(xí)的支付矩陣,見表3。
其中,
G1A=klaI-alI,G1B=kbI-bI
G2A=k1aI-alI,G2B=k1laI
G3A=k2bI-alI,G3B=k2bI-bI
G4A=0,G4B=0
2.小組協(xié)作學(xué)習(xí)博弈模型的分析
雖然智豬博弈均衡是團隊協(xié)作博弈之中的常見結(jié)果,但智豬博弈均衡存在也是有一定條件的,下面將具體分析合作均衡、智豬博弈均衡和囚徒困境形成的條件。
(1)小組協(xié)作博弈模型的均衡條件分析
從A的收益角度分析,此時A對自己的行為具有完全信息,對B有不完全信息。A選擇積極合作還是消極怠工取決于它選擇積極合作(p=1)時的期望支付與選擇消極怠工(P=0)時的期望支付之差△ G的大小。顯然,
ΔGA=∑piqiGiA(p=1)- ∑piqiGiA(p=0) ≥0
其中,p1=p,p2=p,p3=1-p,p4=1-p,q1=q,q2=1-q,q3=q,q4=1-q
代入收益矩陣得:
ΔGA=lI[q(ka-k1a-k2b)+k1a-a]
若ΔGA≥0,得A合作的條件:
q(ka-k1a-k2b)+k1a-a≥0
由a+b=1得:
q(k-k1-kb+k1b-k2b)+k1-k1b-1+b≥0
此不等式的分析,將分為以下兩種情況:
①當(dāng)q=1時,原式可化為k(1-b)-k2b-1+b>0,不等式成立時,得k>1,k2或b越大時,要求k(合作效應(yīng)越大。ΔGA≥0才能成立。在此種情況下,由于q=1且ΔGA≥0,A、B會選擇積極合作,會出現(xiàn)合作均衡。
②當(dāng)q=0時,原式可化為k1-k1b-1+b≥0,得k1≥1,當(dāng)A的獨立效用大于1時,當(dāng)A會選擇合作時,ΔGA≥0時,取決于k1-1≥0這個不等式是否成立。即k1≥1時,A也會選擇積極合作去保證自己的收益,即這種情況下,A會積極合作而B會消極怠工,出現(xiàn)“智豬博弈”。
從B的收益角度分析,此時B對自己的行為具有完全信息,而對A有不完全信息。B選擇積極合作還是消極怠工取決于它對選擇積極合作(q=1)時的期望支付與選擇消極怠工(q=0)時的期望支付之差△ G的大小。
ΔGB=piqiGiB(q=1)- ∑piqiGiB (q=0) ≥0
其中,p1=p,p2=p,p3=1-p,p4=1-p,q1=q,q2=1-q,q3=q,q4=1-q
代入收益矩陣得:
ΔGB=p(kb-k2b-k1la-b)-k2b
若ΔGB≥0, 得B合作的條件:
p(kb-k2b-k1la-b)-k2b≥0
由a+b=1得:
p[k(1-a)-k2(1-a)-k1la-(1-a)]-k2(1-a) ≥0
此不等式的分析,將分為以下兩種情況:
①當(dāng)p=1時,原式可以化為k(1-a)-k2(1-a)-k1la-(1-a)-k2(1-a) ≥0,所以當(dāng)B會選擇合作時, k≥1。k1、k2、l、a越大則要求合作效應(yīng)k越大。ΔGA≥0,A積極合作,B也會積極合作,此時會出現(xiàn)合作均衡。
②當(dāng)p=0時,原式可化為-k2(1-a) ≥0,由于(1-a)≥0,k2≥0所以原式不成立,即當(dāng)A消極怠工,B也不會合作。這種情況下,A消極怠工,B也會消極怠工,形成囚徒困境。
當(dāng)ΔGA和ΔGB同時小于0時,綜上條件即在k<1和k1<1時,出現(xiàn)前“(消極怠工,消極怠工)”為納什均衡解,達成囚徒困境,即智豬博弈的惡化。
二、小組協(xié)作的結(jié)論與建議
相較于合作均衡的收益,智豬博弈均衡并不是最優(yōu)利益的均衡狀態(tài) ,但在協(xié)作過程中,個體為了以最小成本獲取最大收益,往往容易陷入智豬博弈均衡。但相較于囚徒困境均衡,智豬博弈均衡是較優(yōu)選擇。因此,本文將從三個方面為改進協(xié)作中智豬博弈均衡,促進合作均衡,防止智豬博弈惡化進行策略設(shè)計。
1.創(chuàng)造小組內(nèi)部競爭機制
由于團體績效的獎勵機制不合理,小組協(xié)作會有 “搭便車”現(xiàn)象。因此,在小組合作時,首先,選擇具有較高能力的人為組長,提高整體合作意愿;其次,在小組內(nèi)部創(chuàng)造基于內(nèi)部目標(biāo)管理的競爭機制,即將小組任務(wù)做出明確的分工安排,細(xì)化為小組組員的個人任務(wù),并進行集中控制,以此提高合作的效率。最后,設(shè)立有差別的評分標(biāo)準(zhǔn),進行差異化打分,針對小組的工作效果進行公平的內(nèi)部評價。
2.改變客觀環(huán)境和主觀心態(tài),增強合作效應(yīng)
(1)營造良好合作環(huán)境,直接提高合作效應(yīng)
k代表合作效應(yīng)。首先,小組成員能力互補的程度以及是否有合適的機制實現(xiàn)優(yōu)勢互補對合作效應(yīng)的提高有重要影響,在組建小組時要選擇能力互補的各個成員,同時小組成員也可以積極培養(yǎng)自身的能力去提高合作效應(yīng)。其次,良好的環(huán)境氛圍也可以很好提高合作效應(yīng),所以小組在組建時可以選擇同學(xué)或朋友或性格友善的小組成員,打造既可以輕松又可以專注的環(huán)境氛圍。最后,盡量避免隨機分組,防止成員間的陌生感影響合作效應(yīng)。
(2)提高k1,k2值,間接增強合作效應(yīng)
k1,k2代表的A、B獨立效應(yīng),k1、k2與客觀環(huán)境以及主觀心態(tài)的因素相關(guān)。A、B的獨立性越強說明合作一方的獨立性越強,越能容忍對方的“消極怠工”,越有意愿為整個小組付出更多。
3.提高能力和投入,增加合作收益
(1)提高能力系數(shù)
能力系數(shù)越大合作收益會越大,兩者更可能選擇合作。能力系數(shù)可以提高智豬博弈均衡的上限,增強智豬博弈均衡的穩(wěn)定性。能力較弱的一方能力的上升將縮小智豬博弈均衡收益的差距。對于能力較弱的一方,教師可以考慮單獨輔導(dǎo)教學(xué),或者加強其鍛煉以提升其能力系數(shù)。如果雙方的能力持續(xù)上升,智豬博弈均衡會重新出現(xiàn)(以 k1不變?yōu)榍疤?)。雖然在此水平上的合作均衡收益仍大于智豬博弈均衡收益,但此時小組協(xié)作學(xué)習(xí)的總體能力已提升到新的高度,此時的智豬博弈均衡收益遠高于之前的智豬博弈均衡收益。
(2)增加合作投入
a、b分別代表A、B的投入占比,a、b越大且趨于一致,則越能增加雙方收益。a、b越大說明雙方越愿意為小組協(xié)作投入較大精力,而趨于一致可以增加公平感,從而提高合作效應(yīng),增加雙方的合作收益。如加入基于協(xié)作貢獻度的小組互評分?jǐn)?shù),及時反饋各自分配的任務(wù)的完成情況并相互監(jiān)督,促使組員增加自己在小組合作的投入占比?;?qū)⑿〗M成員表現(xiàn)細(xì)化為幾個組成部分,依據(jù)時間投入、成效產(chǎn)出、小組凝聚效果、創(chuàng)新投入等多方面的組合評分方式計算得分,讓組員在各個方面的勞動付出都有具體成績,得到綜合評分。
參考文獻
[1]馬婧.國外協(xié)作學(xué)習(xí)理論的演進與前沿?zé)狳c——基于科學(xué)知識圖譜的研究[J].開放教育研究,2013,19(6):95-101.
[2]朱青梅.薛瓏.知識團隊合作的動態(tài)博弈分析[J].山東社會科學(xué),2010(11):107-110.
[3]李京杰.馬德俊.博弈論與協(xié)作學(xué)習(xí)的組內(nèi)合作及組間競爭問題探討[J].電化教育研究,2010(2):18-21.
[4]史忠翠.魏慧琴.博弈論視角下學(xué)生合作學(xué)習(xí)績效的分析[J].中國教育技術(shù)裝備,2009(18):19-21.
[5]潘涌.加入WTO與新世紀(jì)的中國教育[J].教育研究,2001,22(2):27-29.