周建新,劉明華,沈小偉,吳金秀
(1. 華北理工大學(xué)電氣工程學(xué)院,河北 唐山 063210;2. 華北理工大學(xué)以升創(chuàng)新教育基地,河北 唐山 063210)
生命起源于合作,合作行為在自然界和人類文明社會(huì)中十分普遍,是自然界和人類社會(huì)得以演化的重要基礎(chǔ),如蟻群和蜂群中分工合作是種群繁衍生息的保證,人類相互合作形成社會(huì)結(jié)構(gòu)以維持社會(huì)正常發(fā)展等。如何形成和維持合作行為,是當(dāng)前經(jīng)濟(jì)學(xué)、生態(tài)學(xué)、社會(huì)學(xué)、政治學(xué)及信息科學(xué)研究的重要問題。然而,現(xiàn)實(shí)中的合作往往并不容易達(dá)成,“搭便車”、公共資源過度使用等行為隨處可見,使合作陷入困境[1]。
關(guān)于合作行為的達(dá)成,諸多領(lǐng)域的學(xué)者提出了許多方法和機(jī)制。其中,Martin A·Nowak總結(jié)了生物之間“合作”得以達(dá)成的五種機(jī)制[2]:親緣選擇[3]、直接互惠[4]、間接互惠[5]、空間互惠[6]以及群體選擇[7]。而空間互惠作為一種促進(jìn)合作的機(jī)制,引起了眾多學(xué)者的廣泛關(guān)注。不同的空間結(jié)構(gòu)對(duì)合作行為的演化有不同的影響,如張建磊等人研究了隨機(jī)規(guī)則網(wǎng)絡(luò)中合作行為的演化,指定部分個(gè)體的策略,研究表明在隨機(jī)規(guī)則網(wǎng)絡(luò)中只要指定足夠多的個(gè)體策略就能使其占據(jù)主導(dǎo)地位[8]。Feng Shu等人研究了二維網(wǎng)格中雪堆博弈的演化機(jī)制,引入記憶機(jī)制,研究表明在二維網(wǎng)格中隨著記憶能力的增強(qiáng),合作水平明顯提高[9]。在空間互惠的基礎(chǔ)上,多種提高合作水平的機(jī)制被提出,如移動(dòng)性、信譽(yù)、懲罰、噪聲和寬容等。Vainstein將移動(dòng)性引入合作行為的研究中,研究表明合作者可以通過移動(dòng)逃避背叛者而形成合作者團(tuán)簇來抵抗背叛者的入侵,合作水平明顯提高[10]。廖列法和孫瑋等人研究了噪聲對(duì)個(gè)體行為的影響,研究表明適度的噪聲值能夠促進(jìn)合作行為的涌現(xiàn)[11]。Shuhua Zhang等人研究了空間公共物品博弈中寬容的懲罰對(duì)合作演化的影響,研究表明寬容的懲罰通過加強(qiáng)空間互惠促進(jìn)了合作[12]。
除上述機(jī)制外,近年來信號(hào)傳遞對(duì)合作的促進(jìn)作用也得到了各領(lǐng)域研究學(xué)者的關(guān)注。信號(hào)傳遞是傳統(tǒng)信息經(jīng)濟(jì)學(xué)研究的主要內(nèi)容,信號(hào)包括方言、膚色以及著裝等各種可識(shí)別的標(biāo)簽,向?qū)Ψ絺鬟_(dá)某種信息,對(duì)個(gè)體決策有較強(qiáng)的影響。如Emma Cohen等人研究了以口音為標(biāo)簽的個(gè)體行為演化,通過口音的識(shí)別將合作者進(jìn)行分類,研究表明口音的識(shí)別促進(jìn)了合作[13]。Francisco C. Santos等人研究了有限種群中預(yù)博弈信號(hào)及其數(shù)量對(duì)合作演化的影響,研究表明預(yù)博弈信號(hào)促進(jìn)了合作行為的產(chǎn)生,并且預(yù)博弈信號(hào)數(shù)量的增加使得合作者避免被背叛者欺騙,提高了合作水平[14]。L Spector等人研究了遺傳穩(wěn)定性和環(huán)形網(wǎng)絡(luò)結(jié)構(gòu)對(duì)基于標(biāo)簽的利他主義的影響,研究表明遺傳穩(wěn)定性和環(huán)形結(jié)構(gòu)在較大范圍內(nèi)促進(jìn)了利他主義的產(chǎn)生及發(fā)展[15]。
空間結(jié)構(gòu)和信號(hào)都會(huì)對(duì)合作行為產(chǎn)生重要影響。然而,關(guān)于空間結(jié)構(gòu)中信號(hào)是否影響合作行為的演化,目前仍然缺乏這方面的研究,此外也缺乏信號(hào)如何影響合作行為演化的機(jī)制分析。本文將對(duì)二維空間網(wǎng)格中信號(hào)傳遞對(duì)合作行為演化的影響進(jìn)行研究,建立基于信號(hào)傳遞的合作行為演化模型,對(duì)演化過程進(jìn)行仿真,從合作水平、策略分布和演化機(jī)制等三個(gè)方面進(jìn)行分析。與無信號(hào)情況進(jìn)行對(duì)比,研究信號(hào)對(duì)個(gè)體行為演化的影響。
囚徒博弈是現(xiàn)有研究合作問題最為廣泛的模型之一,其博弈過程中個(gè)體兩兩交互,個(gè)體在合作和背叛這兩種行為中進(jìn)行選擇。如果雙方都選擇合作,則都獲得報(bào)酬R;如果雙方都選擇背叛,則都獲得懲罰P;如果一個(gè)個(gè)體選擇背叛,另一個(gè)個(gè)體選擇合作,則合作者獲得收益S,而背叛者獲得收益T[16]。如圖1為囚徒博弈收益矩陣,其中參數(shù)滿足:T>R>P>S且2R>T+S。Martin A. Nowak和Robert M. May于文獻(xiàn)[17]中提出了簡(jiǎn)化的囚徒博弈模型,即T=b>1,R=1,P=0,S=0。該模型中的參數(shù)只有b,便于分析,被廣泛采用,因此本文中囚徒博弈參數(shù)的設(shè)置與其保持一致。
圖1 囚徒博弈收益矩陣
當(dāng)演化博弈過程中沒有信號(hào)時(shí),個(gè)體采取純合作策略或純背叛策略。而當(dāng)演化過程中存在信號(hào)時(shí),個(gè)體根據(jù)對(duì)方發(fā)出的信號(hào)進(jìn)行決策。本文中信號(hào)分為信號(hào)0和信號(hào)1兩種,只作為表示符號(hào),沒有特殊意義。文中將策略定義為一個(gè)2維向量,其中第1維表示收到信號(hào)0時(shí)個(gè)體采取的行動(dòng),第2維表示收到信號(hào)1時(shí)個(gè)體采取的行動(dòng),即[收到信號(hào)0采取的行動(dòng),收到信號(hào)1采取的行動(dòng)]。根據(jù)策略和信號(hào)的不同將個(gè)體分為利他者、排外者、諂媚者和背叛者,如表1所示,其中合作行為用C表示,背叛行為用D表示。
表1 個(gè)體分類
Fermi函數(shù)被諸多學(xué)者廣泛采用作為策略更新規(guī)則,其特點(diǎn)是個(gè)體能夠依概率調(diào)整自己的策略,既有可能保持策略不變,又有可能學(xué)習(xí)對(duì)方的策略。Fermi函數(shù)的具體機(jī)制如下。
博弈個(gè)體i隨機(jī)選擇一個(gè)鄰居j,個(gè)體i依如下概率調(diào)整自己的策略
(1)
其中,P(si←sj)為個(gè)體i選擇學(xué)習(xí)個(gè)體j的策略的相對(duì)概率,wi和wj分別為個(gè)體i和個(gè)體j的收益,K為選擇強(qiáng)度,0≤K<+∞。K值描述了策略選取過程中的理性程度,K→0表示個(gè)體選擇完全理性,K→+∞表示個(gè)體選擇完全隨機(jī)[18]。根據(jù)最大收益與最小收益之差,文中選擇K=0.1。個(gè)體若選擇學(xué)習(xí)對(duì)方,則學(xué)習(xí)對(duì)方的信號(hào)及其策略,否則保持信號(hào)及策略不變。
當(dāng)演化過程中不存在信號(hào)時(shí),合作水平定義為合作者數(shù)目與個(gè)體總數(shù)的比值,即
(2)
其中,ρ1代表無信號(hào)合作水平,nc代表合作者數(shù)目,N為個(gè)體總數(shù)。
當(dāng)演化過程中存在信號(hào)時(shí),個(gè)體合作程度定義為個(gè)體對(duì)其所有鄰居采取合作行為的數(shù)目與其鄰居總數(shù)的比值,即
(3)
其中,xi代表個(gè)體i對(duì)其鄰居采取合作行為的數(shù)目,n為個(gè)體i周圍鄰居數(shù)目,該模型采用von Neumann鄰居,n=4??傮w合作水平定義為個(gè)體的合作程度之和與個(gè)體總數(shù)的比值,即
(4)
其中,ρ2代表有信號(hào)合作水平,ci代表個(gè)體i的合作程度,N為個(gè)體總數(shù)。
該空間博弈的動(dòng)態(tài)演化過程如圖2所示,具體步驟如下。
step1:初始化一個(gè)100*100的二維網(wǎng)格,格子中放置個(gè)體,個(gè)體隨機(jī)選擇利他者、排外者、諂媚者和背叛者四種策略之一和兩種信號(hào)之一;
step2:每個(gè)個(gè)體同它所有的von Neumann鄰居進(jìn)行囚徒博弈并計(jì)算收益;
step3:根據(jù)Fermi函數(shù)進(jìn)行策略更新;
step4:重復(fù)step2~step3,直至系統(tǒng)滿足停止條件為止。
圖2 演化博弈流程
本文利用Repast仿真軟件[19-20]對(duì)二維網(wǎng)格中存在信號(hào)傳遞的囚徒博弈演化過程進(jìn)行建模和仿真,每組參數(shù)運(yùn)行2000步,分別從合作水平、策略分布和演化機(jī)制三個(gè)方面對(duì)結(jié)果進(jìn)行分析。
圖3為無信號(hào)和有信號(hào)條件下的合作水平隨時(shí)間的變化(對(duì)數(shù)坐標(biāo))。當(dāng)演化過程中無信號(hào)時(shí),個(gè)體采取純合作策略或純背叛策略。如圖3(a)所示,在無信號(hào)博弈模型中,合作水平隨著時(shí)間的推進(jìn)不斷下降,后期合作水平為0,種群演化到完全背叛狀態(tài)。并且隨著b值的逐漸增大,演化過程中合作水平不斷降低,背叛者入侵合作者的速度越來越快。當(dāng)演化過程中有信號(hào)時(shí),個(gè)體根據(jù)對(duì)方發(fā)出的信號(hào)采取行動(dòng)。如圖3(b)所示,在有信號(hào)博弈模型中,初期由于采取合作行為的個(gè)體未能形成團(tuán)簇而受到背叛者的入侵,合作水平下降,而后隨著時(shí)間的推移,合作水平不斷上升。與無信號(hào)博弈相比,有信號(hào)博弈中合作水平明顯提高。
圖3 合作水平的演化
圖4為有信號(hào)條件下合作水平隨b值的變化,其中不同b值對(duì)應(yīng)合作水平取值為演化過程后500步的平均值。當(dāng)b<1.4時(shí),合作水平較高,能夠達(dá)到80%。而當(dāng)b>1.4時(shí),合作水平急劇下降。因此有信號(hào)條件下個(gè)體平均合作水平隨著b值的增大而降低。
圖4 有信號(hào)合作水平隨b值的變化
圖5為有信號(hào)條件下b=1.4和b=1.6時(shí)利他者、排外者、諂媚者和背叛者的分布情況(對(duì)數(shù)坐標(biāo))。如圖5(a)所示,當(dāng)b=1.4時(shí),利他者和諂媚者在演化初期迅速消失,背叛者有小幅度的增加,而后背叛者減少,排外者增多,隨著時(shí)間的推移排外者不斷增加,遠(yuǎn)遠(yuǎn)多于背叛者,呈現(xiàn)出共存現(xiàn)象。如圖5(b)所示,當(dāng)b=1.6時(shí),利他者和諂媚者在演化初期迅速消失,與b=1.4情況相同。但是隨著b值的增大,演化過程中背叛者增多,與排外者交替變化。在有信號(hào)條件下,排外者和背叛者能夠共存,并且背叛者隨著b值的增大而增多。
圖5 四種策略隨時(shí)間的變化
圖6為有信號(hào)條件下b=1.4和b=1.6時(shí)演化過程的截圖,分別對(duì)應(yīng)時(shí)刻t=1,10,100,200,500,1000,1500和2000,黑色代表合作水平為1,白色代表合作水平為0,灰色代表由式(3)計(jì)算得到的介于0-1之間的合作水平,圓形代表發(fā)出信號(hào)0的個(gè)體,方形代表發(fā)出信號(hào)1的個(gè)體。
從圖6可以看到,發(fā)出同種信號(hào)的排外者聚集形成團(tuán)簇,與其信號(hào)相同的背叛者則徘徊在團(tuán)簇邊緣,并且由于排外者只依據(jù)信號(hào)決定是否合作,導(dǎo)致處于邊緣的背叛者可以逐漸入侵團(tuán)簇,從而使得發(fā)出該類信號(hào)的排外者逐漸減少,背叛者逐漸增多,團(tuán)簇隨著背叛者的不斷入侵而瓦解,此時(shí)整個(gè)團(tuán)簇表現(xiàn)為同類個(gè)體之間的競(jìng)爭(zhēng),且背叛者占優(yōu),整體合作水平呈下降趨勢(shì)。但背叛者的增長(zhǎng)并不是無限制的,隨著背叛者逐漸增多而聚集成群,處于群體邊緣的背叛者又會(huì)被發(fā)出另一種信號(hào)的排外者入侵,使得發(fā)出此種信號(hào)的個(gè)體的總數(shù)逐漸減少,而發(fā)出另一種信號(hào)的個(gè)體的總數(shù)逐漸增加,此時(shí)整個(gè)系統(tǒng)表現(xiàn)為發(fā)出兩種不同信號(hào)的個(gè)體組成的群體之間的競(jìng)爭(zhēng),即群體選擇模式。而后在群體選擇中處于優(yōu)勢(shì)的群體又會(huì)被本群中的背叛者入侵,開始新的循環(huán)。在圖7中,可以更清晰的看到,發(fā)出不同信號(hào)的群體表現(xiàn)出動(dòng)態(tài)的周期變化,群體數(shù)目呈現(xiàn)出此消彼長(zhǎng)的形勢(shì)。無論是b=1.4,還是b=1.6時(shí)系統(tǒng)都表現(xiàn)為這樣的模式。區(qū)別只在于當(dāng)b=1.6時(shí)系統(tǒng)形成的團(tuán)簇更小,背叛者的總數(shù)更多,而每個(gè)循環(huán)的平均時(shí)間更短。
圖6 演化截圖
圖7 發(fā)出不同信號(hào)個(gè)體的比例隨時(shí)間的變化
信號(hào)傳遞為研究個(gè)體合作行為的演化提供了新的思路。本文利用Repast仿真環(huán)境構(gòu)建了有信號(hào)傳遞的合作行為演化模型,并進(jìn)行仿真分析。仿真結(jié)果表明,與無信號(hào)情況相比,合作水平有顯著提高。通過研究信號(hào)傳遞對(duì)個(gè)體行為的影響,能夠清楚地分析出不同b值條件下的策略分布,發(fā)出相同信號(hào)的個(gè)體聚集成群,發(fā)出不同信號(hào)的個(gè)體相互制約的特征。進(jìn)一步的研究可嘗試將信號(hào)傳遞推廣到其它空間結(jié)構(gòu)上,如隨機(jī)網(wǎng)絡(luò)、小世界網(wǎng)絡(luò)、無標(biāo)度網(wǎng)絡(luò)等,預(yù)計(jì)其對(duì)合作行為的演化會(huì)有不同的影響。