辛琦
福建江夏學(xué)院 經(jīng)濟(jì)貿(mào)易學(xué)院,福建 福州 350108
合作在自然和人類系統(tǒng)中極為重要,它是每一個(gè)新的群體組織出現(xiàn)的必要先決條件。演化博弈理論[1]為研究合作提供了有力的框架。研究表明親緣選擇、直接互惠、間接互惠、群體選擇和空間互惠是促進(jìn)合作的五種主要演化機(jī)制[2]。其中,間接互惠意味著“助人者,人助之”,人們總是希望與樂(lè)于助人者(合作者)交往,而遠(yuǎn)離自私者(背叛者)。因此,該機(jī)制能很好地解釋為什么人類社會(huì)中無(wú)血緣、無(wú)種群關(guān)系的個(gè)體之間會(huì)產(chǎn)生合作。
網(wǎng)絡(luò)是描述群體組織及其內(nèi)部關(guān)聯(lián)性的有力工具。近年來(lái),關(guān)于合作行為與網(wǎng)絡(luò)結(jié)構(gòu)的協(xié)同演化問(wèn)題受到廣泛關(guān)注[3-6,8-10]。本文將側(cè)重于研究間接互惠機(jī)制下的網(wǎng)絡(luò)協(xié)同演化問(wèn)題。間接互惠機(jī)制中,聲譽(yù)是個(gè)體合作行為的累積,對(duì)促進(jìn)合作具有重要作用[7]。文獻(xiàn)[8]首次在網(wǎng)絡(luò)動(dòng)態(tài)演化博弈中引入“聲譽(yù)”機(jī)制,個(gè)體根據(jù)聲譽(yù)更換鄰居,斷開與低聲譽(yù)鄰居的連接,并以一定的概率與高聲譽(yù)個(gè)體建立連接,在此基礎(chǔ)上研究網(wǎng)絡(luò)的合作演化。文獻(xiàn)[9]考慮了方格網(wǎng)絡(luò)中,個(gè)體可因不滿所處的聲譽(yù)環(huán)境而產(chǎn)生遷移,進(jìn)而研究遷移行為對(duì)合作演化的影響。文獻(xiàn)[10]改進(jìn)了聲譽(yù)計(jì)算方法,并利用公共物品博弈模型研究考慮成本的伙伴更新行為對(duì)網(wǎng)絡(luò)合作演化的影響。上述文獻(xiàn)都是在網(wǎng)絡(luò)節(jié)點(diǎn)及連邊數(shù)量均不變的情況下,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)由于個(gè)體或者連邊在聲譽(yù)影響下產(chǎn)生移動(dòng)而改變,進(jìn)而研究網(wǎng)絡(luò)的合作演化問(wèn)題。
在實(shí)際的社會(huì)網(wǎng)絡(luò)中,組織因發(fā)展需要會(huì)不斷完善結(jié)構(gòu)形態(tài),調(diào)整網(wǎng)絡(luò)規(guī)模,吸收新的個(gè)體,淘汰劣質(zhì)個(gè)體,而個(gè)體也會(huì)根據(jù)自己的需求進(jìn)入或者離開某個(gè)群體或組織。因此,網(wǎng)絡(luò)結(jié)構(gòu)的改變不僅僅是個(gè)體之間關(guān)聯(lián)的變化,還應(yīng)涉及網(wǎng)絡(luò)規(guī)模的變化。尤其,處于成長(zhǎng)過(guò)程中的網(wǎng)絡(luò),網(wǎng)絡(luò)規(guī)模持續(xù)擴(kuò)大,隨著網(wǎng)絡(luò)結(jié)構(gòu)的不斷演變,其復(fù)雜性[11,12]特征日益凸顯。本文考慮網(wǎng)絡(luò)隨著新個(gè)體的進(jìn)入及其連邊的增加而不斷成長(zhǎng),研究在聲譽(yù)機(jī)制作用下,個(gè)體博弈策略改變和個(gè)體連接選擇雙動(dòng)力下的網(wǎng)絡(luò)共演化問(wèn)題。
描述社會(huì)困境的囚徒困境博弈(Prisoner’s Dilemma Game,PDG)是研究在自私個(gè)體構(gòu)成的群體中合作是如何產(chǎn)生的典型模型。該模型中,兩位博弈者同時(shí)進(jìn)行決策,選擇合作或者背叛策略,由此獲取收益。博弈雙方因相互合作得到報(bào)酬R和相互背叛受到懲罰P,當(dāng)背叛者與合作者相遇時(shí),前者能獲得最高收益T(即背叛誘惑),而后者只有最低收益S。因此,這4個(gè)收益參數(shù)滿足不等式T>R>P>S,并且 2R>T+S。不失一般性,本文以弱囚徒困境[13](即T=b,R=1,P=S=0,且 1≤b≤2)模型為基礎(chǔ)進(jìn)行基于聲譽(yù)的網(wǎng)絡(luò)共演化問(wèn)題的研究。
成長(zhǎng)網(wǎng)絡(luò)的初始結(jié)構(gòu)是一個(gè)由m0個(gè)節(jié)點(diǎn)(個(gè)體)構(gòu)成的全連通網(wǎng)絡(luò),其中,每個(gè)個(gè)體的初始狀態(tài)是聲譽(yù)為1的合作者。考慮網(wǎng)絡(luò)博弈和網(wǎng)絡(luò)成長(zhǎng)兩個(gè)時(shí)間尺度,分別用τD和τT表示,在每一輪時(shí)間尺度τD內(nèi),所有個(gè)體根據(jù)弱囚徒困境模型與周圍鄰居進(jìn)行博弈而獲得相應(yīng)收益,該收益決定了是否需要改變策略,并基于該輪博弈所采取的策略更新個(gè)體聲譽(yù)值;對(duì)于每一輪時(shí)間尺度τT,網(wǎng)絡(luò)會(huì)有一個(gè)新個(gè)體加入,該個(gè)體根據(jù)聲譽(yù)情況與m個(gè)原有個(gè)體建立連接。以下是對(duì)個(gè)體策略演化、聲譽(yù)更新以及新加入個(gè)體的連接選擇方法的具體介紹。
個(gè)體策略演化時(shí),個(gè)體與所有鄰居一一博弈,依據(jù)弱囚徒困境模型的收益矩陣得出每一博弈結(jié)果的收益值,與所有鄰居博弈后的收益之和即為個(gè)體在該輪博弈中獲得的總收益,然后根據(jù)復(fù)制動(dòng)力學(xué)(Replicator Dynamics)演化規(guī)則來(lái)調(diào)整自己的策略,即,對(duì)于個(gè)體i隨機(jī)選擇的鄰居j,當(dāng)j的收益fj(t)大于i的收益fj(t)時(shí),i便以一定的概率向j進(jìn)行策略學(xué)習(xí),并且該概率與兩者的收益差成正比,計(jì)算公式如下。
式中,ki(t),kj(t)分別表示時(shí)間步t時(shí)個(gè)體i和j的度(即,鄰居的數(shù)量)。個(gè)體策略調(diào)整之后,更新其聲譽(yù)值,聲譽(yù)的計(jì)算方法如公式(2)所示[8]。
式中,Ri(t)表示時(shí)間步t時(shí)個(gè)體i的累積聲譽(yù)值;Si(t)表示時(shí)間步t時(shí)個(gè)體i的單次聲譽(yù)值,如果個(gè)體i采取合作策略,則Si(t)=1,否則Si(t)=0;α(α∈[0,1])表示歷史聲譽(yù)的衰減系數(shù),當(dāng)α→0時(shí),歷史聲譽(yù)不起作用,當(dāng)α→1時(shí),歷史聲譽(yù)不會(huì)衰減,個(gè)體聲譽(yù)值為歷次時(shí)間步所得聲譽(yù)值的累加。
網(wǎng)絡(luò)結(jié)構(gòu)演化時(shí),網(wǎng)絡(luò)中新加入一個(gè)個(gè)體,其初始狀態(tài)是隨機(jī)生成的,即,個(gè)體有50%的概率成為一個(gè)合作者,相應(yīng)的初始聲譽(yù)值為1;否則該個(gè)體就是一個(gè)背叛者,初始聲譽(yù)值為0。新個(gè)體在選擇網(wǎng)絡(luò)中已有個(gè)體進(jìn)行連接時(shí),聲譽(yù)越高者獲得連接的概率越大,連接概率的計(jì)算如公式(3)所示。
式中,L(t)表示時(shí)間步t時(shí)網(wǎng)絡(luò)中所有個(gè)體的集合;γ(γ∈[0,∞])表示新加入個(gè)體在選擇原有個(gè)體建立連接時(shí)對(duì)聲譽(yù)的敏感度,當(dāng)γ→0時(shí),新增個(gè)體與網(wǎng)絡(luò)中所有個(gè)體建立連接的概率相等,個(gè)體的聲譽(yù)不起作用;當(dāng)γ→∞時(shí),新增個(gè)體與網(wǎng)絡(luò)中聲譽(yù)最高的個(gè)體以100%概率建立連接。
成長(zhǎng)網(wǎng)絡(luò)的初始結(jié)構(gòu)是一個(gè)全聯(lián)通網(wǎng)絡(luò),只包含m0=3個(gè)個(gè)體,每個(gè)個(gè)體的初始狀態(tài)均為聲譽(yù)值為1的合作者。每個(gè)新增個(gè)體加入網(wǎng)絡(luò)時(shí),與m=2個(gè)原有個(gè)體建立連接。個(gè)體策略演化和網(wǎng)絡(luò)結(jié)構(gòu)演化的時(shí)間尺度滿足關(guān)系τD=10τT[15]。以下分別從網(wǎng)絡(luò)的度分布,聲譽(yù)對(duì)合作演化的影響,背叛誘惑、聲譽(yù)衰減系數(shù)、聲譽(yù)敏感度對(duì)合作演化的影響等方面對(duì)網(wǎng)絡(luò)的演化特征進(jìn)行仿真分析。仿真數(shù)據(jù)是通過(guò)對(duì)網(wǎng)絡(luò)規(guī)模成長(zhǎng)至個(gè)體數(shù)量N=5000的50次獨(dú)立實(shí)驗(yàn)結(jié)果取平均得到。
由圖1可見(jiàn),當(dāng)網(wǎng)絡(luò)成長(zhǎng)為有5000個(gè)個(gè)體時(shí),網(wǎng)絡(luò)結(jié)構(gòu)呈現(xiàn)出冪律分布特征,大多數(shù)個(gè)體的度較小,即只有較少的連邊,但存在少數(shù)具有較大度的個(gè)體,它們是網(wǎng)絡(luò)中其他個(gè)體爭(zhēng)相與之建立連接的對(duì)象。與初始的同質(zhì)的全連通的網(wǎng)絡(luò)結(jié)構(gòu)相比,經(jīng)過(guò)不斷演化,網(wǎng)絡(luò)結(jié)構(gòu)的異質(zhì)性和復(fù)雜性凸顯。圖2表明個(gè)體的度與聲譽(yù)值之間是正相關(guān)關(guān)系。對(duì)應(yīng)圖1和圖2可以看出,雖然度大的個(gè)體的數(shù)量很少,但是他們具有較高的聲譽(yù)值,其原因在于,由于引入了聲譽(yù)機(jī)制,新增個(gè)體傾向于與高聲譽(yù)者建立連接,高聲譽(yù)者往往都是合作者,由于多數(shù)個(gè)體愿意或者已經(jīng)與其相連而成為它的鄰居,使其在博弈收益總量上遠(yuǎn)遠(yuǎn)高于其他個(gè)體,因此能夠保持合作策略不變,聲譽(yù)值不斷上升,進(jìn)而吸引更多的個(gè)體與之相連,如此循環(huán),形成圖1和圖2所呈現(xiàn)的“富者恒富”之特征。
圖1 網(wǎng)絡(luò)的度分布(b=1.5,α=1,γ=1)Fig.1 Distribution of network’s degrees(b=1.5,α=1,γ=1)
圖2 度與聲譽(yù)之間的關(guān)系(b=1.5,α=1,γ=1)Fig.2 Relationship between degree and reputation(b=1.5,α=1,γ=1)
圖3 所示為兩種成長(zhǎng)機(jī)制下背叛誘惑對(duì)網(wǎng)絡(luò)合作率的影響。兩種成長(zhǎng)機(jī)制中,一種是基于聲譽(yù)的網(wǎng)絡(luò)成長(zhǎng)機(jī)制,新增個(gè)體的連接是根據(jù)聲譽(yù)(公式(3))而建立的;另一種是基于收益的網(wǎng)絡(luò)成長(zhǎng)機(jī)制,新增個(gè)體的連接是根據(jù)收益而建立的[15]。曲線R和F分別反映了這兩種成長(zhǎng)機(jī)制下網(wǎng)絡(luò)合作率Cρ與背叛誘惑b的關(guān)系,為網(wǎng)絡(luò)中合作者的數(shù)量,N=5000為網(wǎng)絡(luò)中所有個(gè)體的數(shù)量)。由圖3可見(jiàn),隨著b不斷增大,兩種機(jī)制下網(wǎng)絡(luò)的合作率均呈現(xiàn)下降趨勢(shì)。這理所當(dāng)然是因?yàn)楫?dāng)背叛誘惑越大,人們?cè)綍?huì)為了獲取更高的利益而不惜背叛自己的伙伴,從而導(dǎo)致ρC不斷下降。同時(shí),基于聲譽(yù)成長(zhǎng)的網(wǎng)絡(luò)合作率總是高于基于收益成長(zhǎng)的網(wǎng)絡(luò)合作率,當(dāng)背叛誘惑較小時(shí),兩種網(wǎng)絡(luò)的合作率差別并不大,但是,b越大,這種差別越明顯。其原因在于,如果新增個(gè)體的連接是注重聲譽(yù)而非收益,則在一定程度上可以避免與背叛者連接而遭受損失的風(fēng)險(xiǎn),當(dāng)背叛誘惑越大,所規(guī)避的風(fēng)險(xiǎn)損失也就越大。聲譽(yù)機(jī)制使得高聲譽(yù)者獲得更多的連接,又由于個(gè)體的收益是其與所有鄰居分別博弈后的所有收益之和,因此鄰居數(shù)量越多,個(gè)體獲得高收益的可能性越大,而高聲譽(yù)者的高收益則會(huì)導(dǎo)致其眾多的鄰居向其學(xué)習(xí),采取合作策略,從而不斷促進(jìn)整個(gè)網(wǎng)絡(luò)的合作演化。
圖3 背叛誘惑和聲譽(yù)機(jī)制對(duì)網(wǎng)絡(luò)合作率的影響(α=1,γ=1)Fig.3 Influence of defection temptation and reputation mechanism on network cooperation rate(α=1,γ=1)
圖4 對(duì)比了聲譽(yù)衰減系數(shù)α不同取值時(shí)ρC的變化曲線,圖5是聲譽(yù)敏感度γ不同取值時(shí)ρC的變化曲線。由兩組曲線圖可見(jiàn),無(wú)論α、γ取值如何,ρC總是隨著b值的增大而減少。但是,α和γ的不同取值,決定了ρC下降的速度和幅度。
公式(2)體現(xiàn)了歷史聲譽(yù)會(huì)隨著時(shí)間的流逝而不斷衰減,衰減程度由參數(shù)控制。由圖4可知,本例中,當(dāng)時(shí),ρC曲線基本一致,這是因?yàn)楫?dāng)α較小時(shí),網(wǎng)絡(luò)經(jīng)過(guò)若干時(shí)間步的成長(zhǎng),個(gè)體的歷史聲譽(yù)以較大的幅度產(chǎn)生衰減,其作用幾乎為0;只有當(dāng)α足夠大時(shí),歷史聲譽(yù)的作用才得以體現(xiàn)。如圖4所示,歷史聲譽(yù)作用越大(α越大),越能有效地減少因背叛產(chǎn)生的高收益對(duì)個(gè)體的誘惑,越有利于促進(jìn)網(wǎng)絡(luò)的合作演化。
公式(3)中的聲譽(yù)敏感度γ體現(xiàn)了聲譽(yù)在新增個(gè)體選擇原有個(gè)體建立連接時(shí)所發(fā)揮作用的大小。由圖5可見(jiàn),當(dāng)γ較大時(shí),網(wǎng)絡(luò)合作率較大,也較為穩(wěn)定,幾乎不受背叛誘惑b的影響;當(dāng)γ較小時(shí),網(wǎng)絡(luò)合作率會(huì)隨著背叛誘惑的增大而下降。根據(jù)公式(3),當(dāng)γ越大,聲譽(yù)值越高的個(gè)體會(huì)以越高的概率獲得新增個(gè)體的連接,當(dāng)γ大到一定程度時(shí),新增個(gè)體會(huì)確定與網(wǎng)絡(luò)中聲譽(yù)值最高和次高的兩個(gè)個(gè)體建立連接。正如上文所分析,高聲譽(yù)者獲取高收益,影響大量其他個(gè)體向他們學(xué)習(xí),成為合作者,將網(wǎng)絡(luò)的合作率穩(wěn)定在比較高的水平。而當(dāng)γ較小時(shí),聲譽(yù)值所發(fā)揮的作用并不充分,聲譽(yù)較低的個(gè)體會(huì)以一定的概率得到新增個(gè)體的連接,并在較大的背叛誘惑收益下影響與其相連的所有鄰居,從而降低整個(gè)網(wǎng)絡(luò)的合作率。
圖4 衰減系數(shù)對(duì)網(wǎng)絡(luò)合作率的影響(γ=1)Fig.4 Influence of attenuation coefficient on network cooperation rate(γ=1)
圖5 聲譽(yù)敏感度對(duì)網(wǎng)絡(luò)合作率的影響(α=1)Fig.5 Influence of reputation sensitivity on network cooperation rate(α=1)
合作對(duì)人類社會(huì)的發(fā)展具有重要意義。間接互惠是一種促進(jìn)合作演化的重要機(jī)制,聲譽(yù)作為衡量反復(fù)博弈時(shí)個(gè)體策略特征的指標(biāo),對(duì)間接互惠機(jī)制下的網(wǎng)絡(luò)合作演化具有重要影響。本文構(gòu)建了一個(gè)基于聲譽(yù)的網(wǎng)絡(luò)成長(zhǎng)模型。該模型提供了雙動(dòng)力學(xué)的網(wǎng)絡(luò)共演化機(jī)制,即基于收益的個(gè)體策略演化和基于聲譽(yù)的網(wǎng)絡(luò)結(jié)構(gòu)演化。
通過(guò)數(shù)值仿真分析網(wǎng)絡(luò)度分布的特點(diǎn)、聲譽(yù)機(jī)制的引入和背叛誘惑對(duì)網(wǎng)絡(luò)合作率的影響、聲譽(yù)衰減系數(shù)和聲譽(yù)敏感度對(duì)網(wǎng)絡(luò)合作率的影響,并得出如下結(jié)論:(1)網(wǎng)絡(luò)的節(jié)點(diǎn)度分布具有冪律分布特點(diǎn),并且,聲譽(yù)越高者,度越大。這與現(xiàn)實(shí)的人類社會(huì)網(wǎng)絡(luò)特征相符,一個(gè)人如果越是利他者,則越能吸引其他人與之交往,進(jìn)而更有機(jī)會(huì)獲得更多人的幫助而從中獲利;(2)與注重收益而產(chǎn)生個(gè)體之間的連接相比,基于聲譽(yù)的連接選擇能更好地促進(jìn)網(wǎng)絡(luò)的合作演化,并且,后者比前者具有更強(qiáng)的抗拒背叛誘惑的能力;(3)聲譽(yù)衰減系數(shù)α控制著歷史聲譽(yù)對(duì)當(dāng)下聲譽(yù)累積值的貢獻(xiàn)程度,進(jìn)而影響整個(gè)網(wǎng)絡(luò)的合作演化結(jié)果。α越大,越有利于網(wǎng)絡(luò)合作率的提高,但是,該特點(diǎn)只有在α足夠大時(shí)才表現(xiàn)得比較明顯,否則,歷史聲譽(yù)會(huì)因若干時(shí)間步的不斷重復(fù)衰減而幾乎為0,無(wú)法發(fā)揮作用;(4)聲譽(yù)敏感度γ控制著個(gè)體獲得連接的概率,進(jìn)而影響整個(gè)網(wǎng)絡(luò)的合作演化結(jié)果。γ越大,網(wǎng)絡(luò)合作率越高,抵抗背叛誘惑的能力越強(qiáng),并且當(dāng)γ足夠大時(shí),背叛誘惑幾乎無(wú)法發(fā)揮作用。
本文所提出的網(wǎng)絡(luò)結(jié)構(gòu)的演化側(cè)重于探討隨著個(gè)體數(shù)量的不斷增加,網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,網(wǎng)絡(luò)結(jié)構(gòu)是如何演化的;并且,網(wǎng)絡(luò)的成長(zhǎng)不是依賴于節(jié)點(diǎn)度[14]或者收益[15,16],而是將聲譽(yù)機(jī)制引入了網(wǎng)絡(luò)成長(zhǎng)模型?,F(xiàn)實(shí)社會(huì)中,各種網(wǎng)絡(luò)的規(guī)模并非固定不變,并且聲譽(yù)往往是個(gè)體選擇交往對(duì)象的決定性因素,因此,本文的研究結(jié)果將有助于人們更好地理解現(xiàn)實(shí)社會(huì)網(wǎng)絡(luò)在發(fā)展成長(zhǎng)過(guò)程中,聲譽(yù)機(jī)制是如何發(fā)揮作用,并促進(jìn)網(wǎng)絡(luò)的合作演化。
[1]Smith MJ.Evolution and the Theory of Games[M].Cambridge,UK:Cambridge University Press,1982
[2]Nowak MA.Five rules for the evolution of cooperation[J].Science,2006,314(5805):1560-1563
[3]Szolnoki A,Szabó G.Cooperation enhanced by inhomogeneous activity of teaching for evolutionary Prisoner's Dilemma games[J].Europhysics Letters,2007,77(3):30004
[4]Fu F,Liu LH,Wang L.Evolutionary prisoner's dilemma on heterogeneous Newman-Watts small-world network[J].The European Physical Journal B,2007,56(4):367–372
[5]Santos FC,Pacheco JM,Lenaerts T.Evolutionary dynamics of social dilemmas in structured heterogeneous populations[J].Proc Natl Acad Sci USA,2006,103(9):3490-3494
[6]Hauert C,Doebeli M.Spatial structure often inhibits the evolution of cooperation in the snowdrift game[J].Nature,2004,428(6983):643-646
[7]Nowak MA,Sigmund K.Evolution of indirect reciprocity by image scoring[J].Nature,1998,393(6685):573-577
[8]Fu F,Hauert C,Nowak MA,et al.Reputation-based partner choice promotes cooperation in social networks[J].Physical Review E,2008,78(2):026117
[9]CongR,WuB,QiuY,etal.EvolutionofCooperationDrivenbyReputation-BasedMigration[J].PLoSOne,2012,7(5):e35776
[10]Li Y.The evolution of reputation-based partner-swithching behaviors with a cost[J].Scientific Reports,2014(4):5957
[11]Newman MEJ.The structure and function of complex networks[J].SIAM Review,2003,45(2):167-256
[12]BoccalettiS,LatoraV,MorenoY,etal.Complexnetworks:structureanddynamics[J].PhysicsReports,2006,424(1):175-308
[13]Nowak MA,May R.Evolutionary games and spatial chaos[J].Nature,1992,359(6398):826-829
[14]Albert R,Barabasi AL.Statistical mechanics of complex networks[J].Reviews of Modern Physics,2002,74(1):47-98
[15]Poncela J,Gómez-Garde?es J,Floría LM,et al.Complex cooperative networks from evolutionary preferential attachment[J].PLoS One,2008,3(6):e2449
[16]辛 琦,周 曉.基于動(dòng)態(tài)收益矩陣的成長(zhǎng)網(wǎng)絡(luò)合作演化仿真研究[J].系統(tǒng)仿真學(xué)報(bào),2017(2):319-325
山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)2018年1期