劉 靜, 劉春燕, 陸征一, 楊 鳴
(1.武警警官學院部隊管理系,四川成都610213; 2.四川師范大學數(shù)學科學學院,四川成都610066;3.中國科學院成都計算機應用研究所,四川成都610041)
復制系統(tǒng)與 Lotka -Volterra 系統(tǒng)[1]是進化博弈中的 2 個重要模型.1998 年,Sigmund[2]在國際數(shù)學家大會(ICM)報告中將Lotka-Volterra系統(tǒng)與復制系統(tǒng)作為2 個主題分別進行了總結,綜述了永久生存性、穩(wěn)定性、異宿環(huán)、極限環(huán)存在性等一系列結果且說明了兩者之間存在等價性.利用兩系統(tǒng)的等價性和中心流形定理[3],楊靜等[4]用異于前人的方法得到了三維Lotka -Volterra 系統(tǒng)極限環(huán)的存在性,汪芳[5]得到三維復制系統(tǒng)在正平衡點處存在中心或全局穩(wěn)定的充分必要條件.
進化博弈[6-7]中具有循環(huán)優(yōu)勢的博弈是近年來學術研究的熱點,其有效地解釋了策略的選擇和進化.人們發(fā)現(xiàn)循環(huán)優(yōu)勢博弈不僅能夠深入的解釋自然選擇理論,還能解釋物種空間分布復雜性[8]和物種進化[9].實例表明,物種多樣性也可以用循環(huán)優(yōu)勢博弈來解釋.學者們還不斷拓寬著經典的石頭-剪刀-布三循環(huán)優(yōu)勢博弈的研究,不僅研究了其吸引性理論[10-11],還將其應用到微觀競爭群體[12]和大范圍生物群落[13-14].四物種循環(huán)演化博弈[15]也具有與石頭-剪刀-布博弈相似的結論,即過快的流動性會破壞系統(tǒng)的生物多樣性.而在四循環(huán)優(yōu)勢博弈中,還會出現(xiàn)三循環(huán)優(yōu)勢博弈中不存在的中性策略對,即存在2 種策略互不入侵的情形.
進化博弈中可考慮同步博弈和交替博弈.同步博弈是指兩位參與者同時做決定,而交替博弈是兩位參與者先后做決定進行博弈.現(xiàn)在的大多數(shù)研究基于同步博弈中較為簡單的策略相互博弈展開的,但對交替博弈中更復雜的策略相互博弈所產生的循環(huán)優(yōu)勢系統(tǒng)的研究還不豐富.本文將在交替博弈中對新規(guī)定下的16 種策略相互博弈產生的三、四循環(huán)優(yōu)勢系統(tǒng)的性質展開研究.先給出了基于行為誤差的交替博弈在不同成本收益比k 值情形下,具有三、四循環(huán)優(yōu)勢的系統(tǒng)的數(shù)量,得到了三循環(huán)優(yōu)勢系統(tǒng)的完全分類和四循環(huán)優(yōu)勢系統(tǒng)的永久生存性;再利用Lotka-Volterra 系統(tǒng)與復制系統(tǒng)的等價性,中心流形定理和實根分離等理論,考慮基于行為誤差的交替囚徒困境中,具有四循環(huán)優(yōu)勢的系統(tǒng)[S4,S8,S10,S15]的極限環(huán)的存在性.
在雙人博弈中參與者Ⅰ和參與者Ⅱ每次博弈都有2 種選擇:合作C 或背叛D,博弈中可出現(xiàn)4種狀態(tài):(C,C)、(C,D)、(D,C)、(D,D),其對應的收益分別為 R、S、T、P.用 qR、qS、qT、qP來表示上一輪獲得收益 R、S、T、P 本輪選擇合作的概率.如果只考慮反應規(guī)則(qR,qS,qT,qP)的空間,這個單位方形由它的 16 個頂點張成,即由向量(uR,uS,uT,uP)張成,其中 ui取 0 或 1 決定于獲得收益 i∈{R,T,P,S}后策略選擇是背叛還是合作.將這些策略記為 Sj,j =0,1,…,15.而(uR,uS,uT,uP)由二進制給出,例如回報者 TFT = (1,0,1,0)表示為 S10.通過文獻[16]計算方法可以得到交替囚徒博弈中16種策略相互博弈所對應的收益,見表1 所示.
表1 具有行為誤差的交替的囚徒困境博弈Tab. 1 Alternating prisoner’s dilemma game with behavioral errors
當支付成本為 c,收益為 b,且 b >c時,即
該博弈稱捐贈博弈,其收益見文獻[16].由達爾文選擇定律可知群體中策略的單位增長率可由(AX)i-X·AX 給出,其中
為當群體處于狀態(tài) X = (x1,x2,…,xn)時,策略 i的收益,X·AX為群體的平均收益.由此,可得單形
上的復制方程
考慮復制系統(tǒng)(1)當 n =2 時的情形,其正平衡點
滿足 xi>0(i =1,2)的解.又由于收益矩陣添加任意函數(shù) f(x),復制系統(tǒng)(1)不會改變.因此,當只有2 種策略相互博弈時,可假設其收益矩陣A 為如下形式
引理 1[16]在收益矩陣為 A 的系統(tǒng)中,如果a、b 不同時為 0 且 ab≤0 時,則當 a > b 時,策略 x1占優(yōu);當 a <b時,策略 x2占優(yōu).
由引理1 可以得到任意兩策略相互博弈的占優(yōu)情形,為實現(xiàn)對成本收益比的完全分類,根據(jù)收益矩陣的特殊性可將 k 分為4 個區(qū)間:
[0,1],[0,3],[0,4],[0,5],[0,6],[0,7],[0,9],[0,12],[0,13],[0,15],[1,5],[1,6],[1,7],[1,12],[1,13],[1,14],[1,15],[3,1],[3,2],[3,13],[3,14],[3,15],[4,2],[4,3],[4,5],[4,6],[4,7],[4,12],[4,13],[4,15],[5,2],[5,6],[5,7],[5,13],[5,14],[5,15],[6,2],[6,15],[7,2],[7,3],[7,6],[7,10],[7,14],[7,15],[8,1],[8,3],[8,4],[8,5],[8,7],[9,1],[9,5],[9,7],[9,13],[9,15],[10,0],[10,1],[10,2],[10,8],[11,1],[11,2],[11,3],[11,5],[11,8],[11,9],[11,10],[11,13],[12,7],[12,13],[12,15],[13,14],[13,15],[14,2],[14,8],[14,10],[15,10].
由此可以得到在具有行為誤差的交替捐贈博弈中的16 種策略相互博弈所形成的三循環(huán)優(yōu)勢系統(tǒng)與四循環(huán)優(yōu)勢系統(tǒng).
其中,三循環(huán)優(yōu)勢系統(tǒng)1、2、3、6 和 7 存在孤立正平衡點.
引理2[5]當復制系統(tǒng)(1)存在正平衡點時,其存在中心的充分必要條件是
且下列條件之一成立:
考慮具有行為誤差的交替捐贈博弈系統(tǒng),合作者(ALLC)S15總是提供幫助;背叛者(ALLD)S0,總是不提供幫助;回報者(TFT)S10當且僅當對手上一回合不提供幫助時,本回合不提供幫助.三循環(huán)優(yōu)勢系統(tǒng)2 中3 個策略相互博弈具有收益矩陣:
因此,由引理2 知三循環(huán)優(yōu)勢系統(tǒng)2 正平衡點處存在中心.
同理,可驗證三循環(huán)優(yōu)勢系統(tǒng) 8、9、10、11 存在中心.
引理 3[5]當復制系統(tǒng)(1)存在正平衡點,即滿足引理2 中的條件1)~3)且
時,該系統(tǒng)全局穩(wěn)定的充分必要條件為下列條件之一成立:
三循環(huán)優(yōu)勢系統(tǒng)7 中具有野心(這個策略只有在相互背叛后才合作,一旦遇到傻瓜便都無情的背叛)的只滿足于 T 的策略 S1=(0,0,0,1),與 S10、S15博弈構成三循環(huán)優(yōu)勢系統(tǒng),現(xiàn)討論其動力學行為.
系統(tǒng)[S1,S10,S15]具有收益矩陣
故三循環(huán)優(yōu)勢系統(tǒng)7 滿足引理3 中條件6),具有全局穩(wěn)定性.
保留系統(tǒng)[S1,S10,S15]中的策略 S1與回報者S10,將合作者S15替換成與策略S1恰好完全相反的策略S14(該策略稱為“滯后的傻瓜”只有在相互背叛后才選擇背叛),三策略組成系統(tǒng)6,此系統(tǒng)仍是三循環(huán)優(yōu)勢系統(tǒng)且具有全局穩(wěn)定性.
具有正平衡點的三優(yōu)勢循環(huán)系統(tǒng),如果其正平衡點不存在中心且非全局穩(wěn)定,那么其平衡點為不穩(wěn)定焦點,即三循環(huán)優(yōu)勢系統(tǒng)1、3 的正平衡點為不穩(wěn)定焦點.
三循環(huán)優(yōu)勢系統(tǒng)1 具有收益矩陣
做負變換有收益矩陣
滿足引理3 中條件1).因此三循環(huán)優(yōu)勢系統(tǒng)1 做負變換后是全局穩(wěn)定的,原系統(tǒng)1 除正平衡點外異宿環(huán)全局吸引的.由此可知:當時,三循環(huán)優(yōu)勢系統(tǒng)2、8、9、10、11 存在中心,三循環(huán)優(yōu)勢系統(tǒng)6、7 具有全局穩(wěn)定性,三循環(huán)優(yōu)勢系統(tǒng)1、3除正平衡點外異宿環(huán)全局吸引.同理,結合引理1 ~3,得到定理.
定理1在具有行為誤差的交替捐贈博弈中,當成本收益比k∈(0,1)不同取值時,可以對具有正平衡點的三循環(huán)優(yōu)勢系統(tǒng)關于動力學行為進行完全分類,見表2 所示.對應相圖如圖1 所示,其中空心表示不穩(wěn)定駐點,實心表示穩(wěn)定駐點.
圖1 三循環(huán)優(yōu)勢系統(tǒng)動力學行為相圖Fig. 1 Phase diagram of dynamic behavior of three-cycle superior system
表2 具有行為誤差的交替捐贈博弈中不同成本收益比三循環(huán)優(yōu)勢系統(tǒng)的完全分類Tab. 2 A complete classification of three-cycle advantage systems with different cost-benefit ratios in an alternating donation game with behavioral errors
經運算得到了不同成本-收益比下交替捐贈博弈中四循環(huán)優(yōu)勢系統(tǒng)的數(shù)量,下面將進一步討論存在正平衡點的四循環(huán)優(yōu)勢系統(tǒng)的永久生存性.具有正平衡點的四循環(huán)優(yōu)勢系統(tǒng)如表3 所示.
表3 存在正平衡點的四循環(huán)優(yōu)勢系統(tǒng)Tab. 3 Four-cycle advantage systems with positive equilibriums
定義1[17]對于Sn上的復制方程
(4)式的永久生存性即存在 δ >0 使得對所有 i,只要 xi(0)>0,就有
對于(5)式永久生存性還需存在D,使得
引理 4[17]復制系統(tǒng)(1)為永久生存的,如果存在向量P∈int Sn使得
對所有駐點x∈bd Sn成立.
定理2具有收益矩陣
將邊界駐點分別帶入(8)式有:
又由 p1,p2,p3,p4>0,且 p1+p2+p3+p4=1,不等式可簡化為等價形式:
其中,不等式4)~6)恒成立.因此驗證系統(tǒng)的永久生存性只需適當?shù)娜∠蛄縋使其滿足不等式1)~3)即可.令則滿足P的所有限制條件,故存在向量P 使得(8)式成立,得證.
系統(tǒng)[S0,S7,S14,S10]具有收益矩陣:
將其邊界駐點帶入(8)式有:
又P∈int Sn,即P是非負的,與1)矛盾.由此,該系統(tǒng)不滿足永久生存性的充分條件.同理,可驗證存在正平衡點的四循環(huán)優(yōu)勢系統(tǒng)的永久生存性,從而定理2 得證.
在第二節(jié)中是以交替捐贈博弈為背景展開討論的,接下來在更一般的交替囚徒困境中討論極限環(huán)的存在性和穩(wěn)定性.
在雙人博弈中若收益關系滿足:S <0,S < P <R <T 和 T+S <2R,則稱為囚徒困境.
考慮具有收益矩陣
的復制系統(tǒng),由 n 維復制系統(tǒng)與 n -1 維Lotka -Volterra系統(tǒng)的等價性,具有收益矩陣(11)的復制系統(tǒng)相對應的Lotka-Volterra系統(tǒng)為:
假設正平衡點存在,則
下面給出本文的主要結果.
定理3具有收益矩陣(11)的四循環(huán)系統(tǒng)(1)如果有正平衡點,則當參數(shù)適當選取時,至少存在一個不穩(wěn)定的極限環(huán).
又根據(jù)高(n)維系統(tǒng)構造極限環(huán)的一般降維原理,系統(tǒng)線性部分在正平衡點處的特征值具有非正實部,且需 n -2 個負實部.對此問題可由(14)式保證:
又(13)和(14)式等價于
在(15)式條件下,令
則系統(tǒng)的收益矩陣變換為
(16)式具有一個負特征值和一對共軛純虛根特征值[18]當且僅當
即
對系數(shù)矩陣(16)做變換 y = Tx,
fij、gij是關于R 的高次多項式,則變換后系統(tǒng)線性部分具有以下形式
其中aij是關于R 的高次多項式.變換后的線性系統(tǒng)有一對共軛純虛特征值和一個負實特征值,現(xiàn)計算局部中心流形 y3= h(y1,y2).
將 y3= h(y1,y2)展開為
并代入不變流形[3]所滿足的方程求得一階焦點量
其中,f1、f2、g1、g2、g3、g4分別是 6、90、31、8、20、9項的多項式.
為得到小擾動極限環(huán),需在滿足(17)式的條件下判斷一階焦點量的正負性.又(17)式精確到10-100的 3 個區(qū)間形式解分別為[a1,b1]、[a2,b2]、[a3,b3],其中分數(shù)a2、a3的分子分母分別是長度為103、101 位的整數(shù),分數(shù)b2、b3的分子分母是長度為103 和102 位的整數(shù).又(17)式與L1的分子分母的結式都不為零,因而與L1的分子分母都無公根.即在條件(17)下L1分子分母的所有因子都不為零,故判斷L1的正負性只需通過判斷非平方因子f1、f2、g1的正負性即可.
利用實根分離算法[18]的極大極小多項式方法有
即當 R 在區(qū)間[a1,b1]上時,L1<0.同理可得:
f1|[a2,b2]> 0, f2|[a2,b2]< 0, g1|[a2,b2]> 0,f1|[a3,b3]> 0, f2|[a3,b3]< 0, g1|[a3,b3]> 0.因此,當 R∈[a2,b2]或 R∈[a3,b3]時,L1> 0.由Hopf分支[19]可判定 Lotka-Volterra 系統(tǒng)(12)存在不穩(wěn)定極限環(huán),再由具有收益矩陣(11)的復制系統(tǒng)與Lotka-Volterra系統(tǒng)(12)的同胚性定理3 成立.