楊偉松
(江西科技師范大學(xué)通信與電子學(xué)院, 南昌330013 )
?
間諜經(jīng)紀(jì)人的最優(yōu)偵查規(guī)模和決策閾值
楊偉松
(江西科技師范大學(xué)通信與電子學(xué)院, 南昌330013 )
摘要:為了考察爭(zhēng)當(dāng)少數(shù)者博弈模型中引入間諜經(jīng)紀(jì)人后,間諜的偵查規(guī)模和決策閾值分布情況,考察了在不同比例間諜數(shù)目的情況下,間諜采取優(yōu)勝劣汰的原則調(diào)整更換他們的偵查規(guī)模或決策閾值,發(fā)現(xiàn)當(dāng)間諜數(shù)目較少時(shí),間諜偵查規(guī)模取大數(shù)的數(shù)目比例居多;而當(dāng)間諜數(shù)目較多時(shí),間諜偵查規(guī)模取小數(shù)的比例居多。當(dāng)偵查規(guī)模較小時(shí),間諜傾向于取一半的決策閾值;而當(dāng)偵查規(guī)模較大時(shí),不同間諜的決策閾值分布比較廣泛。
關(guān)鍵詞:爭(zhēng)當(dāng)少數(shù)者博弈;間諜;偵查規(guī)模;決策閾值
0引言
D.Challet和Y.C.Zhang提出的爭(zhēng)當(dāng)少數(shù)者博弈模型[1-2]假設(shè)有N(奇數(shù))個(gè)經(jīng)紀(jì)人,在某時(shí)步必須選擇A方或B方(如表示股票的買賣或開車選擇道路A或道路B等),當(dāng)每個(gè)人獨(dú)立地作出選擇后,進(jìn)入少數(shù)者方的人獲勝(供大于求時(shí),買方獲利;供不應(yīng)求時(shí),賣方獲利)。每個(gè)經(jīng)紀(jì)人依據(jù)過(guò)去記錄的公共信息作出決定。假定記錄僅包含A方或B方是否為獲勝方,而不告知實(shí)際的參與人數(shù),這一系統(tǒng)的公共信息(即取勝方的記錄)可以用二進(jìn)制序列表示,當(dāng)A方為獲勝方時(shí)用”1”表示,否則用”0”表示。還進(jìn)一步假定每個(gè)經(jīng)紀(jì)人的記憶容量有限并且相同,只能記住最近m次的獲勝方記錄,并依賴他們作出當(dāng)前時(shí)刻的決定。一個(gè)記憶容量為m的策略是在給定某種獲勝方記錄(m比特歷史)下對(duì)下一時(shí)刻獲勝方的預(yù)測(cè)。經(jīng)紀(jì)人根據(jù)策略的預(yù)測(cè)選擇去A方或B方,對(duì)給定m,有2m種不同的歷史,22m種不同的策略。
博弈開始時(shí),每人隨機(jī)地從這22m個(gè)策略中抽出S個(gè)(允許相同)作為自己的策略。每過(guò)一時(shí)刻,每人對(duì)作出正確預(yù)測(cè)獲勝方的策略加一虛分,否則扣一分。這樣各人每次決策時(shí),就依據(jù)這些策略的虛分,選擇虛分最高者進(jìn)行決策 (如有多個(gè)相同虛分最高策略,則從中任選一個(gè)進(jìn)行決策)。經(jīng)紀(jì)人共同享有的信息,即m位的二進(jìn)制獲勝方歷史記錄則去掉左邊一位,而在右端加上一位當(dāng)前時(shí)刻的獲勝方記錄。
自從爭(zhēng)當(dāng)少數(shù)者博弈模型提出以后,由于它揭示刻畫了大量社會(huì),經(jīng)濟(jì),生態(tài)系統(tǒng)中的普遍現(xiàn)象,立即成為熱門的研究課題,出現(xiàn)了大量的研究工作。我本人以前也對(duì)這個(gè)模型做過(guò)若干個(gè)研究工作[3-6]。例如,將模型中經(jīng)紀(jì)人的二進(jìn)制串策略看成不同歷史條件下子策略的集合體,對(duì)子策略按成功率從大到小排序,替換成功率小的子策略,或者對(duì)表現(xiàn)好的策略按遺傳算法產(chǎn)生子代策略用來(lái)替換表現(xiàn)差的策略,能夠使模型系統(tǒng)功能和資源利用效率得到優(yōu)化。
You-Yang Yu 等[7]設(shè)想在基本爭(zhēng)當(dāng)少數(shù)者博弈模型引入間諜經(jīng)紀(jì)人,間諜經(jīng)紀(jì)人不具有普通經(jīng)紀(jì)人的對(duì)應(yīng)于各種公共信息歷史條件的二進(jìn)制串策略,而是偵查一小組普通經(jīng)紀(jì)人的決策,然后再采用該小組普通經(jīng)紀(jì)人的少數(shù)方的決策。他們發(fā)現(xiàn)一定比例的間諜經(jīng)紀(jì)人能夠使正常經(jīng)紀(jì)人的成功率變大。
本文考察了特定間諜經(jīng)紀(jì)人數(shù)目比例條件下間諜的最優(yōu)偵查規(guī)模和決策閾值。
1演化模型I
假設(shè)爭(zhēng)當(dāng)少數(shù)者博弈模型系統(tǒng)包含101個(gè)普通經(jīng)紀(jì)人,采用模型的標(biāo)準(zhǔn)策略進(jìn)行決策。然后假設(shè)在模型系統(tǒng)中加入間諜經(jīng)紀(jì)人,間諜經(jīng)紀(jì)人的數(shù)目分10,20,40,60四種情況。間諜經(jīng)紀(jì)人的偵查規(guī)模,也就是偵查的范圍所包含的普通經(jīng)紀(jì)人的數(shù)目分少(11個(gè)),中(51),多(91)3個(gè)檔次。
當(dāng)間諜數(shù)目為10時(shí),讓模型系統(tǒng)演化1 000代,每代演化1 000時(shí)步。演化開始時(shí)普通經(jīng)紀(jì)人的策略虛分和間諜的實(shí)分都置零,讓每個(gè)間諜隨機(jī)選擇他的偵查規(guī)模,即在11,51,91三個(gè)數(shù)目的偵查數(shù)中任意選擇一個(gè)作為他的偵查規(guī)模。每時(shí)刻間諜采納他所偵查的人群中少數(shù)方的決策,每時(shí)刻統(tǒng)計(jì)所有普通經(jīng)紀(jì)人和間諜經(jīng)紀(jì)人的決策,總共人數(shù)少的一方為獲勝方。普通經(jīng)紀(jì)人給他的每個(gè)策略打虛分并根據(jù)虛分進(jìn)行決策的機(jī)制同于爭(zhēng)當(dāng)少數(shù)者博弈基本模型。間諜經(jīng)紀(jì)人根據(jù)偵查做出的決策如果和最后整個(gè)系統(tǒng)的獲勝方相同,則該間諜加一實(shí)分;如果相反,則減一實(shí)分。每代結(jié)束時(shí),實(shí)分最低的5個(gè)間諜將隨機(jī)替換他的偵查規(guī)模。然后新一代開始時(shí)所有普通經(jīng)紀(jì)人的策略虛分和間諜實(shí)分都重新置零。經(jīng)過(guò)1 000代的演化后,間諜的偵查規(guī)模人數(shù)分布如圖1,圖1中橫坐標(biāo)1代表偵查規(guī)模為11,橫坐標(biāo)2代表偵查規(guī)模為51,橫坐標(biāo)3代表偵查規(guī)模為91。
當(dāng)間諜數(shù)目為20時(shí),假設(shè)每代結(jié)束時(shí)5個(gè)實(shí)分最低的間諜隨機(jī)更換偵查規(guī)模,然后新一代開始時(shí)所有普通經(jīng)紀(jì)人的策略虛分和間諜的實(shí)分都重新置零。經(jīng)過(guò)5 000代演化后間諜的偵查規(guī)模人數(shù)分布如圖2所示,從圖1,圖2可以發(fā)現(xiàn)當(dāng)間諜數(shù)目比較少時(shí),擁有最大偵查規(guī)模的間諜數(shù)目比例最大,這說(shuō)明當(dāng)間諜數(shù)目較少時(shí),偵查規(guī)模越大或偵查范圍越廣,越對(duì)間諜的收益有利。
當(dāng)間諜數(shù)目分別為40或60時(shí),假設(shè)每代結(jié)束時(shí)10個(gè)實(shí)分最低的間諜隨機(jī)更換偵查規(guī)模,然后新一代開始時(shí)所有普通經(jīng)紀(jì)人的策略虛分和間諜的實(shí)分都重新置零。經(jīng)過(guò)1 000代演化后間諜的偵查規(guī)模人數(shù)分布分別如圖3和圖4所示。
圖1 間諜數(shù)目為10時(shí)經(jīng)過(guò)演化后間諜的偵查規(guī)模人數(shù)分布
圖2 間諜數(shù)目為20時(shí)經(jīng)過(guò)演化后間諜的偵查規(guī)模人數(shù)分布
圖3 間諜數(shù)目為40時(shí)經(jīng)過(guò)演化后間諜的偵查規(guī)模人數(shù)分布
從圖3,圖4可以發(fā)現(xiàn)當(dāng)間諜數(shù)目比較多時(shí),擁有最小偵查規(guī)模的間諜數(shù)目比例最大,這說(shuō)明當(dāng)間諜數(shù)目較多時(shí),偵查規(guī)?;騻刹榉秶叫?,越對(duì)間諜的收益有利。
2演化模型II
假設(shè)爭(zhēng)當(dāng)少數(shù)者博弈模型系統(tǒng)包含101個(gè)普通經(jīng)紀(jì)人和40個(gè)間諜經(jīng)紀(jì)人,間諜經(jīng)紀(jì)人的偵查規(guī)模,仍然分少(11個(gè)),中(51),多(91)3個(gè)檔次。原始間諜經(jīng)紀(jì)人采用偵查范圍少數(shù)方的決策,即小于偵查小組人數(shù)一半的那方的決策。我們假設(shè)間諜經(jīng)紀(jì)人可以采用不同的決策閾值,即不一定采納人數(shù)小于偵查小組人數(shù)一半的那方?jīng)Q策,而可能取其他的閾值。閾值比例p可以取10%,20%,…,90%,100%等10個(gè)數(shù)中的任一個(gè),因而采用不同決策閾值的間諜也就分成了10個(gè)小組。某間諜偵查小組中若A方的人數(shù)小于偵查小組的總?cè)藬?shù)即偵查規(guī)模乘以閾值比例p,則該間諜就決定去A方,否則去B方。
假設(shè)模型系統(tǒng)每代演化1 000時(shí)步,第一代開始前讓每個(gè)間諜隨機(jī)選擇他的決策閾值,并且普通經(jīng)紀(jì)人的策略虛分和間諜的實(shí)分都置零。每時(shí)刻間諜決策的方式如上段所述。每代結(jié)束時(shí),實(shí)分最低的10個(gè)間諜將隨機(jī)替換他的決策閾值。然后新一代開始時(shí)所有普通經(jīng)紀(jì)人的策略虛分和間諜的實(shí)分都重新置零。
當(dāng)間諜的偵查規(guī)模為11時(shí),讓系統(tǒng)演化5 000代,演化后間諜的不同決策閾值人數(shù)分布如圖5所示。
當(dāng)間諜的偵查規(guī)模為51時(shí),讓系統(tǒng)演化1 000代,演化后間諜的不同決策閾值人數(shù)分布如圖6所示。
圖4 間諜數(shù)目為60時(shí)經(jīng)過(guò)演化后間諜的偵查規(guī)模人數(shù)分布
圖5 間諜偵查規(guī)模為11時(shí)經(jīng)過(guò)演化后間諜的決策閾值人數(shù)分布
圖6 間諜偵查規(guī)模為51時(shí)經(jīng)過(guò)演化后間諜的決策閾值人數(shù)分布
當(dāng)間諜的偵查規(guī)模為91時(shí),讓系統(tǒng)演化1 000代,演化后間諜的不同決策閾值人數(shù)分布如圖7所示。
從數(shù)值模擬結(jié)果可以看出當(dāng)間諜的偵查規(guī)模較小(11,51)時(shí),間諜的決策閾值以中間值(0.5,0.6)居多,同普通情形類似。而當(dāng)間諜的偵查規(guī)模較大(91)時(shí),間諜的決策閾值分布則比較廣泛,與普通情形不同。
圖7 間諜偵查規(guī)模為91時(shí)經(jīng)過(guò)演化后間諜的決策閾值人數(shù)分布
3討論
從演化模型I的數(shù)值模擬結(jié)果看,間諜與普通經(jīng)紀(jì)人之間明顯存在信息相互作用。當(dāng)間諜數(shù)量較少時(shí),間諜的偵查規(guī)模越大,越能給間諜帶來(lái)有利的收益;而當(dāng)間諜數(shù)量較多時(shí),則變成偵查規(guī)模越小,越對(duì)間諜有利,這同我們的直覺推理是相符的。
當(dāng)間諜數(shù)量較少時(shí),模型系統(tǒng)每時(shí)刻的獲勝方基本上就是普通經(jīng)紀(jì)人人數(shù)少的那方,這時(shí)間諜偵查普通經(jīng)紀(jì)人的范圍越大,選擇偵查小組中的少數(shù)方就越可能同該時(shí)刻系統(tǒng)的獲勝方相符,從而越可能帶來(lái)收益。而當(dāng)間諜數(shù)量較多時(shí),較多間諜都選擇進(jìn)入普通經(jīng)紀(jì)人人數(shù)少的一方最后反而會(huì)使這方變成總?cè)藬?shù)多的一方,所以間諜偵查普通經(jīng)紀(jì)人的范圍越小反而越有利。
從演化模型II的數(shù)值模擬結(jié)果看,當(dāng)間諜的偵查規(guī)模較小時(shí),間諜傾向于普通情形,即選擇偵查小組中普通經(jīng)紀(jì)人數(shù)較少一方;而當(dāng)間諜的偵查規(guī)模較大時(shí),不同間諜的決策閾值則分布比較廣泛。
我們認(rèn)為,隨著間諜偵查規(guī)模的增大,如果間諜仍然繼續(xù)保持普通情形,選擇偵查小組中普通經(jīng)紀(jì)人人數(shù)少的一方,由于此時(shí)偵查小組中的普通經(jīng)紀(jì)人數(shù)目已經(jīng)接近整個(gè)系統(tǒng)的普通經(jīng)紀(jì)人的總數(shù)目,因此大多數(shù)間諜會(huì)進(jìn)入到普通經(jīng)紀(jì)人人數(shù)較少的一方,結(jié)果最后反而使該方成為總?cè)藬?shù)較多的一方。所以在偵查規(guī)模很大的情況下,間諜的決策閾值趨向于廣泛分布。
根據(jù)我們經(jīng)過(guò)數(shù)值模擬計(jì)算的結(jié)果,可得出結(jié)論,當(dāng)間諜數(shù)目比例較小時(shí),偵查規(guī)模越大對(duì)間諜越有利;反之,當(dāng)間諜數(shù)目比例較大時(shí),則偵查規(guī)模越小越對(duì)間諜有利。對(duì)于第二種演化模型,間諜數(shù)量固定,當(dāng)間諜的偵查規(guī)模較小時(shí),間諜的決策閾值接近于普通情形;而當(dāng)間諜的偵查規(guī)模較大時(shí),間諜的決策閾值趨向于廣泛分布。我們認(rèn)為這些結(jié)果或結(jié)論對(duì)于包含間諜經(jīng)紀(jì)人和普通經(jīng)紀(jì)人的社會(huì)系統(tǒng)的控制和管理有一定的參考借鑒意義。
參考文獻(xiàn):
[1]Challet D, Zhang Y C. Emergence of cooperation and organization in an evolutionary game[J]. Physica A, 1997, 246(3/4): 407-418.
[2]Challet D, Zhang Y C. On the minority game: analytical and numerical studies[J]. Physica A, 1998, 256: 514-532.
[3]Yang W S, Wang B H, He P, et al, Sub-strategy updating evolution in minority game[J]. Chin Phys, 2003, 12: 931-935.
[4]Yang W S, Wang B H, Quan H J, et al. Strategy uniform crossover adaptation evolution in a minority game[J]. Chin Phys Lett, 2003, 20: 1659-1661.
[5]Yang W S, Wang B H, Wu Y L, et al. Searching good strategies in evolutionary minority game using variable length genetic algorithm[J]. Physica A, 2004, 339: 583-590.
[6]Yang W S, Li P,Zou S S, et al. Local minority game with evolutionary strategies[J]. China Phys Lett, 2006, 23: 1961-1964.
[7]Yu Y Y, Xu C, Gu G Q, et al. Spies in the minority game[J]. Phys Rev E, 2008, 77(1): 011106.
(責(zé)任編輯耿金花)
The Best Investigation Scope and Decision Threshold of Spy Brokers
YANG Weisong
(Jiang Xi Normal University of Science and Technology, Communication and electronic, Nanchang, 330013,China)
Abstract:In order to investigate the distribution pattern of investigation scope and decision threshold of spies when introduce spy agents into the minority game model, we investigate different situations with different spy number proportions. Spies take the principle "win stay, lose move" to adapt their investigation scope or decision threshold. It was found that when spy number is small, the proportion of large investigation scope is in the majority; yet when spy number is large, the proportion of small investigation scope is in the majority. When investigation scope is small, spy prefer to adopt half decision threshold; yet when investigation scope is large, the distribution scope of decision threshold of different spies is widespread.
Key words:minority game; spy; investigation scope; decision threshold
文章編號(hào):16723813(2016)01010704;
DOI:10.13306/j.1672-3813.2016.01.012
收稿日期:2015-09-23
作者簡(jiǎn)介:楊偉松(1977-), 男, 江西南昌人,講師,主要研究方向?yàn)榻?jīng)濟(jì)物理、復(fù)雜性科學(xué)。
中圖分類號(hào):N93;N94;C935;C94
文獻(xiàn)標(biāo)識(shí)碼:A