江世杰, 韓戰(zhàn)鋼
(北京師范大學(xué)管理學(xué)院,北京 100875)
Agent-based modeling(簡(jiǎn)稱ABM)是一種研究復(fù)雜系統(tǒng)的模型化手段,它可以方便地將一些不易數(shù)學(xué)化的規(guī)則納入模型,并且易于表示學(xué)習(xí)、發(fā)展(develop)等外生的信息,這使得它有別于傳統(tǒng)模型方法,如微分方程、統(tǒng)計(jì)分析及系統(tǒng)動(dòng)力學(xué)等[1].其與微分方程模型化方法的主要區(qū)別在于微分方程使用宏觀的變量,如密度,而基于agent的模型方法使用微觀變量,如描述具體的某個(gè)分子或個(gè)體.
在社會(huì)系統(tǒng)等復(fù)雜系統(tǒng)中,包含大量個(gè)體,個(gè)體間相互影響,并且通過(guò)學(xué)習(xí)調(diào)整自己的行為以更加適應(yīng)周圍的環(huán)境.ABM由相互作用的自主agent組成,每個(gè)agent有自己的行為規(guī)則,既能夠影響其他的agent或環(huán)境,也能被其他的agent或環(huán)境所影響.在基于agent的模型的微觀層面,每個(gè)agent所遵循的具體規(guī)則都比較簡(jiǎn)單,但是,在宏觀層面上,agent可以通過(guò)自組織,產(chǎn)生并不一定可以直觀想象出來(lái)的宏觀效果、整體行為(collective behavior)[2].相關(guān)研究使得人們可以在規(guī)則制定時(shí)預(yù)計(jì)到會(huì)產(chǎn)生的系統(tǒng)整體行為,并使得人們可以修改這些規(guī)則,讓系統(tǒng)向著有利于系統(tǒng)整體效益的方向發(fā)展.這種在微觀、宏觀多尺度上產(chǎn)生的并不能用簡(jiǎn)單相加解釋的宏觀效果,被稱為是涌現(xiàn)性(emergence)[1].雖然涌現(xiàn)這一概念已經(jīng)提出很久,但是,其出現(xiàn)機(jī)制和效能并沒有被徹底解決.加州州立大學(xué)的Abbott教授也曾明確指出涌現(xiàn)性是復(fù)雜系統(tǒng)研究的重點(diǎn)關(guān)注對(duì)象(原文為“圣餐”——holy grail)[3].
ABM為觀察和研究復(fù)雜系統(tǒng)中的類似現(xiàn)象提供了強(qiáng)而有力的工具.從種族沖突、免疫系統(tǒng)的模擬到經(jīng)濟(jì)政策分析等[4-6],ABM的應(yīng)用已十分廣泛.近年來(lái),國(guó)際上已經(jīng)有大量的學(xué)者和研究人員投身于ABM的研究和應(yīng)用中,并且得出了一些十分有意義的結(jié)論,本文旨在對(duì)ABM作為一個(gè)復(fù)雜系統(tǒng)模型化方法的一些重要問(wèn)題進(jìn)行簡(jiǎn)要介紹.
ABM的雛形可以追溯到20世紀(jì)40年代.當(dāng)時(shí),第一臺(tái)計(jì)算機(jī)的設(shè)計(jì)者及博弈論的創(chuàng)始人,Von Neumann提出了一個(gè)有趣的想法:人造機(jī)器的自我繁殖.他想象著可以制造一臺(tái)機(jī)器,然后讓它在充滿了零件的池塘里游來(lái)游去,它可以拾起一些部件,并將不同的部件組裝到一起,從而制造出一臺(tái)和自己一樣的機(jī)器.但是,當(dāng)時(shí)的機(jī)器零部件非常昂貴,因此,這個(gè)想法幾乎不可能實(shí)現(xiàn).之后受到他的朋友,數(shù)學(xué)家Ulam的啟發(fā),Von Neumann在二維網(wǎng)格平面上實(shí)現(xiàn)了這一模型.這就是最初的元胞自動(dòng)機(jī).
最廣為人知的元胞自動(dòng)機(jī)當(dāng)屬英國(guó)數(shù)學(xué)家Conway在1970年構(gòu)造的生命模型[7].在Conway的生命模型中,二維網(wǎng)格上的一個(gè)網(wǎng)格代表一個(gè)元胞,每個(gè)元胞都有開和關(guān)兩種狀態(tài)(對(duì)應(yīng)生和滅),元胞的狀態(tài)取決于和它相鄰的元胞的生滅狀態(tài).給定不同的初始狀態(tài),模型就可以在簡(jiǎn)單的規(guī)則作用下演化出奇妙的有規(guī)律的宏觀現(xiàn)象,它驗(yàn)證了復(fù)雜的宏觀模式可以通過(guò)簡(jiǎn)單的個(gè)體規(guī)則演化得到.生命模型成為說(shuō)明涌現(xiàn)和自組織的典型例子.
早期基于平面空間作用關(guān)系的ABM大都模仿了生命模型的結(jié)構(gòu),例如,Epstein和Axtell的Sugarscape模型[8].在這一模型中,agent的拓?fù)潢P(guān)系更加復(fù)雜,agent可以在二維平面上的格子之間移動(dòng),即格子成為agent的環(huán)境而非agent本身.agent可以在環(huán)境中移動(dòng)并獲取能量.類似的工作還有Schelling的種族分離模型[9].
從1940年至今,ABM更多地作為一種思想方法,而非僅僅是技術(shù)[10],已經(jīng)被應(yīng)用到科學(xué)研究的各個(gè)方面,ABM的建模形式也是多種多樣的.但是,一個(gè)基本的ABM還是要包含以下3個(gè)元素[11]:
a.一定數(shù)量的agent;
b.一套完備的agent拓?fù)潢P(guān)系和作用規(guī)則;
c.agent的環(huán)境,agent在環(huán)境中相互作用,并且與環(huán)境相互作用.
對(duì)于agent的定義,學(xué)者們并未達(dá)成一個(gè)明確的共識(shí).Jennings[12]提出了一個(gè)面向agent的軟件工程(agent-oriented software engineering)概念,即系統(tǒng)中的agent不需要全局的優(yōu)化計(jì)算,而是通過(guò)個(gè)體間相互作用得出最優(yōu)的配合方式,他認(rèn)為這一思路將成為解決分散控制和復(fù)雜系統(tǒng)控制的途徑.以一個(gè)柔性制造系統(tǒng)為例[12],有多個(gè)工件需要經(jīng)過(guò)多個(gè)機(jī)器的多道工序加工時(shí),現(xiàn)有的思路是預(yù)先設(shè)定一個(gè)全局優(yōu)化的時(shí)序,這會(huì)受到加工時(shí)間延遲或機(jī)器加工失誤的影響.而面向agent的思路是,每個(gè)工件和機(jī)器上都附著一個(gè)agent,工件agent需要與機(jī)器agent協(xié)商,協(xié)調(diào)加工順序,以避免集中式預(yù)先計(jì)劃的弊端.也有學(xué)者認(rèn)為,系統(tǒng)的任意獨(dú)立成分都可以視作agent[10].還有學(xué)者則認(rèn)為agent必須能夠針對(duì)以往的“經(jīng)驗(yàn)”學(xué)習(xí)和改變自己的行為.Casti[13]提出agent應(yīng)該包含兩層規(guī)則.一層基本的規(guī)則用于指導(dǎo)agent對(duì)外界的反應(yīng);一層高級(jí)的規(guī)則指導(dǎo)agent學(xué)習(xí)和調(diào)整基本規(guī)則.
還有一些研究人員給出了agent應(yīng)該具有的性質(zhì)[14-16],現(xiàn)將它們列出來(lái).
自主性(autonomy):agent是自主的個(gè)體,沒有中央控制,能夠處理數(shù)據(jù)并與其他agent交換數(shù)據(jù). agent可以與其他的agent發(fā)生相互作用,或在一定的范圍內(nèi)發(fā)生相互作用,這并不影響自主性.agent是主動(dòng)的而不是被動(dòng)的.
異質(zhì)性(heterogeneity):平均意義上的個(gè)體是沒有意義的,個(gè)體是自主的.可以存在agent群體,但是,這是自底向上形成的、相互類似的自組織個(gè)體的集合.agents的屬性設(shè)置或?qū)傩灾等绻枷嗤?則定義為是同質(zhì)的(homogeneous);agent的屬性設(shè)置或?qū)傩灾涤兴煌?則定義為是異質(zhì)的.
積極主動(dòng)與目標(biāo)引導(dǎo)(pro-active/goal-directed):agent的行動(dòng)要達(dá)成一定的目標(biāo).
反應(yīng)與感知(reactive/perceptive):agent可以被設(shè)計(jì)成具有對(duì)周圍環(huán)境的感知能力.agent也可以被賦予先驗(yàn)的知識(shí).
有限理性(bounded rationality):agent可以通過(guò)異質(zhì)性的形式被設(shè)置為有限理性.
相互作用與通訊(interactive/communicative): agent有能力進(jìn)行頻繁的通訊.
移動(dòng)性(mobility):agent具有可移動(dòng)性,即可以在模型的空間中移動(dòng),與agent的可相互作用性并具有智能屬性結(jié)合,可以發(fā)揮出很多應(yīng)用.
自適應(yīng)性與學(xué)習(xí)(adaptation/learning):agent可以設(shè)計(jì)為具有自適應(yīng)性,構(gòu)成復(fù)雜自適應(yīng)系統(tǒng)[17].這樣的設(shè)計(jì)允許agent以記憶與學(xué)習(xí)的形式適應(yīng)環(huán)境變化.agent的自適應(yīng)可以通過(guò)個(gè)體層次(如通過(guò)學(xué)習(xí)改變競(jìng)爭(zhēng)被關(guān)注程度的規(guī)則的概率分布)或群體層次(如通過(guò)學(xué)習(xí)改變agent競(jìng)爭(zhēng)復(fù)制的概率分布)實(shí)現(xiàn).
人們對(duì)以上agent性質(zhì)的描述,有很多不同的觀點(diǎn).例如,異質(zhì)性就不一定是agent的必有特性.很多情況下,同質(zhì)性或異質(zhì)性是在設(shè)計(jì)agent系統(tǒng)時(shí)事先設(shè)計(jì)好的,也就是說(shuō),agent的屬性設(shè)置和屬性值預(yù)先就被設(shè)計(jì)成都相同或是不同.而已有的工作表明,異質(zhì)性的agent可以從同質(zhì)的agent演化而來(lái)[18].另外,可移動(dòng)性也并不一定是 agent系統(tǒng)必須具備的性質(zhì).例如,最初的元胞自動(dòng)機(jī)[7].
對(duì)agent定義的不同見解,并未影響到人們對(duì)這一工具的使用,ABM已經(jīng)被應(yīng)用到了物理、生物、社會(huì)及經(jīng)濟(jì)系統(tǒng)等各個(gè)領(lǐng)域,相關(guān)工作建立的模型從基本粒子的運(yùn)動(dòng),到恐慌人群的疏散[19,20],覆蓋面非常廣泛.
Vicsek等[20]在1996年提出了經(jīng)典的 Vicsek模型,該模型從統(tǒng)計(jì)力學(xué)的角度出發(fā),驗(yàn)證了簡(jiǎn)單的規(guī)則可以產(chǎn)生復(fù)雜的群體行為.Vicsek模型由大量獨(dú)立的agent組成,agent以固定的速度移動(dòng),移動(dòng)方向則是周圍鄰居agent移動(dòng)方向的平均,并且受到隨機(jī)噪聲的影響.他們發(fā)現(xiàn),系統(tǒng)只要滿足agent密度足夠大、噪聲足夠小的條件,就會(huì)演化出相變行為——系統(tǒng)中所有的agent由隨機(jī)的運(yùn)動(dòng)轉(zhuǎn)化為都向同一個(gè)方向運(yùn)動(dòng).這種一致性現(xiàn)象受到了很多人的關(guān)注,之后Jadbabaie等相繼給出了Vicsek模型在各種條件下能夠達(dá)到一致性的理論證明[21-24].實(shí)際上,這種一致性行為在由大量個(gè)體組成的系統(tǒng)里十分常見.從癌細(xì)胞的擴(kuò)散,到魚群的運(yùn)動(dòng)、鳥類的遷徙、大規(guī)模的蝗蟲災(zāi)害,在上面系統(tǒng)中的個(gè)體,大都能夠在速度、方向、或者集結(jié)位置上達(dá)到相當(dāng)程度的一致性.在這種一致性形成的過(guò)程中,信息傳遞和相互作用的方式是怎樣的,它們之間是否存在共同的基本規(guī)則,能否人為地干涉這種一致性的形成等問(wèn)題受到了人們的普遍關(guān)注.
普林斯頓大學(xué)的Couzin[25]通過(guò)一個(gè)簡(jiǎn)單的矢量相疊加的ABM,展示了掌握信息(食物源、遷徙方向、天敵位置等)的個(gè)體在不發(fā)出公共信號(hào)的情況下,如何通過(guò)個(gè)體間的相互作用將信息傳達(dá)給其他個(gè)體.他們還發(fā)現(xiàn),隨著群體規(guī)模的增大,只要其中一小部分的個(gè)體(小于20%)掌握信息,整個(gè)群體就可以基于已有的信息達(dá)成一致性的行為.這一工作對(duì)群體決策中信息的作用進(jìn)行了定量化的分析,為人們通過(guò)控制少量的個(gè)體達(dá)到影響全局宏觀效果的需要提供了一定的理論基礎(chǔ).
Sumpter[26]通過(guò)觀察和模擬蝗蟲的移動(dòng),得到了和Vicsek模型類似的結(jié)果,隨著蝗蟲密度的增加,蝗蟲群體的移動(dòng)由無(wú)序轉(zhuǎn)向有序,這和Vicsek模型[20]得出的群體密度增加導(dǎo)致一致性出現(xiàn)的結(jié)論吻合得很好.他們還研究了魚群并利用ABM手段對(duì)其模擬[27],認(rèn)為多個(gè)體系統(tǒng)中,個(gè)體之間不需要知道具體掌握信息的個(gè)體是哪一個(gè),只是通過(guò)個(gè)體間的相互作用,即發(fā)現(xiàn)周圍做出相同決策的個(gè)體數(shù)量超過(guò)一定數(shù)量就跟隨它們的動(dòng)作,便可以產(chǎn)生一致性的群體決策.并且,這一非線性的決策規(guī)則優(yōu)于單個(gè)個(gè)體的決策和線性化的決策規(guī)則.
歐洲未來(lái)研究所的 Martinoli和 Deneubourg等[28]還做了這樣一個(gè)實(shí)驗(yàn),將幾個(gè)機(jī)器人和一群蟑螂放在一起,通過(guò)設(shè)計(jì)基于局部信息的非線性反饋規(guī)律,最終發(fā)現(xiàn)在這個(gè)混合系統(tǒng)的行為決策中,機(jī)器人和蟑螂所處的地位是一樣的.通過(guò)控制在群體中占少數(shù)的機(jī)器人,可以影響蟑螂的群體決策,從而產(chǎn)生原蟑螂群體不具有的集體行為.這為人們利用自治的機(jī)器裝置研究和干涉多個(gè)體系統(tǒng)的行為提供了可能性.
此外,ABM還常和復(fù)雜網(wǎng)絡(luò)一起被用來(lái)進(jìn)行疾病傳播的研究和模擬[29].研究者通過(guò)模型可以具體地分析人群流動(dòng)的模式和人們通過(guò)社會(huì)關(guān)系相互接觸的方式,而這正是疾病傳播的基本途徑.在這類模擬中,ABM主要用于尋找疾病形成大規(guī)模傳播的條件和遏制其發(fā)生的手段.
其他方面,T aylor等[30]用ABM建立了一個(gè)針對(duì)鯨魚遷徙過(guò)程中對(duì)阿拉斯加海獅的捕食模型.他們認(rèn)為,傳統(tǒng)捕食模型的作用關(guān)系根本不適用于臨時(shí)過(guò)境生物對(duì)境內(nèi)生物生存影響的分析和研究,而ABM為這種新式的捕食模型研究提供了有效的手段.在微觀領(lǐng)域,ABM則主要用于模擬細(xì)胞的行為和相互作用、免疫系統(tǒng)的工作機(jī)制、還有組織的增長(zhǎng)和疾病的產(chǎn)生[5].
在非生命系統(tǒng)方面,T roisi等[31]利用ABM模擬了分子的自組裝行為,他們用agent代表單個(gè)分子,agent的行為規(guī)則遵循分子相互作用的物理規(guī)律.這種類型的模擬已經(jīng)被用于發(fā)現(xiàn)納米材料自組裝行為中的模式形成以及材料科學(xué)中其他自組織模式的研究.
在社會(huì)經(jīng)濟(jì)系統(tǒng)中,早期較為典型的成果是諾貝爾獎(jiǎng)獲得者 Schelling[9]對(duì)種族隔離的研究. Schelling構(gòu)造了一個(gè)人類群居分離的模型,在模型中,每種人群都希望避免成為少數(shù)人,人們都傾向于與同類居住在一起,基于這一簡(jiǎn)單的條件,Schelling發(fā)現(xiàn)只有完全的隔離才是穩(wěn)定的均衡點(diǎn).這一模型說(shuō)明了個(gè)人動(dòng)機(jī)是如何轉(zhuǎn)化成為集體行為的,并得出結(jié)論,種族隔離是個(gè)人選擇的結(jié)果.
美國(guó)波士頓 NECSI(New England Complex Systems Institute)的Bar-Yam帶領(lǐng)的研究小組將種族隔離的模型對(duì)應(yīng)到了現(xiàn)實(shí)世界中,利用ABM研究了種族居住區(qū)域之間暴力沖突的產(chǎn)生[4].他們利用已有的人口數(shù)據(jù)作為初始群體,放置于實(shí)際地圖中,地圖上的每個(gè)像素點(diǎn)代表一個(gè)agent,所有的agent都偏好和同種族的人居住.演化的結(jié)果說(shuō)明在特定規(guī)模大小的群體居住區(qū)或者邊界定義不清晰的區(qū)域,最容易產(chǎn)生暴力沖突.充分的混居和清晰劃分的邊界都會(huì)有效地降低暴力發(fā)生的可能性.他們將模型應(yīng)用于前南斯拉夫以及印度的種族沖突中,對(duì)暴力沖突發(fā)生地區(qū)進(jìn)行了預(yù)測(cè),與新聞報(bào)道中暴力沖突發(fā)生地區(qū)符合得很好.這一工作為調(diào)節(jié)地區(qū)關(guān)系和避免種族沖突的發(fā)生提供了政策指導(dǎo).
ABM在社會(huì)學(xué)方面的另一個(gè)重要應(yīng)用是人群流動(dòng)的研究.人群中的個(gè)體之間存在著內(nèi)在的協(xié)同性和排斥性,造成了人群流動(dòng)的整體復(fù)雜性.這一研究方向的標(biāo)志性工作是Helbing于1995年在PRE (Physical Review E)上發(fā)表的文獻(xiàn)[32],他在文中提出以社會(huì)力(social force)的形式對(duì)行人間相互作用具體化和模型化,并用Langevin方程描述行人移動(dòng)的動(dòng)力學(xué)過(guò)程.2000年Helbing等在Nature上發(fā)表的文章又以社會(huì)力模型為基礎(chǔ),建立了一個(gè)恐慌人群疏散的的模型[19].在這個(gè)模型中,他們利用社會(huì)力來(lái)作為agent之間相互作用的基本方式,使得個(gè)體之間會(huì)盡量靠近但又避免碰撞.利用這一模型,他們系統(tǒng)地分析了在恐慌人群疏散時(shí)可能出現(xiàn)的問(wèn)題.模型的演化結(jié)果揭示,在出口處放置障礙物反而會(huì)提高人群疏散的效率.這一工作為檢測(cè)和提高大型集會(huì)場(chǎng)所人群疏散能力提供了基本的研究思路.
個(gè)體之間協(xié)作與分工的演化同樣是一個(gè)ABM研究的前沿問(wèn)題[17].Santa Fe研究所的 Bonabeau等受社會(huì)型昆蟲行為研究的啟發(fā),提出了一個(gè)勞動(dòng)分工合作模型[33].在該模型中,基于信息素的信息共享機(jī)制可使系統(tǒng)涌現(xiàn)出分工與合作的機(jī)制.這一研究的立意在于,定義在微觀層次的相互作用過(guò)程可以涌現(xiàn)出宏觀層次的模式(pattern),并可以推廣到社會(huì)型昆蟲系統(tǒng).展現(xiàn)了復(fù)雜的集體行為(collective behavior)可以從個(gè)體簡(jiǎn)單相互作用中涌現(xiàn).
洛桑的瑞士聯(lián)邦理工(EPFL)與加州理工(Caltech)的學(xué)者們還設(shè)計(jì)了一個(gè)非常有趣的拔棍實(shí)驗(yàn)[34],該實(shí)驗(yàn)以一種巧妙的方式展示了分工與合作在群體中如何涌現(xiàn).這一研究源于如下認(rèn)識(shí):任何單獨(dú)的結(jié)構(gòu)復(fù)雜的系統(tǒng)都無(wú)法保證覆蓋實(shí)際應(yīng)用中無(wú)法預(yù)計(jì)的復(fù)雜任務(wù),而單獨(dú)的結(jié)構(gòu)復(fù)雜的系統(tǒng)設(shè)計(jì)困難、成本高、故障率高、維護(hù)困難.所以,應(yīng)該設(shè)計(jì)多個(gè)體系統(tǒng),每個(gè)個(gè)體具有簡(jiǎn)單的功能,他們相互合作以完成復(fù)雜的任務(wù).在此實(shí)驗(yàn)中,agent之間沒有任何信息共享,合作也可以形成.
經(jīng)濟(jì)學(xué)方面,ABM同樣是一個(gè)有效的研究手段.Tesfatsion將這方面的研究稱為ACE(agentbased computational economics),并于2001年 10月為IEEE的相關(guān)雜志組織了專輯[35].此外,Macy等[36]還利用ABM分析了流動(dòng)性對(duì)美國(guó)市場(chǎng)和日本市場(chǎng)信任機(jī)制形成的影響.一般認(rèn)為流動(dòng)性高的社會(huì)個(gè)體間不容易相互信任,不易形成大的市場(chǎng);流動(dòng)性低的社會(huì)大家容易互相信任,容易形成大的市場(chǎng).這與美國(guó)(流動(dòng)性相對(duì)高,市場(chǎng)相對(duì)完善)和日本(流動(dòng)性相對(duì)低,市場(chǎng)相對(duì)沒有美國(guó)完善)的情況不符.Macy的研究得到了信任度與流動(dòng)性的倒U型關(guān)系,解釋了這一現(xiàn)象.這一工作連同Berry[37]和Henrickson等[38]發(fā)表在PNAS(Proceedings of the National Academy of Sciences)的一系列文章反映了這一研究領(lǐng)域正在受到學(xué)界的高度關(guān)注.
在宏觀經(jīng)濟(jì)學(xué)方面,Fagiolo等[39]認(rèn)為,新古典主義經(jīng)濟(jì)學(xué)要成為一門真正的科學(xué),必須要找到一個(gè)新的理論框架來(lái)替代以前的思路,而目前最有可能成為這一新理框架的正是agent-based computational economics(ACE).Hommes則設(shè)計(jì)了一個(gè)資產(chǎn)定價(jià)模型[40],利用真人控制的agent對(duì)資產(chǎn)進(jìn)行估價(jià),分析了預(yù)期形成的過(guò)程.這一研究方式超越了傳統(tǒng)的數(shù)據(jù)分析手段,將人類的真實(shí)行為引入了模擬.我們相信這種方法在發(fā)掘宏觀涌現(xiàn)的微觀機(jī)制的研究工作中將會(huì)越來(lái)越受到重視.Chen等[6]還將ABM用于模擬彩票市場(chǎng),對(duì)彩票收入的征稅額度進(jìn)行優(yōu)化,其中的agent自適應(yīng)機(jī)制采用了遺傳算法的規(guī)則,并且基于模糊邏輯做出選擇,最終的演化結(jié)果給出了制定稅率的最佳區(qū)間.這一工作為分析和研究宏觀政策的制定和影響提供了很好的范例.
需要補(bǔ)充的是,ABM的模型具體設(shè)計(jì)本文并未具體介紹,這里只涉獵一下其中最重要的一點(diǎn),自適應(yīng)性.agent通過(guò)對(duì)歷史信息的記憶,通過(guò)學(xué)習(xí)達(dá)到對(duì)環(huán)境的適應(yīng).agent系統(tǒng)的學(xué)習(xí)機(jī)制有多種,其中,一種被廣泛使用的學(xué)習(xí)機(jī)制是自增益學(xué)習(xí).自增益學(xué)習(xí)的基本思路是:如果一個(gè)動(dòng)作的效果是正面的,則這個(gè)動(dòng)作應(yīng)該更多地被鼓勵(lì);相反,如果一個(gè)動(dòng)作的效果是負(fù)面的,則這個(gè)動(dòng)作應(yīng)該被抑制.例如,Roth和Erev[41]提出了一個(gè)很好的自增益學(xué)習(xí)機(jī)制,Tesfatsion等[42]后來(lái)又進(jìn)行了改進(jìn).這個(gè)機(jī)制對(duì)于可能采取的每個(gè)動(dòng)作都設(shè)置一個(gè)采用概率,并通過(guò)執(zhí)行后的收益情況調(diào)整這些概率的值,達(dá)到自適應(yīng)的目的.
無(wú)論是自頂向下的模型方法(如用微分方程建模)還是自底向上的模型方法(如ABM),都是對(duì)客觀世界現(xiàn)象的描述,不存在孰優(yōu)孰劣之分.ABM更適合描述基于規(guī)則演化的系統(tǒng)或者微觀相互作用的性質(zhì),但對(duì)于大規(guī)模的多個(gè)體相互作用系統(tǒng),如1023量級(jí)的分子相互作用,ABM的計(jì)算效率極低,不如基于微分方程的模型更有效.ABM也與其他的模型化手段一樣,會(huì)面臨模型驗(yàn)證的問(wèn)題(validation)的挑戰(zhàn).與實(shí)際實(shí)驗(yàn)數(shù)據(jù)、觀測(cè)數(shù)據(jù)符合,并能夠預(yù)測(cè)新的現(xiàn)象,也同樣是ABM研究需要遵循的基本原則.
[1] HOLLAND J H.Studying complex adaptive systems [J].Journal of Systems Science and Complexity, 2006,19(1):1-8.
[2] HOLLAND J H.HiddenOrder:How Adaptation Builds Complexity[M].San Francisco:Addison Wesley Publishing Company,1995.
[3] ABBOTT R.Challenges for biologically-inspired computing[C]//Proceedings of the 2005 Workshops on Genetic and Evolutionary Computation.Washington, DC:ACM,2005:12-22.
[4] LIM M,M ETZLER R,BA R-YAM Y.Global pattern formation and ethnic/cultural violence[J].Science, 2007,317(5844):1540.
[5] FOLCIK V A,AN G C,OROSZ C G.The basic immune simulator:An agent-based model to study the interactions between innate and adaptive immunity [J].Theoretical Biology and Medical Modelling, 2007,4(1):39.
[6] CHEN S H,CHIE B T,LEE C W.Lottery marketsdesign,micro-structure,and macro-behavior:an agentbased computational approach[C].Proceedings of 4th Computational Intelligence in Economics and Finance, 2005:21-26.
[7] GARDNER M.Mathematical games:The fantastic combinations of John Conway's new solitaire game‘Life' [J].Scientific American,1970,223(4):120-123.
[8] EPSTEIN J M,AXT ELL R.Growing Artificial Societies[M].Cambridge,MA:MIT Press,1996.
[9] SCHELLING T C.Micromotives and Macrobehavior [M].New York:Norton&Company,1978.
[10] BONABEAU E.Agent-based modeling:Methods and techniques for simulating human systems[J].Proceedings of the National Academy of Sciences of the United States of America,2002,99(Suppl 3):7280.
[11] MACA L C M,NORTH M J.Tutorial on agent-based modelling and simulation[J].Journal of Simulation, 2010,4(3):151-162.
[12] JENNINGS N R.On agent-based software engineering[J].Artificial Intelligence,2000,117(2):277 -296.
[13] CASTI J L.Would-beworlds:How simulation is changing the frontiers of science[M].New York:John Wiley&Sons Inc,1997.
[14] WOOLDRIDGE M,JENNINGS N R.Intelligent agents:Theory and practice[J].The Knowledge Engineering Review,1995,10(2):115-152.
[15] FRANKLIN S,GRAESSER A.Is it an agent,or just a program?:A taxonomy for autonomous agents[J]. Intelligent AgentsⅢ,Agent Theories,Architectures, and Languages,1997(1193):21-35.
[16] NORTH M,MACAL C,CAM PBELL P.Oh behave! Agent-based behavioral representations in problem solving environments[J].Future Generation Computer Systems,2005,21(7):1192-1198.
[17] HOLLAND J H.Complex adaptive systems[J].Daedalus,1992,121(1):17-30.
[18] ZHAO E,LIU G,LUO D,et al.Evolving specialization,market and productivity in an agent-based coop-eration model[J].Complex Sciences,2009(5):1564 -1574.
[19] HELBING D,FARKAS I,VICSEK T.Simulating dynamical features of escape panic[J].Nature,2000,407 (6803):487-490.
[20] VICSEK T,CZIRóK A,BEN-JACOB E,et al.Novel type of phase transition in a system of self-driven particles[J].Physical Review Letters,1995,75(6): 1226-1229.
[21] JADBABAIE A,LIN J,M ORSE A S.Coordination of groups of mobile autonomous agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[22] REN W,BEARD R W.Consensus seeking in multiagent systems under dynamically changing interaction topologies[J].IEEE Transactions on Automatic Control,2005,50(5):655-661.
[23] OLFATI-SABER R,M URRAY R M.Consensus problems in networks of agents with switching topology and time-delays[J].IEEE T ransactions on Automatic Control,2004,49(9):1520-1533.
[24] FAX J A,MURRAY R M.Information flow and cooperative control of vehicle formations[J].IEEE Transactions on Automatic Control,2004,49(9):1465 -1476.
[25] COUZIN I D,KRAUSE J,FRANKS N R,et al.Effectiveleadership and decision-making in animal groups on the move[J].Nature,2005,433(7025):513 -516.
[26] BUHL J,SUMPTER D,COUZIN I D,et al.From disorder to order in marching locusts[J].Science, 2006,312(5778):1402.
[27] WARD A,SUMPTER D,COUZIN I D,et al.Quorum decision-making facilitates information transfer in fish shoals[J].Proceedings of the National Academy of Sciences,2008,105(19):6948.
[28] HALLOY J,SEM PO G,CAPRARI G,et al.Social integration of robots into groups of cockroaches to control self-organized choices[J].Science,2007,318 (5853):1155.
[29] CARLEY K M,FRIDSMA D B,CASM AN E,et al. BioWar:Scalable agent-based model of bioattacks[J]. IEEE Transactions on Systems,M an and Cybernetics,Part A:Systems and Humans,2006,36(2):252 -265.
[30] TAYLOR C,KOYUK H,COYLE J,et al.An agentbased model of predator-prey relationships between transient killer whales and other marine mammals [R].Anchorage,AK:University of Alaska Anchorage,2007.
[31] TROISI A,WONG V,RATNER M A.An agentbased approach for modeling molecular self-organization[J].Proceedings of the National Academy of Sciences of the United States of America,2005,102 (2):255.
[32] HELBING D,M OLNAR P.Social force model for pedestrian dynamics[J].Physical Review E,1995,51 (5):4282-4286.
[33] CAMPOS M,BONABEAU E,THERAULAZ G,et al.Dynamic scheduling and division of labor in social insects[J].Adaptive Behavior,2000,8(2):83.
[34] LI L,MARTINOLI A,ABU-MOSTAFA Y S.Learning and measuring specialization in collaborative swarm systems[J].Adaptive Behavior,2004,12(3/ 4):199.
[35] LEBARON B,IZUM I K,UEDA K,et al.Special issue on the agent-based modeling of evolutionary economic systems[J].IEEE Transactions on Evolutionary Computation,2001,5(5):437-560.
[36] MACY M W,SATO Y.Trust,cooperation,and market formation in the US and Japan[J].Proceedings of the National Academy of Sciences of the United States of America,2002,99(Suppl 3):7214.
[37] BERRY B,KIEL L D,ELLIOTT E.Adaptive agents,intelligence,and emergent human organization:Capturing complexity through agent-based modeling[J].Proceedings of the National Academy of Sciences of the United States of America,2002,99(Suppl 3):7187.
[38] HENRICKSON L,MCKELVEY B.Foundations of“new” social science:Institutional legitimacy from philosophy,complexity science,postmodernism,and agent-based modeling[J].Proceedings of the National Academy of Sciences of the United States of America, 2002,99(Suppl 3):7288.
[39] FAGIOLO G,ROVENTINI A.On the scientific status of economic policy:a tale of alternative paradigms [R].Verona:Università di Verona,2008.
[40] HOMMES C,SONNEMANS J,TUINST RA J,et al. Coordination of expectations in asset pricing experiments[J].Review of Financial Studies,2005,18 (3):955.
[41] ROTH A E,EREV I.Learning in extensive-form games:Experimental data and simple dynamic models in the intermediate term[J].Games and Economic Behavior,1995,8(1):164-212.
[42] NICOLAISEN J,PET ROV V,TESFATSION L. Market power and efficiency in a computational electricity market with discriminatory double-auction pricing[J].IEEE T ransactions on Evolutionary Computation,2002,5(5):504-523.