李 峰 沈惠璋 李 莉
摘要:作為著力于研究“理性人的互動行為”的一門學(xué)科,博弈論幾乎可以被運用于經(jīng)濟學(xué)和其它社會科學(xué)的各個領(lǐng)域。近些年來隨著復(fù)雜網(wǎng)絡(luò)和計算機科學(xué)的發(fā)展,更是能夠?qū)⒉┺恼摴ぞ邞?yīng)用到復(fù)雜的多博弈主體系統(tǒng)中。鑒于國內(nèi)對該領(lǐng)域的研究成果尚未形成系統(tǒng)的梳理,文章先是按照競爭博弈和協(xié)調(diào)博弈的脈絡(luò)來對非合作博弈與復(fù)雜網(wǎng)絡(luò)的形成領(lǐng)域內(nèi)的研究成果進行了論述,之后對近些年涌現(xiàn)的外部性和不完全信息的問題進行了探討,文章的最后部分給予了研究的展望。
關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò);競爭博弈;協(xié)調(diào)博弈;不完全信息
一、 背景
作為著力于研究“理性人的互動行為”(Aumann,1985,p35)的一門學(xué)科,博弈論幾乎可以被運用于經(jīng)濟學(xué)和其它社會科學(xué)的各個領(lǐng)域。近些年來隨著復(fù)雜網(wǎng)絡(luò)和計算機科學(xué)的發(fā)展,更是能夠?qū)⒉┺恼摴ぞ邞?yīng)用到復(fù)雜的多博弈個體系統(tǒng)中。在經(jīng)濟學(xué)和其它社會科學(xué)中,不同主體(Agents)間的交互對于產(chǎn)出是十分重要的。在網(wǎng)絡(luò)結(jié)構(gòu)中,主體用頂點(Node)表示,主體之間的特定關(guān)系用邊(Edge)來表示。邊的連接對個體和整體都有影響。用復(fù)雜網(wǎng)絡(luò)來研究經(jīng)濟學(xué)或社會學(xué)關(guān)系時,一個比較公認的邏輯是:網(wǎng)絡(luò)由N個頂點組成,每兩個頂點之間可以有邊連接,考慮有向圖時,一共有N×(N-1)條邊,可能形成的網(wǎng)絡(luò)有2N(N-1)種,考慮無向圖,就有N(N-1)/2條邊,可能形成的網(wǎng)絡(luò)有2N(N-1)/2種不同結(jié)構(gòu)。對于每一條邊,相當于兩個社會經(jīng)濟主體之間的一種合作或交互作用,不但會影響兩個主體的收益,而且還會通過間接連接擴散到其他的主體。所以理性的主體會根據(jù)收益的動力學(xué)特征(收益函數(shù)、最優(yōu)反應(yīng)原則)決定應(yīng)該與哪一個主體建立連接,建立什么樣的連接(策略)。
按照現(xiàn)有文獻,網(wǎng)絡(luò)形成采用的博弈主要分為合作博弈和非合作博弈兩大類。非合作博弈用于復(fù)雜網(wǎng)絡(luò)研究有兩種模式,一是在給定網(wǎng)絡(luò)結(jié)構(gòu)的條件下,參與人對每一連接均按照最優(yōu)反應(yīng)原則進行策略選擇,討論的問題是經(jīng)過多次重復(fù)的博弈,這些策略能否演化到均衡狀態(tài),如Stanley et al.(1994)、Smucker et al.(1994)、Ashlock et al. (1996)、Tesfatsion(1997a)、Tesfatsion(1998)等人的研究成果都是基于上述的研究模式。另一種模式是網(wǎng)絡(luò)結(jié)構(gòu)通過博弈產(chǎn)生,如在Bala & Goyal(2000)、Harrison & Mu?觡oz(2004)等人的研究中,先由靜態(tài)博弈生成的納什均衡構(gòu)成的網(wǎng)絡(luò)有完全圖、空圖和部分連接網(wǎng)絡(luò)等,然后主體再選擇連接策略。在非合作博弈中,常用的方法主要有二人重復(fù)囚徒困境、二人協(xié)調(diào)博弈等,其中有些思想如穩(wěn)定性、學(xué)習(xí)等概念是與演化博弈有關(guān)的。在非合作博弈中,Tesfatsion與Goyal是兩位有代表性的研究者。其中Iowa州立大學(xué)經(jīng)濟和數(shù)學(xué)教授Tesfatsion對經(jīng)濟網(wǎng)絡(luò)的演化和內(nèi)生網(wǎng)絡(luò)的形成研究頗多,還提出了基于主體計算的經(jīng)濟學(xué)(ACE),她在網(wǎng)絡(luò)形成的研究中主要采用基于主體的計算機仿真方法研究重復(fù)的二人囚徒困境博弈。英國Essex大學(xué)的經(jīng)濟學(xué)教授Goyal對協(xié)調(diào)問題研究較多,近年來主要研究網(wǎng)絡(luò)經(jīng)濟中的一些問題,其對社會經(jīng)濟網(wǎng)絡(luò)的研究主要是二人協(xié)調(diào)博弈,以數(shù)理分析為主要手段。
本文對非合作博弈的討論首先將參照Goyal(2003)分為競爭博弈和協(xié)調(diào)博弈來進行,之后再對近些年興起的外部性問題和不完全信息問題進行闡述。
二、 競爭博弈
Stanley et al.(1994)首先對二人囚徒困境重復(fù)博弈進行了研究(IPD),Smucker et al.(1994)、Ashlock et al. (1996)、Hauk(1996)將二人囚徒困境的重復(fù)博弈行為用到了社會經(jīng)濟網(wǎng)絡(luò)中,Tesfatsion(1997a)則在Stanley et al.(1994)的基礎(chǔ)上用演化的重復(fù)二人囚徒困境博弈研究了選擇與拒絕策略,經(jīng)過上述一系列研究發(fā)現(xiàn)加入是否連接的選擇后,相互合作的涌現(xiàn)比標準的重復(fù)博弈快了許多。但下層參與者之間的交互變得更為復(fù)雜和高度的路徑依賴,即使表現(xiàn)出了很大比例的合作行為,也很難從參數(shù)配置概括出演化產(chǎn)出的特征。Hauk(1996)對這類研究進行了綜述,其它的博弈研究也允許參與者通過自己的行為來改變與其它主體連接的概率。Tesfatsion(1997a)對TNG(Ttr-ade Network Game)提出研究交易網(wǎng)絡(luò)市場結(jié)構(gòu)形成和演化的模型,并于1998研究了在Gale & Shapley(1962)提出的匹配機制下貿(mào)交易網(wǎng)絡(luò)的性能問題。Tesfatsion在對TNG問題的研究中考慮了三種市場結(jié)構(gòu):僅包括單純買方和賣方的雙邊市場、由單純買賣雙方和買賣雙重角色參與的部分流動性市場,以及由完全買賣參與者構(gòu)成的內(nèi)生市場。每一種市場下,參與者在競爭環(huán)境下進行重復(fù)的二人囚徒困境博弈,利用Gale-Shapley匹配選擇和拒絕同伴,使用McFadzean & Tesfatsion(1997)開發(fā)的TNG程序庫進行仿真。談?wù)摰闹饕獑栴}包括:外生結(jié)構(gòu)特征與交易網(wǎng)絡(luò)的形成和演化,交易網(wǎng)絡(luò)的形成與交易行為,及其在網(wǎng)絡(luò)中的社會福利產(chǎn)出之間的關(guān)系。
Goyal(1993)提出了單邊連接形成的非合作博弈靜態(tài)模型,得到一些基礎(chǔ)結(jié)論。Bala & Goyal(2000)討論了非競爭情況(如消費者的信息共享、貿(mào)易網(wǎng)絡(luò)中產(chǎn)生的機會、社會救助帶來的巨大好處等)。他們通過研究發(fā)現(xiàn)納什網(wǎng)絡(luò)通常是完全連接的或空的,并提出強均衡的概念——多個均衡引發(fā)了強均衡的概念。如果一個主體在均衡時有多個最優(yōu)策略,當主體改變到等價策略時,網(wǎng)絡(luò)將變得不穩(wěn)定,這要求研究強的納什均衡。在單向網(wǎng)絡(luò)中,只有輪和空圖是強均衡的;在雙向網(wǎng)絡(luò)中,只有星型結(jié)構(gòu)和空圖是強均衡的。
另一個例子是Goyal(2003)關(guān)于利己主義和利他主義的競爭博弈,該博弈中參與人在兩個策略A(利他主義)和E(利已主義)中進行選擇。Wynne-Edwards(1986)、 Eshel & Cavalli-Sforza(1982)指出在演化生物學(xué)中不同物種涌現(xiàn)和堅持利他主義特征的,利他主義有利于更多的復(fù)制,這種好處使得利他主義被堅持和溢出到鄰近區(qū)域,這反過來進一步導(dǎo)致了這種特征的增加。Nowak & May(1992)也做出了基于仿真的類似研究,認為如果沒有改變,利他主義就會在大量的交互場合存在。Goyal(2003)根據(jù)Eshel, Samuelson and Shaked(1998)等人的研究得到定理1和2:
定理1 吸收集合有兩種類型:一是所有參與者都選擇A或E;二是如果由平均不超過2個連續(xù)選E的參與者隔開的長度為三以上的選擇A的鏈,則保持原有狀態(tài),此時平均至少60%的參與者選擇A。
定理2 如果參與者的初始策略選擇是獨立同分布有變量決定的,且概率都為正時,當參與者人數(shù)增大時,收斂到的吸收集有選A超過60%的概率就趨進于1。
而在Goyal & Vega-Redondo(2003)研究中,假設(shè)連接和選擇是同時發(fā)生的,由于采用了單邊連接,得到了與Jackson & Wolinsky(1996)不同的結(jié)果,在整個參數(shù)范圍內(nèi)都能生成星型結(jié)構(gòu)。他們與Feri(2004)、Hojman & Szeidl (2004)的研究不同之處在于商品之間存在競爭,且收益在初始化時就形成,在均衡時可以涌現(xiàn)出大量星型結(jié)構(gòu)。Galeotti & Melendez(2004)讓主體重復(fù)無窮多次囚徒困境博弈以決定連接的成本分攤,也得到了一個星型的均衡結(jié)果。
同時,Goyal & Vega-Redondo(2004)通過直接連接和間接連接以獲得收益和中介租的網(wǎng)絡(luò)研究發(fā)現(xiàn):納什均衡是空的和全連接的網(wǎng)絡(luò)。如果網(wǎng)絡(luò)要求最少連接且沒有圈,長的路徑是不穩(wěn)定的:對于輪狀的網(wǎng)絡(luò),有頂點會離開輪而形成線,從而形成星型的網(wǎng)絡(luò)。Davis & Maschler(1965)指出,任意兩個頂點的任意兩條邊按照Bertrand思想完來全競爭所有的剩余的這種分配是相應(yīng)合作博弈的唯一的核。
Goyal(2000b)研究了交流是有成本的和不完全可靠的信息網(wǎng)絡(luò),討論了納什網(wǎng)絡(luò)與有效網(wǎng)絡(luò)之間的關(guān)系,發(fā)現(xiàn)結(jié)果與完全可靠時是不一樣的。Haller & Sarangi(2005)在Goyal(2000b)的基礎(chǔ)上對異質(zhì)頂點(不同頂點連接的可靠性不同)網(wǎng)絡(luò)中的均衡與有效性進行了討論,發(fā)現(xiàn)結(jié)果包括了完全可靠與同質(zhì)不完全可靠的情況。
Navarro & Perea(2005)研究了非合作博弈在生成森林上形成的子博弈精煉納什均衡與合作博弈均衡的關(guān)系,在一定條件下,頂點通過這一唯一均衡獲得的收益與合作博弈下的收益是一致的(Myerson值)。
Baron et al.(2006)建立了一個允許不可靠連接和組織成本的網(wǎng)絡(luò)形成的策略模型。該模型中連接的建立是有成本的,并證明了納什均衡的存在性與找到它是兩大難題(實際上是NP-問題)。該文提出的一個隨機演化模型,通過解決全局優(yōu)化問題,選出具有隨機穩(wěn)定性的納什網(wǎng)絡(luò)的子集。
三、 協(xié)調(diào)博弈
在多個納什均衡中進行選擇稱為協(xié)調(diào)博弈。Cooper(2001)和Yang(2004)對協(xié)調(diào)博弈(Coordination Games)進行了詳細的討論,這種協(xié)調(diào)往往是在風(fēng)險占優(yōu)和Pareto有效的均衡中進行協(xié)調(diào),理想狀態(tài)是協(xié)調(diào)到Pareto優(yōu)的均衡而非風(fēng)險占優(yōu)的均衡。但Cooper et al.(1992)的實驗表明,協(xié)調(diào)的結(jié)果是風(fēng)險占優(yōu)的,這與參與人對另一方選擇有效策略的可能性的估計有關(guān)。
Hojman & Szeidl(2002)擴展了Bala & Goyal(2000a)的結(jié)果,使用 的協(xié)調(diào)博弈討論了主體在選擇行為的同時也選擇同伴,發(fā)現(xiàn)納什均衡是最少連接的,并呈現(xiàn)輪狀結(jié)構(gòu),均衡行為接近于下層博弈的對稱均衡。
Jackson & Watts(2002a)利用協(xié)調(diào)博弈研究主體根據(jù)過去的結(jié)果來選擇策略的網(wǎng)絡(luò)穩(wěn)定結(jié)構(gòu)的內(nèi)生形成過程,發(fā)現(xiàn)隨機穩(wěn)定均衡是多重的,有時均衡會出現(xiàn)在協(xié)調(diào)博弈的既不有效又不風(fēng)險占優(yōu)的均衡上。
Goyal(2003)在定理4中表明:固定一些交互網(wǎng)絡(luò),從任意的初始策略配置開始,動態(tài)過程在有限時間內(nèi)以概率1收斂于一個吸收的策略集合。吸收策略集合與靜態(tài)社會博弈的納什均衡集合是等價的。而Mailath, Samuelson & Shaked(1997)證明了2×2靜態(tài)社會博弈的納什均衡集合與該博弈的相關(guān)均衡集合是等價的。Ianni(2001)研究了在短期最優(yōu)反應(yīng)動力下收斂到相關(guān)均衡集合。Anderlini & Ianni(1996)研究了關(guān)于噪聲情況下動態(tài)收斂到納什均衡正規(guī)網(wǎng)絡(luò)(每個參與者只與同樣多的鄰居連接),這一結(jié)論與Goyal(2003)不同,后者是依賴于慣性和博弈的協(xié)調(diào)特征,對所有網(wǎng)絡(luò)都成立。Goyal(2003)在定理4.3中提出,在任意連接的網(wǎng)絡(luò)中,假定在每個周期一個主體被選中采用對數(shù)線性反應(yīng)規(guī)則來修改選擇,那么隨機穩(wěn)定性產(chǎn)出就是每個參與者都選擇風(fēng)險占優(yōu)行動。
Goyal & Vega-Redondo(2003,2005)用協(xié)作博弈方式進行伙伴選擇,每個頂點在選擇連接對象時采取單方面連接,并考慮連接成本。個體在成本與收益之間進行權(quán)衡就會形成唯一的均衡交互結(jié)構(gòu)。網(wǎng)絡(luò)形成的動力學(xué)對個體的行為有很大的影響,如果形成邊的成本低于一定的閾值,參與者會協(xié)調(diào)于風(fēng)險占優(yōu)行為,如果高于一定的閾值,就會協(xié)調(diào)于有效的行為。這個結(jié)論對于修改邊的形成過程、不同的形成成本定義、模型的變化以及在間接聯(lián)接者之間不同的連接概率都是魯棒的。
Kandori et al.(1993)和Young(1993)發(fā)現(xiàn)在微小的干擾下群體的選擇長期會協(xié)調(diào)于Harsanyi & Selten(1988)提出的風(fēng)險占優(yōu)策略。按照Foster & Young(1990)的定義,風(fēng)險占優(yōu)的策略是隨機穩(wěn)定的慣例。而Ellison(1993)、Young (1998)對個體與固定數(shù)目的鄰居交互時也得到了這樣的結(jié)論。Jackson & Watts(2002a)假定參與人有辨別是否與其他人建立和去除連接的能力,通過社會協(xié)調(diào)博弈動態(tài)地形成網(wǎng)絡(luò),在這樣一種內(nèi)生的形成過程中,參與人成對進行 的協(xié)調(diào)博弈,發(fā)現(xiàn)了隨機演化穩(wěn)定結(jié)構(gòu)的出現(xiàn),有些結(jié)構(gòu)既不是風(fēng)險占優(yōu)的,也不具有效性。
四、 不完全信息
在2004年以后的文獻中,開始出現(xiàn)明確提及不完全信息條件下網(wǎng)絡(luò)的形成問題。標準的博弈理論和納什均衡是建立在完全理性人和完全信息基礎(chǔ)上的,有限理性理論認為由于時間和空間有限,不可能完全達到目標,在信息不完全和不對稱的情況下,是否還會形成均衡的結(jié)構(gòu),網(wǎng)絡(luò)的整體收益特征會受什么樣的影響等問題近年來受到了研究者們的關(guān)注。Kandori et al.(1993)和Young(1993)曾經(jīng)考慮到參與人的選擇受到輕微擾動后的均衡情況(見3.3),Haller & Sarangi(1990)、Bala & Goyal(2000b網(wǎng)絡(luò)可靠性)研究了不具有完美可靠性的納什網(wǎng)絡(luò)及其結(jié)構(gòu),但并沒有從不完全信息的角度更多地加以討論。
Galeotti & Vega-Redondo(2005)討論了有正外部效應(yīng)的局部交互情況下異質(zhì)頂點組成的復(fù)雜隨機網(wǎng)絡(luò),對總體度分布為Poisson、指數(shù)和無標度(冪律)時的均衡特征,并對網(wǎng)絡(luò)結(jié)構(gòu)與收益情況進行了分析。在這一模型中,參與者對自己屬于哪種分布的信息是不完全的。Galeotti et al.(2006)則研究了了解固定網(wǎng)絡(luò)的位置后整個網(wǎng)絡(luò)的變化對個體行為和社會產(chǎn)出的影響。研究中采用一類普遍的收益函數(shù)并允許網(wǎng)絡(luò)結(jié)構(gòu)的不完全信息。在網(wǎng)絡(luò)博弈中,由于對自己行為邊際收益的影響,個體激勵依賴于鄰居的行為。鄰居的影響有兩個方面:一方面是策略是互補還是替代的,這將決定鄰居行為對自己行為的激勵的影響。另一方面是與鄰居行動大小相關(guān)的期望。實際上,鄰居的行為又依賴于鄰居的鄰居。因而網(wǎng)絡(luò)的信息結(jié)構(gòu)在形成個人最優(yōu)策略時扮演了重要的角色。網(wǎng)絡(luò)是復(fù)雜的對象,只能提供給個體有關(guān)結(jié)構(gòu)細節(jié)的不完美的知識。這一發(fā)現(xiàn)引發(fā)了對網(wǎng)絡(luò)博弈中不完全信息的作用。支持這一說法的經(jīng)驗文獻有Kumbasar, Romney & Batchelder(1994),Bondonio (1998)以及Casciaro(1998)。
五、 評述與展望
經(jīng)濟學(xué)家一般假定組織結(jié)構(gòu)是規(guī)范的,參與的主體是完全理性的。在經(jīng)濟學(xué)中研究網(wǎng)絡(luò)有兩個極端的方法,一種是個體之間相互獨立的標準模型,他們獨立行動,其行為由市場信號協(xié)調(diào);另一種是完全的博弈方法,主體之間是完全依賴的,被賦予巨大的推理能力。Sanjeev & Goyal(2003)定義了非策略交互和策略交互指出:非策略交互是指行為獲得的收益不受其他人行為的影響,而策略交互是指不同行為獲得的收益受到其他人行為的影響,目前用博弈論來研究的比較多。對于社會經(jīng)濟系統(tǒng),往往由于外部效應(yīng)的存在,主體之間的行為會影響到其他直接相關(guān)和間接相關(guān)的主體,因而采用博弈論工具研究主體之間策略交互對網(wǎng)絡(luò)結(jié)構(gòu)與整個網(wǎng)絡(luò)產(chǎn)出結(jié)果的影響是十分重要的。
目前在經(jīng)濟網(wǎng)絡(luò)中應(yīng)用非合作博弈研究主要采取的是二人博弈的方法,一條邊兩端頂點是否連接,選擇何種策略連接一般是用最優(yōu)反應(yīng)原則加以確定,一定的收益函數(shù)與選擇機制可以導(dǎo)致不同的網(wǎng)絡(luò)結(jié)構(gòu)與收益狀態(tài)。但社會經(jīng)濟網(wǎng)絡(luò)中頂點之間的相互作用遠比二人博弈更為復(fù)雜,可視為多人博弈甚至更為復(fù)雜的緾繞關(guān)系,如賦予邊一定的權(quán)數(shù)和性質(zhì),頂點不僅定量地選擇權(quán)數(shù),還將定性地選擇性質(zhì),而且異質(zhì)性不再只是處于不同的主體和擁有不同的概率這么簡單,將人工智能或人工生命的方式引入網(wǎng)絡(luò)博弈作定量或定性的研究,可以研究更為復(fù)雜的問題,也是基于主體計算的經(jīng)濟學(xué)正在努力的方向。
博弈論的不少研究和結(jié)論都是基于實驗的基礎(chǔ)之上的,如囚徒困境、協(xié)調(diào)博弈等。正是這些實驗推動理論的進展,目前關(guān)于社會經(jīng)濟網(wǎng)的研究中,大多數(shù)是實證研究、計算機仿真和理論推導(dǎo)。隨著實驗經(jīng)濟學(xué)的逐步推廣和深入,用實驗的方法對網(wǎng)絡(luò)進行研究也應(yīng)能發(fā)現(xiàn)一定的新結(jié)論,從而為博弈論在網(wǎng)絡(luò)形成及其特征方面的研究展開新的一頁。
參考文獻:
1. Bala, V. and S. Goyal, A Non-Cooperative Model of Network Formation, Econometrica,2000,68(5):1181-1231.
2. Bala, V. and S. Goyal, A Non-Cooperative Model of Network Formation, Econometrica,1999,(68):1181-1230.
3. Bondonio, D, Predictors of accuracy in perceiving informal socal networks, Social Networks,1998,(20):301-330.
4. Davis, M. and M. Maschler, The Kernel of a cooperative game, Naval Research Logistics Quarterly,1965,(12):223-259.
5. Ellison, G., Learning, Local Interaction, and Coordination. Econometrica,1993,(61):1047- 1071.
6. Feri, F., Stochastic stability in networks with decay, mimeo, University of Venice,2004.
基金項目:國家自然科學(xué)基金項目(70671066);博士點基金項目(20070248054)。
作者簡介:沈惠璋,上海交通大學(xué)安泰經(jīng)濟與管理學(xué)院教授、博士生導(dǎo)師;李峰,上海交通大學(xué)安泰經(jīng)濟與管理學(xué)院博士生;李莉,上海交通大學(xué)安泰經(jīng)濟與管理學(xué)院博士生。
收稿日期:2009-09-04。