,, ,,
(南京航空航天大學經濟與管理學院,江蘇 南京 211106)
自馮·諾依曼和摩根斯坦恩合作出版《博弈論和經濟行為》以來,博弈理論得到不斷發(fā)展,已成為一門較為成熟、應用廣泛的學科。學者們各自從不同的角度,例如完全信息、不完全信息、靜態(tài)、動態(tài)等研究了博弈論,使其逐步完善。近年來,隨著不確定性理論研究的深入,學者們嘗試在博弈研究中考慮不確定性因素。概括來說,不確定博弈模型主要有以下幾個研究方向?;疑淮_定性博弈:羅黨,吳順祥[1]提出了二人有限零和灰色博弈,建立了博弈平衡解優(yōu)序關系的確定方法。方志耕等[2]研究了基于純策略的灰矩陣二人有限零和最保守博弈決策問題,提出了該問題解的灰鞍點概念。倪健等[3]基于灰色思想和博弈理論分析高速公路入口沖突車輛受到的不確定性因素,提出沖突車輛選擇策略時受到區(qū)間灰數的約束,建立沖突車輛的零和灰色博弈模型。隨機不確性博弈:Hoppe[4]分析了不確定條件下采用新技術的期權博弈模型。黃學軍等[5]假定突發(fā)事件服從向下的泊松跳過程,建立了帶跳的幾何布朗運動的雙寡頭期權博弈模型。王皓[6]主要研究了倒向隨機微分方程解的存在性、唯一性,及其在混合零和微分-積分對策問題上的應用。已知參數變化范圍的不確定性博弈。Capisani等[7]結合經典Nash均衡及帕雷托有效解的概念,介紹了不確定性下非合作博弈的NS-均衡概念。Nikobin等[8]在Zhukovskii的基礎上定義了不確定環(huán)境下非合作博弈的ZS-均衡概念,并基于不動點定理證明了其存在性。張會娟等[9]在已知不確定參數變化范圍的假設下,定義并研究了具有不確定參數的強Nash均衡的存在性問題。模糊不確定性博弈。認知的不確定性,人們可能遇到收益值為模糊數的博弈結構。針對此問題,吳詩輝等依據三角模糊數的運算規(guī)則和比較規(guī)則,提出了三角模糊矩陣博弈問題的基于可能度的純策略解的判定規(guī)則[10]。岳立柱等[11]文獻利用結構元相關定理,證明了m×n階模糊矩陣必存在與之有相同納什解的m×n階實數矩陣與其對應,并用結構元方法簡化了模糊博弈矩陣的求解。
綜合來看,不確定性信息下的博弈問題研究已經得到學術界的重視,取得一些有意義的研究成果。但是,仍有部分問題值得深入研究:(1)現有不確定性博弈多數考慮收益值為灰數、已知變化范圍的參數、模糊數等情況,未能考慮到參與人的收益值雖無法準確獲知,卻往往與動態(tài)環(huán)境因素有著密切關聯這種情況。(2)對于博弈中局中人的博弈策略或收益值是某些條件或變元(如時間、環(huán)境、空間、制度或相關其它變元)的映射的這一類博弈問題,目前暫沒有比較有效的模型描述。(3)以往多數研究只能給出一定程度上的靜態(tài)均衡解,事實上隨著博弈環(huán)境的不同,博弈均衡解會動態(tài)變化。
在現實的社會生活中,在信息不確定條件下的博弈問題,局中人的博弈策略或收益值往往無法在事先準確給定。分析基于不確定信息的泛函博弈問題,并描述其形式與框架,構建相應的博弈模型,可以準確的表達現實世界中的博弈問題,可以展示不確定信息下博弈的特征、性質、戰(zhàn)略表達形式等,為模型最優(yōu)策略探討及均衡解的研究打下堅實的基礎。本文重點研究和描述基于不確定性的變元和收益值取決于博弈策略變元的泛函博弈的戰(zhàn)略式(標準表達形式),構建的博弈模型將為更好地認知、把握和解決現實博弈問題提供新的科學依據。
針對在現實的社會經濟生活中,大量存在著基于不確定信息的問題,即在信息不確定條件下,我們所得到的信息可能是某些條件或變元(如時間、環(huán)境、空間、制度或相關其它變元)的映射,在標準區(qū)間數[15]的基礎上設計一種新的基于信息不確定性變元的泛函區(qū)間灰數,為解決這些信息缺失環(huán)境下不確定性變元泛函區(qū)間灰數的運算問題奠定基礎。
γi(t)=F[f1(t),f2(t),…fK(t)],γi(t)∈[0,1],i=1,2,…
(1)
盡管這些變元函數γi(t)∈[0,1];i=1,2,…映射的確切規(guī)律難以準確把握,但是若在一定的條件,隨著時間的推移,利用相關的統(tǒng)計數據、知識和經驗等,能夠對其相關的映射規(guī)律進行更深入地分析(值得注意的是,變元函數γi(t)∈[0,1]中的t是一種廣義時間的表述方式,其所表達真正含義是隨著時間的推移,其不確定信息不斷變得更加清楚、準確),所以可以將不確定信息的標準區(qū)間數轉化為一種依托于變元函數γi(t)∈[0,1];i=1,2,…的泛函區(qū)間灰數集,如式(2)的形式:
(2)
定義2 (泛函區(qū)間灰數的取值) 任給某泛函區(qū)間灰數Ai(t)=ai+ci·γi(t);i=1,2,…,若隨著時間的推移,利用相關的統(tǒng)計數據、知識和經驗等對其不確定性變元函數γi(t)∈[0,1]取定某一確定的值,即γi(t)=γi,(0γi1),那么Ai的值即可唯一確定,則稱γi1)為Ai的取數。
法則1 (泛函區(qū)間數的加法) 設:
Ai(t)=ai+ci·γi(t);γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t);γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的和記為:
Ai(t)+Aj(t)=[(ai+aj),(ci·γi(t)+cj·γj(t))],i,j=1,2,…
法則2 (泛函區(qū)間數的減法) 設:
Ai(t)=ai+ci·γi(t);γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t);γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的差記為:
Ai(t)-Aj(t)=[(ai-aj),(ci·γi(t)-cj·γj(t))],i,j=1,2,…
法則3 (泛函區(qū)間數的乘法) 設:
Ai(t)=ai+ci·γi(t);γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t);γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的積記為:
Ai(t)·Aj(t)=[min{(ai·aj),(ai·cj·γj(t)),(ci·γi(t)·cj·γj(t)),(ci·γi(t)·aj)},max{(ai·aj),(ai·cj·γj(t)),(ci·γi(t)·cj·γj(t)),(ci·γi(t)·aj)}],i,j=1,2,…
法則4 (泛函區(qū)間數的除法) 設:
Ai(t)=ai+ci·γi(t),γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t),γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的商記為:
Ai(t)/Aj(t)=[min{(ai/aj),(ai/[cj·γj(t)]),([ci·γi(t)]/[cj·γj(t)]),([ci·γi(t)]/aj)},max{(ai/aj),(ai/[cj·γj(t)]),([ci·γi(t)]/[cj·γj(t)]),([ci·γi(t)]/aj)}],i,j=1,2,…
定義3 (泛函區(qū)間灰數的數域) 設R(?)為一泛函區(qū)間灰數集合,若對任意的Ai(t),Aj(t)∈R(?),有Ai(t)+Aj(t),Ai(t)-Aj(t),Ai(t)·Aj(t),Ai(t)/Aj(t)均屬于R(?)(商運算時,要滿足aj+cj·γj(t)≠0,j=1,2,…),則稱R(?)為一泛函區(qū)間灰數域。
定義4 (泛函區(qū)間灰數的大小比較規(guī)則)任給兩個泛函區(qū)間灰數Ai(t)=ai+ci·γi(t),γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t),γj(t)∈[0,1],j=1,2,…若滿足:
(1)若Ai(t)-Aj(t)≥0,則Ai(t)≥Aj(t);
(2)若Ai(t)-Aj(t)<0,則Ai(t) 定理1 (Ai(t) 本定理的證明過程簡單,證明過程省略。 定理2 (Ai(t)=Aj(t)的判定) 任給兩個泛函區(qū)間灰數Ai(t)=ai+ci·γi(t),γi(t)∈[0,1],i=1,2,…和Aj(t)=aj+cj·γj(t),γj(t)∈[0,1],j=1,2,…;當ai=aj,ci·γi(t)=cj·γj(t),則Ai(t)=Aj(t)。 本定理的證明過程簡單,證明過程省略。 在泛函博弈問題中,其不確定性變元主要體現在收益矩陣中,即在其收益值矩陣的相關元素中存在信息不確定性變元和策略不確定性變元。由于這些不確定變元的存在,使得運用經典的博弈求解方法求解泛函博弈問題變得十分困難。運用優(yōu)化理論及其相關技術方法,設計基于不確定信息的泛函博弈模型及其把泛函博弈問題轉化為優(yōu)化問題的求解方法,即通過研究和構造泛函博弈收益值的廣義滿秩擴充方陣分析其最優(yōu)博弈策略和博弈收益值問題,不僅為現實生活中的不確定信息問題提供新的解題思路,更為實際問題的解決提供新的方法參考。 對于難以用準確的白數來表示的局中人各策略的博弈值,可以用一個區(qū)間灰數來表示,我們把由這樣的區(qū)間灰數所構成的博弈損益值矩陣稱為灰損益值矩陣A(?),如公式(3)所示: (3) 定義5 (灰博弈)局中人1的策略集為S1={α1,α2,…,αm},局中人 2 的策略集為S2={β1,β2,…,βn},局中人事先判斷的用區(qū)間灰數表征的灰損益值矩陣為A(?),稱由灰損益值矩陣所決定的博弈問題稱為灰博弈,記為G(?)={S1,S2,A(?)}。 在現實的社會經濟生活中,選取信息不確定條件下的一些博弈問題(考慮在一個相對封閉的市場區(qū)域內有2家彩電生產商進行市場份額的競爭、戰(zhàn)斗機群的空中搏斗、無人機對敵機的跟蹤與偵察等),他們的博弈形式可以用進行描述(見公式(4))。 (4) 其中:αi,i=1,2,…,m表示局中人甲的策略;βj,j=1,2,…,n表示局中人乙的策略;[aij,bij],i=1,2,…,m,j=1,2,…,n表示在信息不確定條件下局中人甲和乙分別采取策略αi,i=1,2,…,m和βj,j=1,2,…,n時的博弈收益值的區(qū)間灰數;利用標準區(qū)間灰數的表征方法,可將其博弈收益值的區(qū)間灰數轉化為標準形式: [aij,bij)=aij+(bij-aij)·γij,γij∈[0,1],i=1,2,…,m;j=1,2,…,n (5) 更進一步考慮,γij∈[0,1]是由于事先的信息的不確定性(如信息的不對稱性、有限知識、隨機振蕩等變元因素所造成的)所導致的,也就是說,該γij∈[0,1]應是這些變元的一個映射,可表示為式(6)的形式,其中fk(t),k=1,2,…,K表示這K個影響變元是時間t的映射,K和f表示其相應的映射關系。 γij(t)=F[f1(t),f2(t),…,fK(t)],γij(t)∈[0,1],i=1,2,…,m;j=1,2,…,n (6) (7) 考慮可能存在一種博弈其收益值矩陣中的某些元素值的大小取決于局中人采用該策略的頻率(或混合策略的值),如考慮博弈的局中人甲采用策略αi,i=1,2,…,m的頻率為xi∈[0,1],i=1,2,…,m;局中人乙采用策略βj,j=1,2,…,n頻率為yj∈[0,1],j=1,2,…,n而在其博弈收益值矩陣中存在某個(些)元素的值(如式(8)所示),其中:xi(t)∈[0,1],i=1,2,…,m和yj(t)∈[0,1],j=1,2,…,n分別表示其博弈策略xi(t)∈[0,1],i=1,2,…,m和yj(t)∈[0,1],j=1,2,…,n分別是變元t的函數;cij(t),i=1,2,…,m;j=1,2,…,n是博弈收益值矩陣的元素,xi(t)∈[0,1] 和yj(t)∈[0,1]的映射,Fij(i=1,2,…,m;j=1,2,…,n)表示其映射關系。 cij(t)=Fij[xi(t),yj(t)];xi(t)∈[0,1],i=1,2,…,m;yj(t)∈[0,1],j=1,2,…,n (8) (9) 若在泛函區(qū)間灰數大小意義下存在純策略xi*(t),yj*(t),構成局勢(xi*(t),yj*(t))使得式(10)成立: (10) cij*(t)ci*j*(t)ci*j(t) (11) 證明:先證明充分性,由于對任意的i,j均有cij*(t)ci*j*(t)ci*j(t),故: (12) 另一方面,對任給i,j,有: (13) 由(12)式和(13)式有: 現在來證明必要性。 設有i*,j*使得: 所以對任意i,j有: cij*(t)ci*j*(t) 證畢。 (14) 運用提供的信息不確定性變元泛函區(qū)間灰數的表征與計算方法,并由題意知:a11=γ11(t),a12=2+γ12(t),a21=4,a22=2,盜版者選擇盜版、不盜版策略的泛函最優(yōu)純策略如式(15)和式(16)。 (15) (16) 圖1 盜版企業(yè)的最優(yōu)純策略仿真圖 盜版打擊部門者選擇不打擊、打擊策略的最優(yōu)灰混合策略如式(17)、式(18)。 (17) (18) 圖2 局中人2的最優(yōu)混合策略仿真圖 由圖1和圖2看出,隨著時間的推移,盜版打擊部門會傾向選擇打擊策略,但是盜版企業(yè)選擇盜版、不盜版的概率仍交替增減,這主要是收到灰信息變元的影響。 (19) 圖3 最優(yōu)灰博弈值仿真圖 泛函博弈問題的泛函區(qū)間灰數計算結果如表1所示,標準區(qū)間數計算方法的計算結果是一個區(qū)間的數值,盡管最終的取值范圍都是相同的,但是上述的基于灰信息變元的泛函博弈問題的計算結果是隨時間t不斷變化的,是時間t的映射,可以通過計算機仿真的方式確定在某時間范圍內博弈的雙方都是采取什么策略,而不只是簡單的去計算雙方策略的范圍,給出相對靜態(tài)的結果。 表1 泛函區(qū)間灰數計算結果 本文著眼于在不確定條件下,現實的社會經濟生活中局中人的博弈策略或收益值無法準確實現給定的博弈問題,著重于不確定信息的泛函博弈模型的構建與解析,運用和創(chuàng)新經典博弈理論研究方法,還需要深入研究基于不確定信息的泛函博弈的形式與框架、均衡解的求解方法以及泛函博弈模型穩(wěn)定性等一系列問題,尋求解決此類問題的科學理論和方法。借助于泛函原理構建泛函博弈模型,創(chuàng)新和發(fā)展博弈論研究方法;從實踐領域來看,本文立足于現實社會經濟生活中的相關實際問題為背景,選擇具有較好的代表性的泛函博弈的典型案例如“盜版與打擊盜版”問題通過計算機仿真對其博弈均衡結果進行詳細的對比分析,說明了本文提出的基于信息不確定性變元的區(qū)間數的表征及其運算法則的科學性和計算結果的精確性。此外還可以解決“追捕—格斗”、“航跡規(guī)劃” 等泛函博弈問題。 參考文獻: [1] 羅黨,吳順祥.帶有灰色約束的二人有限零和博弈研究[J].廈門大學學報(自然科學版),2006,45(1):29-32. [2] 方志耕,劉思峰.基于純策略的灰矩陣二人有限零和博弈模型研究[J].南京航空航天大學學報,2003,35(4):441-445. [3] 倪健,韓直,彭金栓.基于零和灰色博弈模型的高速公路入口車輛沖突研究[J].公路交通技術,2008,8(4):121-124. [4] Hoppe H C.Second-mover advantages in the strategic adoption of new technology under uncertainty [J].International Journal of Industrial Organization, 2000,18(2):315-338. [5] 黃學軍,吳沖鋒.不確定環(huán)境下研發(fā)投資決策的期權博弈模型[J].中國管理科學,2006,14(5): 33-37. [6] 王皓.反射倒向隨機微分方程解及其在混合零和微分對策可逆投資問題及偏微分方程中的應用[D].濟南:山東大學,2009. [7] Capisani L M,Ferrara A, Maqnani L.Design and experimental validation of a second-order sliding-mode motion controller for robot manipulators [J].International Journal of Control, 2009, 82(2): 365-377. [8] Nikoobin A, Haqhiqhi R.Lyapunov-based nonlinear disturbance observer for serialn-Link robot manipulators [J].Journal of Intelligent and Robotic Systems: Theory and Applications, 2009, 55(2/3): 135-153. [9] 張會娟, 張強.不確定性下非合作博弈強Nash均衡的存在性[J].控制與決策,2010,25(8):1251-1254. [10] 吳詩輝,楊建軍, 郭乃林.三角模糊矩陣博弈的最優(yōu)策略研究[J].系統(tǒng)工程與電子技術,2009,31(5):1231-1234. [11] 岳立柱,閆艷,仲維清.基于結構元方法的模糊矩陣博弈求解[J].系統(tǒng)工程理論與實踐,2010,30(2):272-276. [12] 王才士,黃志遠.量子隨機 Cable 方程的白噪聲分析方法[J].數學學報,2002,45(5): 851-862. [13] 肖兆銀,周德云.遺傳算法的泛函極值求解與應用[J].火力與指揮控制,2007,32(12):52-54. [14] 吳迪光.變分法[M].北京:高等教育出版社,1987. [15] 方志耕,劉思峰,陸芳,等.區(qū)間灰數表征與算法改進及其GM(1,1)模型應用研究[J].中國工程科學, 2005,7(2):57-61.3 泛函博弈模型
4 案例研究——盜版與打擊盜版
4.1 泛函博弈問題的最優(yōu)解
4.2 泛函區(qū)間灰數與標準區(qū)間數區(qū)別和差異
5 結語