博弈方的行動集合變化的博弈運動研究——以稀土出口貿(mào)易為例
徐寅峰1,2,文生威
(1.四川大學商學院,四川成都610065;2.機械制造系統(tǒng)工程國家重點實驗室,陜西西安710049)
摘要:文章以稀土出口貿(mào)易為背景,分析了博弈方的行動集合隨時間變化的博弈運動。首先定義了行動集合的三種變化情形:集合變大、集合變小和集合變化不確定。然后針對單個博弈方行動集合的三種變化情形,分別討論了均衡解的運動軌跡,分析表明:在行動集合變大和變小兩種情形下,均衡解的軌跡呈現(xiàn)互逆的運動特性;在行動集合變化不確定的情形下,保守和冒險策略等價,固定策略嚴格優(yōu)于保守、冒險策略。在此基礎上,將模型推廣到博弈雙方的行動集合均發(fā)生變化的博弈運動模型,分析表明上述結(jié)論仍然成立。最后,以中國同馬來西亞在2012年6月到2013年3月間的稀土出口貿(mào)易為例,驗證了本文模型和求解方法的合理性與可行性。
關鍵詞:稀土貿(mào)易;寡頭競爭;行動集合;博弈運動;運動軌跡
收稿日期:2013-07-14
基金項目:國家自然科學基金資助項目(71371129,61221063);長江學者和創(chuàng)新團隊發(fā)展計劃(IRT1173)
作者簡介:徐寅峰(1962-),男,吉林人,教授,研究方向:運籌與控制;文生威(1987-),男,河南人,碩士研究生。
中圖分類號:F224文章標識碼:A
Research on the Gaming of the Players’ Action Sets Changing:
A Case Study of the Rare Earth Trade
XU Yin-feng1,2, WEN Sheng-wei
(1.BusinessSchoolofSiChuanUniversity,Chengdu610064,China; 2.StateKeyLabforManufacturingSystemsEngineering,Xi’an710049,China)
Abstract:Considering the export of rare earth as background, this paper analyzes the gaming model in which the players’ action sets are changing over time. First, we define three changing styles for action set: action set heightening, action set shrinking, and action set changing indeterminacy. Then we investigate the track of the equilibrium solution in which only one player’s action set will change over time. The results show that the tracks of the equilibrium solution when the action set heightening and shrinking are opposite, and the stationary strategy is strictly superior to conservative strategy and risky strategy which are equivalent in this situation. Moreover, this single action set changing model is applied to both two action sets changing over time and the results still hold trne for the new model. Finally, the rationality and feasibility of the gaming model and solution are validated by a case study of the rare earth export of China and Malaysia from June 2012 to March 2013.
Key words:rare earth trade; oligopoly competition; action sets; gaming; motion trial
0引言
一般認為對博弈論的研究開始于Zermelo和Neumann等人。1913年,Zermelo提出了選擇公理[1]。1928年,Neumann證明了最大最小定理,標志著博弈論的正式誕生[2]。1944年,Neumann和Morgenstern合著《Theory of games and economic behavior》,將兩人博弈模型推廣到N人博弈并系統(tǒng)地應用于經(jīng)濟領域,構(gòu)建了博弈論的理論體系[3]。1951年,Nash提出和論述了納什均衡的概念,奠定了非合作博弈的理論基礎[4]。1966年,Selten深入研究了動態(tài)博弈中策略的交互作用,提出子博弈精煉納什均衡,隨后,Aumann和Maschler建立了不完全信息的重復博弈模型[1]。1973年,Smith和Price將生物理論中的進化思想引入到博弈論中,提出了演化博弈的思想和演化穩(wěn)定策略的概念[5]。除此之外,還有許多國內(nèi)外學者的研究工作對博弈論的發(fā)展起到推動作用?,F(xiàn)今,博弈論已經(jīng)成為經(jīng)濟學和管理學的核心內(nèi)容。
通常情況下,把以Nash為代表的博弈論稱為經(jīng)典博弈論,經(jīng)典博弈論假設博弈結(jié)構(gòu)和環(huán)境在博弈發(fā)生前事先給定。然而在現(xiàn)實的世界中,信息、物質(zhì)、能量處于一個快速變化的過程中,人類世界信息量的增加、自然環(huán)境和社會環(huán)境的運動變化導致博弈的各要素處于變化之中。博弈方、行動集合、博弈次序和得益函數(shù)等要素在博弈的過程中發(fā)生變化,博弈不是在靜態(tài)的環(huán)境和固有的結(jié)構(gòu)下進行的,而是在運動發(fā)展的環(huán)境和結(jié)構(gòu)中進行的,稱這種運動變化的博弈為博弈運動(Gaming)。它不是某些博弈簡單的重復或交替,而是考慮博弈要素隨時間運動變化。社會經(jīng)濟活動中的博弈運動現(xiàn)象有很多,例如國際稀土貿(mào)易活動就是一個典型的博弈運動。長期以來,中國的稀土出口量在國際稀土貿(mào)易總量中占90%的比重[6]。2013年1月,稀土生產(chǎn)商Lynas宣布在馬來西亞建設稀土提煉廠,該廠竣工后將是世界最大的稀土提煉廠。隨著馬來西亞稀土產(chǎn)量的變化,該國的行動集合也隨之發(fā)生變化,那么,中國同馬來西亞的稀土出口博弈具有博弈運動的特征,隨著這種運動變化,國際稀土市場的貿(mào)易格局將發(fā)生重大轉(zhuǎn)變,研究各國如何在這種新形勢下進行稀土出口博弈具有一定的理論和現(xiàn)實意義。
目前,從博弈論的角度對稀土出口的研究還比較少,并且都是從經(jīng)典博弈論出發(fā)的。王正明等[7]從稅收轉(zhuǎn)嫁的角度分析了寡頭國家的稀土資源稅對出口市場勢力的影響,研究了市場出清條件下的價格轉(zhuǎn)移彈性。裴文琳等[8]利用灰色關聯(lián)度模型評估稀土出口總量分別對出口價格、進口價格、進口總量的相關程度, 提出了我國稀土貿(mào)易的相關建議。本文從博弈運動的角度對稀土貿(mào)易的寡頭市場進行分析,討論行動集合變化的稀土出口寡頭博弈。國內(nèi)外有不少學者從不同的角度對寡頭模型進行了研究,Elsadany[9]和Agiza[10]從動態(tài)博弈的角度討論了企業(yè)序貫博弈和有限理性等因素對博弈方的影響,給出了相應情形下動態(tài)模型的決策值。盧亞麗[11]和閆安等[12]從系統(tǒng)動力學的角度分析了寡頭競爭的均衡解,并分析了系統(tǒng)的穩(wěn)定性。Mallard[13]從演化博弈的角度出發(fā),探討了有限理性在的產(chǎn)量調(diào)整過程中所起的作用,并從環(huán)境與組織本身的影響因素出發(fā),研究了學習型企業(yè)的動態(tài)調(diào)整策略。此外,廖萍康[14]、Anufriev[15]和Zschocke[16]等學者放寬原模型的條件對寡頭模型進行了研究。這些文獻的研究工作對博弈論的發(fā)展起到積極的作用,可是尚未考慮行動集合隨時間變化的情形,也不滿足行動集合的變化不改變均衡解的隱含條件。本文考慮行動集合這一個因素發(fā)生變化的博弈運動模型,從運動變化的角度研究稀土出口博弈,討論了均衡狀態(tài)的運動形式和博弈方的行動選擇,這是以往文獻沒有研究過的,也是本文的創(chuàng)新點和價值所在。
1問題的描述與模型的建立
定義3行動集合變化的博弈運動模型為G(t)=[{A,B},{Sj(t)},{πj(t)}],其中{A,B}表示博弈方的集合,t=0,1,2,…,T,j=1,2,j=1時表示博弈方A,j=2表示博弈方B,Sj(t)表示t時刻博弈方j的行動集合,πj(t)表示t時刻博弈方j在t時刻的收益。
定義4博弈運動的軌跡可以用相繼的收益和實現(xiàn)該收益的行動選擇組成,從初始時刻直到t時刻的軌跡記為H(t)=(q1(0),q2(0),π1(0),π2(0);q1(1),q2(1),π1(1),π2(1);…;q1(t),q2(t),π1(t),π2(t)),將這種記錄博弈方的行動選擇和收益的序列稱為0到t時刻的運動軌跡。
H(t)是對整個博弈運動而言的,它包含從初始時刻直到t時刻的博弈運動信息,記錄和反映了博弈方的行動和收益。特別的,當博弈方的策略是均衡策略時,H(t)可以反映均衡解的運動轉(zhuǎn)移情況。當博弈方{A,B}的產(chǎn)能很大時,行動集合Sj(t)就很大,即為任意時刻博弈方的行動不受產(chǎn)能的制約,則模型G(t)=[{A,B},{S(t)},{π}]退化為寡頭模型G0=[{A,B},{S},{π}]。本文考慮行動集合的變化是博弈運動模型G(t)與模型G0的主要不同。
2行動集合變化的博弈模型分析
(1)
博弈方B的收益函數(shù)為:
(2)
性質(zhì)2在模型G(t)中,如果在t時刻博弈方A的產(chǎn)能小于模型G0均衡解,那么博弈方B不會同博弈方A聯(lián)合。
(3)
(4)
令Δπj(t)表示t時刻博弈方j的產(chǎn)能信息未知時的收益減去其的產(chǎn)能已知時的收益,則有:
(5)
2.1行動集合逐漸變大
定理1在博弈運動模型G(t)中,如果滿足S1(t)?S1(t+1),那么博弈方B的決策值是從聯(lián)合生產(chǎn)均衡狀態(tài)向模型G0均衡狀態(tài)的轉(zhuǎn)移過程。
證明博弈方A的產(chǎn)能逐步增加且沒有達到模型G0均衡解時,由性質(zhì)1知A的決策值為其產(chǎn)能。當A的行動集合變大且已知時,則B的收益函數(shù)表示:
(6)
(7)
定理1表明:當稀土出口國A的產(chǎn)能和出口量逐步增加時,稀土出口國B的出口量不是穩(wěn)定的,而是一個運動轉(zhuǎn)移的過程,意味著B在每個時刻都要對出口量進行修正。B對出口量進行修正時依賴于A的行動集合的變化,分析B的決策可得以下推論:
推論1在博弈運動模型G(t)中,如果滿足S(t)?S(t+1),那么博弈方B采取保守策略將會促使博弈方A聲明其行動集合。
(8)
可知B采取冒險策略時Δπ1(t)>0,A的收益增加;又因為Δπ2(t)<0,即只要B對A行動集合的大小的預估出現(xiàn)偏差,B的收益就會減少,所以B希望正確的估計A的產(chǎn)能。綜上所述:B采取保守策略,這對A構(gòu)成威脅并將導致A的收益減少,那么A為了避免收益的減少,將會聲明其行動集合,使B可以觀察到A的產(chǎn)能。證畢。
2.2行動集合逐漸變小
定理2在博弈運動模型G(t)中,如果S(t+1)?S(t),那么博弈方B的決策值的轉(zhuǎn)移過程是博弈方A的行動集合變大情形時的逆過程。
推論2在博弈運動模型G(t)中,如果滿足S(t+1)?S(t),那么博弈方B采取冒險策略將會促使博弈方聲明其行動集合。
(9)
2.3行動集合變化情形不確定
定理3在博弈運動模型G(t)中,博弈方A行動集合變化情況不確定,則博弈方B采取保守策略和冒險策略等效,固定策略嚴格優(yōu)于保守策略和冒險策略。
(10)
(11)
(12)
(13)
定理3表明:當博弈方A的行動集合變化情形不確定時,博弈方希望得到的均衡策略適用于任意一個可能初始產(chǎn)能。所以在實際的問題中,博弈方可能只需要知道在某些或者某一個特定情形下如何進行策略選擇的就足夠了,也就是說博弈方可以采取相對穩(wěn)定的出口策略。
3模型進一步討論
Step 1初始化并設置參數(shù)a,c,T,q1(0),q2(0),計算π1(0),π2(0),并令t=1;
Step 4計算t時刻的收益πj(t);
Step 5更新H(t)。執(zhí)行t:t+1,然后返回到step2。
Step 4計算t時刻的收益πj(t);
Step 5更新H(t)。執(zhí)行t:t+1,然后返回到step 2。
4算例分析
依據(jù)統(tǒng)計數(shù)據(jù),對模型參數(shù)進行賦值,通過算例來直觀反映博弈雙方行動集合都發(fā)生變化時的博弈運動模型。國際市場2012年稀土需求量約13萬噸,平均每月需求量1.038萬噸,出口成本大概21萬元/噸。對數(shù)據(jù)進行預處理,A=1038(十噸),C=210(萬元/十噸)。另外2012年6月到2013年3月馬來西亞和中國的稀土產(chǎn)能如表5-1,令2012年6月為博弈運動模型的初始時刻,有q1(0)=186.0,q2(0)=303.6,T=9,將這些參數(shù)作為初始輸入,計算得π1(0)=57920.4,π2(0)=102948.8
有
H(0)=((186.0),(303.6)(57920.4)(102948.8))
然后進入t=1時刻,博弈方選擇此時的出口量。依據(jù)冒險策略的計算步驟Step 3,可以得出馬來西亞和中國采取冒險策略時的稀土出口量分別為
此時π1(1)=81501.0,π2(1)=59862.1,有
H(1)=((186.0),(303.6),(57920.4),(102948.8);(338.6),(248.7),(81501.0),(59862.1))
依次可以計算出直到T時刻博弈方的各期決策值,繪制表5-2。依據(jù)表5-2中博弈雙方的決策值便可計算博弈方采取不同策略時各期的收益值,同時,可以得到運動軌跡H(t)。冒險策略下總收益分別為661898.6萬元和703489.0萬元。同樣道理,依據(jù)保守策略計算方法可得雙方的各期決策值和收益,總收益分別為661530.3萬元和703603.6萬元。博弈雙方依據(jù)固定策略選擇出口量時,總收益分別為679762.4萬元和734437.6萬元。另外,計算博弈方按實際產(chǎn)能進行決策時的總收益分別為630233.1萬元和683388.5萬元,作為參照,對比博弈方采取不同策略的總收益,繪制成圖5。
表5-1 馬來西亞和中國稀土產(chǎn)能(單位/十噸)
注:A表示馬來西亞,B表示中國,AC表示實際產(chǎn)能(Actual Capacity)
表5-2 不同策略下馬來西亞和中國的出口量(單位/十噸)
注:RS表示冒險策略(Risky Strategy),CS表示保守策略(Conservative Strategy),SS表示固定策略(Stationary Strategy)
圖1 不同策略下博弈方的總收益
從圖1中可以看出,當博弈雙方的行動集合變化不確定時,馬來西亞和中國采取冒險策略、保守策略或固定策略的總收益都大于按產(chǎn)能出口時的總收益,這說明文中給出的策略是可行的。圖1中冒險策略和保守策略總收益基本相同,與理論分析的冒險策略與保守策略等價的結(jié)論一致,并且可以看出,博弈方采取固定策略時的總收益明顯大于冒險策略和保守策略,說明文中構(gòu)建的博弈運動模型和求解方法是合理、有效的。這可以為稀土出口貿(mào)易提供一些啟示,出口國應該采取相對穩(wěn)定的稀土出口量,可以構(gòu)建稀土貿(mào)易平臺、定期發(fā)布產(chǎn)能和出口信息,這些措施有利于稀土出口國獲得更多的收益和避免惡性競爭。另外,當單個博弈方的行動集合變大、變小或者變化情形不確定時,可以看作是雙方行動集合都發(fā)生變化的特殊情境,不再贅述。
5結(jié)語
本文首先分析了馬來西亞的出口行動集合變化的博弈運動模型,發(fā)現(xiàn)均衡狀態(tài)與經(jīng)典的納什均衡有很大的不同,在博弈運動模型中均衡狀態(tài)是一個運動轉(zhuǎn)移的過程。然后文章分析了博弈雙方的稀土生產(chǎn)不穩(wěn)定情形,探討了博弈雙方的行動集合都發(fā)生變化的博弈運動,給出稀土出口國應該采取相對穩(wěn)定的出口量和發(fā)布的稀土產(chǎn)能等信息的應對措施,這對于稀土貿(mào)易出口國應對博弈對手行動集合變化的新情況具有指導意義。當然,本文只考慮了兩個博弈方的稀土出口競爭,對多個博弈方的行動集合變化的博弈運動模型還要做進一步研究。
參考文獻:
[1] Schwalbe U, Walker P. Zermelo and the early history of game theory[J]. Games and Economic Behavior, 2001, 34(09): 123-137.
[2]Neumann J V, Zur theorie der gesellschaftsspiele[J]. Mathematische Annalen, 1928, 100(1): 295-320.
[3]Von Neumann J, Morgenstern O. Theory of games and economic behavior(commemorative edition)[M]. Princeton university press, 2007.
[4]Nash J. Non-cooperative games[J]. The Annals of Mathematics, 1951, 54(2): 286-295.
[5]Smith J M, Price G R. The logic of animal conflict[J]. Nature, 1973, 246: 15.
[6]Tse P K. China’s rare-earth industry[M]. US Department of the Interior, US Geological Survey, 2011.
[7]王正明,張許靜.稀土資源稅對“寡頭”國出口市場勢力的影響研究[J].經(jīng)濟經(jīng)緯,2012,2(2):52-55.
[8]裴文琳, 孔銳. 我國稀土進出口量與價格關聯(lián)度狀況分析[J].資源開發(fā)與市場, 2011, 7: 613-616.
[9]Elsadany A A. Competition analysis of a triopoly game with bounded rationality[J]. Chaos, Solitons & Fractals, 2012, 45(11): 1343-1348.
[10]Elsadany A A, Agiza H N, Elabbasy E M. Complex dynamics and chaos control of heterogeneous quadropoly game[J]. Applied Mathematics and Computation, 2013, 219(24): 11110-11118.
[11]盧亞麗.主從型Bertrand價格博弈模型及其動力學分析[J].系統(tǒng)工程,2012,30(002):91-94.
[12]閆安,達慶利,裴鳳.多個企業(yè)同時博弈的動態(tài)古諾模型的長期產(chǎn)量解研究[J].管理工程學報,2013,(1):94-98.
[13]Mallard G. Modelling cognitively bounded rationality: an evaluative taxonomy[J]. Journal of Economic Surveys, 2012, 26(4): 674-704.
[14]廖萍康,張衛(wèi)國,謝百帥,閆杜娟.相異成本和廣義非線性需求下多寡頭古諾模型及應用[J].運籌與管理,2013,22(2):172-179.
[15]Anufriev M, Kopányi D, Tuinstra J. Learning cycles in Bertrand competition with differentiated commodities and competing learning rules[J]. Journal of Economic Dynamics and Control, 2013, 37(12): 2562-2581.
[16]Zschocke M S, Mantin B, Jewkes E M. Mature or emerging markets: competitive duopoly investment decisions[J]. European Journal of Operational Research, 2013, 228(2): 612-622.