韓雨
合蕪蚌自主創(chuàng)新改革試驗區(qū)是全國三大自主創(chuàng)新示范區(qū)(北京中關村、武漢東湖、安徽合蕪蚌)之一。自成立以來,合蕪蚌自主創(chuàng)新改革試驗區(qū)將自主創(chuàng)新作為發(fā)展戰(zhàn)略的核心,一些產業(yè)正逐步形成新的經濟增長點,科技創(chuàng)新成果加速涌現(xiàn),有力地推動了安徽區(qū)域創(chuàng)新體系建設,促進了安徽經濟發(fā)展。對于合蕪蚌地區(qū)來講,整體經濟實力的提升比單個行政區(qū)經濟實力的提升更有助于安徽省乃至整個中部地區(qū)整體經濟的發(fā)展。因此,如何平衡三地之間的相互聯(lián)系、相互依存、相互作用、相互制約的內在聯(lián)系,在此基礎上處理好競爭與合作協(xié)調的關系就成為一個突出的問題。
一、博弈論的引入
博弈論(Game Theory)主要是指在研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題,因此,博弈論又稱“決策論”。博弈論是美國數(shù)學家馮·諾依曼(Von.Neumann)和經濟學家摩根斯坦恩(Morgenstern)于1944年創(chuàng)立的帶有方法論性質的學科,它被廣泛應用于經濟學、軍事、政治科學、人工智能等。博弈論分為合作博弈和非合作博弈。納什在1950年代定義了納什均衡即所有對弈者的最優(yōu)策略集合,奠定了非合作博弈的基石。后續(xù)的理論研究主要圍繞“納什均衡”的精化而展開。1965年澤爾騰針對靜態(tài)博弈的局限性,開辟了動態(tài)博弈研究的領域,定義了“子博弈納什精煉均衡”,將納什均衡中包含的不可置信的威脅戰(zhàn)略剔除出去。1967年海薩尼將不完全信息引入博弈模型,由此提出了“貝葉斯納什均衡”,運用隨機分布方法初步解決了信息不完全條件下的博弈問題,在博弈論的發(fā)展中樹立了一塊新的里程碑。
二、合蕪蚌三市博弈關系的分析
1.區(qū)域關系中的“囚徒困境”。區(qū)域的發(fā)展?jié)摿τ卸啻螅P鍵是看該區(qū)域的核心競爭力。合肥、蕪湖、蚌埠三市的核心競爭力之間的差距正在縮小。合肥是安徽省省會,有得天獨厚的優(yōu)勢,但蕪湖和蚌埠也有后來者居上之勢。因此三市之間不自覺形成了競爭的關系?,F(xiàn)在我們引用博弈論中的具體理論“囚徒困境”的概念對合肥、蕪湖、蚌埠三地的利益關系進行博弈分析,以后簡稱博弈。
我們把區(qū)域的地方政府看作是有理性的“參與人”,也就是決策的主體,他可以根據區(qū)域的利益要求來決定自己的行為。地方政府制定的區(qū)域發(fā)展的經濟政策就是“參與人”在博弈過程中制定的“策略”?!皡⑴c人”在博弈過程中制定的具體“政策”實施后獲得的報酬就是“收益”。如圖1 所示的模型。
對于三地之間的博弈關系我們可以通過兩兩討論來進行總結。我們把區(qū)域“參與人”的決策分為兩種純策略: 合作和競爭。對于圖1 我們可得到如下的解:即假設兩個地區(qū)的決策“參與人”采取合作的策略,可以各得到x 份的收益;如果有一方選擇競爭,那么雙方的收益都會下降,主動競爭的一方可獲得(x+1)份的收益,合作的一方會獲得(x-2)份的收益。如果雙方都選擇競爭,則雙方會收到x/2 個份額的收益。選擇競爭還是合作由“參與人”來決定?!皡⑴c人”都選擇合作會得到最大的“收益”,都選擇競爭會在“收益”上平分秋色。因此,(合作,合作)和(競爭,競爭)是兩個納什均衡。而且在合蕪蚌經濟發(fā)展的現(xiàn)階段(競爭,競爭)是“參與人”的嚴格優(yōu)勢策略。因為任何一個“參與人”都無法確定對方選擇那種“策略”,這就使“參與人”陷入了“囚徒困境”之中。
合蕪蚌區(qū)域間所存在的沖突與無序競爭,正是各方追求自身利益最大化,陷入“囚徒困境”的結果。在現(xiàn)實問題中,絕大多數(shù)的博弈問題都是非合作博弈。如上述模型,區(qū)域的“參與人”不可能在任何情況下都遵循同一種純策略合作或是競爭,通常是兩種策略交替出現(xiàn),集體的實施按具體的影響區(qū)域發(fā)展的條件的成熟情況而定。那么我們就可以得到一個新的模型,如圖2 所示。
P 代表A 區(qū)域的“參與人”選擇合作策略的概率,(1- P)代表區(qū)域A 的“參與人”選擇競爭的概率,P+(1-P)=1 代表區(qū)域A 的“參與人”選擇兩種策略的概率相加是1。Q、(1- Q)同上,代表B 區(qū)域“參與人”選擇兩種純策略的概率。這個模型告訴我們,A區(qū)域和B區(qū)域的“參與人”在進行(合作,合作) 時的概率分別是PQ。
假設P、Q分別為50%則PQ為25%,即在現(xiàn)實社會中這樣的雙贏局面即(合作,合作)成功的案例占少數(shù)。納什均衡的概念告訴我們:博弈的理性結局是每個局中人均不能因為單方面改變自己的策略而獲利的一組策略組合。(合作,合作)策略正是這樣的組合。任何一個區(qū)域的參與人如果改變其合作的策略,它的收益都會降低,因此,他們沒有改變策略的激勵,因此難免陷入“囚徒困境”。歸結起來,合蕪蚌三市陷入“囚徒困境”主要有以下幾方面原因:①合蕪蚌尚在“一體化”初級向中級過渡的階段;②利益誘惑促使博弈各方都有改變策略的激勵;③中國經濟發(fā)展的大背景給合蕪蚌三市帶來了機遇也帶來了困惑;④“參與人”具體政策實施的不一致。
2.三方博弈的動態(tài)均衡。首先,“囚徒困境”并不是不能化解的。如果“囚徒困境”是一次性博弈的話,基于個體利益最大化,會得到納什均衡解。但如果是多次博弈,就可能會在各成員之間產生合作,“囚徒困境”得以破解,從而國家或區(qū)域之間形成合作聯(lián)盟,即連續(xù)的合作有可能會成為重復的囚徒困境的均衡解。其次,規(guī)定、條款的制定?!昂献鞑┺摹钡那疤釛l件是在對弈者的行為相互作用時,能否達成一個具有約束力的協(xié)議?!昂献鞑┺摹睆娬{團體理性,即效率、公正和公平。在區(qū)域關系中,只有制定具有約束效力的條款即游戲規(guī)則,才可能實現(xiàn)有效的區(qū)域合作。再其次,無限期的合作。如果成員的合作是無限期的,出于長遠利益的考慮,合作就會成功。
基于以上分析,我們來考慮合蕪蚌三方之間博弈的動態(tài)均衡。在最初的選擇中,每一個區(qū)域都有“合作”和“競爭”兩個備選項。對于合蕪蚌內任何區(qū)域A來講,假設另外兩區(qū)域中在t時期選擇合作的區(qū)域數(shù)量為xt,那么此時選擇沖突的區(qū)域數(shù)量為2-xt。當區(qū)域A 選擇合作時,根據上述博弈模型,其收益為:10xt+3(2-xt)。當區(qū)域A 選擇沖突時,其收益為:6xt+5(2-xt)。由此可見,根據最優(yōu)反應動態(tài)機制,只有當10xt+3(2-xt)>6xt+5(2-xt),即xt>5/6 時,區(qū)域A才會在t+1 時期選擇合作。由于xt只能取0、1、2 三個值,所以,在合蕪蚌的三方區(qū)域當中,只有當另外兩個區(qū)域中在t時期有一個或一個以上采取“合作”時,區(qū)域A 才會在t+1時期采取“合作”戰(zhàn)略。
3.博弈論對合蕪蚌三市的啟示。①提高三地之間的信息通達度。媒體和網絡的出現(xiàn)使人們可以迅速的獲得信息,但信息的真實度和可信度無從考證。區(qū)域是一個非常復雜的系統(tǒng),要想做到信息上的同時完全通達是不可能的,但是我們可以提高信息的精確度,保證三地“參與人”得到信息是準確無誤的。有一點是公平的,那就是各區(qū)域的“參與人”得到的信息都是不完全的信息,在有限的信息基礎上來選擇如何決策,也是區(qū)域的“參與人”的挑戰(zhàn)之一。②選擇對其他區(qū)域和本區(qū)域來講都最佳的策略發(fā)展區(qū)域經濟。現(xiàn)階段各區(qū)域“參與人”選擇的策略還是以自身為重,中國有句成語叫做“損人利己”,但納什均衡概念告訴我們“利己”不一定“損人”。通常來講,“參與人”強調本區(qū)域的繁榮發(fā)展不但不會對其他區(qū)域造成負面影響,反而是其他區(qū)域進一步發(fā)展的一個助推器。合肥“參與人”的策略在合肥取得了先行的收益,由于利益的激勵,蕪湖和蚌埠的“參與人”就會跟進。這也是一種政策的慣性,在這種策略慣性的作用下,合蕪蚌三地就會在不斷博弈的過程中逐漸融合。③建立公平交易規(guī)則的監(jiān)督機制。合蕪蚌三市應該嚴格摒棄地方保護主義實現(xiàn)一體化。地方保護主義的觀念往往存在于一些對區(qū)域總體發(fā)展信息把握不完全的決策人的頭腦中,是區(qū)域經濟發(fā)展的制約因素。因此,為了形成公平的合作發(fā)展環(huán)境,應該建立一個公平交易規(guī)則的監(jiān)督機制。哪個區(qū)域的參與人違反了協(xié)議就要受到懲罰,這樣合蕪蚌三地的“參與人”沒有了改變策略而獲得更多利益的激勵,也就不會違反契約了。
(作者單位:安徽大學商學院)