◇梅潔
乳制品企業(yè)失信問題的進(jìn)化博弈分析
◇梅潔
摘要:本文基于進(jìn)化博弈的復(fù)制動態(tài)機(jī)制,對乳制品企業(yè)的失信策略選擇進(jìn)行進(jìn)化博弈分析,并在模型求解和參數(shù)分析的基礎(chǔ)上,判斷進(jìn)化博弈均衡的穩(wěn)定性,剖析兩個博弈方群體的策略選擇狀況,得出影響違規(guī)行為進(jìn)化的因素。
關(guān)鍵詞:乳制品企業(yè);失信;監(jiān)管;進(jìn)化博弈
10.13999/j.cnki.scyj.2015.09.015
乳制品市場中各企業(yè)的相互模仿與競爭行為與自然界中生物的進(jìn)化博弈十分相似。本研究在進(jìn)化博弈的分析框架下,基于博弈參與方的有限理性前提,建立乳制品企業(yè)間的進(jìn)化博弈模型,探討企業(yè)與企業(yè)橫向間隱蔽違規(guī)行為的長期進(jìn)化趨勢,并考慮博弈方群體間非法利潤的差異對系統(tǒng)收斂效果的影響,求解出它們類型比例變化的動態(tài)趨勢及穩(wěn)定性關(guān)系,剖析乳制品企業(yè)誠信與失信的策略選擇狀況,得出影響乳制品企業(yè)失信行為的關(guān)鍵因素。
有限理性博弈的有效分析框架是由限理性博弈方構(gòu)成的,一定規(guī)模的特定群體內(nèi)成員的某種反復(fù)博弈[1],這與市場上眾多的乳制品企業(yè)相互間的策略選擇非常相似。起初企業(yè)大多是基于“質(zhì)量取勝”的原則進(jìn)行原料奶的采購與加工,但在市場競爭中,有的企業(yè)為了縮減成本,使用問題奶源或沿用落后的加工存儲技術(shù)(易使奶粉在加工過程中受到污染),利用消費(fèi)者難以識別劣質(zhì)奶粉及追溯維權(quán)難等特點(diǎn),將問題奶粉上市,致使誠信企業(yè)所占的市場份額急劇下降,其他競爭對手如不想退市,在策略選擇上就只能模仿學(xué)習(xí)這種失信行為。當(dāng)這種違規(guī)行為曝光,問題企業(yè)就會受到政府、監(jiān)管部門、消費(fèi)者的懲罰,整個行業(yè)受到整頓,許多奶粉企業(yè)又會回到符合國家標(biāo)準(zhǔn)的生產(chǎn)程序中,這是一個時間動態(tài)博弈系統(tǒng)。本文重點(diǎn)關(guān)注乳制品企業(yè)失信情況的演進(jìn)篩選過程,根據(jù)進(jìn)化博弈理論,篩選過程中既有原來策略選擇的慣性,也有潛在突變的動力,兩者共同作用,使乳制品企業(yè)違規(guī)狀態(tài)發(fā)生改變。為了清晰把握乳制品企業(yè)失信演變機(jī)制,本研究的進(jìn)化博弈模型以是否失信作為公司策略選擇單位,用動態(tài)機(jī)制來說明乳制品企業(yè)失信狀況的演變過程。
(一)模型建立
根據(jù)模型設(shè)計(jì)思想,針對乳制品企業(yè)失信情況的進(jìn)化模型作出以下假設(shè):
假設(shè)1博弈方。乳制品企業(yè)在決策時面對的是群體中的其他乳制品企業(yè),總可以假設(shè)博弈是在兩類有限理性的乳制品企業(yè)之間進(jìn)行的:企業(yè)1和企業(yè)2。
假設(shè)2策略空間。乳制品企業(yè)具有誠信(等同守規(guī))和失信(等同違規(guī))兩種可選策略。假設(shè)ki(i=1,2)表示企業(yè)i采取誠信策略時生產(chǎn)單位產(chǎn)品獲得的凈利潤,vi(i=1,2)表示企業(yè)i采取失信策略時生產(chǎn)單位產(chǎn)品獲得的凈利潤(vi>ki),qi(i=1,2)分別表示企業(yè)i生產(chǎn)乳制品的數(shù)量;m表示企業(yè)失信行為被曝光后所承擔(dān)的單位產(chǎn)品懲罰費(fèi)用(包括監(jiān)管部門罰金、消費(fèi)者產(chǎn)生“信任危機(jī)”而帶來的持續(xù)銷量損失),n表示企業(yè)失信行為被曝光的概率,則mnqi(i=1,2)為企業(yè)i選擇違規(guī)策略時的風(fēng)險成本;通常情況下,企業(yè)1和企業(yè)2均采取失信策略的得益大于其風(fēng)險成本,即v1q1>mnq1、v2q2>mnq2[1]。
假設(shè)3重視當(dāng)期收益。由于乳制品企業(yè)數(shù)量眾多,且企業(yè)制假售假行為帶有一定隱蔽性,短期內(nèi)不易被發(fā)現(xiàn),但長遠(yuǎn)收益不一定為正,故假設(shè)企業(yè)只重視當(dāng)期收益,當(dāng)期收益對公司策略選擇的影響遠(yuǎn)大于遠(yuǎn)期收益。
假設(shè)4行為策略的采取比例。假設(shè)在乳制品企業(yè)群體1中,采取失信策略的企業(yè)比例為p(0
乳制品企業(yè)的失信行為過程是在一個具有不確定性和有限理性的空間進(jìn)行的,同時企業(yè)之間的策略又是相互影響的,各成員根據(jù)其他成員的策略選擇,考慮在自身群體中的相對適應(yīng)性,來選擇和調(diào)整各自的策略[2]。在乳制品企業(yè)群體的進(jìn)化博弈過程中,由于博弈方相互均為有限理性,傾向于在決策中模仿學(xué)習(xí)對方的行為,而在模仿之初可能并不完全知道此行為的持續(xù)將給生產(chǎn)系統(tǒng)帶來多少得益、模仿后的得益大抑或原先行為的得益大,帶有相對的盲目性。因此,存在v1
博弈得益矩陣如下:
(二)進(jìn)化博弈模型求解
我們對上述模型進(jìn)行進(jìn)化博弈求解。首先,計(jì)算采用不同策略的博弈方的期望收益和群體的平均期望收益。
分別是:
分別是:
根據(jù)GINTIS[3]、謝識予[4]的研究,可以將p、y分別看成時間t的函數(shù),采取不同策略的乳制品企業(yè)的概率變化速度可以用復(fù)制動態(tài)方程表示。將進(jìn)化博弈的復(fù)制動態(tài)分析用于兩個位置上的博弈方群體,分別得到在企業(yè)1和企業(yè)2位置上的博弈方類型比例的復(fù)制動態(tài)方程為:
根據(jù)進(jìn)化博弈的穩(wěn)定策略性質(zhì),一個穩(wěn)定狀態(tài)必須對微小擾動具有穩(wěn)健性才能稱為進(jìn)化穩(wěn)定策略。也就是說,進(jìn)化博弈穩(wěn)定策略點(diǎn)在某個博弈方因?yàn)榕既诲e誤偏離它時,復(fù)制動態(tài)具有自動回位功能[5]。結(jié)合微分方程的穩(wěn)定性定理,進(jìn)化穩(wěn)定策略可以表達(dá)為:在穩(wěn)定狀態(tài)處,F(xiàn)'(p*)<0、F'(y*)<0。
對博弈方1和博弈方2的復(fù)制動態(tài)方程作分析。根據(jù)復(fù)制動態(tài)方程⑦,若p=0、1或y=(k1q1-v1q1+mnq1)/(v2q1-v1q1),F(xiàn) (p)始終為0,企業(yè)群體1中采用失信策略的企業(yè)所占的比例是穩(wěn)定的;同樣,根據(jù)方程⑧,若y=0、1或p=(k2q2-v2q2+mnq2)/(v1q2-v2q2),F(xiàn)(y)始終為0,企業(yè)群體2中采用失信策略的企業(yè)所占的比例是穩(wěn)定的。
如果y≠(k1q1-v1q1+mnq1)/(v2q1-v1q1),則p=0和p=1為兩個穩(wěn)定狀態(tài),可求解F'(p)<0確定群體變化趨勢;如果p≠(k2q2-v2q2+mnq2)/(v1q2-v2q2),則y=0和y=1為兩個穩(wěn)定狀態(tài),可求解F'(y)<0確定群體變化趨勢。依據(jù)v1與v2的大小關(guān)系,會出現(xiàn)兩種情況:
1.當(dāng)v1 博弈方1:如y>(k1q1-v1q1+mnq1)/(v2q1-v1q1),p=1為進(jìn)化穩(wěn)定策略(ESS);如y<(k1q1-v1q1+mnq1)/(v2q1-v1q1),p=0為ESS。博弈方2:如p>(k2q2-v2q2+mnq2)/(v1q2-v2q2),y=0為ESS;如p<(k2q2-v2q2+mnq2)/(v1q2-v2q2),y=1為ESS。 進(jìn)一步,我們可以把上述兩個群體類型比例變化復(fù)制動態(tài)的關(guān)系,在以兩個比例為坐標(biāo)的坐標(biāo)平面圖上表示出來,如圖1、圖2。由圖1可知,該博弈中的5個平衡點(diǎn)中,點(diǎn)A和點(diǎn)C為不穩(wěn)定源出發(fā)點(diǎn),點(diǎn)D為鞍點(diǎn),點(diǎn)B和點(diǎn)O為進(jìn)化穩(wěn)定狀態(tài),它們分別對應(yīng)于所有企業(yè)均采取誠信策略和均采取失信策略兩種模式。圖2反映了企業(yè)1和企業(yè)2的復(fù)制動態(tài)進(jìn)化博弈過程,由兩個不穩(wěn)定的均衡點(diǎn)(A和C)和鞍點(diǎn)D連成的折線為系統(tǒng)收斂于不同狀態(tài)的臨界線,即在折線的右上方(即ABCD部分)系統(tǒng)收斂于所有企業(yè)選擇失信策略的模式,在折線的左下方(即AOCD部分)系統(tǒng)收斂于所有企業(yè)選擇誠信策略的模式??紤]到系統(tǒng)的進(jìn)化是一個漫長的過程,在很長的時間內(nèi)系統(tǒng)保持一種失信與誠信共存的局面。 圖1 演化博弈分析下的博弈方類型比例變化趨勢示意圖(v1 圖2 演化博弈分析下的博弈方策略動態(tài)進(jìn)化圖(v1 2.當(dāng)v1>v2時: 博弈方1:如y>(k1q1-v1q1+mnq1)/(v2q1-v1q1),p=0為ESS;如y<(k1q1-v1q1+mnq1)/(v2q1-v1q1),p=1為ESS。博弈方2:如p> (k2q2-v2q2+mnq2)/(v1q2-v2q2),y=1為ESS;如p<(k2q2-v2q2+ mnq2)/(v1q2-v2q2),y=0為ESS。同理,我們可以把這兩個群體類型比例變化復(fù)制動態(tài)的關(guān)系,在以兩個比例為坐標(biāo)的坐標(biāo)平面的圖上表示出來,如圖3、圖4。由圖3可知,該博弈中的5個平衡點(diǎn)中,點(diǎn)F和點(diǎn)O為不穩(wěn)定源出發(fā)點(diǎn),點(diǎn)H為鞍點(diǎn),點(diǎn)E和點(diǎn)G為進(jìn)化穩(wěn)定狀態(tài),圖4反映了企業(yè)1和企業(yè)2的復(fù)制動態(tài)進(jìn)化博弈過程,當(dāng)初始情況落在EFHO區(qū)域時,博弈方1位置群體都采用誠信策略,博弈方2位置群體都采用失信策略;當(dāng)初始情況落在FHOG區(qū)域時,博弈方1位置群體都采用失信策略,博弈方2位置群體都采用誠信策略。兩個博弈方長期最終進(jìn)化結(jié)果為一方采取誠信策略,而另一方采取失信策略,即有企業(yè)會在競爭中出現(xiàn)違規(guī)造假行為,破壞市場秩序。 圖3 演化博弈分析下的博弈方類型比例變化趨勢示意圖(v1>v2) 圖4 演化博弈分析下的博弈方策略動態(tài)進(jìn)化圖(v1>v2) 有限理性博弈方通過長期的學(xué)習(xí)和策略調(diào)整,最終會沿何種軌跡,收斂于何種策略,與博弈的支付矩陣及博弈發(fā)生時的初始狀態(tài)有關(guān)。在博弈過程中,博弈雙方得益函數(shù)中某些參數(shù)值的差異及變化將導(dǎo)致進(jìn)化系統(tǒng)向不同的均衡點(diǎn)收斂。前已述及,當(dāng)v1 (一)當(dāng)v1 1.風(fēng)險成本mnqi。構(gòu)成廠商風(fēng)險成本的重要組成部分就是“企業(yè)失信行為被曝光后所承擔(dān)的單位產(chǎn)品懲罰費(fèi)用(包括監(jiān)管部門罰金、消費(fèi)者產(chǎn)生‘信任危機(jī)’而帶來的持續(xù)銷量損失)”和“企業(yè)失信行為被曝光的概率”。由圖4可看出,當(dāng)相關(guān)部門的懲罰力度越大、概率越高時,折線的右上方(即ABCD部分)的面積越小,折線的左下方(即AOCD部分)的面積越大,系統(tǒng)會趨向收斂于所有企業(yè)選擇誠信策略的模式。 2.誠信行為單位凈利潤ki與失信行為單位凈利潤vi。當(dāng)廠商采取守規(guī)策略生產(chǎn)單位產(chǎn)品的成本降低,所獲凈利潤的幅度加大,能拉近與違規(guī)獲利的差距時,折線的右上方(即ABCD部分)的面積會減小,系統(tǒng)收斂于均衡點(diǎn)O的概率會增加,即所有企業(yè)最終都采取守規(guī)策略的可能性增加;反之,當(dāng)企業(yè)的非法利潤遠(yuǎn)大于合法利潤時,逐利的本性會使所有企業(yè)采取失信策略的比例增加,導(dǎo)致折線的右上方(即ABCD部分)的面積增加。 (二)當(dāng)v1>v2時: 風(fēng)險成本mn。有限理性的博弈方在選擇策略時不僅考慮自己的得益,還需考慮其他同質(zhì)企業(yè)所選策略的得益。如果博弈方2的失信策略為其帶來的懲罰高于誠信行為,則博弈方1會趨向采用誠信策略;反之亦然。由前文p=0和y=0成為進(jìn)化穩(wěn)定策略的條件,可推導(dǎo)出博弈方2風(fēng)險成本的臨界范圍mnq2>v2q2-k2q2(v2>k2)及博弈方1風(fēng)險成本的臨界范圍mnq1< v1q1-k1q1(v1>k1),即兩博弈方的風(fēng)險成本在各自的臨界范圍內(nèi)才會趨向守規(guī)。根據(jù)vi、ki、qi等參數(shù)的數(shù)量關(guān)系不同,雙方的臨界范圍將出現(xiàn)差異,但可以推斷,參與競爭的博弈方會根據(jù)其他博弈方失信行為的得益情況調(diào)整自己的策略,如博弈方2的違規(guī)行為曝光,被處以重罰,此時即使博弈方1的風(fēng)險成本很小,它也會采取保守的誠信策略。 本文基于進(jìn)化博弈的復(fù)制動態(tài)機(jī)制,對乳制品企業(yè)之間的策略選擇進(jìn)行進(jìn)化博弈分析,考察了兩個博弈方群體相互模仿失信行為過程中,雙方非法利潤的差異對系統(tǒng)收斂效果的不同影響。分析結(jié)果表明,當(dāng)博弈方1的非法利潤小于博弈方2時,在很長的時間內(nèi)系統(tǒng)都將保持一種或全部失信,或全部誠信共存的局面;當(dāng)博弈方1的非法利潤大于博弈方2時,兩個博弈方長期最終進(jìn)化結(jié)果為一方采取誠信策略,另一方采取失信策略。影響違規(guī)行為進(jìn)化的因素有風(fēng)險成本(包括企業(yè)生產(chǎn)劣質(zhì)乳制品被查處的概率及懲罰額度)、非法利潤與合法利潤的差額等等,即使非法利潤的空間大,但相應(yīng)的風(fēng)險成本高,企業(yè)的違規(guī)行為也將趨于減少。我國相關(guān)部門在2013 至2014年的一年間就出臺了14項(xiàng)乳粉新規(guī),正是從嬰幼兒乳粉參照藥品規(guī)范管理、嬰幼兒乳粉在出廠時接受全項(xiàng)目批批檢驗(yàn)、對嬰幼兒配方乳粉行業(yè)企業(yè)進(jìn)行兼并重組、落實(shí)嬰幼兒配方乳粉生產(chǎn)企業(yè)質(zhì)量安全責(zé)任和對企業(yè)的監(jiān)督檢查方式、禁止以委托、貼牌、分裝等方式生產(chǎn)嬰幼兒配方乳粉、明確嬰幼兒配方乳粉生產(chǎn)企業(yè)應(yīng)當(dāng)具備自建自控奶源、嚴(yán)格落實(shí)質(zhì)量安全責(zé)任追究制度,建立先行賠償和追償制度[6]等方面入手,旨在大幅提高乳制品失信企業(yè)的曝光機(jī)率、懲罰力度與違法成本,令企業(yè)違規(guī)行為的機(jī)會成本增大,最終使我國的乳制品市場秩序回歸良性,提振消費(fèi)信心。從這個角度而言,本研究從進(jìn)化博弈的角度對國家當(dāng)前嚴(yán)厲的乳制品監(jiān)管行為提供了方法論的支持。 注:通常情況下,企業(yè)采取失信策略的得益大于其風(fēng)險成本,但也存在采取失信策略的得益小于風(fēng)險成本的情況。本研究暫只考慮第一種情況。 參考文獻(xiàn): [1][4]謝識予.經(jīng)濟(jì)博弈論[M].上海:復(fù)旦大學(xué)出版社,2006. [2]樊斌,李翠霞.基于質(zhì)量安全的乳制品加工企業(yè)隱蔽違規(guī)行為演化博弈分析[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2012(01). [3]Herbert Gintis.Game Theory Evolving[M].Princeton:Princeton University Press,2000. [5]黃維民,沈樂平.上市公司違規(guī)問題的進(jìn)化博弈分析[J].管理學(xué)報,2009(03). [6]http://finance.qq.com/a/20140515/006185.htm pgv_ref=aio 2012&ptlang=2052 (作者單位:廣西大學(xué))三、乳制品企業(yè)失信問題進(jìn)化博弈模型分析
四、結(jié)論