李君妍 楊家其
(武漢理工大學(xué)交通學(xué)院 武漢 430063)
藥品回收物流三方演化博弈行為研究
李君妍 楊家其
(武漢理工大學(xué)交通學(xué)院 武漢 430063)
實施藥品回收物流是解決醫(yī)藥安全問題的重要舉措.運用演化博弈理論中的復(fù)制動態(tài)的分析方法建立了藥品回收物流過程中政府、醫(yī)藥生產(chǎn)企業(yè)和消費者三者之間的博弈模型.通過建立非對稱三方博弈支付矩陣,得到了三者在不同條件下的穩(wěn)定性策略和不同策略組合的漸進趨勢.博弈分析結(jié)果顯示:消費者的策略選擇主要受到參與藥品回收過程中經(jīng)濟利益的驅(qū)使;醫(yī)藥企業(yè)回收藥品主要受政府處罰力度、消費者舉報力度和政府干預(yù)成功率影響;政府若能在不同時期分階段實施不同的策略,可以有效發(fā)揮對醫(yī)藥生產(chǎn)企業(yè)和消費者的指導(dǎo)作用.
回收物流;三方演化博弈;藥品回收;復(fù)制動態(tài)
科學(xué)回收藥品是保護消費者生命健康安全、減少環(huán)境污染和維護醫(yī)藥市場穩(wěn)定的客觀要求.目前,我國藥品回收物流面臨回收物流網(wǎng)絡(luò)和回收體系不健全、主體參與積極性低和相關(guān)法律法規(guī)尚不完善等問題.
針對藥品的回收處理, Kongar等[1]從技術(shù)上提出利用基于射頻識別技術(shù)(RFID)的設(shè)備在逆向物流過程中跟蹤過期藥品以實現(xiàn)實時數(shù)據(jù)可視化.胡亞平[2]構(gòu)建了以積分激勵為核心的廢棄藥品回收管理體系的框架和逆向供應(yīng)鏈決策模型,探討了政府補貼機制下制造商和零售商主導(dǎo)回收渠道的各方?jīng)Q策情況.王雁鳳等[3]引入居民對藥品回收點的選擇行為,建立了基于雙層規(guī)劃的過期藥品逆向物流網(wǎng)絡(luò)優(yōu)化模型,通過算例驗證了模型及算法的可行性,并對多級設(shè)施選址、藥品流向流量等決策進行了優(yōu)化.王高玲等[4]建立了政府和醫(yī)藥零售企業(yè)博弈模型,從政府、零售企業(yè)和消費者層面提出了解決過期藥品回收過程中所出現(xiàn)問題的具體措施,但是傳統(tǒng)博弈論假設(shè)參與人是完全理性的且要求完全信息條件,在實際情況中這種假設(shè)很難實現(xiàn).肖增敏[5]運用系統(tǒng)動力學(xué)方法分析了無政府參與下的過期藥品回收系統(tǒng),指出人民群眾健康水平的提高具有正外部性,因而政府在改善藥品回收環(huán)境中起關(guān)鍵作用.王世磊等[6]運用演化博弈理論分析了政府管制在企業(yè)實施逆向物流中的作用.張亞軒[7]從第三方監(jiān)管群體和藥品零售企業(yè)的博弈關(guān)系入手研究了第三方監(jiān)管群體在過期藥品回收過程中的監(jiān)管作用,通過數(shù)值仿真檢驗了關(guān)鍵參數(shù)對博弈均衡的影響.以上文獻圍繞不同群體間的利益沖突展開研究,驗證了演化博弈在解決此類問題的實用性.但現(xiàn)有的文獻大多局限于兩個參與方的分析,鮮有提到三方非對稱演化博弈.魏芳芳[8]對三方非對稱演化博弈進行了漸進穩(wěn)定性分析,得出了三個參與主體在不同情況下的穩(wěn)定性策略.
本文針對現(xiàn)有研究中各參與主體之間利益均衡如何實現(xiàn)、行為策略研究不足的問題,在分析藥品回收物流實施過程中政府、醫(yī)藥生產(chǎn)企業(yè)和消費者的行為和收益的基礎(chǔ)上,打破傳統(tǒng)的兩兩博弈,運用演化博弈理論中的復(fù)制動力學(xué)方法研究了三個參與主體之間的博弈關(guān)系.通過建立非對稱三方博弈支付矩陣,得到了三方在不同條件下的穩(wěn)定性策略,最后了分析演化穩(wěn)定的影響因素,為政府引導(dǎo)藥品回收機制提供理論依據(jù).
藥品回收物流的主要參與主體包括消費者和醫(yī)藥生產(chǎn)企業(yè),就實際情況來看,消費者和醫(yī)藥生產(chǎn)企業(yè)并沒有積極參與藥品逆向回收的過程.藥品回收物流運營成本高,前期投入資金大且短期內(nèi)難以實現(xiàn)經(jīng)濟效益,因此醫(yī)藥生產(chǎn)企業(yè)對于藥品回收缺乏積極性.而消費者缺乏廢棄藥品對身體健康和社會環(huán)境危害的認識,同時也面臨不法分子高價回收過期藥品的誘惑,因此建立長遠的藥品回收機制還需要政府作為第三大主體進行干預(yù),采取一定的監(jiān)管和引導(dǎo)措施完善藥品逆向回收機制[9].
藥品回收物流中涉及的三個參與主體之間存在明顯的博弈關(guān)系,就現(xiàn)實情況而言,非對稱三方演化博弈模型解決該問題具有很強的適用性.政府必然首先制定一系列針對藥品回收物流的政策和法規(guī)約束和指引相關(guān)的企業(yè)和消費者.醫(yī)藥生產(chǎn)企業(yè)隨后根據(jù)政府政策和企業(yè)運營情況修正判斷并做出對策,消費者在了解一定的政府政策和企業(yè)信息的基礎(chǔ)上做出決策[10].因此,三個參與主體在行動上的先后順序形成了一個動態(tài)過程.并且,三個參與主體的行為都會有意識的選擇某種行為策略來掩蓋自己的真實目的,因此三者在信息上是不對稱的.
政府的目標(biāo)是通過干預(yù)藥品回收物流來改善藥品回收環(huán)境,幫助企業(yè)建立完善的藥品回收物流網(wǎng)絡(luò),減少負外部性.但是企業(yè)沒有義務(wù)主動解決這一社會公益問題,在政府壓力下只會追求企業(yè)理性,衡量實際收益和成本并選擇最優(yōu)的策略.在市場環(huán)境的影響下,消費者會根據(jù)實際情況盡量在投入成本最少的前提下讓自己利益最大化.博弈結(jié)果對于整個社會來說,如果負外部性問題沒有得到解決即是沒有效率的.
1.1 博弈模型假設(shè)
1) 假設(shè)藥品回收物流為生產(chǎn)商負責(zé)回收模式,即由醫(yī)藥生產(chǎn)企業(yè)直接負責(zé)回收和處理退回的藥品.醫(yī)藥生產(chǎn)企業(yè)建立了覆蓋銷售區(qū)域的逆向物流網(wǎng)絡(luò),將回收的各種藥品運送至回收中心進行處理.在政府的監(jiān)管下,這種模式是外部社會成本內(nèi)部化的體現(xiàn),也是生產(chǎn)者責(zé)任延伸制的主要形式.
2) 假設(shè)參與博弈的三個利益主體:政府、醫(yī)藥生產(chǎn)企業(yè)和消費者都是有限理性參與人,在不完全信息條件下無法做出利益最大化的決策,同時具有學(xué)習(xí)和模仿能力,根據(jù)經(jīng)驗調(diào)整自己的決策.
3) 藥品回收物流需要醫(yī)藥生產(chǎn)企業(yè)和消費者共同參與才能得以進行.政府的政策會激勵醫(yī)藥生產(chǎn)企業(yè)回收藥品.
4) 藥品回收具有公益性質(zhì),在短期內(nèi)不會對醫(yī)藥生產(chǎn)企業(yè)產(chǎn)生任何直接經(jīng)濟收益.長期來看,生產(chǎn)企業(yè)可以根據(jù)藥品回收掌握產(chǎn)品回收量和流向的一手信息,有利于企業(yè)完善回收物流系統(tǒng)和信息反饋機制,同時承擔(dān)社會責(zé)任可以提高企業(yè)形象從而吸引更多消費者.
為研究不同行為策略組合下政府、醫(yī)藥生產(chǎn)企業(yè)和消費者的成本和收益,相關(guān)模型參數(shù)設(shè)定如下:C1為政府干預(yù)藥品回收物流所付出的監(jiān)管成本;S為政府對醫(yī)藥企業(yè)實施回收物流的補貼;T為政府對醫(yī)藥生產(chǎn)企業(yè)不實施回收物流收取的矯正稅;I為實施回收物流后的政府收益,包括減少藥品隨意丟棄造成污染的綠色收益及政府監(jiān)管所帶來民眾支持的社會收益;D為不實施回收物流可能帶來環(huán)境污染的處理費用;α為政府干預(yù)成功的概率;C2為醫(yī)藥生產(chǎn)企業(yè)實施回收物流的成本,包括回收成本和處理成本;P為將過期和富余藥品投入回收網(wǎng)點時醫(yī)藥生產(chǎn)企業(yè)對消費者的支付,可以是一定的購藥優(yōu)惠;G為醫(yī)藥生產(chǎn)企業(yè)實行回收物流所帶來的長遠利益;C3為消費者參與回收物流投入的人力物力成本;H為實施回收物流避免消費者服用過期藥品的健康收益;A為政府對消費者舉報醫(yī)藥生產(chǎn)企業(yè)不實施回收物流的獎勵.
1.2 博弈模型
政府在博弈中面臨兩種策略:a1為對醫(yī)藥生產(chǎn)企業(yè)回收藥品進行干預(yù);a2為不干預(yù)藥品回收物流活動.干預(yù)即是通過一定的政策和法規(guī)對藥品回收進行監(jiān)管和引導(dǎo),對回收藥品的企業(yè)采取一定的政策扶持和對不回收的企業(yè)收取一定的稅收處罰.
醫(yī)藥生產(chǎn)企業(yè)面臨兩種策略:b1為投入人力物力實施藥品回收物流;b2為不實施回收物流.
消費者面臨兩種策略:c1為將過期和富余藥品投入正規(guī)回收渠道參與回收物流并對醫(yī)藥生產(chǎn)企業(yè)進行監(jiān)督;c2為不參與醫(yī)藥回收也不對企業(yè)進行監(jiān)督.因此可以得到三個參與主體之間的八種博弈策略組合.
當(dāng)三方行為策略組合為(干預(yù),實施,參與)時,政府需要付出監(jiān)管成本C1,同時對實施回收物流的企業(yè)給予一定的補貼S,實施藥品回收物流產(chǎn)生了包括綠色收益和社會收益的政府收益I;醫(yī)藥生產(chǎn)企業(yè)要付出回收和處理成本C2和一定的消費者的支付P,獲得了政府補貼S和長遠利益G;消費者要付出一定人力物力的參與成本C3,獲得了企業(yè)支付P和健康收益H.同理,可以得到政府、企業(yè)和消費者在其他策略組合下的各自收益,三方演化博弈的策略組合及收益矩陣見表1.
表1 策略組合和博弈收益矩陣
2.1 博弈三方期望收益和群體平均收益
假設(shè)在政府、企業(yè)和消費者博弈的初始階段,政府選擇“干預(yù)”策略的比例為x,選擇“不干預(yù)”策略的比例為1-x;醫(yī)藥生產(chǎn)企業(yè)選擇“實施”策略的比例為y,選擇“不實施”策略的比例為1-y;消費者選擇“參與”策略的比例為z,選擇“不參與”策略的比例為1-z.
Ea1=yz(-C1-S+I)+
y(1-z)(-C1-S-D)+
(1-y)·z(-C1+αT-D-A)+
(1-y)(1-z)(-C1+αT-D)
(1)
Ea2=yzI+y(1-z)(-D)+
(1-y)z(-D)+(1-y)(1-z)(-D)
(2)
(3)
Eb1=xz(-C2-P+G+S)+
x(1-z)(-C2+G+S)+
(1-x)z(-C2-P+G)+
(1-x)(1-z)(-C2+G)
(4)
Eb2=xz(-αT)+x(1-z)(-αT)
(5)
(6)
Ec1=xy(H+P-C3)+
x(1-y)(-C3+A)+(1-x)y(H+P-C3)+
(1-x)(1-y)(-C3)
(7)
Ec2=0
(8)
(9)
2.2 博弈三方復(fù)制動力學(xué)方程和演化穩(wěn)定性分析
2.2.1政府采取“干預(yù)”策略比例的復(fù)制動態(tài)方程
構(gòu)建政府采取“干預(yù)”策略比例的復(fù)制動態(tài)方程為
x(1-x)[(1-y)z(-A)-
y(αT+S)-C1+αT]
(10)
對F(x)求導(dǎo)得
y(αT+S)-C1+αT]
(11)
綜上所述,政府群體動態(tài)趨勢示意圖見圖1.
圖1 政府群體動態(tài)趨勢示意圖
2.2.2企業(yè)采取“實施”策略比例的復(fù)制動態(tài)方程
構(gòu)建企業(yè)采取“實施”策略比例的復(fù)制動態(tài)方程為
y(1-y)[x(S+αT)-zP-C2+G]
(12)
對F(y)求導(dǎo)得
2) 若G-C2
綜上所述,醫(yī)藥生產(chǎn)企業(yè)群體動態(tài)趨勢示意圖見圖2.
圖2 醫(yī)藥生產(chǎn)企業(yè)群體動態(tài)趨勢示意圖
2.2.3消費者采取“參與”策略比例的復(fù)制動態(tài)方程
構(gòu)建消費者采取“參與”策略比例的復(fù)制動態(tài)方程為
z(1-z)[y(H+P)+x(1-y)A-C3] (13)
對F(z)求導(dǎo)得
2) 若H+P 綜上所述,醫(yī)藥生產(chǎn)企業(yè)群體動態(tài)趨勢示意圖見圖3. 圖3 消費者群體動態(tài)趨勢示意圖 2.3 三方演化博弈系統(tǒng)均衡性分析 當(dāng)G-C2>P時,即對于醫(yī)藥生產(chǎn)企業(yè)來說,實施回收物流所帶來的長遠利益大于實施回收物流的成本和對參與回收的消費者支付,因此無論政府選擇何種策略,醫(yī)藥生產(chǎn)企業(yè)都會選擇回收藥品.當(dāng)H+P>C3時,對于消費者來說,藥品回收所帶來的健康收益和從醫(yī)藥生產(chǎn)企業(yè)獲得的支付大于參與回收物流的成本,因此無論政府選擇何種策略,消費者都會參與藥品回收. 當(dāng)G-C2 表2 各空間均衡狀態(tài) 結(jié)合圖1~3可知,當(dāng)初始情況落在V1、V3、V5交集內(nèi)的空間時會收斂到演化穩(wěn)定策略(1,0,1),即政府干預(yù)藥品回收物流、企業(yè)不實施回收物流、消費者參與回收物流;當(dāng)初始情況落在V2、V4、V6交集內(nèi)的空間時會收斂到演化穩(wěn)定策略(0,1,0),即政府不干預(yù)藥品回收物流、企業(yè)實施回收物流、消費者不參與回收物流.而其他六種均衡狀態(tài)都不具有對微小擾動的穩(wěn)健性,最終將會收斂到以上兩種狀態(tài). 1) 對于政府而言,當(dāng)監(jiān)管藥品回收物流總成本大于不實施回收物流時對企業(yè)的稅收和對消費者舉報支付之差時,政府最終會選擇干預(yù)藥品回收物流.所以加大對不實施藥品回收企業(yè)的懲罰力度,同時適度減少對企業(yè)的補貼,提升政府干預(yù)成功率,有利于推動政府干預(yù)藥品回收物流. 2) 對于企業(yè)而言,只要在實施回收物流過程中所獲得的期望收益大于不實施回收物流時所支付的罰款,企業(yè)最終會對藥品進行回收.所以降低回收成本和對消費者的支付,增大政府補貼力度,有利于促進企業(yè)實施回收物流.故政府要主動承擔(dān)導(dǎo)向作用,針對不同的時期分階段實施不同的措施.當(dāng)初始階段企業(yè)實施回收物流積極性很低時,政府應(yīng)當(dāng)加大對不實施回收物流企業(yè)矯正稅的處罰,引導(dǎo)企業(yè)考慮到負外部性的影響.針對實施回收物流的醫(yī)藥生產(chǎn)企業(yè),政府應(yīng)當(dāng)給予合理的補貼,幫助企業(yè)建立完善的回收物流網(wǎng)絡(luò)減少其回收成本. 3) 對于消費者而言,一旦政府干預(yù)醫(yī)藥回收物流,消費者就會積極參與,即政府對消費者有明顯的指導(dǎo)作用.同時,當(dāng)參與藥品回收物流中所獲支付大于其付出的成本時,消費者就會選擇參與.在初期,政府可以通過對消費者監(jiān)督支付來激勵消費者參與藥品回收過程,同時也督促了企業(yè)承擔(dān)相應(yīng)的企業(yè)責(zé)任.隨著藥品回收機制的不斷完善,政府慢慢減少對消費者的支付,消費者也會主動監(jiān)督企業(yè)并參與到回收物流過程.另一方面,需要減少消費者參與的成本,適當(dāng)增加指定的回收點,讓消費者更方便地將藥品送去回收處理. 4) 對于博弈問題,大多數(shù)現(xiàn)有研究都是基于靜態(tài)或者動態(tài)的兩方參與主體的角度進行分析和探討,忽視了在現(xiàn)實生活中普遍存在的三方參與主體的動態(tài)博弈,本文正是基于此建立了藥品回收物流實施過程中政府、醫(yī)藥生產(chǎn)企業(yè)和社會消費者三者之間的演化博弈模型并對三者行為進行分析,得到了三方在不同條件下的穩(wěn)定性策略,同時用立體圖演示了不同策略組合的漸進趨勢.由分析可知,藥品回收物流的管理有賴于政府的指導(dǎo),不同時期分階段實施不同的策略,可以有效發(fā)揮對醫(yī)藥生產(chǎn)企業(yè)和消費者的指導(dǎo)作用. [1] KONGAR E, HAZNEDAROGLU E, Abdelghany O, et al. A novel IT infrastructure for reverse logistics operations of end-of-life pharmaceutical products[J]. Information Technology and Management,2015,16(1):51-65. [2] 胡亞平.基于積分激勵的廢棄藥品逆向供應(yīng)鏈模型研究[D].成都:西南交通大學(xué),2016. [3] 王雁鳳,黃有方.考慮居民選擇行為的過期藥品逆向物流網(wǎng)絡(luò)設(shè)計[J].華中師范大學(xué)學(xué)報(自然科學(xué)版),2015,49(1):52-59. [4] 王高玲,湯少梁,沈愛琴,等.基于政府和醫(yī)藥零售企業(yè)博弈的促進過期藥品回收的策略研究[J].預(yù)測,2011,30(5):54-58. [5] 肖增敏.家庭過期藥品回收體系中政府作用的系統(tǒng)動力學(xué)分析[J].上海醫(yī)藥,2009,30(8):360-362. [6] 王世磊,嚴(yán)廣樂,李貞.逆向物流的演化博弈分析[J].系統(tǒng)工程學(xué)報,2010,25(4):90-95. [7] 張亞軒.基于逆向物流的過期藥品回收演化博弈研究[D].鎮(zhèn)江:江蘇大學(xué),2015. [8] 魏芳芳,陳福集.三方非對稱進化博弈行為分析[J].浙江大學(xué)學(xué)報(理學(xué)版),2013,40(2):146-151. [9] 孫慶文,陸柳,嚴(yán)廣樂,等.不完全信息條件下演化博弈均衡的穩(wěn)定性分析[J].系統(tǒng)工程理論與實踐,2003,23(7):11-16. [10] 潘峰,西寶,王琳.基于演化博弈的地方政府環(huán)境規(guī)制策略分析[J].系統(tǒng)工程理論與實踐,2015(6):1393-1404. Behavior Research on Tripartite Evolutionary Game in Medicine Reverse Logistics LIJunyanYANGJiaqi (SchoolofTransportation,WuhanUniversityofTechnology,Wuhan430063,China) Operating medicine reverse logistics is a key step to ensure medical safety. The replicated dynamic method in evolution game theory is used to establish the game model among the government, pharmaceutical manufacturers and consumers in medicine reverse logistics. The stability strategy of the three parties under different conditions and the progressive trends of different strategies are obtained by establishing the asymmetric triangular game payment matrix. The results show that the strategy choice of consumers is mainly driven by the economic benefits involved in the process of medicine recovery, and pharmaceutical manufacturers are mainly affected by the punishment from the government, the report from consumers and the success rate of government intervention. If the government stages implementations for different strategies, it can effectively play a guiding role for pharmaceutical manufacturers and consumers. reverse logistics; tripartite evolutionary game; medicine reverse; replication dynamic U116.1 10.3963/j.issn.2095-3844.2017.05.029 2017-08-20 李君妍(1993-):女,碩士生,主要研究領(lǐng)域為物流管理3 結(jié) 論