楊雅斌 陳 勇
(1.佛山職業(yè)技術(shù)學(xué)院 工商管理系,廣東 佛山 528137; 2.廣州工商學(xué)院 物流系,廣州 510850)
進(jìn)入21世紀(jì),企業(yè)之間的競(jìng)爭(zhēng)不再是傳統(tǒng)的一對(duì)一爭(zhēng)奪資源之戰(zhàn),企業(yè)和上下游供應(yīng)商的關(guān)系也不再是簡(jiǎn)單的業(yè)務(wù)往來(lái),而是形成了一種供應(yīng)鏈競(jìng)爭(zhēng)與利益共享的戰(zhàn)略合作伙伴關(guān)系。 因此,企業(yè)雙方應(yīng)將目光放遠(yuǎn),做好長(zhǎng)期合作的打算,建立一種以合作和信任為基礎(chǔ)的戰(zhàn)略合作伙伴關(guān)系,通過(guò)共享信息實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),增強(qiáng)供應(yīng)鏈與其他供應(yīng)鏈的競(jìng)爭(zhēng)力。
建立供應(yīng)鏈戰(zhàn)略合作伙伴關(guān)系可以達(dá)成更有效的交流,降低不確定性造成的損失,減少外部因素的影響和管理成本,從而達(dá)到規(guī)模效應(yīng),實(shí)現(xiàn)共同目標(biāo)和雙贏模式。目前,企業(yè)要想從供應(yīng)鏈中尋找效益,需要借助博弈理論,成為新時(shí)代供應(yīng)鏈的引航者。
供應(yīng)鏈合作伙伴關(guān)系(supply chain partnership,簡(jiǎn)稱SCP)是供應(yīng)鏈成員(供應(yīng)商、制造商、分銷商、零售商、客戶等)之間在一定時(shí)期內(nèi)共享信息、一起承擔(dān)風(fēng)險(xiǎn)、一起獲利的協(xié)議關(guān)系。近幾年,企業(yè)考慮將自身業(yè)務(wù)與合作伙伴業(yè)務(wù)集成,不僅可縮短企業(yè)之間的距離,而且還能促進(jìn)先進(jìn)技術(shù)的發(fā)展。如今,大多成功企業(yè)都從原先的主從關(guān)系轉(zhuǎn)向打造供應(yīng)鏈戰(zhàn)略合作伙伴關(guān)系。
企業(yè)供應(yīng)鏈成員之間是否建立合作伙伴關(guān)系,涉及供應(yīng)鏈各成員之間的博弈問(wèn)題。博弈論是研究有理性的主體在做出決策時(shí),另一方主體所采取的應(yīng)對(duì)決策而獲得的均衡問(wèn)題[4]?;诓┺睦碚?,某一成員的收益與自己的行為和與之交易的參與者有關(guān)。
作為理性主體,個(gè)體在合作取舍方面,一定是基于成本—收益考慮的。為便于分析,下面將基于制造商和供應(yīng)商之間的戰(zhàn)略伙伴合作關(guān)系來(lái)探討供應(yīng)鏈戰(zhàn)略合作伙伴關(guān)系模型,假設(shè)雙方的收益結(jié)構(gòu)相同,用支付矩陣表示雙方博弈組合。供應(yīng)商與制造商的支付矩陣如表1所示。
表1 供應(yīng)商與制造商的支付矩陣
其中:C代表合作,N代表不合作。e表示雙方合作時(shí)每個(gè)企業(yè)的收益,e>0;f表示雙方不合作時(shí)企業(yè)的收益,e≠f;g表示企業(yè)背叛對(duì)方時(shí)的收益,g>0;h表示雙方企業(yè)都背叛對(duì)方時(shí)各自的收益,e>h且g≠h。
在理性經(jīng)濟(jì)人和不違背合作協(xié)議的前提下,供應(yīng)鏈中的每個(gè)企業(yè)都以個(gè)體利益最大化為目的,這時(shí)的供應(yīng)鏈企業(yè)合作伙伴達(dá)成的是非完全合作博弈,一般來(lái)說(shuō)非合作博弈屬于小概率事件。下面以供應(yīng)鏈合作伙伴中的供應(yīng)商和制造商為例,闡述納什均衡和重復(fù)博弈的原理及運(yùn)用。
1.2.1囚徒困境
(1)供應(yīng)商與制造商的非合作博弈
博弈論中的“囚徒困境”模型說(shuō)明,兩囚犯決策的最終結(jié)果都是基于個(gè)體理性考慮,在所選擇策略的基礎(chǔ)上達(dá)到均衡,即納什均衡(坦白,坦白),但從整體最優(yōu)考慮,卻是最糟糕的結(jié)局。從“囚徒困境”博弈我們可以得知一個(gè)事實(shí):個(gè)體理性與集體理性的沖突,即個(gè)人追求最大利益的行為,通常無(wú)法使得社會(huì)利益最大化,也很難真正實(shí)現(xiàn)個(gè)人自身利益最大化。
透過(guò)供應(yīng)鏈內(nèi)制造商與供應(yīng)商的博弈過(guò)程,可分析出供應(yīng)鏈內(nèi)企業(yè)之間的競(jìng)爭(zhēng)性對(duì)立關(guān)系。每個(gè)企業(yè)的選擇對(duì)彼此都有著影響,其可能結(jié)果如表2所示。
表2 制造商與供應(yīng)商的支付矩陣
表3給出了制造商與供應(yīng)商的不同選擇所得到的結(jié)局。由表3中數(shù)據(jù)可知,企業(yè)如果只考慮自身利益的話,雙方博弈的最優(yōu)策略選擇是(2,2);如果雙方合作的話,那么選擇策略(8,8)是最優(yōu)的。由此可見,只考慮自身利益的企業(yè)將使雙方都陷入“囚徒困境”。為此,雙方必須達(dá)成協(xié)作,才能獲得共同發(fā)展。
表3 供應(yīng)商和制造商的支付矩陣
(2)供應(yīng)商與制造商的合作博弈
在現(xiàn)實(shí)情況中,個(gè)體理性與集體理性的矛盾不可避免,為此,我們需要設(shè)定一種具有約束力的激勵(lì)機(jī)制,使局中人既能滿足個(gè)體理性又能實(shí)現(xiàn)集體理性。在上例不合作博弈的基礎(chǔ)上,假定企業(yè)雙方預(yù)先給定一個(gè)約束:如果任意一方違背約束協(xié)議的話需要付出很高的代價(jià)。我們不妨假設(shè)制裁成本分別為X1,X2,然后將決定采取一致行動(dòng)——雙方合作。
根據(jù)約束協(xié)議,開始交易時(shí)雙方都傾向合作的策略(8,8),雙方都將獲得8單位的收益,總收益最大為16。但有限理性和機(jī)會(huì)主義傾向的存在,有可能使供應(yīng)鏈節(jié)點(diǎn)上的企業(yè)從自身利益出發(fā),單方面撕毀約束協(xié)議,以求獲得更大的利益。
當(dāng)10-X1<8且10-X2<8時(shí),即違約成本X1,X2都大于2時(shí),不可能使得有機(jī)會(huì)主義傾向的企業(yè)違約,這樣就鞏固了供應(yīng)鏈長(zhǎng)期戰(zhàn)略合作伙伴的穩(wěn)定性,實(shí)現(xiàn)了個(gè)體理性基礎(chǔ)上的團(tuán)體理性。
通過(guò)數(shù)據(jù)分析可知,一次性的博弈使得參與者只考慮短期的利益,如果違約者受到的懲罰不夠大,雙方很難選擇合作博弈。當(dāng)今,由于供應(yīng)鏈合作意識(shí)比較淡,很多企業(yè)仍然處于對(duì)立狀態(tài)而非合作關(guān)系,雙方選擇非合作性的博弈往往來(lái)自利益沖突。
1.2.2重復(fù)博弈
如果將上述博弈模型作為重復(fù)博弈的原博弈,則若此博弈重復(fù)進(jìn)行有限次,使用逆向歸納法易得出:有限次重復(fù)博弈的均衡解與一次博弈沒(méi)有什么區(qū)別;如果供應(yīng)商與制造商的合作是持久的,則此博弈可認(rèn)為是無(wú)限次重復(fù)博弈。下面我們以觸發(fā)策略為基點(diǎn),預(yù)測(cè)重復(fù)博弈的均衡。
觸發(fā)策略是指在第1階段選擇合作,且在第t>1階段,如果所有前面t-1階段的結(jié)果都是(合作,合作),則選擇合作,否則選擇不合作[6]。分析過(guò)程如圖1所示。
圖1 觸發(fā)策略
由圖1可以看出,從參與人角度出發(fā),由于博弈可以循環(huán)往復(fù),博弈雙方為了長(zhǎng)期利益采取試探性的選擇。在第一次博弈時(shí)選擇合作策略以尋求對(duì)方的合作,一旦另一方為了短期利益而采取不合作行為,那么就會(huì)建立該對(duì)弈者是不可信任的理念,在下一次博弈中將采取不合作的行為,使對(duì)弈者的長(zhǎng)期利益受損。
可見,若局中人都采取這種觸發(fā)策略,那么選擇(合作,合作)始終是無(wú)限重復(fù)博弈的均衡結(jié)果。由于供應(yīng)鏈戰(zhàn)略合作伙伴的建立是直接的、長(zhǎng)期的,則采取這種策略對(duì)參與雙方而言都是最優(yōu)的,因而為納什均衡。也就是說(shuō),如果進(jìn)行多次博弈,參與者會(huì)選擇長(zhǎng)遠(yuǎn)利益從而選擇不同的均衡戰(zhàn)略,使得在一次性博弈中有可能達(dá)成合作,從而實(shí)現(xiàn)更好的均衡。
供應(yīng)鏈?zhǔn)且粋€(gè)動(dòng)態(tài)系統(tǒng),穩(wěn)定性是系統(tǒng)良好運(yùn)作的前提。由于存在個(gè)人理性與團(tuán)體理性的差異,如何使企業(yè)走出短期行為的困境,實(shí)現(xiàn)企業(yè)利潤(rùn)的帕累托最優(yōu),需將博弈理論引入供應(yīng)鏈合作伙伴關(guān)系穩(wěn)定性的研究。
在博弈論中,帕累托最優(yōu)和帕累托改進(jìn)是兩個(gè)重要的專業(yè)術(shù)語(yǔ)。帕累托最優(yōu)假定有限的人群和資源,如果改變現(xiàn)有分配狀態(tài)的話,在不損害一個(gè)人的利益情況下,不會(huì)使其他人變得更好[7]。而帕累托改進(jìn)(Pareto Improvement)基于帕累托最優(yōu)(Pareto Optimality)基礎(chǔ)之上,是指在不減少一方福利的同時(shí),重組現(xiàn)有資源分配模式來(lái)增加另一方的福利。一般帕累托改進(jìn)應(yīng)用于閑置資源和失效的市場(chǎng)中。圖2是基于兩級(jí)供應(yīng)鏈下合作博弈的帕累托改進(jìn)。
圖2 兩級(jí)供應(yīng)鏈的帕累托改進(jìn)
對(duì)供應(yīng)鏈進(jìn)行管理之前,用無(wú)差異曲線I表示上游企業(yè)A和下游企業(yè)B的總體盈利水平。其中,R點(diǎn)表示實(shí)際獲利水平。對(duì)供應(yīng)鏈流程進(jìn)行管理之后,上游企業(yè)A和下游企業(yè)B的總體獲利水平得到提升,用無(wú)差異曲線II表示。其中,無(wú)差異曲線II的ST段為帕累托改進(jìn)閉區(qū)間,該閉區(qū)間內(nèi)所有的分配方案都能獲得帕累托改進(jìn)[7]。綜上,企業(yè)A最高的獲利水平由OM提高到OP,企業(yè)B最高的獲利水平由ON提到到OQ[8]。
由上述的分析得出:總收益的增多,在基于帕累托改進(jìn)的基礎(chǔ)上,供應(yīng)鏈上各節(jié)點(diǎn)企業(yè)也能從中收益,從而達(dá)到一個(gè)新的帕累托最優(yōu)狀態(tài)。個(gè)體自身利益的增加,無(wú)形中對(duì)各節(jié)點(diǎn)企業(yè)有更多的誘惑力和激勵(lì),使得博弈雙方能夠建立并維系雙方合作的策略。
參考文獻(xiàn):