劉敬偉,黃成節(jié),蒲勇健
(1.茅臺學(xué)院,貴州 仁懷 564500;2.重慶大學(xué) 經(jīng)濟(jì)與工商管理學(xué)院,重慶 400040)
創(chuàng)新是引領(lǐng)發(fā)展的第一動力,合作研發(fā)是國家創(chuàng)新戰(zhàn)略的核心內(nèi)容之一。合作研發(fā)作為一種互惠型合作關(guān)系,是以資源優(yōu)勢互補(bǔ)為前提,以合作方的共同利益為基礎(chǔ),以合作創(chuàng)新為目的,通過彼此之間的契約等實現(xiàn)協(xié)同行動而自愿形成的組織[1]。它具有實現(xiàn)資源優(yōu)勢互補(bǔ)、降低研發(fā)風(fēng)險、提高研發(fā)效率和成功可能性的優(yōu)勢。
針對合作研發(fā)問題,國內(nèi)外學(xué)者從不同角度開展了一系列富有成效的研究。在合作研發(fā)的合作機(jī)制方面,鄭月龍(2015)針對以企業(yè)為主體的共性技術(shù)合作研發(fā)形成機(jī)制,以演化博弈為理論基礎(chǔ)進(jìn)行了研究[2]。朱晨、楊曄(2018)基于交易成本理論和演化博弈理論,以成本視角為出發(fā)點探究本土企業(yè)與跨國公司合作研發(fā)的誘發(fā)機(jī)制[3]。Sara Amoroso(2017)的研究表明:合作研發(fā)中的知識溢出、風(fēng)險與成本的合理分?jǐn)偂⑵髽I(yè)規(guī)模以及創(chuàng)新活動類型等與企業(yè)參與不同類型研發(fā)聯(lián)盟的決策有關(guān)[4]。
在合作研發(fā)的合作模式方面,陸玉梅等(2019)運(yùn)用博弈論方法研究了資金和知識投入對產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟合作研發(fā)模式的影響,分析了獨立研發(fā)模式、資金分擔(dān)模式、共同研發(fā)模式下的產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟的知識和資金投入決策問題[5]。
在合作研發(fā)的激勵與績效方面,耿智琳、張耀峰(2012)基于多代理人的模擬仿真方法分析了自主創(chuàng)新企業(yè)合作研發(fā)中企業(yè)平均收益的影響因素,建立了考慮補(bǔ)貼激勵的縱向合作研發(fā)利潤分配的演化博弈模型,以解決自主創(chuàng)新企業(yè)中新產(chǎn)品合作研發(fā)的利潤分配問題[6]。RenéBelderbos等(2004)實證分析了競爭對手、供應(yīng)商、客戶、高校及研究機(jī)構(gòu)四類合作研發(fā)伙伴之間不同的研發(fā)合作組合形式對企業(yè)績效的影響[7]。
以合作研發(fā)中的機(jī)會主義行為研究方向,易余胤等(2005)運(yùn)用演化博弈理論對企業(yè)間合作研發(fā)過程中的機(jī)會主義行為進(jìn)行演化分析,以及監(jiān)督機(jī)制對防范機(jī)會主義行為的有效性[8]。蘇中鋒(2019)通過構(gòu)建博弈模型,著重分析了合作研發(fā)的控制機(jī)制與機(jī)會主義行為的關(guān)系,豐富了對機(jī)會主義行為研究[9]。
另外,Nisvan&Daniel(2009)在允許自由進(jìn)入研發(fā)競爭和產(chǎn)品市場的條件下,分析了隨機(jī)型研發(fā)產(chǎn)出溢出模型中合作研發(fā)協(xié)議的效果[10]。René等(2004)探討了創(chuàng)新企業(yè)進(jìn)行合作研發(fā)決策的決定因素的異質(zhì)性[11]。Mário&Silva(2018)建立了一個理論框架來研究采用專有技術(shù)交易策略對研發(fā)合作程度的影響,證明了非合作企業(yè)向行業(yè)披露其專有技術(shù)的預(yù)先承諾可以有效地引導(dǎo)參與者進(jìn)行合作研發(fā)投資[12]。Deming等(2017)通過區(qū)分兩種不同類型的合作伙伴,研究了非對稱溢出在研發(fā)合作穩(wěn)定性中的作用,并運(yùn)用博弈論方法揭示了橫向和縱向合作研發(fā)中非對稱溢出與研發(fā)投資的關(guān)系[13]。
通過梳理相關(guān)文獻(xiàn)可以發(fā)現(xiàn),國內(nèi)外學(xué)者對合作研發(fā)的多個方面都進(jìn)行了一些富有價值的研究,不管是研究內(nèi)容還是研究方法都取得了一定的成效。在企業(yè)之間合作研發(fā)的策略選擇問題上,一部分研究側(cè)重于運(yùn)用經(jīng)典非合作博弈方法,在完全理性的假設(shè)下分析合作者之間的策略選擇問題[14],另一部分研究是運(yùn)用合作博弈的思路,對合作研發(fā)策略進(jìn)行分析?;谟邢蘩硇缘膭討B(tài)演化分析方法在合作研發(fā)的策略選擇問題上的研究多數(shù)集中在諸如機(jī)會主義或搭便車等合作研發(fā)的風(fēng)險分析[8,9]。文章基于有限理性假設(shè),以演化博弈的視角,運(yùn)用動態(tài)演化的理論和方法,對合作研發(fā)的策略選擇問題進(jìn)行分析。
演化穩(wěn)定策略(Evolutionary Stable Strategy,ESS)和復(fù)制動態(tài)(Replicator Dynamics)是演化博弈最核心的概念,它們分別描述了演化博弈的穩(wěn)定狀態(tài)和向這種穩(wěn)定狀態(tài)收斂的動態(tài)過程。其中,演化穩(wěn)定策略主要描述了系統(tǒng)在動態(tài)演化過程中的穩(wěn)定狀態(tài),單群體情形下,演化穩(wěn)定策略(ESS)的定義如下:
定義(Maynard Smith)[15]:如果策略s*∈S滿足以下兩個條件,則稱s*是演化穩(wěn)定策略(ESS)。
條件1:對任意的s∈S且s≠s*,有u(s*,s*)≥u(s*,s);
條件2:即使u(s*,s*)=u(s*,s),也有u(s*,s)>u(s,s)。
演化穩(wěn)定策略是:在自然選擇的作用下,如果整個種群中的每一個成員都采取這個策略,那么,不存在一個具有突變特征的策略(即突變策略)能夠侵入這個種群[15]。
而復(fù)制動態(tài)是演化博弈論中運(yùn)用最為廣泛的選擇機(jī)制動態(tài)方程,它刻畫了一個群體中采用某種策略的個體所占比例的變化過程。單群體情形下復(fù)制動態(tài)方程可以用以下微分方程給出(Taylor&Jonker)[16]:
式中,xi表示在某時刻t選擇純策略si的個體在群體中所占的比例;
u(si,s)表示群體中選擇純策略si的個體的適應(yīng)度或期望支付;
u(s,s)=∑xi·u(si,s)表示群體平均期望支付或適應(yīng)度。
當(dāng)dx/dt為x的單元函數(shù)時,上述復(fù)制動態(tài)方程可簡記為:若x*滿足F(x*)=0且F(x*)<0,則x*即為演化穩(wěn)定策略(ESS)。
在演化博弈中,博弈雙方的策略選擇收斂至均衡狀態(tài)的過程是一個動態(tài)過程,通過復(fù)制動態(tài)方程分析這個動態(tài)過程的穩(wěn)定性,可以確定系統(tǒng)的均衡性復(fù)制動態(tài)方程是描述某一特定策略在一個群體中被采用的頻數(shù)或頻度的動態(tài)微分方程。以“演化穩(wěn)定策略”和“復(fù)制動態(tài)方程”為建?;A(chǔ),通過構(gòu)建合作研發(fā)策略選擇問題的演化博弈模型,可以分析其動態(tài)演化的內(nèi)在機(jī)制。
為簡單起見,不妨假定進(jìn)行合作研發(fā)的行為主體有兩個:企業(yè)A和企業(yè)B,他們的策略集均為(合作研發(fā)、獨立研發(fā))。“合作研發(fā)”策略下,雙方按照達(dá)成的協(xié)議進(jìn)行合作研發(fā);“獨立研發(fā)”策略表示雙方不進(jìn)行合作,各自進(jìn)行獨立研發(fā),也表示在合作過程中有一方單方面違約,終止合作關(guān)系而進(jìn)行獨立研發(fā)。
第一,若兩個企業(yè)都選擇“獨立研發(fā)”策略,假設(shè)在這種不合作狀態(tài)下各自進(jìn)行獨立研發(fā)獲得的正常收益分別為π1、π2,且π1≠π2,π1,π2>0;
第二,若兩個企業(yè)都選擇“合作研發(fā)”策略,則假設(shè)在正常收益基礎(chǔ)上由雙方合作研發(fā)而獲得的超額收益為Δπ,且有Δπ>0;假設(shè)超額收益在雙方之間的分配系數(shù)為k,0≤k≤1。
第三,若兩個企業(yè)中有一方選擇“合作研發(fā)”策略,另一方選擇“獨立研發(fā)”策略,這種情況描述的是雙方合作關(guān)系達(dá)成后,一方由于反悔或者機(jī)會主義行為等原因背叛合作約定而造成違約,從而使得雙方的合作關(guān)系被迫終止。此時,違約方由于在合作過程中的信息、資源共享等原因,能夠依靠自身學(xué)習(xí)能力,通過知識溢出等途徑獲得額外收益,記為R,R>0,但同時需支付一定的違約成本C,C>0,即違約方支付給履約方的罰金等。為著眼于系統(tǒng)動態(tài)演化機(jī)理的分析,避免復(fù)雜的數(shù)學(xué)討論,又不失合理性,這里假設(shè)C>R。
基于上述對問題的描述和假設(shè)條件,可以構(gòu)建雙方博弈策略的支付矩陣,如表1所示。
表1 博弈策略支付矩陣
演化博弈論中的復(fù)制動態(tài)方程源于群體概念,當(dāng)其用于研究個體之間的博弈時,可以把個體選擇某個純策略的概率視為群體中選擇該純策略的個體所占的比例。因此,假設(shè)企業(yè)A選擇“合作研發(fā)”策略的概率為x,選擇“獨立研發(fā)”策略的概率為1-x;假設(shè)企業(yè)B選擇“合作研發(fā)”策略的概率為y,選擇“獨立研發(fā)”策略的概率為1-y。在有限理性和信息不對稱的前提下,上述支付矩陣不存在純策略納什均衡,但存在混合策略納什均衡,并且博弈雙方策略選擇的概率x和y存在動態(tài)調(diào)整,這種動態(tài)調(diào)整表現(xiàn)為雙方策略在博弈的動態(tài)復(fù)制中的演化[3]。根據(jù)演化博弈復(fù)制動態(tài)的分析方法,進(jìn)行如下計算:
企業(yè)A選擇“合作研發(fā)”策略的期望收益:
企業(yè)A選擇“獨立研發(fā)”策略的期望收益:
企業(yè)A的平均期望收益為:
企業(yè)B選擇“合作研發(fā)”策略的期望收益:
企業(yè)B選擇“獨立研發(fā)”策略的期望收益:
企業(yè)B的平均期望收益為:
根據(jù)以上計算結(jié)果,可以分別建立企業(yè)A和企業(yè)B的復(fù)制動態(tài)方程。
企業(yè)A的復(fù)制動態(tài)方程為:
企業(yè)B的復(fù)制動態(tài)方程為:
顯然,當(dāng)F(x)=0、F(y)=0時,博弈達(dá)到一種相對穩(wěn)定狀態(tài),此時可以得到該動態(tài)演化系統(tǒng)的五個局部均衡點:(x,y)={(0,0),(0,1),(1,0),(1,1),(x*,y*)},其中當(dāng)且僅當(dāng)0≤x*,y*≤1時,均衡點(x*,y*)存在。
根據(jù)Friedman提出的利用雅克比矩陣(Jacobi Matrix)分析動態(tài)系統(tǒng)局部穩(wěn)定性的方法,進(jìn)行演化穩(wěn)定性分析并求解演化穩(wěn)定策略[17]。復(fù)制動態(tài)方程式(7)、式(8)分別對x和y求偏導(dǎo)數(shù),可得該博弈系統(tǒng)的雅克比矩陣(Jacobi Matrix,J),并計算該矩陣的行列式Det(J)和跡Tr(J)如下:
根據(jù)雅克比矩陣的行列式的符號和跡的符號,可以判定系統(tǒng)局部均衡點的穩(wěn)定性,即當(dāng)Det(J)>0、Tr(J)<0時,系統(tǒng)處于演化穩(wěn)定狀態(tài)[18]。據(jù)此,對上述五個局部均衡點進(jìn)行穩(wěn)定性分析。先計算各均衡點處雅克比矩陣的行列式和跡的表達(dá)式,結(jié)果如表2所示。
表2 各均衡點處雅克比矩陣的行列式及跡的表達(dá)式
根據(jù)表2中矩陣行列式和矩陣的跡的表達(dá)式,結(jié)合上文假設(shè)C>R,及x*與y*的解的表達(dá)式,可以分以下幾種情況進(jìn)行討論:
第一,當(dāng)kΔπ-R>0,(1-kΔπ)-R>0時,即雙方通過合作研發(fā)獲得的超額收益大于終止合作而因知識外溢等獲得的額外收益;第二,當(dāng)kΔπ-R<0,(1-kΔπ)-R<0時,即雙方通過合作研發(fā)獲得的超額收益小于終止合作而因知識外溢等獲得的額外收益;第三,當(dāng)kΔπ-R>0,(1-kΔπ)-R<0時,或當(dāng)kΔπ-R<0,(1-kΔπ)-R>0時,即一方通過合作研發(fā)獲得的超額收益大于終止合作而因知識外溢等獲得的額外收益,而另一方則相反。分析結(jié)果如表3所示。
表3 各均衡點穩(wěn)定性分析結(jié)果
根據(jù)以上局部均衡點的穩(wěn)定性分析及演化穩(wěn)定策略的求解結(jié)果,可以利用matlab繪制四種不同情況下的動態(tài)演化相位圖(左圖)和動態(tài)演化路徑(右圖),如圖1-4所示。
圖1 kΔπ-R>0,(1-k)Δπ-R>0,取k=0.6,Δπ=3,R=1,C=1.5
從相位圖上看,四種情況下系統(tǒng)均收斂于(1,1),證實了E4(1,1)是演化穩(wěn)定策略(ESS),也就是說在模型假設(shè)條件下,博弈雙方的動態(tài)演化策略均為“合作研發(fā)”;從演化路徑來看,無論博弈雙方初始狀態(tài)如何,隨著時間的推移,最終也都會收斂于“合作研發(fā)”策略,同樣印證了E4(1,1)是演化穩(wěn)定策略[19]。
圖2 kΔπ-R<0,(1-k)Δπ-R<0,取k=0.4,Δπ=1.5,R=1,C=1.5
圖3 kΔπ-R>0,(1-k)Δπ-R<0,取k=0.6,Δπ=2,R=1,C=1.5
圖4 kΔπ-R<0,(1-k)Δπ-R>0,取k=0.4,Δπ=2,R=1,C=1.5
文章基于有限理性假設(shè),建立動態(tài)演化博弈模型,分析企業(yè)之間合作研發(fā)策略選擇問題的演化路徑及演化穩(wěn)定策略,并通過數(shù)值模擬與仿真,得到:首先,企業(yè)之間合作研發(fā)的策略選擇問題可以看作是一個動態(tài)演化過程,在違約成本嚴(yán)格大于因違約而獲得的額外收益這一關(guān)鍵假設(shè)條件下,無論初始狀態(tài)如何,博弈雙方的策略選擇最終會收斂于合作研發(fā)而不是獨立研發(fā),從該動態(tài)演化系統(tǒng)的相位圖中可以清晰地觀察到。其次,合作研發(fā)獲得的超額收益的分配系數(shù)并不是關(guān)鍵變量,僅影響博弈雙方的收斂速度,而不影響收斂結(jié)果,從該動態(tài)演化系統(tǒng)的演化路徑圖中可以得到直觀的認(rèn)識。最后,數(shù)值模擬顯示,合作研發(fā)產(chǎn)生的額外收益越大,雙方的收斂速度越快。
合作研發(fā)對于企業(yè)技術(shù)創(chuàng)新無疑有著重要的意義,合作研發(fā)的優(yōu)勢也是有目共睹的,但合作研發(fā)面臨的最大風(fēng)險是機(jī)會主義行為的存在,在一定的條件下,需要采取有針對性的措施來克服機(jī)會主義行為對合作研發(fā)帶來的不良影響。根據(jù)以上模型分析的結(jié)論,文章得到如下促進(jìn)合作研發(fā)的政策啟示。
一是加大對機(jī)會主義行為的懲罰力度,降低其機(jī)會主義行為的收益??梢栽诤献髌跫s中賦予雙方較大的違約成本作為懲罰因子。數(shù)值模擬表明:違約成本越高,合作研發(fā)的雙方越趨于演化穩(wěn)定策略。具體措施包括,在政府或者產(chǎn)業(yè)協(xié)會的指導(dǎo)下,建立企業(yè)聲譽(yù)機(jī)制,通過聲譽(yù)機(jī)制,增強(qiáng)企業(yè)之間合作研發(fā)的信任度,進(jìn)而能夠使合作企業(yè)更方便地選擇合適的合作研發(fā)伙伴;合作研發(fā)雙方之間建立良好的、順暢的信息溝通機(jī)制,使合作雙方的合作信息公開化、透明化[20]。
二是降低合作研發(fā)成本,提高合作收益。通過數(shù)值模擬,合作研發(fā)產(chǎn)生的額外收益越高,合作雙方的策略選擇越趨于模型中的演化穩(wěn)定策略。降低合作研發(fā)成本的途徑包括建立合作研發(fā)過程中的知識共享、信息共享、設(shè)備共享、人才共享等合作共享機(jī)制。在降低直接成本的同時,可以在合作研發(fā)過程中適當(dāng)增加監(jiān)督成本,加大監(jiān)督力度,其目的也是為了防范合作研發(fā)過程中機(jī)會主義行為的產(chǎn)生。
三是建立合理的收益分配機(jī)制。合理的收益分配機(jī)制能夠增強(qiáng)雙方的合作意愿,收益分配機(jī)制的建立不一定按照雙方的資金成本分?jǐn)偙壤齺矸峙?,也不一定按照雙方投入的人、財、物等資源的比例來進(jìn)行分配,而是需要建立一套科學(xué)、合理、公平的分配機(jī)制來保證雙方的合作能夠進(jìn)行下去,不至于中途因反悔或者機(jī)會主義行為而背叛合作,以保證合作關(guān)系的穩(wěn)定性。一個可行的方法是利用合作博弈的Shapley值來解決雙方合作收益的分配問題。
以上研究僅討論了兩方對稱博弈的情形,對于非對稱博弈和多方演化博弈未做考慮;同時,為了簡化分析,對合作研發(fā)的風(fēng)險未做考慮,有些情況下,合作研發(fā)可能不成功,存在一定的合作風(fēng)險,這可以通過在模型中增加風(fēng)險系數(shù)予以適當(dāng)處理。在后續(xù)研究中,可以從合作博弈的角度分析合作研發(fā)的收益分配關(guān)系從而建立穩(wěn)定的合作機(jī)制,也可以從機(jī)制設(shè)計的角度闡述合作研發(fā)的機(jī)制演化,又可以從產(chǎn)業(yè)內(nèi)以及不同產(chǎn)業(yè)之間的多方演化博弈機(jī)制來研究合作研發(fā)的群體動態(tài)演化路徑和演化機(jī)制。
技術(shù)經(jīng)濟(jì)與管理研究2022年2期