任 南,馬園園
江蘇科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,江蘇 鎮(zhèn)江 212003
習(xí)近平總書記在十九屆中共中央政治局集中學(xué)習(xí)時(shí)強(qiáng)調(diào)“要把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新的重要突破口”。區(qū)塊鏈技術(shù)正逐漸應(yīng)用于金融、醫(yī)療、政務(wù)、能源等領(lǐng)域[1-5],成為我國(guó)數(shù)字化轉(zhuǎn)型、加快數(shù)字經(jīng)濟(jì)發(fā)展的重要技術(shù)力量,如何解決安全和效率問題是當(dāng)前區(qū)塊鏈技術(shù)研究的重點(diǎn)之一。共識(shí)機(jī)制作為區(qū)塊鏈技術(shù)的基礎(chǔ)和核心,決定了區(qū)塊鏈的安全性、可擴(kuò)展性和去中心化程度等重要特性[6]。系統(tǒng)探究共識(shí)機(jī)制的內(nèi)在機(jī)理及優(yōu)化改進(jìn)對(duì)于提高區(qū)塊鏈技術(shù)的安全與效率具有重要的理論與現(xiàn)實(shí)意義。
目前主流的區(qū)塊鏈共識(shí)機(jī)制包括工作量證明機(jī)制[7](proof of work,PoW)、權(quán)益證明機(jī)制[8](proof of stake,PoS)、股份授權(quán)證明共識(shí)機(jī)制[9](delegated proof of stake,DPoS)和實(shí)用拜占庭容錯(cuò)協(xié)議[10](practical Byzantine fault tolerance,PBFT)。PoW由于巨大的算力消耗與出塊時(shí)間被人們所詬病;PoS權(quán)益積累會(huì)造成貧富兩極分化的問題;實(shí)用拜占庭容錯(cuò)協(xié)議不適合大規(guī)模的應(yīng)用場(chǎng)景;DPoS以類似于董事會(huì)投票的方式選舉出代理節(jié)點(diǎn)生成區(qū)塊,在一定程度上解決了工作量證明機(jī)制和權(quán)益證明機(jī)制存在的算力消耗和權(quán)益累積問題,同時(shí),減少了參與區(qū)塊生成和驗(yàn)證的節(jié)點(diǎn)數(shù)量,適用于大規(guī)模的應(yīng)用場(chǎng)景和實(shí)現(xiàn)了秒級(jí)的共識(shí)驗(yàn)證。但是DPoS存在如下問題:在DPoS中只有生成區(qū)塊的代理節(jié)點(diǎn)會(huì)獲得獎(jiǎng)勵(lì),參與投票的節(jié)點(diǎn)在本輪投票中沒有任何收益,節(jié)點(diǎn)參與投票的積極性下降,導(dǎo)致區(qū)塊鏈共識(shí)效率低下;由于DPoS以類似于董事會(huì)投票的方式選舉出塊者,因此會(huì)出現(xiàn)惡意節(jié)點(diǎn)通過賄賂手段與投票節(jié)點(diǎn)合謀獲得出塊權(quán)的現(xiàn)象,若該惡意節(jié)點(diǎn)無法完成區(qū)塊生成任務(wù)或者有篡改區(qū)塊信息的意圖,區(qū)塊鏈系統(tǒng)將面臨嚴(yán)重的安全問題。
目前,針對(duì)DPoS共識(shí)機(jī)制存在的節(jié)點(diǎn)投票不積極與合謀問題,一些學(xué)者提出了改進(jìn)方案,Xu等[11]針對(duì)節(jié)點(diǎn)合謀和惡意節(jié)點(diǎn)不能及時(shí)剔除問題,提出了基于模糊集投票的改進(jìn)方案,降低了惡意節(jié)點(diǎn)被選為代理節(jié)點(diǎn)的可能性,提高了區(qū)塊鏈的安全性和公平性。Wang等[12]針對(duì)代理共識(shí)節(jié)點(diǎn)的惡意行為與節(jié)點(diǎn)投票不積極的問題,提出一種基于信譽(yù)的區(qū)塊鏈共識(shí)協(xié)議,提高了區(qū)塊鏈的安全性與抵抗攻擊的能力。Tang等[13]針對(duì)節(jié)點(diǎn)的惡意行為造成的算力資源浪費(fèi)問題提出信譽(yù)機(jī)制,激勵(lì)節(jié)點(diǎn)誠(chéng)實(shí)參與共識(shí),提高礦池整體收益。付瑤瑤等[14]通過提出基于獎(jiǎng)勵(lì)激勵(lì)和信用機(jī)制的改進(jìn)方案,提高了節(jié)點(diǎn)投票的積極性和降低了惡意節(jié)點(diǎn)成為代理節(jié)點(diǎn)的概率,提高了區(qū)塊鏈系統(tǒng)的安全性。
上述研究大多從技術(shù)角度出發(fā)解決問題,并未過多關(guān)注節(jié)點(diǎn)間行為策略的相互影響以及策略變化的問題。Liu等[15]提出博弈論作為一種分析工具,可以應(yīng)用于解決區(qū)塊鏈存在的攻擊、共識(shí)中的利益分配和激勵(lì)機(jī)制設(shè)定問題。目前,已有學(xué)者在此方面開展了一些研究,袁勇等[16]指出區(qū)塊鏈共識(shí)算法與激勵(lì)機(jī)制是一個(gè)整體,將區(qū)塊鏈運(yùn)作系統(tǒng)建模為節(jié)點(diǎn)群體博弈過程,共識(shí)規(guī)則和獎(jiǎng)懲制度將決定博弈樹的形狀和葉節(jié)點(diǎn)的收益。唐長(zhǎng)兵等[17]從工作量證明共識(shí)算法的挖礦困境入手,分析共識(shí)過程中礦工策略選擇的納什均衡存在條件,利用零行行列式策略對(duì)礦工策略進(jìn)行優(yōu)化,為設(shè)計(jì)基于博弈論的共識(shí)算法提供思路和方法。王雷等[18]針對(duì)雙花攻擊問題,構(gòu)建進(jìn)化博弈模型并解釋節(jié)點(diǎn)策略的動(dòng)態(tài)演化趨勢(shì),預(yù)測(cè)雙花攻擊出現(xiàn)的概率。Adler等[19]為保證區(qū)塊鏈系統(tǒng)的安全性,把投票節(jié)點(diǎn)和代理共識(shí)節(jié)點(diǎn)作為博弈方,分析表明在設(shè)置的規(guī)則條件下存在納什均衡,所有理性參與者為了利益最大化都將誠(chéng)實(shí)行事。上述研究利用博弈論為解決區(qū)塊鏈共識(shí)存在的安全、利益分配、交易延遲等方面提供了一定的指導(dǎo)意義,但對(duì)于監(jiān)管和獎(jiǎng)懲對(duì)于節(jié)點(diǎn)行為的影響關(guān)注過少。
共識(shí)機(jī)制中加入監(jiān)察機(jī)制可以有效遏制惡意節(jié)點(diǎn)的不良行為,進(jìn)而保證共識(shí)安全和提高共識(shí)效率[20-21]。劉懿中等[6]從共識(shí)機(jī)制本質(zhì)等角度對(duì)共識(shí)機(jī)制進(jìn)行研究,區(qū)塊鏈技術(shù)人員可以將節(jié)點(diǎn)共識(shí)過程以及治理規(guī)則寫入鏈上,實(shí)現(xiàn)區(qū)塊鏈節(jié)點(diǎn)自身行為監(jiān)管。Tao等[22]針對(duì)區(qū)塊鏈中存在惡意節(jié)點(diǎn)問題,引入監(jiān)管節(jié)點(diǎn)輔助監(jiān)管,及時(shí)糾正和更換惡意節(jié)點(diǎn)。上述研究關(guān)注到了監(jiān)管對(duì)惡意節(jié)點(diǎn)行為的束縛作用,但并未對(duì)監(jiān)管力度和監(jiān)管與獎(jiǎng)懲的協(xié)同作用進(jìn)行深入研究。
目前針對(duì)共識(shí)機(jī)制的改進(jìn)研究大多集中在計(jì)算機(jī)科學(xué)和密碼學(xué)領(lǐng)域,但是已有研究表明節(jié)點(diǎn)遵循特定的規(guī)則完成共識(shí)任務(wù)并獲得利益本質(zhì)上是一個(gè)經(jīng)濟(jì)問題,站在管理的視角通過改變節(jié)點(diǎn)的行為優(yōu)化共識(shí)機(jī)制是可行的。同時(shí),盡管學(xué)者們很少關(guān)注監(jiān)管與獎(jiǎng)懲對(duì)節(jié)點(diǎn)行為影響的協(xié)同作用,但也有研究表明監(jiān)管機(jī)制和獎(jiǎng)懲制度在一定程度上可以遏制不良行為[23]。故本文結(jié)合DPoS共識(shí)機(jī)制改進(jìn)的研究現(xiàn)狀與博弈論在區(qū)塊鏈中的分析應(yīng)用,站在管理的視角,引入監(jiān)察機(jī)制,構(gòu)建代理節(jié)點(diǎn)、投票節(jié)點(diǎn)、監(jiān)管節(jié)點(diǎn)三方主體演化博弈模型,研究在監(jiān)管與獎(jiǎng)懲的協(xié)同作用下節(jié)點(diǎn)行為策略的動(dòng)態(tài)演化趨勢(shì)和懲罰因子對(duì)三方演化趨勢(shì)的影響。
在區(qū)塊鏈系統(tǒng)中,扮演不同角色的節(jié)點(diǎn)群體根據(jù)達(dá)成共識(shí)的規(guī)則和影響因素選擇行為策略進(jìn)行博弈,經(jīng)過不斷地學(xué)習(xí)和調(diào)整達(dá)到演化博弈的穩(wěn)定狀態(tài)。不同于經(jīng)典博弈論研究?jī)蓚€(gè)個(gè)體之間的交互作用,演化博弈引入種群的思維模式,以群體為研究對(duì)象,探索群體達(dá)到某一穩(wěn)定狀態(tài)并且如何達(dá)到的[24]。在節(jié)點(diǎn)演化博弈模型中,把節(jié)點(diǎn)群體行為的調(diào)整看作一個(gè)動(dòng)態(tài)過程,把個(gè)體行為到群體行為的形成機(jī)制以及涉及到的因素納入其中,構(gòu)成一個(gè)具有微觀基礎(chǔ)的宏觀模型,為調(diào)控節(jié)點(diǎn)群體行為提供理論依據(jù),其中,每個(gè)節(jié)點(diǎn)都是重復(fù)從群體中隨機(jī)選取其他節(jié)點(diǎn)進(jìn)行博弈,他們既可以通過自身經(jīng)驗(yàn)也可以模仿他人而做出決策。
為解決節(jié)點(diǎn)投票不積極和合謀問題,本方案設(shè)計(jì)代理人選舉規(guī)則如下:投票節(jié)點(diǎn)權(quán)重是由節(jié)點(diǎn)的實(shí)際權(quán)益和信譽(yù)值決定的,候選節(jié)點(diǎn)(以下統(tǒng)稱為代理節(jié)點(diǎn))的得分是由得票數(shù)和自身信譽(yù)值決定,得票數(shù)最多的前n名候選節(jié)點(diǎn)成為代理節(jié)點(diǎn)生成區(qū)塊。代理節(jié)點(diǎn)若是通過與投票節(jié)點(diǎn)合謀獲得生成區(qū)塊的權(quán)力,將會(huì)承擔(dān)經(jīng)濟(jì)處罰、信譽(yù)值降低和被踢出代理節(jié)點(diǎn)組織群體的后果;投票節(jié)點(diǎn)受賄合謀,將承擔(dān)經(jīng)濟(jì)和信譽(yù)值降低的雙重處罰;改進(jìn)方案加入監(jiān)管節(jié)點(diǎn),該節(jié)點(diǎn)負(fù)責(zé)監(jiān)管網(wǎng)絡(luò)中節(jié)點(diǎn)的行為,對(duì)節(jié)點(diǎn)的合謀意向行為進(jìn)行處罰,同時(shí),系統(tǒng)也會(huì)對(duì)于未履行監(jiān)管職責(zé)的監(jiān)管節(jié)點(diǎn)進(jìn)行處罰。當(dāng)節(jié)點(diǎn)均正常參與投票與選舉,系統(tǒng)穩(wěn)定發(fā)展,節(jié)點(diǎn)手中的權(quán)益增值,所有的節(jié)點(diǎn)都能夠獲得間接收益,方案以懲罰機(jī)制約束節(jié)點(diǎn)的負(fù)向行為,以獎(jiǎng)勵(lì)機(jī)制激勵(lì)節(jié)點(diǎn)的正向行為,從管理視角分析節(jié)點(diǎn)行為。
結(jié)合DPoS共識(shí)機(jī)制的改進(jìn)方案,為分析各方策略均衡點(diǎn)的穩(wěn)定性以及獎(jiǎng)懲力度對(duì)演化穩(wěn)定趨勢(shì)的影響,做出如下假設(shè):
H1:代理節(jié)點(diǎn)為參與方1,投票節(jié)點(diǎn)為參與方2,監(jiān)管節(jié)點(diǎn)為參與方3。三方均為有限理性的參與主體,代理節(jié)點(diǎn)的策略空間A=(A1,A2)=(賄賂,不賄賂),投票節(jié)點(diǎn)的策略空間為V=(V1,V2)=(接受,不接受),監(jiān)管節(jié)點(diǎn)的策略空間為S=(S1,S2)=(不監(jiān)管,監(jiān)管)。
H2:代理節(jié)點(diǎn)通過正常投票選舉獲得生成區(qū)塊的能力,完成區(qū)塊生成任務(wù)獲利為R1,通過賄賂獲得區(qū)塊生成的權(quán)力,需賄賂成本C1,合謀成功收益為R2,僅有賄賂意圖但未成功實(shí)施不需要成本。在監(jiān)管節(jié)點(diǎn)監(jiān)管的情況下,代理節(jié)點(diǎn)的賄賂行為和賄賂意向都將被處以罰金B(yǎng)1,信譽(yù)值降低D1;監(jiān)管節(jié)點(diǎn)不監(jiān)管時(shí),代理節(jié)點(diǎn)將會(huì)獲得合謀收益R2。
H3:投票節(jié)點(diǎn)正常投票獲利為R3,在未改進(jìn)方案中,節(jié)點(diǎn)投票沒有直接收益,僅有權(quán)益增值后的間接收益,改進(jìn)方案設(shè)定節(jié)點(diǎn)正常參與投票就會(huì)獲得收益R3,受賄參與合謀進(jìn)行投票獲得收益R4,不論是否接受賄賂,投票節(jié)點(diǎn)的投票成本均為C3。監(jiān)管節(jié)點(diǎn)監(jiān)管時(shí),投票節(jié)點(diǎn)接受賄賂的行為將被處以罰金B(yǎng)2,信譽(yù)值降低D2;監(jiān)管節(jié)點(diǎn)不監(jiān)管時(shí),投票節(jié)點(diǎn)獲得合謀收益R4。
H4:監(jiān)管節(jié)點(diǎn)的監(jiān)管成本為C2,監(jiān)管行為的收益為R5,發(fā)現(xiàn)節(jié)點(diǎn)合謀,監(jiān)管節(jié)點(diǎn)將會(huì)收獲罰金B(yǎng)1、B2;θ為對(duì)監(jiān)管節(jié)點(diǎn)的失職行為進(jìn)行懲罰的力度(以下簡(jiǎn)稱懲罰因子),可根據(jù)演化程度適當(dāng)調(diào)整θ值,B3為監(jiān)管節(jié)點(diǎn)未履行監(jiān)管職責(zé)的罰金,若在節(jié)點(diǎn)存在合謀行為或者合謀意圖而監(jiān)管節(jié)點(diǎn)未采取監(jiān)管行為的情況下,將被以θ的懲罰力度處于罰金θB3,監(jiān)管節(jié)點(diǎn)未實(shí)施監(jiān)管行為時(shí)可以利用監(jiān)管資源獲得其他收益I。
H5:監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略,投票節(jié)點(diǎn)與代理節(jié)點(diǎn)無合謀意圖,系統(tǒng)穩(wěn)定發(fā)展,三方節(jié)點(diǎn)主體獲得權(quán)益增值價(jià)值n。不考慮貨幣的時(shí)間價(jià)值對(duì)節(jié)點(diǎn)收益造成的影響。
H6:代理節(jié)點(diǎn)選擇賄賂策略的概率為x,不賄賂策略的概率為1-x;投票節(jié)點(diǎn)選擇接受賄賂策略的概率為y,不接受策略的概率為1-y;監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略的概率為z,監(jiān)管策略的概率為1-z。為研究方案改進(jìn)對(duì)節(jié)點(diǎn)投票積極性的影響,設(shè)方案改進(jìn)的概率為w,方案不改進(jìn)的概率為1-w,節(jié)點(diǎn)參與投票的概率為q,不參與投票的概率為1-q。其中x、y、z、w、q均為時(shí)間t的函數(shù),R1,R2,R3,R4,R5,C1,C2,C3,B1,B2,B3,D1,D2,n,I>0,0≤x,y,z,w,q≤1。
基于上述假設(shè),對(duì)未改進(jìn)方案的演化穩(wěn)定策略進(jìn)行分析,已知未改進(jìn)方案中無監(jiān)管節(jié)點(diǎn)與獎(jiǎng)懲機(jī)制,投票節(jié)點(diǎn)完成投票任務(wù)后沒有投票獎(jiǎng)勵(lì),構(gòu)建代理節(jié)點(diǎn)主體、投票節(jié)點(diǎn)主圖兩方演化博弈模型,收益矩陣如表1所示。
表1 未改進(jìn)方案演化博弈收益矩陣Table 1 Unimproved scheme evolutionary game profit matrix
改進(jìn)方案加入監(jiān)管節(jié)點(diǎn)和獎(jiǎng)懲機(jī)制構(gòu)建代理節(jié)點(diǎn)主體,投票節(jié)點(diǎn)主體與監(jiān)管節(jié)點(diǎn)主體三類節(jié)點(diǎn)主體間的演化博弈模型,三類主體不同策略組合的收益矩陣如表2所示。其中R3、R4為投票節(jié)點(diǎn)收益減去成本的純收益,為簡(jiǎn)化計(jì)算,表2未引入投票成本C3。
表2 改進(jìn)方案演化博弈收益矩陣Table 2 Improved scheme evolutionary game profit matrix
改進(jìn)方案為激勵(lì)節(jié)點(diǎn)積極參與投票,設(shè)計(jì)投票節(jié)點(diǎn)參與即可獲得收益,構(gòu)建方案改進(jìn)與投票節(jié)點(diǎn)的演化博弈模型,由于節(jié)點(diǎn)積極參與投票維護(hù)區(qū)塊鏈的良性發(fā)展,改進(jìn)共識(shí)方案后礦池收益增加,為了研究改進(jìn)方案對(duì)節(jié)點(diǎn)投票積極性的影響,故僅考慮投票節(jié)點(diǎn)的收益,方案改進(jìn)前后礦池收益以“*”表示,其投票節(jié)點(diǎn)的收益矩陣如表3所示。
表3 方案與投票節(jié)點(diǎn)的演化博弈收益矩陣Table 3 Evolutionary game profit matrix of scheme and voting node
根據(jù)表1的收益矩陣,可以得出代理節(jié)點(diǎn)賄賂策略的期望收益EA1和不賄賂策略的期望收益EA2及策略選擇的平均收益EA各為:
從以上策略組合的收益表可以看出,在沒有監(jiān)管節(jié)點(diǎn)監(jiān)管和獎(jiǎng)懲機(jī)制的約束下,節(jié)點(diǎn)的收益與選擇合謀策略的概率成正比,從理性經(jīng)濟(jì)人的角度來看,為了利益最大化,節(jié)點(diǎn)在達(dá)成共識(shí)時(shí)均會(huì)選擇合謀策略。
代理節(jié)點(diǎn)賄賂策略的復(fù)制動(dòng)態(tài)方程為:
投票節(jié)點(diǎn)接受策略的期望收益E'V1和舉報(bào)策略的期望收益E'V2及策略選擇的平均收益E'V為:
投票節(jié)點(diǎn)接受策略的復(fù)制動(dòng)態(tài)方程為:
監(jiān)管節(jié)點(diǎn)不監(jiān)管策略的期望收益ES1和監(jiān)管策略的期望收益ES2及策略選擇的平均收益ES為:
動(dòng)態(tài)復(fù)制系統(tǒng)穩(wěn)定點(diǎn)所對(duì)應(yīng)的策略組合為演化博弈的一個(gè)均衡,簡(jiǎn)稱為演化穩(wěn)定[25],基于演化穩(wěn)定策略的性質(zhì),博弈群體達(dá)到演化穩(wěn)定點(diǎn)的條件必須滿足該策略下的復(fù)制動(dòng)態(tài)方程等于零且一階導(dǎo)數(shù)小于零。
2.2.1 代理節(jié)點(diǎn)賄賂策略的復(fù)制動(dòng)態(tài)分析
2.2.2 投票節(jié)點(diǎn)接受策略的復(fù)制動(dòng)態(tài)分析
2.2.3 監(jiān)管節(jié)點(diǎn)不監(jiān)管策略的復(fù)制動(dòng)態(tài)分析管概率隨著代理節(jié)點(diǎn)的賄賂概率與投票節(jié)點(diǎn)的接受概率的增加而增加。
圖1 三方主體策略演化過程Fig.1 Evolution process of tripartite agent strategy
令三方博弈主體的復(fù)制動(dòng)態(tài)方程(10)、(14)、(18)等于零求解可知存在如下系統(tǒng)均衡點(diǎn)E1(1,1,1)、E2(1,1,0)、E3(1,0,1)、E4(1,0,0)、E5(0,1,1)、E6(0,1,0)、E7(0,0,1)、E8(0,0,0)、E9(x1,y1,z1)、E10(x2,y2,z2)、E11(x3,y3,z3),其中
對(duì)以上均衡點(diǎn),利用雅可比矩陣判斷以上均衡點(diǎn)是否穩(wěn)定演化,當(dāng)其特征值均為負(fù)時(shí),則均衡點(diǎn)為演化穩(wěn)定點(diǎn);當(dāng)其特征值有一個(gè)為正時(shí),則均衡點(diǎn)不是演化穩(wěn)定點(diǎn);當(dāng)其存在為零的特征值,其余特征值均為負(fù)時(shí),則均衡點(diǎn)處于臨界演化穩(wěn)定狀態(tài)[26]。該三方演化博弈系統(tǒng)的雅可比矩陣:
在非對(duì)稱博弈中,演化穩(wěn)定均衡點(diǎn)一定是嚴(yán)格納什均衡點(diǎn),嚴(yán)格納什均衡點(diǎn)一定是純策略均衡點(diǎn),故在非對(duì)稱博弈中混合策略均衡點(diǎn)一定不是演化穩(wěn)定均衡點(diǎn)[27],故僅討論純策略均衡點(diǎn)的穩(wěn)定性,E1~E8特征值及均衡點(diǎn)穩(wěn)定性分析如表4所示。
表4 均衡點(diǎn)穩(wěn)定性分析Table 4 Stability analysis of equilibrium point
均衡點(diǎn)穩(wěn)定性分析如下:
(1)E1(1,1,1):代理節(jié)點(diǎn)賄賂策略帶來的超額收益大于實(shí)施賄賂成本,λ1=-(R2-R1-C1)<0,投票節(jié)點(diǎn)接受賄賂進(jìn)行合謀的收益大于正常投票收益,λ2=-(R4-R3)<0,下面對(duì)λ3進(jìn)行分析。
情形1若I-θB3<(R5+B1+B2-C2),則監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略的收益小于監(jiān)管時(shí)的收益,λ3>0,存在雅可比矩陣大于零的特征值,該點(diǎn)為不穩(wěn)定均衡點(diǎn)。
情形2若I-θB3>(R5+B1+B2-C2),則監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略的收益大于監(jiān)管時(shí)的收益,λ3<0,雅可比矩陣的特征值均小于零,該點(diǎn)為穩(wěn)定均衡點(diǎn)。對(duì)應(yīng)的穩(wěn)定演化策略為(賄賂,接受,不監(jiān)管),即代理節(jié)點(diǎn)選舉過程存在大量合謀現(xiàn)象且沒有監(jiān)管措施,對(duì)區(qū)塊鏈網(wǎng)絡(luò)中共識(shí)節(jié)點(diǎn)安全高效達(dá)成共識(shí)造成極大的安全隱患,不是方案的改進(jìn)目標(biāo)。
(2)E2(1,1,0):λ1=-(R2-R1-C1-B1-D1),λ2=-(R4-R3-B2-D2),λ3=I-θB3-(R5+B1+B2-C2),對(duì)λ1、λ2、λ3的符號(hào)進(jìn)行判定。
情形1若R2-R1-C1>B1+D1、R4-R3>B2+D2且I-θB3<R5+B1+B2-C2,則代理節(jié)點(diǎn)通過賄賂行為獲得區(qū)塊生成的權(quán)力所獲得的收益大于被監(jiān)管的處罰,投票節(jié)點(diǎn)受賄投票獲得的超額收益大于被監(jiān)管的處罰,監(jiān)管節(jié)點(diǎn)不監(jiān)管的收益小于監(jiān)管的收益,對(duì)應(yīng)雅可比矩陣的特征值均小于零,該點(diǎn)為演化穩(wěn)定點(diǎn)。此時(shí),監(jiān)管節(jié)點(diǎn)的監(jiān)管行為和懲罰措施不能阻止代理節(jié)點(diǎn)和投票節(jié)點(diǎn)的合謀行為,此時(shí)系統(tǒng)存在極大的安全隱患,不是方案的改進(jìn)目標(biāo)。
情形2若R2-R1-C1<B1+D1、R4-R3<B2+D2且I-θB3<R5+B1+B2-C2,則代理節(jié)點(diǎn)和投票節(jié)點(diǎn)的合謀行為獲得的超額收益均小于被監(jiān)管的處罰,監(jiān)管節(jié)點(diǎn)的監(jiān)管行為能夠有效阻止選舉投票過程中的合謀行為,此時(shí)對(duì)應(yīng)的雅可比矩陣存在大于零的特征值,該點(diǎn)不是演化穩(wěn)定點(diǎn)。
(3)E4(1,0,0)、E4(1,0,0)、E5(0,1,1)、E6(0,1,0)均衡點(diǎn)的雅可比矩陣均存在大于零的特征值,以上各均衡點(diǎn)不是演化穩(wěn)定點(diǎn)。
(4)E7(0,0,1)、E8(0,0,0),λ1、λ2均小于零,λ3=±(n+I-R5+C2),下面對(duì)E7、E8的特征值λ3進(jìn)行討論。
情形1n+I>(R5-C2),即λ3=-(n+I-R5+C2),均衡點(diǎn)的雅可比矩陣的特征值λ1、λ2、λ3均小于零,此時(shí)對(duì)應(yīng)的策略組合為(不賄賂,不接受,不監(jiān)管),代理和投票節(jié)點(diǎn)合謀收益均小于正常投票選舉收益,監(jiān)管節(jié)點(diǎn)的監(jiān)管收益小于不監(jiān)管收益,即在監(jiān)管節(jié)點(diǎn)監(jiān)管和罰金與信譽(yù)值的處罰約束下,系統(tǒng)節(jié)點(diǎn)經(jīng)過不斷博弈演化到最優(yōu)進(jìn)化策略,代理節(jié)點(diǎn)按照正常的投票選舉產(chǎn)生和安全高效的完成區(qū)塊生成任務(wù),投票節(jié)點(diǎn)根據(jù)各節(jié)點(diǎn)的真實(shí)情況進(jìn)行投票完成投票任務(wù),監(jiān)管節(jié)點(diǎn)由于區(qū)塊鏈網(wǎng)絡(luò)中節(jié)點(diǎn)達(dá)成共識(shí)的狀態(tài)良好,無安全隱患且無需監(jiān)管,這正是方案的設(shè)計(jì)目標(biāo)。
情形2n+I<(R5-C2),即λ3=n+I-R5+C2,均衡點(diǎn)的雅可比矩陣的特征值λ1、λ2、λ3均小于零,此時(shí)對(duì)應(yīng)的策略組合為(不賄賂,不接受,監(jiān)管),即該共識(shí)機(jī)制使運(yùn)用該機(jī)制的區(qū)塊鏈系統(tǒng)處于安全高效的運(yùn)行環(huán)境時(shí),監(jiān)管節(jié)點(diǎn)仍采取監(jiān)管策略,保證代理節(jié)點(diǎn)的正常選舉,此情形為本方案的次穩(wěn)定演化點(diǎn)。從理性經(jīng)濟(jì)人角度出發(fā),可以降低監(jiān)管節(jié)點(diǎn)的監(jiān)管獎(jiǎng)勵(lì),促使監(jiān)管節(jié)點(diǎn)改變行為策略,利用自身資源獲得其他收益I,使系統(tǒng)演化至E7狀態(tài);當(dāng)系統(tǒng)中節(jié)點(diǎn)存在變異個(gè)體乃至群體時(shí),可以提高監(jiān)管節(jié)點(diǎn)的監(jiān)管獎(jiǎng)勵(lì),確保系統(tǒng)安全高效的運(yùn)行環(huán)境。
為了驗(yàn)證本文改進(jìn)方案能夠有效解決節(jié)點(diǎn)投票不積極與節(jié)點(diǎn)合謀問題,結(jié)合三方演化博弈模型的穩(wěn)定性分析對(duì)方案中各變量進(jìn)行賦值,利用Matlab2018a進(jìn)行數(shù)值仿真分析。初始值設(shè)定C2=2,B3=12,n=4,B2=3,D2=3,R5=5,I=10,θ=0.5(當(dāng)節(jié)點(diǎn)均處于意向合謀狀態(tài)時(shí)θ>0.5,當(dāng)監(jiān)管作用使代理節(jié)點(diǎn)的放棄賄賂策略時(shí)θ<0.5)。
首先根據(jù)上述數(shù)值設(shè)定,R1=10、R2=15、C1=3、B1=6、D1=6、R3=3、R4=5、C2=2、B3=12、D2=3、R5=5、C2=2、B3=12、n=4、I=20、θ=0.5,進(jìn)行方案改進(jìn)前后節(jié)點(diǎn)行為策略選擇的演化趨勢(shì)仿真分析,如圖2所示。
圖2 E7(0,0,1)穩(wěn)定點(diǎn)趨勢(shì)圖Fig.2 Trend diagram of steady point E7(0,0,1)
當(dāng)I-θB3>(R5+B1+B2-C2)和R2-R1-C1<B1+D1、R4-R3<B2+D2時(shí),監(jiān)管節(jié)點(diǎn)不監(jiān)管的收益大于監(jiān)管收益,代理節(jié)點(diǎn)和投票節(jié)點(diǎn)合謀收益小于正常投票收益,無論三方節(jié)點(diǎn)行為策略選擇的初始概率為多少,最終都將趨向于唯一的演化穩(wěn)定點(diǎn)(0,0,1),相應(yīng)的演化穩(wěn)定策略為(不賄賂,不接受,不監(jiān)管),與進(jìn)化博弈演化穩(wěn)定點(diǎn)的分析相吻合。
原方案未引入監(jiān)管與獎(jiǎng)懲機(jī)制,節(jié)點(diǎn)選擇合謀策略的收益大于正常投票選舉的收益,從圖3可以看出,無論兩節(jié)點(diǎn)行為策略選擇的初始概率為多少,都將趨向于唯一的演化穩(wěn)定點(diǎn)(1,1),對(duì)應(yīng)的演化穩(wěn)定策略為(賄賂,接受),如圖3所示。
對(duì)比圖2和圖3可以看出,改進(jìn)方案中的監(jiān)管機(jī)制與獎(jiǎng)懲機(jī)制能夠有效阻止代理節(jié)點(diǎn)與投票節(jié)點(diǎn)在投票選舉過程中的合謀行為,同時(shí)也能在一定程度上減少惡意節(jié)點(diǎn)謀劃成為代理節(jié)點(diǎn)對(duì)區(qū)塊鏈惡意攻擊的概率。
圖3 原方案節(jié)點(diǎn)合謀策略演化穩(wěn)定趨勢(shì)圖Fig.3 Original plan node collusion strategy evolution and stability trend graph
當(dāng)I-θB3<(R5+B1+B2-C2)和R4-R3>B2+D2、R2-R1-C1>B1+D1時(shí),設(shè)數(shù)值R1=10,R2=15,C1=2,B1=0.5,D1=0.5,R3=3,R4=5,B2=0.25,D2=0.25,R5=5,C2=1,B3=12,n=4,I=10,θ=0.5,對(duì)三方演化穩(wěn)定策略進(jìn)行模擬仿真,如圖4所示。
圖4 E2(1,1,0)穩(wěn)定點(diǎn)趨勢(shì)圖Fig.4 Trend diagram of steady point E2(1,1,0)
改進(jìn)方案中唯一的演化穩(wěn)定策略點(diǎn)是(0,0,1),演化穩(wěn)定策略為(不賄賂,不接受,不監(jiān)管),但是當(dāng)IθB3<(R5+B1+B2-C2)和R2-R1-C1<B1+D1、R4-R3<B2+D2時(shí),即監(jiān)管節(jié)點(diǎn)選擇監(jiān)管策略的收益大于不監(jiān)管策略的收益,代理節(jié)點(diǎn)與投票節(jié)點(diǎn)的合謀收益大于監(jiān)管繳納的罰金。監(jiān)管節(jié)點(diǎn)的監(jiān)管行為與獎(jiǎng)懲機(jī)制均不能有效阻止節(jié)點(diǎn)在投票選舉過程中的合謀行為,區(qū)塊鏈達(dá)成共識(shí)存在嚴(yán)重的安全隱患和算力資源浪費(fèi),故應(yīng)當(dāng)合理地設(shè)置懲罰與監(jiān)察力度,通過控制監(jiān)管節(jié)點(diǎn)的其他收益,規(guī)制監(jiān)管節(jié)點(diǎn)履行監(jiān)管職責(zé),極力避免這種情景。
為了保證區(qū)塊鏈系統(tǒng)以盡可能小的算力消耗安全高效的達(dá)成共識(shí),完成交易的記錄,需要在節(jié)點(diǎn)群體演化的不同階段調(diào)整懲罰因子,本文設(shè)定懲罰因子θ(0≤θ≤1),設(shè)定數(shù)值θ=0.2,0.5,0.8研究對(duì)三方節(jié)點(diǎn)穩(wěn)定演化趨勢(shì)影響進(jìn)行仿真分析,如圖5所示。
圖5 懲罰因子θ對(duì)三方主體行為策略選擇的影響Fig.5 Influence of penalty factorθon behavior strategy choice of three parties
根據(jù)圖5仿真結(jié)果可知,代理節(jié)點(diǎn)與投票節(jié)點(diǎn)選擇合謀的概率隨著獎(jiǎng)懲力度的增大而減小,監(jiān)管節(jié)點(diǎn)選擇監(jiān)管的概率隨著獎(jiǎng)懲力度的增大而增大,但在監(jiān)察機(jī)制與獎(jiǎng)懲制度的制約下,最終演化至(不賄賂、不接受、不監(jiān)管)的均衡穩(wěn)定狀態(tài),故可以在節(jié)點(diǎn)群體演化的不同程度適當(dāng)調(diào)整改進(jìn)方案的獎(jiǎng)懲力度。
從管理學(xué)中經(jīng)濟(jì)人的角度出發(fā),人們?cè)谶x擇某一行為策略時(shí)總是會(huì)考慮收益,若收益可觀,便會(huì)保持這種行為。投票節(jié)點(diǎn)選擇投票策略的復(fù)制動(dòng)態(tài)方程F(q)=dq/dt=q(1-q)[w(R3-C3)+n-C3],由于共識(shí)方案的變化僅有改進(jìn)(w=1)和不改進(jìn)(w=0)兩種可能,當(dāng)方案不改進(jìn)時(shí)F(q)=q(1-q)(n-C3),方案改進(jìn)時(shí)F(q)=q(1-q)[w(R3-C3)+n-C3],取R3=3,n=2,C3=1,方案改進(jìn)前后投票節(jié)點(diǎn)策略隨時(shí)間變化對(duì)比如圖6所示。
由圖6可知,當(dāng)t=2.5時(shí),未改進(jìn)方案中,投票節(jié)點(diǎn)選擇投票策略的概率僅約為0.4,而改進(jìn)方案中約為1。用投票節(jié)點(diǎn)選擇投票策略的概率看作投票積極性,可以得出共識(shí)方案改進(jìn)前投票節(jié)點(diǎn)的投票積極性遠(yuǎn)低于改進(jìn)后,故改進(jìn)方案中激勵(lì)措施能夠提高投票節(jié)點(diǎn)參與投票的積極性。
圖6 方案改進(jìn)前后投票策略演化趨勢(shì)對(duì)比Fig.6 Comparison of voting strategy evolution trend before and after scheme improvement
通過共識(shí)方案改進(jìn)前后對(duì)比分析及節(jié)點(diǎn)策略演化穩(wěn)定性分析得出如下結(jié)論:
(1)監(jiān)察和獎(jiǎng)懲的協(xié)同作用能夠改變節(jié)點(diǎn)的合謀行為,提高投票節(jié)點(diǎn)參與投票的積極性。
(2)收益影響節(jié)點(diǎn)行為策略的選擇。當(dāng)節(jié)點(diǎn)合謀收益小于正常參與投票收益且監(jiān)管節(jié)點(diǎn)的監(jiān)管收益小于不監(jiān)管收益時(shí),系統(tǒng)處于演化穩(wěn)定狀態(tài),此時(shí)投票節(jié)點(diǎn)和代理節(jié)點(diǎn)在罰金和信譽(yù)值的約束及獎(jiǎng)勵(lì)的激勵(lì)下將遵循共識(shí)規(guī)則,積極參與區(qū)塊鏈系統(tǒng)的良好運(yùn)行。
(3)監(jiān)管節(jié)點(diǎn)的行為策略受懲罰因子與收益的雙重影響。當(dāng)系統(tǒng)存在較大的安全隱患時(shí),可通過提高監(jiān)管節(jié)點(diǎn)監(jiān)管策略的收益和加大對(duì)不監(jiān)管策略的懲罰力度來激勵(lì)監(jiān)管節(jié)點(diǎn)履行監(jiān)管職責(zé),降低系統(tǒng)的安全風(fēng)險(xiǎn);當(dāng)系統(tǒng)的安全隱患適中時(shí),可對(duì)監(jiān)管節(jié)點(diǎn)保持適中的激勵(lì)和懲罰力度,使系統(tǒng)朝著更加安全穩(wěn)定的方向發(fā)展;當(dāng)系統(tǒng)的安全隱患較低時(shí),可適當(dāng)放松對(duì)監(jiān)管節(jié)點(diǎn)的管束,使其通過參與其他共識(shí)活動(dòng)提高自身收益,避免職位冗余、資源浪費(fèi),但也要實(shí)時(shí)監(jiān)管,防止惡意節(jié)點(diǎn)萌生合謀意圖。
針對(duì)以上結(jié)論,未來對(duì)DPoS共識(shí)機(jī)制的改進(jìn)可從以下兩個(gè)方面開展:
(1)從管理的角度看待節(jié)點(diǎn)達(dá)成共識(shí)中的策略選擇。對(duì)于EOS等區(qū)塊鏈系統(tǒng)平臺(tái),其選舉制度和節(jié)點(diǎn)利益分配屬于系統(tǒng)設(shè)定,但是隨著系統(tǒng)的發(fā)展演化,最初的設(shè)定需要根據(jù)其需求進(jìn)行變化。由于節(jié)點(diǎn)通過完成某項(xiàng)任務(wù)達(dá)成共識(shí)完成數(shù)據(jù)上鏈并獲得交易費(fèi)用的問題實(shí)質(zhì)上是一個(gè)經(jīng)濟(jì)問題,故建議在變更相關(guān)制度時(shí)應(yīng)考慮到激勵(lì)因素和懲罰因素的作用,以正向激勵(lì)促進(jìn)節(jié)點(diǎn)某種優(yōu)良行為,以負(fù)向懲罰遏制節(jié)點(diǎn)的某種不良行為。
(2)根據(jù)應(yīng)用場(chǎng)景和系統(tǒng)狀態(tài)制定監(jiān)管力度。共識(shí)機(jī)制是制約區(qū)塊鏈技術(shù)發(fā)展的最重要因素,然而一種共識(shí)機(jī)制并不能滿足所有的應(yīng)用場(chǎng)景。當(dāng)應(yīng)用場(chǎng)景對(duì)安全和效率有著極高的要求,則應(yīng)當(dāng)適度調(diào)高系統(tǒng)監(jiān)管力度,使節(jié)點(diǎn)在高額的作惡代價(jià)下嚴(yán)格約束自身行為,保證系統(tǒng)有一個(gè)安全高效的環(huán)境。當(dāng)系統(tǒng)節(jié)點(diǎn)處于高度自治,可以適當(dāng)調(diào)整監(jiān)管力度,節(jié)約監(jiān)管行為的成本。
未來的工作主要考慮把改進(jìn)方案引入到區(qū)塊鏈共識(shí)的實(shí)際應(yīng)用中,為區(qū)塊鏈技術(shù)在具體場(chǎng)景的安全高效應(yīng)用做出貢獻(xiàn)。