DPoS共識(shí)機(jī)制改進(jìn)的演化博弈及策略研究

2022-06-23 06:24:36馬園園

計(jì)算機(jī)工程與應(yīng)用 2022年12期

任南，馬園園

江蘇科技大學(xué) 經(jīng)濟(jì)管理學(xué)院，江蘇鎮(zhèn)江 212003

習(xí)近平總書記在十九屆中共中央政治局集中學(xué)習(xí)時(shí)強(qiáng)調(diào)“要把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新的重要突破口”。區(qū)塊鏈技術(shù)正逐漸應(yīng)用于金融、醫(yī)療、政務(wù)、能源等領(lǐng)域[1-5]，成為我國(guó)數(shù)字化轉(zhuǎn)型、加快數(shù)字經(jīng)濟(jì)發(fā)展的重要技術(shù)力量，如何解決安全和效率問題是當(dāng)前區(qū)塊鏈技術(shù)研究的重點(diǎn)之一。共識(shí)機(jī)制作為區(qū)塊鏈技術(shù)的基礎(chǔ)和核心，決定了區(qū)塊鏈的安全性、可擴(kuò)展性和去中心化程度等重要特性[6]。系統(tǒng)探究共識(shí)機(jī)制的內(nèi)在機(jī)理及優(yōu)化改進(jìn)對(duì)于提高區(qū)塊鏈技術(shù)的安全與效率具有重要的理論與現(xiàn)實(shí)意義。

目前主流的區(qū)塊鏈共識(shí)機(jī)制包括工作量證明機(jī)制[7]（proof of work，PoW）、權(quán)益證明機(jī)制[8]（proof of stake，PoS）、股份授權(quán)證明共識(shí)機(jī)制[9]（delegated proof of stake，DPoS）和實(shí)用拜占庭容錯(cuò)協(xié)議[10]（practical Byzantine fault tolerance，PBFT）。PoW由于巨大的算力消耗與出塊時(shí)間被人們所詬病；PoS權(quán)益積累會(huì)造成貧富兩極分化的問題；實(shí)用拜占庭容錯(cuò)協(xié)議不適合大規(guī)模的應(yīng)用場(chǎng)景；DPoS以類似于董事會(huì)投票的方式選舉出代理節(jié)點(diǎn)生成區(qū)塊，在一定程度上解決了工作量證明機(jī)制和權(quán)益證明機(jī)制存在的算力消耗和權(quán)益累積問題，同時(shí)，減少了參與區(qū)塊生成和驗(yàn)證的節(jié)點(diǎn)數(shù)量，適用于大規(guī)模的應(yīng)用場(chǎng)景和實(shí)現(xiàn)了秒級(jí)的共識(shí)驗(yàn)證。但是DPoS存在如下問題：在DPoS中只有生成區(qū)塊的代理節(jié)點(diǎn)會(huì)獲得獎(jiǎng)勵(lì)，參與投票的節(jié)點(diǎn)在本輪投票中沒有任何收益，節(jié)點(diǎn)參與投票的積極性下降，導(dǎo)致區(qū)塊鏈共識(shí)效率低下；由于DPoS以類似于董事會(huì)投票的方式選舉出塊者，因此會(huì)出現(xiàn)惡意節(jié)點(diǎn)通過賄賂手段與投票節(jié)點(diǎn)合謀獲得出塊權(quán)的現(xiàn)象，若該惡意節(jié)點(diǎn)無法完成區(qū)塊生成任務(wù)或者有篡改區(qū)塊信息的意圖，區(qū)塊鏈系統(tǒng)將面臨嚴(yán)重的安全問題。

目前，針對(duì)DPoS共識(shí)機(jī)制存在的節(jié)點(diǎn)投票不積極與合謀問題，一些學(xué)者提出了改進(jìn)方案，Xu等[11]針對(duì)節(jié)點(diǎn)合謀和惡意節(jié)點(diǎn)不能及時(shí)剔除問題，提出了基于模糊集投票的改進(jìn)方案，降低了惡意節(jié)點(diǎn)被選為代理節(jié)點(diǎn)的可能性，提高了區(qū)塊鏈的安全性和公平性。Wang等[12]針對(duì)代理共識(shí)節(jié)點(diǎn)的惡意行為與節(jié)點(diǎn)投票不積極的問題，提出一種基于信譽(yù)的區(qū)塊鏈共識(shí)協(xié)議，提高了區(qū)塊鏈的安全性與抵抗攻擊的能力。Tang等[13]針對(duì)節(jié)點(diǎn)的惡意行為造成的算力資源浪費(fèi)問題提出信譽(yù)機(jī)制，激勵(lì)節(jié)點(diǎn)誠(chéng)實(shí)參與共識(shí)，提高礦池整體收益。付瑤瑤等[14]通過提出基于獎(jiǎng)勵(lì)激勵(lì)和信用機(jī)制的改進(jìn)方案，提高了節(jié)點(diǎn)投票的積極性和降低了惡意節(jié)點(diǎn)成為代理節(jié)點(diǎn)的概率，提高了區(qū)塊鏈系統(tǒng)的安全性。

上述研究大多從技術(shù)角度出發(fā)解決問題，并未過多關(guān)注節(jié)點(diǎn)間行為策略的相互影響以及策略變化的問題。Liu等[15]提出博弈論作為一種分析工具，可以應(yīng)用于解決區(qū)塊鏈存在的攻擊、共識(shí)中的利益分配和激勵(lì)機(jī)制設(shè)定問題。目前，已有學(xué)者在此方面開展了一些研究，袁勇等[16]指出區(qū)塊鏈共識(shí)算法與激勵(lì)機(jī)制是一個(gè)整體，將區(qū)塊鏈運(yùn)作系統(tǒng)建模為節(jié)點(diǎn)群體博弈過程，共識(shí)規(guī)則和獎(jiǎng)懲制度將決定博弈樹的形狀和葉節(jié)點(diǎn)的收益。唐長(zhǎng)兵等[17]從工作量證明共識(shí)算法的挖礦困境入手，分析共識(shí)過程中礦工策略選擇的納什均衡存在條件，利用零行行列式策略對(duì)礦工策略進(jìn)行優(yōu)化，為設(shè)計(jì)基于博弈論的共識(shí)算法提供思路和方法。王雷等[18]針對(duì)雙花攻擊問題，構(gòu)建進(jìn)化博弈模型并解釋節(jié)點(diǎn)策略的動(dòng)態(tài)演化趨勢(shì)，預(yù)測(cè)雙花攻擊出現(xiàn)的概率。Adler等[19]為保證區(qū)塊鏈系統(tǒng)的安全性，把投票節(jié)點(diǎn)和代理共識(shí)節(jié)點(diǎn)作為博弈方，分析表明在設(shè)置的規(guī)則條件下存在納什均衡，所有理性參與者為了利益最大化都將誠(chéng)實(shí)行事。上述研究利用博弈論為解決區(qū)塊鏈共識(shí)存在的安全、利益分配、交易延遲等方面提供了一定的指導(dǎo)意義，但對(duì)于監(jiān)管和獎(jiǎng)懲對(duì)于節(jié)點(diǎn)行為的影響關(guān)注過少。

共識(shí)機(jī)制中加入監(jiān)察機(jī)制可以有效遏制惡意節(jié)點(diǎn)的不良行為，進(jìn)而保證共識(shí)安全和提高共識(shí)效率[20-21]。劉懿中等[6]從共識(shí)機(jī)制本質(zhì)等角度對(duì)共識(shí)機(jī)制進(jìn)行研究，區(qū)塊鏈技術(shù)人員可以將節(jié)點(diǎn)共識(shí)過程以及治理規(guī)則寫入鏈上，實(shí)現(xiàn)區(qū)塊鏈節(jié)點(diǎn)自身行為監(jiān)管。Tao等[22]針對(duì)區(qū)塊鏈中存在惡意節(jié)點(diǎn)問題，引入監(jiān)管節(jié)點(diǎn)輔助監(jiān)管，及時(shí)糾正和更換惡意節(jié)點(diǎn)。上述研究關(guān)注到了監(jiān)管對(duì)惡意節(jié)點(diǎn)行為的束縛作用，但并未對(duì)監(jiān)管力度和監(jiān)管與獎(jiǎng)懲的協(xié)同作用進(jìn)行深入研究。

目前針對(duì)共識(shí)機(jī)制的改進(jìn)研究大多集中在計(jì)算機(jī)科學(xué)和密碼學(xué)領(lǐng)域，但是已有研究表明節(jié)點(diǎn)遵循特定的規(guī)則完成共識(shí)任務(wù)并獲得利益本質(zhì)上是一個(gè)經(jīng)濟(jì)問題，站在管理的視角通過改變節(jié)點(diǎn)的行為優(yōu)化共識(shí)機(jī)制是可行的。同時(shí)，盡管學(xué)者們很少關(guān)注監(jiān)管與獎(jiǎng)懲對(duì)節(jié)點(diǎn)行為影響的協(xié)同作用，但也有研究表明監(jiān)管機(jī)制和獎(jiǎng)懲制度在一定程度上可以遏制不良行為[23]。故本文結(jié)合DPoS共識(shí)機(jī)制改進(jìn)的研究現(xiàn)狀與博弈論在區(qū)塊鏈中的分析應(yīng)用，站在管理的視角，引入監(jiān)察機(jī)制，構(gòu)建代理節(jié)點(diǎn)、投票節(jié)點(diǎn)、監(jiān)管節(jié)點(diǎn)三方主體演化博弈模型，研究在監(jiān)管與獎(jiǎng)懲的協(xié)同作用下節(jié)點(diǎn)行為策略的動(dòng)態(tài)演化趨勢(shì)和懲罰因子對(duì)三方演化趨勢(shì)的影響。

1 三方演化博弈模型構(gòu)建

1.1 DPoS中的節(jié)點(diǎn)共識(shí)演化博弈問題

在區(qū)塊鏈系統(tǒng)中，扮演不同角色的節(jié)點(diǎn)群體根據(jù)達(dá)成共識(shí)的規(guī)則和影響因素選擇行為策略進(jìn)行博弈，經(jīng)過不斷地學(xué)習(xí)和調(diào)整達(dá)到演化博弈的穩(wěn)定狀態(tài)。不同于經(jīng)典博弈論研究?jī)蓚€(gè)個(gè)體之間的交互作用，演化博弈引入種群的思維模式，以群體為研究對(duì)象，探索群體達(dá)到某一穩(wěn)定狀態(tài)并且如何達(dá)到的[24]。在節(jié)點(diǎn)演化博弈模型中，把節(jié)點(diǎn)群體行為的調(diào)整看作一個(gè)動(dòng)態(tài)過程，把個(gè)體行為到群體行為的形成機(jī)制以及涉及到的因素納入其中，構(gòu)成一個(gè)具有微觀基礎(chǔ)的宏觀模型，為調(diào)控節(jié)點(diǎn)群體行為提供理論依據(jù)，其中，每個(gè)節(jié)點(diǎn)都是重復(fù)從群體中隨機(jī)選取其他節(jié)點(diǎn)進(jìn)行博弈，他們既可以通過自身經(jīng)驗(yàn)也可以模仿他人而做出決策。

1.2 方案改進(jìn)與基本假設(shè)

為解決節(jié)點(diǎn)投票不積極和合謀問題，本方案設(shè)計(jì)代理人選舉規(guī)則如下：投票節(jié)點(diǎn)權(quán)重是由節(jié)點(diǎn)的實(shí)際權(quán)益和信譽(yù)值決定的，候選節(jié)點(diǎn)（以下統(tǒng)稱為代理節(jié)點(diǎn)）的得分是由得票數(shù)和自身信譽(yù)值決定，得票數(shù)最多的前n名候選節(jié)點(diǎn)成為代理節(jié)點(diǎn)生成區(qū)塊。代理節(jié)點(diǎn)若是通過與投票節(jié)點(diǎn)合謀獲得生成區(qū)塊的權(quán)力，將會(huì)承擔(dān)經(jīng)濟(jì)處罰、信譽(yù)值降低和被踢出代理節(jié)點(diǎn)組織群體的后果；投票節(jié)點(diǎn)受賄合謀，將承擔(dān)經(jīng)濟(jì)和信譽(yù)值降低的雙重處罰；改進(jìn)方案加入監(jiān)管節(jié)點(diǎn)，該節(jié)點(diǎn)負(fù)責(zé)監(jiān)管網(wǎng)絡(luò)中節(jié)點(diǎn)的行為，對(duì)節(jié)點(diǎn)的合謀意向行為進(jìn)行處罰，同時(shí)，系統(tǒng)也會(huì)對(duì)于未履行監(jiān)管職責(zé)的監(jiān)管節(jié)點(diǎn)進(jìn)行處罰。當(dāng)節(jié)點(diǎn)均正常參與投票與選舉，系統(tǒng)穩(wěn)定發(fā)展，節(jié)點(diǎn)手中的權(quán)益增值，所有的節(jié)點(diǎn)都能夠獲得間接收益，方案以懲罰機(jī)制約束節(jié)點(diǎn)的負(fù)向行為，以獎(jiǎng)勵(lì)機(jī)制激勵(lì)節(jié)點(diǎn)的正向行為，從管理視角分析節(jié)點(diǎn)行為。

結(jié)合DPoS共識(shí)機(jī)制的改進(jìn)方案，為分析各方策略均衡點(diǎn)的穩(wěn)定性以及獎(jiǎng)懲力度對(duì)演化穩(wěn)定趨勢(shì)的影響，做出如下假設(shè)：

H1：代理節(jié)點(diǎn)為參與方1，投票節(jié)點(diǎn)為參與方2，監(jiān)管節(jié)點(diǎn)為參與方3。三方均為有限理性的參與主體，代理節(jié)點(diǎn)的策略空間A=(A1,A2)=（賄賂，不賄賂），投票節(jié)點(diǎn)的策略空間為V=(V1,V2)=（接受，不接受），監(jiān)管節(jié)點(diǎn)的策略空間為S=(S1,S2)=（不監(jiān)管，監(jiān)管）。

H2：代理節(jié)點(diǎn)通過正常投票選舉獲得生成區(qū)塊的能力，完成區(qū)塊生成任務(wù)獲利為R1，通過賄賂獲得區(qū)塊生成的權(quán)力，需賄賂成本C1，合謀成功收益為R2，僅有賄賂意圖但未成功實(shí)施不需要成本。在監(jiān)管節(jié)點(diǎn)監(jiān)管的情況下，代理節(jié)點(diǎn)的賄賂行為和賄賂意向都將被處以罰金B(yǎng)1，信譽(yù)值降低D1；監(jiān)管節(jié)點(diǎn)不監(jiān)管時(shí)，代理節(jié)點(diǎn)將會(huì)獲得合謀收益R2。

H3：投票節(jié)點(diǎn)正常投票獲利為R3，在未改進(jìn)方案中，節(jié)點(diǎn)投票沒有直接收益，僅有權(quán)益增值后的間接收益，改進(jìn)方案設(shè)定節(jié)點(diǎn)正常參與投票就會(huì)獲得收益R3，受賄參與合謀進(jìn)行投票獲得收益R4，不論是否接受賄賂，投票節(jié)點(diǎn)的投票成本均為C3。監(jiān)管節(jié)點(diǎn)監(jiān)管時(shí)，投票節(jié)點(diǎn)接受賄賂的行為將被處以罰金B(yǎng)2，信譽(yù)值降低D2；監(jiān)管節(jié)點(diǎn)不監(jiān)管時(shí)，投票節(jié)點(diǎn)獲得合謀收益R4。

H4：監(jiān)管節(jié)點(diǎn)的監(jiān)管成本為C2，監(jiān)管行為的收益為R5，發(fā)現(xiàn)節(jié)點(diǎn)合謀，監(jiān)管節(jié)點(diǎn)將會(huì)收獲罰金B(yǎng)1、B2；θ為對(duì)監(jiān)管節(jié)點(diǎn)的失職行為進(jìn)行懲罰的力度（以下簡(jiǎn)稱懲罰因子），可根據(jù)演化程度適當(dāng)調(diào)整θ值，B3為監(jiān)管節(jié)點(diǎn)未履行監(jiān)管職責(zé)的罰金，若在節(jié)點(diǎn)存在合謀行為或者合謀意圖而監(jiān)管節(jié)點(diǎn)未采取監(jiān)管行為的情況下，將被以θ的懲罰力度處于罰金θB3，監(jiān)管節(jié)點(diǎn)未實(shí)施監(jiān)管行為時(shí)可以利用監(jiān)管資源獲得其他收益I。

H5：監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略，投票節(jié)點(diǎn)與代理節(jié)點(diǎn)無合謀意圖，系統(tǒng)穩(wěn)定發(fā)展，三方節(jié)點(diǎn)主體獲得權(quán)益增值價(jià)值n。不考慮貨幣的時(shí)間價(jià)值對(duì)節(jié)點(diǎn)收益造成的影響。

H6：代理節(jié)點(diǎn)選擇賄賂策略的概率為x，不賄賂策略的概率為1-x；投票節(jié)點(diǎn)選擇接受賄賂策略的概率為y，不接受策略的概率為1-y；監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略的概率為z，監(jiān)管策略的概率為1-z。為研究方案改進(jìn)對(duì)節(jié)點(diǎn)投票積極性的影響，設(shè)方案改進(jìn)的概率為w，方案不改進(jìn)的概率為1-w，節(jié)點(diǎn)參與投票的概率為q，不參與投票的概率為1-q。其中x、y、z、w、q均為時(shí)間t的函數(shù)，R1,R2,R3,R4,R5,C1,C2,C3,B1,B2,B3,D1,D2,n,I＞0,0≤x,y,z,w,q≤1。

1.3 模型構(gòu)建

基于上述假設(shè)，對(duì)未改進(jìn)方案的演化穩(wěn)定策略進(jìn)行分析，已知未改進(jìn)方案中無監(jiān)管節(jié)點(diǎn)與獎(jiǎng)懲機(jī)制，投票節(jié)點(diǎn)完成投票任務(wù)后沒有投票獎(jiǎng)勵(lì)，構(gòu)建代理節(jié)點(diǎn)主體、投票節(jié)點(diǎn)主圖兩方演化博弈模型，收益矩陣如表1所示。

表1 未改進(jìn)方案演化博弈收益矩陣Table 1 Unimproved scheme evolutionary game profit matrix

改進(jìn)方案加入監(jiān)管節(jié)點(diǎn)和獎(jiǎng)懲機(jī)制構(gòu)建代理節(jié)點(diǎn)主體，投票節(jié)點(diǎn)主體與監(jiān)管節(jié)點(diǎn)主體三類節(jié)點(diǎn)主體間的演化博弈模型，三類主體不同策略組合的收益矩陣如表2所示。其中R3、R4為投票節(jié)點(diǎn)收益減去成本的純收益，為簡(jiǎn)化計(jì)算，表2未引入投票成本C3。

表2 改進(jìn)方案演化博弈收益矩陣Table 2 Improved scheme evolutionary game profit matrix

改進(jìn)方案為激勵(lì)節(jié)點(diǎn)積極參與投票，設(shè)計(jì)投票節(jié)點(diǎn)參與即可獲得收益，構(gòu)建方案改進(jìn)與投票節(jié)點(diǎn)的演化博弈模型，由于節(jié)點(diǎn)積極參與投票維護(hù)區(qū)塊鏈的良性發(fā)展，改進(jìn)共識(shí)方案后礦池收益增加，為了研究改進(jìn)方案對(duì)節(jié)點(diǎn)投票積極性的影響，故僅考慮投票節(jié)點(diǎn)的收益，方案改進(jìn)前后礦池收益以“*”表示，其投票節(jié)點(diǎn)的收益矩陣如表3所示。

表3 方案與投票節(jié)點(diǎn)的演化博弈收益矩陣Table 3 Evolutionary game profit matrix of scheme and voting node

2 演化博弈分析

2.1 演化博弈復(fù)制動(dòng)態(tài)方程

根據(jù)表1的收益矩陣，可以得出代理節(jié)點(diǎn)賄賂策略的期望收益EA1和不賄賂策略的期望收益EA2及策略選擇的平均收益EA各為：

從以上策略組合的收益表可以看出，在沒有監(jiān)管節(jié)點(diǎn)監(jiān)管和獎(jiǎng)懲機(jī)制的約束下，節(jié)點(diǎn)的收益與選擇合謀策略的概率成正比，從理性經(jīng)濟(jì)人的角度來看，為了利益最大化，節(jié)點(diǎn)在達(dá)成共識(shí)時(shí)均會(huì)選擇合謀策略。

代理節(jié)點(diǎn)賄賂策略的復(fù)制動(dòng)態(tài)方程為：

投票節(jié)點(diǎn)接受策略的期望收益E＇V1和舉報(bào)策略的期望收益E＇V2及策略選擇的平均收益E＇V為：

投票節(jié)點(diǎn)接受策略的復(fù)制動(dòng)態(tài)方程為：

監(jiān)管節(jié)點(diǎn)不監(jiān)管策略的期望收益ES1和監(jiān)管策略的期望收益ES2及策略選擇的平均收益ES為：

2.2 三方主體的復(fù)制動(dòng)態(tài)與演化穩(wěn)定性分析

動(dòng)態(tài)復(fù)制系統(tǒng)穩(wěn)定點(diǎn)所對(duì)應(yīng)的策略組合為演化博弈的一個(gè)均衡，簡(jiǎn)稱為演化穩(wěn)定[25]，基于演化穩(wěn)定策略的性質(zhì)，博弈群體達(dá)到演化穩(wěn)定點(diǎn)的條件必須滿足該策略下的復(fù)制動(dòng)態(tài)方程等于零且一階導(dǎo)數(shù)小于零。

2.2.1 代理節(jié)點(diǎn)賄賂策略的復(fù)制動(dòng)態(tài)分析

2.2.2 投票節(jié)點(diǎn)接受策略的復(fù)制動(dòng)態(tài)分析

2.2.3 監(jiān)管節(jié)點(diǎn)不監(jiān)管策略的復(fù)制動(dòng)態(tài)分析管概率隨著代理節(jié)點(diǎn)的賄賂概率與投票節(jié)點(diǎn)的接受概率的增加而增加。

圖1 三方主體策略演化過程Fig.1 Evolution process of tripartite agent strategy

2.3 三方演化博弈系統(tǒng)均衡點(diǎn)的穩(wěn)定性分析

令三方博弈主體的復(fù)制動(dòng)態(tài)方程（10）、（14）、（18）等于零求解可知存在如下系統(tǒng)均衡點(diǎn)E1(1,1,1)、E2(1,1,0)、E3(1,0,1)、E4(1,0,0)、E5(0,1,1)、E6(0,1,0)、E7(0,0,1)、E8(0,0,0)、E9(x1,y1,z1)、E10(x2,y2,z2)、E11(x3,y3,z3)，其中

對(duì)以上均衡點(diǎn)，利用雅可比矩陣判斷以上均衡點(diǎn)是否穩(wěn)定演化，當(dāng)其特征值均為負(fù)時(shí)，則均衡點(diǎn)為演化穩(wěn)定點(diǎn)；當(dāng)其特征值有一個(gè)為正時(shí)，則均衡點(diǎn)不是演化穩(wěn)定點(diǎn)；當(dāng)其存在為零的特征值，其余特征值均為負(fù)時(shí)，則均衡點(diǎn)處于臨界演化穩(wěn)定狀態(tài)[26]。該三方演化博弈系統(tǒng)的雅可比矩陣：

在非對(duì)稱博弈中，演化穩(wěn)定均衡點(diǎn)一定是嚴(yán)格納什均衡點(diǎn)，嚴(yán)格納什均衡點(diǎn)一定是純策略均衡點(diǎn)，故在非對(duì)稱博弈中混合策略均衡點(diǎn)一定不是演化穩(wěn)定均衡點(diǎn)[27]，故僅討論純策略均衡點(diǎn)的穩(wěn)定性，E1～E8特征值及均衡點(diǎn)穩(wěn)定性分析如表4所示。

表4 均衡點(diǎn)穩(wěn)定性分析Table 4 Stability analysis of equilibrium point

均衡點(diǎn)穩(wěn)定性分析如下：

（1）E1(1,1,1)：代理節(jié)點(diǎn)賄賂策略帶來的超額收益大于實(shí)施賄賂成本，λ1=-(R2-R1-C1)＜0，投票節(jié)點(diǎn)接受賄賂進(jìn)行合謀的收益大于正常投票收益，λ2=-(R4-R3)＜0，下面對(duì)λ3進(jìn)行分析。

情形1若I-θB3＜(R5+B1+B2-C2)，則監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略的收益小于監(jiān)管時(shí)的收益，λ3＞0，存在雅可比矩陣大于零的特征值，該點(diǎn)為不穩(wěn)定均衡點(diǎn)。

情形2若I-θB3＞(R5+B1+B2-C2)，則監(jiān)管節(jié)點(diǎn)選擇不監(jiān)管策略的收益大于監(jiān)管時(shí)的收益，λ3＜0，雅可比矩陣的特征值均小于零，該點(diǎn)為穩(wěn)定均衡點(diǎn)。對(duì)應(yīng)的穩(wěn)定演化策略為（賄賂，接受，不監(jiān)管），即代理節(jié)點(diǎn)選舉過程存在大量合謀現(xiàn)象且沒有監(jiān)管措施，對(duì)區(qū)塊鏈網(wǎng)絡(luò)中共識(shí)節(jié)點(diǎn)安全高效達(dá)成共識(shí)造成極大的安全隱患，不是方案的改進(jìn)目標(biāo)。

（2）E2(1,1,0)：λ1=-(R2-R1-C1-B1-D1)，λ2=-(R4-R3-B2-D2)，λ3=I-θB3-(R5+B1+B2-C2)，對(duì)λ1、λ2、λ3的符號(hào)進(jìn)行判定。

情形1若R2-R1-C1＞B1+D1、R4-R3＞B2+D2且I-θB3＜R5+B1+B2-C2，則代理節(jié)點(diǎn)通過賄賂行為獲得區(qū)塊生成的權(quán)力所獲得的收益大于被監(jiān)管的處罰，投票節(jié)點(diǎn)受賄投票獲得的超額收益大于被監(jiān)管的處罰，監(jiān)管節(jié)點(diǎn)不監(jiān)管的收益小于監(jiān)管的收益，對(duì)應(yīng)雅可比矩陣的特征值均小于零，該點(diǎn)為演化穩(wěn)定點(diǎn)。此時(shí)，監(jiān)管節(jié)點(diǎn)的監(jiān)管行為和懲罰措施不能阻止代理節(jié)點(diǎn)和投票節(jié)點(diǎn)的合謀行為，此時(shí)系統(tǒng)存在極大的安全隱患，不是方案的改進(jìn)目標(biāo)。

情形2若R2-R1-C1＜B1+D1、R4-R3＜B2+D2且I-θB3＜R5+B1+B2-C2，則代理節(jié)點(diǎn)和投票節(jié)點(diǎn)的合謀行為獲得的超額收益均小于被監(jiān)管的處罰，監(jiān)管節(jié)點(diǎn)的監(jiān)管行為能夠有效阻止選舉投票過程中的合謀行為，此時(shí)對(duì)應(yīng)的雅可比矩陣存在大于零的特征值，該點(diǎn)不是演化穩(wěn)定點(diǎn)。

（3）E4(1,0,0)、E4(1,0,0)、E5(0,1,1)、E6(0,1,0)均衡點(diǎn)的雅可比矩陣均存在大于零的特征值，以上各均衡點(diǎn)不是演化穩(wěn)定點(diǎn)。

（4）E7(0,0,1)、E8(0,0,0),λ1、λ2均小于零，λ3=±(n+I-R5+C2)，下面對(duì)E7、E8的特征值λ3進(jìn)行討論。

情形1n+I＞(R5-C2)，即λ3=-(n+I-R5+C2)，均衡點(diǎn)的雅可比矩陣的特征值λ1、λ2、λ3均小于零，此時(shí)對(duì)應(yīng)的策略組合為（不賄賂，不接受，不監(jiān)管），代理和投票節(jié)點(diǎn)合謀收益均小于正常投票選舉收益，監(jiān)管節(jié)點(diǎn)的監(jiān)管收益小于不監(jiān)管收益，即在監(jiān)管節(jié)點(diǎn)監(jiān)管和罰金與信譽(yù)值的處罰約束下，系統(tǒng)節(jié)點(diǎn)經(jīng)過不斷博弈演化到最優(yōu)進(jìn)化策略，代理節(jié)點(diǎn)按照正常的投票選舉產(chǎn)生和安全高效的完成區(qū)塊生成任務(wù)，投票節(jié)點(diǎn)根據(jù)各節(jié)點(diǎn)的真實(shí)情況進(jìn)行投票完成投票任務(wù)，監(jiān)管節(jié)點(diǎn)由于區(qū)塊鏈網(wǎng)絡(luò)中節(jié)點(diǎn)達(dá)成共識(shí)的狀態(tài)良好，無安全隱患且無需監(jiān)管，這正是方案的設(shè)計(jì)目標(biāo)。

情形2n+I＜(R5-C2)，即λ3=n+I-R5+C2，均衡點(diǎn)的雅可比矩陣的特征值λ1、λ2、λ3均小于零，此時(shí)對(duì)應(yīng)的策略組合為（不賄賂，不接受，監(jiān)管），即該共識(shí)機(jī)制使運(yùn)用該機(jī)制的區(qū)塊鏈系統(tǒng)處于安全高效的運(yùn)行環(huán)境時(shí)，監(jiān)管節(jié)點(diǎn)仍采取監(jiān)管策略，保證代理節(jié)點(diǎn)的正常選舉，此情形為本方案的次穩(wěn)定演化點(diǎn)。從理性經(jīng)濟(jì)人角度出發(fā)，可以降低監(jiān)管節(jié)點(diǎn)的監(jiān)管獎(jiǎng)勵(lì)，促使監(jiān)管節(jié)點(diǎn)改變行為策略，利用自身資源獲得其他收益I，使系統(tǒng)演化至E7狀態(tài)；當(dāng)系統(tǒng)中節(jié)點(diǎn)存在變異個(gè)體乃至群體時(shí)，可以提高監(jiān)管節(jié)點(diǎn)的監(jiān)管獎(jiǎng)勵(lì)，確保系統(tǒng)安全高效的運(yùn)行環(huán)境。

3 仿真分析

為了驗(yàn)證本文改進(jìn)方案能夠有效解決節(jié)點(diǎn)投票不積極與節(jié)點(diǎn)合謀問題，結(jié)合三方演化博弈模型的穩(wěn)定性分析對(duì)方案中各變量進(jìn)行賦值，利用Matlab2018a進(jìn)行數(shù)值仿真分析。初始值設(shè)定C2=2,B3=12,n=4,B2=3,D2=3,R5=5,I=10,θ=0.5（當(dāng)節(jié)點(diǎn)均處于意向合謀狀態(tài)時(shí)θ＞0.5，當(dāng)監(jiān)管作用使代理節(jié)點(diǎn)的放棄賄賂策略時(shí)θ＜0.5）。

3.1 方案改進(jìn)前后節(jié)點(diǎn)行為策略演化趨勢(shì)變化對(duì)比

首先根據(jù)上述數(shù)值設(shè)定，R1=10、R2=15、C1=3、B1=6、D1=6、R3=3、R4=5、C2=2、B3=12、D2=3、R5=5、C2=2、B3=12、n=4、I=20、θ=0.5，進(jìn)行方案改進(jìn)前后節(jié)點(diǎn)行為策略選擇的演化趨勢(shì)仿真分析，如圖2所示。

圖2 E7(0,0,1)穩(wěn)定點(diǎn)趨勢(shì)圖Fig.2 Trend diagram of steady point E7(0,0,1)

當(dāng)I-θB3＞(R5+B1+B2-C2)和R2-R1-C1＜B1+D1、R4-R3＜B2+D2時(shí)，監(jiān)管節(jié)點(diǎn)不監(jiān)管的收益大于監(jiān)管收益，代理節(jié)點(diǎn)和投票節(jié)點(diǎn)合謀收益小于正常投票收益，無論三方節(jié)點(diǎn)行為策略選擇的初始概率為多少，最終都將趨向于唯一的演化穩(wěn)定點(diǎn)（0，0，1），相應(yīng)的演化穩(wěn)定策略為（不賄賂，不接受，不監(jiān)管），與進(jìn)化博弈演化穩(wěn)定點(diǎn)的分析相吻合。

原方案未引入監(jiān)管與獎(jiǎng)懲機(jī)制，節(jié)點(diǎn)選擇合謀策略的收益大于正常投票選舉的收益，從圖3可以看出，無論兩節(jié)點(diǎn)行為策略選擇的初始概率為多少，都將趨向于唯一的演化穩(wěn)定點(diǎn)（1，1），對(duì)應(yīng)的演化穩(wěn)定策略為（賄賂，接受），如圖3所示。

對(duì)比圖2和圖3可以看出，改進(jìn)方案中的監(jiān)管機(jī)制與獎(jiǎng)懲機(jī)制能夠有效阻止代理節(jié)點(diǎn)與投票節(jié)點(diǎn)在投票選舉過程中的合謀行為，同時(shí)也能在一定程度上減少惡意節(jié)點(diǎn)謀劃成為代理節(jié)點(diǎn)對(duì)區(qū)塊鏈惡意攻擊的概率。

圖3 原方案節(jié)點(diǎn)合謀策略演化穩(wěn)定趨勢(shì)圖Fig.3 Original plan node collusion strategy evolution and stability trend graph

3.2 改進(jìn)方案中穩(wěn)定性驗(yàn)證分析

當(dāng)I-θB3＜(R5+B1+B2-C2)和R4-R3＞B2+D2、R2-R1-C1＞B1+D1時(shí)，設(shè)數(shù)值R1=10,R2=15,C1=2，B1=0.5,D1=0.5,R3=3,R4=5,B2=0.25,D2=0.25,R5=5,C2=1,B3=12,n=4,I=10,θ=0.5，對(duì)三方演化穩(wěn)定策略進(jìn)行模擬仿真，如圖4所示。

圖4 E2(1,1,0)穩(wěn)定點(diǎn)趨勢(shì)圖Fig.4 Trend diagram of steady point E2(1,1,0)

改進(jìn)方案中唯一的演化穩(wěn)定策略點(diǎn)是（0，0，1），演化穩(wěn)定策略為（不賄賂，不接受，不監(jiān)管），但是當(dāng)IθB3＜(R5+B1+B2-C2)和R2-R1-C1＜B1+D1、R4-R3＜B2+D2時(shí)，即監(jiān)管節(jié)點(diǎn)選擇監(jiān)管策略的收益大于不監(jiān)管策略的收益，代理節(jié)點(diǎn)與投票節(jié)點(diǎn)的合謀收益大于監(jiān)管繳納的罰金。監(jiān)管節(jié)點(diǎn)的監(jiān)管行為與獎(jiǎng)懲機(jī)制均不能有效阻止節(jié)點(diǎn)在投票選舉過程中的合謀行為，區(qū)塊鏈達(dá)成共識(shí)存在嚴(yán)重的安全隱患和算力資源浪費(fèi)，故應(yīng)當(dāng)合理地設(shè)置懲罰與監(jiān)察力度，通過控制監(jiān)管節(jié)點(diǎn)的其他收益，規(guī)制監(jiān)管節(jié)點(diǎn)履行監(jiān)管職責(zé)，極力避免這種情景。

3.3 懲罰因子對(duì)三方節(jié)點(diǎn)主體演化策略的影響

為了保證區(qū)塊鏈系統(tǒng)以盡可能小的算力消耗安全高效的達(dá)成共識(shí)，完成交易的記錄，需要在節(jié)點(diǎn)群體演化的不同階段調(diào)整懲罰因子，本文設(shè)定懲罰因子θ(0≤θ≤1)，設(shè)定數(shù)值θ=0.2,0.5,0.8研究對(duì)三方節(jié)點(diǎn)穩(wěn)定演化趨勢(shì)影響進(jìn)行仿真分析，如圖5所示。

圖5 懲罰因子θ對(duì)三方主體行為策略選擇的影響Fig.5 Influence of penalty factorθon behavior strategy choice of three parties

根據(jù)圖5仿真結(jié)果可知，代理節(jié)點(diǎn)與投票節(jié)點(diǎn)選擇合謀的概率隨著獎(jiǎng)懲力度的增大而減小，監(jiān)管節(jié)點(diǎn)選擇監(jiān)管的概率隨著獎(jiǎng)懲力度的增大而增大，但在監(jiān)察機(jī)制與獎(jiǎng)懲制度的制約下，最終演化至（不賄賂、不接受、不監(jiān)管）的均衡穩(wěn)定狀態(tài)，故可以在節(jié)點(diǎn)群體演化的不同程度適當(dāng)調(diào)整改進(jìn)方案的獎(jiǎng)懲力度。

3.4 方案改進(jìn)前后節(jié)點(diǎn)投票積極性對(duì)比

從管理學(xué)中經(jīng)濟(jì)人的角度出發(fā)，人們?cè)谶x擇某一行為策略時(shí)總是會(huì)考慮收益，若收益可觀，便會(huì)保持這種行為。投票節(jié)點(diǎn)選擇投票策略的復(fù)制動(dòng)態(tài)方程F(q)=dq/dt=q(1-q)[w(R3-C3)+n-C3]，由于共識(shí)方案的變化僅有改進(jìn)(w=1)和不改進(jìn)(w=0)兩種可能，當(dāng)方案不改進(jìn)時(shí)F(q)=q(1-q)(n-C3)，方案改進(jìn)時(shí)F(q)=q(1-q)[w(R3-C3)+n-C3]，取R3=3,n=2,C3=1，方案改進(jìn)前后投票節(jié)點(diǎn)策略隨時(shí)間變化對(duì)比如圖6所示。

由圖6可知，當(dāng)t=2.5時(shí)，未改進(jìn)方案中，投票節(jié)點(diǎn)選擇投票策略的概率僅約為0.4，而改進(jìn)方案中約為1。用投票節(jié)點(diǎn)選擇投票策略的概率看作投票積極性，可以得出共識(shí)方案改進(jìn)前投票節(jié)點(diǎn)的投票積極性遠(yuǎn)低于改進(jìn)后，故改進(jìn)方案中激勵(lì)措施能夠提高投票節(jié)點(diǎn)參與投票的積極性。

圖6 方案改進(jìn)前后投票策略演化趨勢(shì)對(duì)比Fig.6 Comparison of voting strategy evolution trend before and after scheme improvement

4 結(jié)果分析

通過共識(shí)方案改進(jìn)前后對(duì)比分析及節(jié)點(diǎn)策略演化穩(wěn)定性分析得出如下結(jié)論：

（1）監(jiān)察和獎(jiǎng)懲的協(xié)同作用能夠改變節(jié)點(diǎn)的合謀行為，提高投票節(jié)點(diǎn)參與投票的積極性。

（2）收益影響節(jié)點(diǎn)行為策略的選擇。當(dāng)節(jié)點(diǎn)合謀收益小于正常參與投票收益且監(jiān)管節(jié)點(diǎn)的監(jiān)管收益小于不監(jiān)管收益時(shí)，系統(tǒng)處于演化穩(wěn)定狀態(tài)，此時(shí)投票節(jié)點(diǎn)和代理節(jié)點(diǎn)在罰金和信譽(yù)值的約束及獎(jiǎng)勵(lì)的激勵(lì)下將遵循共識(shí)規(guī)則，積極參與區(qū)塊鏈系統(tǒng)的良好運(yùn)行。

（3）監(jiān)管節(jié)點(diǎn)的行為策略受懲罰因子與收益的雙重影響。當(dāng)系統(tǒng)存在較大的安全隱患時(shí)，可通過提高監(jiān)管節(jié)點(diǎn)監(jiān)管策略的收益和加大對(duì)不監(jiān)管策略的懲罰力度來激勵(lì)監(jiān)管節(jié)點(diǎn)履行監(jiān)管職責(zé)，降低系統(tǒng)的安全風(fēng)險(xiǎn)；當(dāng)系統(tǒng)的安全隱患適中時(shí)，可對(duì)監(jiān)管節(jié)點(diǎn)保持適中的激勵(lì)和懲罰力度，使系統(tǒng)朝著更加安全穩(wěn)定的方向發(fā)展；當(dāng)系統(tǒng)的安全隱患較低時(shí)，可適當(dāng)放松對(duì)監(jiān)管節(jié)點(diǎn)的管束，使其通過參與其他共識(shí)活動(dòng)提高自身收益，避免職位冗余、資源浪費(fèi)，但也要實(shí)時(shí)監(jiān)管，防止惡意節(jié)點(diǎn)萌生合謀意圖。

5 總結(jié)與展望

針對(duì)以上結(jié)論，未來對(duì)DPoS共識(shí)機(jī)制的改進(jìn)可從以下兩個(gè)方面開展：

（1）從管理的角度看待節(jié)點(diǎn)達(dá)成共識(shí)中的策略選擇。對(duì)于EOS等區(qū)塊鏈系統(tǒng)平臺(tái)，其選舉制度和節(jié)點(diǎn)利益分配屬于系統(tǒng)設(shè)定，但是隨著系統(tǒng)的發(fā)展演化，最初的設(shè)定需要根據(jù)其需求進(jìn)行變化。由于節(jié)點(diǎn)通過完成某項(xiàng)任務(wù)達(dá)成共識(shí)完成數(shù)據(jù)上鏈并獲得交易費(fèi)用的問題實(shí)質(zhì)上是一個(gè)經(jīng)濟(jì)問題，故建議在變更相關(guān)制度時(shí)應(yīng)考慮到激勵(lì)因素和懲罰因素的作用，以正向激勵(lì)促進(jìn)節(jié)點(diǎn)某種優(yōu)良行為，以負(fù)向懲罰遏制節(jié)點(diǎn)的某種不良行為。

（2）根據(jù)應(yīng)用場(chǎng)景和系統(tǒng)狀態(tài)制定監(jiān)管力度。共識(shí)機(jī)制是制約區(qū)塊鏈技術(shù)發(fā)展的最重要因素，然而一種共識(shí)機(jī)制并不能滿足所有的應(yīng)用場(chǎng)景。當(dāng)應(yīng)用場(chǎng)景對(duì)安全和效率有著極高的要求，則應(yīng)當(dāng)適度調(diào)高系統(tǒng)監(jiān)管力度，使節(jié)點(diǎn)在高額的作惡代價(jià)下嚴(yán)格約束自身行為，保證系統(tǒng)有一個(gè)安全高效的環(huán)境。當(dāng)系統(tǒng)節(jié)點(diǎn)處于高度自治，可以適當(dāng)調(diào)整監(jiān)管力度，節(jié)約監(jiān)管行為的成本。

未來的工作主要考慮把改進(jìn)方案引入到區(qū)塊鏈共識(shí)的實(shí)際應(yīng)用中，為區(qū)塊鏈技術(shù)在具體場(chǎng)景的安全高效應(yīng)用做出貢獻(xiàn)。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放