莫梓嘉,高志鵬,楊楊,林怡靜,孫山,趙晨
(北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100876)
在5G 和人工智能等新一代信息和通信技術(shù)的支撐下,由車輛、路邊單元(RSU,roadside unit)、基站(BS,base station)組成[1]的車聯(lián)網(wǎng)(IoV,Internet of vehicles)[2]通過(guò)車與車、車與人、車與路邊環(huán)境等多維交互方式實(shí)現(xiàn)智能化交通管理、動(dòng)態(tài)信息服務(wù)以及車輛智能化控制。車聯(lián)網(wǎng)場(chǎng)景中車輛與各節(jié)點(diǎn)之間的數(shù)據(jù)共享對(duì)于改善駕駛體驗(yàn)、增強(qiáng)車載服務(wù)起著至關(guān)重要的作用。海量的車載數(shù)據(jù)包含大量關(guān)于個(gè)人的敏感信息,例如軌跡、交通信息和多媒體數(shù)據(jù)等,泄露這些敏感信息對(duì)用戶有著直接和明顯負(fù)面的影響[3-5]。因此,如何在保護(hù)隱私的前提下高效地共享數(shù)據(jù)是一個(gè)關(guān)鍵的研究課題。
聯(lián)邦學(xué)習(xí)[6-7]為車聯(lián)網(wǎng)數(shù)據(jù)共享提供了一種去中心化的分布式安全解決方案。通過(guò)將本地?cái)?shù)據(jù)保存在車輛節(jié)點(diǎn)上,中心服務(wù)器聚合多個(gè)節(jié)點(diǎn)模型參數(shù)的方式來(lái)訓(xùn)練模型,從而將數(shù)據(jù)共享問(wèn)題轉(zhuǎn)化為模型共享問(wèn)題,在很大程度上解決了隱私問(wèn)題,同時(shí)降低了數(shù)據(jù)傳輸成本。但是,傳統(tǒng)聯(lián)邦學(xué)習(xí)方法缺少鼓勵(lì)和吸引車輛節(jié)點(diǎn)參與學(xué)習(xí)的激勵(lì)機(jī)制,為聯(lián)邦學(xué)習(xí)引入激勵(lì)機(jī)制可以有效地提高聯(lián)邦學(xué)習(xí)獲得信息的能力。而區(qū)塊鏈[8]憑借著分布式存儲(chǔ)特性天然地保證了聯(lián)邦學(xué)習(xí)中多個(gè)節(jié)點(diǎn)的模型參數(shù)一致性,同時(shí)為模型共享提供激勵(lì),鼓勵(lì)車輛節(jié)點(diǎn)參與系統(tǒng)學(xué)習(xí)以提升整體性能。
然而在車聯(lián)網(wǎng)場(chǎng)景中,由于車輛的移動(dòng)性和不可靠的車間通信,將區(qū)塊鏈與聯(lián)邦學(xué)習(xí)集成到車聯(lián)網(wǎng)中面臨新的問(wèn)題。隨著車聯(lián)網(wǎng)中車輛數(shù)量的增加和網(wǎng)絡(luò)帶寬的限制,通信效率成為在車聯(lián)網(wǎng)場(chǎng)景中進(jìn)行大規(guī)模數(shù)據(jù)共享的瓶頸之一。在這種情況下,本文主要面對(duì)3 個(gè)挑戰(zhàn):首先,區(qū)塊鏈產(chǎn)生的額外計(jì)算和通信開銷給予系統(tǒng)較大的通信壓力;其次,聯(lián)邦學(xué)習(xí)模型參數(shù)的同步聚合方式造成了難以忽視的計(jì)算效率問(wèn)題;最后,由于車輛及路邊單元等設(shè)備懈怠導(dǎo)致準(zhǔn)確率降低,系統(tǒng)整體性能受限。因此,為解決上述挑戰(zhàn),本文為車聯(lián)網(wǎng)設(shè)計(jì)了基于主從鏈體系的異步聯(lián)邦學(xué)習(xí)架構(gòu),旨在保護(hù)數(shù)據(jù)隱私的同時(shí),實(shí)現(xiàn)高效的分布式模型共享。本文的創(chuàng)新點(diǎn)如下。
1) 提出了基于主從鏈體系的異步聯(lián)邦學(xué)習(xí)(AFL-MSC,asynchronous federated learning based on master-slave chain)機(jī)制,與傳統(tǒng)基于區(qū)塊鏈的方法相比,本文提出的分層架構(gòu)可以有效降低通信成本,適用于動(dòng)態(tài)多車輛場(chǎng)景。
2) 摒除了聯(lián)邦學(xué)習(xí)同步聚合的等待時(shí)間限制,結(jié)合遺傳算法(GA,genetic algorithm)構(gòu)造了基于通信資源優(yōu)化的異步聯(lián)邦學(xué)習(xí)算法,提高了通信效率。
3) 彌補(bǔ)了聯(lián)邦學(xué)習(xí)架構(gòu)中參與節(jié)點(diǎn)積極性差的弱點(diǎn),依靠聯(lián)邦學(xué)習(xí)的參數(shù)更新方式,提出了基于共識(shí)交易的節(jié)點(diǎn)訓(xùn)練激勵(lì)機(jī)制,將聯(lián)邦學(xué)習(xí)的模型參數(shù)以交易格式進(jìn)行存儲(chǔ)和傳輸,從而降低了參數(shù)傳輸?shù)耐ㄐ懦杀疽约肮沧R(shí)時(shí)間。
4) 改進(jìn)了拜占庭容錯(cuò)共識(shí)算法的不足,構(gòu)造了輕量化的區(qū)塊鏈共識(shí)機(jī)制——混合拜占庭容錯(cuò)的改進(jìn)委托權(quán)益證明共識(shí)機(jī)制(DPoM,delegated protocol of model),實(shí)現(xiàn)了快速共識(shí),減少了系統(tǒng)運(yùn)行時(shí)間。
車聯(lián)網(wǎng)的重要特征在于協(xié)作環(huán)境數(shù)據(jù)傳感、計(jì)算和處理[9]。分布式場(chǎng)景下的多方數(shù)據(jù)共享是緩解車聯(lián)網(wǎng)中計(jì)算和存儲(chǔ)資源受限問(wèn)題的一種有效方法,聯(lián)邦學(xué)習(xí)技術(shù)的出現(xiàn)為車聯(lián)網(wǎng)數(shù)據(jù)共享提供了有力的技術(shù)基礎(chǔ)支撐[10]。Mcmahan 等[7]提出了一種基于迭代模型平均的聯(lián)邦學(xué)習(xí)方法,該方法在學(xué)習(xí)過(guò)程中將訓(xùn)練數(shù)據(jù)分布在移動(dòng)設(shè)備上,通過(guò)聚合本地計(jì)算的更新來(lái)學(xué)習(xí)共享模型,大大降低了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。進(jìn)一步地,Zhao 等[11]將聯(lián)邦學(xué)習(xí)框架引入車聯(lián)網(wǎng)環(huán)境中,為了避免隱私威脅并降低車輛之間的通信成本,將聯(lián)邦學(xué)習(xí)和本地差分隱私(LDP,local differential privacy)相結(jié)合,提出了一種 LDP-FedSGD 算法來(lái)協(xié)調(diào)云服務(wù)器和車輛協(xié)同訓(xùn)練模型。該模型提出了4種差分隱私機(jī)制來(lái)擾亂本地模型輸出的梯度,同時(shí)提出了三輸出機(jī)制,為隱私預(yù)算引入3 種不同的輸出可能性,并用兩位編碼以降低通信成本。類似地,為了減少節(jié)點(diǎn)和中央服務(wù)器之間的通信成本,Chen 等[12]提出一種基于深淺層異步參數(shù)更新的增強(qiáng)聯(lián)邦學(xué)習(xí)(ASTW,temporally weighted asynchronous federated learning)技術(shù),此外,在中央服務(wù)器上引入了時(shí)間加權(quán)聚合策略,以提高中心模型的準(zhǔn)確性和收斂性。然而,這種方法存在一個(gè)集中式的管理服務(wù)器,顯著增加了系統(tǒng)單點(diǎn)故障的風(fēng)險(xiǎn)。
為規(guī)避單點(diǎn)故障風(fēng)險(xiǎn),Lu 等[13]將區(qū)塊鏈技術(shù)擴(kuò)展到車聯(lián)網(wǎng)分布式數(shù)據(jù)共享架構(gòu)中,設(shè)計(jì)了一種由許可區(qū)塊鏈和本地有向無(wú)環(huán)圖組成的混合區(qū)塊鏈架構(gòu),以提高模型參數(shù)的安全性和可靠性。此外,Lu等[13]還提出了一種異步聯(lián)邦學(xué)習(xí)方案,通過(guò)深度強(qiáng)化學(xué)習(xí)進(jìn)行節(jié)點(diǎn)選擇以提高效率。遺憾的是,該方案并未采取有效方法來(lái)提高異步聯(lián)邦學(xué)習(xí)參數(shù)傳輸中的通信效率。類似地,Chai 等[14]提出了適用于車聯(lián)網(wǎng)數(shù)據(jù)共享的分層區(qū)塊鏈和分層聯(lián)邦學(xué)習(xí)(HBFL,hierarchical blockchain-enabled federated learning)算法。知識(shí)在聯(lián)邦學(xué)習(xí)過(guò)程中以學(xué)習(xí)參數(shù)的形式共享,HBFL 算法將車輛和基礎(chǔ)設(shè)施根據(jù)其區(qū)域特征分組并維護(hù)其專屬區(qū)塊鏈賬本來(lái)記錄聯(lián)邦學(xué)習(xí)模型。同時(shí),Chai 等[14]還提出了一種輕量級(jí)共識(shí)機(jī)制——知識(shí)證明(PoK,proof of knowledge),將知識(shí)共享過(guò)程建模為交易市場(chǎng)中的多領(lǐng)導(dǎo)者和多人非合作博弈。與傳統(tǒng)區(qū)塊鏈框架相比,該算法雖然充分考慮了計(jì)算成本問(wèn)題,但忽略了聯(lián)邦學(xué)習(xí)的參數(shù)共享造成的通信成本問(wèn)題。針對(duì)通信效率問(wèn)題,Pokhrel 等[15]依靠聯(lián)邦學(xué)習(xí)的更新獎(jiǎng)勵(lì)方法,設(shè)計(jì)了一個(gè)包含區(qū)塊鏈參數(shù)的數(shù)學(xué)框架(例如,重傳限制、塊大小、塊到達(dá)率和幀大?。?,通過(guò)對(duì)端到端時(shí)延的嚴(yán)格分析量化來(lái)推導(dǎo)出最佳塊到達(dá)率,從而最小化系統(tǒng)時(shí)延。該框架忽略了聯(lián)邦學(xué)習(xí)中同步聚合導(dǎo)致的時(shí)延問(wèn)題,從而影響了系統(tǒng)的整體運(yùn)行時(shí)延。
已有研究方案對(duì)比如表1 所示。通過(guò)以上調(diào)研發(fā)現(xiàn),大多數(shù)面向車聯(lián)網(wǎng)場(chǎng)景的數(shù)據(jù)共享方案忽略了用戶激勵(lì)以及共識(shí)算法對(duì)系統(tǒng)效率的影響。同時(shí),聯(lián)邦學(xué)習(xí)的聚合方法也是保障共享機(jī)制高效性與有效性的一個(gè)重要因素,為此,本文提出了面向車聯(lián)網(wǎng)數(shù)據(jù)隱私保護(hù)的高效分布式模型共享策略。
表1 已有研究方案對(duì)比
車聯(lián)網(wǎng)由車輛、路邊單元、基站3 個(gè)部分組成,如圖1 所示。其中,基站具有較高的計(jì)算和通信能力;路邊單元配有移動(dòng)邊緣計(jì)算(MEC,mobile edge computing)服務(wù)器,具有一定的邊緣側(cè)計(jì)算和通信能力;車輛裝有智能車載系統(tǒng)負(fù)責(zé)車輛數(shù)據(jù)實(shí)時(shí)處理和多傳感器數(shù)據(jù)融合,保證車輛在各種復(fù)雜的情況下穩(wěn)定、安全行駛。路邊單元通過(guò)無(wú)線信道通信鏈路向上與基站相連接,向下與其覆蓋范圍內(nèi)的車輛相連接。
圖1 主從鏈架構(gòu)
本文所提機(jī)制由基站組成的主鏈(MC,master chain)和多個(gè)由路邊單元維護(hù)的從鏈(SC,slave chain)構(gòu)成。本文假設(shè)參與學(xué)習(xí)的節(jié)點(diǎn)都是安全可信的,不存在惡意上傳錯(cuò)誤參數(shù)的可能性,但是,節(jié)點(diǎn)本身存在懈怠狀態(tài),有一定可能無(wú)法及時(shí)盡力地參與計(jì)算與共享過(guò)程。
本文所提主從鏈架構(gòu)將全局計(jì)算與共享過(guò)程分為3 個(gè)步驟,車輛層的本地計(jì)算過(guò)程、從鏈層的學(xué)習(xí)過(guò)程以及主鏈層的學(xué)習(xí)過(guò)程。系統(tǒng)參數(shù)如表2 所示。
表2 系統(tǒng)參數(shù)
1) 車輛層的本地計(jì)算過(guò)程
車輛在本地執(zhí)行基于機(jī)器學(xué)習(xí)的模型訓(xùn)練過(guò)程,一段時(shí)間后將訓(xùn)練結(jié)果向上發(fā)送給鄰近的路邊單元。在本地訓(xùn)練階段,每個(gè)車輛基于其本地?cái)?shù)據(jù)來(lái)訓(xùn)練模型,車輛在訓(xùn)練數(shù)據(jù)集上的損失函數(shù)為
其中,f u(w,xu,yu)是損失函數(shù)在數(shù)據(jù)樣本(xu,yu)上的值,w是所訓(xùn)練模型的參數(shù),是數(shù)據(jù)集所含有的樣本數(shù)目。在不同的算法中,損失函數(shù)有不同的計(jì)算方式,本文采用梯度下降的算法來(lái)計(jì)算損失函數(shù)
2) 從鏈層的學(xué)習(xí)過(guò)程
路邊單元收到所有參與訓(xùn)練的車輛發(fā)來(lái)的模型參數(shù)后執(zhí)行全局聚合,其目標(biāo)是通過(guò)全局聚合將損失函數(shù)值最小化。本文采用的加權(quán)聚合方式為
聚合后的新模型參數(shù)以交易的方式由主記賬節(jié)點(diǎn)發(fā)起共識(shí),從鏈層中多個(gè)路邊單元共識(shí)后的結(jié)果被記錄到區(qū)塊鏈上由主記賬節(jié)點(diǎn)向上發(fā)送給鄰近的基站。
3) 主鏈層的學(xué)習(xí)過(guò)程
同從鏈層的學(xué)習(xí)過(guò)程相似,基站收到由路邊單元發(fā)送的模型參數(shù)及計(jì)算結(jié)果后將其存儲(chǔ)在本地,同時(shí)將所有收到的參數(shù)聚合,此處全局聚合的損失函數(shù)定義為
本文所提機(jī)制的系統(tǒng)時(shí)延主要分為計(jì)算時(shí)延和通信時(shí)延,其中,計(jì)算時(shí)延包括節(jié)點(diǎn)本地計(jì)算的時(shí)間以及多節(jié)點(diǎn)參數(shù)聚合的時(shí)間。為了簡(jiǎn)化分析過(guò)程,本文以一次迭代過(guò)程為例進(jìn)行分析,V I是所有參與學(xué)習(xí)的車輛集合,對(duì)于車輛∈VI,其所持?jǐn)?shù)據(jù)集用表示,車輛的CPU 主頻用f()表示;為訓(xùn)練單位數(shù)據(jù)的CPU 周期個(gè)數(shù)。那么在本地計(jì)算中,每輛車每輪的訓(xùn)練時(shí)間為
類似地,f()和分別為路邊單元的CPU 主頻以及訓(xùn)練單位數(shù)據(jù)的CPU 周期個(gè)數(shù)為路邊單元在一段時(shí)間內(nèi)收到的來(lái)自所屬區(qū)域內(nèi)各車輛上傳的參數(shù)值。在側(cè)鏈層,路邊單元用來(lái)聚合區(qū)域內(nèi)車輛上傳的模型參數(shù)所需的計(jì)算時(shí)間為
類似地,f(bn)和Cn分別為基站bn的CPU 主頻以及訓(xùn)練單位數(shù)據(jù)的CPU 周期個(gè)數(shù),為基站在一段時(shí)間內(nèi)收到的來(lái)自所屬區(qū)域內(nèi)各路邊單元上傳的參數(shù)值。在主鏈層,基站用來(lái)聚合區(qū)域內(nèi)路邊單元上傳的模型參數(shù)所需的計(jì)算時(shí)間為
在本文的系統(tǒng)模型中,相比于本地計(jì)算以及上傳時(shí)間,模型聚合所需要的時(shí)間非常少,所以,本文不把聚合時(shí)間作為一個(gè)重要影響參數(shù)衡量。
本文考慮使用時(shí)分多址(TDMA,time division multiple access)方法來(lái)實(shí)現(xiàn)數(shù)據(jù)的傳輸并用加性白高斯噪聲信道(AGWN,additive white Gaussian noise)計(jì)算方式來(lái)表示AFL-MSC 機(jī)制中的信道狀態(tài)。本文所提AFL-MSC 機(jī)制中的模型參數(shù)通過(guò)無(wú)線信道進(jìn)行數(shù)據(jù)傳輸?shù)倪^(guò)程主要分為2 個(gè)部分,下載全局模型參數(shù)的時(shí)延和上傳本地模型參數(shù)的時(shí)延。假設(shè)數(shù)據(jù)傳輸中總帶寬為B,可用的信道數(shù)為c0,對(duì)于車輛,其上行鏈路可達(dá)到的數(shù)據(jù)傳輸速率為
其中,cvij(t)是第t次迭代輪數(shù)被分配的子信道數(shù),N0是噪聲強(qiáng)度,Pvij(t)是車輛的發(fā)射功率,φ是車輛與上行路邊單元之間的無(wú)線信道增益,(t)是車輛客戶端傳輸?shù)哪P蛥?shù)量,為固定值。車輛上傳模型參數(shù)至路邊單元的傳輸時(shí)間為
由于系統(tǒng)的下行帶寬遠(yuǎn)大于上行帶寬,因此本文不考慮下行時(shí)間。
本文設(shè)計(jì)了一種基于通信資源優(yōu)化的異步聯(lián)邦學(xué)習(xí)算法,通過(guò)降低聯(lián)邦學(xué)習(xí)中單輪次所需通信資源來(lái)降低系統(tǒng)的整體通信開銷,提升共享效率。
以從鏈層中車輛上傳參數(shù)至路邊單元的過(guò)程為例,傳統(tǒng)的聯(lián)邦學(xué)習(xí)通信過(guò)程如圖2 所示。由于車輛計(jì)算和通信資源的異構(gòu)性,不同車輛的本地計(jì)算完成時(shí)間不同,路邊單元等待所有參與學(xué)習(xí)的車輛完成本地計(jì)算并上傳參數(shù)后才開始聚合,冗余的等待時(shí)間降低了系統(tǒng)的通信效率。
圖2 傳統(tǒng)的聯(lián)邦學(xué)習(xí)通信過(guò)程
本文提出的基于通信資源優(yōu)化的異步聯(lián)邦學(xué)習(xí)算法根據(jù)車輛當(dāng)前的計(jì)算能力和信道狀態(tài)信息,自適應(yīng)地將通信資源分配給參與的車輛,以減輕通信性能的不平衡。如圖3 所示,計(jì)算能力較差的車輛被分配更多的通信資源,而計(jì)算能力較強(qiáng)的車輛被分配更少的通信資源。
圖3 優(yōu)化的聯(lián)邦學(xué)習(xí)通信過(guò)程
車輛的數(shù)據(jù)傳輸速率為
其中,∈{0,1}表示當(dāng)前子信道是否分配給車輛,=1表示當(dāng)前子信道分配給車輛,=0表示當(dāng)前子信道不分配給車輛。對(duì)于車輛,本文算法在第t次迭代期望的平均執(zhí)行時(shí)間為
基于以上內(nèi)容,本文算法的優(yōu)化問(wèn)題可以表示為
其中,λ i表示車輛是否參與此次聯(lián)邦學(xué)習(xí),λi=1代表是,λi=0代表否。為了找到式(13)的最優(yōu)解,本文引入遺傳算法。遺傳算法具有良好的全局搜索能力,利用它的內(nèi)在并行性可以方便地進(jìn)行分布式計(jì)算,加快求解速度?;谶z傳算法的車輛選擇和通信資源分配算法如算法1 所示。
算法1基于遺傳算法的車輛選擇和通信資源分配算法
由于傳統(tǒng)區(qū)塊鏈共識(shí)機(jī)制的密集資源消耗以及高時(shí)延特性,將其應(yīng)用于本文提出的主從鏈聯(lián)邦學(xué)習(xí)框架中不利于系統(tǒng)的整體性能。因此,針對(duì)區(qū)塊鏈共識(shí)效率及激勵(lì)問(wèn)題,本文提出了一種輕量級(jí)的共識(shí)方案來(lái)提高整體的通信效率。
3.2.1 交易格式及激勵(lì)機(jī)制
本文所提機(jī)制的交易過(guò)程如圖4 所示。
圖4 本文所提機(jī)制的交易過(guò)程
在從鏈層,所有參與學(xué)習(xí)的車輛通過(guò)計(jì)算本地?cái)?shù)據(jù)集得到模型參數(shù)以及訓(xùn)練結(jié)果的損失函數(shù)下降比例,每個(gè)車輛將上述參數(shù)打包為交易的格式發(fā)送給鄰近的路邊單元
交易中的第二項(xiàng)為0 意味著該交易為車輛上傳訓(xùn)練好的模型參數(shù),在收到該筆交易后,路邊單元先檢查該筆交易的真實(shí)性,然后提取交易中的參數(shù)為后續(xù)的聚合過(guò)程做準(zhǔn)備,并返回一個(gè)獎(jiǎng)勵(lì)給車輛。針對(duì)車輛的工作懈怠問(wèn)題,本文提出了相應(yīng)的激勵(lì)機(jī)制:將收到的所有車輛上傳的結(jié)果按照損失函數(shù)值減少的比例進(jìn)行倒序排序,本文期望車輛能夠?qū)⒏嗟挠?jì)算資源貢獻(xiàn)給學(xué)習(xí)過(guò)程,以達(dá)到系統(tǒng)的最快收斂。對(duì)于排序好的隊(duì)列,假設(shè)上傳的交易排第n個(gè)位置,則其所獲得的獎(jiǎng)勵(lì)為
其中,I為參與學(xué)習(xí)的所有車輛數(shù);為路邊單元的本地獎(jiǎng)勵(lì),初始值設(shè)為1。路邊單元返回獎(jiǎng)勵(lì)給相應(yīng)車輛的交易為
在下一步的共識(shí)過(guò)程中,路邊單元負(fù)責(zé)鍛造新的區(qū)塊。本文期望提升通信效率,因此在共識(shí)過(guò)程中用哈希來(lái)代替原有交易中的參數(shù)內(nèi)容。因?yàn)槁?lián)邦學(xué)習(xí)的模型參數(shù)量相比于一般區(qū)塊交易中值來(lái)說(shuō)是巨大的,常用的數(shù)據(jù)集如MNIST 數(shù)據(jù)集每次更新的參數(shù)量大概在1 MB 左右[16],所以本文在區(qū)塊交易中記錄模型參數(shù)的方法是記錄它的哈希值,當(dāng)智能合約驗(yàn)證交易時(shí),它需要查詢星際文件系統(tǒng)(IPFS,inter planetary file system)以獲得鏈下值。此時(shí),路邊單元在共識(shí)階段發(fā)起的區(qū)塊包含的交易格式為
其中,Addrrnj是確認(rèn)區(qū)塊發(fā)起者的身份,是這筆交易在達(dá)到共識(shí)后的獎(jiǎng)勵(lì),H()是模型的哈希值,是該模型的準(zhǔn)確率。共識(shí)通過(guò)后,主記賬節(jié)點(diǎn)將新交易上傳至鄰近基站
與從鏈層類似,基站收到后提取交易中的參數(shù)值,在本文的設(shè)定中,路邊單元和基站都不會(huì)產(chǎn)生懈怠,所以此時(shí)基站返回的獎(jiǎng)勵(lì)為
基站聚合所有參數(shù)后開始鍛造區(qū)塊并發(fā)起共識(shí),此時(shí)的交易為
所有基站通過(guò)共識(shí)后得到新的全局模型wglo并將全局模型下發(fā)。本文提出的框架結(jié)合區(qū)塊鏈和聯(lián)邦學(xué)習(xí)技術(shù)來(lái)解決隱私問(wèn)題。分層聯(lián)邦學(xué)習(xí)方法利用參數(shù)上傳機(jī)制取代傳統(tǒng)的數(shù)據(jù)上傳方法,有效地保護(hù)參與者的隱私,此外,區(qū)塊鏈技術(shù)利用非對(duì)稱加密技術(shù)和數(shù)字簽名技術(shù)將參數(shù)本身替換為哈希值,進(jìn)一步保護(hù)用戶的隱私。
3.2.2 DPoM 共識(shí)機(jī)制
在本文提出的區(qū)塊鏈框架中,模型聚合后的參數(shù)共享過(guò)程通過(guò)共識(shí)來(lái)達(dá)到。本文使用多個(gè)路邊單元來(lái)聚合車輛在其覆蓋范圍內(nèi)生成的本地模型,并利用區(qū)塊鏈來(lái)同步這些模型,在不同的路邊單元和基站之間達(dá)成共識(shí)。由于全局模型需要確認(rèn)為區(qū)塊鏈交易,因此區(qū)塊鏈的運(yùn)行效率對(duì)整個(gè)學(xué)習(xí)過(guò)程至關(guān)重要。由于本文提出的框架分為兩層,而在從鏈和主鏈這兩層的共識(shí)內(nèi)容是相似的,為了方便分析,本文只給出了從鏈層的共識(shí)過(guò)程。
傳統(tǒng)共識(shí)機(jī)制比如工作量證明(PoW,proof of work)機(jī)制采用哈希難題來(lái)確定候選區(qū)塊的發(fā)布者,其中能夠最快解出難題的獲得記賬權(quán),但是該方法擁有較低的吞吐量和較高的確認(rèn)時(shí)延;代理權(quán)益證明(DPoS,delegated proof of stake)機(jī)制作為主流共識(shí)算法中最平衡的算法,采用選舉部分特殊節(jié)點(diǎn)代理網(wǎng)絡(luò)中其余節(jié)點(diǎn)的方式,減少了參與區(qū)塊生產(chǎn)和驗(yàn)證的節(jié)點(diǎn)數(shù)量,既能滿足公有鏈對(duì)吞吐量的需求,又可以在一定程度上降低確認(rèn)時(shí)延?;诖耍疚奶岢隽舜砟P妥C明(DPoM,delegated proof of model)機(jī)制,將實(shí)用拜占庭容錯(cuò)(PBFT,practical Byzantine fault tolerance)算法引入DPoS的節(jié)點(diǎn)驗(yàn)證部分,能夠進(jìn)一步降低驗(yàn)證時(shí)延,同時(shí)引入懲罰機(jī)制,對(duì)節(jié)點(diǎn)生產(chǎn)區(qū)塊的質(zhì)量進(jìn)行評(píng)估,以提高系統(tǒng)整體性能。
1) 節(jié)點(diǎn)類型
本文見(jiàn)證人選舉模型涉及4 種角色節(jié)點(diǎn):普通節(jié)點(diǎn)、候選節(jié)點(diǎn)、見(jiàn)證人節(jié)點(diǎn)、備選見(jiàn)證人節(jié)點(diǎn)。
普通節(jié)點(diǎn)是系統(tǒng)中占比最大的節(jié)點(diǎn)類型,具有投票權(quán)和被選舉權(quán)。被普通節(jié)點(diǎn)選舉出來(lái)的節(jié)點(diǎn)稱為候選節(jié)點(diǎn)。候選節(jié)點(diǎn)通過(guò)排序分為見(jiàn)證人節(jié)點(diǎn)和備選見(jiàn)證人節(jié)點(diǎn)2個(gè)集合。見(jiàn)證人節(jié)點(diǎn)具有區(qū)塊打包的權(quán)力。備選見(jiàn)證人節(jié)點(diǎn)則負(fù)責(zé)對(duì)見(jiàn)證人節(jié)點(diǎn)生產(chǎn)的區(qū)塊進(jìn)行驗(yàn)證以及替換效率低的見(jiàn)證人節(jié)點(diǎn)。
2) 選舉機(jī)制
在本文的方案中,所有參與的路邊單元都充當(dāng)區(qū)塊鏈用戶。它們持有的股份代表它們對(duì)訓(xùn)練模型的貢獻(xiàn),本文將其設(shè)為模型的質(zhì)量。區(qū)塊鏈用戶根據(jù)路邊單元計(jì)算和通信能力投票選擇首選的路邊單元作為驗(yàn)證者。持股節(jié)點(diǎn)在投票選舉階段會(huì)將手中的股份作為票數(shù)通過(guò)贊成投票的方式給支持的節(jié)點(diǎn)進(jìn)行投票,每個(gè)節(jié)點(diǎn)允許給其他節(jié)點(diǎn)投一票。當(dāng)投票結(jié)束后,系統(tǒng)計(jì)算所有節(jié)點(diǎn)的有效得票數(shù),選擇有效得票數(shù)排名前2TN個(gè)節(jié)點(diǎn)作為候選見(jiàn)證人節(jié)點(diǎn)(TN是系統(tǒng)通過(guò)至少50%投票的持股節(jié)點(diǎn)認(rèn)為足夠去中心化的見(jiàn)證人節(jié)點(diǎn)數(shù)目),并將其分為兩組,得票數(shù)排名前TN個(gè)節(jié)點(diǎn)作為本輪的見(jiàn)證人節(jié)點(diǎn)集合A1={x0,x1,…,xTN-1},另一組作為備選見(jiàn)證人節(jié)點(diǎn)集合A2={xTN,xTN+1,…,x2TN-1}。
3) 見(jiàn)證人節(jié)點(diǎn)出塊
DPoS 算法通過(guò)選擇一部分稱作“見(jiàn)證人”的節(jié)點(diǎn),代為行使區(qū)塊鏈系統(tǒng)中區(qū)塊生成和區(qū)塊驗(yàn)證的工作。每個(gè)見(jiàn)證人節(jié)點(diǎn)排好序后在規(guī)定的時(shí)間間隔內(nèi)按序生產(chǎn)區(qū)塊,如果沒(méi)有生產(chǎn)成功則跳過(guò)該見(jiàn)證人,由下一見(jiàn)證人繼續(xù)鍛造區(qū)塊。這樣可以有效避免見(jiàn)證人出塊錯(cuò)誤導(dǎo)致的系統(tǒng)時(shí)延問(wèn)題。
4) 區(qū)塊驗(yàn)證
針對(duì)DPoS 算法目前存在的節(jié)點(diǎn)生成區(qū)塊后驗(yàn)證時(shí)延過(guò)長(zhǎng)的問(wèn)題,引入PBFT 算法,將見(jiàn)證人節(jié)點(diǎn)生成的區(qū)塊立即通過(guò)PBFT 算法進(jìn)行驗(yàn)證,新的機(jī)制可以在更短的時(shí)間內(nèi)完成區(qū)塊的驗(yàn)證,從而大大降低交易的確認(rèn)時(shí)延。
在原始DPoS 算法中,選舉出的見(jiàn)證人節(jié)點(diǎn)會(huì)被隨機(jī)打亂序列,然后在規(guī)定的時(shí)間內(nèi)按照序列生產(chǎn)區(qū)塊,新生成的區(qū)塊隨著見(jiàn)證人節(jié)點(diǎn)的序列交由后續(xù)的見(jiàn)證人節(jié)點(diǎn)進(jìn)行區(qū)塊驗(yàn)證。當(dāng)一個(gè)區(qū)塊生成后需要得到的驗(yàn)證確認(rèn)數(shù)為總見(jiàn)證人節(jié)點(diǎn)數(shù)目的時(shí),才能被加入?yún)^(qū)塊鏈中,這樣大大延長(zhǎng)了驗(yàn)證時(shí)間。為了提升區(qū)塊驗(yàn)證時(shí)延并更好地利用選舉出的備選見(jiàn)證人節(jié)點(diǎn)集合A2,本文通過(guò)A2集合中的節(jié)點(diǎn)對(duì)A1生成的區(qū)塊進(jìn)行立即驗(yàn)證。
基于DPoS 的見(jiàn)證人選舉模型選舉產(chǎn)生了2 個(gè)節(jié)點(diǎn)集合:見(jiàn)證人節(jié)點(diǎn)集合A1和備選見(jiàn)證人節(jié)點(diǎn)集合A2。A1節(jié)點(diǎn)的主要作用是對(duì)網(wǎng)絡(luò)中產(chǎn)生的交易進(jìn)行打包,生產(chǎn)區(qū)塊,A2節(jié)點(diǎn)則作為備選節(jié)點(diǎn)用戶運(yùn)行PBFT 算法,A1生產(chǎn)的區(qū)塊立即廣播給A2集合中的節(jié)點(diǎn)進(jìn)行驗(yàn)證工作,從而更快地完成區(qū)塊的驗(yàn)證工作,降低區(qū)塊內(nèi)交易的時(shí)延。
除此之外,在區(qū)塊驗(yàn)證過(guò)程中,以主鏈層為例,每個(gè)基站將其聚合模型發(fā)送給其他驗(yàn)證節(jié)點(diǎn)進(jìn)行驗(yàn)證。除了常規(guī)的驗(yàn)證外,驗(yàn)證者還根據(jù)模型是否對(duì)最后一個(gè)全局模型進(jìn)行更新做出了積極貢獻(xiàn)來(lái)驗(yàn)證接收到的模型。主驗(yàn)證節(jié)點(diǎn)從所有驗(yàn)證節(jié)點(diǎn)收集驗(yàn)證結(jié)果并確認(rèn)事務(wù)。審核后的區(qū)塊被添加到區(qū)塊鏈中,并廣播到其他基站進(jìn)行存儲(chǔ)。
見(jiàn)證人節(jié)點(diǎn)將產(chǎn)生的區(qū)塊向備選見(jiàn)證人集合中廣播。備選見(jiàn)證人集合中的主節(jié)點(diǎn)接收到該區(qū)塊信息后,會(huì)封裝信息并簽名,主節(jié)點(diǎn)的選取遵循
其中,v為PBFT 的視圖編號(hào),為備選見(jiàn)證人節(jié)點(diǎn)個(gè)數(shù)。主節(jié)點(diǎn)將封裝并簽名的消息向A2中的其余節(jié)點(diǎn)廣播,當(dāng)其余備選見(jiàn)證人接收到區(qū)塊消息時(shí)需要驗(yàn)證,驗(yàn)證的規(guī)則如下。
①簽名是否正確。
②消息中的視圖編號(hào)和該節(jié)點(diǎn)的視圖編號(hào)是否一致。
③該區(qū)塊消息是否已經(jīng)接收過(guò)。
④消息中的區(qū)塊高度是否和該節(jié)點(diǎn)的區(qū)塊高度一致。
⑤模型是否對(duì)最后一個(gè)全局模型做了積極貢獻(xiàn)。
滿足上述條件的區(qū)塊消息才會(huì)被備選見(jiàn)證人節(jié)點(diǎn)承認(rèn)。當(dāng)備選見(jiàn)證人節(jié)點(diǎn)承認(rèn)接收的區(qū)塊消息有效時(shí),該節(jié)點(diǎn)狀態(tài)就會(huì)進(jìn)入準(zhǔn)備狀態(tài),之后會(huì)繼續(xù)封裝準(zhǔn)備消息并進(jìn)行簽名,準(zhǔn)備消息會(huì)繼續(xù)向其余節(jié)點(diǎn)廣播,當(dāng)檢驗(yàn)通過(guò)累積達(dá)到后,節(jié)點(diǎn)會(huì)進(jìn)入提交狀態(tài),然后封裝并簽名確認(rèn)消息,同樣地,當(dāng)確認(rèn)消息個(gè)數(shù)達(dá)到時(shí),該消息得到驗(yàn)證,該輪驗(yàn)證區(qū)塊完成,驗(yàn)證結(jié)果會(huì)被返回給生產(chǎn)區(qū)塊的見(jiàn)證人節(jié)點(diǎn),意味著該區(qū)塊可加入?yún)^(qū)塊鏈中?;诟倪M(jìn)PBFT 的優(yōu)化區(qū)塊驗(yàn)證算法如算法2 所示。
算法2基于改進(jìn)PBFT 的優(yōu)化區(qū)塊驗(yàn)證算法
4.1.1 參數(shù)設(shè)置
為了驗(yàn)證本文所提機(jī)制的有效性,分別在MNIST[17]數(shù)據(jù)集和SVHN[18]數(shù)據(jù)集上對(duì)其進(jìn)行了評(píng)估。二者均為來(lái)自真實(shí)世界的數(shù)據(jù)集,可代表本地設(shè)備所收集的復(fù)雜度中等的數(shù)據(jù),也被大量基于車聯(lián)網(wǎng)場(chǎng)景的聯(lián)邦學(xué)習(xí)算法作為測(cè)試數(shù)據(jù)使用。其中,MNIST 作為一個(gè)大型手寫數(shù)字?jǐn)?shù)據(jù)庫(kù)廣泛應(yīng)用于圖像分類任務(wù),由60 000 個(gè)訓(xùn)練示例和10 000 個(gè)測(cè)試示例組成。SVHN 摘自Google 街景圖像中的門牌號(hào),適用于車聯(lián)網(wǎng)中車載傳感器讀取車輛周圍圖像數(shù)據(jù)場(chǎng)景,SVHN 中包含了超過(guò)60 萬(wàn)張數(shù)字圖像,其中訓(xùn)練集有73 257 張圖像,測(cè)試集有26 032 張圖像,以及額外531 131 張圖像作為訓(xùn)練使用。
為了更好地評(píng)估本文所提機(jī)制,數(shù)據(jù)集被平均分為100 個(gè)子集分配給100 個(gè)節(jié)點(diǎn)。實(shí)驗(yàn)使用卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolutional neural network)作為訓(xùn)練模型,該網(wǎng)絡(luò)由2 個(gè)5×5 的卷積層、一個(gè)全連接層和一個(gè)softmax 輸出層組成。在每個(gè)迭代周期中,包含一次全局聚合和10 次本地訓(xùn)練時(shí)隙?;谏鲜鲈O(shè)置,本節(jié)將對(duì)本文所提機(jī)制進(jìn)行性能驗(yàn)證。
4.1.2 對(duì)比方案
在本文所提機(jī)制的仿真過(guò)程中,有以下3 種對(duì)比方案。
1) 激勵(lì)機(jī)制評(píng)價(jià)。通過(guò)對(duì)比本文所提機(jī)制AFL-MSC 與FedAVG 和ASTW-FedAVG,可以看出本文所提激勵(lì)機(jī)制對(duì)提升系統(tǒng)通信效率的有效性。
2) 共識(shí)機(jī)制評(píng)價(jià)。通過(guò)對(duì)比本文所提DPoM 共識(shí)機(jī)制與PBFT 和DPoS 在區(qū)塊確認(rèn)時(shí)間上的差異,可以看出本文所提共識(shí)機(jī)制對(duì)提升系統(tǒng)通信效率的有效性。
3) 綜合性能評(píng)價(jià)。通過(guò)改變參與訓(xùn)練的節(jié)點(diǎn)數(shù)量,可以清晰地看出本文所提機(jī)制的可擴(kuò)展性;通過(guò)與ASTW-FedAVG 以及本地CNN 算法的對(duì)比,可以看出本文所提機(jī)制的準(zhǔn)確率以及對(duì)不同數(shù)據(jù)集的通用性。
4.2.1 激勵(lì)機(jī)制評(píng)價(jià)
為了驗(yàn)證本文所提激勵(lì)機(jī)制的效果,本節(jié)采用2 個(gè)指標(biāo)來(lái)衡量比較算法的性能。一個(gè)是中心模型在200 輪內(nèi)的最佳準(zhǔn)確率,另一個(gè)是在中心模型的準(zhǔn)確率達(dá)到95%(SVHN 數(shù)據(jù)集為90%)。相同的計(jì)算輪次意味著相同的通信成本。MNIST 數(shù)據(jù)集和SVHN 數(shù)據(jù)集均被分為100 個(gè)子集并部署于100 個(gè)節(jié)點(diǎn)上,由于數(shù)據(jù)集切分的隨機(jī)性,本文采用3 次隨機(jī)分配結(jié)果,例如,第一次數(shù)據(jù)集的隨機(jī)分配被稱為1@MNIST,比較本文所提機(jī)制AFL-MSC 與FedAVG 和ASTW-FedAVG 在MNIST 和SVHN 數(shù)據(jù)集上的結(jié)果,如表3 所示。
從表3 可以看出,ASTW-FedAVG 和AFL-MSC在所有數(shù)據(jù)集上的通信輪數(shù)、準(zhǔn)確率都優(yōu)于FedAVG,這是由于FedAVG 未采用任何激勵(lì)機(jī)制或其他優(yōu)化算法對(duì)聯(lián)邦學(xué)習(xí)中的通信效率進(jìn)行優(yōu)化。以1@MNIST 為例,AFL-MSC 需要31 輪通信即可達(dá)到95%的準(zhǔn)確率,優(yōu)于需要61 輪才能達(dá)到相應(yīng)準(zhǔn)確率的ASTW-FedAVG 以及需要75 輪才能達(dá)到相應(yīng)準(zhǔn)確率的FedAVG。實(shí)驗(yàn)說(shuō)明,AFL-MSC 在大多數(shù)數(shù)據(jù)集上的通信輪數(shù)和準(zhǔn)確率方面都取得了最優(yōu)結(jié)果,證明本文所提激勵(lì)機(jī)制加速了學(xué)習(xí)的收斂速度并提高了學(xué)習(xí)性能,顯著降低了聯(lián)邦學(xué)習(xí)的通信成本。
表3 激勵(lì)機(jī)制性能測(cè)試
4.2.2 共識(shí)機(jī)制評(píng)價(jià)
時(shí)延是衡量共識(shí)算法效率的指標(biāo),本文所指區(qū)塊確認(rèn)時(shí)延是區(qū)塊從見(jiàn)證人節(jié)點(diǎn)生成后到最終被備選見(jiàn)證人節(jié)點(diǎn)驗(yàn)證可添加到區(qū)塊鏈的時(shí)間間隔。作為比較,對(duì)比分析相同環(huán)境下本文所提DPoM 與DPoS 和PBFT 的確認(rèn)時(shí)延,如圖5 所示。
圖5 區(qū)塊確認(rèn)時(shí)延對(duì)比
從圖5 可以看出,本文所提DPoM 在區(qū)塊的驗(yàn)證上做到了及時(shí)確認(rèn),所以時(shí)間上只需要800 ms左右,而原本DPoS 算法因?yàn)樾枰玫街辽賯€(gè)總驗(yàn)證人節(jié)點(diǎn)的驗(yàn)證確認(rèn),所以驗(yàn)證時(shí)間至少需要6 s。同時(shí),因?yàn)椴捎昧薖BFT 算法的核心思想,所以DPoM 與PBFT 的驗(yàn)證時(shí)延基本一致。由于本文所提DPoM是通過(guò)選舉部分見(jiàn)證人節(jié)點(diǎn)的方式代為生產(chǎn)區(qū)塊,且見(jiàn)證人的數(shù)量在很長(zhǎng)一段時(shí)間內(nèi)是固定的,因此區(qū)塊的吞吐量和驗(yàn)證時(shí)延都不會(huì)隨著全網(wǎng)節(jié)點(diǎn)的增加而有很大的變化,這一特性較好地保證了區(qū)塊鏈網(wǎng)絡(luò)的穩(wěn)定性。
4.2.3 綜合性能評(píng)價(jià)
圖6 和圖7 給出了在不同訓(xùn)練節(jié)點(diǎn)數(shù)量的情況下本文所提機(jī)制在MNIST 和SVHN 數(shù)據(jù)集上的準(zhǔn)確率。為了更加符合車聯(lián)網(wǎng)中真實(shí)場(chǎng)景,實(shí)驗(yàn)將隨機(jī)選取3 個(gè)節(jié)點(diǎn)設(shè)置為低質(zhì)量的參與者,這3 個(gè)節(jié)點(diǎn)的通信和計(jì)算能力較差,通過(guò)隨機(jī)噪聲干擾原始參數(shù)為模型聚合過(guò)程提供較差的模型參數(shù)質(zhì)量。實(shí)驗(yàn)結(jié)果表明,本文所提機(jī)制具有良好的精確度,由于數(shù)據(jù)集本身結(jié)構(gòu)更加復(fù)雜,本文所提算法在SVHN 上的全局準(zhǔn)確率結(jié)果略低于MNIST,但是同樣能夠達(dá)到較高的精度,證明了本文所提算法對(duì)不同數(shù)據(jù)集的通用性。
圖6 MNIST 數(shù)據(jù)集上不同數(shù)量節(jié)點(diǎn)的全局準(zhǔn)確率
圖7 SVHN 數(shù)據(jù)集上不同數(shù)量節(jié)點(diǎn)的全局準(zhǔn)確率
當(dāng)參與訓(xùn)練的節(jié)點(diǎn)數(shù)量分別從20、40 變?yōu)?0時(shí),隨著迭代次數(shù)的增加,全局準(zhǔn)確率結(jié)果有小幅的降低但整體差異不大。實(shí)驗(yàn)結(jié)果變化的幅度較小,說(shuō)明了本文所提機(jī)制具有良好的可擴(kuò)展性并且能夠有效減少低質(zhì)量節(jié)點(diǎn)對(duì)整體學(xué)習(xí)結(jié)果的影響。
在綜合性能評(píng)價(jià)的算法對(duì)比實(shí)驗(yàn)中,本節(jié)將本文所提機(jī)制與本地CNN 和ASTW-FedAVG 進(jìn)行比較。數(shù)據(jù)集被隨機(jī)分為100 個(gè)子集以分配給100 個(gè)訓(xùn)練節(jié)點(diǎn),本地CNN 中節(jié)點(diǎn)使用被分配的子集進(jìn)行模型訓(xùn)練,ASTW-FedAVG 在節(jié)點(diǎn)的子數(shù)據(jù)集上進(jìn)行局部模型訓(xùn)練,并在中央服務(wù)器采用加權(quán)平均聚合算法更新全局模型。圖8 和圖9 表明,本文所提機(jī)制的準(zhǔn)確率略優(yōu)于ASTW-FedAVG。本地CNN的準(zhǔn)確率遠(yuǎn)低于其他2 種機(jī)制,原因是在本地CNN訓(xùn)練算法中,本地訓(xùn)練的目標(biāo)是最小化本地?cái)?shù)據(jù)集的損失,這樣導(dǎo)致其可以得到局部最優(yōu)解,但可能離全局最優(yōu)解仍有一定距離,因此準(zhǔn)確率較低。實(shí)驗(yàn)證明,本文所提機(jī)制在保障數(shù)據(jù)安全和隱私保護(hù)的情況下仍可以達(dá)到較高的準(zhǔn)確率。
圖8 MNIST 數(shù)據(jù)集上3 種算法的全局準(zhǔn)確率
圖9 SVHN 數(shù)據(jù)集上3 種算法的全局準(zhǔn)確率
圖10 評(píng)估了系統(tǒng)總體運(yùn)行時(shí)間。對(duì)于相同數(shù)量的用戶,系統(tǒng)的運(yùn)行時(shí)間隨著數(shù)據(jù)集大小的增加而增加,最終趨于平穩(wěn),這是由于本文所提機(jī)制在一定程度上優(yōu)化了聯(lián)邦學(xué)習(xí)的計(jì)算效率以及區(qū)塊鏈的共識(shí)效率,從而提高了系統(tǒng)的運(yùn)行效率。對(duì)于不同數(shù)量的用戶,系統(tǒng)的運(yùn)行時(shí)間隨著用戶數(shù)量的增加而增加,原因是用戶越多,實(shí)現(xiàn)協(xié)同工作所需的時(shí)間就越多。
圖10 系統(tǒng)總體運(yùn)行時(shí)間
通過(guò)以上實(shí)驗(yàn)可以發(fā)現(xiàn),用戶數(shù)量的增加對(duì)本文所提機(jī)制的準(zhǔn)確性影響不大,但運(yùn)行時(shí)間則會(huì)明顯增加。穩(wěn)定的準(zhǔn)確率是因?yàn)樗岱桨钢械闹鲝逆溎J奖WC了穩(wěn)定的學(xué)習(xí)精度,然而用戶的增加使更多的本地模型需要被更新和計(jì)算,同時(shí)更多的路邊單元需要執(zhí)行共識(shí),這增加了訓(xùn)練和更新傳輸?shù)臅r(shí)間開銷。盡管運(yùn)行時(shí)間略有增加,但多個(gè)用戶的參與擴(kuò)大了用于計(jì)算的數(shù)據(jù)規(guī)模,從而使數(shù)據(jù)共享的內(nèi)容更加準(zhǔn)確。
為解決車聯(lián)網(wǎng)場(chǎng)景中隱私數(shù)據(jù)共享的效率問(wèn)題,本文提出了基于主從鏈體系的異步聯(lián)邦學(xué)習(xí)架構(gòu)AFL-MSC,為分布式邊緣計(jì)算在數(shù)據(jù)隱私方面提供了一個(gè)安全高效的解決方案。進(jìn)一步地,為提高系統(tǒng)效率,本文提出基于PBFT 的改進(jìn)DPoS 共識(shí)算法DPoM,將激勵(lì)機(jī)制引入異步聯(lián)邦學(xué)習(xí)主從鏈架構(gòu)中。仿真實(shí)驗(yàn)證明,相較于ASTW-FedAVG,本文所提機(jī)制擁有更高的準(zhǔn)確率和更低的運(yùn)行時(shí)間,最終實(shí)現(xiàn)了安全可靠、智能高效的數(shù)據(jù)共享。
在未來(lái)工作中,將進(jìn)一步對(duì)本文所提機(jī)制進(jìn)行改進(jìn)和完善。一方面,針對(duì)異步聯(lián)邦學(xué)習(xí)時(shí)間決策問(wèn)題對(duì)用戶節(jié)點(diǎn)的選擇進(jìn)行優(yōu)化,考慮多個(gè)因素對(duì)節(jié)點(diǎn)選擇的影響,如能耗、通信開銷、計(jì)算成本等;另一方面,改進(jìn)共識(shí)算法,增強(qiáng)其對(duì)動(dòng)態(tài)環(huán)境的適用性,以進(jìn)一步提高算法的可擴(kuò)展性及穩(wěn)鍵性。