李濟(jì)偉,商晴慶,孫建剛,董耀眾,李偉良
(國家電網(wǎng)有限公司信息通信分公司,北京,100761)
區(qū)塊鏈技術(shù)是相對成熟的信任機(jī)制,區(qū)塊鏈中的所有區(qū)塊基本都包含了當(dāng)前區(qū)塊。每個區(qū)塊中的數(shù)據(jù)都存儲在一個Merkle樹根結(jié)構(gòu)中。一個區(qū)塊由區(qū)塊頭和區(qū)塊體組成,所有Merkle樹根放在區(qū)塊頭中,不包含具體的內(nèi)容,具體的內(nèi)容放在塊頭。Merkle樹根的作用是提供證據(jù),為節(jié)點(diǎn)提供路徑。哈希計(jì)算的原理是對同一條數(shù)據(jù)散列后,得到一個固定長度的散列碼,使用非對稱加密來實(shí)現(xiàn)去信任。隨著越來越多的事務(wù)出現(xiàn),區(qū)塊鏈也隨之增長。當(dāng)添加一個區(qū)塊時,所有節(jié)點(diǎn)必須參與區(qū)塊檢查。傳遞區(qū)塊后將通過反向鏈接指向其父區(qū)塊,添加到整個區(qū)塊鏈的末尾。區(qū)塊鏈需要數(shù)據(jù)和應(yīng)用分布式存儲和計(jì)算,還需要對數(shù)據(jù)進(jìn)行多邊控制,以確保不被偽造??傊?,區(qū)塊鏈具有可追溯性的應(yīng)用優(yōu)勢,方便合作伙伴進(jìn)行檢查、跟蹤和監(jiān)控,區(qū)塊鏈中數(shù)據(jù)的每一次變化都會捕捉到明確時間和其他相關(guān)信息。不同的區(qū)塊鏈參與者使用數(shù)據(jù)源,而不是不斷檢查的去中心化數(shù)據(jù)源。區(qū)塊鏈允許參與者一起上傳和共享狀態(tài)和業(yè)務(wù)信息,以提高各方整體規(guī)劃和協(xié)作。區(qū)塊鏈維護(hù)下載信息的完整性,允許所有合作人員不斷更改[1]。
聯(lián)邦學(xué)習(xí)是互利的獨(dú)立數(shù)據(jù)庫集合,單個數(shù)據(jù)庫的重要組成部分是自治性、異構(gòu)性和分布性。隨著云計(jì)算的發(fā)展和應(yīng)用,研究人員對聯(lián)邦云進(jìn)行了研究。聯(lián)邦云是對外部和內(nèi)部云計(jì)算的部署管理。聯(lián)邦云可以通過更高效的一方來降低成本。資源遷移和預(yù)留是組合云的關(guān)鍵特征,資源可以從一個云提供移到另一個云,遷移可以重新分配資源。冗余允許在不同的域中使用服務(wù)功能??梢愿鶕?jù)相同的計(jì)算對來自不同的數(shù)據(jù)進(jìn)行拆分和處理。各種資源的規(guī)劃是聯(lián)邦云設(shè)計(jì)的重要因素。聯(lián)邦學(xué)習(xí)與傳統(tǒng)的制度存在一些異同,考慮不同分布異質(zhì)性和自治性的前景適用于聯(lián)邦學(xué)習(xí)系統(tǒng)。分布式系統(tǒng)中的一些因素對于聯(lián)邦學(xué)習(xí)很重要。部署之間交換數(shù)據(jù)會影響系統(tǒng)性能。聯(lián)邦制度對合作與約束重視不同,聯(lián)邦數(shù)據(jù)庫側(cè)重于數(shù)據(jù)管理,聯(lián)邦學(xué)習(xí)云側(cè)重于資源規(guī)劃,聯(lián)邦學(xué)習(xí)更多的是多方安全計(jì)算。聯(lián)邦培訓(xùn)帶來了許多新的挑戰(zhàn),分布式學(xué)習(xí)算法的開發(fā)和隱私限制的數(shù)據(jù)保護(hù)。當(dāng)今人工智能中存在普遍的數(shù)據(jù)獨(dú)島現(xiàn)象,成為機(jī)器學(xué)習(xí)中重要的問題。因此,聯(lián)邦學(xué)習(xí)研究的必要性和緊迫性開始凸顯。對于通信架構(gòu)、保密機(jī)制以及聯(lián)邦學(xué)習(xí)技術(shù)的動機(jī)。這些是制定聯(lián)邦學(xué)習(xí)體系結(jié)構(gòu)和具體內(nèi)容時應(yīng)考慮的因素,是影響聯(lián)邦學(xué)習(xí)發(fā)展的主要。從通訊系統(tǒng)架構(gòu)來看,聯(lián)邦學(xué)習(xí)的系統(tǒng)通常是集中式的,后來出現(xiàn)分散的項(xiàng)目,聯(lián)邦培訓(xùn)通訊方式主要有集中式和分散式。在開發(fā)通信架構(gòu)時,數(shù)據(jù)流是不對稱的。這意味著服務(wù)器從其他參與者收集信息將學(xué)習(xí)結(jié)果發(fā)回。全局模型參數(shù)更新在此服務(wù)器上執(zhí)行。服務(wù)器和本地參與者通信可以是同步或異步。在去中心化設(shè)計(jì)中,各方進(jìn)行通信,可以直接更新全局參數(shù)。集中式架構(gòu)簡單高效,可擴(kuò)展性和穩(wěn)定性是系統(tǒng)的重要因素。盡管集中式設(shè)計(jì)在研究中被廣泛使用,但在某些情況下,采用分散式設(shè)計(jì),將信息集中在單個服務(wù)器上會導(dǎo)致潛在的風(fēng)險。聯(lián)邦學(xué)習(xí)中本地?cái)?shù)據(jù)是私有受到保護(hù),但其安全性會受到模型參數(shù)的影響,不同保密聯(lián)邦學(xué)習(xí)系統(tǒng)中威脅模型也不同。攻擊發(fā)生在單個學(xué)習(xí)的任何階段。各方在學(xué)習(xí)前可能會更改某個標(biāo)簽,這就是研究的模型效果不佳的原因。每一方都可以攻擊模型中毒,下載惡意開發(fā)的模型,就像數(shù)據(jù)中毒一樣,全局模型的準(zhǔn)確率會非常低,局部更新被中毒了。除了模型中毒,分布式學(xué)習(xí)中的常見問題是拜占庭失敗,模型在各方面的學(xué)習(xí)可能很弱,會隨機(jī)加載。如果研究模型被公開,則發(fā)生輸出攻擊,服務(wù)器從交換模型的參數(shù)中提取訓(xùn)練數(shù)據(jù)的機(jī)密信息。檢測特定數(shù)據(jù)記錄是否用于訓(xùn)練,聯(lián)邦學(xué)習(xí)管理器在整個學(xué)習(xí)中訪問各方的本地更新,以進(jìn)行推理攻擊。對于提供不同保密性保密機(jī)制有很多,如不同保密性和匿名性,也有研究總結(jié)了保密機(jī)制的特點(diǎn)。總結(jié)現(xiàn)代聯(lián)邦學(xué)習(xí)系統(tǒng)中保護(hù)數(shù)據(jù)的主要方法,加密方法和差異機(jī)密性。同態(tài)加密和多邊安全計(jì)算加密方法廣泛用于聯(lián)邦學(xué)習(xí)算法中以保護(hù)機(jī)密性。通過方法的應(yīng)用,聯(lián)邦學(xué)習(xí)系統(tǒng)中的機(jī)密性總體上可以得到保護(hù)。在多邊安全計(jì)算中,除了結(jié)果之外,并非所有都可以知道任何事情。這種方法容易受到攻擊,由于額外的加密和解密,系統(tǒng)運(yùn)行將具有極高的負(fù)載。保密性可以保證寄存器不會對輸出產(chǎn)生太大影響,數(shù)據(jù)集中或不在數(shù)據(jù)集中的人幾乎沒有影響。使用差異機(jī)密性來保護(hù)數(shù)據(jù)機(jī)密性,每個參與者不知道其他參與者參與了過程。通過向數(shù)據(jù)或參數(shù)添加隨機(jī)噪聲,差分機(jī)密性為單個記錄提供統(tǒng)計(jì),保證并防止模型輸出攻擊,與加密方法相比不會產(chǎn)生計(jì)算成本,但由于對于學(xué)習(xí)中的噪音,系統(tǒng)會創(chuàng)建精度較低的模型。同時也是相互獨(dú)立的,單一的系統(tǒng)使用不同的方法提高保密性。盡管大多數(shù)聯(lián)邦學(xué)習(xí)系統(tǒng)使用加密技術(shù)實(shí)現(xiàn)保密保證,但這些方法的局限性難以克服。目前的專項(xiàng)工作是盡量減少方法的副作用,同時尋找一種兼顧數(shù)據(jù)保密性和靈活要求的新方法。采用較低的安全性旨在用于系統(tǒng)實(shí)際應(yīng)用[2]。
資源分配和數(shù)據(jù)管理在BFL中非常重要。在聯(lián)邦學(xué)習(xí)參與者的每個客戶端中,應(yīng)該共享計(jì)算和資源,用于模型和參與區(qū)塊鏈。基于深度強(qiáng)化學(xué)習(xí)的解決方案,以限制計(jì)算和存儲資源,增加區(qū)塊鏈學(xué)習(xí)延遲。針對問題的存在,聯(lián)邦學(xué)習(xí)發(fā)起方需要確定資源分配和區(qū)塊鏈頻率,但這在復(fù)雜的物聯(lián)網(wǎng)中是非常困難的。因此,基于深度學(xué)習(xí)和強(qiáng)化方案,讓聯(lián)邦學(xué)習(xí)的發(fā)起者在沒有物聯(lián)網(wǎng)先驗(yàn)的情況下,有效地分配資源?;诼?lián)邦區(qū)塊鏈的移動學(xué)習(xí)系統(tǒng)。在邊界計(jì)算網(wǎng)絡(luò)中,傳統(tǒng)的聯(lián)邦學(xué)習(xí)存在一定的局限性。比如設(shè)備的異構(gòu)性和高數(shù)據(jù)維度更新,數(shù)據(jù)、算法、數(shù)據(jù)預(yù)處理和學(xué)習(xí)導(dǎo)致的錯誤。針對以上問題,針對數(shù)據(jù)集的分離提出學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)多層次的數(shù)據(jù)管理。資源分配是BFL中非常重要的任務(wù),以確保數(shù)據(jù)資源的最佳使用。流行使用深度學(xué)習(xí)為基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)實(shí)施資源分配策略,前提是計(jì)算負(fù)載和帶寬都得到合理的應(yīng)用。通過降低聯(lián)邦學(xué)習(xí)成本來解決資源分配問題,基于輕量級區(qū)塊鏈平臺用于支持基于聯(lián)邦區(qū)塊鏈學(xué)習(xí)。此外,在整個聯(lián)邦基于區(qū)塊鏈的學(xué)習(xí)對本地設(shè)備學(xué)習(xí)速度和區(qū)塊生成進(jìn)行評估,是進(jìn)一步改善資源配置的途徑[3]。
對基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)的研究,通過去中心化解決安全和其他問題,側(cè)重于創(chuàng)建激勵機(jī)制。聯(lián)邦學(xué)習(xí)技術(shù)雖然促進(jìn)了協(xié)作學(xué)習(xí),保護(hù)用戶的隱私,但面臨著如何鼓勵各方參與聯(lián)邦學(xué)習(xí)并提供數(shù)據(jù)和計(jì)算的挑戰(zhàn)。如果沒有適當(dāng)?shù)募顧C(jī)制,參與者可能不愿意參與聯(lián)邦學(xué)習(xí),降低所開發(fā)的系統(tǒng)的可擴(kuò)展性。通過實(shí)施區(qū)塊鏈激勵機(jī)制,并實(shí)施具有成本效益的激勵機(jī)制,這將提高聯(lián)邦學(xué)習(xí)系統(tǒng)各方參與的積極性。激勵機(jī)制可以在服務(wù)器或區(qū)塊鏈中的激勵機(jī)制,是增加聯(lián)邦學(xué)習(xí)積極性的很好的解決方案。提出新的基于聯(lián)邦區(qū)塊鏈的系統(tǒng),用于無人駕駛場景。這種結(jié)構(gòu)針對聯(lián)邦訓(xùn)練系統(tǒng)應(yīng)用于無人駕駛場景。如果中心服務(wù)器出現(xiàn)故障,將會帶來更大的風(fēng)險。本地?cái)?shù)據(jù)對于無人駕駛非常重要,需要有具體的機(jī)制來鼓勵用戶為模型提供數(shù)據(jù)。使用區(qū)塊鏈解決去中心化,制定一套激勵措施,以便數(shù)據(jù)提供者從中受益。學(xué)習(xí)中的參與者越多,模型的性能就越好。如果數(shù)據(jù)所有者對數(shù)據(jù)和資源的利益沒有貢獻(xiàn),則不需要參與學(xué)習(xí)過程。一些研究人員開發(fā)了激勵機(jī)制,讓數(shù)據(jù)所有者參與模型學(xué)習(xí)?;谟?jì)算次數(shù)、通信、本地模型,確保準(zhǔn)確性、數(shù)據(jù)質(zhì)量、客戶端設(shè)備行為等。激勵機(jī)制的對于聯(lián)邦學(xué)習(xí)成功至關(guān)重要,在區(qū)塊鏈設(shè)計(jì)激勵機(jī)制,系統(tǒng)各方可以是合作伙伴或參與者。研究提出了獨(dú)特的激勵機(jī)制設(shè)計(jì),讓參與者參與學(xué)習(xí)高質(zhì)量數(shù)據(jù)。不同的機(jī)制模型及其均衡設(shè)計(jì)應(yīng)在聯(lián)邦體系內(nèi)進(jìn)行修訂。在大數(shù)據(jù)時代,每天都會產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)通常是不相關(guān)的。大部分?jǐn)?shù)據(jù)掌握在大型科技公司。為了解決這個問題,新的聯(lián)邦學(xué)習(xí)系統(tǒng)需要結(jié)合了區(qū)塊鏈和聯(lián)邦學(xué)習(xí),共識算法來驗(yàn)證分布式IPFS存儲。使用激勵鼓勵用戶參加聯(lián)邦學(xué)習(xí)以獲取數(shù)據(jù)。針對聯(lián)邦學(xué)習(xí)的激勵機(jī)制,采用加權(quán)邏輯模型對用戶進(jìn)行評估,并制定激勵機(jī)制。對于基于EOS和IPFS區(qū)塊鏈的基于區(qū)塊鏈的學(xué)習(xí)系統(tǒng),使用EOS來擴(kuò)展更新,并為安裝的用戶產(chǎn)生利潤。將區(qū)塊鏈與聯(lián)邦學(xué)習(xí)相結(jié)合,使用網(wǎng)絡(luò)區(qū)塊鏈設(shè)備模型的本地更新,比在服務(wù)器上運(yùn)行更穩(wěn)定,可以為設(shè)備提供獎勵。種基于信任和激勵的結(jié)構(gòu),保存信息和經(jīng)過驗(yàn)證的聯(lián)邦學(xué)習(xí)細(xì)節(jié)以供審查。激勵機(jī)制會激勵可靠的用戶。為了解決用戶的威脅以及梯度收集更新方面缺乏激勵的問題,需要支持審計(jì)和隱私保護(hù)的框架。提供參與隱私訓(xùn)練的激勵,共享并準(zhǔn)確更新設(shè)置,實(shí)現(xiàn)迭代深度學(xué)習(xí)。基于區(qū)塊鏈激勵機(jī)制打造模型交易體系,鼓勵用戶參與學(xué)習(xí),并利用區(qū)塊鏈記錄模型學(xué)習(xí),保證學(xué)習(xí)過程的隱私保護(hù)。共識算法應(yīng)該滿足特定的物聯(lián)網(wǎng)環(huán)境,適應(yīng)不斷變化的環(huán)境。因此,適用于環(huán)境的新型區(qū)塊鏈共識算法,主要使用高質(zhì)量的計(jì)算對新區(qū)塊進(jìn)行認(rèn)證,不需要所有節(jié)點(diǎn)一起計(jì)算,節(jié)省大量計(jì)算資源,可有效的避免資源浪費(fèi)[4]。
為了保證聯(lián)邦學(xué)習(xí)基于區(qū)塊鏈的可靠性和安全性,需要創(chuàng)建保護(hù)隱私的機(jī)制,是區(qū)塊鏈技術(shù)納入聯(lián)邦學(xué)習(xí)的主要原因。數(shù)據(jù)源利用區(qū)塊鏈來控制節(jié)點(diǎn)之間的數(shù)據(jù)和交換,對于解決單個故障和攻擊非常有效。對于去中心化的學(xué)習(xí)系統(tǒng),區(qū)塊鏈不是記錄審計(jì)和數(shù)據(jù)跟蹤的數(shù)據(jù),而是記錄所有事件,并允許授權(quán)方訪問信息?;趨^(qū)塊鏈系統(tǒng)的分布式聯(lián)邦學(xué)習(xí)系統(tǒng),解決去中心化中的性能問題,定義模型的存儲方式、學(xué)習(xí)過程以及共識機(jī)制。優(yōu)化共識效率和消耗,模仿惡意節(jié)點(diǎn)的攻擊,證明了框架的安全性。針對聯(lián)邦5G網(wǎng)絡(luò)聯(lián)邦學(xué)習(xí)的中毒威脅,使用智能區(qū)塊鏈的聯(lián)邦安全系統(tǒng)。并引入差分保密技術(shù)來對抗攻擊。使用區(qū)塊鏈來記錄行為,以檢測對敏感信息的攻擊?;诼?lián)邦區(qū)塊鏈的模糊計(jì)算,使用分布式優(yōu)化數(shù)據(jù)在區(qū)塊鏈中的存儲,提高出塊效率,實(shí)現(xiàn)分布式隱私保護(hù),解決場景問題。通過分布式寄存器捕獲平移更新,實(shí)現(xiàn)收集數(shù)據(jù)的能力。基于區(qū)塊鏈場景的聯(lián)邦訓(xùn)練系統(tǒng),用于更新移動設(shè)備原生模型。用戶通過將移動設(shè)備連接到他們的本地模型獲得獎勵。檢查所有本地模型,檢查工作以獲得獎勵。單個設(shè)備的故障不會影響全局更新,增加了系統(tǒng)的可靠性。引入許可鏈技術(shù)和有向無環(huán)圖,新的聯(lián)邦學(xué)習(xí)架構(gòu)進(jìn)行改進(jìn)。將深度學(xué)習(xí)與強(qiáng)化結(jié)合來提高生產(chǎn)力,提出了異步復(fù)合學(xué)習(xí)方案。引入?yún)^(qū)塊鏈通道的來研究全局模型,通過共識獲得最終的全局模型,將局部模型存儲為一個塊。全局模型狀態(tài)樹,用狀態(tài)樹來求解模型的全局參數(shù),與傳統(tǒng)的聯(lián)邦模型相比,該模型更加可靠。在BFL系統(tǒng)中,攻擊者會嘗試使用錯誤數(shù)據(jù)來修改全局模型,在模型遷移中操縱參數(shù)值,操縱學(xué)習(xí)入口。當(dāng)前的工作都集中在為模型學(xué)習(xí)構(gòu)建檢測機(jī)制和更新,提供基于區(qū)塊鏈的學(xué)習(xí)系統(tǒng)。通過調(diào)整復(fù)雜性來降低中毒的可能性,不降低培訓(xùn)效率??v觀聯(lián)邦區(qū)塊鏈的學(xué)習(xí)系統(tǒng),在區(qū)塊鏈挖掘和數(shù)據(jù)訓(xùn)練中應(yīng)綜合考慮攻擊模型??梢允褂靡粋€完整的基于區(qū)塊鏈的學(xué)習(xí)系統(tǒng)提高控制,達(dá)到修改數(shù)據(jù)塊的目的,這一過程降低了生產(chǎn)效率。在數(shù)據(jù)隱私保護(hù)方面,差分隱私和加密等技術(shù)是訓(xùn)練基于區(qū)塊鏈的聯(lián)邦的有效工具。通過在私有樹的中間節(jié)點(diǎn)中隨機(jī)葉節(jié)點(diǎn)加入噪聲,消除了去除噪聲的能力,實(shí)現(xiàn)了差分保密性,同態(tài)加密對于聯(lián)邦學(xué)習(xí)有一定的應(yīng)用效果。在學(xué)習(xí)時保護(hù)存儲機(jī)密和外包計(jì)算,區(qū)塊鏈共享聯(lián)邦學(xué)習(xí)的聚合之前,有效地加密數(shù)據(jù),對個人信息和隱私敏感的任務(wù)中起著重要的作用[5]。