亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于聯(lián)邦學(xué)習(xí)的邊緣智能協(xié)同計算與隱私保護方法

        2021-10-11 13:09:38劉慶祥許小龍張旭云竇萬春
        計算機集成制造系統(tǒng) 2021年9期
        關(guān)鍵詞:模型

        劉慶祥,許小龍,張旭云,竇萬春

        (1.南京信息工程大學(xué) 計算機與軟件學(xué)院,江蘇 南京210044;2.中國科學(xué)院 計算技術(shù)研究所,北京100190;3.麥考瑞大學(xué) 計算機系,澳大利亞 悉尼 NSW 2109;4.計算機軟件新技術(shù)國家重點實驗室,江蘇 南京210023)

        0 引言

        在邊緣計算中,服務(wù)器被部署在網(wǎng)絡(luò)邊緣。邊緣服務(wù)器相對用戶更近,使得計算任務(wù)的遷移時間更短,因此其成為計算任務(wù)執(zhí)行的首選平臺[1]。但是邊緣服務(wù)器資源有限,隨著移動終端數(shù)量增多,應(yīng)用功能更加復(fù)雜,計算任務(wù)遷移到邊緣服務(wù)器處理時的排隊時間較長,增大了計算延遲[2]。同時,用戶向服務(wù)器遷移的計算任務(wù)中難免包含自己的隱私信息。這些信息在服務(wù)器中保存,使得用戶對私有數(shù)據(jù)不可控。

        聯(lián)邦學(xué)習(xí)中,所有參與者運行同一機器學(xué)習(xí)模型,即所有終端協(xié)同完成模型的訓(xùn)練,降低了終端的學(xué)習(xí)開銷,提高了學(xué)習(xí)效率。同時,參與者將計算模型產(chǎn)生的參數(shù)進行更新而不是將原始數(shù)據(jù)遷移到服務(wù)器上聚合,使得用戶數(shù)據(jù)僅保存在本地,在服務(wù)器上并沒有備份,因此用戶的隱私得到保護[3]。服務(wù)器對參與者產(chǎn)生的更新參數(shù)聚合完成后,將結(jié)果返回各參與者作為下次學(xué)習(xí)模型的參數(shù)初始值。服務(wù)器與參與者的交互方式、參與者之間的協(xié)同方式解決了數(shù)據(jù)孤島問題,同時避免了部分參與者網(wǎng)絡(luò)不穩(wěn)定帶來的負面情況[4]。

        基于聯(lián)邦學(xué)習(xí)的邊緣智能協(xié)同計算與隱私保護方法研究將聯(lián)邦學(xué)習(xí)的機制應(yīng)用到邊緣計算中,以此緩解邊緣計算所引起的用戶隱私泄露的情況。同時考慮在這種模式下,如何保障數(shù)據(jù)分析精度、減少模型聚合的通信開銷、提高聯(lián)邦學(xué)習(xí)的參數(shù)更新效率。

        1 相關(guān)工作

        傳統(tǒng)的聯(lián)邦學(xué)習(xí)機制中,雖然用戶的私有數(shù)據(jù)并不會傳遞給其他設(shè)備,但終端將本地更新后的數(shù)據(jù)直接上傳至邊緣服務(wù)器,仍然存在通過上傳數(shù)據(jù)反演出用戶私有數(shù)據(jù)這一隱私泄露的可能[5-6]。HAO等[7]提出一種非交互性的保障隱私的聯(lián)邦學(xué)習(xí)算法。該方法即使在多個聯(lián)邦學(xué)習(xí)參與者串通的情況下也可保證隱私不被泄露。XU等[8]在保護用戶隱私的同時,考慮如何驗證服務(wù)器聚合數(shù)據(jù)的正確性,并在分析解決上述問題的方法基礎(chǔ)上提出了可驗證的聯(lián)邦學(xué)習(xí)隱私保護框架(VerifyNet)。

        另一方面,如何提高其通信效率、減少通信開銷也逐漸成為當前研究的重要問題。WEI等[9]提出移動終端根據(jù)中心服務(wù)器的反饋信息來驗證當前的參數(shù)更新,從而決定是否將自己的更新量上傳至服務(wù)器。但該算法執(zhí)行時,移動終端需要額外的開銷來確定本地更新量是否和全局收斂具有相關(guān)性。WANG等[10]設(shè)計了一個控制算法,在給定的資源下,根據(jù)收斂約束,調(diào)整局部更新和全局聚合的次數(shù),從而最大程度地提高資源使用率。但是該算法運行的前提是局部更新消耗等數(shù)量的資源??紤]到終端的差異性以及數(shù)據(jù)大小的不同,局部更新消耗的資源必定不同,影響局部更新次數(shù)。YANG等[11]通過加快FedAvg算法聚合的速度來提高通信效率。這種方式可以在一定程度上降低通信開銷,但是算法的實現(xiàn)過程仍然采用了FedAvg的框架,并沒有在最大程度上降低模型學(xué)習(xí)時間。

        當前采用聯(lián)邦學(xué)習(xí)來保護邊緣計算中用戶隱私的工作較少,且盡管已經(jīng)有一些工作致力于研究怎樣提高聯(lián)邦學(xué)習(xí)效率,但這些方法或多或少存在一些紕漏。因此,基于聯(lián)邦學(xué)習(xí)的邊緣智能協(xié)同計算與隱私保護方法研究使用聯(lián)邦學(xué)習(xí)的機制保護邊緣計算中用戶隱私,同時探尋提高聯(lián)邦學(xué)習(xí)效率、減少移動終端開銷的方法。

        2 基于聯(lián)邦學(xué)習(xí)的邊緣計算系統(tǒng)

        2.1 系統(tǒng)架構(gòu)

        在一個邊緣計算服務(wù)器的覆蓋范圍內(nèi)共有M個用戶各使用一個移動終端。D={d1,d2,…,dM}表示這M個移動終端的集合,其中dm表示第m個移動終端。一共需要經(jīng)過N輪全局更新達到聯(lián)邦學(xué)習(xí)要求或者模型收斂停止學(xué)習(xí)。Rn(1≤n≤N)表示第n輪聚合時參與的移動終端的集合。IMAXm, n表示當dm∈Rn時,dm在本地迭代運行學(xué)習(xí)模型的最大次數(shù)。

        基于聯(lián)邦學(xué)習(xí)的邊緣計算系統(tǒng)架構(gòu)如圖1所示。在每一輪全局更新開始時,邊緣服務(wù)器確定本輪的參與終端,將模型參數(shù)傳遞至這些終端,并將參與的終端信息傳遞至第三方密鑰生成平臺。密鑰生成平臺生成這些參與者的密鑰,傳遞至相應(yīng)參與者。本地更新時,各參與者利用本地數(shù)據(jù)進行學(xué)習(xí)。學(xué)習(xí)結(jié)束后,得到本地更新的模型參數(shù),利用密鑰對數(shù)據(jù)加密后上傳至邊緣服務(wù)器。服務(wù)器聚合所有參與者的上傳數(shù)據(jù),生成下一次各參與者學(xué)習(xí)的模型參數(shù)。上述過程一直持續(xù),直至達到最大全局聚合輪數(shù),或者整個聯(lián)邦學(xué)習(xí)模型收斂。

        2.2 隱私保護機制設(shè)計

        本研究認為密鑰生成平臺是一個完全可信任的平臺,除此以外的設(shè)備,包括所有的終端以及邊緣服務(wù)器均會按照聯(lián)邦學(xué)習(xí)的協(xié)議執(zhí)行程序,但不排除他們嘗試獲取其他用戶的隱私數(shù)據(jù)的可能。這一設(shè)定也被廣泛地作為研究聯(lián)邦學(xué)習(xí)中隱私保護的基礎(chǔ)[12-14]。因此,為了防止其他設(shè)備根據(jù)終端上傳的模型參數(shù)反演出本地數(shù)據(jù),終端不能將本地更新后的參數(shù)直接上傳至邊緣服務(wù)器。換言之,為了保護用戶隱私,應(yīng)該保證除了終端本身,其余設(shè)備都對終端的本地數(shù)據(jù)以及本地更新后的實際參數(shù)不可知。同時隱私保護機制也需要保證邊緣服務(wù)器能夠聚合得到真正的模型。本部分介紹了終端如何根據(jù)密鑰對上傳的數(shù)據(jù)進行加密。

        3 模型建立與問題定義

        3.1 模型分析

        設(shè)flagm, n表示dm是否參與第n輪聚合,其計算方式如下:

        (1)

        假設(shè)在第n輪全局聚合中,dm處理一個樣本的時鐘周期為cm, n。終端dm本地數(shù)據(jù)集共有sm個樣本。dm計算樣本時間

        (2)

        式中:fm,n表示dm的主頻,Im, n表示dm在第n輪實際循環(huán)的次數(shù),且Im, n≤IMAXm, n。

        dm運行模型產(chǎn)生的能耗

        (3)

        假設(shè)在第n輪,dm與服務(wù)器之間傳輸?shù)臄?shù)據(jù)量大小為lm, n,信道帶寬為Bm, n,則dm的傳輸時間

        (4)

        第n輪中,dm產(chǎn)生的傳輸能耗

        (5)

        式中:pm, n表示dm,n在第n輪的傳輸功率。

        所有終端在整個模型運行期間的時間開銷:

        (6)

        終端與服務(wù)器通信過程中,信道傳播時間相對很小,因此本研究考慮時間開銷時,對其忽略不計。

        所有終端在聯(lián)邦學(xué)習(xí)期間產(chǎn)生的能耗表示為

        (7)

        3.2 問題定義

        本研究旨在通過聯(lián)邦學(xué)習(xí)的方式保護邊緣計算中用戶的隱私,同時在保證學(xué)習(xí)精度的前提下,減少時間開銷和移動終端能耗,其形式化表示為:

        minE,T;

        (8)

        s.t.λm≥Λm,m=1,2,…,M。

        (9)

        其中:λm表示聯(lián)邦學(xué)習(xí)結(jié)束后dm的學(xué)習(xí)精度,即dm學(xué)習(xí)的樣本正確率;Λm表示dm的目標學(xué)習(xí)精度。式(9)表示聯(lián)邦學(xué)習(xí)后每個模型的精度應(yīng)不小于目標學(xué)習(xí)精度,以此保證聯(lián)邦學(xué)習(xí)的學(xué)習(xí)精度。

        4 算法設(shè)計

        由圖1可知,在整個過程中,對聯(lián)邦學(xué)習(xí)的性能和學(xué)習(xí)效率有較大影響的過程包括參與者選擇、本地更新和全局聚合。其中,參與者選擇確定了選擇哪些終端作為參與者,決定某一終端是否要參與本輪的聯(lián)邦學(xué)習(xí);本地更新決定了終端運行學(xué)習(xí)模型的方式,對其分析精度有直接影響;全局聚合決定了下一輪參與者學(xué)習(xí)的模型,聚合方式的優(yōu)劣直接影響了參與者的時間、能耗和學(xué)習(xí)精度等性能。因此本章針對上述3個過程分別提出改進后的算法,最后總結(jié)概括了整個聯(lián)邦學(xué)習(xí)的算法過程。

        4.1 參與者確定算法

        dm數(shù)據(jù)集中任意的第j(1≤j≤sm)個樣本均由xm,j和ym, j兩部分組成。其中:xm,j描述了樣本的特征,其作為模型的輸入;ym, j∈{+1,-1}表示樣本的標簽,是期望的模型輸出。認為樣本是線性可分的,采用支持向量機模型(Support Vector Machine,SVM)來解決這個典型的二分類問題。因此,每次dm本地更新的目標為:

        (10)

        (11)

        ξm,j≥0。

        (12)

        其中:Wm和bm表示dm當前的模型參數(shù);ξm, j為引入的松弛變量。將上述式子進一步轉(zhuǎn)化為:

        (13)

        式中:Jm(Wm)為dm最終的損失函數(shù)[16]。每次選擇之前,邊緣服務(wù)器比較每個終端的分析精度和目標精度,只選擇那些沒有達到精度要求的終端。當一個終端的分析精度達到目標精度時,該終端在以后的全局更新中都不會被選擇。這種方式使得每個終端的精度都盡可能大,且降低了對其他終端的干擾。

        4.2 本地更新算法

        (14)

        (15)

        式中:θ為一個常數(shù),ηm, max表示dm的最大學(xué)習(xí)率。這種計算方式使得學(xué)習(xí)率可以自適應(yīng)當前學(xué)習(xí)精度,避免了學(xué)習(xí)率過大或過小造成的負面影響。

        4.3 全局聚合算法

        FedAvg聚合算法對所有參與者的權(quán)值求平均值。第n+1輪模型參數(shù)

        (16)

        這種參數(shù)聚合的方式可能會導(dǎo)致一些參與者在下一輪的精度低于上一輪的精度,因為服務(wù)器在聚合的時候?qū)λ袇⑴c者作平均考慮,忽略了參與者之間的影響。

        因此,本研究使用q-FedSGD算法中參數(shù)聚合機制[17]。第n+1輪模型參數(shù)

        (17)

        式中:Wn表示第n輪的模型參數(shù);Δm, n和hm, n的計算表達式分別如下:

        (18)

        (19)

        其中:q和L均為常數(shù)。這種方式使得參數(shù)聚合更加有效。

        4.4 基于聯(lián)邦學(xué)習(xí)的邊緣計算方法

        基于聯(lián)邦學(xué)習(xí)的邊緣計算方法(Federated Learning Basecl Edge Computing,FLBEC)算法流程如圖3所示。其中邊緣服務(wù)器首先選擇每輪的參與者,然后將模型參數(shù)傳遞至參與者,參與者進行本地更新。本地更新過程中,如果學(xué)習(xí)精度大于目標精度,則停止本地更新。否則,向邊緣服務(wù)器傳遞聚合需要的數(shù)據(jù)。邊緣服務(wù)器在所有參與者本地更新結(jié)束后,則聚合生成下輪全局更新的參數(shù)。該算法一直持續(xù)至達到最大的全局更新輪數(shù),或者所有的終端都達到了目標學(xué)習(xí)精度。

        5 實驗分析

        5.1 實驗配置

        在實驗中,使用的數(shù)據(jù)集為Vehicle數(shù)據(jù)集,它包括由傳感器網(wǎng)絡(luò)收集的聲學(xué)、地震和紅外傳感器數(shù)據(jù)[18]。為了實現(xiàn)對比,另外運行2個聯(lián)邦學(xué)習(xí)算法,具體如下:

        (1)FedAvg[19]。每輪服務(wù)器將所有終端作為參與者,本地更新時,參與者通過SVM進行學(xué)習(xí)。在參數(shù)聚合階段,使用簡單的平均聚合方式。該方法作為聯(lián)邦學(xué)習(xí)最經(jīng)典的算法之一,在很多聯(lián)邦學(xué)習(xí)相關(guān)的文獻中都被當作對比方法使用。

        (2)q-FedSGD[17]。每輪服務(wù)器隨機選擇15個終端作為參與者,本地更新時,參與者只是通過SVM進行學(xué)習(xí)。在參數(shù)聚合階段,使用改進后的參數(shù)聚合算法。該方法旨在保證終端參與聯(lián)邦學(xué)習(xí)精度,降低各終端學(xué)習(xí)精度的誤差。

        5.2 實驗對比分析

        本節(jié)對FLBEC、FedAvg和q-FedSGD 3個算法中,終端在聯(lián)邦學(xué)習(xí)結(jié)束后的目標學(xué)習(xí)精度、終端參與聯(lián)邦學(xué)習(xí)時間以及能耗開銷進行對比。從這3個方面驗證FLBEC方法的高效性。

        5.2.1 終端學(xué)習(xí)精確度對比分析

        如圖4所示為3個算法下各終端的學(xué)習(xí)精度與目標精度差,從中可以看出各算法在保證學(xué)習(xí)精度方面的效果。因為FedAvg在聯(lián)邦學(xué)習(xí)中能保證學(xué)習(xí)精確性,所以本研究將其運行結(jié)束后終端學(xué)習(xí)精度的0.99倍作為FLBEC算法中各終端的目標精度。由圖5可知,q-FedSGD中大多數(shù)終端的精度小于目標精度。在FLBEC中,只有d5沒有達到目標精度,從而表明FLBEC算法能保證終端的學(xué)習(xí)精度。

        5.2.2 終端學(xué)習(xí)時間對比分析

        該部分對FedAvg、q-FedSGD、FLBEC三個算法運行時,每個終端參與聯(lián)邦學(xué)習(xí)的時間進行對比分析。由上述分析可知,終端參與聯(lián)邦學(xué)習(xí)的時間由本地運行機器學(xué)習(xí)模型的計算時間和上傳數(shù)據(jù)的傳輸時間組成。而計算時間與運行機器學(xué)習(xí)模型的次數(shù)成正比,傳輸時間與參與全局更新的輪數(shù)成正比。如圖6所示,對所有終端而言,F(xiàn)edAvg算法的時間最長,因為該算法中,所有終端均參與每輪的全局更新。由于q-FedSGD每輪只選擇一部分終端作為參與者,終端的學(xué)習(xí)時間比FedAvg算法小。同時,該算法對終端進行隨機選擇,導(dǎo)致每個終端的學(xué)習(xí)時間與FedAvg算法中學(xué)習(xí)時間的差值并不相同。在FLBEC算法中,當終端達到目標精度時,即不再被服務(wù)器選中,因此整體來看,終端的學(xué)習(xí)時間在3個算法中最少。但也存在例外,d5在FLBEC下的時間與在FedAvg下的時間相等。因為在所有次的本地更新中,λ5始終小于Λ5,所以d5在所有聯(lián)邦學(xué)習(xí)輪次中均被選擇。

        5.2.3 終端能耗對比分析

        本節(jié)分析了FedAvg、q-FedSGD、FLBEC三個算法中各終端參與聯(lián)邦學(xué)習(xí)的總能耗,能耗描述了參與聯(lián)邦學(xué)習(xí)的開銷。對移動終端終端而言,其物理尺寸、計算能力有限,因此能耗是在考慮運行哪種算法的最重要的標準之一。盡管一個聯(lián)邦學(xué)習(xí)算法能最大程度上保證學(xué)習(xí)精度,如果運行需要很大的能耗開銷,其在實際應(yīng)用中也不會被優(yōu)先考慮。

        圖5所示為3個算法中,各終端學(xué)習(xí)的總能耗。總能耗分為傳輸能耗和計算能耗。由計算表達式可知,計算能耗與計算時間成正比,傳輸能耗與傳輸時間成正比。因此,3個算法下各終端的能耗分布趨勢和時間分布相似。

        6 結(jié)束語

        針對邊緣計算中終端處理大量數(shù)據(jù)效率低下且存在隱私泄露的風(fēng)險,基于聯(lián)邦學(xué)習(xí)的邊緣智能協(xié)同計算與隱私保護方法研究設(shè)計了保護邊緣計算中用戶隱私的機制。同時,通過提出的聯(lián)邦學(xué)習(xí)算法降低終端的開銷,提高聯(lián)邦學(xué)習(xí)的效率。結(jié)果表明,本研究提出的FLBEC方法在保證各終端學(xué)習(xí)精度達到一定值的情況下,與FedAvg方法和q-FedSGD方法相比,能大幅度降低終端聯(lián)邦學(xué)習(xí)時間和能耗。

        另一方面,考慮到終端計算資源和存儲資源的有限性,在未來的相關(guān)工作中,聯(lián)邦學(xué)習(xí)將會與邊緣計算進一步結(jié)合,最大程度地降低終端開銷。同時,更多的數(shù)據(jù)集將被用來訓(xùn)練FLBEC方法,從而驗證其高效性。同時,對本研究所提出的隱私保護機制做進一步優(yōu)化,設(shè)計出更完備的基于聯(lián)邦學(xué)習(xí)框架保護邊緣計算中用戶隱私的機制。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        国产一区二区三区仙踪林| 欧美成人精品福利在线视频| 美女被射视频在线观看91| 亚洲无毛成人在线视频| 亚洲午夜成人精品无码色欲| 久久发布国产伦子伦精品| 无码一区东京热| 国产在线视频一区二区三| 人妻少妇看a偷人无码| 国产精品久久久久久影视| 夜夜春精品视频| 亚洲国产av中文字幕| 亚洲最近中文字幕在线| 午夜福利啪啪片| 久久免费大片| 久久精品亚洲熟女九色| 99久久无码一区人妻| 青青草视频免费观看| 91精品国产91久久久久久青草 | 99麻豆久久久国产精品免费| 国产极品美女高潮抽搐免费网站| 无码一区二区三区网站| 中文字幕人乱码中文字幕乱码在线| 久久无码字幕中文久久无码| 青青久在线视频免费观看| 国产自在自线午夜精品视频在| 久久免费精品日本久久中文字幕| 风流老太婆大bbwbbwhd视频| 亚洲av日韩av永久无码色欲| 久久精品国产亚洲AV古装片| 免费在线视频亚洲色图| 久久久久久国产精品免费免费| 日本中文字幕在线播放第1页| 中文乱码字幕在线中文乱码| 日本不卡在线视频二区三区| 99精品欧美一区二区三区| 久久久久久久一线毛片| 日本女优中文字幕亚洲| 免费观看18禁无遮挡真人网站| 国产精品密播放国产免费看| 用力草我小逼视频在线播放|