王家瑞,譚國平*,周思源
(1.河海大學(xué)計算機與信息學(xué)院 南京 211100;2.江蘇智能交通及智能駕駛研究院南京 210019)
(?通信作者:gptan@hhu.edu.cn)
隨著5G 技術(shù)的發(fā)展,物聯(lián)網(wǎng)逐漸成為5G 時代的研究熱點。車聯(lián)網(wǎng)作為物聯(lián)網(wǎng)中一個有潛力的研究分支,有望成為智能交通系統(tǒng)中的重要的數(shù)據(jù)傳輸與控制平臺。車聯(lián)網(wǎng)是一種移動自組網(wǎng)絡(luò),可以有效地改善道路安全問題和駕駛者的駕乘環(huán)境。支撐這一功能的是用戶及其車輛所帶來的大量數(shù)據(jù),但是車聯(lián)網(wǎng)的規(guī)模巨大、所用無線信道較為開放缺乏保密性、車輛的運動軌跡容易被跟蹤預(yù)測,這都使用戶的安全隱私容易泄露。不法分子可能通過截取用戶廣播的信息、預(yù)測車輛軌跡等方式竊取同戶的數(shù)據(jù)隱私,一旦車聯(lián)網(wǎng)系統(tǒng)暴露了任何車輛或用戶的隱私信息,將在很長一段時間內(nèi)難以被公眾廣泛地接受。因此,用戶的隱私安全問題逐漸成為限制車輛及用戶參與數(shù)據(jù)提供程度的主要因素。為加強對用戶隱私的保護,除差分隱私保護理論[1]、k匿名[2]等常用的隱私保護方法外,近幾年,文獻[3-7]中也提出了許多解決方案。與此同時,2016 年谷歌提出了一種基于用戶隱私保護的學(xué)習框架——聯(lián)邦學(xué)習[8-10],其主要的特征是數(shù)據(jù)提供方的數(shù)據(jù)均保留在本地,沒有進行數(shù)據(jù)傳輸,從源頭上抑制了數(shù)據(jù)隱私的泄露。通過聯(lián)邦學(xué)習,車聯(lián)網(wǎng)系統(tǒng)可以在保護用戶隱私不被泄露的條件下,使用大量用戶數(shù)據(jù)進行模型訓(xùn)練。
現(xiàn)行的許多關(guān)于分布式聯(lián)邦學(xué)習系統(tǒng)的研究[11-14]的用戶拓撲通常為星型拓撲。但星型拓撲大多針對小范圍的隨機用戶,并沒有充分考慮車聯(lián)網(wǎng)場景下車輛隨道路分布的特殊性及其對聯(lián)邦學(xué)習訓(xùn)練效果的影響,為此本文提出了一種分布式的分簇式聯(lián)邦學(xué)習算法。從文獻[15-16]中可以得知,目前車聯(lián)網(wǎng)的發(fā)展存在以下兩方面挑戰(zhàn):一方面,車聯(lián)網(wǎng)場景下用戶分布往往更為分散,采用單參數(shù)服務(wù)端進行用戶的模型數(shù)據(jù)匯總、更新往往需要更長的時間;另一方面,用戶距離參數(shù)服務(wù)端較遠,用戶所需的總功率相對較大。通過設(shè)計用戶的分簇方案可以選擇用戶端總功率較小的分簇方式進行訓(xùn)練,從而對用戶端進行功率控制。
如圖1 所示,模型建立在雙向四車道的高速公路上,路段長度為L,單車道寬為W,圓點表示車輛。在道路中間每隔距離i設(shè)置一個路側(cè)元(Road Side Unit,RSU),用于完成用戶模型的接收匯總與更新。
在車用無線通信技術(shù)的長期演進計劃(Long Term Evolution-Vehicle to everything,LTE-V2X)系統(tǒng)級仿真中,設(shè)計車輛撒點及運動的內(nèi)容包括五項:車輛數(shù)量、撒點方式、車速、行車方向、轉(zhuǎn)向模型[17]。其中車輛數(shù)量N的計算式如下:
其中:P為車速;T為駕駛員安全反應(yīng)時間。在上述模型的基礎(chǔ)上,將在四條車道上隨機撒點,使車輛散布于每條車道的中線上,并保證車輛之間的間距大于安全跟車距離l。
考慮到RSU 的發(fā)射功率可以滿足數(shù)據(jù)的有效發(fā)送,而移動車輛的發(fā)射功率有限,假設(shè)RSU 將數(shù)據(jù)下傳至簇內(nèi)用戶的下行信道及RSU 之間的信道均為無損信道,用戶上傳模型數(shù)據(jù)至RSU的信道為衰落信道。
在用戶端進行上行模型數(shù)據(jù)傳輸時,采用模擬的方法進行傳輸,第i次迭代時,RSU接收到的信號yi(t)可表示為:
其中:Mi為第i次迭代時當前簇內(nèi)用戶的集合;hm,i(t)~CN(0,)為第m個設(shè)備在第i次模型迭代時與RSU之間的瑞利信道,zi(t)~CN(0,)為加性高斯白噪聲;xm,i(t)為t時刻第m個設(shè)備在第i次模型迭代完成后所需發(fā)送的信息??梢詫m,i(t)用式(3)表示:
其中:gm,i(t)為第i次迭代時的模型梯度值;αm,i(t)表示功率控制向量。為滿足發(fā)射功率的限制,該功率控制向量的表達式如下:
其中,γ(t),λm,i(t)∈R,為功率控制參數(shù),調(diào)控λm,i(t)與γ(t)的值,可以使αm,i(t)滿足功率限制條件。
結(jié)合式(4),可以將RSU接收信號重新表達為:
假設(shè)信號需要傳輸?shù)木嚯x為d,考慮大尺度衰落,可以重新得到此時RSU處接收到的信號表達式:
其中:B為與信號頻率等條件相關(guān)的常數(shù);ρ為信號距離衰落因子,控制信號衰落的幅度。
由式(4)可知,可以通過調(diào)整λ的值來控制有效傳輸模型數(shù)據(jù)的數(shù)量,以完成對數(shù)據(jù)丟包情況的模擬。定義有效數(shù)據(jù)傳輸率β為有效傳輸?shù)臄?shù)據(jù)包數(shù)量J占模型數(shù)據(jù)完整傳輸時所需傳輸數(shù)據(jù)包數(shù)量H的比值,即:
它可以作為有效傳輸概率的估計,即:
其中f(z)為瑞利分布的概率密度:
其中δ為方差,由此,可以得到:
第k個用戶端處訓(xùn)練模型的損失函數(shù)可表示為:
其中:Dk表示在第k個用戶處收集到的本地數(shù)據(jù)集;f(w,xi,yi)表示模型w基于訓(xùn)練集樣本xi及其對應(yīng)標簽yi的誤差損失函數(shù)。同時,一簇內(nèi)的總體模型損失函數(shù)F(w)可以表示為如下形式:
其中,K為該簇內(nèi)參與模型訓(xùn)練的用戶總數(shù)。
圖2 為整體系統(tǒng)框圖,后續(xù)實驗也將據(jù)此進行相關(guān)仿真。在一次迭代中,當一簇用戶的模型更新完成后,其模型將作為下一簇用戶的初始模型進行訓(xùn)練,這種方式與傳統(tǒng)聯(lián)邦學(xué)習中模型值取平均的做法不同,但這也是針對分簇式聯(lián)邦學(xué)習方法進行的一種嘗試。
圖2 C-WFLA流程Fig.2 Flow chart of C-WFLA
在每次隨機撒點完成后,將根據(jù)個用戶的車輛位置進行分簇,把模型中的N個用戶分為C簇,控制用戶端在上傳數(shù)據(jù)時不要離RSU 過遠,具體的分簇方法基于二分k-means 的思路,流程如下:
1)計算N個用戶位置坐標的質(zhì)心。
2)選擇距離1)中質(zhì)心最近的RSU作為初始中心點。
3)隨機選取2 個用戶位置做中心點,并由此將剩余用戶分為兩簇。
4)選取步驟3)中未選擇的用戶點,分別計算其與步驟3)中選取兩中心點歐氏距離的平方,并使其歸于數(shù)值較小的一方,該用戶點加入后,重新計算該簇用戶位置坐標的質(zhì)心。
5)重復(fù)步驟4)直至所有點分簇完成,選擇距離兩簇質(zhì)心最近的RSU作為該簇的中心點。
6)分別計算兩簇內(nèi)用戶點與中心點距離的平方和,選擇數(shù)值較大的一簇重復(fù)步驟3)~4)直至模型內(nèi)的總簇數(shù)達到設(shè)定值。
在實驗仿真中,圖1 中示意的高速公路的長度L定為1 000 m,單條道路寬定為7.5 m。
設(shè)置車輛數(shù)量時,取車輛速度P為120 km/h,駕駛員安全反應(yīng)時間T取6 s,安全跟車距離l取20 m,確保同一車道兩車間距大于20 m,根據(jù)式(1),可得N=20。因此,在每次迭代時將模擬生成20輛車的位置,以進行分簇。
本次實驗,以數(shù)字手寫體識別的模型訓(xùn)練為例,展示訓(xùn)練效果,優(yōu)化器選擇隨機梯度下降(Stochastic Gradient Descent,SGD),訓(xùn)練集大小r取5 000,經(jīng)預(yù)實驗迭代次數(shù)i取150,學(xué)習率lr選擇如式(13):
基于每次迭代整體的效率與速度,分簇過少會使整體用戶的發(fā)射功率增加,分簇過多會導(dǎo)致單次迭代內(nèi)的訓(xùn)練區(qū)域較多,系統(tǒng)整體訓(xùn)練時間較長,因此選擇將20 個用戶分為3簇。
根據(jù)圖2 介紹的流程,接下來通過一次仿真案例的執(zhí)行情況,具體展示分簇算法運行結(jié)果細節(jié):
1)根據(jù)用戶位置,20個用戶端的初始分簇情況如下:
其中,數(shù)字0~19 為用戶端的標號,在分配訓(xùn)練集圖片時,將給0 號、1 號用戶端分配5 000 張數(shù)字“0”的圖片,以此類推18號、19號用戶端將獲得5 000張數(shù)字“9”的圖片。
2)在根據(jù)β值的大小做好功率控制的情況下,通過當前簇內(nèi)用戶([1,2,5,6,12,14,17,18])的數(shù)據(jù)集進行模型學(xué)習,并通過RSU 將匯總、更新后的模型參數(shù)傳至下一簇([7,13,15,19]),并作為下一簇用戶模型訓(xùn)練的初始模型。
3)重復(fù)2)中的操作,直至3簇用戶均訓(xùn)練完成,第一次迭代結(jié)束。
4)在下一輪迭代開始之前,系統(tǒng)將重新生成用戶的位置信息,并重新進行分簇。
5)重復(fù)2)~3)中的操作,直至迭代150 次,模型損失值基本收斂,訓(xùn)練完成。
圖3 為β值取20%、40%、60%、80%、100%時,模型經(jīng)過150 輪迭代,傳統(tǒng)聯(lián)邦學(xué)習(集中式)、分簇式聯(lián)邦學(xué)習(分布式)兩種訓(xùn)練方式下,模型損失函數(shù)的變化。
從圖3 可以看出:在β大于等于40%時,兩種訓(xùn)練方式下的模型收斂值、收斂速度相近,但分簇式訓(xùn)練在模型收斂時的損失函數(shù)波動變大。當β值繼續(xù)降低到20%時,傳統(tǒng)聯(lián)邦學(xué)習的收斂值劇增,整體模型訓(xùn)練效果變差。
圖3 不同β值下的損失函數(shù)變化Fig.3 Change of loss function under different β values
表1為模型經(jīng)過150輪迭代后,兩種訓(xùn)練方式下?lián)p失函數(shù)的收斂值。
從表1 中可以看出:β高于40%時,分簇式聯(lián)邦學(xué)習訓(xùn)練后的模型收斂值略高于傳統(tǒng)聯(lián)邦學(xué)習;而當β值降低至20%,分簇式聯(lián)邦學(xué)習的模型收斂值卻更低,這說明在β值較低,即信道狀態(tài)較差或者發(fā)射功率受限較大時,分簇式訓(xùn)練有著更好的抵抗性,因此獲得了更好的模型訓(xùn)練效果。
表1 兩種訓(xùn)練方式下模型收斂值對比Tab.1 Comparison of model convergence values under two training methods
對傳統(tǒng)聯(lián)邦學(xué)習模式在不同β值下的收斂情況進行了橫向?qū)Ρ龋鐖D4所示。在圖4中可以觀察到,β值為100%、80%時曲線基本重合,當β值低于40%時,模型損失函數(shù)出現(xiàn)了類似門限效應(yīng)的情況,隨著β值的減小,損失函數(shù)的收斂值迅速變大,而分簇式聯(lián)邦學(xué)習訓(xùn)練出的模型并沒有出現(xiàn)類似情況。
圖4 傳統(tǒng)聯(lián)邦學(xué)習在訓(xùn)練時的損失函數(shù)值Fig.4 Loss function values during training of traditional federated learning
這一現(xiàn)象,推測可能是隨機拓撲網(wǎng)絡(luò)的隨機性產(chǎn)生的效果:
1)從模型參數(shù)的角度分析:假設(shè)有利于模型訓(xùn)練的關(guān)鍵參數(shù)位置基本不變,在隨機網(wǎng)絡(luò)引入之前,在通過功率控制進行模擬丟包后,關(guān)鍵位置的模型參數(shù)可能會丟失,從而導(dǎo)致模型不能正常收斂。而在分簇式聯(lián)邦學(xué)習中,用戶被分為了多簇,在每一次的迭代中,模型需要進行多次接力更新才能完成,而根據(jù)式(6)可知,聯(lián)邦學(xué)習只關(guān)注模型更新時,所有用戶發(fā)送的梯度矢量平均值。由于分簇式聯(lián)邦學(xué)習的每一簇用戶在上傳模型數(shù)據(jù)時都需要進行一次功率控制,從概率上講,模型中關(guān)鍵位置參數(shù)全部丟失的可能性相對減小,取而代之的是該位置上的參數(shù)值變小,這一變化提高了其模型數(shù)據(jù)在丟包較多的情況下,訓(xùn)練后模型的整體效果。
2)分簇式聯(lián)邦學(xué)習在每次迭代時,用戶的位置與用戶的分組方式發(fā)生了改變,這相當于在模型訓(xùn)練的過程中引入了一定的隨機性,從而優(yōu)化了整體模型訓(xùn)練的效果,而也正是由于這種隨機性的引入使模型收斂時會出現(xiàn)一定的波動。
針對基于高速公路模型的車聯(lián)網(wǎng)場景,本文提出了一種分布式的分簇式無線聯(lián)邦學(xué)習算法(C-WFLA)。通過仿真實驗對該算法的訓(xùn)練性能進行的分析可知,本文提出的分簇式訓(xùn)練方式能有效應(yīng)對無線系統(tǒng)中的數(shù)據(jù)丟包狀況,即在相應(yīng)的丟包率低于一定的閾值時,本文提出的分布式算法依然能夠取得較好的訓(xùn)練效果。但本文所提出的算法還存在很多問題值得探討:1)目前只考慮了數(shù)字手寫體識別模型訓(xùn)練,對一些更復(fù)雜的模型有待實驗驗證;2)對于無線信道的仿真還不夠?qū)嶋H,沒有考慮多徑效應(yīng)、多普勒效應(yīng)等實際情況;3)對模型隨機性的考慮還不夠完備,分簇方法也還有待優(yōu)化;4)在諸如城市道路、鄉(xiāng)村道路等不同車聯(lián)網(wǎng)模型下的訓(xùn)練效果還有待驗證。以上問題都將是我們后續(xù)的重點研討方向。