江 帆 梁 曉 孫長印 王軍選
(西安郵電大學(xué)通信與信息工程學(xué)院 西安 710121)
(陜西省信息通信網(wǎng)絡(luò)及安全重點(diǎn)實(shí)驗(yàn)室 西安 710121)
隨著近年來移動(dòng)互聯(lián)網(wǎng)平臺(tái)的迅速發(fā)展以及各類智能設(shè)備的空前增長,對(duì)于數(shù)據(jù)流量的需求也呈現(xiàn)爆炸式高速增長[1]。截至2021年底,僅蜂窩物聯(lián)網(wǎng)用戶在我國已達(dá)13.99億戶[2],逼近移動(dòng)電話用戶規(guī)模。然而,由于無線網(wǎng)絡(luò)通信資源有限,大規(guī)模的數(shù)據(jù)流量會(huì)使得移動(dòng)通信網(wǎng)絡(luò)面臨時(shí)延增加、通信擁塞甚至通信中斷的困境。在低時(shí)延、高效數(shù)據(jù)處理需求的驅(qū)動(dòng)下,霧無線接入網(wǎng)(Fog-Radio Access Network, F-RAN)作為一種新型網(wǎng)絡(luò)架構(gòu),能夠充分利用邊緣設(shè)備-霧接入點(diǎn)(Fog Access Point, F-AP)的通信、計(jì)算、存儲(chǔ)能力,有效緩解大規(guī)模數(shù)據(jù)流量帶來的無線網(wǎng)絡(luò)負(fù)載壓力[3]。因此,可以將用戶感興趣的熱門內(nèi)容提前緩存在霧接入點(diǎn),從而減少無線通信中回程鏈路的負(fù)載壓力,降低用戶的請(qǐng)求時(shí)延。在信息緩存過程中,緩存的內(nèi)容一般包含兩種類型:靜態(tài)內(nèi)容和動(dòng)態(tài)內(nèi)容。靜態(tài)內(nèi)容不隨時(shí)間的改變而改變(如電影、圖片、音樂等);而動(dòng)態(tài)內(nèi)容會(huì)隨時(shí)間的改變發(fā)生變化,一般用來表征設(shè)備所處環(huán)境的實(shí)時(shí)狀態(tài)(如道路通行狀態(tài)、停車場(chǎng)空位情況、車輛位置等),該類內(nèi)容通常對(duì)于時(shí)延非常敏感且具有動(dòng)態(tài)特性。雖然移動(dòng)邊緣緩存技術(shù)能夠有效減小信息傳輸?shù)亩说蕉藭r(shí)延,但是隨時(shí)間和環(huán)境的動(dòng)態(tài)變化,如何保證已緩存動(dòng)態(tài)內(nèi)容的信息時(shí)效性,避免信息滯后甚至信息失效值得深入探究。因此,相關(guān)研究提出了采用信息年齡(Age of Information, AoI)作為度量動(dòng)態(tài)內(nèi)容新鮮度的指標(biāo),其定義為信息從產(chǎn)生到使用的時(shí)間差,即AoI越大信息越滯后,反之,則表示信息越新鮮[4]。與時(shí)延指標(biāo)不同,AoI與信息的產(chǎn)生時(shí)間、緩存時(shí)間等因素密切相關(guān);而時(shí)延則一般取決于信息的比特大小,隊(duì)列的分組到達(dá)強(qiáng)度等因素。在實(shí)際的網(wǎng)絡(luò)中,智能終端側(cè)的AoI不僅與傳輸時(shí)延有關(guān),也取決于信源節(jié)點(diǎn)內(nèi)容的生成過程,中間節(jié)點(diǎn)的轉(zhuǎn)發(fā)與處理等過程等。因此,如何為用戶提供滿足時(shí)效性需求的動(dòng)態(tài)內(nèi)容,已成為近年來霧無線接入網(wǎng)中緩存策略的研究熱點(diǎn)[5,6]。
傳統(tǒng)的內(nèi)容緩存策略,如先入先出(First In First Out, FIFO),最近最少使用(Least Recently Used, LRU),最不經(jīng)常使用(Least Frequently Used, LFU)等已經(jīng)在有線網(wǎng)絡(luò)中得到了廣泛使用,但上述策略沒有考慮內(nèi)容流行度,其性能效率受限[7]。近些年,通過預(yù)測(cè)內(nèi)容流行度來提高內(nèi)容緩存效率已成為目前緩存策略的研究主流。在相關(guān)的研究工作中,文獻(xiàn)[8]提出一種基于聯(lián)邦學(xué)習(xí)的上下文感知流行度預(yù)測(cè)策略。文獻(xiàn)[9]提出一種基于深度強(qiáng)化學(xué)習(xí)的協(xié)作邊緣緩存方法。但是,目前大多數(shù)基于流行度預(yù)測(cè)的緩存算法并未充分考慮內(nèi)容流行度的時(shí)空動(dòng)態(tài)性,且僅考慮了靜態(tài)的內(nèi)容緩存策略,而沒有考慮如何維護(hù)已緩存的動(dòng)態(tài)內(nèi)容的時(shí)效性。
基于已有研究,本文提出一種基于內(nèi)容流行度和信息新鮮度的緩存更新策略。該策略主要包含基于流行度預(yù)測(cè)的內(nèi)容緩存和基于信息新鮮度的緩存更新兩方面。首先,根據(jù)用戶的歷史位置信息,使用Bi-LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到用戶的移動(dòng)模型,從而預(yù)測(cè)用戶在下一時(shí)段所處的位置區(qū)。然后,根據(jù)預(yù)測(cè)得到的用戶所在位置區(qū),結(jié)合用戶偏好模型,得到各位置區(qū)內(nèi)的內(nèi)容流行度分布。最后,使用最流行緩存策略(Most Popular Caching, MPC)將流行內(nèi)容緩存在多個(gè)霧接入點(diǎn)(F-APs)中[10]。針對(duì)已緩存在F-APs中的內(nèi)容,本文以最小化時(shí)延為目標(biāo),為具有不同流行度分布的內(nèi)容設(shè)置不同的緩存更新窗口,從而保證已緩存內(nèi)容的新鮮度。仿真結(jié)果表明,所提出的算法可以有效地提升緩存命中率,在保證內(nèi)容新鮮度的同時(shí),最大限度地減小平均時(shí)延。
如圖1所示,考慮結(jié)合邊緣緩存的霧無線接入網(wǎng)(F-RAN)場(chǎng)景,其中包含云服務(wù)器,云服務(wù)器所覆蓋的若干個(gè)霧無線小區(qū)、隨機(jī)分布的提供內(nèi)容的源節(jié)點(diǎn)及用戶。假設(shè)用戶所發(fā)出的內(nèi)容請(qǐng)求包含靜態(tài)內(nèi)容和動(dòng)態(tài)內(nèi)容,且該內(nèi)容流行度具有時(shí)空動(dòng)態(tài)性,即內(nèi)容流行度會(huì)隨所處時(shí)間空間不同而改變。將圖1所示網(wǎng)絡(luò)又進(jìn)一步劃分為若干個(gè)獨(dú)立的位置區(qū),假設(shè)用戶可以在各個(gè)位置區(qū)之間隨機(jī)移動(dòng)。令L={1,2,...,l,...,L}表 示所劃分的位置區(qū)集合,U={1,2,...,u,...,U}表示整個(gè)區(qū)域的所有用戶集合。考慮有限時(shí)間內(nèi)的內(nèi)容緩存情況,故將時(shí)間軸劃分為離散集合T={1,2,...,t,...,T}。在每個(gè)時(shí)間周期t內(nèi),假設(shè)用戶的位置不發(fā)生變化,用戶u在t時(shí)刻所處的位置用lu,t表 示,用Ul,t={1,2,...,ul,t,...,Ul,t}表示在t時(shí)間段處于l位置的用戶集合。假設(shè)用戶設(shè)備(User Equipment, UE)會(huì)自動(dòng)記錄用戶的歷史請(qǐng)求信息和移動(dòng)位置信息,且每個(gè)位置區(qū)都已部署一個(gè)F-AP來為UE提供包含接入、切換、內(nèi)容請(qǐng)求等在內(nèi)的服務(wù),部署在不同位置區(qū)的F-AP可以共享整個(gè)區(qū)域內(nèi)的用戶的位置信息。假設(shè)每個(gè)位置區(qū)的F-AP具有相同大小的內(nèi)容存儲(chǔ)空間,設(shè)為C。F={1,2,...,f,...,F}代表整個(gè)系統(tǒng)內(nèi)源節(jié)點(diǎn)所提供的所有內(nèi)容的集合,其包含了靜態(tài)內(nèi)容和動(dòng)態(tài)內(nèi)容,每個(gè)內(nèi)容大小為φ。為了減少用戶請(qǐng)求時(shí)延并考慮到F-APs有限的緩存空間,只將部分流行度較高的內(nèi)容緩存在F-APs中??紤]到用戶并非只會(huì)請(qǐng)求流行度高的內(nèi)容,流行度較低的內(nèi)容也可能會(huì)被請(qǐng)求,因此將所有的內(nèi)容上傳到云中心存儲(chǔ)備份。
圖1 基于F-RAN的緩存系統(tǒng)模型
為了實(shí)現(xiàn)高效的內(nèi)容緩存,云中心首先結(jié)合系統(tǒng)內(nèi)的用戶信息,進(jìn)行線下流行度模型訓(xùn)練,并將訓(xùn)練好的模型發(fā)送到F-APs處。在每個(gè)時(shí)間周期t開始時(shí),各位置區(qū)的F-AP再結(jié)合訓(xùn)練好的模型和位置區(qū)內(nèi)的用戶歷史位置信息和歷史請(qǐng)求信息,進(jìn)行線上的流行度預(yù)測(cè),進(jìn)而得到位置區(qū)內(nèi)的流行度分布。根據(jù)預(yù)測(cè)得到的流行度分布,使用MPC策略將流行度高的部分內(nèi)容緩存在F-AP中。假設(shè)已緩存在l位置區(qū)的靜態(tài)內(nèi)容集合可表示為Sl,t={1,2,...,sl.t,...,Sl,t}, 動(dòng)態(tài)內(nèi)容集合表示為Cl,t={1,2,...,cl.t,...,Cl,t}。為保證所有緩存在F-APs中動(dòng)態(tài)內(nèi)容的時(shí)效性,需要為每個(gè)動(dòng)態(tài)內(nèi)容設(shè)置緩存更新窗口,令其為Wcl,t。記Alc,t為t時(shí)間段緩存在l位置動(dòng)態(tài)內(nèi)容c的信息年齡。若用戶所請(qǐng)求的動(dòng)態(tài)內(nèi)容cl,t已緩存在本地的F-AP處,且Alc, t≤Wcl,t,用戶將直接從FAP處下載該內(nèi)容;如果Alc, t>Wcl,t則表示該動(dòng)態(tài)內(nèi)容已失效,F(xiàn)-AP需要先從源節(jié)點(diǎn)處獲取最新的動(dòng)態(tài)內(nèi)容,再傳輸給用戶,因而就產(chǎn)生了1次緩存命中。而當(dāng)用戶請(qǐng)求的動(dòng)態(tài)內(nèi)容并沒有緩存在本地FAP時(shí),用戶請(qǐng)求將會(huì)被路由到云中心,則認(rèn)為緩存未命中。
由式(2)所建立的最大化緩存命中率目標(biāo)函數(shù)可以看出,全局緩存命中率取決于各位置區(qū)的緩存命中率的分布,且內(nèi)容流行度會(huì)隨著位置區(qū)中用戶集合的變化而變化。如果能夠?qū)τ脩舻奈恢脜^(qū)進(jìn)行精準(zhǔn)預(yù)測(cè),再將用戶位置預(yù)測(cè)和該位置區(qū)內(nèi)的用戶偏好模型結(jié)合,會(huì)進(jìn)一步提高內(nèi)容流行度預(yù)測(cè)的精確性和針對(duì)性,從而有效提高緩存命中率。因此,所提出的基于內(nèi)容流行度預(yù)測(cè)的緩存策略首先針對(duì)用戶的位置區(qū)進(jìn)行預(yù)測(cè),然后結(jié)合用戶偏好模型,得到各位置區(qū)的內(nèi)容流行度分布。最后,利用最流行緩存策略將流行度高的內(nèi)容緩存在F-AP中以最大化緩存命中率。
由于用戶當(dāng)前所處位置與用戶的歷史位置及未來位置之間存在緊密的制約關(guān)系,獲取用戶過去位置信息的同時(shí)挖掘未來可能的位置信息顯得非常的重要。本文采用了雙向長短期記憶(Bi-directional Long-Short Term Memory, Bi-LSTM)[11]以線下線上結(jié)合的方式,對(duì)用戶的位置進(jìn)行預(yù)測(cè)。其中,Bi-LSTM結(jié)合了兩種長短期記憶網(wǎng)絡(luò)(Long-Short Term Memory, LSTM),一種 LSTM能從前往后分析輸入的位置序列信息,另一種 LSTM能從后往前分析輸入的位置序列信息,因而將用戶歷史位置信息輸入到Bi-LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,即可得到用于預(yù)測(cè)下一時(shí)刻用戶的位置預(yù)測(cè)模型。
最后,基于預(yù)測(cè)得到的內(nèi)容流行度分布,則利用MPC緩存策略將流行度較高的內(nèi)容緩存在F-AP處。
圖2 緩存內(nèi)容的信息年齡(AoI)變化示意圖
其中,P2問題的目標(biāo)函數(shù)是最小化平均更新概率,這等價(jià)于最小化平均時(shí)延Dˉc。此外式(21)中的約束條件C1也等價(jià)于式(22)中的約束條件C1,式(22)中的約束條件C2也等價(jià)于式(21)中的約束條件C3。根據(jù)Wc和Nc的線性關(guān)系,雖然P1和P2在數(shù)學(xué)上不等價(jià),但可以通過求解P2來找到P1的最優(yōu)解。根據(jù)文獻(xiàn)[16]可以證明問題P2是凸的,因此可以利用凸優(yōu)化工具來解決P2問題,進(jìn)而得到P1的最優(yōu)解,最后即可得到各緩存內(nèi)容的更新窗口長度。
為了評(píng)估內(nèi)容流行度預(yù)測(cè)的準(zhǔn)確性,本文利用從MovieLens[18]網(wǎng)站下載的真實(shí)電影評(píng)級(jí)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。此數(shù)據(jù)集由用戶ID、電影ID、電影類型、電影評(píng)分以及時(shí)間戳組成。電影類型一共可分為18種,這18種電影類型組成了一個(gè)18維特征矢量。當(dāng)電影具有1個(gè)特征時(shí),就將該內(nèi)容特征矢量所對(duì)應(yīng)的位置設(shè)置為1,否則設(shè)置為0。此外,當(dāng)用戶對(duì)電影的評(píng)分≥3 時(shí),視為用戶偏好此部電影;否則視為用戶不偏好此電影。將內(nèi)容流行度預(yù)測(cè)的周期t設(shè)置為1 d。為了與位置預(yù)測(cè)結(jié)果相對(duì)應(yīng),在BALI-2的數(shù)據(jù)集中我們共提取了分布在90個(gè)位置的102名用戶的位置數(shù)據(jù),對(duì)應(yīng)于MovieLens數(shù)據(jù)集中的102個(gè)用戶信息,并假設(shè)兩個(gè)數(shù)據(jù)集所包含的用戶是相同的。由于用戶的內(nèi)容請(qǐng)求既包含靜態(tài)內(nèi)容又包含動(dòng)態(tài)內(nèi)容,假設(shè)每個(gè)內(nèi)容請(qǐng)求最大為1M,其他仿真參數(shù)設(shè)置參見表1。
表1 仿真參數(shù)
圖3展示了Bi-LSTM神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率的對(duì)比圖。從圖中可以看出Bi-LSTM的預(yù)測(cè)準(zhǔn)確率比LSTM準(zhǔn)確率高,這是由于相比較LSTM而言,Bi-LSTM神經(jīng)網(wǎng)絡(luò)可以同時(shí)利用正向和反向的LSTM層,更為精準(zhǔn)地挖掘到輸入信息中歷史位置和未來位置之間的關(guān)系。圖4展示了本文所提出的用戶位置預(yù)測(cè)方法對(duì)一個(gè)隨機(jī)選定用戶進(jìn)行30 d的位置的預(yù)測(cè)結(jié)果與用戶真實(shí)位置的對(duì)比圖??梢钥闯?,所提出的用戶預(yù)測(cè)模型在絕大多數(shù)時(shí)間段內(nèi),都能較為準(zhǔn)確地預(yù)測(cè)出用戶所處的位置區(qū)。
圖3 Bi-LSTM和LSTM的準(zhǔn)確率對(duì)比圖
圖4 用戶位置預(yù)測(cè)隨時(shí)間的變化
圖5展示了內(nèi)容流行度預(yù)測(cè)誤差在劃分位置區(qū)和不劃分位置區(qū)的分布情況,可以看出劃分位置區(qū)的絕大多數(shù)預(yù)測(cè)誤差都分布于0-0.1,平均預(yù)測(cè)誤差為綠色橫線所示的0.0404。而不劃分位置區(qū)的平均預(yù)測(cè)誤差為橙色橫線所示的0.137。這是因?yàn)榭紤]位置劃分的流行度預(yù)測(cè)算法充分考慮了內(nèi)容流行度與用戶位置之間的關(guān)系,因而對(duì)于內(nèi)容流行度的預(yù)測(cè)更為準(zhǔn)確。
圖5 內(nèi)容流行度預(yù)測(cè)誤差
為了評(píng)估本文所提出算法的緩存性能,分別選擇了3種基準(zhǔn)對(duì)比方法,即基于流行度已知 (最優(yōu)方法)的緩存方法,最近最少使用(LRU)緩存方法以及無位置預(yù)測(cè)的緩存方法。其中,基于流行度已知 (最優(yōu)方法)緩存方法是根據(jù)真實(shí)流行度的分布情況來緩存流行度較高的內(nèi)容;最近最少使用(LRU)緩存方法的基本原理是當(dāng)用戶有新的內(nèi)容請(qǐng)求時(shí),F(xiàn)-AP只緩存近期用戶請(qǐng)求過的內(nèi)容,而將之前長時(shí)間未使用的內(nèi)容刪除;無位置預(yù)測(cè)的緩存方法則是不考慮位置區(qū)的劃分,結(jié)合整個(gè)區(qū)域內(nèi)的用戶歷史請(qǐng)求信息與用戶偏好模型實(shí)現(xiàn)流行度預(yù)測(cè),將較為流行的內(nèi)容緩存在各個(gè)F-AP中。
圖6展示了4種緩存算法緩存命中率隨F-AP緩存容量增長的變化情況。從圖6的仿真結(jié)果可以看出,隨F-AP緩存容量的增長,4種算法的緩存命中率都增長。同時(shí),可以觀察得到本文所提算法的緩存命中率最接近于最優(yōu)方法的性能,且明顯高于其他兩種對(duì)比算法。這是由于本文所提出算法充分考慮了內(nèi)容流行度與用戶所處的位置之間的緊密關(guān)系,使得內(nèi)容流行度的預(yù)測(cè)的結(jié)果更加準(zhǔn)確,緩存命中率也得到了提升。而LRU緩存方法的緩存命中率最低是因?yàn)槠錄]有考慮內(nèi)容流行度的動(dòng)態(tài)變化。
圖6 緩存命中率隨F-AP緩存容量的變化情況
圖7描述了考慮不同內(nèi)容流行度分布情況下基于信息年齡的最佳更新窗口結(jié)果,其中橫軸序號(hào)1-10代表內(nèi)容流行度按照降序分布排列的10個(gè)內(nèi)容。在仿真中,將每個(gè)F-AP能夠緩存的內(nèi)容條目數(shù)設(shè)置為10,且內(nèi)容流行度選取基于本文第3節(jié)的流行度預(yù)測(cè)算法得到的內(nèi)容流行度分布。給定平均的AoI要求為不大于100 ms。
從圖7可以看出,利用所提出的基于信息年齡的最佳更新窗口設(shè)置算法,不同流行度的緩存內(nèi)容動(dòng)態(tài)地設(shè)置了不同的更新窗口,且流行度較高的內(nèi)容采用了更小的更新窗口(如內(nèi)容序號(hào)1),從而保證了較為流行的內(nèi)容具有較高的新鮮度。圖8描述了不同內(nèi)容流行度分布情況下基于信息年齡的最佳更新概率。從圖8可以看出,較流行的內(nèi)容的更新概率更低,表明所提出的方案避免了F-AP頻繁地對(duì)較流行內(nèi)容進(jìn)行更新,因此在AoI需求和時(shí)延兩方面性能之間取得了平衡。
圖7 不同流行度內(nèi)容的最佳更新窗口
圖8 不同流行度內(nèi)容的最佳更新概率
圖9對(duì)比了給定不同的AoI要求,分別采用動(dòng)態(tài)更新窗口和恒定更新窗口兩種情況下,服務(wù)時(shí)延的變化情況。可以看出,采用所提出的動(dòng)態(tài)窗口更新方式能夠在滿足AoI的要求下,明顯降低時(shí)延。這是因?yàn)閯?dòng)態(tài)窗口更新算法以最小化延時(shí)為目標(biāo),能夠在滿足信息年齡的要求下,動(dòng)態(tài)地選擇內(nèi)容更新窗口,進(jìn)而降低時(shí)延。
圖9 時(shí)延隨要求AoI的變化情況
為了提高邊緣緩存算法的緩存命中率以及保證已緩存內(nèi)容的時(shí)效性,本文在霧無線接入網(wǎng)中提出了基于內(nèi)容流行度和信息新鮮度的緩存更新策略。首先使用訓(xùn)練好的Bi-LSTM神經(jīng)網(wǎng)絡(luò)對(duì)用戶位置進(jìn)行預(yù)測(cè),從而得到用戶在下一時(shí)間段內(nèi)用戶的位置區(qū);進(jìn)而結(jié)合用戶的偏好模型獲得各位置區(qū)內(nèi)的內(nèi)容流行度分布。考慮到F-AP有限的緩存計(jì)算能力,以最大化緩存命中率為目標(biāo),利用最流行緩存策略將流行度較高的部分內(nèi)容緩存在F-AP中。此外,為了保證已緩存在F-AP處內(nèi)容的新鮮度,進(jìn)一步以最小化時(shí)延為目標(biāo),為具有不同流行度分布的內(nèi)容設(shè)置了最優(yōu)的緩存更新窗口,從而保證已緩存內(nèi)容的新鮮度。仿真結(jié)果表明,所提出的緩存策略相比已有緩存策略能夠?qū)崿F(xiàn)更高的緩存命中率。且通過為具有不同流行度的內(nèi)容動(dòng)態(tài)地設(shè)置更新窗口大小,能夠在保障內(nèi)容的時(shí)效性的同時(shí),有效地的減小平均服務(wù)時(shí)延。