摘" 要: 為提升對(duì)多模態(tài)數(shù)據(jù)的管理效果,提高數(shù)據(jù)訪問(wèn)速度并減輕數(shù)據(jù)庫(kù)負(fù)載,設(shè)計(jì)一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的多模態(tài)數(shù)據(jù)層次化緩存系統(tǒng)。在DRAM/NVM混合內(nèi)存模塊中,利用DRAM完成主存NVM的緩存。當(dāng)DRAM存在緩存缺失時(shí),利用訪問(wèn)監(jiān)控模塊內(nèi)置高速采集卡來(lái)采集NVM上頻繁訪問(wèn)4 KB數(shù)據(jù)塊的歷史訪問(wèn)記錄,再將歷史訪問(wèn)記錄編碼為訪問(wèn)向量后構(gòu)建訓(xùn)練集,作為長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)的輸入,用于預(yù)測(cè)訪問(wèn)頻率。在緩存過(guò)濾模塊中,將訪問(wèn)頻率預(yù)測(cè)結(jié)果高于設(shè)定閾值部分的4 KB多模態(tài)數(shù)據(jù)讀取到DRAM中進(jìn)行緩存。實(shí)驗(yàn)結(jié)果顯示:所設(shè)計(jì)系統(tǒng)可最大程度地降低系統(tǒng)帶寬占用情況,TLB缺失率低,緩存執(zhí)行效率較高,面對(duì)大頁(yè)面具備顯著緩存優(yōu)勢(shì)。
關(guān)鍵詞: 多模態(tài)數(shù)據(jù); 層次化緩存; 循環(huán)神經(jīng)網(wǎng)絡(luò); 長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò); DRAM; NVM; 訪問(wèn)頻率
中圖分類(lèi)號(hào): TN919.5?34; TP303" " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " "文章編號(hào): 1004?373X(2025)04?0052?05
Design of multimodal data hierarchical caching system based on recurrent neural network
ZHANG Yan
(Xinjiang Normal University, Urumqi 830017, China)
Abstract: In order to improve the management effect of multimodal data, improve data access speed and reduce database load, a multimodal data hierarchical caching system based on recurrent neural networks is designed. In the DRAM/NVM hybrid memory module, DRAM is used to cache the main memory NVM. When there is a cache loss in DRAM, the high?speed acquisition card built?in in the access monitoring module is used to collect the historical access records of frequently accessed 4 KB data blocks on NVM. The historical access records are encoded as access vectors to construct a training set, which is used as input for the long short term memory network (LSTM) to predict access frequency. In the cache filtering module, the 4 KB multimodal data with predicted access frequency exceeding the set threshold is read into DRAM for caching. The experimental results show that the designed system can minimize the bandwidth usage of the system, and has low TLB miss rate, high cache execution efficiency, and significant caching advantages when facing large pages.
Keywords: multimodal data; hierarchical caching; recurrent neural network; long short term memory network; DRAM; NVM; access frequency
0" 引" 言
多模態(tài)數(shù)據(jù)是指由多種不同的數(shù)據(jù)模態(tài)組成的數(shù)據(jù)[1?3],這些模態(tài)可以是文本、圖像、音頻、視頻等不同類(lèi)型。多模態(tài)數(shù)據(jù)的出現(xiàn)源于多種信息源和感知方式,每種模態(tài)都有獨(dú)特的特性和表達(dá)方式,可以提供更豐富、全面的信息,有助于提高數(shù)據(jù)的表達(dá)和傳輸效果[4?5]。但多模態(tài)數(shù)據(jù)具有較大數(shù)據(jù)量和復(fù)雜的特征,直接處理會(huì)消耗大量計(jì)算資源和時(shí)間。通過(guò)將多模態(tài)數(shù)據(jù)緩存在內(nèi)存中,可以減少對(duì)原始數(shù)據(jù)的重復(fù)訪問(wèn)和計(jì)算,提高數(shù)據(jù)處理的效率。同時(shí),通過(guò)合理地設(shè)計(jì)緩存策略,可以根據(jù)數(shù)據(jù)的訪問(wèn)頻率和重要程度進(jìn)行分層存儲(chǔ),提高緩存的命中率,從而進(jìn)一步優(yōu)化數(shù)據(jù)處理的性能[6]。為此,設(shè)計(jì)有效的多模態(tài)數(shù)據(jù)的緩存系統(tǒng)具有重要的現(xiàn)實(shí)意義。
文獻(xiàn)[7]研究了支持海量小文件的多模態(tài)數(shù)據(jù)的緩存系統(tǒng),其使用可擴(kuò)展哈希函數(shù)來(lái)構(gòu)建多模態(tài)數(shù)據(jù)的緩存桶,通過(guò)MWHC哈希函數(shù)存儲(chǔ)多模態(tài)數(shù)據(jù)位置索引信息,只需提取緩存桶中索引信息,便可實(shí)現(xiàn)多模態(tài)數(shù)據(jù)訪問(wèn),提高數(shù)據(jù)訪問(wèn)效率,并設(shè)置用于區(qū)分不同模態(tài)數(shù)據(jù)的標(biāo)識(shí)列,提升緩存數(shù)據(jù)的管理效果。但該系統(tǒng)僅適用于小文件,面對(duì)海量數(shù)據(jù)的緩存效果不太理想;同時(shí),可擴(kuò)展哈希函數(shù)的沖突情況可能會(huì)導(dǎo)致某些緩存桶中的數(shù)據(jù)量不均衡,影響緩存性能。文獻(xiàn)[8]設(shè)計(jì)一種基于聯(lián)盟鏈的多模態(tài)數(shù)據(jù)邊緣緩存系統(tǒng),其利用邊緣設(shè)備實(shí)現(xiàn)大范圍數(shù)據(jù)共享,并以最大收益為目標(biāo),結(jié)合貪婪算法確定緩存內(nèi)容放置的位置,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)緩存。但當(dāng)多個(gè)邊緣設(shè)備緩存相同的數(shù)據(jù)時(shí),需要確保這些設(shè)備上的數(shù)據(jù)保持一致性。文獻(xiàn)[9]和文獻(xiàn)[10]分別提出基于邊緣計(jì)算和基于NVM文件系統(tǒng)的緩存系統(tǒng),前者將數(shù)據(jù)緩存問(wèn)題分解為基于啟發(fā)式ABR(自適應(yīng)比特率)感知算法的緩存放置問(wèn)題和基于低復(fù)雜度的訪問(wèn)請(qǐng)求調(diào)度問(wèn)題,提高了緩存命中率,降低了內(nèi)容訪問(wèn)延遲,但是面對(duì)數(shù)據(jù)訪問(wèn)的動(dòng)態(tài)變化并未提出針對(duì)性措施,這可能對(duì)緩存放置和訪問(wèn)請(qǐng)求調(diào)度算法的有效性帶來(lái)挑戰(zhàn)。后者通過(guò)DRAM緩存機(jī)制設(shè)計(jì)分層緩存頁(yè)面,利用RCache在后臺(tái)線程中將NVM的數(shù)據(jù)遷移到DRAM中進(jìn)行緩存,避免占用數(shù)據(jù)訪問(wèn)關(guān)鍵路徑。但頻繁的數(shù)據(jù)遷移可能導(dǎo)致DRAM緩存中的內(nèi)存碎片化,降低內(nèi)存利用率和訪問(wèn)效率。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)具有記憶性、參數(shù)共享、非線性特征學(xué)習(xí)等優(yōu)勢(shì),但是存在梯度消失和梯度爆炸問(wèn)題,而長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)作為其優(yōu)化網(wǎng)絡(luò)可有效解決該問(wèn)題。為此,本文設(shè)計(jì)了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的多模態(tài)數(shù)據(jù)層次化緩存系統(tǒng),利用LSTM來(lái)設(shè)計(jì)訪問(wèn)監(jiān)測(cè)模塊并應(yīng)用于緩存系統(tǒng),提升系統(tǒng)緩存效果。
1" 多模態(tài)數(shù)據(jù)層次化緩存系統(tǒng)
1.1" 多模態(tài)數(shù)據(jù)層次化緩存系統(tǒng)總體結(jié)構(gòu)
多模態(tài)數(shù)據(jù)層次化緩存系統(tǒng)包括DRAM/NVM混合內(nèi)存模塊、訪問(wèn)監(jiān)測(cè)模塊、緩存過(guò)濾模塊,系統(tǒng)總體結(jié)構(gòu)如圖1所示。圖1中,DRAM/NVM混合內(nèi)存模塊由動(dòng)態(tài)隨機(jī)存儲(chǔ)器(DRAM)和非易失性存儲(chǔ)器(NVM)組成,多模態(tài)數(shù)據(jù)主存NVM的緩存部分為DRAM。其中,NVM的頁(yè)面大小為2 MB,DRAM通過(guò)4 KB的大顆粒度管理方式將多模態(tài)數(shù)據(jù)的元數(shù)據(jù)直接保存在高速緩存片上,可以有效降低多模態(tài)數(shù)據(jù)的存儲(chǔ)時(shí)間[11]。當(dāng)DRAM存在緩存缺失時(shí),會(huì)調(diào)取NVM中的4 KB數(shù)據(jù)到DRAM中進(jìn)行補(bǔ)充。
針對(duì)頻繁的數(shù)據(jù)讀取工作占用大量?jī)?nèi)存問(wèn)題,系統(tǒng)中設(shè)計(jì)了緩存過(guò)濾模塊,僅針對(duì)訪問(wèn)頻率較高的NVM數(shù)據(jù)在DRAM中進(jìn)行緩存,減少DRAM與NVM之間的數(shù)據(jù)交換。在DRAM存在緩存缺失時(shí),利用訪問(wèn)監(jiān)控模塊內(nèi)置高速采集卡采集NVM上頻繁訪問(wèn)4 KB數(shù)據(jù)塊的歷史訪問(wèn)記錄,并采用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訪問(wèn)頻率預(yù)測(cè)。當(dāng)DRAM存在緩存缺失時(shí),緩存過(guò)濾模塊依據(jù)訪問(wèn)監(jiān)控模塊獲取的訪問(wèn)頻率預(yù)測(cè)結(jié)果并結(jié)合設(shè)定的閾值判斷訪問(wèn)頻率高低,將訪問(wèn)頻率預(yù)測(cè)結(jié)果高于設(shè)定閾值部分4 KB多模態(tài)數(shù)據(jù)讀取到DRAM中進(jìn)行緩存。
1.2" DRAM的數(shù)據(jù)緩存結(jié)構(gòu)
DRAM的多模態(tài)數(shù)據(jù)緩存結(jié)構(gòu)圖如圖2所示。其中,多模態(tài)數(shù)據(jù)包的緩存任務(wù)調(diào)度工作、多模態(tài)數(shù)據(jù)包緩沖存儲(chǔ)器訪問(wèn)控制工作均通過(guò)多模態(tài)數(shù)據(jù)包緩存分配單元完成,將管理后的多模態(tài)數(shù)據(jù)包傳輸至對(duì)應(yīng)網(wǎng)絡(luò)接口進(jìn)行數(shù)據(jù)包緩存排隊(duì),并通過(guò)多模態(tài)數(shù)據(jù)包隊(duì)列管控單元的調(diào)度,將多模態(tài)數(shù)據(jù)包傳輸至輸出鏈路。
多模態(tài)數(shù)據(jù)包緩存分配單元采用基于共享存儲(chǔ)的隊(duì)列緩存機(jī)制[12],為數(shù)據(jù)包隊(duì)列分配緩沖存儲(chǔ)資源,該機(jī)制將同一個(gè)緩存空間分享給全部的數(shù)據(jù)傳輸端口,緩存后的多模態(tài)數(shù)據(jù)包僅需在發(fā)送時(shí)將傳輸至同一接口的多模態(tài)數(shù)據(jù)包存儲(chǔ)地址進(jìn)行排序,形成發(fā)送隊(duì)列,按照順序進(jìn)行發(fā)送便可,具備操作簡(jiǎn)單且資源利用率高等優(yōu)勢(shì)。
多模態(tài)數(shù)據(jù)包隊(duì)列管控單元負(fù)責(zé)對(duì)傳輸至同一網(wǎng)絡(luò)接口的多模態(tài)數(shù)據(jù)包進(jìn)行緩存隊(duì)列管控,可控制多模態(tài)數(shù)據(jù)包在層次化緩存系統(tǒng)中的存儲(chǔ)位置[13?14]。該單元采用的排隊(duì)方式為輸出排隊(duì)方式,利用鏈表形式實(shí)現(xiàn)多模態(tài)數(shù)據(jù)包發(fā)送隊(duì)列管理,通過(guò)多模態(tài)數(shù)據(jù)包隊(duì)列句柄在排隊(duì)和出隊(duì)時(shí)進(jìn)行控制,句柄中有針對(duì)發(fā)送隊(duì)列頭、尾的兩個(gè)指針,當(dāng)多模態(tài)數(shù)據(jù)包發(fā)送隊(duì)列中新增排隊(duì)數(shù)據(jù)包或出隊(duì)數(shù)據(jù)包時(shí),分別需要修改尾指針和頭指針,確保先排隊(duì)先發(fā)送。依據(jù)隊(duì)列句柄對(duì)流數(shù)據(jù)包的管控過(guò)程如圖3所示。
用于記錄指針的長(zhǎng)字一和用于記錄隊(duì)列中多模態(tài)數(shù)據(jù)包數(shù)量的長(zhǎng)字二共同組建了隊(duì)列句柄,長(zhǎng)字一中記錄的頭、尾指針?lè)謩e占據(jù)指針的高16 bit和低16 bit。依據(jù)發(fā)送多模態(tài)數(shù)據(jù)包網(wǎng)絡(luò)接口編碼確定隊(duì)列句柄的保存位置。當(dāng)一個(gè)網(wǎng)絡(luò)接口接收到第一個(gè)多模態(tài)數(shù)據(jù)包,驗(yàn)證、更新數(shù)據(jù)包頭并寫(xiě)入數(shù)據(jù)包句柄后,在接收到多模態(tài)數(shù)據(jù)包時(shí)開(kāi)始寫(xiě)入隊(duì)列句柄,每次增加排隊(duì)的多模態(tài)數(shù)據(jù)包時(shí),均先改寫(xiě)上一個(gè)多模態(tài)數(shù)據(jù)包的句柄長(zhǎng)字的首字,隨后將句柄尾指針改寫(xiě)為新增多模態(tài)數(shù)據(jù)包的句柄地址,同時(shí)對(duì)句柄長(zhǎng)字二進(jìn)行加1處理,如此形成隊(duì)列句柄,完成隊(duì)列管控,再按照隊(duì)列順序進(jìn)行多模態(tài)數(shù)據(jù)包緩存。
1.3" 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的NVM訪問(wèn)頻率預(yù)測(cè)
訪問(wèn)監(jiān)測(cè)模塊利用高速采集卡采集NVM中頻繁訪問(wèn)4 KB數(shù)據(jù)塊的歷史訪問(wèn)記錄,將歷史訪問(wèn)記錄編碼為訪問(wèn)向量后構(gòu)建訓(xùn)練集,作為RNN?LSTM的輸入,實(shí)現(xiàn)NVM訪問(wèn)頻率預(yù)測(cè)。
1.3.1" NVM歷史訪問(wèn)記錄編碼
將采集到的NVM中的歷史訪問(wèn)記錄視為一種包括多個(gè)節(jié)點(diǎn)的多叉樹(shù),每個(gè)節(jié)點(diǎn)中均包含訪問(wèn)的相關(guān)信息。將NVM歷史訪問(wèn)記錄編碼成便于作為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)的格式[Sop=op0,op1,op2,…,opm-1],其中[opi]表示訪問(wèn)序列中的第[i]次訪問(wèn)編碼,[m]表示NVM歷史訪問(wèn)記錄中的訪問(wèn)次數(shù)。為此可將NVM歷史訪問(wèn)記錄多叉樹(shù)遍歷描述為:
[Sop=T2,λT1,klt;100,Hash,T=T1?T2,Materialize,T?T3,Sort,Group]" "(1)
式中:[T1]、[T2]、[T3]分別表示歷史訪問(wèn)記錄中第1、2、3次訪問(wèn)所用到的NVM源表;[λ]、“[?]”分別表示選擇和連接操作;[T]、[k]分別表示[T1]與[T2]相連接的結(jié)果、源表的主鍵。每一棵NVM歷史訪問(wèn)記錄多叉樹(shù)均可被轉(zhuǎn)換成唯一的訪問(wèn)序列[Sop];反之,[Sop]同樣可以轉(zhuǎn)換成唯一的訪問(wèn)記錄多叉樹(shù)。樹(shù)的每個(gè)葉子節(jié)點(diǎn)中均包含了NVM的源表信息。
在遍歷后NVM歷史訪問(wèn)記錄中每次訪問(wèn)都會(huì)生成訪問(wèn)序列,在此過(guò)程中需提取NVM歷史訪問(wèn)記錄中的關(guān)鍵特征,用于完成訪問(wèn)向量[v]編碼。[v]包括如下內(nèi)容:
1) 訪問(wèn)的類(lèi)型[n0]、訪問(wèn)在NVM中對(duì)應(yīng)的源表[n1];
2) 訪問(wèn)在NVM中對(duì)應(yīng)源表所設(shè)計(jì)的列[n2];
3) 訪問(wèn)對(duì)應(yīng)結(jié)果所在行的寬度均值[n3];
4) 訪問(wèn)對(duì)多模態(tài)數(shù)據(jù)的選擇率[n4]。
其中:[n0]、[n1]、[n2]分別表示訪問(wèn)多模態(tài)數(shù)據(jù)的結(jié)構(gòu);[n3]、[n4]分別表示訪問(wèn)多模態(tài)數(shù)據(jù)的規(guī)模。利用向量[Sv=v0,v1,v2,…,vm-1]表示歷史訪問(wèn)記錄,[vi]是編碼中第[i]次訪問(wèn),將向量[Sv]作為NVM歷史訪問(wèn)記錄的訪問(wèn)向量編碼結(jié)果,輸入LSTM中進(jìn)行訪問(wèn)頻率預(yù)測(cè)。
1.3.2" 基于LSTM的訪問(wèn)頻率預(yù)測(cè)
為解決RNN在處理長(zhǎng)時(shí)間依賴問(wèn)題時(shí)的梯度消失和梯度爆炸問(wèn)題[15],使得RNN能夠更好地學(xué)習(xí)并處理長(zhǎng)時(shí)間序列的NVM歷史訪問(wèn)頻率數(shù)據(jù),本文在RNN的基礎(chǔ)上增添記憶細(xì)胞和門(mén)控結(jié)構(gòu),構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型,模型中輸入門(mén)[it]、遺忘門(mén)[ft]計(jì)算公式為:
[it=σ(Wi?[ht-1,xt]+bi)ft=σ(Wf?[ht-1,xt]+bf)]" " " " "(2)
輸入門(mén)和遺忘門(mén)一起決定了新細(xì)胞的狀態(tài)信息[Ct],[Ct]與輸出門(mén)共同決定了LSTM輸出的訪問(wèn)頻率預(yù)測(cè)結(jié)果,表達(dá)式為:
[ot=σ(Wo?[ht-1,xt]+bo)ht=ot?tanh(Ct)] (3)
式中:[W]、[b]分別表示權(quán)重和偏置;下標(biāo)[i]、[f]、[o]分別對(duì)應(yīng)輸入門(mén)、遺忘門(mén)、輸出門(mén);[xt]、[ht-1]分別表示[t]時(shí)刻網(wǎng)絡(luò)輸入的訪問(wèn)向量、[t-1]時(shí)刻隱藏層的輸出結(jié)果。
將NVM歷史訪問(wèn)記錄編碼向量作為L(zhǎng)STM模型的輸入數(shù)據(jù),有效地利用LSTM的特性來(lái)捕捉數(shù)據(jù)訪問(wèn)的時(shí)間序列依賴性,實(shí)現(xiàn)訪問(wèn)頻率預(yù)測(cè)。結(jié)合設(shè)定的閾值判斷NVM多模態(tài)數(shù)據(jù)訪問(wèn)頻率,將訪問(wèn)頻率預(yù)測(cè)結(jié)果高于設(shè)定閾值部分4 KB多模態(tài)數(shù)據(jù)讀取到DRAM中進(jìn)行緩存,減少不必要的緩存替換操作,從而提高系統(tǒng)的性能和效率。
2" 實(shí)驗(yàn)與結(jié)果分析
為驗(yàn)證本文系統(tǒng)的緩存性能,采用NVMain局部?jī)?nèi)存模擬器對(duì)系統(tǒng)的緩存性能進(jìn)行模擬,主要模擬本文系統(tǒng)DRAM和NVM內(nèi)存的訪問(wèn)行為,并結(jié)合全局模擬器模擬生成不同分布情況和訪問(wèn)模式的多模態(tài)數(shù)據(jù),用于系統(tǒng)緩存實(shí)驗(yàn),同時(shí)模擬系統(tǒng)各功能模塊的應(yīng)用情況,如隊(duì)列管理等。本文系統(tǒng)的配置情況如表1所示。
本文系統(tǒng)在進(jìn)行多模態(tài)數(shù)據(jù)緩存時(shí),引入了緩存過(guò)濾模塊來(lái)降低系統(tǒng)的帶寬占用情況,便于增加系統(tǒng)緩存速度。為驗(yàn)證本文系統(tǒng)的帶寬占用管控情況,以100 s為一個(gè)時(shí)間周期,記錄緩存過(guò)濾模塊加入前后系統(tǒng)的帶寬占用情況,結(jié)果如圖4所示。
分析圖4數(shù)據(jù)可知:在加入緩存過(guò)濾模塊前,系統(tǒng)在實(shí)驗(yàn)初始階段的帶寬占用為20%左右,隨著時(shí)間的推移,系統(tǒng)訪問(wèn)緩存的特征發(fā)生變化,帶寬占用情況也快速上升,且在短時(shí)間內(nèi)便達(dá)到100%帶寬占用,此時(shí)極易引發(fā)緩存系統(tǒng)癱瘓;而應(yīng)用緩存過(guò)濾模塊后,可依據(jù)設(shè)定的閾值以及訪問(wèn)監(jiān)控模塊應(yīng)用LSTM神經(jīng)網(wǎng)絡(luò)獲取的訪問(wèn)頻率預(yù)測(cè)結(jié)果,將訪問(wèn)頻率高于設(shè)定閾值部分?jǐn)?shù)據(jù)進(jìn)行緩存,由此可有效控制系統(tǒng)的帶寬占用情況,使其始終保持在一個(gè)較低水平。綜上分析可知,本文系統(tǒng)引入緩存過(guò)濾模塊可最大程度降低系統(tǒng)帶寬占用情況,提升系統(tǒng)在多模態(tài)數(shù)據(jù)層次化緩存中的應(yīng)用效果。
TLB(Translation Lookaside Buffer)是一種小型的、高速的緩存,用于存儲(chǔ)最近使用過(guò)的虛擬到物理地址的映射。由于TLB的大小有限,它不能存儲(chǔ)所有的映射關(guān)系,因此當(dāng)系統(tǒng)嘗試訪問(wèn)一個(gè)沒(méi)有存儲(chǔ)在TLB中的虛擬地址時(shí),就會(huì)導(dǎo)致TLB缺失。TLB缺失率的高低會(huì)直接影響系統(tǒng)的性能,如果缺失率很高,系統(tǒng)將頻繁地訪問(wèn)更慢的內(nèi)存層次結(jié)構(gòu)來(lái)獲取地址轉(zhuǎn)換信息,這會(huì)降低系統(tǒng)緩存效率。因此,降低TLB缺失率是衡量緩存系統(tǒng)性能的一個(gè)重要目標(biāo)。為此,選取文獻(xiàn)[7]、文獻(xiàn)[9]中的系統(tǒng)作為對(duì)比系統(tǒng),統(tǒng)計(jì)不同頁(yè)面大小時(shí)的TLB缺失率情況,結(jié)果如圖5所示。
分析圖5可知,隨著指令數(shù)量的增加,三種緩存系統(tǒng)的TLB缺失率均有所增加。原因在于TLB覆蓋的虛擬地址空間變得更加稀疏,導(dǎo)致缺失率上升。但是相對(duì)于兩種傳統(tǒng)系統(tǒng),本文系統(tǒng)的TLB缺失率始終未超過(guò)5%,但兩種對(duì)比系統(tǒng)在指令數(shù)超過(guò)1 000條時(shí),TLB缺失率已經(jīng)超過(guò)35%,此時(shí)這兩種系統(tǒng)緩存執(zhí)行效率較低。綜上可知,本文系統(tǒng)具備較好的緩存執(zhí)行效率,且面對(duì)大頁(yè)面時(shí)具備顯著緩存優(yōu)勢(shì)。
3" 結(jié)" 論
本文利用循環(huán)神經(jīng)網(wǎng)絡(luò)中LSTM的預(yù)測(cè)優(yōu)勢(shì),將其應(yīng)用到多模態(tài)數(shù)據(jù)層次化緩存系統(tǒng)的訪問(wèn)監(jiān)測(cè)模塊中,用于對(duì)NVM主存的訪問(wèn)頻率預(yù)測(cè),更好地進(jìn)行緩存過(guò)濾,避免DRAM在進(jìn)行多模態(tài)數(shù)據(jù)緩存時(shí)頻繁的數(shù)據(jù)讀取工作占用大量?jī)?nèi)存的問(wèn)題。經(jīng)實(shí)驗(yàn)驗(yàn)證,將基于LSTM神經(jīng)網(wǎng)絡(luò)獲取的訪問(wèn)頻率預(yù)測(cè)結(jié)果高于設(shè)定閾值部分的4 KB多模態(tài)數(shù)據(jù)讀取到DRAM中進(jìn)行緩存,可有效控制系統(tǒng)的帶寬占用情況,使其始終保持在一個(gè)較低水平。
參考文獻(xiàn)
[1] 王波,王紅霞,姚良忠,等.電力系統(tǒng)多模態(tài)數(shù)據(jù)融合模式及關(guān)鍵技術(shù)問(wèn)題[J].電力系統(tǒng)自動(dòng)化,2022,46(19):188?199.
[2] 肖萍,劉荊欣,王妍,等.一種視頻多模態(tài)數(shù)據(jù)自適應(yīng)采集策略[J].小型微型計(jì)算機(jī)系統(tǒng),2023,44(2):383?391.
[3] 李立柱,孟明,高云園,等.基于小波變換的EEG?fNIRS多模態(tài)數(shù)據(jù)融合方法[J].傳感技術(shù)學(xué)報(bào),2023,36(7):1064?1072.
[4] 余輝,梁鎮(zhèn)濤,鄢宇晨.多來(lái)源多模態(tài)數(shù)據(jù)融合與集成研究進(jìn)展[J].情報(bào)理論與實(shí)踐,2020,43(11):169?178.
[5] 王勁林,井麗南,陳曉,等.面向多模態(tài)網(wǎng)絡(luò)的可編程數(shù)據(jù)處理方法及系統(tǒng)設(shè)計(jì)[J].通信學(xué)報(bào),2022,43(4):14?25.
[6] 馬亞軍,孔令信.基于動(dòng)態(tài)反饋的多源數(shù)據(jù)庫(kù)緩存沖突處理仿真[J].計(jì)算機(jī)仿真,2022,39(1):432?436.
[7] 曾夢(mèng),鄒北驥,張文生,等.多模態(tài)醫(yī)療數(shù)據(jù)中海量小文件存儲(chǔ)優(yōu)化方法[J].軟件學(xué)報(bào),2023,34(3):1451?1469.
[8] 楊帆,姜靜,杜劍波,等.基于聯(lián)盟鏈的邊緣緩存系統(tǒng)收益最大化的緩存策略[J].計(jì)算機(jī)應(yīng)用研究,2023,40(8):2447?2451.
[9] XIA X, CHEN F, HE Q, et al. Online collaborative data caching in edge computing [J]. IEEE transactions on parallel and distributed systems, 2021, 32(2): 281?294.
[10] TU Y F, ZHU B H, YANG H Z, et al. RCache: a read?intensive workload?aware page cache for NVM filesystem [J]. ZTE technology: English version, 2023, 21(1): 89?94.
[11] 駱克云,葉保留,唐斌,等.基于增量學(xué)習(xí)的RocksDB鍵值系統(tǒng)主動(dòng)緩存機(jī)制[J].計(jì)算機(jī)應(yīng)用,2020,40(2):321?327.
[12] 李楊,閻志遠(yuǎn),戴琳琳.鐵路客票系統(tǒng)自主化數(shù)據(jù)庫(kù)數(shù)據(jù)同步技術(shù)研究[J].計(jì)算機(jī)應(yīng)用研究,2020,37(z1):175?176.
[13] 丁遠(yuǎn).煤礦安全監(jiān)控系統(tǒng)多線程雙數(shù)據(jù)緩存數(shù)據(jù)處理技術(shù)[J].煤礦安全,2021,52(4):152?155.
[14] 王緒亮,聶鐵錚,唐欣然,等.流式數(shù)據(jù)處理的動(dòng)態(tài)自適應(yīng)緩存策略研究[J].計(jì)算機(jī)科學(xué),2020,47(11):122?127.
[15] 丁尹,桑楠,李曉瑜,等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)的電信行業(yè)容量數(shù)據(jù)預(yù)測(cè)方法[J].計(jì)算機(jī)應(yīng)用,2021,41(8):2373?2378.
作者簡(jiǎn)介:張" 燕(1978—),女,甘肅天水人,博士研究生,副教授,研究方向?yàn)橛?jì)算機(jī)應(yīng)用。