亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于混合索引的HDFS 小文件存儲(chǔ)策略

        2015-12-15 10:30:24熊安萍
        關(guān)鍵詞:內(nèi)存客戶端標(biāo)簽

        熊安萍,黃 容,鄒 洋

        (重慶郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶400065)

        0 引言

        在互聯(lián)網(wǎng)飛速發(fā)展、數(shù)據(jù)量暴增的時(shí)代,各種分布式文件系統(tǒng)[1]應(yīng)運(yùn)而生,如GlusterFS,Lustre,GoogleFS,HDFS等。分布式文件系統(tǒng)(hadoop distributed file system,HDFS)[2-3]作為Hadoop的分布式文件系統(tǒng),憑借其高可靠性、高擴(kuò)展性、高效性、高吞吐率等優(yōu)勢(shì)在互聯(lián)網(wǎng)領(lǐng)域得到了廣泛研究和應(yīng)用。但其也存在一些不足之處,如:元數(shù)據(jù)服務(wù)器節(jié)點(diǎn)單點(diǎn)故障、負(fù)載均衡能力不足、小文件存儲(chǔ)及處理問(wèn)題等。

        當(dāng)前HDFS中,小文件存儲(chǔ)和讀取效率普遍不高,過(guò)多小文件元數(shù)據(jù)占用元數(shù)據(jù)服務(wù)器節(jié)點(diǎn)Nam-eNode的內(nèi)存開銷;小文件合并方案中小文件到大文件的映射記錄量太大,導(dǎo)致從合并文件中訪問(wèn)小文件的效率不高及訪問(wèn)小文件時(shí)NameNode負(fù)載過(guò)大;小文件塊內(nèi)索引訪問(wèn)效率不高。針對(duì)以上問(wèn)題,本文提出一種更有利于小文件存儲(chǔ)和讀取的優(yōu)化存儲(chǔ)策略。該存儲(chǔ)策略應(yīng)用分類器分類標(biāo)記小文件,同一標(biāo)簽的小文件合并為一個(gè)大文件,既充分利用Hadoop平臺(tái)大文件存儲(chǔ)處理優(yōu)勢(shì),也減少了元數(shù)據(jù)數(shù)目;設(shè)計(jì)了混合索引機(jī)制,即對(duì)服務(wù)端的小文件標(biāo)簽及小文件與塊的映射建立H-B+樹索引,以及對(duì)塊內(nèi)小文件建立不同的塊內(nèi)索引,以提高小文件的訪問(wèn)效率,一定程度節(jié)省索引文件存儲(chǔ)空間;實(shí)現(xiàn)中采用緩存結(jié)構(gòu),以提高客戶端訪問(wèn)請(qǐng)求的響應(yīng)速度及減小元數(shù)據(jù)服務(wù)器的負(fù)載。

        1 相關(guān)工作

        HDFS作為Google公司GoogleFS的開源實(shí)現(xiàn)[2],是以流式數(shù)據(jù)訪問(wèn)模式存儲(chǔ)超大文件的文件系統(tǒng),可運(yùn)行在普通硬件集群上。

        1.1 HDFS中小文件處理缺陷

        1)元數(shù)據(jù)服務(wù)器NameNode內(nèi)存開銷大。NameNode將文件系統(tǒng)元數(shù)據(jù)放置于內(nèi)存,一般而言,每一個(gè)文件、文件夾或Block需要占據(jù)150 Byte左右的內(nèi)存空間,如果有100萬(wàn)個(gè)文件,則至少需要300 MByte內(nèi)存。如果面對(duì)海量小文件,當(dāng)前的硬件無(wú)法滿足內(nèi)存需求。

        2)小文件存儲(chǔ)和讀取效率不佳。HDFS利于大吞吐量數(shù)據(jù)處理,以一定延時(shí)為代價(jià)[4]。HDFS集群存儲(chǔ)10 000 MByte大文件的速度比存儲(chǔ)10 000 MByte小文件的速度要快得多。

        1.2 相關(guān)研究

        對(duì)于HDFS小文件問(wèn)題,目前已經(jīng)有多種解決方案,其核心都是將小文件合并為大文件,通過(guò)減少文件個(gè)數(shù)以減少元數(shù)據(jù)大小,同時(shí)為小文件建立索引以提高訪問(wèn)效率[5]。

        文獻(xiàn)[6-9]是HDFS自身提供的解決方案。Hadoop Archive[6]將多個(gè)小文件打包成一個(gè)HAR文件存儲(chǔ),通過(guò)減少文件個(gè)數(shù),緩解了NameNode內(nèi)存的壓力。Sequence File[7]由二進(jìn)制對(duì)組成,其中key為小文件名,value為小文件內(nèi)容。CombineFileInput-Format[8]將多個(gè)小文件合并成一個(gè)單獨(dú)的split,并且考慮數(shù)據(jù)的存儲(chǔ)位置,解決了大量小文件造成Maptask過(guò)多而降低整體性能的問(wèn)題。MapFile[9]是一種有索引的按key排序的SequenceFile,讀取性能有所提高。

        文獻(xiàn)[10-13]針對(duì)特定應(yīng)用場(chǎng)景的解決方案。劉旭輝等[10]結(jié)合WebGIS數(shù)據(jù)的相關(guān)特征,將相鄰地理位置的小文件合并,并為這些文件構(gòu)建全局的hash索引,有效提高了小文件的訪問(wèn)效率。鄭慶華等[11]針對(duì)BlueSky的PPT文件,將屬于同一課件的小文件合并,從而減輕NameNode的壓力,提出了一種兩級(jí)預(yù)取機(jī)制以提高小文件的讀取效率。趙躍龍等[12]提出的優(yōu)化的小文件存儲(chǔ)策略,把邏輯上連續(xù)的數(shù)據(jù)在物理空間上連續(xù)存放以提高預(yù)讀數(shù)據(jù)的命中率,減少磁盤尋道時(shí)間,通過(guò)使用cache充當(dāng)元數(shù)據(jù)服務(wù)器的角色和簡(jiǎn)化文件信息節(jié)點(diǎn)的方式提高I/O性能。CHANDRASEKAR S等[13]合并小文件時(shí)由客戶指定要合并的小文件名及文件間的關(guān)系,建立索引機(jī)制,采用預(yù)取機(jī)制,以減少元數(shù)據(jù)讀取時(shí)間,提高I/O性能。

        2 基于混合索引的小文件存儲(chǔ)策略

        本文基于混合索引的小文件存儲(chǔ)策略(small files storage based on hybrid index,SFSHI),針對(duì)小文件的存儲(chǔ)策略,設(shè)計(jì)混合索引機(jī)制,實(shí)現(xiàn)中采用三級(jí)緩存結(jié)構(gòu)。

        2.1 小文件存儲(chǔ)架構(gòu)

        本文小文件存儲(chǔ)策略架構(gòu)如圖1所示。在Client客戶端的本地存儲(chǔ)中,應(yīng)用一個(gè)分類器來(lái)對(duì)小文件進(jìn)行分類標(biāo)記,分類規(guī)則可由用戶定義,根據(jù)實(shí)際系統(tǒng)需求,分類規(guī)則可以按業(yè)務(wù)或按客戶群體等來(lái)分別定義,分類后同一類型小文件具有相同標(biāo)簽。同一標(biāo)簽中的小文件進(jìn)一步按照大小分類,小文件大小為1-1023 KByte,為K級(jí)文件,1-64 MByte為M級(jí)文件,同一標(biāo)簽的同級(jí)文件合并為一個(gè)大文件,合并時(shí)滿一個(gè)塊提交一次,同時(shí)保證小文件不跨2個(gè)數(shù)據(jù)塊,并根據(jù)文件大小建立合適的塊內(nèi)索引,同數(shù)據(jù)塊一起存儲(chǔ)到DataNode中。在NameNode中存儲(chǔ)小文件標(biāo)簽索引和小文件與塊的映射索引。

        2.2 混合索引策略設(shè)計(jì)

        結(jié)合散列索引快速定位的特點(diǎn)和樹型結(jié)構(gòu)的搜索路徑短、可動(dòng)態(tài)增長(zhǎng)的特點(diǎn),散列與樹結(jié)構(gòu)的混合索引策略被廣泛研究及應(yīng)用。本文在小文件分類標(biāo)記的場(chǎng)景下,改進(jìn)混合索引策略,結(jié)合三級(jí)緩存結(jié)構(gòu),提高小文件的訪問(wèn)及處理效率。

        本文小文件存儲(chǔ)架構(gòu)中設(shè)計(jì)的混合索引策略如圖2所示。NameNode服務(wù)端建立基于小文件標(biāo)簽的散列索引和桶內(nèi)小文件與塊的映射(簡(jiǎn)稱小文件映射)的B+樹索引,DataNode數(shù)據(jù)端根據(jù)所存儲(chǔ)小文件的大小,有區(qū)別的建立合適的塊內(nèi)索引,以實(shí)現(xiàn)小文件高效快速的訪問(wèn)。

        圖1 小文件存儲(chǔ)架構(gòu)圖Fig.1 Small files storage architecture

        圖2 混合索引策略Fig.2 Hybrid index strategy

        本文混合索引策略中,由于小文件標(biāo)簽和小文件映射動(dòng)態(tài)增長(zhǎng),對(duì)上層的小文件標(biāo)簽建立基于小文件標(biāo)簽的可擴(kuò)展散列索引??蓴U(kuò)展散列可節(jié)省空間,當(dāng)索引項(xiàng)增長(zhǎng)時(shí),動(dòng)態(tài)分配桶,雖然需要維護(hù)桶地址表,這一額外開銷影響非常小,我們可以忽略。傳統(tǒng)的散列索引結(jié)構(gòu)為了提高數(shù)據(jù)映射的隨機(jī)性,相鄰數(shù)據(jù)項(xiàng)在索引項(xiàng)的位置是離散的,這不利于小文件映射記錄的局部性訪問(wèn)。本文提出基于文件標(biāo)簽的散列索引,除了保持散列索引的處理速度、存儲(chǔ)空間的優(yōu)勢(shì),還能有效提高緩存命中率。該索引結(jié)構(gòu)的主要思路是根據(jù)小文件所屬標(biāo)簽,使用文件標(biāo)簽代替數(shù)據(jù)項(xiàng)作為索引單元,保證同一標(biāo)簽的文件映射記錄被映射到同一個(gè)桶中,訪問(wèn)文件映射記錄時(shí),其緩存命中率有所提高,從而使小文件達(dá)到更高的訪問(wèn)效率。

        下層的小文件映射采用B+樹結(jié)構(gòu),由于小文件映射記錄海量且要適應(yīng)多個(gè)客戶端并發(fā)請(qǐng)求,NameNode內(nèi)存不能承擔(dān)載如此大的負(fù)載,所以小文件映射只能存儲(chǔ)在磁盤上,需按文件塊讀取到內(nèi)存。要有效查詢小文件映射,必須減少磁盤訪問(wèn)次數(shù),而B+樹索引具有搜索路徑短的特點(diǎn),適合作為小文件映射的索引結(jié)構(gòu)。B+樹索引的搜索路徑小于[log[n/2](K)](n為結(jié)點(diǎn)的階,K為索引項(xiàng)的總數(shù)量)。例如,結(jié)點(diǎn)的大小一般為磁盤塊大小(4 KByte),如果搜索碼大小為32 Byte,n=4×210/32=100,如果索引項(xiàng)有1 000 000個(gè),一次查詢?cè)L問(wèn)磁盤次數(shù)為log[100/2](1 000 000)=4次。再加上緩存的作用,訪問(wèn)磁盤的次數(shù)更少。

        DataNode的塊內(nèi)索引,根據(jù)數(shù)據(jù)塊所存儲(chǔ)小文件的大小,有區(qū)別地建立合適的索引,既能節(jié)省索引文件的存儲(chǔ)空間,又能充分利用高速緩存的作用,有效提高小文件塊內(nèi)索引的查詢效率。因?yàn)镠DFS有一次寫入多次讀取的特點(diǎn),數(shù)據(jù)塊一旦建立修改操作較少,則塊內(nèi)索引的變化和增加較少,因此都采用順序索引。小文件大小為1-1 023 KByte,為K級(jí)文件,1-64 MByte為M級(jí)文件,K級(jí)文件最壞情況下索引項(xiàng)有220個(gè),M級(jí)文件最壞情況下索引項(xiàng)有26個(gè),索引項(xiàng)數(shù)量達(dá)到214倍的差別,有區(qū)別地建立索引是有必要的。M級(jí)文件的塊內(nèi)索引的索引項(xiàng)較少,選擇線性索引結(jié)構(gòu),實(shí)現(xiàn)簡(jiǎn)單,沒(méi)有節(jié)點(diǎn)和數(shù)據(jù)項(xiàng)的指針,節(jié)省存儲(chǔ)空間,塊內(nèi)索引項(xiàng)大小為12 Byte,則M級(jí)文件的塊內(nèi)索引文件大小64×12=768 Byte,文件非常小,可以直接加載到數(shù)據(jù)端緩存,能保證緩存命中率。K級(jí)文件的索引項(xiàng)較多,采用CST樹(cache sensitive T-tree)結(jié)構(gòu)。CST樹對(duì)所有節(jié)點(diǎn)進(jìn)行分組,分組大小根據(jù)緩存容量而定,組內(nèi)的多個(gè)節(jié)點(diǎn)采用數(shù)組結(jié)構(gòu)連續(xù)存儲(chǔ)。通過(guò)只保存節(jié)點(diǎn)的最大關(guān)鍵字,以及減少節(jié)點(diǎn)組內(nèi)節(jié)點(diǎn)間的指針,以減少節(jié)點(diǎn)組的存儲(chǔ)容量,并且節(jié)點(diǎn)組大小不大于緩存的容量,則每次從內(nèi)存可以讀入一個(gè)完整的節(jié)點(diǎn)組到緩存,這樣有效提高節(jié)點(diǎn)組內(nèi)關(guān)鍵字的緩存命中率,只有查詢節(jié)點(diǎn)組外的關(guān)鍵字時(shí)才會(huì)發(fā)生命中失敗。文獻(xiàn)[14]實(shí)驗(yàn)結(jié)果表明,CST樹在查詢速度和cache命中率方面比CSB樹和B+樹的性能都好,雖然CST樹在修改時(shí)效率不高,但對(duì)于相對(duì)比較靜態(tài)的塊內(nèi)索引,CST是最合適的選擇。

        2.3 三級(jí)緩存結(jié)構(gòu)

        三級(jí)緩存結(jié)構(gòu)分別為:NameNode服務(wù)端緩存、DataNode數(shù)據(jù)端緩存、客戶端緩存。

        服務(wù)端緩存小文件標(biāo)簽的散列索引,客戶端訪問(wèn)小文件時(shí),NameNode通過(guò)散列函數(shù)計(jì)算出所在標(biāo)簽桶,首先在服務(wù)端緩存查詢標(biāo)簽桶的存儲(chǔ)地址。再由標(biāo)簽桶中小文件映射索引查找出該小文件所在的小文件映射索引塊,將該索引塊返回給客戶端,并加入到客戶端緩存,客戶端進(jìn)行訪問(wèn)小文件時(shí),首先在客戶端緩存中查找小文件映射,從而減少與NameNode的交互次數(shù)。數(shù)據(jù)端緩存則緩存小文件的塊內(nèi)索引,以有效提高小文件塊內(nèi)的訪問(wèn)效率。

        3 SFSHI策略實(shí)現(xiàn)

        本文小文件存儲(chǔ)策略中,Client客戶端完成小文件標(biāo)記與合并、與DataNode之間的數(shù)據(jù)傳輸。NameNode服務(wù)器負(fù)責(zé)處理客戶端請(qǐng)求、標(biāo)簽索引管理、小文件映射索引管理。DataNode負(fù)責(zé)完成數(shù)據(jù)存儲(chǔ)和讀取操作、小文件塊內(nèi)索引管理、本身所存儲(chǔ)數(shù)據(jù)塊的管理。

        3.1 小文件存儲(chǔ)流程

        本文的小文件存儲(chǔ)流程如圖3所示。

        圖3 存儲(chǔ)流程圖Fig.3 Storage process

        當(dāng)客戶端中某標(biāo)簽小文件的數(shù)據(jù)塊已滿,調(diào)用存儲(chǔ)小文件的方法writeSF,DataNode服務(wù)器添加接收小文件并更新元數(shù)據(jù)的方法receiveSF。方法描述為

        3.2 小文件讀取流程

        本文的小文件讀取流程如圖4所示。

        圖4 讀取流程圖Fig.4 Access process

        客戶端添加小文件讀取方法readSF,獲取小文件的所在blockId及DataNode列表。DataNode上添加方法querySF,讀取小文件塊內(nèi)索引及小文件內(nèi)容并返回。方法描述為

        4 實(shí)驗(yàn)與結(jié)果分析

        4.1 實(shí)驗(yàn)環(huán)境

        實(shí)驗(yàn)環(huán)境搭建了12個(gè)節(jié)點(diǎn)的Hadoop集群,每個(gè)節(jié)點(diǎn)的配置為:6核Intel Xeon CPU 2.4 GHz,8 GByte內(nèi)存,10 TByte硬盤。網(wǎng)絡(luò)環(huán)境是千兆光纖。其中一臺(tái)機(jī)器作NameNode,一臺(tái)作SecondNameNode,12臺(tái)機(jī)器全部作DataNode。每臺(tái)節(jié)點(diǎn)安裝的操作系統(tǒng)為Cent OS5.4,Hadoop版本為cdh3u6,JDK的版本為1.6.0_35。

        4.2 數(shù)據(jù)集

        實(shí)驗(yàn)數(shù)據(jù)是大量小文件,小文件格式有圖片、文本文件、二進(jìn)制文件。數(shù)據(jù)來(lái)源為某電信公司營(yíng)業(yè)終端服務(wù)與集約化管理平臺(tái)各客戶端產(chǎn)生的操作日志文件及用戶數(shù)據(jù),其中,操作日志文件大小為1-300 KByte,用戶數(shù)據(jù)文件大小為1-4 MByte,該平臺(tái)每天產(chǎn)生約210 000個(gè)小文件,文件總量約40 GByte。這些數(shù)據(jù)海量,且都是大小集中在1 KByte-4 MByte的小文件。測(cè)試用到的文件集合共435 462個(gè)文件,總量為89.4 GByte,小文件大小分布如圖5所示。

        圖5 小文件大小分布Fig.5 Distribution of small file size

        4.3 實(shí)驗(yàn)對(duì)比

        在集群上部署Ganglia集群監(jiān)控系統(tǒng),它可以提供準(zhǔn)確而有效的實(shí)驗(yàn)結(jié)果來(lái)對(duì)實(shí)驗(yàn)進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)對(duì)比的主要指標(biāo)是:NameNode的內(nèi)存開銷,讀取小文件的時(shí)間開銷。

        從存儲(chǔ)435 462小文件的集群中,讀取6組不同數(shù)量的小文件,每組進(jìn)行10次實(shí)驗(yàn),對(duì)實(shí)驗(yàn)結(jié)果取平均值。對(duì)HDFS原小文件存儲(chǔ)策略和基于混合索引的小文件存儲(chǔ)策略2種測(cè)試環(huán)境下讀取文件的耗時(shí)和內(nèi)存開銷進(jìn)行統(tǒng)計(jì)。

        小文件讀取時(shí)間開銷對(duì)比如圖6所示。圖6結(jié)果表明,基于混合索引的小文件存儲(chǔ)策略讀取小文件的速度比HDFS原方案讀取速度快得多。

        圖6 小文件讀取時(shí)間開銷對(duì)比Fig.6 Time cost comparison when accessing small files

        小文件讀取時(shí),NameNode的內(nèi)存開銷對(duì)比如圖7所示,結(jié)果表明,基于混合索引的小文件存儲(chǔ)策略中NameNode的內(nèi)存占用率大大減少。SFSHI策略中NameNode內(nèi)存只存儲(chǔ)合并后大文件標(biāo)簽元數(shù)據(jù),并且將大文件標(biāo)簽索引加載到NameNode緩存,小文件映射索引存儲(chǔ)在NameNode磁盤上;同時(shí),如果所訪問(wèn)的小文件映射在客戶端緩存命中,則可以減少與NameNode的交互,所以SFSHI策略能顯著降低NameNode的內(nèi)存開銷。

        圖7 內(nèi)存開銷對(duì)比Fig.7 Memory overhead comparison

        綜上所述,基于混合索引的小文件存儲(chǔ)策略SFSHI對(duì)同一標(biāo)簽的小文件作為一個(gè)大文件存儲(chǔ)管理,同時(shí)采用的服務(wù)端緩存和客戶端緩存,減少了NameNode的內(nèi)存開銷;針對(duì)本文小文件存儲(chǔ)策略,合理地采用三級(jí)緩存和混合索引策略,在一定程度上減少了索引文件存儲(chǔ)空間,同時(shí)有效提高了小文件的讀取效率。

        5 結(jié)語(yǔ)

        本文分析了HDFS中小文件處理機(jī)制,針對(duì)小文件過(guò)多時(shí)占用NameNode內(nèi)存開銷、從合并文件中訪問(wèn)小文件的效率不高等問(wèn)題,給出了一個(gè)基于混合索引的小文件存儲(chǔ)策略,該存儲(chǔ)策略核心在于應(yīng)用分類器分類標(biāo)記小文件,同一標(biāo)簽的小文件作為一個(gè)大文件存儲(chǔ)管理,減少了元數(shù)據(jù)數(shù)目;針對(duì)本文中小文件存儲(chǔ)策略,設(shè)計(jì)了混合索引機(jī)制,提高了小文件訪問(wèn)效率,實(shí)現(xiàn)中采用緩存結(jié)構(gòu),同時(shí)也解決了NameNode內(nèi)存負(fù)載問(wèn)題。實(shí)驗(yàn)及結(jié)果表明,本文小文件存儲(chǔ)策略能有效提高海量小文件的訪問(wèn)效率,并大大減小NameNode的內(nèi)存負(fù)載。

        [1]郝杰,逯彥博,劉鑫吉,等.分布式存儲(chǔ)中的再生碼綜述[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2013,25(1):30-38.

        HAO Jie,LU Yanbo,LIU Xinji,et al.Survey for regenerating codes for distributed storage[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2013,25(1):30-38.

        [2]TOM White.Hadoop:The Definitive Guide[M].2nd ed.O’Reilly Media,Inc,2011.

        [3]ARMBRUST M,F(xiàn)OX A,GRIFFITH R,et al.Above the Clouds:A Berkeley View of Cloud Computing[D].Berkeley:UCB/EECS-2009-28,EECS Department,University of California,Berkeley,2009.

        [4]王鈴惠,李小勇,張軼彬.海量小文件存儲(chǔ)文件系統(tǒng)研究綜述[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(8):106-109.

        WANG Linghui,LI Xiaoyong,ZHANG Yibin.Mass Small-File Storage File System Research Overview[J].Computer Applications and Software,2012,29(8):106-109.

        [5]TOM White.The Small Files Problem[EB/OL].(2009-02-02)[2013-12-10].http://www.cloudera.com/blog/2009/02/02/the-small-files-problem/.

        [6]HADOOP.Hadoop Archives[EB/OL].(2013-04-01)[2013-12-10].http://hadoop.apache.org/docs/r-1.2.1/hadoop_archives.html.

        [7]HADOOP.Sequence File Wiki[EB/OL].(2009-09-05)[2013-12-10].http://wiki.apache.org/had-oop/SequenceFile.

        [8]CARPE Diem.Combine File Input Format[EB/OL].(2009-10-05)[2013-12-10].http://ww-w.idryman.org/blog/2013/09/22/process-small-files-on-hadoop-using-combinefileinputformat-1/.

        [9]HADOOP.Map files[EB/OL].(2013-04-15)[2013-12-10].http://hadoop.apache.org/docs/cu-rrent/api/org/apache/hadoop/io/MapFile.html.

        [10]LIU Xuhui,HAN Jizhong,ZHONG Yunqin,et al.Implementing WebGIS on Hadoop:A Case Study of Improving Small File I/O Performance on HDFS[C]//2009 IEEE International Conference on Cluster Computing and Work-shops.New Orleans:IEEE Press,2009:1-8.

        [11]DONG Bo,QIU Jie,ZHENG Qinghua,et al.A Novel Approach to Improving the Efficiency of Storing and Accessing Small Files on Hadoop:a Case Study by Power-Point Files[C]//2010 IEEE International Conference on Services Computing(SCC).Miami,F(xiàn)L:IEEE Press,2010:65-72.

        [12]趙躍龍,謝曉玲,蔡詠才,等.一種性能優(yōu)化的小文件存儲(chǔ)訪問(wèn)策略的研究[J].計(jì)算機(jī)研究與發(fā)展,2012,49(7):1579-1586.

        ZHAO Yuelong,XIE Xiaoling,CAI Yongcai,et al.A Strategy of Small File Storage Access with Performance Optimization[J].Journal of Computer Research and Development,2012,49(7):1579-1586.

        [13]CHANDRASEKAR S,DAKSHINAMURTHY R,SESHAKUMAR P G,et al.A novel indexing scheme for efficient handling of small files in Hadoop Distributed File System[C]//2013 IEEE International Conference on Computer Communication and Informatics(ICCCI).Coimbatore:IEEE Press,2013:1-8.

        [14]LEE I,LEE S,SHIM J.Making T-Trees Cache Conscious on Commodity Microprocessors[J].J Inf Sci Eng,2011,27(1):143-161.

        猜你喜歡
        內(nèi)存客戶端標(biāo)簽
        “春夏秋冬”的內(nèi)存
        無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        縣級(jí)臺(tái)在突發(fā)事件報(bào)道中如何應(yīng)用手機(jī)客戶端
        孵化垂直頻道:新聞客戶端新策略
        基于Vanconnect的智能家居瘦客戶端的設(shè)計(jì)與實(shí)現(xiàn)
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        標(biāo)簽化傷害了誰(shuí)
        基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
        基于內(nèi)存的地理信息訪問(wèn)技術(shù)
        客戶端空間數(shù)據(jù)緩存策略
        国产在线播放免费人成视频播放| 3d动漫精品啪啪一区二区下载 | 亚洲国产精品嫩草影院久久| 亚洲av一二三又爽又爽又色| 国产亚洲av成人噜噜噜他| 亚洲国产精品无码专区| 人妻在卧室被老板疯狂进入国产| 久久HEZYO色综合| 中文字幕人妻互换av| 欧美成人猛交69| 黄色毛片在线看| 亚洲国产精一区二区三区性色| 不卡av网站一区二区三区| 成人国产精品一区二区视频 | 欧美日韩视频在线第一区| 91老司机精品视频| 日韩中文字幕一区二十| 欧美v国产v亚洲v日韩九九| 欧美jizzhd精品欧美| 久久亚洲国产欧洲精品一| 日韩精品一区二区亚洲观看av| 蜜臀av色欲a片无码精品一区| 无码夜色一区二区三区| 国产一区,二区,三区免费视频| 国产一区二区长腿丝袜高跟鞋| 欧美乱人伦人妻中文字幕| 国产午夜在线观看视频播放| 亚洲美女av二区在线观看| 日本在线视频www色| 俺来也俺去啦最新在线| 欧美1区二区三区公司| 精品亚洲国产日韩av一二三四区 | 中文字幕无码不卡一区二区三区| 国产片三级视频播放| av在线高清观看亚洲| 97精品国产97久久久久久免费| 91网站在线看| 亚洲av毛片在线播放| 成熟丰满熟妇av无码区| 国产亚洲日韩欧美一区二区三区| 日韩少妇高潮在线视频|