亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        云平臺(tái)下的NoSQL分布式大數(shù)據(jù)存儲(chǔ)技術(shù)與應(yīng)用

        2016-05-14 21:12:48吳燕波薛琴向大為麥永浩
        現(xiàn)代電子技術(shù) 2016年9期
        關(guān)鍵詞:云存儲(chǔ)

        吳燕波 薛琴 向大為 麥永浩

        摘 要: 隨著移動(dòng)互聯(lián)網(wǎng)云計(jì)算、大數(shù)據(jù)的快速發(fā)展,以圖片、視頻等組成的數(shù)據(jù)存儲(chǔ)急劇增加,目前已有存儲(chǔ)方式無(wú)法滿足系統(tǒng)需要,而NoSQL分布式大數(shù)據(jù)存儲(chǔ)技術(shù)因其具有可擴(kuò)展、快速讀取、海量處理等特點(diǎn),其在云計(jì)算領(lǐng)域如雨后春筍般被廣泛應(yīng)用。采用基于Hadoop平臺(tái)和NoSQL的MongoDB數(shù)據(jù)庫(kù)技術(shù)設(shè)計(jì)非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)架構(gòu),證明云存儲(chǔ)的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)技術(shù)可緩解當(dāng)前非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)面臨的難題,提升非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)服務(wù)質(zhì)量。

        關(guān)鍵詞: Hadoop云存儲(chǔ)平臺(tái); MongoDB數(shù)據(jù)庫(kù); 非關(guān)系型數(shù)據(jù)庫(kù); 云存儲(chǔ)

        中圖分類號(hào): TN911?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)09?0044?04

        Abstract: Since the mobile Internet cloud computing and big data are rapidly developed, and data storage composed of pictures and videos is sharply increased, the existing storage methods can′t satisfy the system requirement. The NoSQL distribu?ted big data storage technology is widely used in cloud computing field due to its characteristics of extensibility, fast read speed and mass data processing. The unstructured data cloud storage architecture was designed with MongoDB database technology based on Hadoop platform and NoSQL. The unstructured data storage technology of cloud storage can alleviate the difficulties exiting in the current unstructured data storage, and improve the service quality of unstructured data storage.

        Keywords: Hadoop cloud storage platform; MongoDB database; NoSQL; cloud storage

        隨著Web 2.0技術(shù)的發(fā)展,越來(lái)越多的非結(jié)構(gòu)化數(shù)據(jù)比如文檔、圖片、音樂、視頻等產(chǎn)生。IDC研究表明:當(dāng)前企業(yè)中有80%是非結(jié)構(gòu)化數(shù)據(jù),并且以60%的增長(zhǎng)率在不斷增加。如何突破傳統(tǒng)技術(shù),實(shí)現(xiàn)大規(guī)模數(shù)據(jù)高效存儲(chǔ)和利用管理是當(dāng)前面臨的重大挑戰(zhàn)。

        1 NoSQL數(shù)據(jù)庫(kù)技術(shù)

        非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL)是一種全新的非關(guān)系型分布式存儲(chǔ)技術(shù),該數(shù)據(jù)庫(kù)數(shù)據(jù)不但包括日常的文本數(shù)據(jù),還包括如圖片、視頻、FLASH動(dòng)畫等其他數(shù)據(jù),因其具有海量存儲(chǔ)、靈活易用、高并發(fā)等特點(diǎn),可以為系統(tǒng)提供一個(gè)可擴(kuò)展的松耦合類型數(shù)據(jù)模式,該模式嚴(yán)格遵循CAP定理,能夠很好地支持非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ),滿足高并發(fā)讀寫需求,具有很好的擴(kuò)展性。

        目前的NoSQL數(shù)據(jù)存儲(chǔ)主要包括以下幾種,具體見表1。

        (1) 鍵值對(duì)存儲(chǔ)。通過對(duì)提供的鍵值對(duì)數(shù)據(jù)存儲(chǔ),能夠很好地滿足系統(tǒng)的讀寫需求,例如MemcacheDB,Redis,Dynamo。

        (2) 文檔數(shù)據(jù)存儲(chǔ)。能夠高效滿足系統(tǒng)的海量數(shù)據(jù)存儲(chǔ)和訪問需求,目前的存儲(chǔ)主要包括MongoDB和CouchDB等,能夠很好地提高海量數(shù)據(jù)存儲(chǔ)的訪問效率。

        (3) 面向列存儲(chǔ)。在面向列的存儲(chǔ)系統(tǒng)中,數(shù)據(jù)以列為存儲(chǔ)單位。相同列的數(shù)據(jù)存儲(chǔ)在一起,從而支持列的動(dòng)態(tài)擴(kuò)展,對(duì)某一列或某幾列的查詢具有明顯的I/O優(yōu)勢(shì)。典型代表有Hbase,Hypertable等。

        2 MongoDB數(shù)據(jù)庫(kù)

        MongoDB數(shù)據(jù)庫(kù)不但能夠通過系統(tǒng)的鍵值對(duì)存儲(chǔ)提高其快速寫入和讀取,而且能夠很好地兼容傳統(tǒng)關(guān)系型DBMS功能,它主要可以提供一種功能強(qiáng)大、靈活、可擴(kuò)展的無(wú)結(jié)構(gòu)的存儲(chǔ)方式,該存儲(chǔ)方式采用松散的BSON數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ)。

        MongoDB的主要特性如下:

        (1) 擴(kuò)展性好:MongoDB數(shù)據(jù)庫(kù)在設(shè)計(jì)初期,首先考慮到數(shù)據(jù)庫(kù)的擴(kuò)展問題,通過采用無(wú)模式的存儲(chǔ)結(jié)構(gòu)可以快速對(duì)服務(wù)器進(jìn)行自動(dòng)分割。采用MongoDB數(shù)據(jù)庫(kù)的自動(dòng)分片機(jī)制,可以實(shí)現(xiàn)集群中數(shù)據(jù)的動(dòng)態(tài)負(fù)載均衡。

        (2) 數(shù)據(jù)存儲(chǔ)豐富多樣化:MongoDB是面向文檔的數(shù)據(jù)庫(kù),MongoDB拋棄關(guān)系存儲(chǔ)模型,用戶在進(jìn)行添加模塊時(shí)不用事先定義,即可橫向靈活的更改數(shù)據(jù)模型。

        (3) 檢索功能豐富:該數(shù)據(jù)庫(kù)不但支持輔助索引,而且方便存儲(chǔ)JavaScript腳本和MapReduce等模式。

        (4) 性能引擎優(yōu)良:MongoDB數(shù)據(jù)庫(kù)中的文檔數(shù)據(jù)可以動(dòng)態(tài)擴(kuò)充,通常先將存儲(chǔ)引擎配置到內(nèi)存映射文件中,實(shí)現(xiàn)數(shù)據(jù)文件進(jìn)行預(yù)分配,然后通過采用空間轉(zhuǎn)換的形式,確保數(shù)據(jù)庫(kù)的性能穩(wěn)定。

        (5) 配置管理便捷:MongoDB數(shù)據(jù)庫(kù)為提升系統(tǒng)的可靠性和穩(wěn)定性,通常采用服務(wù)器自身機(jī)制完成配置功能。MongoDB數(shù)據(jù)庫(kù)的核心是文檔數(shù)據(jù),每個(gè)文檔數(shù)據(jù)中的字段名和值一一對(duì)應(yīng)存放在表中??梢酝ㄟ^MongoDB數(shù)據(jù)庫(kù)實(shí)例方便管理相應(yīng)的數(shù)據(jù)庫(kù)表。

        圖1為MongoDB的分布式存儲(chǔ)架構(gòu)。

        2.1 分片

        在MongoDB數(shù)據(jù)庫(kù)中,每個(gè)分片均由一臺(tái)或多臺(tái)服務(wù)器構(gòu)成,該服務(wù)器的功能主要是通過運(yùn)行MongoDB進(jìn)程實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)。但在實(shí)際環(huán)境中,為了提高系統(tǒng)的可靠性和實(shí)現(xiàn)自動(dòng)故障恢復(fù),每個(gè)分片可以獨(dú)立看作是一個(gè)replica set,replica set從本質(zhì)上來(lái)講,它是一種異步的主從復(fù)制機(jī)制,每個(gè)replica set至少包括一個(gè)主節(jié)點(diǎn)和一個(gè)以上副節(jié)點(diǎn)。主節(jié)點(diǎn)主要負(fù)責(zé)數(shù)據(jù)的寫入,副節(jié)點(diǎn)主要負(fù)責(zé)數(shù)據(jù)的讀取。replica set中兩類節(jié)點(diǎn)之間通過oplog保證數(shù)據(jù)的一致性,所有操作數(shù)據(jù)及時(shí)間戳都會(huì)被寫入oplog,因其大小固定,所有的副節(jié)點(diǎn)均會(huì)監(jiān)聽oplog的變化情況,以實(shí)現(xiàn)與主節(jié)點(diǎn)的同步。replica set通常能夠?qū)崿F(xiàn)兩個(gè)以上子節(jié)點(diǎn)的故障自動(dòng)恢復(fù)。

        2.2 配置服務(wù)

        配置服務(wù)主要用來(lái)存儲(chǔ)MongoDB數(shù)據(jù)庫(kù)集群的元數(shù)據(jù)信息,這些元數(shù)據(jù)信息來(lái)源于兩方面:一部分是分片服務(wù)器上的集群信息;另一部分是該分片集群服務(wù)器上的文檔數(shù)據(jù)和集合信息。每一個(gè)配置服務(wù)信息中都包括了MongoDB數(shù)據(jù)庫(kù)中的群集信息,通常采用一個(gè)兩階段協(xié)議實(shí)現(xiàn)相互之間的通信,確保配置信息的一致性。配置服務(wù)器目前擁有自己的復(fù)制模型,可以對(duì)集群元數(shù)據(jù)信息備份。當(dāng)任何一個(gè)集群服務(wù)器發(fā)生宕機(jī)時(shí),集群中的元數(shù)據(jù)就自動(dòng)變?yōu)橹蛔x狀態(tài),通過此種方式能夠有效避免系統(tǒng)在不穩(wěn)定的情況下,誤操作導(dǎo)致元數(shù)據(jù)信息被改動(dòng),避免config servers節(jié)點(diǎn)間出現(xiàn)元數(shù)據(jù)不一致的情形。數(shù)據(jù)庫(kù)集群中某一配置服務(wù)器發(fā)生異常,不會(huì)影響整個(gè)集群的正常工作,最終能夠確保集群中寫入數(shù)據(jù)或從集群中讀取數(shù)據(jù)。

        2.3 路由進(jìn)程

        路由進(jìn)程可以將數(shù)據(jù)庫(kù)集群中的多個(gè)組件看作是一個(gè)單一的系統(tǒng),當(dāng)MongoDB數(shù)據(jù)庫(kù)服務(wù)器接收到用戶請(qǐng)求時(shí),首先查詢相應(yīng)的配置文件,找到存放該數(shù)據(jù)的分片服務(wù)器。然后通過配置服務(wù)協(xié)議把用戶請(qǐng)求轉(zhuǎn)發(fā)給相對(duì)應(yīng)的分片服務(wù)器。當(dāng)所有的分片服務(wù)器完成操作后,會(huì)將結(jié)果通過路由協(xié)議打包分別發(fā)送給Mongos。當(dāng)Mongos匯總所有的數(shù)據(jù)結(jié)果后,再把最終結(jié)果返回給用戶。Mongos每次啟動(dòng),首先要去配置服務(wù)器中讀取元數(shù)據(jù)單元,并同時(shí)保存到本地。每當(dāng)配置服務(wù)器中的元數(shù)據(jù)信息發(fā)生變動(dòng)時(shí),它都會(huì)在第一時(shí)間通知所有的Mongos。

        3 Hadoop大數(shù)據(jù)云存儲(chǔ)平臺(tái)

        Hadoop大數(shù)據(jù)平臺(tái)是Apache公司的一個(gè)開源子項(xiàng)目,該平臺(tái)項(xiàng)目的主要目標(biāo)是能夠依據(jù)目前已有的廉價(jià)硬件設(shè)備生成系統(tǒng)穩(wěn)定、可擴(kuò)展的分布式計(jì)算架構(gòu)。其中HDFS是Hadoop平臺(tái)的子項(xiàng)目之一,它主要是能夠?qū)崿F(xiàn)分布式文件系統(tǒng),為各大機(jī)構(gòu)和公司建設(shè)云存儲(chǔ)解決方案提供了參考。

        云存儲(chǔ)數(shù)據(jù)中心是由多服務(wù)器組成的服務(wù)器集群的統(tǒng)稱,該云存儲(chǔ)數(shù)據(jù)中心能夠提供大容量、高并發(fā)的數(shù)據(jù)存儲(chǔ)。該服務(wù)集群主要由一個(gè)主控節(jié)點(diǎn)和多個(gè)數(shù)據(jù)節(jié)點(diǎn)構(gòu)成,能夠通過網(wǎng)絡(luò)設(shè)備將集群系統(tǒng)連接在一起,方便實(shí)現(xiàn)用戶統(tǒng)一的管理和維護(hù)。

        非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)非常廣泛,目前系統(tǒng)建設(shè)功能模塊中對(duì)非結(jié)構(gòu)化數(shù)據(jù)要求很多,包括圖片上傳下載、新聞圖片發(fā)布、視頻剪輯、文檔管理等功能。其云存儲(chǔ)層次結(jié)構(gòu)如圖2所示。

        但是大部分的功能實(shí)現(xiàn)是通過在服務(wù)器上創(chuàng)建可寫的目錄來(lái)存儲(chǔ),采用此種方式有如下弊端:

        (1) 性能低下。因系統(tǒng)所需的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)量大,服務(wù)器帶寬和計(jì)算能力會(huì)根據(jù)數(shù)據(jù)類型進(jìn)行相應(yīng)分配,這樣導(dǎo)致大量服務(wù)器存儲(chǔ)被占用,對(duì)于一些核心設(shè)備上性能要求極高的服務(wù)器有很大影響。

        (2) 集群同步難以維護(hù)。當(dāng)大型項(xiàng)目規(guī)模需要集群支持時(shí),為了確保實(shí)現(xiàn)節(jié)點(diǎn)內(nèi)各服務(wù)器之間同步數(shù)據(jù),通常采用基于服務(wù)器內(nèi)部之間的協(xié)議保證數(shù)據(jù)傳輸?shù)囊恢滦院屯暾浴?/p>

        (3) 服務(wù)安全管控性差。目前服務(wù)器都逐步采用集中式管控,這對(duì)服務(wù)器出入口安全提出更苛刻的要求,傳統(tǒng)入侵都是通過對(duì)服務(wù)器上傳木馬實(shí)現(xiàn)的,為更好的提升服務(wù)安全管理,迫切需要對(duì)外服務(wù)接口進(jìn)行監(jiān)管。

        (4) 數(shù)據(jù)安全性。針對(duì)服務(wù)器集群數(shù)據(jù)間的交換,通常采用vpn登錄等方式獲取所需的數(shù)據(jù)信息,而vpn通常是內(nèi)外網(wǎng)信息的入口憑證,加強(qiáng)vpn等登錄信息的監(jiān)管是確保數(shù)據(jù)安全的重中之重。

        (5) 數(shù)據(jù)持久性?;跇I(yè)務(wù)應(yīng)用的系統(tǒng),通常采用單一數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ),一旦數(shù)據(jù)庫(kù)發(fā)生異常,無(wú)法保證數(shù)據(jù)的完整性和一致性,容易發(fā)生存儲(chǔ)數(shù)據(jù)丟失等情況,一旦丟失,進(jìn)行數(shù)據(jù)恢復(fù)往往比較困難。

        本文設(shè)計(jì)的非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)架構(gòu)建立在Hadoop之上,層次結(jié)構(gòu)如下:

        (1) 存儲(chǔ)層:非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)系統(tǒng)對(duì)外提供不同的存儲(chǔ)服務(wù),每種服務(wù)的數(shù)據(jù)被統(tǒng)一存儲(chǔ)在系統(tǒng)中,構(gòu)成一個(gè)數(shù)據(jù)池。

        (2) 管理層:管理層是非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)系統(tǒng)中最核心的一層。通過管理層實(shí)現(xiàn)云存儲(chǔ)中多個(gè)存儲(chǔ)設(shè)備之間的協(xié)同工作,確保這些設(shè)備對(duì)外提供統(tǒng)一的數(shù)據(jù)公眾服務(wù)。

        (3) 應(yīng)用服務(wù)層:該層主要是根據(jù)用戶自身業(yè)務(wù)而實(shí)現(xiàn)的業(yè)務(wù)需求,能夠?qū)崿F(xiàn)與云存儲(chǔ)服務(wù)器集群進(jìn)行交互的具體操作,最終實(shí)現(xiàn)用戶的業(yè)務(wù)操作。

        (4) 應(yīng)用接口層:對(duì)應(yīng)于云存儲(chǔ)中的用戶訪問層。

        4 本文設(shè)計(jì)內(nèi)容

        本文為優(yōu)化HDFS的存儲(chǔ),引入MongoDB非關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行相應(yīng)的改進(jìn),在Hadoop云平臺(tái)上搭建HDFS和MongoDB存儲(chǔ)系統(tǒng)實(shí)現(xiàn)非結(jié)構(gòu)化海量資源的存儲(chǔ)。非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)平臺(tái)如圖3所示。

        非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)平臺(tái)中MongoDB架構(gòu)如圖4所示,其功能如下:

        (1) Client:包含訪問MongoDB的接口,維護(hù)緩存數(shù)據(jù)加快數(shù)據(jù)的訪問速度,如集合位置信息。

        (2) 協(xié)調(diào)服務(wù):確保整個(gè)系統(tǒng)集群只有一個(gè)主控制節(jié)點(diǎn),能夠存儲(chǔ)所有集合的尋址入口,實(shí)時(shí)監(jiān)控集合服務(wù)的狀態(tài),將集合服務(wù)的狀態(tài)信息實(shí)時(shí)發(fā)送到主控制節(jié)點(diǎn);存儲(chǔ)和管理MongoDB的模式信息,包括有哪些集合,每個(gè)集合有哪些文檔。

        (3) 控制節(jié)點(diǎn):分配集合空間,負(fù)責(zé)元數(shù)據(jù)存儲(chǔ)的負(fù)載均衡;發(fā)現(xiàn)失效的數(shù)據(jù)節(jié)點(diǎn)時(shí),進(jìn)行故障轉(zhuǎn)移;處理MongoDB上的垃圾文件回收和schema更新請(qǐng)求。

        (4) 集合服務(wù):數(shù)據(jù)的I/O請(qǐng)求;對(duì)數(shù)據(jù)量較大的集合進(jìn)行自動(dòng)分片。

        非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)平臺(tái)中HDFS架構(gòu)如圖5所示,其功能如下:

        (1) NameNode節(jié)點(diǎn)即控制節(jié)點(diǎn),它可以看作是HDFS中的管理者,工作內(nèi)容主要包括:管理文件系統(tǒng)的命名空間、集群配置、存儲(chǔ)塊復(fù)制等。

        (2) 存儲(chǔ)節(jié)點(diǎn)是數(shù)據(jù)存儲(chǔ)的基本單元,通過將數(shù)據(jù)以塊的方式存儲(chǔ)到本地文件系統(tǒng)中,同時(shí)能夠?qū)⑺袎K信息及時(shí)準(zhǔn)確地發(fā)送給控制節(jié)點(diǎn)。

        (3) MongoDB客戶端就是獲取分布式文件系統(tǒng)的應(yīng)用程序。

        通過開源Hadoop非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)平臺(tái),用戶可以將海量非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到云平臺(tái)上。HDFS可以用來(lái)存儲(chǔ)PB級(jí)的數(shù)據(jù),但數(shù)據(jù)訪問延時(shí)高,不適合存儲(chǔ)小文件等。MongoDB存儲(chǔ)海量數(shù)據(jù)的元數(shù)據(jù),可以實(shí)現(xiàn)實(shí)時(shí)讀寫,很好地彌補(bǔ)了HDFS的不足。

        5 測(cè)試結(jié)果

        測(cè)試實(shí)驗(yàn)數(shù)據(jù)來(lái)源于所在公司的商務(wù)數(shù)據(jù)。本次實(shí)驗(yàn)主要對(duì)Hadoop平臺(tái)下NameNode節(jié)點(diǎn)內(nèi)存損耗進(jìn)行測(cè)試。為了進(jìn)行NameNode內(nèi)存損耗測(cè)試實(shí)驗(yàn),實(shí)驗(yàn)設(shè)計(jì)數(shù)據(jù)如下:采用樣本數(shù)分別為10 000,20 000,30 000,40 000,50 000,每組樣本數(shù)中各自創(chuàng)建10萬(wàn)個(gè)文件;對(duì)引入MongoDB前后的系統(tǒng)進(jìn)行相應(yīng)實(shí)驗(yàn),獲取NameNode節(jié)點(diǎn)的內(nèi)存大小并記錄,實(shí)驗(yàn)結(jié)果如表2所示。

        從實(shí)驗(yàn)數(shù)據(jù)中可以看出,對(duì)于原始不加任何修改的HDFS文件系統(tǒng),隨著文件數(shù)量的不斷增加,NameNode節(jié)點(diǎn)的內(nèi)存消耗也呈線性增長(zhǎng)趨勢(shì)。而在引入MongoDB后,文件數(shù)量等比增加,NameNode節(jié)點(diǎn)的內(nèi)存消耗基本保持不變,內(nèi)存占用率也不高。表3為響應(yīng)時(shí)間對(duì)比結(jié)果。

        從表3中可以看出,對(duì)于原始不加任何修改的HDFS文件系統(tǒng),隨著文件數(shù)量的不斷增加,系統(tǒng)響應(yīng)時(shí)間呈線性增長(zhǎng)趨勢(shì)。而在引入MongoDB后,文件數(shù)量等比增加,系統(tǒng)響應(yīng)時(shí)間同樣基本保持不變。實(shí)驗(yàn)結(jié)果表明,基于Hadoop云存儲(chǔ)平臺(tái),采用MongoDB和HDFS相結(jié)合的方式,對(duì)緩解大數(shù)據(jù)NameNode節(jié)點(diǎn)的內(nèi)存耗費(fèi)和響應(yīng)時(shí)間均有很好的改進(jìn)。

        6 結(jié) 語(yǔ)

        本文通過對(duì)互聯(lián)網(wǎng)發(fā)展的現(xiàn)狀進(jìn)行分析,重點(diǎn)研究了當(dāng)前流行的NoSQL數(shù)據(jù)庫(kù)代表MongoDB的數(shù)據(jù)庫(kù)模型、特性以及它的分布式存儲(chǔ)架構(gòu),并詳細(xì)介紹了大數(shù)據(jù)云平臺(tái)技術(shù)的特點(diǎn),依據(jù)大數(shù)據(jù)云存儲(chǔ)平臺(tái)和非結(jié)構(gòu)化數(shù)據(jù)庫(kù)自身的特點(diǎn),設(shè)計(jì)基于MongoDB和HDFS的非結(jié)構(gòu)化數(shù)據(jù)云存儲(chǔ)服務(wù)架構(gòu)。針對(duì)非結(jié)構(gòu)化數(shù)據(jù)元數(shù)據(jù)的特點(diǎn)以及MongoDB的存儲(chǔ)特性,將MongoDB部署到Hadoop平臺(tái)中,存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)信息,而非結(jié)構(gòu)化數(shù)據(jù)以文件的方式存放在HDFS系統(tǒng)中。這樣可以降低HDFS在應(yīng)對(duì)海量小文件的存儲(chǔ)應(yīng)用時(shí),由于NameNode內(nèi)存不足導(dǎo)致的性能瓶頸。在本文的最后設(shè)計(jì)實(shí)驗(yàn)對(duì)平臺(tái)的可行性進(jìn)行了驗(yàn)證,實(shí)驗(yàn)數(shù)據(jù)證明了改進(jìn)方案的有效性和高效性。

        參考文獻(xiàn)

        [1] WHITE Tom.Hadoop權(quán)威指南[M].北京:清華大學(xué)出版社,2011.

        [2] 李喬,鄭嘯.云計(jì)算研究現(xiàn)狀綜述[J].計(jì)算機(jī)科學(xué),2011,38(4):32?37.

        [3] 謝華成,陳向東.面向云存儲(chǔ)的非結(jié)構(gòu)化數(shù)據(jù)存取[J].計(jì)算機(jī)應(yīng)用,2012,32(7):1924?1928.

        [4] WANG R W, ZHANG H, DENG Y F, et al. Efficient parallel radiosity for terascale applications [C]// Proceedings of 2008 International Conference on Computer Science and Software Engineering. [S.l.]: IEEE, 2008: 1074?1077.

        [5] FABIANOWSKI B, DINGLIANA J. Interactive global photon mapping [J]. Computer graphics forum, 2009, 28(4): 1151?1159.

        [6] 田浪軍,陳衛(wèi)衛(wèi),陳衛(wèi)東,等.云存儲(chǔ)系統(tǒng)中動(dòng)態(tài)負(fù)載均衡算法研究[J].計(jì)算機(jī)工程,2013,39(10):19?23.

        [7] GHEMAWAT S, GOBIOFF H, LEUNG S T. The Google file system [C]// Proceedings of 2003 ACM Symposium on Opera?ting Systems Review. [S.l.]: ACM, 2003: 29?43.

        [8] 林菲,張萬(wàn)軍,孫勇.一種分布式非結(jié)構(gòu)化數(shù)據(jù)副本管理模型[J].計(jì)算機(jī)工程,2013,39(4):36?38.

        [9] 胡珊珊.面向云存儲(chǔ)的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)研究與應(yīng)用[D].廣州:廣東工業(yè)大學(xué),2014.

        [10] 李存琛.海量數(shù)據(jù)分布式存儲(chǔ)技術(shù)的研究與應(yīng)用[D].北京:北京郵電大學(xué),2013.

        [11] 楊磊.基于NoSQL數(shù)據(jù)庫(kù)的結(jié)構(gòu)化存儲(chǔ)設(shè)計(jì)與應(yīng)用[J].科技風(fēng),2011(18):99.

        [12] 朱建生,汪健雄,張軍鋒.基于NoSQL數(shù)據(jù)庫(kù)的大數(shù)據(jù)查詢技術(shù)的研究與應(yīng)用[J].中國(guó)鐵道科學(xué),2014,35(1):135?141.

        猜你喜歡
        云存儲(chǔ)
        天地一體化網(wǎng)絡(luò)環(huán)境下的云存儲(chǔ)技術(shù)探討
        基于橢圓曲線的云存儲(chǔ)數(shù)據(jù)完整性的驗(yàn)證研究
        高校檔案云存儲(chǔ)模式探究
        地鐵高清視頻存儲(chǔ)技術(shù)的應(yīng)用分析
        云數(shù)據(jù)存儲(chǔ)安全關(guān)鍵技術(shù)研究
        基于云存儲(chǔ)的氣象數(shù)字化圖像檔案存儲(chǔ)研究
        試論云存儲(chǔ)與數(shù)字版權(quán)的沖突、法制與協(xié)同
        出版廣角(2016年14期)2016-12-13 02:10:43
        云存儲(chǔ)出版服務(wù)的版權(quán)侵權(quán)責(zé)任風(fēng)險(xiǎn)分析
        出版廣角(2016年14期)2016-12-13 02:06:45
        云存儲(chǔ)技術(shù)的起源與發(fā)展
        基于云存儲(chǔ)的數(shù)據(jù)庫(kù)密文檢索研究
        久久人人爽人人爽人人片av高请 | 老熟妇乱子伦牲交视频| 精品国产青草久久久久福利| 国产成年无码v片在线| 国产精品无码久久久久免费AV| 伊人色综合九久久天天蜜桃| 国产少妇高潮在线视频| 在线观看午夜视频一区二区| 欧美亚洲国产一区二区三区| 国产精品国产三级国产av品爱| 射精专区一区二区朝鲜| av无码免费永久在线观看| 无码国产色欲xxxxx视频| 国产老妇伦国产熟女老妇高清| 黄色三级国产在线观看| 中文字幕第一页人妻丝袜| 欧美丰满熟妇性xxxx| 中文字幕熟妇人妻在线视频 | 男人j进女人p免费视频| 久久中文字幕日韩无码视频| 亚洲免费人成网站在线观看| 自拍成人免费在线视频| 日本一区二区三区免费播放| 洗澡被公强奷30分钟视频| 久久精品国产精品亚洲毛片| 人妻爽综合网| 丰满少妇被爽的高潮喷水呻吟| 精品卡一卡二卡3卡高清乱码| 人妻av无码系列一区二区三区| 91超碰在线观看免费| 人妻系列少妇极品熟妇| 国产91极品身材白皙| 搡女人真爽免费视频大全| 男女啪啪永久免费观看网站| 国产乱人视频在线观看播放器| 亚洲熟女av一区少妇| 性人久久久久| 男女啪啪无遮挡免费网站| 日本高清一区二区不卡视频| 少妇人妻一区二区三飞| 大尺度无遮挡激烈床震网站|