亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Hadoop核心架構淺析及集群部署的設計與實現(xiàn)

        2018-01-17 15:56:30韓健
        電子技術與軟件工程 2017年20期

        摘 要 隨著大數(shù)據(jù)應用的如火如荼,各種大數(shù)據(jù)技術業(yè)層出不窮,其中以Hadoop技術為核心的大數(shù)據(jù)存儲和計算解決方案受到越來越廣泛的好評,成功案例也越來越多。在這種背景下,本文介紹了Hadoop的核心架構并用實驗的方式對Hadoop集群的部署給出了設計方案。

        【關鍵詞】Hadoop 架構 集群部署

        Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎架構,其前身為本世紀初Apache研發(fā)出的Nutch。簡單來說,Hadoop就是一個搜索引擎,其可以為人們的各種搜索需要提供與之相對應的搜索工具,而谷歌公司發(fā)表的關于谷歌文件系統(tǒng)的論文,則是谷歌公司首次向世人展示了這一集數(shù)據(jù)搜索功能、數(shù)據(jù)存儲功能等于一身的專用文件系統(tǒng)。Nutch創(chuàng)始人緊隨其后,通過學習和借鑒谷歌公司發(fā)布的技術論文,重新開發(fā)出了分布式文件系統(tǒng),并將其命名為NDFS。此舉則使得Google在該領域加大了研究力度,其在隨后發(fā)表的MapReduce即編程模型論文當中,展示了該模型強大的分析和運算能力,其可以同時完成超過1TB的數(shù)據(jù)集分析與運算。次年,Nutch創(chuàng)始人以MapReduce為基礎,依托Nutch搜索引擎,同樣實現(xiàn)了大容量數(shù)據(jù)集的分析和運算。直到2006年雅虎公司聘用Nutch創(chuàng)始人,使得NDFS以及MapReduce被正式統(tǒng)一命名為Hadoop。

        1 Hadoop核心技術架構

        Hadoop作為分布式文件系統(tǒng)的一種,除了具備強大的存儲功能之外,其通過大量計算設備,使得系統(tǒng)可以在大型集群上完成分布式應用的有效執(zhí)行。事實上,在Hadoop的當中,HDFS和MapReduce占據(jù)著最為重要的地位,但其只是一種基礎理論,缺乏足夠的應用性。

        1.1 HDFS文件系統(tǒng)

        HDFS文件系統(tǒng)具有高容錯性,適用于價格較為低廉的機器,而其提供的數(shù)據(jù)訪問具備較高的吞吐量,因此對于大型數(shù)據(jù)集的應用程序而言無疑是一利好消息。

        在 Hadoop軟件框架當中,HDFS雖然身處最底層,但是其傳輸和容錯較高的特性使其能夠輕松完成全部存儲節(jié)點文件的存儲工作,在對文件系統(tǒng)數(shù)據(jù)進行訪問時,也支持流形式,使得管理大量信息數(shù)據(jù)的工作變得更加輕松和高效,如圖1所示,管理者、工作者是組成Hadoop集群最為關鍵的兩大部分(如圖1)。

        1.2 MapReduce軟件框架

        在Hadoop當中,分布式處理機制(MapReduce)是其十分重要的一項技術。其組成要素分別JobTracker 和TaskTracker,前者為 Hadoop集群當中獨一無二的應用程序,負責啟動并控制單個主系統(tǒng)上與之相對應的對象,提交應用程序后將負責直接提供輸入目錄、輸出目錄。TaskTracker的數(shù)量眾多,其充當著執(zhí)行者的身份,在執(zhí)行完JobTracker各項命令后會直接向其反饋本地節(jié)點狀態(tài)。

        MapReduce會采用分化的方式,將原本十分龐大的數(shù)據(jù)分析劃分成若干個小塊,在對每一個小塊進行分析之后將最終獲得的數(shù)據(jù)進行匯總,進而得到最終的分析結果。而Hadoop出現(xiàn)使得人們通過編寫極為簡單的需求命令,便可以完成相關數(shù)據(jù)的有效獲取。

        2 Hadoop集群部署

        2.1 安裝環(huán)境準備

        2.1.1 硬件環(huán)境準備

        我們的集群部署環(huán)境選擇四臺PC服務器,每臺服務器裝有紅帽LINUX操作系統(tǒng),并配有8GB 內存和40GB 的存儲。通過局域網(wǎng)實現(xiàn)四臺服務器之間的互聯(lián), 其中主節(jié)點一臺 ,從節(jié)點共有三臺。在每一臺服務器上都需要完成 Hadoop 用戶的建立,由此完成所有 Hadoop操作。

        注意Hadoop 是用 Java 語言開發(fā)的分布式計算框架,所以每臺服務器需要安裝JDK。

        另外,Hadoop 集群在運行時需要通過 ssh免密碼服務來進行通信。

        2.1.2 配置 Hadoop 文件

        考慮到Hadoop 擁有不同的版本,本文最終選擇使用具有較好穩(wěn)定性的 Hadoop 2.2.0。 在將安裝文件下載并保存至主節(jié)點之后,在相關目錄下配置 Hadoop 文件。其配置過程如下所示:

        (1) 對從節(jié)點進行配置。在將文件打開之后將 slave1,slave2,slave3加入其中。

        (2) 配置hadoop環(huán)境變量腳本Hadoop-env.sh。修改 JAVA_HOME值: export JAVA_HOME = /usr/local/java/jdk1.8.0_25

        (3)對yarn環(huán)境變量腳本yarn-env.sh進行配置。將JAVAHOME值修改為xport JAVA_HOME=/usr/local/java/jdk1.8.0_25

        (4)對目錄當中的xml 文件(共計四個)進行修改。

        最后,將 Hadoop 文件通過 scp 命令發(fā)送到各個從結點。這樣,就完成了 Hadoop 集群的部署。

        3 結語

        Hadoop是一種主流的大數(shù)據(jù)技術,本文通過對 Hadoop及其關鍵技術進行簡要分析研究,分別從理論和實踐兩個角度,對 Hadoop技術進行全面展示,這證明其具有強大的信息數(shù)據(jù)存儲、分析和處理能力。

        參考文獻

        [1]TomWhite.Hadoop權威指南(2版)[M].北京:清華大學出版社,2011:15-73,167-188.

        [2]TomWhite.HadoopTheDefinitiveGuide2ndEdition[M].Oreilly,2010:41-73,167-188.

        [3]JasonVenner.ProHadoop[M].Apress,2009:27-53.

        作者簡介

        韓?。?982-),男,北京市人。碩士研究生。工程師。研究方向為大數(shù)據(jù)和數(shù)據(jù)挖掘。

        作者單位

        中國民生銀行總行 北京市 100031endprint

        日本真人添下面视频免费| 99久久国语露脸国产精品| 一区二区亚洲精美视频| 美女主播网红视频福利一区二区| 激情伊人五月天久久综合| 久久国产精久久精产国| 亚洲欧美日韩国产综合专区| 亚洲美女一区二区三区三州| 精品无码一区二区三区爱欲| 久久久噜噜噜www成人网| 中文字幕永久免费观看| av有码在线一区二区三区| 亚洲国产成人精品无码区在线播放| 中文字幕av无码一区二区三区| 欧美精品一区二区精品久久| 少妇我被躁爽到高潮在线影片 | 亚洲乱码中文字幕综合69堂| 国产实拍日韩精品av在线| 一区二区三区国产| 久久99精品免费一区二区| 国产一区二区三区经典| 国产精品亚洲av无人区一区香蕉| 精品水蜜桃久久久久久久| 日批视频免费在线观看| 国产超碰在线91观看| 精品福利一区二区三区免费视频 | 久久人人97超碰超国产| 无码国产精品一区二区免费式芒果 | 成人性生交c片免费看| 水蜜桃在线观看一区二区| 国产精品久久久久久影视 | 国产精品国产三级国产专播| 国产成人综合久久大片| 久久久久亚洲av片无码| 日本丶国产丶欧美色综合| 精品蜜桃一区二区三区| 又黄又刺激的网站久久| 亚洲综合色自拍一区| 国产一区二区a毛片色欲| 日韩精品一区二区三区乱码| 在线播放免费播放av片|