亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Linux的Hadoop平臺(tái)搭建及測(cè)驗(yàn)研究

        2021-10-11 09:37:06李小立
        魅力中國(guó) 2021年32期
        關(guān)鍵詞:詞頻集群分布式

        李小立

        (長(zhǎng)沙民政職業(yè)技術(shù)學(xué)院 軟件學(xué)院,湖南 長(zhǎng)沙 410000)

        一、Hadoop 簡(jiǎn)介

        Hadoop 是一個(gè)由Apache 基金會(huì)所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),它允許用戶使用簡(jiǎn)單的編程模型跨計(jì)算機(jī)集群分布式處理大型數(shù)據(jù)集[1]。其核心組件包括HDFS、Yarn 和MapReduce,其中HDFS 是分布式存儲(chǔ)系統(tǒng),用于提供高可靠性、高擴(kuò)展性和高吞吐率的數(shù)據(jù)存儲(chǔ)服務(wù);Yarn 是資源管理系統(tǒng),負(fù)責(zé)集群資源的統(tǒng)一管理和調(diào)度;MapReduce 是分布式計(jì)算框架,具有易于編程、高容錯(cuò)性和高擴(kuò)展性的優(yōu)點(diǎn)。由于Hadoop 帶有用Java 語(yǔ)言編寫的框架,因此使用Linux 系統(tǒng)搭建Hadoop平臺(tái)更具有優(yōu)勢(shì),該文將使用Linux 系統(tǒng)進(jìn)行平臺(tái)搭建。

        二、Hadoop平臺(tái)部署

        Hadoop 支持在GNU/Linux 系統(tǒng)以及Windows 系統(tǒng)上進(jìn)行安裝使用,在實(shí)際開發(fā)中,由于Linux 系統(tǒng)的便捷性和穩(wěn)定性,Hadoop 集群一般是在Linux 系統(tǒng)上運(yùn)行的。Hadoop 集群的搭建方式分為3 種,包括獨(dú)立模式、偽分布式模式和完全分布式模式。該文將使用三臺(tái)虛擬機(jī)搭建一個(gè)偽分布式模式Hadoop 集群。Hadoop 集群的搭建一般需要多臺(tái)機(jī)器,從而保證集群的穩(wěn)定性和可靠性,但一般實(shí)驗(yàn)情況下,由于條件限制,通常借助虛擬機(jī)軟件在一臺(tái)物理機(jī)上創(chuàng)建多個(gè)Linux 虛擬機(jī)環(huán)境。

        (一)準(zhǔn)備工作

        使用的軟件包括Vmware Workstation14.0,JDK 1.8,Hadoop2.8.3,Redhat Linux7.0,集群規(guī)劃如表1 所示。

        表1 集群規(guī)劃

        (二)軟件安裝及集群配置

        使用Vmware Workstation 虛擬機(jī)軟件構(gòu)建三臺(tái)虛擬機(jī),并安裝RedHat Linux 系統(tǒng),安裝過程該文不進(jìn)行詳細(xì)描述[1]。

        1.Linux 系統(tǒng)網(wǎng)絡(luò)配置

        設(shè)置每臺(tái)虛擬機(jī)的網(wǎng)絡(luò)連接,使用僅主機(jī)的連接模式,并測(cè)試網(wǎng)絡(luò)連通性。修改主機(jī)名與IP 地址映射配置,測(cè)試三臺(tái)主機(jī)之間的連通性,分別在每臺(tái)主機(jī)上使用ping 命令去ping 另外兩臺(tái)主機(jī)的IP 地址或主機(jī)名。

        2.設(shè)置節(jié)點(diǎn)互信

        在集群開發(fā)與使用中,主節(jié)點(diǎn)通常會(huì)與集群中的其他節(jié)點(diǎn)進(jìn)行通信,由于Linux 系統(tǒng)的安全設(shè)置,在節(jié)點(diǎn)與節(jié)點(diǎn)進(jìn)行訪問時(shí)需要輸入目標(biāo)節(jié)點(diǎn)的用戶名和密碼,因此為了保障集群服務(wù)的連續(xù)運(yùn)行,通過配置SSH 服務(wù)來(lái)實(shí)現(xiàn)免密登錄。使用ssh-keygen-t rsa 命令生成秘鑰,并使用sshcopy-id 命令將公鑰拷貝至其他節(jié)點(diǎn)。在每個(gè)節(jié)點(diǎn)都進(jìn)行SSH 服務(wù)配置,配置完成后使用ssh 進(jìn)行訪問測(cè)試,此時(shí)可在任意一個(gè)節(jié)點(diǎn)自由切換至其他節(jié)點(diǎn)且不需要輸入用戶名與密碼。

        3.為所有節(jié)點(diǎn)配置JDK 和Hadoop

        第一步,安裝JDK 與Hadoop。

        第二步,配置系統(tǒng)環(huán)境變量,修改/etc/profile 文件,在文件末尾添加JAVA_HOME 與HADOOP_HOME 環(huán)境變量,并修改PATH 環(huán)境變量。修改完配置文件后,使用source/etc/profile 命令使配置生效,并使用 java-version 命令查看JDK 版本信息。

        第三步:修改Hadoop 環(huán)境變量

        三、配置Zookeeper 集群

        (一)Zookeeper 安裝

        下載并解壓zookeeper-3.3.5.tar 到/hadoop 目錄,將zookeeper-3.3.5.tar 復(fù)制到另外兩臺(tái)機(jī)器,每個(gè)節(jié)點(diǎn)創(chuàng)建存放數(shù)據(jù)的目錄/hadoop/data。

        (二)Zookeeper 相關(guān)配置

        1.設(shè)置Zookeeper 相關(guān)配置文件。其中需要注意的是hdfs-site.xml文件,該文件用于設(shè)置HDFS的NameNode 和DataNode 兩大進(jìn)程。可在該文件中設(shè)置節(jié)點(diǎn)個(gè)數(shù)及第二個(gè)NameNode 網(wǎng)絡(luò)端口配置。文件中中的設(shè)置的節(jié)點(diǎn)名稱必須一致。

        2.啟動(dòng)Zookeeper 服務(wù)

        修改完所有配置文件后,將配置文件復(fù)制到其他機(jī)器,并為每個(gè)節(jié)點(diǎn)添加id,啟動(dòng)zk 服務(wù)并查看狀態(tài),然后啟動(dòng)journalnode,在hdp1 上格式化namenode 節(jié)點(diǎn)及zk,格式化成功后在hdp1 節(jié)點(diǎn)上啟動(dòng)NameNode 服務(wù)并在備節(jié)點(diǎn)同步主節(jié)點(diǎn)數(shù)據(jù),最后在主節(jié)點(diǎn)上啟動(dòng)所有服務(wù),啟動(dòng)成功后在各個(gè)節(jié)點(diǎn)查看服務(wù)啟動(dòng)狀態(tài)。各節(jié)點(diǎn)服務(wù)啟動(dòng)狀態(tài)如表2 所示。

        表2 節(jié)點(diǎn)服務(wù)器啟動(dòng)狀態(tài)

        四、集群測(cè)試

        為了保證整個(gè)平臺(tái)的穩(wěn)定工作,在Zookeeper 引入Watch 機(jī)制,對(duì)集群的各個(gè)節(jié)點(diǎn)進(jìn)行監(jiān)聽,當(dāng)集群中的主節(jié)點(diǎn)無(wú)法正常工作時(shí),則集群立即啟用備用節(jié)點(diǎn)。該測(cè)試將模擬hdp1 節(jié)點(diǎn)故障,查看hdp2 上的NameNode 服務(wù)是否能成功激活。

        (一)查看節(jié)點(diǎn)狀態(tài)

        1.查看hdp1 節(jié)點(diǎn)狀態(tài),如圖1 所示。

        2.查看hdp1 及hdp2 上的NameNode 狀態(tài),其中hdp1 為active 狀態(tài),hdp2為standby狀態(tài)。表明當(dāng)前hdp1節(jié)點(diǎn)上的NameNode服務(wù)處于激活狀態(tài)。

        3.模擬hdp1 節(jié)點(diǎn)故障,即殺死hdp1 節(jié)點(diǎn)上的NameNode 服務(wù)對(duì)應(yīng)的進(jìn)程。查看hdp1 與hdp2 節(jié)點(diǎn)的NameNode 服務(wù)狀態(tài),如圖2 所示。

        重新啟動(dòng)hdp1 節(jié)點(diǎn)的NameNode 服務(wù),查看服務(wù)狀態(tài)。此時(shí),hdp1 節(jié)點(diǎn)的NameNode 服務(wù)已變?yōu)閟tandby。至此,Hadoop平臺(tái)及Zookeeper 集群均已準(zhǔn)備就緒。

        五、詞頻統(tǒng)計(jì)測(cè)試

        在hdfs-site.xml 文件中,可設(shè)置進(jìn)行MapReduce 計(jì)算時(shí)數(shù)據(jù)切分的數(shù)據(jù)塊大小,默認(rèn)為128M。在個(gè)人學(xué)習(xí)或測(cè)試中,該值設(shè)置過大,一般個(gè)人的測(cè)試數(shù)據(jù)大小為KB 或者M(jìn)B 級(jí)別。因此,為了進(jìn)行試驗(yàn)對(duì)比,該文中將數(shù)據(jù)塊大小修改為1MB,分別使用大小為2.5MB的文件和2KB的文件進(jìn)行詞頻統(tǒng)計(jì)[2],試驗(yàn)結(jié)果對(duì)比如表3 所示。

        表3 詞頻統(tǒng)計(jì)結(jié)果對(duì)比

        六、總結(jié)與展望

        該文詳細(xì)介紹了Hadoop平臺(tái)部署與Zookeeper 集群部署,成功搭建了一個(gè)Hadoop 分布式架構(gòu)平臺(tái),并進(jìn)行了集群測(cè)試及詞頻統(tǒng)計(jì)對(duì)比實(shí)驗(yàn),為以后大數(shù)據(jù)研究工作提供了一個(gè)實(shí)踐平臺(tái)。

        猜你喜歡
        詞頻集群分布式
        基于詞頻分析法的社區(qū)公園歸屬感營(yíng)建要素研究
        園林科技(2021年3期)2022-01-19 03:17:48
        海上小型無(wú)人機(jī)集群的反制裝備需求與應(yīng)對(duì)之策研究
        一種無(wú)人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
        電子制作(2018年11期)2018-08-04 03:25:40
        分布式光伏熱錢洶涌
        能源(2017年10期)2017-12-20 05:54:07
        分布式光伏:爆發(fā)還是徘徊
        能源(2017年5期)2017-07-06 09:25:54
        Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
        勤快又呆萌的集群機(jī)器人
        基于DDS的分布式三維協(xié)同仿真研究
        詞頻,一部隱秘的歷史
        云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
        久久国产香蕉一区精品天美| 精品国产乱码久久久久久1区2区| 伊人久久综合精品无码av专区| 在线观看国产精品91| 国产精品黑丝美女av| 在线麻豆精东9制片厂av影现网 | 口爆吞精美臀国产在线| 无码人妻久久一区二区三区免费丨 | 曰韩无码av一区二区免费| 日本少妇被黑人xxxxx| 欧美日韩中文字幕久久伊人| 青青草成人原视频在线播放视频| 好吊妞视频这里有精品| 午夜三级a三级三点| 一区五码在线| 开心五月激情五月天天五月五月天| 少妇久久久久久被弄高潮| 欧洲日本一线二线三线区本庄铃| 国产精品18久久久久久首页| 久久精品国产亚洲av久五月天| 国产老熟女网站| 色窝窝在线无码中文| 日韩在线中文字幕一区二区三区 | 伊伊人成亚洲综合人网7777| 中文字幕色视频在线播放| 亚洲人成网站色在线入口口| 久激情内射婷内射蜜桃| 无码午夜剧场| 人妻1024手机看片你懂的| 国产精品区一区二区三在线播放 | 人成视频在线观看免费播放| 国产一区二区三区不卡在线观看 | 国产成人综合日韩精品无| 精品一区二区av在线| 国产在线 | 中文| 无码人妻视频一区二区三区99久久| 中国av一区二区三区四区| 中国少妇×xxxx性裸交| 韩国三级中文字幕hd久久精品 | 国产精品原创巨作av无遮| 淫秽在线中国国产视频|