亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Spark大數(shù)據(jù)處理平臺的構(gòu)建及應(yīng)用

        2016-09-08 08:56:34蔡文濤
        中國新通信 2016年15期
        關(guān)鍵詞:公鑰解密結(jié)構(gòu)化

        蔡文濤

        【摘要】 本文簡述了大數(shù)據(jù)產(chǎn)生的原因及背景,并對大數(shù)據(jù)的4個特點進行了說明:數(shù)據(jù)體量巨大,數(shù)據(jù)種類繁多,流動速度快,價值密度低。由此引出對大數(shù)據(jù)處理平臺的需求,針對當(dāng)前最為流行的Spark處理平臺,介紹了環(huán)境平臺的搭建過程及可能的相關(guān)分析應(yīng)用,為相關(guān)人員開展大數(shù)據(jù)分析處理工作提供一定參考。

        【關(guān)鍵字】 大數(shù)據(jù)分析 Hadoop Spark 內(nèi)存計算

        一、引言

        近年來,大數(shù)據(jù)成為工業(yè)界與學(xué)術(shù)界關(guān)注的熱點,因為隨著存儲設(shè)備容量的快速增長、CPU處理能力的大幅提升、網(wǎng)絡(luò)帶寬的不斷增加,也為大數(shù)據(jù)時代提供了強有力的技術(shù)支撐。從web1.0到web2.0,每個用戶都成為一個自媒體,一個互聯(lián)網(wǎng)內(nèi)容的提供者,這種數(shù)據(jù)產(chǎn)生方式的變革更是推動著大數(shù)據(jù)時代的到來。

        二、相關(guān)研究

        什么是大數(shù)據(jù)呢?大數(shù)據(jù)是由結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)組成的,其中10%為結(jié)構(gòu)化數(shù)據(jù),存儲于各類數(shù)據(jù)庫中,90%為非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)如圖片、視頻、郵件、網(wǎng)頁等,現(xiàn)如今,大數(shù)據(jù)應(yīng)用以滲透到各行各業(yè),數(shù)據(jù)驅(qū)動決策,信息社會智能化程度大幅提高。目前,國內(nèi)相關(guān)技術(shù)主要集中在數(shù)據(jù)挖掘相關(guān)算法、實際應(yīng)用及有關(guān)理論方面的研究,涉及行業(yè)比較廣泛,包括零售業(yè)、制造業(yè)、金融業(yè)、電信業(yè)、網(wǎng)絡(luò)相關(guān)專業(yè)、醫(yī)療保健及科學(xué)領(lǐng)域,單位集中在部分高等院校、研究所和公司,特別是在IT等新興領(lǐng)域,阿里巴巴、騰訊、百度等巨頭對技術(shù)發(fā)展推動作用巨大,而這些互聯(lián)網(wǎng)巨頭們在大數(shù)據(jù)處理中,又紛紛采用了Hadoop、Spark這一處理框架。

        三、基于spark的大數(shù)據(jù)處理平臺

        3.1大數(shù)據(jù)平臺搭建

        環(huán)境說明:3臺裝有Ubuntu14.04操作系統(tǒng)的PC機,Hadoop 2.6.0,Spark1.6.0。

        Hadoop環(huán)境的搭建首先從apache官網(wǎng)下載合適版本的Hadoop代碼,本文中安裝的Hadoop版本為Hadoop 2.6.0。首先需要在各臺實驗PC機之間設(shè)置SSH免密碼登錄,無密碼登錄的原理:用戶在 master上生成一個密鑰對,包括一個公鑰和一個私鑰,并將公鑰復(fù)制到所有的 slave上。然后當(dāng) master 通過 SSH 連接 slave 時, slave 就會生成一個隨機數(shù)并用 master 的公鑰對隨機數(shù)進行加密,并發(fā)送給 master ,master用自己的私鑰進行解密得到解密數(shù),并將解密數(shù)回傳給slave,slave確認解密數(shù)無誤之后就允許master不輸入密碼進行連接了,通過免密碼登錄主節(jié)點于從節(jié)點之間即可進行數(shù)據(jù)計算結(jié)果的快速交互。隨后確認本機上是否安裝了jdk,如未安裝需要先安裝Java的jdk,本環(huán)境中使用的是jdk1.8.0版本。

        然后將下載的Hadoop文件解壓到某個目錄下,進行Hadoop的配置過程,涉及的配置文件有7個,分別為hadoop-env.sh,yarn-env.sh,slaves,core-site.xml,hdfs-site. xml,mapred-site.xml,yarn-site.xml,具體配置參數(shù)可查看相關(guān)教程。在主節(jié)點(master)配置完畢后,將整個Hadoop文件夾依次拷貝到各個slave節(jié)點。Hadoop安裝完畢后,即可啟動驗證,首先格式化Hadoop節(jié)點,執(zhí)行以下命令,只需格式一次:

        $hadoop namenode -format

        進入Hadoop目錄下的sbin文件夾,啟動Hadoop,

        $./start-all.sh

        檢查Hadoop進程,

        $jps

        master節(jié)點上有如下進程,如圖1:

        slave節(jié)點上有如下進程,如圖2:

        表明Hadoop集群已配置完成。

        安裝完Hadoop后,即可進行Spark安裝文件的配置,基本同Hadoop的配置相似,將Spark安裝完畢后,可以啟動spark-shell查看安裝是否成功。

        3.2大數(shù)據(jù)平臺分析

        spark集群處理環(huán)境搭建完畢后,我們可以使用其進行簡單的數(shù)據(jù)分析,spark1.6.0中也為我們提供了示例代碼,涵蓋流計算、圖計算、機器學(xué)習(xí)、sql查詢處理等程序,用戶可以方便的參考學(xué)習(xí),從而進行自己的開發(fā)應(yīng)用。

        參 考 文 獻

        [1]王珊,王會舉,覃雄派,周烜. 架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J]. 計算機學(xué)報. 2011(10)

        [2]樊嘉麒. 基于大數(shù)據(jù)的數(shù)據(jù)挖掘引擎[D]. 北京郵電大學(xué) 2015

        猜你喜歡
        公鑰解密結(jié)構(gòu)化
        解密“熱脹冷縮”
        促進知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
        解密“一包三改”
        少先隊活動(2020年9期)2020-12-17 06:17:31
        結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
        計算機教育(2020年5期)2020-07-24 08:53:00
        炫詞解密
        一種基于混沌的公鑰加密方案
        HES:一種更小公鑰的同態(tài)加密算法
        SM2橢圓曲線公鑰密碼算法綜述
        基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
        計算機工程(2015年8期)2015-07-03 12:20:35
        解密“大調(diào)解”
        久久亚洲国产高清av一级| 熟女性饥渴一区二区三区| 亚洲国产美女精品久久久| 吃奶还摸下面动态图gif| 99久久精品一区二区三区蜜臀 | 亚洲一码二码在线观看| 亚洲香蕉久久一区二区| 久久精品亚洲熟女av蜜謦| 蜜臀亚洲av无码精品国产午夜.| 久久久久亚洲av无码专区首jn | 国产黑色丝袜在线观看下 | 亚洲av无码国产精品久久| 亚洲精品无码成人a片| 91情侣视频| 亚洲香蕉av一区二区蜜桃| 91国产精品自拍在线观看| 48久久国产精品性色aⅴ人妻| 最好看的最新高清中文视频| 国内精品一区视频在线播放| 精品视频在线观看一区二区三区| 国产亚洲中文字幕久久网| 蜜桃视频在线看一区二区三区| 中文字幕v亚洲日本| 亚洲人成无码网站久久99热国产| 日韩无码电影| 丰满人妻无套内射视频| 91露脸半推半就老熟妇| 日韩少妇内射免费播放| 伊人亚洲综合网色AV另类| 极品少妇一区二区三区四区| 日韩在线不卡一区三区av| 国产成人精品无码免费看| 亚洲av成人无码网站…| 国产精品中文第一字幕| 成人自拍偷拍视频在线观看| 免费人成年激情视频在线观看| 男女扒开双腿猛进入免费看污 | 国产成人精品三级91在线影院 | 久久亚洲精品成人AV无码网址| 日韩一区二区av伦理| 日本视频二区在线观看|