亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于hadoop平臺(tái)海量數(shù)據(jù)的快速查詢與實(shí)現(xiàn)

        2016-10-18 21:17:22褚福銀張林何坤鵬
        電腦知識(shí)與技術(shù) 2016年21期
        關(guān)鍵詞:海量數(shù)據(jù)

        褚福銀+張林+何坤鵬

        摘要:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人類產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級(jí)增長(zhǎng),Hadoop作為大數(shù)據(jù)領(lǐng)域的常用工具,在現(xiàn)代生活中發(fā)揮著至關(guān)重要的作用。Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,在做查詢統(tǒng)計(jì)分析時(shí)最終翻譯成Hadoop平臺(tái)上的MapReduce程序運(yùn)行,當(dāng)數(shù)據(jù)量不斷增大時(shí),就會(huì)使得查詢效率[5]下降。該文就此提出了一種Hive與Spark結(jié)合的方案,將Hive的查詢作為Spark的任務(wù)提交到Spark集群上進(jìn)行計(jì)算,利用Spark的特性提高Hive 查詢性能。該研究首先理論闡述了Hive與Spark各自的工作機(jī)制,然后介紹Hive_Spark原理,最后通過(guò)做實(shí)驗(yàn),對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,分析,從而驗(yàn)證Hive_Spark提高了查詢效率,對(duì)大規(guī)模數(shù)據(jù)處理具有一定參考意義。

        關(guān)鍵詞:Hadoop;Hive;Spark;查詢;海量數(shù)據(jù)

        中圖分類號(hào):TP31 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)21-0003-03

        Abstract: With the development of Internet technology, The amount of data generated by humans is growing exponentially. Hadoop as a common tool in the field of big data, play a vital role in modern life. Hive is a data warehouse tools based on Hadoop, when doing statistical analysis queries eventually translated into Hadoop program running on the platform, when increasing amounts of data, it makes the query efficiency will be reduced. In this paper, we propose a Hive and Spark combination of the program, the Hive query as the task of Spark to submit to the Spark cluster computing, using the characteristics of Spark to improve the performance of Hive query. This research firstly theory elaborated the Hive and Spark their working mechanism, and then this paper introduces the principle of Hive_Spark finally by doing experiment, compared with the result of the experiment and analysis, to validate Hive_Spark improve the query efficiency, for large-scale data processing has a certain reference significance.

        Key words: Hadoop; Hive; Spark; Data query; Mass data

        1 引言

        隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的急速增長(zhǎng)以及對(duì)數(shù)據(jù)實(shí)時(shí)查詢的迫切需求使得傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)引擎難以滿足企業(yè)對(duì)大數(shù)據(jù)存儲(chǔ)與分析的需求。Hadoop[3-4] 作為一種開(kāi)源的架構(gòu)憑借其低成本、可伸縮性和高容錯(cuò)性等優(yōu)點(diǎn)開(kāi)始取代傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)[8],采用 MapReduce 編程模型可以對(duì)海量數(shù)據(jù)進(jìn)行有效分割和合理分配。hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具, 提供了類似SQL的查詢接口,但是由于Hive[13]的執(zhí)行引擎是將SQL編譯成一系列的MapReduce作業(yè)來(lái)運(yùn)行,其性能代價(jià)較高。本文提出了一種hive_spark的查詢模式,spark本身是基于內(nèi)存的迭代式計(jì)算,利用Spark的特性提高Hive 查詢性能[12]。

        2 Hive

        2.1Hive系統(tǒng)架構(gòu)

        Hive是建立在Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)構(gòu)架[11],它提供了一系列的工具,以用來(lái)進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載ETL,這是一種可以存儲(chǔ)、查詢和分析存儲(chǔ)在Hadoop中的大規(guī)模數(shù)據(jù)的機(jī)制。Hive定義了簡(jiǎn)單的類SQL查詢語(yǔ)言,稱為 HQL,它允許熟悉SQL的用戶查詢數(shù)據(jù),方便熟悉MapReduce開(kāi)發(fā)者的開(kāi)發(fā)自定義的mapper和reducer來(lái)處理內(nèi)建的mapper和reducer無(wú)法完成的復(fù)雜的分析工作。Hive是SQL解析引擎,它將SQL語(yǔ)句轉(zhuǎn)譯成M/R Job然后在Hadoop執(zhí)行。

        1) 用戶接口主要有三個(gè):CLI,Client 和 WUI。其中最常用的是CLI,Cli啟動(dòng)的時(shí)候,會(huì)同時(shí)啟動(dòng)一個(gè)Hive副本。Client是Hive的客戶端,用戶連接至Hive Server。在啟動(dòng) Client模式的時(shí)候,需要指出Hive Server所在節(jié)點(diǎn),并且在該節(jié)點(diǎn)啟動(dòng)Hive Server。 WUI是通過(guò)瀏覽器訪問(wèn)Hive。

        2) Hive將元數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,如mysql、derby。Hive中的元數(shù)據(jù)包括表的名字,表的列和分區(qū)及其屬性,表的屬性(是否為外部表等),表的數(shù)據(jù)所在目錄等[10]。

        3) 解釋器、編譯器、優(yōu)化器完成HQL查詢語(yǔ)句從詞法分析、語(yǔ)法分析、編譯、優(yōu)化以及查詢計(jì)劃的生成。生成的查詢計(jì)劃存儲(chǔ)在HDFS中,并在隨后有MapReduce調(diào)用執(zhí)行。

        猜你喜歡
        海量數(shù)據(jù)
        基于HADOOP集群的數(shù)據(jù)采集和清洗
        軟件工程(2016年11期)2017-01-17 17:05:51
        商業(yè)銀行海量金融數(shù)據(jù)分析中數(shù)據(jù)分析技術(shù)的實(shí)踐探究
        海量數(shù)據(jù)庫(kù)的設(shè)計(jì)與優(yōu)化
        一種基于HBase的交通旅行時(shí)間計(jì)算方法
        基于MapReduce的海量數(shù)據(jù)動(dòng)態(tài)裝箱算法研究
        基于遺傳算法的多中心海量數(shù)據(jù)布局研究
        成人免费无码a毛片| 免费1级做爰片1000部视频| 精品久久久久久中文字幕大豆网| 国精无码欧精品亚洲一区| 精品少妇大屁股白浆无码| av有码在线一区二区| 亚洲无精品一区二区在线观看| 精品熟人妻一区二区三区四区不卡| 7777色鬼xxxx欧美色妇| 亚洲色偷拍区另类无码专区| 国产精品麻豆A啊在线观看| 国产av一区二区三区天美| 三级全黄裸体| 欧美人与动人物姣配xxxx| 日韩国产精品一本一区馆/在线| 成人免费播放片高清在线观看| 日本免费久久高清视频| 国产乱子伦| 天天av天天爽无码中文| 国产三级自拍视频在线| 午夜福利影院成人影院| 国语对白做受xxxxx在线| 2022Av天堂在线无码| 亚洲一区二区一区二区免费视频| 91麻豆精品国产91久久麻豆| 自愉自愉产区二十四区| 成人精品一级毛片| 亚洲一区二区三区天堂av| 人人妻人人澡人人爽人人精品浪潮 | 国产女主播福利一区在线观看| 国产极品大秀在线性色| 免费无码精品黄av电影| 免费现黄频在线观看国产| 久久久亚洲精品一区二区| 亚洲三级视频一区二区三区 | 亚洲熟女少妇精品综合| 一夲道无码人妻精品一区二区 | 都市激情亚洲综合一区| 少妇一级淫片中文字幕| 国产精品免费大片| 亚洲最稳定资源在线观看|