亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Hadoop平臺的大數(shù)據(jù)應(yīng)用系統(tǒng)解決方案

        2017-12-19 09:15:22朱立
        科學(xué)與財富 2017年33期
        關(guān)鍵詞:大數(shù)據(jù)

        摘要:當(dāng)前在進(jìn)行大數(shù)據(jù)應(yīng)用過程中存在三方面的問題,分別是大數(shù)據(jù)的存儲、分析和管理的問題,如果不能有效解決這些問題,將會直接影響其發(fā)展和應(yīng)用。下面在總結(jié)前人經(jīng)驗(yàn)的基礎(chǔ)上,根據(jù)當(dāng)前研究所得到的成果,提出有效的解決策略,希望給有關(guān)人士一些借鑒。

        關(guān)鍵詞:Hadoop平臺;大數(shù)據(jù);應(yīng)用系統(tǒng)

        當(dāng)前移動電子商務(wù)、云計算、互聯(lián)網(wǎng)得到的快速發(fā)展,在整個數(shù)據(jù)庫市場中大數(shù)據(jù)占據(jù)很重要的地位,而且這一趨勢還在繼續(xù)發(fā)展,由此可見,基于Hadoop平臺的大數(shù)據(jù)將會得到廣泛的推廣。大數(shù)據(jù)具有廣度寬、深度深、規(guī)模大的特點(diǎn),而且處理時間短,要求處理效果高,當(dāng)前在應(yīng)用中存在一定問題,下面就深入分析這方面的問題。

        1分析大數(shù)據(jù)的存儲問題和解決方案

        1.1大數(shù)據(jù)的存儲問題

        HDFS屬于一種分布式文件系統(tǒng),其中一個文 件以多個block的形式存放在多個Namenode節(jié)點(diǎn)上,每個block有多個副本,副本存放的位置根據(jù)HDFS放置算法來決定,但是在這方面還要注意,在HDFS中缺省block副本數(shù)和大小,但是對于所缺省的參數(shù)可以重新進(jìn)行設(shè)置,對于CLIENT文件,可以臨時設(shè)置兩個參數(shù),有效提高了系統(tǒng)的靈活性,在文件中其邏輯處理單元、重要性、大小都不同。由此可見,HDFS可以對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲,對數(shù)據(jù)實(shí)施分布式計算,具有較高的性價比,系統(tǒng)運(yùn)行可靠性比較高,通過增加機(jī)器設(shè)備,就可以保證系統(tǒng)的存儲能力。HDFS文件在讀寫并行方面存在問題,其已經(jīng)可以讀讀并行,但是寫讀并行、讀寫并行中會受到制約,對于正在寫操作的文件,讀用戶看不到最后的block內(nèi)容。

        1.2相應(yīng)的解決方案

        針對HDFS文件在讀寫并行方面存在問題,技術(shù)人員分析了HDFS文件組織方式,其真實(shí)數(shù)據(jù)文件和元數(shù)據(jù)文件是單獨(dú)存放的,其中的每個數(shù)據(jù)塊都和本地文件系統(tǒng)相對應(yīng),因此在處理這一問題時,先不要改動HDFS的主要接口和主要特點(diǎn),利用這方面的邏輯處理功能,編號算法等,對不同的HDFS文件進(jìn)行塊集合組合,可以有效解決問題。

        2 大數(shù)據(jù)分析過程的問題和解決方案

        2.1 Hadoop生態(tài)系統(tǒng)存在的問題

        Hadoop生態(tài)系統(tǒng)進(jìn)行數(shù)據(jù)分析時有其自己的特點(diǎn),對板結(jié)構(gòu)化的數(shù)據(jù)、非結(jié)構(gòu)的化的數(shù)據(jù)比較容易處理,系統(tǒng)擁有很好的容錯性和擴(kuò)展性,該系統(tǒng)的接口類型很多,適應(yīng)運(yùn)行環(huán)境的異構(gòu)性,該計算模型可以采用并行方式計算,因此該系統(tǒng)可以得到很好的性能,但是這一系統(tǒng)在相同條件下,和商業(yè)并行數(shù)據(jù)庫進(jìn)行測試對比,其在性能方面存在很大的劣勢。

        2.2有效的解決方案分析

        為了解決上述的問題,可以從三個方面進(jìn)行分析,第一點(diǎn),Hadoop生態(tài)系統(tǒng)開始研發(fā)時是針對半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù);第二點(diǎn),這一生態(tài)系統(tǒng)容錯性和可擴(kuò)展性非常好,技術(shù)人員在改進(jìn)時,如果增加節(jié)點(diǎn)數(shù)量就可以得到很好的性能,因此在使用中不需要在相同條件下和并行數(shù)據(jù)庫進(jìn)行對比。在增加了節(jié)點(diǎn)的數(shù)量后,沒有必要對SQL接口查詢命令進(jìn)行修改,也沒有必要對編程語言進(jìn)行修改,達(dá)到很好的效果。機(jī)器使用的是中低端設(shè)備,其對性價比沒有較大的影響,當(dāng)前生態(tài)系統(tǒng)自身也可以對其問題、性能等進(jìn)行優(yōu)化,例如數(shù)據(jù)的壓縮優(yōu)化、job調(diào)度程序優(yōu)化,體系結(jié)構(gòu)優(yōu)化等。當(dāng)前主要有兩種解決方式,分別是混合型MapReduce解決方式,其主要吸收了并行數(shù)據(jù)中的一些特點(diǎn),還有一種是經(jīng)典型MapReduce解決方式,主要針對生態(tài)系統(tǒng)中的HadoopDB項目和HadoopDB MapRe-duce項目。

        3大數(shù)據(jù)管理問題和解決方案

        3.1分析大數(shù)據(jù)管理中有待解決的問題

        一般在大數(shù)據(jù)管理中都不重視易用性,其中的hadoop也有類似的問題,但是在商業(yè)解決方案中技術(shù)人員就注意到了這一點(diǎn),因此在設(shè)計中具有針對性,有效解決了這一問題。例如IBM大數(shù)據(jù)解決方案中,BI-ginsights對相應(yīng)的集群、作業(yè)運(yùn)行、HDFS文件管理有一個統(tǒng)一的管理模式,管理中系統(tǒng)具有可視化功能,對于大數(shù)據(jù)解決方案而言,也有賴于內(nèi)部的集群管理系統(tǒng)。對于一個完整的大數(shù)據(jù)解決方案而言,必須使用到一體化的管理系統(tǒng),這一系統(tǒng)在管理中包括很多的項目,例如通過大量機(jī)器構(gòu)成大集群和小集群,具有多種數(shù)據(jù)來源,涉及到很多作業(yè)的運(yùn)行和部署。在管理中如果只使用手工操作,沒有專業(yè)的平臺和技術(shù)工具等,不能保證系統(tǒng)的工作效率,間接也會影響系統(tǒng)的進(jìn)一步推廣。相關(guān)企業(yè)雖然使用這一生態(tài)系統(tǒng)建立了平臺,沒有一個完整的集群配置平臺,在刪除節(jié)點(diǎn)和增加節(jié)點(diǎn)時必須進(jìn)行手工操作,進(jìn)行參數(shù)配置時主要依靠個人經(jīng)驗(yàn),工作中沒有可靠的模擬器來幫助。從當(dāng)前的解決方案中分析,在對Hadoop生態(tài)系統(tǒng)大數(shù)據(jù)管理中,主要應(yīng)用了Ganglia和Sqoop[1]。

        3.2分析具體的解決方案

        解決大數(shù)據(jù)中的管理問題時,主要引入了Sqoop技術(shù),其可以將生態(tài)系統(tǒng)以外的內(nèi)容導(dǎo)入其中,還可以將內(nèi)部的數(shù)據(jù)導(dǎo)出,具體應(yīng)用Sqoop技術(shù)時主要存在下列問題,缺少圖形化的客戶端,導(dǎo)入的效率還需要進(jìn)一步提高 穩(wěn)定性問題需要解決。針對這一情況,技術(shù)人員進(jìn)行了深入的研究,進(jìn)而開發(fā)設(shè)計出了插件、application、Web客戶端。在使用中發(fā)現(xiàn)使用Sqoop進(jìn)行大表導(dǎo)入過程中,工作狀態(tài)較差,導(dǎo)入效率低,而且經(jīng)常出現(xiàn)問題,技術(shù)人員根據(jù)MapReduce設(shè)計出了大表導(dǎo)入編程模型,在該方式下實(shí)行切分算法,具體而言,對大表總的記錄mapper數(shù)求步長,得到與之對應(yīng)的splitSQL查詢語句的起始行和區(qū)間長度,最終就可以保證導(dǎo)入工作量完全相同;這一模型工作方式是先進(jìn)入 到MAP函數(shù)的鍵值對中的鍵[2],是split對應(yīng)的SQL語句,把查詢放入到地圖函數(shù)中,這樣使用這一模型時,對于其中的每一個mapper只調(diào)用一次map函數(shù),通過實(shí)驗(yàn)對比得知,使用的大表記錄數(shù)據(jù)都相同,測試中無論是記錄的分布情況還是區(qū)間情況,導(dǎo)入的時間都相同,或者對同一表分別用不同的分割字段,導(dǎo)入時間也完全相同。針對同一個大表模型而言,其實(shí)際導(dǎo)入效率比Sqoop有明顯的提高。在引入Ganglia技術(shù)時,主要存在兩個問題,分布是收集到的metrics數(shù)據(jù)只能進(jìn)行顯示,用戶不能制定自己的metrics。針對這一情況,可以在OpenTSDB架構(gòu)中融入Ganglia,這樣可以吧gmond所收集到的數(shù)據(jù)送往HBase和RRDTool中,有效解決了上述存在的問題,使用中可以進(jìn)行監(jiān)控,還有些保存了原始數(shù)據(jù)。

        總結(jié):

        通過以上對Hadoop平臺的大數(shù)據(jù)應(yīng)用系統(tǒng)解決方案分析,根據(jù)現(xiàn)實(shí)應(yīng)用中存在的問題,結(jié)合生態(tài)系統(tǒng)的特點(diǎn)解決其問題,可以得到顯著的效果。在商業(yè)的解決方案中,在服務(wù)、易用性、性能方面具有優(yōu)勢,在解決問題時,技術(shù)人員還優(yōu)化了相關(guān)項目,前言工作者已經(jīng)開始開發(fā)與之配套的管理套件。在以后的發(fā)展中,Hadoop生態(tài)系統(tǒng)發(fā)展速度會更快,但是在發(fā)展中要提高對大數(shù)據(jù)安全的重視度,否則影響會很大。

        參考文獻(xiàn):

        [1]陳吉榮,樂嘉錦.基于Hadoop生態(tài)系統(tǒng)的大數(shù)據(jù)解決方案綜述[J].計算機(jī)工程與科學(xué),2013,35(10):25-35.

        [2]向庭波,劉樹莊,何濤,等.大數(shù)據(jù)技術(shù)在卡口系統(tǒng)聯(lián)網(wǎng)方面的應(yīng)用——基于Hadoop的卡口系統(tǒng)云計算聯(lián)網(wǎng)平臺改造設(shè)計與開發(fā)[J].中國公共安全:學(xué)術(shù)版, 2015(11):45-50.

        作者姓名:朱立 出生年月:1970年3月 學(xué)歷:碩士endprint

        猜你喜歡
        大數(shù)據(jù)
        基于在線教育的大數(shù)據(jù)研究
        中國市場(2016年36期)2016-10-19 04:41:16
        “互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
        中國市場(2016年36期)2016-10-19 03:31:48
        基于大數(shù)據(jù)的小微電商授信評估研究
        中國市場(2016年35期)2016-10-19 01:30:59
        大數(shù)據(jù)時代新聞的新變化探究
        商(2016年27期)2016-10-17 06:26:00
        淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
        今傳媒(2016年9期)2016-10-15 23:35:12
        “互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
        今傳媒(2016年9期)2016-10-15 22:09:11
        大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
        中國記者(2016年6期)2016-08-26 12:36:20
        日韩亚洲欧美中文在线| 免费观看日本一区二区三区| 国内久久婷婷六月综合欲色啪 | 日韩人妻无码精品久久| 国产精在线| 国内色精品视频在线网址| 美艳善良的丝袜高跟美腿| 色婷婷五月综合久久| 国内露脸中年夫妇交换| 美女被射视频在线观看91| 在线中文字幕一区二区| 亚洲愉拍99热成人精品热久久| 亚洲色偷偷色噜噜狠狠99| 亚洲啊啊啊一区二区三区| 亚洲国产女性内射第一区二区| 国语对白做受xxxxx在| 日韩黑人欧美在线视频观看| 被驯服人妻中文字幕日本| 亚洲国产色婷婷久久精品| 青春草在线视频免费观看| 国产午夜久久久婷婷| 中文字幕久久人妻av| 真人做爰试看120秒| 99热久久精里都是精品6| 日韩不卡av高清中文字幕 | 国产一区二区三区av免费| 亚洲avav天堂av在线网毛片| 亚洲综合色秘密影院秘密影院| 国产精品国产三级在线专区| 欧美午夜理伦三级在线观看| 综合无码一区二区三区| 精品国产午夜久久久久九九 | 人妻少妇喷水意淫诱惑| 日本熟女中文字幕在线| 国产69精品久久久久999小说| 一区二区三区内射视频在线观看| 区一区二区三免费观看视频| 亚洲av无码乱码在线观看裸奔| 欧美日韩综合网在线观看| 女同同成片av免费观看| 亚洲日韩小电影在线观看|