亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Hadoop的高校大數(shù)據(jù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)

        2019-10-21 09:32:15彭航
        知識(shí)文庫(kù) 2019年19期
        關(guān)鍵詞:存儲(chǔ)管理數(shù)據(jù)管理結(jié)構(gòu)化

        彭航

        本文在對(duì)Hadoop平臺(tái)的結(jié)構(gòu)及功能分析基礎(chǔ)上,結(jié)合信息化環(huán)境下高校系統(tǒng)建設(shè)的現(xiàn)狀,對(duì)基于Hadoop的高校大數(shù)據(jù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)進(jìn)行研究,以供參考。

        在信息化發(fā)展影響下,高校信息系統(tǒng)建設(shè)與運(yùn)用也取得了較為顯著的發(fā)展,并且在長(zhǎng)期的運(yùn)營(yíng)與管理中積累了相對(duì)較多的數(shù)據(jù),對(duì)高校信息化建設(shè)與發(fā)展有著十分積極的作用和意義。指導(dǎo)注意的是,結(jié)合當(dāng)前高校信息系統(tǒng)建設(shè)與發(fā)展現(xiàn)狀,由于其信息系統(tǒng)的分階段建設(shè),導(dǎo)致在對(duì)系統(tǒng)運(yùn)營(yíng)及數(shù)據(jù)管理中是由多個(gè)不同部門分別執(zhí)行,各數(shù)據(jù)之間的相互聯(lián)系與有效交互明顯不足。另一方面,在大數(shù)據(jù)環(huán)境下,通過大數(shù)據(jù)平臺(tái)的開發(fā)設(shè)計(jì)以實(shí)現(xiàn)各信息系統(tǒng)之間的有效對(duì)接與信息交互,形成較為統(tǒng)一的數(shù)據(jù)運(yùn)營(yíng)與管理模式,成為各領(lǐng)域信息建設(shè)與運(yùn)營(yíng)管理研究和關(guān)注重點(diǎn)。

        1 Hadoop平臺(tái)及其結(jié)構(gòu)、功能分析

        Hadoop作為一個(gè)分布式系統(tǒng)的基礎(chǔ)架構(gòu),在實(shí)際設(shè)計(jì)與開發(fā)運(yùn)用中,是通過Hadoop集群中的一個(gè)主控節(jié)點(diǎn)對(duì)整個(gè)集群的運(yùn)行進(jìn)行控制與管理實(shí)現(xiàn),以滿足該集群中多個(gè)節(jié)點(diǎn)的數(shù)據(jù)與計(jì)算任務(wù)協(xié)調(diào)需求。其中,分布式文件系統(tǒng)HDFS以及MapReduce并行化計(jì)算框架是Hadoop集群系統(tǒng)的核心,HDFS是Hadoop平臺(tái)中分布式計(jì)算下數(shù)據(jù)存儲(chǔ)管理開展基礎(chǔ),具有較為突出的可靠性以及擴(kuò)展性和高容錯(cuò)性特征;而MapReduce并行計(jì)算框架能夠?qū)⒎治鋈蝿?wù)分成大量并行Map和Reduce任務(wù)以進(jìn)行Hadoop平臺(tái)運(yùn)行及功能支撐;此外,HBase是以HDFS為基礎(chǔ)的分布式數(shù)據(jù)庫(kù),能夠?qū)崿F(xiàn)海量數(shù)據(jù)存儲(chǔ),而Hive作為數(shù)據(jù)倉(cāng)庫(kù)處理工具,在Hadoop平臺(tái)運(yùn)行中主要用于HDFS或者是HBase中存儲(chǔ)的結(jié)構(gòu)化或者是半結(jié)構(gòu)化的數(shù)據(jù)管理。隨著對(duì)Hadoop研究的不斷發(fā)展,當(dāng)前Hadoop平臺(tái)已經(jīng)成為一個(gè)包含很多子系統(tǒng)大數(shù)據(jù)的處理生態(tài)系統(tǒng)。如下圖1所示,即為Hadoop平臺(tái)的結(jié)構(gòu)組成示意圖。

        2 基于Hadoop的高校大數(shù)據(jù)平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)研究

        根據(jù)上述對(duì)Hadoop平臺(tái)及其結(jié)構(gòu)功能的分析,結(jié)合當(dāng)前高校信息系統(tǒng)建設(shè)與數(shù)據(jù)管理現(xiàn)狀,可構(gòu)建如下圖2所示的基于Hadoop的高校大數(shù)據(jù)平臺(tái)系統(tǒng),其系統(tǒng)結(jié)構(gòu)主要包括數(shù)據(jù)源、數(shù)據(jù)集成、Hadoop平臺(tái)管理、分布式數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)分析、API接口、應(yīng)用單元等。

        其中,數(shù)據(jù)源中包含了高校的各個(gè)業(yè)務(wù)系統(tǒng)、文件系統(tǒng)、視頻監(jiān)控以及校園論壇等系統(tǒng)數(shù)據(jù),主要由結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)兩種形式,其中,結(jié)構(gòu)化數(shù)據(jù)以Sqlserver和Oracle數(shù)據(jù)庫(kù)為數(shù)據(jù)存儲(chǔ)位置,主要以高校各業(yè)務(wù)系統(tǒng)數(shù)據(jù)為主;而非結(jié)構(gòu)化數(shù)據(jù)中,部分?jǐn)?shù)據(jù)是以blob格式在數(shù)據(jù)庫(kù)或者是文件系統(tǒng)中進(jìn)行存儲(chǔ)管理。

        基于Hadoop的高校大數(shù)據(jù)平臺(tái)系統(tǒng)中的數(shù)據(jù)集成單元,包含了數(shù)據(jù)采集以及清洗、整合等環(huán)節(jié),是數(shù)據(jù)源中數(shù)據(jù)提取至Hadoop憑條數(shù)據(jù)分析的中間結(jié)構(gòu),其中,該結(jié)構(gòu)單元在進(jìn)行數(shù)據(jù)采集中是通過Sqoop實(shí)現(xiàn)關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)導(dǎo)向Hadoop平臺(tái)的HDFS或者是HIVE進(jìn)行導(dǎo)入。

        分布式數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)單元中,進(jìn)行結(jié)構(gòu)化數(shù)據(jù)是以表格格式在Hadoop平臺(tái)的Hive中進(jìn)行存儲(chǔ)管理,或者是將數(shù)據(jù)轉(zhuǎn)換成Key-value形式在HBASE中進(jìn)行存儲(chǔ)管理,還可以通過文件格式在HDFS中進(jìn)行存儲(chǔ);而非結(jié)構(gòu)化數(shù)據(jù)是通過目錄與文件組織方式在HDFS中進(jìn)行存儲(chǔ)管理。

        此外,高校大數(shù)據(jù)平臺(tái)系統(tǒng)的大數(shù)據(jù)分析單元在系統(tǒng)運(yùn)行中,通過Hadoop平臺(tái)進(jìn)行多種數(shù)據(jù)處理與分析框架提供,并根據(jù)不同應(yīng)用場(chǎng)景實(shí)現(xiàn)合適的數(shù)據(jù)處理框架和模型選擇,來(lái)滿足其數(shù)據(jù)離線分析與流式計(jì)算需求。在智能分析與可視化單元中可以通過機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘計(jì)算對(duì)數(shù)據(jù)進(jìn)行更深層次的分析,最終以圖表或者導(dǎo)航儀等形式進(jìn)行中展現(xiàn),并實(shí)現(xiàn)數(shù)據(jù)分析結(jié)果的可視化圖形或文字呈現(xiàn)效果,使其更加容易被理解和運(yùn)用,對(duì)數(shù)據(jù)分析結(jié)果在高校門戶網(wǎng)站或者是移動(dòng)APP程序中進(jìn)行展示。

        最后,在高校大數(shù)據(jù)平臺(tái)的應(yīng)用單元能夠通過API接口對(duì)所有處理數(shù)據(jù)及分析結(jié)果在高校門戶網(wǎng)站或者是移動(dòng)APP程序中進(jìn)行調(diào)用,或者是在其他系統(tǒng)中進(jìn)行展示與應(yīng)用,以達(dá)到數(shù)據(jù)集中管理和運(yùn)用的目的。

        根據(jù)上述所構(gòu)建的基于Hadoop的高校大數(shù)據(jù)平臺(tái)系統(tǒng),為驗(yàn)證該平臺(tái)中Hadoop平臺(tái)管理的Hive存儲(chǔ)能夠順利實(shí)現(xiàn)高校各業(yè)務(wù)系統(tǒng)數(shù)據(jù)提取,并將處理數(shù)據(jù)向業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)

        進(jìn)行導(dǎo)出,以某高校MySQL數(shù)據(jù)為例,設(shè)計(jì)該數(shù)據(jù)庫(kù)中學(xué)生一卡通數(shù)據(jù)在Sqoop工具支持下向Hadoop平臺(tái)管理的Hive進(jìn)行導(dǎo)入,同時(shí)將Hive數(shù)據(jù)分析結(jié)果向MySQL系統(tǒng)導(dǎo)出實(shí)驗(yàn),實(shí)驗(yàn)分析過程顯示,在數(shù)據(jù)量較小情況下,Hadoop平臺(tái)管理的數(shù)據(jù)運(yùn)算與讀寫時(shí)間與Oracal相比無(wú)明顯優(yōu)勢(shì),但是,數(shù)據(jù)量較大情況下,Hadoop平臺(tái)管理集群優(yōu)勢(shì)明顯,其數(shù)據(jù)預(yù)算及分析時(shí)間明顯較短,由此可見,基于Hadoop的高校大數(shù)據(jù)平臺(tái)設(shè)計(jì)方案可行。

        3 結(jié)束語(yǔ)

        總之,針對(duì)高校信息系統(tǒng)建設(shè)與發(fā)展現(xiàn)狀,進(jìn)行基于Hadoop的高校大數(shù)據(jù)平臺(tái)開發(fā)設(shè)計(jì),以促進(jìn)其在高校信息系統(tǒng)運(yùn)營(yíng)與數(shù)據(jù)管理中的運(yùn)用實(shí)現(xiàn),具有十分積極的價(jià)值和作用。

        (作者單位:岳陽(yáng)職業(yè)技術(shù)學(xué)院)

        猜你喜歡
        存儲(chǔ)管理數(shù)據(jù)管理結(jié)構(gòu)化
        企業(yè)級(jí)BOM數(shù)據(jù)管理概要
        定制化汽車制造的數(shù)據(jù)管理分析
        海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實(shí)踐
        促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
        CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
        結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
        一種衛(wèi)星數(shù)據(jù)廣播系統(tǒng)端站存儲(chǔ)管理方案設(shè)計(jì)
        電子制作(2017年13期)2017-12-15 09:00:32
        文檔存儲(chǔ)管理系統(tǒng)的設(shè)計(jì)
        省級(jí)氣象數(shù)據(jù)文件共享存儲(chǔ)管理系統(tǒng)研究
        基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
        7m精品福利视频导航| 日本高清一区二区三区在线| 日本女优中文字幕在线播放 | 手机看片自拍偷拍福利| 日韩毛片无码永久免费看| 在线综合网| 成人精品国产亚洲av久久| 国产色婷婷久久又粗又爽| 九色九九九老阿姨| 91av国产视频| 人妻在线中文字幕视频| 粉嫩国产av一区二区三区| 亚洲av无码久久精品狠狠爱浪潮 | 男男做h嗯啊高潮涩涩| 五月综合激情婷婷六月| 亚洲欧洲中文日韩久久av乱码| 色婷婷狠狠97成为人免费| 黄色潮片三级三级三级免费| 帅小伙自慰videogay男男| 激情久久av一区av二区av三区| 国产在视频线精品视频二代| 精品高清一区二区三区人妖| а√中文在线资源库| 精品一区二区三区在线观看视频 | 人妻av鲁丝一区二区三区| 久久久久国产一级毛片高清版A| 亚洲男人在线天堂av| 久久午夜福利电影| 午夜精品久久久久久中宇| 亚洲色拍拍噜噜噜最新网站| 蜜桃网站免费在线观看视频| 免费人妻无码不卡中文字幕系| 久久亚洲欧洲无码中文| 都市激情亚洲综合一区| 日韩亚洲精品中文字幕在线观看| 亚洲aⅴ天堂av天堂无码麻豆| 亚洲一区二区在线视频播放| 三级网站亚洲三级一区| 亚洲精品无码高潮喷水a片软| 99re这里只有热视频| 精品国产车一区二区三区|