亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        學(xué)生事務(wù)中心大數(shù)據(jù)平臺(tái)建設(shè)

        2018-07-26 09:25:24王扉
        關(guān)鍵詞:云計(jì)算數(shù)據(jù)中心大數(shù)據(jù)

        王扉

        摘 要:采用互聯(lián)網(wǎng)+、云計(jì)算、大數(shù)據(jù)相結(jié)合的技術(shù),建立學(xué)生事務(wù)大數(shù)據(jù)平臺(tái),對(duì)接現(xiàn)有的業(yè)務(wù)數(shù)據(jù)庫(kù)和文件數(shù)據(jù),通過(guò)優(yōu)秀的ETL工具對(duì)中心業(yè)務(wù)有幫助的各種不同的存儲(chǔ)格式的數(shù)據(jù)源進(jìn)行集中整合,建立集中數(shù)據(jù)倉(cāng)庫(kù),深入挖掘,實(shí)現(xiàn)智慧分析提供決策依據(jù)。

        關(guān)鍵詞:云計(jì)算 大數(shù)據(jù) 數(shù)據(jù)中心

        中圖分類號(hào):G645 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2018)02(a)-0158-02

        學(xué)生事務(wù)中心通過(guò)10余年的信息化建設(shè),已建成以業(yè)務(wù)條線為主體的“2+8+2”的12個(gè)平臺(tái)的建設(shè),包括學(xué)生學(xué)籍信息、學(xué)生就業(yè)信息、學(xué)生資助信息,非上海生源落戶信息等各類信息累計(jì)已超過(guò)千萬(wàn)條,在各個(gè)系統(tǒng)數(shù)據(jù)庫(kù)中橫向還不能通過(guò)數(shù)據(jù)庫(kù)層直接調(diào)用。希望在建設(shè)大數(shù)據(jù)平臺(tái),打通各個(gè)系統(tǒng)間的數(shù)據(jù)壁壘,建設(shè)一個(gè)學(xué)生事務(wù)中心的統(tǒng)一數(shù)據(jù)中心。

        1 建設(shè)學(xué)生事務(wù)中心大數(shù)據(jù)平臺(tái)的意義

        大數(shù)據(jù)重在實(shí)時(shí)處理與應(yīng)用,以獲得所需要的信息和知識(shí),從而實(shí)現(xiàn)商業(yè)價(jià)值以及為學(xué)生事務(wù)管理服務(wù)。數(shù)據(jù)挖掘和人工智能等應(yīng)用工具在大數(shù)據(jù)處理中發(fā)揮著重要作用,現(xiàn)代信息技術(shù)是大數(shù)據(jù)賴以存在和發(fā)展的重要支撐力量。解決信息孤島,通過(guò)大數(shù)據(jù)分析,挖掘歷年沉淀的學(xué)生信息數(shù)據(jù),意義重大。

        2 基于云計(jì)算架構(gòu)的大數(shù)據(jù)運(yùn)算分析平臺(tái)

        2.1 大數(shù)據(jù)基礎(chǔ)硬件平臺(tái)建設(shè)

        平臺(tái)運(yùn)行硬件環(huán)境:服務(wù)器群、大數(shù)據(jù)集中存儲(chǔ)、萬(wàn)兆網(wǎng)絡(luò)等。

        平臺(tái)運(yùn)行軟件環(huán)境:Linux、服務(wù)器虛擬化軟件、數(shù)據(jù)庫(kù)、地圖、可視化BI軟件等。

        平臺(tái)運(yùn)行技術(shù):采用分布式云計(jì)算技術(shù),彈性擴(kuò)張平臺(tái)運(yùn)算能力。

        2.2 分布式大數(shù)據(jù)管理層軟件

        (1)對(duì)接現(xiàn)有的業(yè)務(wù)數(shù)據(jù)庫(kù)和文件數(shù)據(jù)。

        (2)融合各類業(yè)務(wù)系統(tǒng)數(shù)據(jù)資源。將分散在各個(gè)業(yè)務(wù)子系統(tǒng)中的數(shù)據(jù)歸集起來(lái)(包括自有數(shù)據(jù)、上級(jí)數(shù)據(jù)、外部數(shù)據(jù)等),通過(guò)建立大數(shù)據(jù)平臺(tái),進(jìn)而充分挖掘數(shù)據(jù)價(jià)值,提供全員使用的檢索功能,提供多維度數(shù)據(jù)支持。通過(guò)優(yōu)秀的ETL工具對(duì)中心業(yè)務(wù)有幫助的各種不同的存儲(chǔ)格式的數(shù)據(jù)源進(jìn)行集中整合,建立集中數(shù)據(jù)倉(cāng)庫(kù):文本格式、oracle數(shù)據(jù)庫(kù)、sql數(shù)據(jù)庫(kù)、sysbasee數(shù)據(jù)庫(kù)、access數(shù)據(jù)庫(kù)、txt文件、excle文件、data文件等;建設(shè)可配置的自動(dòng)抽取方案。

        (3)建立分布式文件系統(tǒng)。建立分布式大數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù),包括分布式關(guān)系型數(shù)據(jù)庫(kù)、對(duì)象存儲(chǔ)、圖數(shù)據(jù)庫(kù)。對(duì)不同來(lái)源的每條數(shù)據(jù)給予40位唯一哈希值,避免數(shù)據(jù)的重復(fù)性。建立數(shù)據(jù)索引,便于快速查詢以及快速調(diào)用。元數(shù)據(jù)管理。數(shù)據(jù)的安全管理和審計(jì)。

        2.3 數(shù)據(jù)感知與數(shù)據(jù)處理建設(shè)

        數(shù)據(jù)標(biāo)簽的建立,多達(dá)數(shù)百種標(biāo)簽的定義。表關(guān)聯(lián)定義。關(guān)系發(fā)掘。搜索引擎,包括全文檢索、漸進(jìn)式搜索、單表查詢等。算法庫(kù)建設(shè),數(shù)據(jù)的分析挖掘、比對(duì)碰撞??梢暬ㄔO(shè),包括地理位置展現(xiàn),儀表盤(pán),圖表建設(shè)。

        2.4 數(shù)據(jù)分析及應(yīng)用模型建設(shè)

        指標(biāo)模型:結(jié)合學(xué)籍管理經(jīng)驗(yàn),自定義各類指標(biāo),系統(tǒng)自動(dòng)計(jì)算匯總異常指標(biāo),并發(fā)送給應(yīng)用系統(tǒng)及相關(guān)警員。比對(duì)模型。通過(guò)比對(duì)模型比對(duì)出來(lái)的預(yù)警信息,系統(tǒng)可以根據(jù)設(shè)定自動(dòng)發(fā)送到指定的單位。學(xué)生管理。知識(shí)管理。

        2.5 API建設(shè)

        平臺(tái)向應(yīng)用系統(tǒng)提供豐富的API接口,應(yīng)用層可以通過(guò)大數(shù)據(jù)平臺(tái)獲取綜合信息及數(shù)據(jù)分析的結(jié)果。

        3 基于云計(jì)算的大數(shù)據(jù)平臺(tái)設(shè)計(jì)

        大數(shù)據(jù)支撐體系架構(gòu)如下。建設(shè)基于云計(jì)算的大數(shù)據(jù)平臺(tái)管理軟件,對(duì)大數(shù)據(jù)底層軟件進(jìn)行統(tǒng)一管理,既要管理服務(wù)總線,又要統(tǒng)一管理大數(shù)據(jù)底層各類軟件。各個(gè)業(yè)務(wù)系統(tǒng)需要通過(guò)服務(wù)總線獲取數(shù)據(jù)查詢信息或者數(shù)據(jù)分析結(jié)果。

        3.1 大數(shù)據(jù)軟件平臺(tái)建設(shè)

        如圖1所示,采用業(yè)界先進(jìn)的理論體系,支撐各類數(shù)據(jù)結(jié)構(gòu)及大批量數(shù)據(jù)的存放、查詢、分析,并且大數(shù)據(jù)平臺(tái)能主動(dòng)學(xué)習(xí),發(fā)現(xiàn)數(shù)據(jù)價(jià)值。所以,大數(shù)據(jù)平臺(tái)融合MPP數(shù)據(jù)庫(kù)、Hadoop、搜索引擎、圖數(shù)據(jù)庫(kù)、消息總線、內(nèi)存數(shù)據(jù)庫(kù)、NOSQL等先進(jìn)的技術(shù),形成統(tǒng)一管理的數(shù)據(jù)平臺(tái)。

        大數(shù)據(jù)平臺(tái)對(duì)業(yè)務(wù)系統(tǒng)的支撐方式主要包括兩大類:數(shù)據(jù)查詢服務(wù)、數(shù)據(jù)分析服務(wù)。為了實(shí)現(xiàn)對(duì)應(yīng)用的支撐,大數(shù)據(jù)平臺(tái)需要具備的功能架構(gòu)分為三層:基礎(chǔ)數(shù)據(jù)層、數(shù)據(jù)感知層、學(xué)習(xí)層。

        3.2 數(shù)據(jù)管理層

        (1)數(shù)據(jù)采集:由于數(shù)據(jù)類型豐富,需要專門(mén)的ETL模塊,將來(lái)自O(shè)ralce\SQL Server\DB2\MySQL,以及Excel\PDF\Word文件,甚至還有錄音錄像文件采集到大數(shù)據(jù)平臺(tái),而且ETL工具采集過(guò)來(lái)后,要和大數(shù)據(jù)文件系統(tǒng)及數(shù)據(jù)倉(cāng)庫(kù)對(duì)接起來(lái)入庫(kù)。

        (2)元數(shù)據(jù)管理:元數(shù)據(jù)是主數(shù)據(jù)的基礎(chǔ),元數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行分類存放,追溯數(shù)據(jù)的血緣關(guān)系,建立數(shù)據(jù)之間的關(guān)聯(lián),以及對(duì)每條數(shù)據(jù)的屬性做管理,實(shí)現(xiàn)數(shù)據(jù)的生命周期管理。

        (3)數(shù)據(jù)標(biāo)準(zhǔn)化:由于數(shù)據(jù)來(lái)源不同,格式不同,存放方式不同,所以從采集入庫(kù)的裸倉(cāng),到可以使用的數(shù)倉(cāng),需要做數(shù)據(jù)標(biāo)準(zhǔn)化處理。否則系統(tǒng)呈現(xiàn)的格式以及方式都不同,比如有些表定義“男”“女”,有些表定義成“1”“0”。有些定義成數(shù)值,有些定義成字符。這個(gè)是較大的數(shù)據(jù)治理過(guò)程。

        (4)數(shù)據(jù)標(biāo)識(shí):每條數(shù)據(jù)給予40位哈希值唯一標(biāo)識(shí)符,不能重復(fù)。每條數(shù)據(jù)建立唯一索引。

        (5)分布式文件系統(tǒng):分布式存放,使得系統(tǒng)具備動(dòng)態(tài)可擴(kuò)充的彈性架構(gòu)。

        (6)分布式數(shù)據(jù)倉(cāng)庫(kù):大數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)分析挖掘的基礎(chǔ),支持超大規(guī)模的數(shù)據(jù)量。數(shù)據(jù)倉(cāng)庫(kù)是由內(nèi)存數(shù)據(jù)庫(kù),大規(guī)模并行處理數(shù)據(jù)庫(kù)及Hbase等構(gòu)成。

        (7)圖數(shù)據(jù)庫(kù):存放大量的實(shí)體、對(duì)象之間的關(guān)系。

        (8)安全審計(jì):大數(shù)據(jù)平臺(tái)的安全,審計(jì),權(quán)限管理。

        3.3 數(shù)據(jù)感知層

        (1)標(biāo)簽定義:通常是數(shù)據(jù)庫(kù)中沒(méi)有存在的表示方式, 經(jīng)過(guò)某些指標(biāo)對(duì)應(yīng),給實(shí)體對(duì)象一個(gè)屬性標(biāo)志?;蛘咄ㄟ^(guò)某些事件,給實(shí)體一個(gè)事件標(biāo)識(shí)。

        (2)關(guān)聯(lián)定義:同樣包括屬性關(guān)聯(lián)和事件關(guān)聯(lián)。建立數(shù)據(jù)關(guān)聯(lián),要經(jīng)過(guò)需求調(diào)研,對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行分析,制定關(guān)聯(lián)規(guī)則等系列過(guò)程。在眾多表之間,眾多對(duì)象之間,要定義是可以被關(guān)聯(lián)的,關(guān)聯(lián)定義是關(guān)聯(lián)分析的基礎(chǔ)。關(guān)聯(lián)分析又稱關(guān)聯(lián)挖掘,就是在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。

        (3)知識(shí)管理:有關(guān)實(shí)體的非結(jié)構(gòu)化文檔管理方法。

        (4)搜索引擎:在數(shù)據(jù)分類之后,提供全文檢索功能。

        (5)條件篩查:用戶自定條件,發(fā)現(xiàn)符合多重條件的結(jié)果。

        (6)時(shí)空特征:實(shí)體對(duì)象的屬性改變或事件發(fā)生的時(shí)空排序,用于梳理實(shí)體的演變。比如某學(xué)生什么時(shí)候取得了某項(xiàng)獎(jiǎng)勵(lì),什么時(shí)候參加實(shí)習(xí)等等。

        (7)報(bào)表可視化:為分析預(yù)警的可視化呈現(xiàn)提供了編程接口工具。

        (8)地址數(shù)據(jù)庫(kù):按國(guó)家標(biāo)準(zhǔn)要求,重新將地址入庫(kù)。在很多系統(tǒng)里由于填寫(xiě)不規(guī)范,地址信息比較亂,導(dǎo)致分析不方便。

        3.4 學(xué)習(xí)模型層

        (1)指標(biāo)建模:包含指標(biāo)定義工具,即彈性指標(biāo)機(jī)器學(xué)習(xí)。指標(biāo)是預(yù)警分析的啟始條件之一。不同應(yīng)用預(yù)警,需要不同指標(biāo)模型。比如對(duì)于圍標(biāo)嫌疑分析,除了做關(guān)系模型外,還需要指標(biāo)模型。

        (2)比對(duì)模型:在多維表之間做比對(duì)分析,尋找多個(gè)對(duì)象出現(xiàn)的相近相同的值,要求性能快,數(shù)據(jù)挖掘的功能。

        (3)關(guān)系模型:首先根據(jù)業(yè)務(wù)需求,定義關(guān)系,關(guān)系有很多種大數(shù)據(jù)系統(tǒng)自定義運(yùn)行任務(wù),不斷發(fā)現(xiàn)關(guān)系。關(guān)系模型是預(yù)警模塊的重要基礎(chǔ)。

        (4)實(shí)體檔案:通過(guò)各類數(shù)據(jù),發(fā)現(xiàn)實(shí)體背景檔案。

        (5)語(yǔ)義分析:不同文本之間的關(guān)鍵詞詞頻分析,相似度分析。可以用于投標(biāo)方案的雷同性比較。

        (6)趨勢(shì)預(yù)測(cè):通過(guò)訓(xùn)練模型,分類分析或傅里葉算法等,市場(chǎng)預(yù)測(cè)。

        4 結(jié)語(yǔ)

        學(xué)生事務(wù)中心的數(shù)據(jù)可以通過(guò)建立分布式數(shù)據(jù)融合平臺(tái),實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)管理、建立數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)搜索、分布式計(jì)算等。自動(dòng)實(shí)現(xiàn)數(shù)據(jù)實(shí)體的維度建立、大數(shù)據(jù)自動(dòng)關(guān)聯(lián)。自動(dòng)適應(yīng)日益變化的數(shù)據(jù)源,為大數(shù)據(jù)分析及輔助決策提供支撐。學(xué)生事務(wù)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)將會(huì)為不同層面提供數(shù)據(jù)支撐,將來(lái)還要建設(shè)市—校間的數(shù)據(jù)交換將大數(shù)據(jù)平臺(tái)的數(shù)據(jù)結(jié)果推送到各個(gè)學(xué)校,讓學(xué)校了解各學(xué)生數(shù)據(jù)的走勢(shì)。

        參考文獻(xiàn)

        [1] 李學(xué)龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國(guó)科學(xué):信息科學(xué),2015(1):1-44.

        [2] 俞立平.大數(shù)據(jù)與大數(shù)據(jù)經(jīng)濟(jì)學(xué)[J].中國(guó)軟科學(xué),2013(7):177-183.

        [3] 秦榮生.大數(shù)據(jù)、云計(jì)算技術(shù)對(duì)審計(jì)的影響研究[J].審計(jì)研究,2014(6):23-28.

        猜你喜歡
        云計(jì)算數(shù)據(jù)中心大數(shù)據(jù)
        酒泉云計(jì)算大數(shù)據(jù)中心
        民航綠色云數(shù)據(jù)中心PUE控制
        基于云計(jì)算的移動(dòng)學(xué)習(xí)平臺(tái)的設(shè)計(jì)
        實(shí)驗(yàn)云:理論教學(xué)與實(shí)驗(yàn)教學(xué)深度融合的助推器
        云計(jì)算中的存儲(chǔ)虛擬化技術(shù)應(yīng)用
        科技視界(2016年20期)2016-09-29 13:34:06
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        基于云計(jì)算的交通運(yùn)輸數(shù)據(jù)中心實(shí)現(xiàn)與應(yīng)用
        Overlay Network技術(shù)在云計(jì)算數(shù)據(jù)中心中的應(yīng)用
        河南科技(2014年11期)2014-02-27 14:16:49
        亚洲天堂av路线一免费观看| 日本大片免费观看完整视频| 国产日韩久久久精品影院首页| 午夜视频福利一区二区三区| 人妻少妇精品视频专区二区三区| 国产亚洲成av人片在线观黄桃| 精品国产乱码久久久软件下载| 亚洲va在线va天堂va四虎| 国产偷闻女邻居av在线观看| 欧美丰满少妇xxxx性| 人妻在线日韩免费视频| 亚洲韩国在线| 人妻有码中文字幕在线| 狠狠色噜噜狠狠狠8888米奇| 四虎影视在线影院在线观看| 91亚洲人成手机在线观看| 性色国产成人久久久精品二区三区| 内射中出日韩无国产剧情| 少女高清影视在线观看动漫| 久久中国国产Av秘 入口| 免费国产不卡在线观看| 午夜成人理论福利片| 少妇被爽到高潮动态图| 亚洲成AV人片无码不卡| 加勒比日韩视频在线观看| 欧美色欧美亚洲另类二区| 亚洲综合一区二区三区四区五区| 国内色精品视频在线网址| 亚洲免费国产中文字幕久久久| 亚洲av无码xxx麻豆艾秋| 亚洲精品成AV无在线观看| 草青青视频手机免费观看| 中国精品18videosex性中国| 国产欧美日韩视频一区二区三区| 亚洲专区在线观看第三页| 国产亚洲人成在线观看| 亚洲av永久无码天堂网毛片| 男人的天堂av网站一区二区| 综合久久精品亚洲天堂| 国产精品永久免费| 亚洲性综合网|