唐國純
(瓊臺師范學院信息科學技術學院,海南 ???571100)
隨著新一代信息通信技術(如大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)等)被廣泛應用在各種領域,高校信息資源的整合,尤其是數(shù)據(jù)的整合,已成為智能校園建設的重要一環(huán)。在教育大數(shù)據(jù)的構建中,我國高校由于數(shù)據(jù)資產(chǎn)意識薄弱,數(shù)據(jù)缺乏規(guī)范性和統(tǒng)一管理,導致建立起科學規(guī)范的高校云數(shù)據(jù)中心困難重重。針對海量的高校數(shù)據(jù)資源,如何有效的實施數(shù)據(jù)整合,開展其數(shù)據(jù)的挖掘分析與預測,發(fā)掘出潛在的數(shù)據(jù)價值成為智慧校園建設的一部分。
根據(jù)云系統(tǒng)建設單位要求的不同,需要解決不同的需求問題。當前高校信息云中心一般包括教學云中心、學習云中心、后勤云中心、科研云中心、招生就業(yè)云中心等。計算集群系統(tǒng)是云系統(tǒng)中的重要組成部分,主要包括網(wǎng)絡、存儲、計算、診斷和基礎架構五個子系統(tǒng)。對于云系統(tǒng)的建設,可根據(jù)不同的需求建造不同的云類型,如服務云和存儲云。
高校中存在著海量的數(shù)據(jù)信息。既包括學生的招生,檔案,學習,校園生活,就業(yè)等信息,也包括教師的人事檔案,教學,科研,校園生活等信息,此外它還包括行政部門人事檔案,工作,服務考核以及學校的資產(chǎn)信息[1]。隨著云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新技術廣泛使用,師生通過微博、微信、各種短視頻、云視頻會議等信息平臺也產(chǎn)生了大量的數(shù)據(jù)。上述信息具有數(shù)據(jù)量大、結構復雜、頻率快等特點。高校數(shù)據(jù)資源特性體現(xiàn)在:①分散性:高校信息云中心的數(shù)據(jù)資源都存儲在各自的數(shù)據(jù)中心,主要是由高校院系、行政、師生等服務對象生成的主要數(shù)據(jù),并以各種組織形式存儲。②海量性:一是來自云平臺的各種實時數(shù)據(jù)一直存儲在不同的云中。二是不同云中數(shù)據(jù)資源因交互協(xié)作也會產(chǎn)生大量的數(shù)據(jù)。③多源性[2]:主要體現(xiàn)在高校數(shù)據(jù)資源來源和種類豐富。一是各類云端設備產(chǎn)生的各種數(shù)據(jù)。二是云用戶因各種交互活動而產(chǎn)生的結構化、半結構化和非結構化數(shù)據(jù)。④異構性:主要指不同云成員的數(shù)據(jù)資源的組織和存儲形式差異。⑤資產(chǎn)和價值:數(shù)據(jù)資源可視為無形資產(chǎn)和價值。數(shù)據(jù)集成的目標是對集成的云數(shù)據(jù)庫中心進行數(shù)據(jù)挖掘分析,形成可視化的管理和決策信息。
數(shù)據(jù)提取與集成中要解決的主要問題是動態(tài)收集各種零碎的數(shù)據(jù),清洗數(shù)據(jù),統(tǒng)籌數(shù)據(jù)標準,進行數(shù)據(jù)分析。由于建設資金巨大,許多高校往往分階段完成信息化建設,在管理信息系統(tǒng)的早期設計中沒有考慮一些過程數(shù)據(jù)的采集和集成,需要對應用系統(tǒng)進行擴展,采集數(shù)據(jù)源,并在分析過程中將它們匯入云數(shù)據(jù)中心。同時,異構的數(shù)據(jù)類型、廣泛的數(shù)據(jù)源等因素給數(shù)據(jù)集成造成了困難。高校要打造依托大數(shù)據(jù)的智慧校園,必須統(tǒng)籌構建結構化、半結構化和非結構化數(shù)據(jù)集成的全局標準,保證數(shù)據(jù)采集質量。此外,由于高校半結構化和非結構化數(shù)據(jù)的快速增長,傳統(tǒng)的聚類和關聯(lián)分析等數(shù)據(jù)挖掘技術面臨新的挑戰(zhàn)[3-4]。它主要體現(xiàn)在各種云服務對數(shù)據(jù)的實時分析需求以及多源數(shù)據(jù)關聯(lián)關系的復雜性。高校需要在信息化建設部門中設置大數(shù)據(jù)小組,研究可靠的數(shù)據(jù)分析方法。另外,在高校數(shù)據(jù)集成過程中,由于各種數(shù)據(jù)關聯(lián)關系的復雜性、數(shù)據(jù)維度的多樣性,以及數(shù)據(jù)的安全性和隱私性問題,如何使用多維疊加數(shù)據(jù)可視化模型,有效反應數(shù)據(jù)的時空變化與比較等可視化顯示數(shù)據(jù)的方法,如何保證高校的數(shù)據(jù)安全和師生的隱私保護,也是一個值得關注的問題。
信息資源整合按其技術層次可將其分為標準和規(guī)范層、整合基礎網(wǎng)絡層、整合數(shù)據(jù)層、整合平臺和應用層[5]。 因SDN 的開放和可編程性易于實施全網(wǎng)管控,可有效滿足云數(shù)據(jù)中心網(wǎng)絡的需求[6]。隨著云計算,SDN 和大數(shù)據(jù)技術的不斷發(fā)展應用,一種云計算和大數(shù)據(jù)的高校數(shù)據(jù)整合架構如圖1 所示。
其中,SDN 網(wǎng)絡架構要用于實現(xiàn)對網(wǎng)絡設備的集中管理和控制;基礎設施服務主要對網(wǎng)絡資源進行管理,以服務的方式動態(tài)按需分配,進行虛擬資源配置;云管理平臺主要用于實現(xiàn)高校云系統(tǒng)的集中管控,通過SDN 控制器實現(xiàn)對數(shù)據(jù)中心資源(計算、存儲、網(wǎng)絡等)全局配置。
SDN 一般有單一集中控制和分布式控制方式。單一集中控制方式如圖2 所示。
單一集中控制模式通常適用于中型網(wǎng)絡,但對性能影響不大。然而,對于大型網(wǎng)絡,為了保證性能,需要采用多線程方式。如果采用單一集中控制模式來處理交換機請求,那么控制器跟其他域中的交換機間可能產(chǎn)生顯著的延遲現(xiàn)象。此外,它還會影響網(wǎng)絡處理性能。如果網(wǎng)絡的規(guī)模增加,會導致性能處理不可接受。另外,單節(jié)點故障可能發(fā)生在單集中控制中,可以通過增加控制器的數(shù)量來解決,即通過邏輯集中控制將控制器物理分布在網(wǎng)絡中。這允許每個交換機與控制器交互,以增強網(wǎng)絡的總體性能。分布式控制器通常有兩種模式。第一種是扁平控制方式(如圖3所示),第二種是層次控制方式(如圖4 所示)[7]。
扁平控制模式要求將所有控制器放置在不相交區(qū)域并管理它們自身所在的網(wǎng)絡。每個控制器經(jīng)東西方向接口相互通信,作用平等。故而在扁平控制模式下,所有控制器處于同一層面,每個控制器在物理上位于不同的區(qū)域[8]。所有的控制器邏輯上都可以作為全局控制器來管控整個網(wǎng)絡而實時動態(tài)更新,交換機只要調整與控制器地址的映射,對數(shù)據(jù)層影響不大。扁平控制模式的缺點是每個控制器只控制本地網(wǎng)絡,掌握整個網(wǎng)絡的狀態(tài),造成一定的資源浪費,在網(wǎng)絡更新時增加了控制器的整體負載而使性能受到影響。另外,在實際應用中,如果不同域歸的運營商有差異,則很難保證不同域的控制器間的平等通信問題。層次控制模式體現(xiàn)了控制器間的縱向管控能力。既局部控制器管控自己的網(wǎng)絡,全局控制器管控局部控制器及其間的交互。層次控制器之間的相互通信有兩種類型:一是局部控制器和全局控制器間的相互通信,二是全局控制器間的相互通信。對于不同的操作域,只需要協(xié)調全局控制器間的相互通信。該方法防止了全局控制器繼續(xù)不斷的交互,可靠地減少了流量負載。因為該方法寄托于本地控制器處理信息的命中率,所以在局部應用較多的情境中表現(xiàn)出良好的執(zhí)行效率。
作為高校云數(shù)據(jù)中心來說,整個網(wǎng)絡通??蓜澐殖鋈齻€層次,分別是物理設備層、局部網(wǎng)絡控制層和全局控制層[9-10]。高校的智慧校園構建中,一個業(yè)務領域通常對應著一個數(shù)據(jù)中心,比如教師數(shù)據(jù)中心,學生數(shù)據(jù)中心等。一般來說,第一層的物理交換機和第二層的控制器在每個數(shù)據(jù)中心內(nèi)的出口處均有布置,且第三層的SDN 網(wǎng)關和流量工程TE(Traffic Engineering)服務器要在一個全局統(tǒng)一的控制區(qū)域。因而SDN 層次控制方式較為適合,如果為了考慮集中控制和穩(wěn)定的可靠性,在經(jīng)費保障的情況下,可結合扁平控制和層次控制的各自優(yōu)點,采用混合控制方式,如圖5 所示。
采用SDN 混合控制方式,第二層可根據(jù)需要在每個數(shù)據(jù)中心出口配置一臺或多臺配置控制器服務器,服務器經(jīng)SDN Gateway,可依托每個數(shù)據(jù)中心的控制器采集鏈路信息進行掌控,對新業(yè)務進行按需配置,并幫它挑揀出一條最優(yōu)路徑,生成業(yè)務相對應的流,經(jīng)控制器配置在交換機上,與挑揀的路徑進行捆綁,從而整體上使鏈路達到最優(yōu)配置。
本文對高校云數(shù)據(jù)中心模式進行研究,系統(tǒng)梳理了高校信息資源的類型、數(shù)據(jù)特征與數(shù)據(jù)整合困境,研究了基于SDN 的網(wǎng)絡控制,給出了“基于SDN 和大數(shù)據(jù)的高校云數(shù)據(jù)中心的設計”方案,期望為高校云數(shù)據(jù)中心建設提供一定的參考依據(jù)。