沈一平
摘要:隨著信息技術的應用,數據逐漸成為最重要的媒介,發(fā)揮著重要的作用。隨著校園信息化建設的浪潮,校園網絡覆蓋投入逐漸加大、信息系統(tǒng)中產生的數據總量不斷增加,數據結構也日趨復雜??梢暬夹g作為IT領域新一代的數據管理技術與架構,在信息化建設中具有極大的應用價值。該文闡述了大數據的來源及類型,分析了數據的收集分析機制以及可視化的技術手段,展望了校園信息化建設的美好前景。
關鍵詞:信息化;數據;大數據技術;分析工具;可視化
中圖分類號:TP393 文獻標識碼:A
文章編號:1009-3044(2019)29-0278-02
信息化時代的數據分析影響著我們的生活和學習,也影響著學校的發(fā)展。近幾年,我國的教育事業(yè)不斷創(chuàng)新,學校為提高教學質量、改進教學水平,紛紛著手投入到校園信息化建設中。而大數據技術的發(fā)展,為信息化建設提供了很好的平臺與關鍵技術。
1校園中的大數據
隨著互聯網等新興技術的蓬勃發(fā)展,微博、微信等社交平臺信息,各類搜索點擊記錄的信息量與日俱增。這些信息存在著數據量龐大、結構性復雜、產生的速度較快等特點。例如:學生的聯系方式等基本信息,食堂超市消費記錄、住宿等生活信息;選課、課堂作業(yè)、借閱圖書、成績等學習信息;參與社團、競賽、講座等第二課堂信息;教師包括教學課程、課件視頻等教學信息,論文課題著作等科研信息。
2存在的問題
(1)數據收集機制的缺乏
目前,數據收集的來源為OA系統(tǒng)、Excel等,收集的數據分散凌亂。每個部門對收集到的電子數據往往過段時間刪了,保存時間不長,數據再利用相當不便,效率低下。
(2)數據分析技術的落后
來源大多數學校缺少如OLAP這樣的數據分析工具以及如Spark這樣的數據處理平臺,更缺乏數據分析技術的專業(yè)人才,因此,對收集的數據缺乏分析環(huán)節(jié)。對于數據分析,只是停留在excel等工具進行簡單篩選與分類匯總而已。
(3)批量數據處理技術有待加強
學生日常行為產生的數據往往是批量產生的,諸如,手機瀏覽上網,一卡通消費等實時數據,大型作業(yè)、自媒體等圖片數據,短視頻等視頻數據。由于數據處理軟件類型眾多,技術性強、價格昂貴等原因,導致先進的數據處理軟件未能在學校推廣,數據處理無法與時俱進。
3可視化技術在信息建設中的應用
數據分析得到的分析結果,需要以直觀可理解的方式呈現給最終用戶,在大數據時代,數據分析產生的結果是多維度的。數據可視化技術通過圖形圖像化的方式展示數據分析結果,已被證明是展示海量數據分析結果最為有效的方法。常見的可視化方法有:多維疊加式數據可視化、空間、時間坐標變化和對比等。很多學校正在使用數據可視化技術解決遇到的實際問題。
(1)數據來源
學??梢越柚髷祿治黾夹g,從學習、學科、就業(yè)情況等方面進行分析,挖掘數據中的潛在價值。這樣做的目的是更好的指導每一個學生。
(2)數據分析
數據分析方法層出不窮,在統(tǒng)計建模以及數據挖掘領域都有不少經典的方法,這些方法往往需要滿足一定的條件,比如平穩(wěn)等。但是真實數據往往無法很好地滿足這些條件,這樣就需要用更加普適的方法。如信息論等進行分析。此外,對于某些真實的應用場景,比如多傳感器數據,需要挖掘之中某些變量之間的影響關系,同時這樣的影響關系又是非常復雜的,隨著變量數量的增加,其間關系指數增加,這樣也干擾了分析的進行。
(3)數據展示
數據可視化是指借助于圖形化的手段,清晰、有效地傳達與溝通信息。隨著信息技術的不斷發(fā)展,當今社會已步人大數據時代,如何幫助學校在海量數據中快速獲取重要信息應對學校的變化已成為各個學校亟需解決的難題。數據可視化讓枯燥的數據以簡單友好的圖表形式展現出來,是一種最為直觀有效的分析方式,無須過多的技術基礎。Tableau是一款定位于數據可視化敏捷開發(fā)和實現的商務智能展現工具,初創(chuàng)合伙人是來自斯坦福大學的數據科學家,他們?yōu)榱藢崿F卓越的可視化數據獲取與后期處理,Tableau提供了幾乎所有數據源的訪問接口,分析處理能力強大,圖表精美,操作簡單,可以用來實現交互的、可視化的分析和儀表板應用,從而快速地認識和理解數據,以應對不斷變化的環(huán)境與挑戰(zhàn)?,F代數據可視化技術的核心,并沒有像普通數據分析類軟件那樣簡單地調用和整合現行主流的關系型數據庫,而是革命性地進行了大尺度的創(chuàng)新,獨創(chuàng)了VIZQL數據庫。
4優(yōu)化策略與應用前景
信息可視化(Information Visualization)是可視化另一大重要領域,其致力于對各種非結構化、抽象的數據集合進行可視化處理。對數據進行處理和展示,從而更好地進行數據分析工作。展現形式主要有:網絡圖、地圖、樹、時間軸、氣泡圖、平行坐標軸、標簽云、流程圖、熱力圖、折線圖、散點圖等。Tableau提供了一個非常新穎而易用的使用界面,使得處理規(guī)模巨大的、多維的數據時,可以即時地從不同角度和設置看到數據所呈現出的規(guī)律。Tableau通過數據可視化技術,使得數據挖掘變得平民化,而其自動生成和展現出的圖表,也絲毫不遜色于互聯網美術編輯的水平。正是這個特點奠定了其廣泛的用戶基礎(用戶總數年均增長126%),帶來了高續(xù)訂率(906的用戶選擇續(xù)訂其服務)。時序多變量數據作為這些領域的一種重要的數據形式,其來源廣泛(如各種傳感器網絡數據),應用前景較佳,近年來越來越受到重視。校園信息化建設程度日益成熟,信息化內容日益豐富,但由于信息系統(tǒng)設計的不周,導致一些過程數據未能采集,無法滿足的應用需求。在校園信息化建設中,每個學校都應首先加強資源建設,制訂建設方案,推動校園信息化建設的發(fā)展。