季 紅
(天津職業(yè)大學網(wǎng)絡安全和信息化辦公室,天津 300400)
隨著高校信息化的建設和發(fā)展,數(shù)據(jù)的問題逐步顯現(xiàn)出來。如何有效地管理和利用數(shù)據(jù),成為高校信息化發(fā)展的新方向?!笆濉敝腔坌@建設積累了大量的數(shù)據(jù)、日志信息,這些數(shù)據(jù)來源眾多,缺乏統(tǒng)一的建設標準,獨立存儲,缺乏有效的整合,形成了新的“數(shù)據(jù)孤島”,嚴重阻礙了學校的發(fā)展。按照《2020教育信息化和網(wǎng)絡安全工作要點》的工作部署,推動教育數(shù)據(jù)的有序共享,實現(xiàn)更好的支撐校園服務應用[1]。高校要通過數(shù)據(jù)的治理與挖掘,提高數(shù)據(jù)信息價值,從而輔助學校決策,提高信息化管理服務水平。
學校缺乏統(tǒng)一的數(shù)據(jù)建設標準,缺少頂層規(guī)劃,數(shù)據(jù)信息建設中各自為政,獨立存儲,無法實現(xiàn)數(shù)據(jù)的共建共享。系統(tǒng)數(shù)據(jù)在采集和存儲過程中雜亂無章,缺乏有效的管理,不能形成權威數(shù)據(jù)源,無法形成標準校本數(shù)據(jù)。
學校雖然建設了數(shù)據(jù)交換中心,但數(shù)據(jù)存在嚴重的質量問題,數(shù)據(jù)來源不唯一,一致性差,固定格式的數(shù)據(jù)中存在無關字符,數(shù)據(jù)內容不完整,接口數(shù)據(jù)流失嚴重。數(shù)據(jù)中心里的數(shù)據(jù)沒有進行精細化、全面化的管理,數(shù)據(jù)冗余較大,臟數(shù)據(jù)較多,工作效率極低。不能為數(shù)據(jù)展示分析、綜合利用提供高質量的數(shù)據(jù)。
學校數(shù)據(jù)對外開放多采用中間庫的方式,形式單一,共享內容不可控,對數(shù)據(jù)使用人員技術要求較高。無法做到全校重視,全體參與,負責數(shù)據(jù)的教師需要頻繁與業(yè)務部門對接,重復開發(fā)大量數(shù)據(jù)視圖或中間庫,效率低下。學校管理缺乏數(shù)據(jù)的深度挖掘和綜合利用,沒有真正地發(fā)揮數(shù)據(jù)價值,無法為各級領導及廣大師生提供校務數(shù)據(jù)綜合展示的服務。
從學校信息化建設的實際情況出發(fā),以國標、教標以及信息化行業(yè)標準為指導,對全校數(shù)據(jù)資源和數(shù)據(jù)模型進行頂層規(guī)劃設計,形成統(tǒng)一、全面的學校標準,使不同部門建設的應用系統(tǒng)之間數(shù)據(jù)相互流通共享,實現(xiàn)數(shù)據(jù)精細化的管理。建立校本數(shù)據(jù)模型,建立長期的數(shù)字資源集成共享機制。
建設數(shù)據(jù)治理體系,形成數(shù)據(jù)資源池,構建全校資源主數(shù)據(jù)、共享數(shù)據(jù)、歷史數(shù)據(jù)、數(shù)據(jù)倉庫,形成學校新舊應用系統(tǒng)的數(shù)據(jù)交換體系,實現(xiàn)不同部門或單位的業(yè)務協(xié)同和信息融合[2],并為后續(xù)新建系統(tǒng)的無縫對接提供規(guī)范與基礎。建設一站式綜合數(shù)據(jù)服務平臺,提供業(yè)務數(shù)據(jù)的采集、清洗、存儲、服務、監(jiān)控的全生命周期管理。
利用信息和網(wǎng)絡技術,用數(shù)據(jù)反映學校教學基本狀態(tài),校務管理的執(zhí)行情況。進行深入的數(shù)據(jù)挖掘,進行數(shù)據(jù)關聯(lián)分析,靈活運用聚類、分類等算法,探索或預測導致事件發(fā)生的相關性因素[3],為學校不同的用戶群體提供智能的數(shù)據(jù)檢索服務。為學校搭建學生安全管理、校外媒體監(jiān)測、網(wǎng)絡日志分析等豐富的校園大數(shù)據(jù)應用,支撐決策層集中掌握校園整體運行情況,打造大數(shù)據(jù)時代的智慧校園。
高校數(shù)據(jù)治理旨在深化學校的數(shù)據(jù)規(guī)范,建立一套符合學校實際需要的數(shù)據(jù)標準化體系,充分挖掘、共享、分析、利用數(shù)據(jù)資源,發(fā)揮數(shù)據(jù)價值。數(shù)據(jù)治理工作從數(shù)據(jù)質量出發(fā),建立學校數(shù)據(jù)質量建設和管理準則。將制度落地,通過數(shù)據(jù)治理系統(tǒng)平臺實現(xiàn)數(shù)據(jù)的集中采集、動態(tài)監(jiān)控、規(guī)則執(zhí)行和數(shù)據(jù)任務調度,從而發(fā)現(xiàn)數(shù)據(jù)問題,并形成預警,及時整改,實現(xiàn)數(shù)據(jù)的實時更新和同步。利用數(shù)據(jù)分析工具產生有用數(shù)據(jù),輔助學校各項工作開展,為學校的智慧校園建設提供數(shù)據(jù)支撐。數(shù)據(jù)治理平臺應包括數(shù)據(jù)標準管理、全量數(shù)據(jù)中心、數(shù)據(jù)質量管理、數(shù)據(jù)共享交換和數(shù)據(jù)挖掘分析等功能。
首先對學校數(shù)據(jù)建設情況進行全面梳理,實現(xiàn)數(shù)據(jù)信息從生產、存儲、流動到使用的全過程進行調研,明確業(yè)務流程和數(shù)據(jù)應用關系,按照規(guī)范化的表達方式,展現(xiàn)出學校的業(yè)務現(xiàn)狀和未來發(fā)展需求的公共基礎數(shù)據(jù)模型及業(yè)務數(shù)據(jù)模型[4]。建立數(shù)據(jù)標準管理平臺,為數(shù)據(jù)治理和大數(shù)據(jù)分析提供一定的標準規(guī)范,以保證信息的高效匯集和交換。進行信息化標準體系建設,厘清數(shù)據(jù)關系,明確各項數(shù)據(jù)責任人,全面掌握目前院內業(yè)務系統(tǒng)數(shù)據(jù)現(xiàn)狀,使學院在信息的采集、處理、交換、傳輸?shù)倪^程中有統(tǒng)一的規(guī)范,并且能夠有效指導未來各個業(yè)務系統(tǒng)升級和建設工作,切實提高學院的信息化標準水平。
建設學校全量數(shù)據(jù)中心,覆蓋整個業(yè)務域,從業(yè)務系統(tǒng)中提取核心數(shù)據(jù),通過抽取(extract)、轉換(transform)、加載(load)過程,存儲到全量數(shù)據(jù)庫中。再進行集中數(shù)據(jù)的清洗和驗證。依據(jù)信息標準規(guī)范,對全量數(shù)據(jù)庫進行配置化備份建設歷史數(shù)據(jù)庫;通過核驗功能,對數(shù)據(jù)庫的規(guī)范性進行定期校驗,強化數(shù)據(jù)庫的規(guī)范性;最終數(shù)據(jù)中心以服務的方式把統(tǒng)一的、完整的、準確的、具有權威性的主題數(shù)據(jù)傳送給學校范圍內需要使用這些數(shù)據(jù)的操作型應用系統(tǒng)和分析型應用系統(tǒng)[5]。
建成數(shù)據(jù)質量監(jiān)控平臺,根據(jù)不同類型的數(shù)據(jù)問題,項目將采取相對應的數(shù)據(jù)質量檢測和治理方式。對全校的數(shù)據(jù)進行實時監(jiān)控,借助數(shù)據(jù)質量監(jiān)控工具,形成權威的數(shù)據(jù)質量報告,推動學校數(shù)據(jù)質量完善,深度挖掘數(shù)據(jù)價值。要求實現(xiàn):(1)完備性,數(shù)據(jù)擁有所有必須或適當?shù)牟糠郑瑩碛械氖钦麄€成品的全部。完備性的第一條件是存在性,數(shù)據(jù)必須存在。(2)一致性,同時滿足穩(wěn)定性和連貫性,必須實現(xiàn)不存在變異或變更。(3)及時性,數(shù)據(jù)顯示要求及時更新,對于數(shù)據(jù)處理,及時性與數(shù)據(jù)的可用性相關,要求在一定程度上在正確的時間有他們需要的數(shù)據(jù)。(4)有效性,數(shù)據(jù)對一組業(yè)務規(guī)則、標準或已定義的數(shù)據(jù)值域的符合程度。(5)完整性,數(shù)據(jù)對(由數(shù)據(jù)模型定義的)數(shù)據(jù)關系規(guī)則的符合程度,這些規(guī)則的目的是確保數(shù)據(jù)對概念進行完備、一致和有效地表示。
構建數(shù)據(jù)開放共享平臺,實現(xiàn)數(shù)據(jù)的共享開放。數(shù)據(jù)開放共享的意義在于把高校的數(shù)據(jù)服務,像水、電、煤一樣輸送給有需要的業(yè)務部門、應用系統(tǒng)、開發(fā)者、學生和教工團體。面向校級業(yè)務部門、二級學院、廣大師生及個人用戶提供基于權限控制的應用平臺,向各類用戶開放數(shù)據(jù)集、數(shù)據(jù)接口和數(shù)據(jù)應用3類資源。規(guī)范部門間的數(shù)據(jù)交換,將對開放的數(shù)據(jù)進行集中管理,使學校數(shù)據(jù)中心成為發(fā)布數(shù)據(jù)唯一的權威來源。
最終通過大數(shù)據(jù)的分析和挖掘技術,關聯(lián)分析學生、老師以及其它幾個層面的深度畫像,清新地展示不同對象的個性化特性,助力教學及管理過程的個性化和特色化。對在校學生個人信息和學生行為信息的關聯(lián)進行分析?;趯W校的學生素質評價體系,構建每個學生的多個維度的模型,綜合各個維度的情況建立全校學生個人行為畫像和綜合畫像,樹立學校優(yōu)秀學生的行為畫像,宏觀和微觀展現(xiàn)學生各方面的情況,有利于學生了解自身整體情況以及和優(yōu)秀學生的差距,有利于學校統(tǒng)籌規(guī)劃學生的培養(yǎng)和管理。同時,分析每個學生的素質、技能的發(fā)展趨勢和學校排名,剖析綜合素質和專業(yè)技能上升和下降的原因,提供學生、班級和學院的目前素質狀況、歷史對比和排名對比的行為畫像分析報告。
通過大數(shù)據(jù)治理,形成標準化校本數(shù)據(jù),以真實的數(shù)據(jù)進行深度挖掘和數(shù)據(jù)分析,形成學校人、財、物的綜合展現(xiàn)和動態(tài)監(jiān)控,為領導決策提供數(shù)據(jù)參考。同時通過多維度的分析,掌握學生學習和生活狀態(tài),記錄成長軌跡;推動個性化的學習和就業(yè),實現(xiàn)精準教學和管理,促進學校的發(fā)展。