文/陳偉
近些年,不少高校陸續(xù)進行了專項數(shù)據(jù)治理工作,在促進數(shù)據(jù)質量的完整性、準確性等方面取得了一定成效的同時,也暴露了一些問題。本文總結了目前的高校常見數(shù)據(jù)治理模式、方法、路徑,探討了如何利用互聯(lián)網(wǎng)+的思想重塑整個數(shù)據(jù)治理體系,提出了以大數(shù)據(jù)、人工智能等新技術構建用戶自治理模式的校園數(shù)據(jù)治理體系,從而有效提升數(shù)據(jù)質量,滿足下一代智慧校園建設的需要。
從數(shù)字校園到智慧校園建設演進的過程中,數(shù)據(jù)質量問題成為困擾廣大教育信息化工作者的一個難題。數(shù)據(jù)治理(Data Governance)是保證數(shù)據(jù)質量的必需手段,加強數(shù)據(jù)治理提升數(shù)據(jù)質量已成為教育信息化工作者的重要任務。如何通過數(shù)據(jù)治理解決數(shù)據(jù)的完整性(Completeness)、規(guī)范性(Conformity)、準確性(Accuracy)、唯一性(Uniqueness)、關聯(lián)性(Integration)等多方面的問題,從技術層面到管理層面多個方面,先行者已經(jīng)做了很多探索。
數(shù)據(jù)治理是指在數(shù)據(jù)資產(chǎn)價值創(chuàng)造的過程中,治理團隊對數(shù)據(jù)資產(chǎn)管理的評價、指導和控制,核心是加強對數(shù)據(jù)資產(chǎn)的管控,通過深化數(shù)據(jù)服務,持續(xù)創(chuàng)造價值。數(shù)據(jù)治理工作包括:數(shù)據(jù)生命周期管理、數(shù)據(jù)安全管理、數(shù)據(jù)質量管理、元數(shù)據(jù)及數(shù)據(jù)模型管理、數(shù)據(jù)標準管理。
在大數(shù)據(jù)時代,高校數(shù)據(jù)治理的范疇包括主數(shù)據(jù)、業(yè)務數(shù)據(jù)、分析數(shù)據(jù)等全量數(shù)據(jù)。新一代的數(shù)據(jù)治理,需要用更智能化、現(xiàn)代化的方法實現(xiàn)服務廣大師生的目標,幫助學校實現(xiàn)數(shù)據(jù)標準構建、數(shù)據(jù)模型設計、數(shù)據(jù)協(xié)同機制、數(shù)據(jù)服務的全過程。
目前高校數(shù)據(jù)治理框架主要包含三方面內(nèi)容:
第一,有效的高校內(nèi)部數(shù)據(jù)標準體系,包括數(shù)據(jù)標準、管理標準、質量標準等內(nèi)容,并保證各業(yè)務部門、各業(yè)務系統(tǒng)能得到落實與管控。落實到治理工具上,主要體現(xiàn)在元數(shù)據(jù)管理功能是否得到詳細認真的設計、應用,助力于業(yè)務系統(tǒng)。例如,元數(shù)據(jù)中除了應設有國標、行業(yè)標體系(如地理、行政區(qū)劃,學科門類、專業(yè)等)的數(shù)據(jù)之外,還應涉及應用系列校標數(shù)據(jù),如建筑物、樓宇體系等。
第二,完成各業(yè)務系統(tǒng)的整合工作。完成用戶集成、數(shù)據(jù)集成、業(yè)務集成工作,消除信息孤島,完善數(shù)據(jù)中心建設。首先,盡可能在被集成的業(yè)務系統(tǒng),即產(chǎn)生數(shù)據(jù)的源系統(tǒng)中解決數(shù)據(jù)質量問題,這對于整個體系的數(shù)據(jù)治理來說是非常高效的措施。其次,在各業(yè)務系統(tǒng)及平臺的建設過程中,描述核心業(yè)務實體的數(shù)據(jù),如教師、學生、教學、科研、資產(chǎn)、財務等,交換、共享性要求較高,均要被納入到主數(shù)據(jù)范圍,形成全校范圍內(nèi)一致的、完整的、準確的核心業(yè)務數(shù)據(jù),由數(shù)據(jù)中心統(tǒng)一對外提供數(shù)據(jù)服務。最后,落實到數(shù)據(jù)治理平臺上,集中反映在主數(shù)據(jù)管理是否完備,是否能以多種數(shù)據(jù)共享形式服務于各類應用。
第三,評估數(shù)據(jù)質量,生成數(shù)據(jù)質量報告。以數(shù)據(jù)標準體系為基準,以數(shù)據(jù)治理平臺為工具,數(shù)據(jù)管理員對整個主數(shù)據(jù)(或者全量數(shù)據(jù))質量檢測,根據(jù)實際需求,利用檢測數(shù)據(jù)進行單一主題或者整體進行數(shù)據(jù)質量分析,生成數(shù)據(jù)質量報告。在數(shù)據(jù)質量報告的基礎上,結合系統(tǒng)配置好的數(shù)據(jù)管控體系,生成針對部門、業(yè)務數(shù)據(jù)管理員的各子數(shù)據(jù)集整改報告。
在治理驅動路徑選擇上,目前很多高校認同自上而下的驅動形式,成立分管領導甚至主要領導牽頭的工作小組,以強大的行政力強力推動,取得了不錯的成效;也有的學校以信息部門為主進行驅動,聚焦于解決具體問題由點帶面自下而上的形式,從而在較小的投入下取得成效。
對于信息部門來說,數(shù)據(jù)治理就是把系統(tǒng)生成的數(shù)據(jù)質量報告分發(fā)給各部門,因為不觸及業(yè)務,在其他方面也很難著力。對于業(yè)務部門來說,數(shù)據(jù)治理就是按照信息部門交付的整改報告,錄入、審核、調整數(shù)據(jù);此外,要求廣大師生在各業(yè)務系統(tǒng)終端錄入、核驗個人數(shù)據(jù),核驗用戶數(shù)據(jù)是否真實準確也非常繁復。
治理工作階段性完成后,通過數(shù)據(jù)平臺以多樣化的數(shù)據(jù)服務形式提供給廣大師生使用。數(shù)據(jù)治理受益最明顯、最直接的是廣大師生,數(shù)據(jù)治理也往往先從師生聚焦的共享性高的數(shù)據(jù)子集開始,如教學、科研、人事信息等等。但在數(shù)據(jù)治理過程中,參與感最低的卻是師生。師生在具體業(yè)務場景使用數(shù)據(jù)的過程中,發(fā)現(xiàn)的數(shù)據(jù)質量問題,又很難有及時、有效的機制,完成從反饋到整改的整個業(yè)務閉環(huán),從而使用戶體驗很差(如圖1 所示)。
圖1 傳統(tǒng)數(shù)據(jù)治理過程
因為內(nèi)生驅動力不足,目前高校數(shù)據(jù)治理主要方式可以形象地稱為“運動式”。領導動員強調,信息部門三令五聲要求,業(yè)務部門加班加點落實,數(shù)據(jù)質量得到有效提升。但是,治理周期一過,數(shù)據(jù)質量馬上下滑。這個問題不可避免,因為業(yè)務數(shù)據(jù)不斷產(chǎn)生,數(shù)據(jù)治理工作無法一蹴而就,如果沒有長效機制保障,數(shù)據(jù)治理永遠在路上。
數(shù)據(jù)與服務,兩者相輔相成,互為依托。數(shù)據(jù)治理,是一項基礎性、長期性的工作。在數(shù)據(jù)服務需求不明確、不突出時,單方面推進數(shù)據(jù)治理,困難極大,成效也很難凸顯。有成效一類,解決問題一類,從而逐漸突破,提升數(shù)據(jù)質量。
目前數(shù)據(jù)治理工作均基于傳統(tǒng)數(shù)字化校園體系開展,由相關人員圍繞業(yè)務系統(tǒng)、數(shù)據(jù)中心進行數(shù)據(jù)治理,各系統(tǒng)均為傳統(tǒng)管理信息系統(tǒng)設計思路,以面向管理的方式開展工作。在下一代智慧校園建設過程中,業(yè)務系統(tǒng)開始逐步被微服務體系解構、替代,廣大師生更加注重于基于大數(shù)據(jù)、人工智能等新技術環(huán)境下面向服務體系架構的用戶體驗。新的技術架構、新的服務場景,數(shù)據(jù)治理如何開展,也到了亟待變革的時候。
數(shù)據(jù)治理,從名稱上看就是典型的管理信息系統(tǒng)思維模式的產(chǎn)物。治理就是一項管理工作,就需要管理部門的介入,被治理的,就是廣大普通用戶,在高校就是廣大師生。
在各種服務使用的過程中,互聯(lián)網(wǎng)公司不知不覺的完成了數(shù)據(jù)治理工作,以To C 將龐大的數(shù)據(jù)采集需求分散到各種微小的服務中,并且馬上讓用戶有獲得感,潤物無聲地完成數(shù)據(jù)治理工作。
高校信息化產(chǎn)品、服務的設計,傳統(tǒng)To B 思維居多,買單的是學校管理部門,設計思路自然也圍繞管理人員展開,也導致了上述許多問題。數(shù)據(jù)治理最終受益的是廣大師生,數(shù)據(jù)治理產(chǎn)品是To B 模式還是To C 模式設計,這是根源性的問題。只有以用戶為中心設計產(chǎn)品、體系乃至整個解決方案,才能真正獲得用戶的認同(如圖2 所示)。
智慧校園的數(shù)據(jù)治理產(chǎn)品、方案設計,也應該以業(yè)務需求為牽引,在微服務應用的過程中便可以完成數(shù)據(jù)采集、修訂等工作,同時在數(shù)據(jù)管理人員支持下,以大數(shù)據(jù)、人工智能的技術手段為依托,厘清個人數(shù)據(jù)、業(yè)務數(shù)據(jù)、主數(shù)據(jù)的關系,適時寫入主數(shù)據(jù),形成業(yè)務閉環(huán),實現(xiàn)圍繞師生為核心的需求、治理、服務的全業(yè)務閉環(huán)體系,完成整個治理過程。業(yè)務的應用每時每刻在進行,數(shù)據(jù)的治理工作也一直在進行,從而杜絕運動式的數(shù)據(jù)治理模式,保持數(shù)據(jù)質量穩(wěn)定。
目前,已經(jīng)有從事高校信息化領域的公司開始以To C 模式,圍繞廣大師生需求為核心設計、推廣相關產(chǎn)品,取得了不錯的效果。
如何圍繞廣大師生需求,做好數(shù)據(jù)治理工作,相關運營體系的建立是必然趨勢。構建起從廣大用戶、業(yè)務系統(tǒng)管理者、數(shù)據(jù)中心管理者多角色參與的運營指標體系,從問題解決率、解決時效、數(shù)據(jù)質量等方面建立關于以上多角色的評價指標,通過系統(tǒng)記錄、跟蹤數(shù)據(jù)治理整個過程,持續(xù)進行整改優(yōu)化,必要時進行一定的考核,持續(xù)促進數(shù)據(jù)質量提升。
圖2 服務引領,用戶自治理的數(shù)據(jù)治理模式
在數(shù)據(jù)采集、填報的過程中,傳統(tǒng)形式均為手工錄入方式,由用戶或者管理人員錄入相關信息,形成最初的數(shù)據(jù)來源。實際上,因為技術方法的進步,很多數(shù)據(jù)可以用更方便的方法獲取、組織管理起來,從而大大節(jié)省工作量,提高治理效率。如元數(shù)據(jù)信息,通過網(wǎng)絡爬蟲、自然語言處理、人工智能等算法,實現(xiàn)知識提??;未來可自動構建成起知識圖譜,利用智能搜索、關聯(lián)查詢手段,為師生自動化提供更加精確的數(shù)據(jù),高效率、智能化完成數(shù)據(jù)治理工作。
2018 年4 月,教育部正式印發(fā)《教育信息化2.0 行動計劃》,推動教育信息化從融合應用向創(chuàng)新發(fā)展轉變。不同于以信息技術(Information Technology)為基礎的教育信息化1.0,教育信息化2.0以數(shù)據(jù)技術(Data Technology)為基礎,將一切參與主體、教育元素、教育行為數(shù)據(jù)化將是教育信息化2.0 的基本特征。我們需要思考,如何推動教育信息化從傳統(tǒng)業(yè)務的融合應用向創(chuàng)新發(fā)展進行轉變。教育信息化作為一個競爭不充分、發(fā)展落后的細分行業(yè),相關從業(yè)者一定要認真關注各種新技術的發(fā)展,思考其在高校落地的具體結合場景,要打破頭腦中思想的桎梏,吸取優(yōu)秀行業(yè)經(jīng)驗,探索互聯(lián)網(wǎng)思維在校園信息化中的應用與實踐,這樣才能真正做出師生有感知、有溫度的產(chǎn)品、方案,才能真正提升高校信息化水平。