徐 勝
(揚(yáng)州工業(yè)職業(yè)技術(shù)學(xué)院,江蘇 揚(yáng)州 225100)
2010年浙江大學(xué)在信息化“十二五”規(guī)劃中提出的“智慧校園”概念指明了高校信息化建設(shè)的方向。智慧校園是物理空間和信息空間有機(jī)銜接,使任何人、任何時(shí)間、任何地點(diǎn)都能便捷地獲取資源服務(wù)[1]。以物聯(lián)網(wǎng)為基礎(chǔ)的智慧化的校園工作、學(xué)習(xí)和生活一體化環(huán)境,這個(gè)一體化環(huán)境以各種應(yīng)用服務(wù)系統(tǒng)為載體,將教學(xué)、科研、管理和校園生活進(jìn)行充分融合。隨著智慧校園建設(shè)的深入,業(yè)務(wù)系統(tǒng)間數(shù)據(jù)的流通共享成了瓶頸,出現(xiàn)數(shù)據(jù)孤島問(wèn)題。《教育信息化2.0行動(dòng)計(jì)劃》明確提出推進(jìn)教育政務(wù)信息系統(tǒng)整合共享。以“互聯(lián)互通、信息共享、業(yè)務(wù)協(xié)同”為目標(biāo),完成教育政務(wù)信息系統(tǒng)整合工作。建立“覆蓋全國(guó)、統(tǒng)一標(biāo)準(zhǔn)、上下聯(lián)動(dòng)、資源共享”的教育政務(wù)信息資源大數(shù)據(jù),打破數(shù)據(jù)壁壘,實(shí)現(xiàn)一數(shù)一源和伴隨式數(shù)據(jù)采集。完善教育數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,促進(jìn)政務(wù)數(shù)據(jù)分級(jí)分層有效共享,避免數(shù)據(jù)重復(fù)采集,優(yōu)化業(yè)務(wù)管理,提升公共服務(wù),促進(jìn)決策支持[2]。因此,如何將智慧校園建設(shè)中沉淀的各類(lèi)數(shù)據(jù)轉(zhuǎn)為高價(jià)值數(shù)據(jù)資產(chǎn)是亟需解決的問(wèn)題。
目前,大數(shù)據(jù)已被廣泛應(yīng)用在社交媒體數(shù)據(jù)、瀏覽器日志和文本挖掘等數(shù)據(jù)集中,通過(guò)大數(shù)據(jù)技術(shù)創(chuàng)建預(yù)測(cè)模型,達(dá)到了解客戶(hù)及其行為、喜好的目的。利用大數(shù)據(jù),電信公司可以更好地預(yù)測(cè)客戶(hù)流失;沃爾瑪可以更準(zhǔn)確地預(yù)測(cè)產(chǎn)品銷(xiāo)售情況;汽車(chē)保險(xiǎn)公司能更真實(shí)地了解客戶(hù)實(shí)際駕駛情況。大數(shù)據(jù)技術(shù)應(yīng)用于高校場(chǎng)景,服務(wù)于教學(xué)管理等業(yè)務(wù),因而具有一些不同于其他領(lǐng)域的特點(diǎn)。首先,數(shù)字化校園建設(shè)階段的業(yè)務(wù)系統(tǒng)多由不同的廠商建設(shè),這就要求高校數(shù)據(jù)中心能夠?qū)硬煌?lèi)型的數(shù)據(jù)庫(kù)。同時(shí)信息化建設(shè)過(guò)程中,仍存在使用Excel表格管理權(quán)威數(shù)據(jù)的現(xiàn)象,這部分?jǐn)?shù)據(jù)也要能夠?qū)崿F(xiàn)線(xiàn)上的存儲(chǔ)和流通管理;其次,高校信息化建設(shè)過(guò)程中投入大量的人力、財(cái)力用于核心交換機(jī)、認(rèn)證計(jì)費(fèi)、防火墻、行為管理、負(fù)載均衡、無(wú)線(xiàn)AP等網(wǎng)絡(luò)設(shè)備建設(shè),這些設(shè)備產(chǎn)生的日志數(shù)據(jù)擁有很高的價(jià)值,卻因體量非常大難以發(fā)揮出來(lái)。數(shù)據(jù)中心要通過(guò)對(duì)日志數(shù)據(jù)的存儲(chǔ)、解析,并實(shí)現(xiàn)與高校主數(shù)據(jù)關(guān)聯(lián),以達(dá)到釋放日志內(nèi)在價(jià)值的目的;最后,有別于企業(yè)級(jí)數(shù)據(jù)中心專(zhuān)注于某一領(lǐng)域分析預(yù)測(cè),高校對(duì)于數(shù)據(jù)資產(chǎn)應(yīng)用和服務(wù)方向也是不斷發(fā)展變化,這就要求實(shí)現(xiàn)跨業(yè)務(wù)數(shù)據(jù)的關(guān)聯(lián)融合,根據(jù)需求實(shí)現(xiàn)數(shù)據(jù)的快速供給。
圍繞前述幾類(lèi)業(yè)務(wù)痛點(diǎn),聚焦“思想、目標(biāo)、管理、應(yīng)用、技術(shù)”的多維角度匯聚學(xué)校全量數(shù)據(jù),提升數(shù)據(jù)質(zhì)量,挖掘數(shù)據(jù)價(jià)值,旨在提升智慧校園數(shù)據(jù)服務(wù)能力,最大限度發(fā)揮其價(jià)值更好地服務(wù)師生,為學(xué)校的決策分析、運(yùn)營(yíng)管理效率和應(yīng)用生態(tài)的建設(shè)發(fā)揮重要作用。全量數(shù)據(jù)中心平臺(tái)架構(gòu)[3]如圖1所示。該平臺(tái)主要由“五個(gè)層面、兩大體系”構(gòu)成:全量數(shù)據(jù)采集及清洗轉(zhuǎn)換層、全量數(shù)據(jù)治理層、全量數(shù)據(jù)倉(cāng)庫(kù)層、全量數(shù)據(jù)管理層、統(tǒng)一數(shù)據(jù)門(mén)戶(hù)層(包含大數(shù)據(jù)分析應(yīng)用)以及數(shù)據(jù)治理體系和數(shù)據(jù)安全管控體系。整個(gè)架構(gòu)將充分支撐揚(yáng)州工業(yè)職業(yè)技術(shù)學(xué)院智慧校園中的各類(lèi)信息化服務(wù)綜合應(yīng)用。
圖1 全量數(shù)據(jù)中心平臺(tái)架構(gòu)
主數(shù)據(jù)是指學(xué)校范圍內(nèi)各個(gè)應(yīng)用系統(tǒng)間要共享的、高價(jià)值的數(shù)據(jù)(如學(xué)校基本信息、學(xué)生基本信息、教師基本信息等),具有變化緩慢、使用頻率高等特點(diǎn)。數(shù)據(jù)治理是圍繞數(shù)據(jù)資產(chǎn)展開(kāi)的一系列工作,以服務(wù)組織各層決策為目標(biāo),涉及有關(guān)數(shù)據(jù)管理的技術(shù)、過(guò)程、標(biāo)準(zhǔn)和政策的集合[4]。通過(guò)主數(shù)據(jù)的清洗治理工作,實(shí)現(xiàn)校級(jí)統(tǒng)一標(biāo)準(zhǔn)結(jié)構(gòu)、分類(lèi)清晰科學(xué)的高質(zhì)量數(shù)據(jù)集建設(shè)不僅能厘清全校數(shù)據(jù)資產(chǎn),也能夠提高高校決策的科學(xué)性和管理的有效性。
數(shù)據(jù)標(biāo)準(zhǔn)是整個(gè)信息化建設(shè)的基石,為信息交換、資源共享提供了基礎(chǔ)性條件。通過(guò)對(duì)全校各種數(shù)據(jù)的調(diào)研梳理,按照教育部行業(yè)標(biāo)準(zhǔn)為主體框架,進(jìn)行數(shù)據(jù)子集分類(lèi)和元數(shù)據(jù)標(biāo)準(zhǔn)定義,引用國(guó)家、行業(yè)的標(biāo)準(zhǔn)代碼以及學(xué)?,F(xiàn)有數(shù)據(jù)標(biāo)準(zhǔn),結(jié)合學(xué)校實(shí)際情況制定自有代碼標(biāo)準(zhǔn)、編碼規(guī)范、命名規(guī)范等,從而建立全校統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。制定數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)應(yīng)著重考慮以下方面:
(1)標(biāo)準(zhǔn)的兼容性:“標(biāo)準(zhǔn)”的實(shí)施對(duì)各職能部門(mén)信息系統(tǒng)建設(shè)、數(shù)據(jù)交換與共享,數(shù)據(jù)收集、分析、發(fā)布都有十分重要的意義,因此所采用的數(shù)據(jù)標(biāo)準(zhǔn)必須與國(guó)家標(biāo)準(zhǔn)、教育部等數(shù)據(jù)標(biāo)準(zhǔn)相兼容。
(2)標(biāo)準(zhǔn)的唯一性:一個(gè)分類(lèi)編碼標(biāo)準(zhǔn)中,每一編碼對(duì)象只能有唯一的代碼,一個(gè)代碼只唯一表示一個(gè)編碼對(duì)象。
(3)標(biāo)準(zhǔn)的可擴(kuò)性:隨著信息化進(jìn)程的發(fā)展,數(shù)據(jù)標(biāo)準(zhǔn)也必須是一個(gè)可以及時(shí)更新、不斷充實(shí)的動(dòng)態(tài)系統(tǒng)。
(4)標(biāo)準(zhǔn)的規(guī)范性:在一個(gè)信息編碼標(biāo)準(zhǔn)中,代碼的結(jié)構(gòu)、類(lèi)型以及編寫(xiě)格式必須統(tǒng)一。
(5)標(biāo)準(zhǔn)的適用性:代碼應(yīng)盡可能地反映分類(lèi)對(duì)象的特點(diǎn),便于應(yīng)用。
(6)標(biāo)準(zhǔn)的全面性:數(shù)據(jù)標(biāo)準(zhǔn)不僅包含國(guó)家、教育部級(jí)、學(xué)校本身的業(yè)務(wù)標(biāo)準(zhǔn)集,還要在業(yè)務(wù)標(biāo)準(zhǔn)的基礎(chǔ)上構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)標(biāo)準(zhǔn)以便實(shí)現(xiàn)學(xué)校的業(yè)務(wù)優(yōu)化和數(shù)據(jù)資產(chǎn)盤(pán)活。
由信息中心牽頭對(duì)學(xué)校的部門(mén)組織架構(gòu)、管理機(jī)制、數(shù)據(jù)管理現(xiàn)狀等進(jìn)行摸底。將各管理部門(mén)的業(yè)務(wù)內(nèi)容、組織機(jī)構(gòu)、管理信息系統(tǒng)、后臺(tái)數(shù)據(jù)庫(kù)信息、數(shù)據(jù)內(nèi)容和形態(tài)、供需關(guān)系、交換共享要求、數(shù)據(jù)質(zhì)量問(wèn)題、可引入的標(biāo)準(zhǔn)資源等進(jìn)行調(diào)研了解并輸出數(shù)據(jù)現(xiàn)狀報(bào)告,確定數(shù)據(jù)治理范圍,初步梳理出業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)治理的內(nèi)容。
根據(jù)數(shù)據(jù)調(diào)研的結(jié)果,羅列所有已知的數(shù)據(jù)來(lái)源和分布,記錄訪(fǎng)問(wèn)賬號(hào)和入口(獲取業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)只讀賬號(hào),部分業(yè)務(wù)系統(tǒng)對(duì)接采用視圖方式,則應(yīng)當(dāng)深度使用信息系統(tǒng),盡可能全的獲取視圖字段)查看實(shí)際的數(shù)據(jù)內(nèi)容。根據(jù)調(diào)研確定的數(shù)據(jù)治理范圍目標(biāo),從數(shù)據(jù)來(lái)源中識(shí)別出目標(biāo)數(shù)據(jù)所在的庫(kù)、表、字段和格式等信息。
通過(guò)對(duì)學(xué)校業(yè)務(wù)系統(tǒng)數(shù)據(jù)調(diào)研識(shí)別以及對(duì)系統(tǒng)數(shù)據(jù)庫(kù)的梳理,歸納整理出一卡通數(shù)據(jù)集、圖書(shū)管理數(shù)據(jù)集、財(cái)務(wù)管理數(shù)據(jù)集和科研管理數(shù)據(jù)集等9個(gè)數(shù)據(jù)集,建立高校統(tǒng)一數(shù)據(jù)倉(cāng)庫(kù)(UDW,University UnifiedData Warehouse)模型。
識(shí)別人事、科研和一卡通等系統(tǒng)數(shù)據(jù)庫(kù)中的業(yè)務(wù)數(shù)據(jù)表、代碼表,使用抽取-轉(zhuǎn)換-加載(ETL,Extract-Transform-Load)工具對(duì)表中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行抽取。配置定時(shí)調(diào)度任務(wù),利用凌晨各業(yè)務(wù)系統(tǒng)庫(kù)訪(fǎng)問(wèn)量不大的窗口期,集中對(duì)系統(tǒng)數(shù)據(jù)庫(kù)采集、加載到操作數(shù)據(jù)倉(cāng)庫(kù)(ODS,Operational Data Store)中。數(shù)據(jù)集成時(shí)需要在線(xiàn)連接多個(gè)外部業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù),同時(shí)系統(tǒng)數(shù)據(jù)庫(kù)還承載著實(shí)際業(yè)務(wù)的訪(fǎng)問(wèn)壓力,直接影響到業(yè)務(wù)系統(tǒng)的穩(wěn)定性,出現(xiàn)訪(fǎng)問(wèn)延遲等問(wèn)題。ODS庫(kù)作為原始業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)的拷貝用于數(shù)據(jù)集成,完美地解決了這樣的問(wèn)題,還能夠提高數(shù)據(jù)治理平臺(tái)的穩(wěn)定性和數(shù)據(jù)治理的效率。
基于學(xué)校各業(yè)務(wù)系統(tǒng)廠商數(shù)據(jù)字典,對(duì)數(shù)據(jù)的業(yè)務(wù)含義進(jìn)行理解,梳理需要采集的數(shù)據(jù)出處。根據(jù)數(shù)據(jù)字典識(shí)別理解原始數(shù)據(jù),從中篩選出有效的數(shù)據(jù)(即數(shù)據(jù)標(biāo)準(zhǔn)所對(duì)應(yīng)的數(shù)據(jù)范圍),進(jìn)行相應(yīng)的標(biāo)注:是否是主數(shù)據(jù)、是否是關(guān)鍵過(guò)程數(shù)據(jù)、備注等。數(shù)據(jù)識(shí)別完成后,記錄表與表之間的映射關(guān)系、字段與字段的映射關(guān)系,如圖2所示。
圖2 數(shù)據(jù)采集映射規(guī)劃
通過(guò)明確每一張數(shù)據(jù)表的權(quán)威數(shù)據(jù)來(lái)源于那個(gè)系統(tǒng)、中間經(jīng)過(guò)了哪些系統(tǒng)以及最后從那個(gè)庫(kù)里面被共享出去,輸出校級(jí)的數(shù)據(jù)血緣關(guān)系圖。繪制數(shù)據(jù)矩陣表(UCRM,Use Create Role Management)(如圖3所示),記錄和編輯每個(gè)數(shù)據(jù)項(xiàng)的產(chǎn)生部門(mén)(Create)和使用部門(mén)(Use),明確數(shù)據(jù)權(quán)威來(lái)源和責(zé)任歸屬,同時(shí)對(duì)部門(mén)各個(gè)角色(Role)在數(shù)據(jù)管理方面的權(quán)限(Management)進(jìn)行明確定義,以確立“一數(shù)一源”,厘清高校數(shù)據(jù)的脈絡(luò)、落實(shí)數(shù)據(jù)在共享交換過(guò)程中的職責(zé)。
圖3 校級(jí)UCRM矩陣圖
數(shù)據(jù)清洗轉(zhuǎn)換主要是對(duì)原始業(yè)務(wù)系統(tǒng)數(shù)據(jù)中存在的明顯錯(cuò)誤進(jìn)行識(shí)別和處理,包括遺漏值處理、噪音數(shù)據(jù)處理、不一致數(shù)據(jù)處理等內(nèi)容。根據(jù)數(shù)據(jù)映射關(guān)系,參照預(yù)先制定的數(shù)據(jù)標(biāo)準(zhǔn),對(duì)ODS庫(kù)中數(shù)據(jù)進(jìn)行格式統(tǒng)一、質(zhì)量提升等處理,最終輸出到UDW庫(kù)中。數(shù)據(jù)清洗轉(zhuǎn)換按照實(shí)際的處理過(guò)程,可分為以下幾種:
(1)數(shù)據(jù)名稱(chēng)及格式統(tǒng)一。主要包括統(tǒng)一的命名、數(shù)據(jù)格式、計(jì)量單位以及數(shù)據(jù)粒度轉(zhuǎn)換和商務(wù)規(guī)則等內(nèi)容,通過(guò)數(shù)據(jù)之間的映射關(guān)系來(lái)完成此過(guò)程。
(2)消除數(shù)據(jù)類(lèi)型的不一致。對(duì)不同數(shù)據(jù)源中的相同字段的類(lèi)型根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)中的定義進(jìn)行轉(zhuǎn)換。
(3)消除數(shù)據(jù)標(biāo)準(zhǔn)的不一致。數(shù)據(jù)集成過(guò)程中,將不同數(shù)據(jù)源的數(shù)據(jù)標(biāo)準(zhǔn)轉(zhuǎn)換成統(tǒng)一的格式。如人事系統(tǒng)中性別的定義為“男”“女”,一卡通系統(tǒng)中以整型的“M”代表男,“F”代表女,而在數(shù)據(jù)倉(cāng)庫(kù)中采用統(tǒng)一格式定義性別。
(4)數(shù)據(jù)二次計(jì)算處理。在數(shù)據(jù)倉(cāng)庫(kù)的場(chǎng)景中,部分?jǐn)?shù)據(jù)內(nèi)容無(wú)法從源數(shù)據(jù)庫(kù)中直接獲取,需要對(duì)源數(shù)據(jù)進(jìn)行字段的分割或計(jì)算,組合成新的內(nèi)容。數(shù)據(jù)二次計(jì)算主要包括對(duì)數(shù)據(jù)的匯總,例如從人員基礎(chǔ)信息中統(tǒng)計(jì)出各個(gè)學(xué)院的人數(shù)、職稱(chēng)等數(shù)據(jù),進(jìn)行中間數(shù)據(jù)的存儲(chǔ),在最終分析呈現(xiàn)中可以提高數(shù)據(jù)使用的效率、降低使用的門(mén)檻。
數(shù)據(jù)質(zhì)量是一種通過(guò)測(cè)量和改善數(shù)據(jù)綜合特征來(lái)優(yōu)化數(shù)據(jù)價(jià)值的過(guò)程[5]。數(shù)據(jù)清洗轉(zhuǎn)換完畢后,需要進(jìn)行數(shù)據(jù)質(zhì)量檢查,直觀展現(xiàn)出存在的數(shù)據(jù)質(zhì)量問(wèn)題,以供業(yè)務(wù)部門(mén)從源頭修正。根據(jù)我校對(duì)于數(shù)據(jù)的需求,定義數(shù)據(jù)質(zhì)量核心規(guī)則如表1所示。
表1 數(shù)據(jù)質(zhì)量核心規(guī)則
根據(jù)字段的業(yè)務(wù)特性,將質(zhì)量規(guī)則綁定到對(duì)應(yīng)字段上(一個(gè)字段可能會(huì)同時(shí)綁定多個(gè)規(guī)則)。執(zhí)行質(zhì)量檢查,輸出可視化數(shù)據(jù)質(zhì)量檢核報(bào)告,并根據(jù)校級(jí)UCRM矩陣確定數(shù)據(jù)源頭業(yè)務(wù)系統(tǒng),并將該報(bào)告推送至各部門(mén)相關(guān)負(fù)責(zé)人,實(shí)現(xiàn)數(shù)據(jù)的溯源修正。
為了更好地自主管理數(shù)據(jù)資產(chǎn),學(xué)校引入北京希嘉公司的數(shù)據(jù)治理平臺(tái)、非結(jié)構(gòu)化數(shù)據(jù)治理平臺(tái)、數(shù)據(jù)開(kāi)放共享平臺(tái)。通過(guò)實(shí)現(xiàn)數(shù)據(jù)治理、數(shù)據(jù)開(kāi)放共享等關(guān)鍵環(huán)節(jié)全流程可視化操作,解決以往只有廠家技術(shù)人員在數(shù)據(jù)庫(kù)層面或者線(xiàn)下層面才能完成的工作,從而真正掌握全校數(shù)據(jù)資產(chǎn)。
數(shù)據(jù)治理平臺(tái)(如圖4所示)集“標(biāo)準(zhǔn)制定、集成清洗、數(shù)據(jù)管理、質(zhì)量提升”功能為一體,提供半自動(dòng)化的線(xiàn)上工具去記錄、管控、沉淀整體流程。平臺(tái)實(shí)現(xiàn)了全校業(yè)務(wù)系統(tǒng)數(shù)據(jù)資產(chǎn)盤(pán)點(diǎn)、全生命周期元數(shù)據(jù)管理、主數(shù)據(jù)管理、校級(jí)數(shù)據(jù)標(biāo)準(zhǔn)管理、ETL接口同步管理和數(shù)據(jù)質(zhì)量檢測(cè)分析等諸多功能,保障數(shù)據(jù)治理過(guò)程中關(guān)鍵信息的及時(shí)性和一致性,為學(xué)校的數(shù)據(jù)治理工作提供可視化的數(shù)據(jù)支撐。
圖4 數(shù)據(jù)治理平臺(tái)
相較于結(jié)構(gòu)化的主數(shù)據(jù),非結(jié)構(gòu)化日志數(shù)據(jù)和半結(jié)構(gòu)化的線(xiàn)下表格數(shù)據(jù)也是學(xué)校數(shù)據(jù)資產(chǎn)的重要組成部分。日志數(shù)據(jù)來(lái)源于各類(lèi)網(wǎng)絡(luò)設(shè)備、安全設(shè)備、應(yīng)用系統(tǒng)等,其特性為非結(jié)構(gòu)化存儲(chǔ)、體量巨大,但其中蘊(yùn)含了高價(jià)值的行為類(lèi)信息。構(gòu)建了基于Hadoop集群的日志治理平臺(tái)(如圖5所示),實(shí)現(xiàn)對(duì)于多源日志數(shù)據(jù)的一鍵式接入、解析、關(guān)聯(lián)和計(jì)算等功能,從而為更為豐富的應(yīng)用分析場(chǎng)景提供高質(zhì)量、結(jié)構(gòu)化的日志數(shù)據(jù)源。
圖5 日志數(shù)據(jù)治理平臺(tái)
由于學(xué)校信息化水平限制等原因,很多的權(quán)威數(shù)據(jù)通過(guò)線(xiàn)下Excel表格進(jìn)行管理。構(gòu)建了基于可視化界面的線(xiàn)下數(shù)據(jù)治理平臺(tái),在兼顧業(yè)務(wù)部門(mén)人員維護(hù)數(shù)據(jù)習(xí)慣的基礎(chǔ)上,實(shí)現(xiàn)對(duì)于此類(lèi)高價(jià)值數(shù)據(jù)的采集,最終實(shí)現(xiàn)對(duì)于部門(mén)權(quán)威線(xiàn)下數(shù)據(jù)的常態(tài)化收集利用。
數(shù)據(jù)開(kāi)放是指通過(guò)數(shù)據(jù)接口、網(wǎng)站等形式,在業(yè)務(wù)系統(tǒng)內(nèi)部、系統(tǒng)之間或面向全社會(huì),合理合法公開(kāi)特定數(shù)據(jù)的獲取與使用權(quán)限[6]。傳統(tǒng)數(shù)據(jù)共享在數(shù)據(jù)庫(kù)層面用視圖完成,存在系統(tǒng)間數(shù)據(jù)協(xié)調(diào)復(fù)雜,難以復(fù)用、廠商響應(yīng)速度太慢、信息中心運(yùn)維管控困難和共享數(shù)據(jù)實(shí)時(shí)性難以保證等諸多痛點(diǎn)。因此應(yīng)構(gòu)建數(shù)據(jù)開(kāi)放共享平臺(tái),將學(xué)校不同類(lèi)別數(shù)據(jù)源以統(tǒng)一的API接口方式對(duì)外開(kāi)放,供第三方開(kāi)發(fā)者使用,減少對(duì)數(shù)據(jù)庫(kù)的直接訪(fǎng)問(wèn),降低數(shù)據(jù)共享門(mén)檻,滿(mǎn)足實(shí)時(shí)、按需的共享需求,適應(yīng)高校智慧校園一站式服務(wù)中碎片化服務(wù)流程的需要。該平臺(tái)實(shí)現(xiàn)了數(shù)據(jù)的發(fā)布、申請(qǐng)、審核、調(diào)用全流程可控與數(shù)據(jù)安全保障等功能。數(shù)據(jù)開(kāi)放平臺(tái)界面如圖6所示。
圖6 數(shù)據(jù)開(kāi)放平臺(tái)界面
主數(shù)據(jù)治理以及三大平臺(tái)(數(shù)據(jù)治理平臺(tái)、非結(jié)構(gòu)化數(shù)據(jù)治理平臺(tái)和數(shù)據(jù)開(kāi)放共享平臺(tái))的建設(shè)完成,全量數(shù)據(jù)中心整體框架基本完成,數(shù)據(jù)紅利初步釋放。在數(shù)據(jù)開(kāi)放共享方面,平臺(tái)已相繼完成對(duì)專(zhuān)業(yè)管理平臺(tái)、教師發(fā)展平臺(tái)、云課堂和學(xué)工系統(tǒng)的數(shù)據(jù)供給,如圖7所示。在數(shù)據(jù)分析決策方面,領(lǐng)導(dǎo)駕駛艙已完成基本辦學(xué)條件、師資、教學(xué)、科研、圖書(shū)、國(guó)資、一卡通和智慧網(wǎng)絡(luò)等8大類(lèi)主題分析,如圖8所示。
圖7 數(shù)據(jù)開(kāi)放平臺(tái)應(yīng)用管理
圖8 領(lǐng)導(dǎo)駕駛艙主題分析
本文從高校數(shù)據(jù)現(xiàn)狀入手,說(shuō)明了建設(shè)全量數(shù)據(jù)中心平臺(tái)的必要性。通過(guò)對(duì)平臺(tái)框架、主數(shù)據(jù)治理、數(shù)據(jù)開(kāi)放共享等問(wèn)題的研究,闡述全量數(shù)據(jù)中心平臺(tái)建設(shè)的全過(guò)程。該平臺(tái)的建設(shè)解決了業(yè)務(wù)系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)不一致、數(shù)據(jù)交換門(mén)檻高、數(shù)據(jù)質(zhì)量不高等問(wèn)題,為“智慧校園”建設(shè)打好了數(shù)據(jù)基礎(chǔ)。如何將外部互聯(lián)網(wǎng)等更多類(lèi)型數(shù)據(jù)納入平臺(tái)當(dāng)中,并將它們與主數(shù)據(jù)關(guān)聯(lián)應(yīng)用于不同類(lèi)型主題分析則是下一步需要重點(diǎn)研究的問(wèn)題。