韓 昊
(武漢軟件工程職業(yè)學院 湖北 武漢 430033)
隨著“建設(shè)終身教育體系,構(gòu)建學習型社會”成為國家戰(zhàn)略,全國各地先后出臺了適應本地實際情況的終身教育體系建設(shè)任務和目標,其中相當關(guān)鍵的一環(huán)就是終身教育信息化平臺的建設(shè),即利用“互聯(lián)網(wǎng)+終身教育”模式推動區(qū)域乃至全社會終身教育體系的構(gòu)建與發(fā)展。目前,我國各地的廣播電視大學、社區(qū)教育學院等有關(guān)教育機構(gòu)作為當?shù)亟K身教育體系建設(shè)的主體,根據(jù)所在區(qū)域的實際情況,建設(shè)了一批面向區(qū)域內(nèi)全體居民的終身學習信息化平臺,其中影響較大的有:“全民終身學習公共服務平臺”“奧鵬教育”“上海學習網(wǎng)”等,這些終身學習平臺學習資源豐富、課程設(shè)置全面、支持服務系統(tǒng)較為完善,對于滿足不同人群的個性化學習需求、促進當?shù)亟K身教育發(fā)展發(fā)揮著重要作用[1]。
在大數(shù)據(jù)視域下,如何對終身教育信息化平臺存儲的用戶基本信息、學習行為、日志行為等大數(shù)據(jù)進行分析,構(gòu)建學習者畫像,實現(xiàn)個性化學習資源推送、學習路徑推薦,學習異常行為預警等功能,從整體上提升信息化平臺對學習者個性化學習需求的支持能力,是終身教育信息化平臺構(gòu)建研究的熱點。本文提出了一種基于數(shù)據(jù)中臺的終身教育信息化平臺架構(gòu),從異構(gòu)的底層數(shù)據(jù)庫中采集學習者在線學習行為、資源使用統(tǒng)計等數(shù)據(jù),通過匯聚、預處理、計算、開發(fā)、挖掘、封裝等流程構(gòu)建數(shù)據(jù)倉庫,將數(shù)據(jù)歸類為各種主題,形成數(shù)據(jù)資產(chǎn)。根據(jù)應用需求,封裝主題數(shù)據(jù),為各類應用提供統(tǒng)一規(guī)范的數(shù)據(jù)服務體系,實現(xiàn)采集、匯聚、開發(fā)、封裝、服務和反饋閉環(huán),為終身學習信息化平臺的建設(shè)和運營提供強有力的數(shù)據(jù)支持。
數(shù)據(jù)中臺并非指大數(shù)據(jù)平臺,而是指通過數(shù)據(jù)技術(shù)對海量的數(shù)據(jù)進行采集、計算、存儲和加工,并統(tǒng)一標準和口徑[2]。從本質(zhì)上來說,數(shù)據(jù)中臺就是通過有形的設(shè)施設(shè)備和實施方法,依據(jù)教學與學習業(yè)務的需求,經(jīng)過全域數(shù)據(jù)采集、匯聚、預處理、計算、封裝等過程,構(gòu)建一套“讓數(shù)據(jù)持續(xù)運作并發(fā)揮價值”的機制,即一套持續(xù)不斷把數(shù)據(jù)變成資產(chǎn)并服務于業(yè)務的機制。數(shù)據(jù)中臺通常具有四個核心能力,即數(shù)據(jù)匯聚能力、數(shù)據(jù)處理(加工)能力、數(shù)據(jù)可視化能力、數(shù)據(jù)價值變現(xiàn)能力??偟膩碚f,就是數(shù)據(jù)中臺可以從異構(gòu)的底層數(shù)據(jù)庫采集各種結(jié)構(gòu)的數(shù)據(jù),匯聚成數(shù)據(jù)湖;通過預處理、計算、開發(fā)、挖掘等步驟構(gòu)建數(shù)據(jù)倉庫,存儲滿足教學與學習需求的各類數(shù)據(jù)主題;將數(shù)據(jù)主題封裝成可供不同應用的數(shù)據(jù)服務接口,形成標準的數(shù)據(jù)服務體系。特別重要的是,整個數(shù)據(jù)運行閉環(huán)都有數(shù)字資產(chǎn)管理功能提供數(shù)據(jù)資產(chǎn)管理和安全管理。
本文以信息化條件下終身學習實際需求為導向,將數(shù)據(jù)中臺概念融入到整體架構(gòu)設(shè)計中。整個架構(gòu)分為底層數(shù)據(jù)層、數(shù)據(jù)中臺和應用層。其中,作為信息化平臺核心的數(shù)據(jù)中臺將學習者的基本信息,包括學習行為數(shù)據(jù)、學習統(tǒng)計數(shù)據(jù)、學習軌跡,以及教學資源文件、信息化平臺日志等作為數(shù)據(jù)源,進行全域采集和統(tǒng)一存儲,形成數(shù)據(jù)湖。依據(jù)終身教育學習和管理需求,運用OLAP、數(shù)據(jù)挖掘和人工智能等方法對數(shù)據(jù)湖進行加工和萃取,將數(shù)據(jù)聚合成主題,最后將數(shù)據(jù)主題進行封裝來構(gòu)建數(shù)據(jù)服務體系,向用戶管理、資源管理、學分銀行、統(tǒng)計報表等應用模塊提供統(tǒng)一標準的數(shù)據(jù)支持。應用層處于架構(gòu)的最頂端,包含平臺的業(yè)務和管理功能,通過調(diào)用數(shù)據(jù)中臺提供的數(shù)據(jù)服務接口獲取運行所需數(shù)據(jù),并將運行結(jié)果反饋到底層數(shù)據(jù)庫。整個架構(gòu)形成了數(shù)據(jù)采集、匯聚、開發(fā)、挖掘、服務和反饋的完整閉環(huán),實現(xiàn)從信息化平臺各功能模塊獲取數(shù)據(jù),形成數(shù)據(jù)資產(chǎn)并反哺應用的目的。
基于數(shù)據(jù)中臺的終身教育信息化平臺構(gòu)建是一個系統(tǒng)工程,通過數(shù)據(jù)采集、匯聚及預處理構(gòu)建數(shù)據(jù)倉庫,利用數(shù)據(jù)挖掘、人工智能等技術(shù)深入挖掘利用信息化平臺大數(shù)據(jù),以數(shù)據(jù)服務接口的方式向平臺的業(yè)務和管理功能模塊提供數(shù)據(jù)支持,為學習者利用信息化平臺進行終身學習提供全過程的信息化支持與服務。本文提出的基于數(shù)據(jù)中臺的終身教育信息化平臺總體架構(gòu)如圖1所示。
圖1 基于數(shù)據(jù)中臺的終身教育信息化平臺總體架構(gòu)
基礎(chǔ)設(shè)施層指的是為信息化平臺提供基礎(chǔ)網(wǎng)絡(luò)服務、存儲服務、業(yè)務服務等底層基礎(chǔ)性服務的設(shè)施設(shè)備,涉及應用服務器、數(shù)據(jù)庫服務器、目錄服務器、安全管理服務器、資源服務器、核心交換機等硬件設(shè)施設(shè)備,以及運行在服務器上的操作系統(tǒng)和應用軟件軟件,通過虛擬化等手段實現(xiàn)存儲、計算等資源利用率最大化,平衡負載、對軟硬件資源進行有效監(jiān)控。如學習者利用信息化平臺學習的行為數(shù)據(jù)、學習資源數(shù)據(jù)、平臺管理日志等初始數(shù)據(jù)均保存在本層的數(shù)據(jù)庫中,作為整個學習平臺的原始數(shù)據(jù)來源。
數(shù)據(jù)中臺是整個數(shù)字化學習環(huán)境的核心部分,它是一種數(shù)據(jù)處理機制,是將學習過程中產(chǎn)生的各類數(shù)據(jù)進行一系列處理形成數(shù)據(jù)資產(chǎn)、屏蔽底層數(shù)據(jù)細節(jié)、對外提供標準的數(shù)據(jù)服務接口的機制,包括數(shù)據(jù)的采集與匯聚、開發(fā)、計算、挖掘、封裝等過程,在數(shù)據(jù)資產(chǎn)治理和數(shù)據(jù)安全管理功能管控下,形成了從數(shù)據(jù)的采集到數(shù)據(jù)服務接口(API)的完整閉環(huán)。
4.3.1 數(shù)據(jù)采集與匯聚
數(shù)據(jù)采集與匯聚功能是數(shù)據(jù)中臺的入口,它從異構(gòu)的底層數(shù)據(jù)庫中將各類結(jié)構(gòu)化、半結(jié)構(gòu)化和無結(jié)構(gòu)數(shù)據(jù)采集到數(shù)據(jù)中臺進行集中存儲,形成數(shù)據(jù)湖,構(gòu)成整個數(shù)據(jù)中臺運行的數(shù)據(jù)基礎(chǔ)。
4.3.2 數(shù)據(jù)開發(fā)
數(shù)據(jù)開發(fā)是一整套數(shù)據(jù)加工以及加工過程管控的工具,面向開發(fā)人員、分析人員,提供離線、實時、算法開發(fā)工具,以及任務的管理、代碼發(fā)布、運維、監(jiān)控、告警等一系列集成工具,具備批計算、流計算、在線查詢、即時分析計算能力[3],可以實現(xiàn)離線計算、實時計算和人工智能等。數(shù)據(jù)開發(fā)功能將采集、匯聚而成的數(shù)據(jù)湖轉(zhuǎn)變?yōu)榻K身教育信息化平臺的數(shù)據(jù)資產(chǎn),為進一步面向應用提供數(shù)據(jù)服務打下基礎(chǔ)。例如,通過對成績管理模塊、學習行為日志等功能模塊中有關(guān)學生的學習行為、成績等原始數(shù)據(jù)進行關(guān)聯(lián)分析,建立學生學習行為模型、學生畫像等,供數(shù)據(jù)服務體系封裝使用。
4.3.3 數(shù)據(jù)資產(chǎn)管理
數(shù)據(jù)資產(chǎn)管理是對終身教育信息化平臺數(shù)據(jù)資產(chǎn)的識別和管理,重點是保障數(shù)據(jù)質(zhì)量,以管理人員能夠理解的形式進行展示數(shù)據(jù)的組織結(jié)構(gòu)等信息,包括數(shù)據(jù)地圖、數(shù)據(jù)血緣管理等。例如,數(shù)據(jù)血緣管理可以對學習者學習行為日志報表中的異常數(shù)據(jù)進行追根溯源,快速準確地定位初始問題表格,幫助管理人員及時、快速、準確地進行修正;數(shù)據(jù)質(zhì)量管理通過對數(shù)據(jù)進行深入分析比對、科學的評估、實時的監(jiān)控、錯誤預警等方法保證數(shù)據(jù)質(zhì)量。
4.3.4 數(shù)據(jù)服務體系
數(shù)據(jù)服務體系是將數(shù)據(jù)資產(chǎn)按照終身教育信息化平臺功能模塊應用的需求進行數(shù)據(jù)服務封裝,以接口的形式面向各功能模塊提供服務,最大程度發(fā)揮數(shù)據(jù)的價值,是整個數(shù)據(jù)中臺核心價值所在。例如,根據(jù)平臺統(tǒng)計分析功能的數(shù)據(jù)需求,可以提供學生數(shù)據(jù)引擎,供學習平臺查詢學生信息,分析學生學習行為等。數(shù)據(jù)服務體系最大的特點就是能屏蔽底層數(shù)據(jù)庫細節(jié),根據(jù)業(yè)務需求提供統(tǒng)一、可復用的數(shù)據(jù)服務接口,最大程度的實現(xiàn)數(shù)據(jù)對各類應用的支持服務功能。
4.3.5 數(shù)據(jù)安全管理
數(shù)據(jù)安全管理是整個數(shù)字化學習環(huán)境運行的基礎(chǔ)和保障,隨著《網(wǎng)絡(luò)安全法》的頒布與實施,數(shù)據(jù)安全更是成為了一個法律問題。數(shù)據(jù)安全管理功能圍繞數(shù)字化學習環(huán)境與學習過程中的數(shù)據(jù)產(chǎn)生、存儲、計算及應用全周期構(gòu)建安全管控體系,對“發(fā)布—申請—審核—調(diào)用—運維”全過程提供安全保障。
應用層作為整個架構(gòu)最頂層,直接為學習者和管理者提供學習和管理服務。應用層包括身份認證、課程中心、項目培訓、學分銀行、專題課程等功能,用戶通過SAAS方式調(diào)用功能模塊,而各應用功能模塊調(diào)用數(shù)據(jù)中臺的數(shù)據(jù)服務接口來獲取運行所需數(shù)據(jù),運行過程中將產(chǎn)生的數(shù)據(jù)反饋回底層數(shù)據(jù)庫,使得數(shù)據(jù)的存儲、匯聚、開發(fā)、應用、反饋形成閉環(huán),有利于充分挖掘數(shù)據(jù)價值,為學習者學習和管理者決策提供數(shù)據(jù)支持。
本文提出了一種基于數(shù)據(jù)中臺的終身教育信息化平臺構(gòu)建策略,利用數(shù)據(jù)中臺從異構(gòu)的底層數(shù)據(jù)庫中采集、匯聚各種結(jié)構(gòu)的數(shù)據(jù),通過數(shù)據(jù)開發(fā)構(gòu)建數(shù)據(jù)倉庫,形成數(shù)據(jù)資產(chǎn),利用數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)封裝提供統(tǒng)一標準的數(shù)據(jù)服務接口,提升終身教育信息化平臺的數(shù)據(jù)支持能力,為構(gòu)建“數(shù)據(jù)驅(qū)動”的終身教育信息化平臺提供參考。