摘 ? 要:伴隨著智能時代的到來,數(shù)據(jù)成為重要的戰(zhàn)略資源,數(shù)據(jù)驅(qū)動成為現(xiàn)代教育的基本特征,教育數(shù)據(jù)治理面臨著新的變革。文章在分析了智能時代教育數(shù)據(jù)治理面臨的復雜挑戰(zhàn)后,歸納了智能時代教育數(shù)據(jù)治理應當實現(xiàn)精準、敏捷、安全的管理目標,并從管理體系和技術體系兩個維度,分別論述了智能時代教育數(shù)據(jù)治理策略的內(nèi)涵,提出了數(shù)據(jù)確權(quán)、治理機構(gòu)和數(shù)據(jù)標準等可行管理機制,以及敏捷的教育數(shù)據(jù)部署、可信的教育數(shù)據(jù)日志管理和可靠的教育數(shù)據(jù)共享機制等技術保障路徑。
關鍵詞:教育數(shù)據(jù)治理;人工智能;教育大數(shù)據(jù)
中圖分類號:G434;TP274 ?文獻標志碼:A ? 文章編號:1673-8454(2022)01-0011-07
一、引言
伴隨著信息技術的迅猛發(fā)展,數(shù)據(jù)已成為當今社會正常運轉(zhuǎn)的基石。2020 年 3 月出臺的《中共中央 國務院關于構(gòu)建更加完善的要素市場化配置體制機制的意見》中,明確將數(shù)據(jù)作為與土地、勞動力、資本和技術并列的五大生產(chǎn)要素之一,意義十分重大深遠??梢哉f,數(shù)據(jù)是數(shù)字時代最重要的戰(zhàn)略資源,其在各行各業(yè)中的地位和價值日益凸顯。
在教育領域,由于教育信息化發(fā)展和智慧教育探索的不斷深化,教育數(shù)據(jù)的采集、存儲、分析、應用已逐步覆蓋教育的方方面面,數(shù)據(jù)驅(qū)動已成為現(xiàn)代教育的基本特征[1],數(shù)據(jù)技術已經(jīng)引發(fā)了教育實踐與教育研究的范式轉(zhuǎn)變。[2]特別是人工智能技術的快速發(fā)展及其在教育中的加速應用,更加鞏固了教育數(shù)據(jù)在未來教育中的基礎性、戰(zhàn)略性地位。無論是基于深度學習的教育行為理解和分析、基于大數(shù)據(jù)分析的個性化學習,還是基于計算機視覺和自然語言處理的智能學伴、基于泛在計算的智慧校園等,智慧教育樣態(tài)無不仰賴于我們對教育數(shù)據(jù)的獲取和理解。與此同時,教育數(shù)據(jù)也給教育評價改革帶來新的契機,利用學習分析、學生畫像、教育大數(shù)據(jù)等數(shù)據(jù)科學手段,能夠?qū)崿F(xiàn)因材施教和過程性評價的統(tǒng)一,將“千人一面”的標準化考試變成“多一把尺子”的個性化評價。[3]
2021年7月,《教育部等六部門關于推進教育新型基礎設施建設構(gòu)建高質(zhì)量教育支撐體系的指導意見》提出,到2025年,要基本形成結(jié)構(gòu)優(yōu)化、集約高效、安全可靠的教育新型基礎設施體系。教育數(shù)據(jù)無疑是教育新基建的核心要素和關鍵變量。為確保教育數(shù)據(jù)在分析和應用中發(fā)揮最大的效能,教育數(shù)據(jù)治理成為一個不可回避的話題。
數(shù)據(jù)治理在不同的專業(yè)領域往往有不同的內(nèi)涵,但總體上來說,學術界基本認可DAMA的定義,即數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)利和控制的活動的集合。[4]數(shù)據(jù)治理的概念由信息管理領域提出,并伴隨信息技術的普遍應用逐漸滲透到經(jīng)濟、社會、法律和教育領域。
從數(shù)據(jù)治理發(fā)展的外延來看,最早是以個別組織的角度考慮大數(shù)據(jù)治理的相關問題,強調(diào)的是從組織內(nèi)部的高級管理層及組織架構(gòu)和職責入手,建立企業(yè)級的數(shù)據(jù)治理體系,自上而下推動數(shù)據(jù)相關工作在全企業(yè)范圍的開展。但隨著數(shù)據(jù)開放、流通技術以及渠道的逐步完善,數(shù)據(jù)的跨組織乃至跨境流動和應用已經(jīng)發(fā)生并呈現(xiàn)出日益普及的趨勢。數(shù)據(jù)治理是涉及個人、企業(yè)、政府,行業(yè)內(nèi)和跨行業(yè),區(qū)域內(nèi)和跨區(qū)域,全國乃至全球多個層次的問題,通過多層次的協(xié)同才能實現(xiàn)??偠灾?,教育數(shù)據(jù)是智能時代教育的核心要素之一,教育數(shù)據(jù)治理也將對智能時代教育的發(fā)展起到全局性和引領性的作用。
二、教育數(shù)據(jù)治理面臨的復雜挑戰(zhàn)解析
由于教育數(shù)據(jù)屬性的復雜性和教育數(shù)據(jù)利益相關方的多樣性,在教育數(shù)據(jù)治理領域長期存在著數(shù)據(jù)安全風險、數(shù)據(jù)質(zhì)量等問題。隨著大數(shù)據(jù)、人工智能技術的發(fā)展和在線教育領域的應用,教育數(shù)據(jù)治理面臨著諸如數(shù)據(jù)無偏性、應用結(jié)果可解釋性等一系列新的挑戰(zhàn)??偨Y(jié)當前教育數(shù)據(jù)治理面對的各種問題和風險,是應對這些問題的前提。綜合歸納來看,教育數(shù)據(jù)治理面臨的挑戰(zhàn)主要表現(xiàn)在以下幾個方面:
(一)數(shù)據(jù)源挑戰(zhàn)
教育數(shù)據(jù)的突出特點之一是數(shù)據(jù)來源的廣泛性和復雜性。伴隨著數(shù)字社會的深化和教育信息化的發(fā)展,教育數(shù)據(jù)的來源已經(jīng)大大擴充。從課堂到校園,從線下到線上,從教師到學生,各類教育數(shù)據(jù)已經(jīng)大量生成。換言之,教育數(shù)據(jù)生態(tài)已經(jīng)進入一種典型的“多中心”組織模式,多樣的數(shù)據(jù)源帶來了教育數(shù)據(jù)治理三個方面的困境:
第一,不同數(shù)據(jù)源的權(quán)威性和有效性不同。對于同一客體,不同數(shù)據(jù)來源產(chǎn)生不同的數(shù)據(jù),往往其權(quán)威性和有效性不可等量齊觀。例如,從教學效果評價角度來看,課堂測試的學業(yè)數(shù)據(jù)往往比學生課堂行為數(shù)據(jù)更加準確有效。
第二,不同數(shù)據(jù)源往往數(shù)據(jù)格式和數(shù)據(jù)標準不一致,無法有效地實現(xiàn)數(shù)據(jù)融合。例如,對于高校外部的專利、基金項目、教育部統(tǒng)計等數(shù)據(jù)源與學校內(nèi)部的教務、科研等管理數(shù)據(jù)源之間,由于數(shù)據(jù)源在建設時僅考慮自身需求,同樣數(shù)據(jù)在不同數(shù)據(jù)源中有不同的屬性信息,各數(shù)據(jù)源間缺乏協(xié)調(diào),彼此獨立,增加了數(shù)據(jù)治理的難度。[5]
第三,數(shù)據(jù)源的無偏性成為影響教育數(shù)據(jù)的重要因素。受制于教育數(shù)據(jù)采集的事業(yè)環(huán)境因素和技術水平條件,數(shù)據(jù)源生成的數(shù)據(jù)往往是有偏的,在基于機器學習的應用中,會導致算法的不可靠,并會對教育行為的正確解釋帶來負面影響。
(二)數(shù)據(jù)質(zhì)量挑戰(zhàn)
數(shù)據(jù)質(zhì)量是數(shù)據(jù)滿足使用需求的程度。隨著教育數(shù)據(jù)體量的急劇增大,非結(jié)構(gòu)化數(shù)據(jù)占比增加,教育數(shù)據(jù)的質(zhì)量問題也日益突出。
從教育數(shù)據(jù)的完整性來看,不同種類的教育數(shù)據(jù)其完整性往往各不相同。一般來說,根據(jù)不同的應用需求,教育數(shù)據(jù)完整性要求也不同,部分不完整數(shù)據(jù)的治理問題可以通過多維數(shù)據(jù)校正等方法獲得改善,但如何保證教育數(shù)據(jù)的完整性、降低應用的復雜度依然是一個重要的問題。
從教育數(shù)據(jù)的準確性來看,作為最基本和最重要的屬性,教育數(shù)據(jù)的準確性往往需要自動化數(shù)據(jù)采集和處理過程進行保證。在現(xiàn)階段部分數(shù)據(jù)源無法避免人工干預的條件下,教育數(shù)據(jù)的準確性還將繼續(xù)成為數(shù)據(jù)質(zhì)量的挑戰(zhàn)之一。
從教育數(shù)據(jù)的可用性[6]來看,相當一部分的教育數(shù)據(jù)處于“冷存儲”狀態(tài),無法實現(xiàn)實時可用,對“熱數(shù)據(jù)”的備份與容災能力也不能滿足日益增長的數(shù)據(jù)應用需求。
從教育數(shù)據(jù)的時效性來看,隨著各種教育信息化技術的廣泛應用,對教育數(shù)據(jù)的時效性需求不斷提升,教育數(shù)據(jù)的時效性也成為衡量教育數(shù)據(jù)價值的重要因素之一。
(三)數(shù)據(jù)應用挑戰(zhàn)
教育數(shù)據(jù)獨特的價值在于其表征的教育活動以及對各類教育活動之間關系的描述[7],教育數(shù)據(jù)的應用也必須遵循教育規(guī)律和教育價值的一般要求。在教育數(shù)據(jù)應用層面,教育數(shù)據(jù)治理面臨的挑戰(zhàn)如下:
第一個挑戰(zhàn)是教育數(shù)據(jù)產(chǎn)權(quán)的模糊性問題,由于教育數(shù)據(jù)本身的復雜性,部分數(shù)據(jù)(如數(shù)字教育資源、法定教育統(tǒng)計數(shù)據(jù)等)產(chǎn)權(quán)較明確,而教育行為數(shù)據(jù)、學情數(shù)據(jù)等方面則存在一些模糊地帶,有待規(guī)范。[8]
第二個挑戰(zhàn)是教育數(shù)據(jù)使用權(quán)限的管理問題,即教育數(shù)據(jù)在應用中由誰授權(quán)、由誰使用、如何使用的問題,這也是教育數(shù)據(jù)管理領域必須回應的一個重要問題。
第三個挑戰(zhàn)來自于技術方面,即教育數(shù)據(jù)應用結(jié)果的可解釋性問題。一般來說,大數(shù)據(jù)應用往往僅基于數(shù)據(jù)的相關性,即數(shù)據(jù)間的匹配關系不基于某種因果邏輯,僅表現(xiàn)為數(shù)值趨勢的相關。在其他一些學科或領域,例如統(tǒng)計學或市場營銷領域,這種無須得到合理解釋的變量相關性,往往會帶來意想不到的有益結(jié)果。然而在教育領域,因果性的需求往往是必要的,換言之,教育數(shù)據(jù)應用的結(jié)果應當具備邏輯上的可解釋性。
第四個挑戰(zhàn)是隨著教育數(shù)據(jù)應用廣度和深度的發(fā)展,教育數(shù)據(jù)應用的倫理問題日漸突出。[9]從實踐應用來看,教育數(shù)據(jù)的隱私保護和開放共享之間存在嚴重沖突,教育數(shù)據(jù)應用必須在保護師生隱私和開放共享之間求取一個平衡點。[10]此外,和其他數(shù)據(jù)類似,數(shù)據(jù)安全風險也伴隨著教育數(shù)據(jù)應用的全過程。隨著人工智能技術的發(fā)展,教育數(shù)據(jù)應用的無偏性問題也值得重視。由于人工智能應用存在無偏性傳遞的問題,即“Bias in,Bias out”,也就是“偏見進,偏見出”,對于智能教育應用來說,其用來訓練算法的教育數(shù)據(jù)本身的無偏性以及對智能算法進行應力測試的過程,都會影響算法最終應用中的無偏性。數(shù)據(jù)源體現(xiàn)出的教育價值觀、數(shù)據(jù)集存在的偏見和技術本身的缺陷都會反映到算法中,并被放大為一個不可忽略的風險。
三、智能時代教育數(shù)據(jù)治理目標
數(shù)據(jù)治理是追求公共利益最大化的社會治理過程[11],因此,首先需要明確數(shù)據(jù)治理的基本原則。智能時代教育數(shù)據(jù)治理作為數(shù)據(jù)治理的一個特定子集,其本質(zhì)可以概括為既充分挖掘教育數(shù)據(jù)的價值,又同時降低數(shù)據(jù)使用成本和控制數(shù)據(jù)應用中潛在風險的過程。
教育數(shù)據(jù)治理目標中的這三方面要素既互相聯(lián)系,又互相制約,形成一種如圖1所示的類似“不可能三角”的關系,即在實際應用場景中,往往只能完全滿足其中兩方面的要求。魚與熊掌不可得兼時,就要求我們必須在進行數(shù)據(jù)治理之初就做好統(tǒng)籌規(guī)劃,根據(jù)實際場景的需要進行適當取舍,不可簡單偏廢任何一方。
(一)教育數(shù)據(jù)精準治理
教育數(shù)據(jù)精準治理是充分挖掘教育數(shù)據(jù)價值的前提和保證。此處的“精準”治理包含有兩重含義:首先是價值數(shù)據(jù)的精準識別,其次是數(shù)據(jù)本身的準確性。一方面,教育數(shù)據(jù)作為一種教育活動的電子化記錄,充斥于教育過程中,在多數(shù)情況下都無關教育活動或智能教育應用的重大利益,并沒有特別進行數(shù)據(jù)治理的必要。有鑒于此,教育數(shù)據(jù)治理需要符合滿足數(shù)據(jù)應用需求前提下的最小化獲取原則,重點關注具有較大教育價值的數(shù)據(jù)。另一方面,對于具備較大教育價值的數(shù)據(jù),則需要確保其準確性和可追溯性,以便為人工智能時代的教育應用創(chuàng)造更加有益的價值。
(二)教育數(shù)據(jù)敏捷治理
數(shù)據(jù)治理的敏捷性是反映數(shù)據(jù)服務中的靈活性、數(shù)據(jù)快速適應需求、快速執(zhí)行請求和持續(xù)性改進的一種能力。教育數(shù)據(jù)由于具有體量龐大、涉及面廣、多元異構(gòu)、實效性強等特點,如果采用全域、復雜的治理模式,將極大地提升數(shù)據(jù)治理和數(shù)據(jù)應用的成本,而敏捷治理成為降低數(shù)據(jù)應用成本的一個重要方式。
首先,教育數(shù)據(jù)的可用性挑戰(zhàn)決定了教育數(shù)據(jù)治理體系需要面對快速的數(shù)據(jù)應用需求,進行不間斷的數(shù)據(jù)交付。其次,教育數(shù)據(jù)的時效性挑戰(zhàn),決定了教育數(shù)據(jù)治理體系需要及時響應數(shù)據(jù)需求,以保證數(shù)據(jù)的實時性價值。最后,數(shù)據(jù)治理必須要建立起長治久安、持續(xù)運行的機制,敏捷治理強調(diào)面向交付的結(jié)果,而非復雜的過程,可以為數(shù)據(jù)應用的改進提供持續(xù)性的支持。
(三)教育數(shù)據(jù)安全治理
海量的教育數(shù)據(jù)關乎教育未來發(fā)展、師生個人隱私,教育數(shù)據(jù)的安全也決定了建構(gòu)于其上的教育智能應用的安全,因此,確保教育數(shù)據(jù)不受任何未經(jīng)授權(quán)的訪問、篡改、公開和破壞,確保其機密性、完整性和可用性是教育數(shù)據(jù)治理的題中應有之義。教育數(shù)據(jù)安全治理,從空間維度上來說,涵蓋從應用層到技術層,從管理制度到工具支撐,是一個自上而下建立的數(shù)據(jù)安全保障體系和技術防護體系,同時貫穿整個教育數(shù)據(jù)治理架構(gòu)的完整鏈條。從時間維度上來說,教育數(shù)據(jù)安全必須在規(guī)劃之初就納入教育數(shù)據(jù)治理的體系設計中,覆蓋數(shù)據(jù)的生成、獲取、傳輸、利用、消亡全生命周期,并貫穿整個教育數(shù)據(jù)治理過程。
四、智能時代教育數(shù)據(jù)治理策略
通過對教育數(shù)據(jù)面臨的挑戰(zhàn)進行剖析,梳理智能時代教育數(shù)據(jù)治理的價值取向,我們可以發(fā)現(xiàn)教育數(shù)據(jù)治理是一種復雜的治理結(jié)構(gòu),其中既包含管理制度等“軟”的方面,也包含技術支撐等“硬”的方面。智能時代的教育數(shù)據(jù)治理必須堅持管理體系和技術支持體系“軟硬結(jié)合、齊頭并進”的總體治理策略,才能達到精準、敏捷、安全的治理效果。
(一)管理體系
完善的教育數(shù)據(jù)管理體系是智能時代實現(xiàn)教育數(shù)據(jù)價值最大化的重要保障。從教育數(shù)據(jù)治理實現(xiàn)路徑的依賴關系來看,又可分為數(shù)據(jù)確權(quán)、治理機構(gòu)和數(shù)據(jù)標準等幾個重要方面。其內(nèi)在邏輯關系是,數(shù)據(jù)確權(quán)為后續(xù)進行數(shù)據(jù)管理奠定法律法規(guī)基礎,并提供一個權(quán)責明晰的邏輯前提;機構(gòu)設置為教育數(shù)據(jù)有效管理提供抓手,避免令出多門,確保教育數(shù)據(jù)的有效管理、安全使用;數(shù)據(jù)標準提供了教育數(shù)據(jù)共享的必要條件,為教育數(shù)據(jù)發(fā)揮價值提供基本保障。
1.數(shù)據(jù)確權(quán)
教育數(shù)據(jù)作為教育活動的產(chǎn)物,已經(jīng)成為教育活動的要素之一,是教育的戰(zhàn)略資源,教育數(shù)據(jù)權(quán)屬明晰是對其進行管理和利用的前提。雖然目前學術界對數(shù)據(jù)確權(quán)應適用的法律法規(guī)還存在一些爭議,但是對數(shù)據(jù)確權(quán)的重要性和緊迫性的認識是一致的?!稊?shù)據(jù)安全法》明確了國家建立數(shù)據(jù)分類分級保護制度,而《個人信息保護法》規(guī)定了敏感個人信息的處理規(guī)則,但是對數(shù)據(jù)確權(quán)問題都策略性留白,針對教育數(shù)據(jù)確權(quán)的具體措施和實踐方案仍有待探索。
對于教育數(shù)據(jù)來說,數(shù)據(jù)產(chǎn)生者是教師、學生、教育管理者等教育活動的主體,但是這些人群往往不持有數(shù)據(jù),數(shù)據(jù)一般情況下存儲在教育應用端,面臨著數(shù)據(jù)越權(quán)使用的風險。從有利于實踐探索的角度出發(fā),為簡便起見,可以采用產(chǎn)權(quán)保證、權(quán)責共擔的方式,先行確定教育數(shù)據(jù)產(chǎn)權(quán)的問題。按照“誰產(chǎn)生數(shù)據(jù),誰負責管理”的原則,由學?;蛘块T暫時代行教育數(shù)據(jù)的產(chǎn)權(quán)管理職能,由數(shù)據(jù)使用方對數(shù)據(jù)的合規(guī)使用負責,并為以后通過法律法規(guī)形式對此問題加以解決探索路徑。
2.機構(gòu)設置
“徒法不足以自行”,良好的教育數(shù)據(jù)治理制度必須依賴有力的機構(gòu)執(zhí)行。當前,教育數(shù)據(jù)治理往往依托學校的信息管理部門進行,教育數(shù)據(jù)散見于各個數(shù)據(jù)孤島內(nèi),需要一個更具有全局統(tǒng)領性的機構(gòu)統(tǒng)一進行治理,其治理方略可以歸納為以下幾個方面:
首先,針對數(shù)據(jù)源的廣泛性和復雜性,教育數(shù)據(jù)治理機構(gòu)要做好數(shù)據(jù)源治理。按照“一數(shù)一源、多元校核”的原則,在數(shù)據(jù)源分類的基礎上明確權(quán)威數(shù)據(jù)源,確保教育數(shù)據(jù)源的一致性和無偏性。在此基礎上,還需要在合法正當原則、最小必要性原則和知情同意原則下,規(guī)范教育數(shù)據(jù)采集活動,確保數(shù)據(jù)的精準性。
其次,針對數(shù)據(jù)的不同應用場景,規(guī)范數(shù)據(jù)使用流程,確保教育數(shù)據(jù)安全應用。按照數(shù)據(jù)管理規(guī)范要求,應根據(jù)教育數(shù)據(jù)的重要性和利用范圍,對教育數(shù)據(jù)進行分級分類管理。在教育數(shù)據(jù)全生命周期中,必須要明確不同級別數(shù)據(jù)可以應用的場景,各教育數(shù)據(jù)集支持的產(chǎn)品和用戶,以及使用不同等級、不同類型數(shù)據(jù)的前置審核條件等對應關系,教育數(shù)據(jù)治理機構(gòu)據(jù)此進行教育數(shù)據(jù)的合規(guī)管理。
最后,做好教育數(shù)據(jù)的質(zhì)量控制。一般認為,教育數(shù)據(jù)的質(zhì)量由教育數(shù)據(jù)的標準和技術支撐體系決定,但是從實踐過程來看,合理且強力的制度執(zhí)行保障才是教育數(shù)據(jù)質(zhì)量的關鍵。教育數(shù)據(jù)治理機構(gòu)的執(zhí)行保障是數(shù)據(jù)治理體系有效運轉(zhuǎn)的動力源,能夠確保教育數(shù)據(jù)采集存儲符合標準、使用過程符合技術指標要求,為真正實現(xiàn)數(shù)據(jù)完整性、可用性、準確性、時效性提供有效支撐。
3.數(shù)據(jù)標準
數(shù)據(jù)標準是保障數(shù)據(jù)使用和交換過程一致性和準確性的規(guī)范性約束。制定規(guī)范和完備的數(shù)據(jù)標準體系并加以落地執(zhí)行,是推進教育數(shù)據(jù)治理有效性和持續(xù)性的核心工作。
首先,要加強教育數(shù)據(jù)標準體系設計。教育數(shù)據(jù)標準的制定應該是一個從上到下、由粗及細、漸進實施的過程。國家、省市、各級各類學校分別制定本級標準,下級標準與上級標準做好銜接,共同組成教育數(shù)據(jù)標準體系。
其次,應重點完善教育元數(shù)據(jù)標準。元數(shù)據(jù)是關于數(shù)據(jù)的組織、數(shù)據(jù)域及其關系的描述,是定義數(shù)據(jù)的數(shù)據(jù)。定義合理、描述有序的元數(shù)據(jù)對提升數(shù)據(jù)檢索、分析和交換的便利性具有重要意義。
(二)技術體系
教育數(shù)據(jù)治理技術體系是管理體系發(fā)揮作用的物質(zhì)基礎和活躍變動的環(huán)境因素。由于數(shù)據(jù)處理和應用技術不斷進步,教育數(shù)據(jù)治理的技術體系也應是一個動態(tài)調(diào)整、漸進明細的構(gòu)型。從教育數(shù)據(jù)全生命周期的角度來看,教育數(shù)據(jù)治理的技術體系應包含以下三個方面的內(nèi)容:
1.敏捷的教育數(shù)據(jù)部署模型
敏捷的教育數(shù)據(jù)部署模型是為了解決教育數(shù)據(jù)生命周期內(nèi)精準有效使用并平衡數(shù)據(jù)使用成本的策略。其核心意義在于,在實現(xiàn)數(shù)據(jù)部署管理標準化、規(guī)范化的同時,通過應用接口的方式,滿足數(shù)據(jù)精細化、敏捷化和個性化的應用需要。目前此類模型的代表技術是基于數(shù)據(jù)即服務(DaaS)的數(shù)據(jù)中臺。
數(shù)據(jù)中臺是提供數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)處理與數(shù)據(jù)服務的全鏈路一體化,面向業(yè)務應用的數(shù)據(jù)智能平臺,通過構(gòu)建全域數(shù)據(jù)共享,能夠有效實現(xiàn)教育數(shù)據(jù)的快速流轉(zhuǎn)與價值挖掘。[12]DaaS是一種數(shù)據(jù)部署和使用模型,它參考了云計算“一切皆服務”的理念,通過應用接口API實現(xiàn)服務數(shù)據(jù)的安全調(diào)用,以提供各種與數(shù)據(jù)相關的服務,例如存儲、處理和分析。[13]基于DaaS的數(shù)據(jù)中臺,融合了面向數(shù)據(jù)服務的理念,同時實現(xiàn)了教育數(shù)據(jù)相關的任何服務(如數(shù)據(jù)聚合、數(shù)據(jù)清洗、數(shù)據(jù)抽取等)都能由中臺提供,然后再將數(shù)據(jù)按照管理基準提供給不同的應用端系統(tǒng)和用戶。應用端基于數(shù)據(jù)中臺API精細而敏捷地獲得所有所需數(shù)據(jù),無需再考慮這些數(shù)據(jù)來自于哪些數(shù)據(jù)源。
2.可信的教育數(shù)據(jù)日志管理方案
數(shù)據(jù)日志是覆蓋數(shù)據(jù)全生命周期的過程記錄。數(shù)據(jù)日志可以跟蹤數(shù)據(jù)使用狀態(tài),并為數(shù)據(jù)管理提供依據(jù)??尚诺慕逃龜?shù)據(jù)日志管理方案能夠記錄教育數(shù)據(jù)在采集、傳輸、存儲、處理、交換、銷毀各階段活動情況的同時,通過日志的不可篡改性為數(shù)據(jù)的安全使用提供支撐。區(qū)塊鏈技術旨在不可信的開放網(wǎng)絡中,維護一個安全可信、不可篡改的分布式數(shù)據(jù)庫,是目前較為理想的教育數(shù)據(jù)日志管理技術。
區(qū)塊鏈是將數(shù)據(jù)按照區(qū)塊生成時序鏈式存儲的數(shù)據(jù)結(jié)構(gòu),采用共識機制算法實現(xiàn)各個節(jié)點數(shù)據(jù)的一致性和不可篡改性,從而保證了數(shù)據(jù)的完整性和可驗證性。以往有研究認為,教育數(shù)據(jù)可以直接上鏈進行存儲和共享。事實上,在區(qū)塊鏈系統(tǒng)的實際使用過程中,為了保證區(qū)塊鏈上記錄數(shù)據(jù)的可溯源、可驗證等特性,所有數(shù)據(jù)都必須公開給區(qū)塊鏈網(wǎng)絡中的所有節(jié)點,這一特性在保障安全、可驗證的同時,也會導致惡意攻擊者可以直接獲取區(qū)塊鏈賬本中記錄的數(shù)據(jù)[14],破壞了數(shù)據(jù)的安全性。
利用區(qū)塊鏈對教育數(shù)據(jù)日志進行管理則不同,由于教育數(shù)據(jù)日志是可以公開的數(shù)據(jù),如果教育數(shù)據(jù)的各種活動行為都能如實上鏈,一方面可以保證教育數(shù)據(jù)日志的完整性,另一方面數(shù)據(jù)管理方也可以準確獲知任何教育數(shù)據(jù)被應用調(diào)用情況,這將大大增強數(shù)據(jù)應用活動的可追溯性。
3.可靠的教育數(shù)據(jù)共享機制
可靠的教育數(shù)據(jù)共享機制旨在確保教育數(shù)據(jù)隱私不泄露的前提下,解決數(shù)據(jù)流通、數(shù)據(jù)應用等數(shù)據(jù)服務問題??煽康臄?shù)據(jù)共享機制是解決數(shù)據(jù)安全與數(shù)據(jù)利用成本間矛盾的一種方式,可以在徹底杜絕數(shù)據(jù)越權(quán)訪問的基礎上實現(xiàn)數(shù)據(jù)共享,目前此類機制的代表技術是隱私計算。
隱私計算技術是面向隱私信息全生命周期保護的計算理論和方法,是隱私信息的所有權(quán)、管理權(quán)和使用權(quán)分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統(tǒng)。[15]簡而言之,通過數(shù)據(jù)與算法的解耦,隱私計算可以依托“數(shù)據(jù)可用不可見”“本地數(shù)據(jù)異地計算”等理念,實現(xiàn)在不共享教育數(shù)據(jù)的前提下,發(fā)揮教育數(shù)據(jù)的價值。
五、結(jié)語
大數(shù)據(jù)和智能技術的發(fā)展已經(jīng)開始深刻變革人類社會,教育領域人工智能的應用方興未艾。教育數(shù)據(jù)作為教育智能應用發(fā)展的基石,必將發(fā)揮越來越重要的作用。教育數(shù)據(jù)治理是一個長期持續(xù)的過程,需要建立長效機制保證治理工作的開展,無論是管理體系或技術體系的支撐,最終都離不開人的因素。因此,注重數(shù)據(jù)素養(yǎng),培養(yǎng)高數(shù)據(jù)素養(yǎng)的人才,也是教育數(shù)據(jù)資產(chǎn)治理能夠發(fā)揮價值創(chuàng)造功能的重點。對于未來在教育數(shù)據(jù)治理方面面臨的理論和實踐問題,必須要未雨綢繆,才能更好地推動教育信息化和智能教育行穩(wěn)致遠。
參考文獻:
[1]楊開城.教育何以是大數(shù)據(jù)的[J].電化教育研究,2019,40(2):5-11.
[2]余勝泉,徐劉杰.大數(shù)據(jù)時代的教育計算實驗研究[J].電化教育研究,2019,40(1):17-24.
[3]崔保師,鄧友超,萬作芳,等.扭轉(zhuǎn)教育功利化傾向[J].教育研究,2020,41(8):4-17.
[4]DAMA International. DAMA數(shù)據(jù)管理知識體系指南[M].馬歡,劉晨等譯.北京:清華大學出版社,2012:13-14.
[5]周煒.大數(shù)據(jù)視域下高校數(shù)據(jù)治理優(yōu)化路徑研究[J].教育發(fā)展研究,2021,41(9):78-84.
[6]李建中,王宏志,高宏.大數(shù)據(jù)可用性的研究進展[J].軟件學報,2016,27(7):1605-1625.
[7]劉桐,沈書生.從表征到?jīng)Q策:教育大數(shù)據(jù)的價值透視[J].電化教育研究,2018,39(6):54-60.
[8]金燦.探索合理有效的數(shù)據(jù)產(chǎn)權(quán)制度[N].經(jīng)濟參考報,2021-03-30(8).
[9]謝娟.教育數(shù)據(jù)治理的倫理框架:價值、向度與路徑[J].現(xiàn)代遠程教育研究,2020,32(5):15-24.
[10]田賢鵬.隱私保護與開放共享:人工智能時代的教育數(shù)據(jù)治理變革[J].電化教育研究,2020,41(5):33-38.
[11]梁正.人工智能時代亟需構(gòu)建合理高效的數(shù)據(jù)治理體系[J].國家治理,2020(31):40-42.
[12]李愛霞,舒杭,顧小清.打造教育人工智能大腦:教育數(shù)據(jù)中臺技術實現(xiàn)路徑[J].開放教育研究,2021,27(3):96-103.
[13]周志剛,張宏莉,余翔湛,等.面向DaaS應用的數(shù)據(jù)集成隱私保護機制研究[J].通信學報,2016,37(4):96-106.
[14]張奧,白曉穎.區(qū)塊鏈隱私保護研究與實踐綜述[J].軟件學報,2020,31(5):1406-1434.
[15]李鳳華,李暉,賈焰,等.隱私計算研究范疇及發(fā)展趨勢[J].通信學報,2016,37(4):1-11.
作者簡介:
張臻,中國教育科學研究院教育信息與數(shù)據(jù)統(tǒng)計研究所助理研究員、博士,郵箱:zhangzh@nies.edu.cn。
The Challenge and The Path of Educational Data Governance Evolution
in The Intelligent Era
Zhen ZHANG
(Institute of Educational Information and Statistics, Chinese National Institute of Education Sciences, Beijing 100088)
Abstract: As the intelligent era is coming, data has become an important strategic resource, wherein the data-driven has become a typical feature of modern education. For that, the governance of educational data undergoes the revolution. By analyzing the complicated challenges in educational data governance, this article summarizes the management goals, which should be achieved in a manner of precise, agile, and secure in educational data governance during the intelligent era. In order to achieve these goals, the educational data governance system needs to work from two aspects, that is, management and technology. By discussing the conception of education data governance strategy, this can propose some feasible management mechanisms such as defining data rights, founding governance institutions, and developing data standards, while can offer several technical assurance paths such as deploying agile education data, building credible education data log management, and establishing reliable education data sharing mechanism.
Keywords: Educational data governance; Artificial intelligence; Educational big data
編輯:李曉萍 ? 校對:王天鵬