郭勝男 吳永和 張 治
(1.華東師范大學 教育學部教育信息技術(shù)學系,上海 200062;2.上海市寶山區(qū)教育局,上海 201999)
人工智能技術(shù)發(fā)揮作用的三要素為數(shù)據(jù)、算法和算力。正如人工智能專家周志華(2020)所言,“今天的人工智能熱潮是由于機器學習,尤其是深度學習技術(shù)在大數(shù)據(jù)、大算力的支持下發(fā)揮出了巨大威力”。這些均需建立在數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全及算法合乎倫理的基礎(chǔ)上,因此,如何進行有效的教育數(shù)據(jù)治理成為教育數(shù)字化轉(zhuǎn)型的必經(jīng)之路。人工智能教育大腦系統(tǒng)整合了教育數(shù)據(jù)、智能算法和算力資源,以保證最大限度地挖掘大數(shù)據(jù)的潛在價值,為教育數(shù)據(jù)精準治理提供新路向。
“智能大腦”最早由雷·庫茲韋爾(Ray Kurzweil)提出,指借助海量數(shù)據(jù)和算法,模擬人腦思考和判斷(何懷宏,2018)。之后在城市治理領(lǐng)域,有研究者提出城市大腦概念,指在互聯(lián)網(wǎng)大腦架構(gòu)的基礎(chǔ)上,以云神經(jīng)網(wǎng)絡(luò)和云反射弧為建設(shè)重點,為解決城市治理難題提供全新工具(胡堅波,2021)。在教育領(lǐng)域,顧小清等(2021)以“人工智能教育大腦”為隱喻,將智能技術(shù)與教育融合,致力于解決高等教育數(shù)據(jù)治理和教學創(chuàng)新問題。張治等(2022)將人工智能本質(zhì)和人腦特質(zhì)結(jié)合,構(gòu)建教育大腦生態(tài)架構(gòu),強調(diào)基于人工智能的教育大腦是實現(xiàn)教育數(shù)字化轉(zhuǎn)型的關(guān)鍵基礎(chǔ)設(shè)施。由此可見,人工智能等新一代信息技術(shù)支撐的“教育大腦”具備規(guī)范化整合數(shù)據(jù)資源和算法模型、提高數(shù)據(jù)質(zhì)量和保障隱私安全的強大能力。
數(shù)據(jù)作為新的生產(chǎn)要素,在滲入教育治理結(jié)構(gòu)時,必然會引發(fā)一系列新的問題,如數(shù)據(jù)質(zhì)量參差不齊、隱私泄露、算法失衡?,F(xiàn)階段教育領(lǐng)域尚缺乏有效的教育數(shù)據(jù)治理方案。為了提高教育數(shù)據(jù)質(zhì)量,保障算法安全,打破數(shù)據(jù)孤島之間的壁壘,充分挖掘教育大數(shù)據(jù)的潛在價值,教育治理亟需更寬廣的視野和更強大、靈敏的治理工具。本研究遵循“問題解構(gòu)→方法模型→實踐路徑”的邏輯思路,在解構(gòu)教育數(shù)據(jù)治理的內(nèi)涵、困境及成因的基礎(chǔ)上,構(gòu)建人工智能教育大腦模型,提出教育大腦賦能教育數(shù)據(jù)治理的實踐路徑。
數(shù)據(jù)治理(data governance)是數(shù)字化技術(shù)和治理理論融合形成的新概念,學界尚未給出統(tǒng)一的定義。國際數(shù)據(jù)管理協(xié)會(DAMA International,2009)認為,數(shù)據(jù)治理指在管理和使用層面對數(shù)據(jù)進行規(guī)劃、監(jiān)督和控制。國際著名數(shù)據(jù)治理專家桑尼爾·索瑞斯(2014)認為數(shù)據(jù)治理是制定與大數(shù)據(jù)相關(guān)的數(shù)據(jù)優(yōu)化、隱私保護與數(shù)據(jù)變現(xiàn)等政策。國內(nèi)學者梁芷銘(2015)認為數(shù)據(jù)治理是為了應(yīng)對大數(shù)據(jù)帶來的種種不安、困難與威脅,運用技術(shù)工具對大數(shù)據(jù)進行管理、整合、分析并挖掘其價值的行為。有學者將數(shù)據(jù)治理等同于數(shù)據(jù)管理,認為二者均指采取必要的步驟、度量和策略管理數(shù)據(jù)的整個生命周期,涉及數(shù)據(jù)識別、收集、準備、組織、分類、處理、分析、存儲、發(fā)布、管理和重用等(Gajbe et al., 2021)。事實上,數(shù)據(jù)治理蘊含明確相關(guān)角色、工作職責和工作流程等含義,是過程性概念,強調(diào)做出哪些決策以及由誰做出決策(Abraham et al.,2019)。數(shù)據(jù)管理是目標性概念,強調(diào)決策是數(shù)據(jù)執(zhí)行的一部分。從本質(zhì)上講,數(shù)據(jù)治理是對數(shù)據(jù)管理進程行使權(quán)利和控制,指導(dǎo)組織內(nèi)和跨組織的數(shù)據(jù)和算法整個生命周期的正常運行,強調(diào)數(shù)據(jù)資產(chǎn)的價值和數(shù)據(jù)安全管控(Carretero et al., 2016)。
隨著教育信息化的發(fā)展,教育領(lǐng)域積聚了海量數(shù)據(jù),呈現(xiàn)“大數(shù)據(jù)”形態(tài),“教育數(shù)據(jù)治理”概念應(yīng)運而生。教育數(shù)據(jù)治理作為嶄新的研究領(lǐng)域,其概念一直是學界討論的議題。教育數(shù)據(jù)治理涵蓋教育的數(shù)據(jù)治理和數(shù)據(jù)驅(qū)動的教育治理兩層內(nèi)涵,數(shù)據(jù)治理為教育治理提供技術(shù)和程序,教育治理為數(shù)據(jù)治理提供目標(劉金松,2018)。兩者交叉融合、密不可分,共同服務(wù)于教育發(fā)展需求,提升教育治理水平和治理能力。
研究發(fā)現(xiàn),現(xiàn)有教育治理體系與大數(shù)據(jù)算法系統(tǒng)的耦合度不高(Janssen et al., 2020),教育數(shù)據(jù)治理在數(shù)據(jù)質(zhì)量、安全風險、算法倫理等方面面臨難題,未能充分發(fā)揮大數(shù)據(jù)的價值,嚴重阻礙了教育數(shù)字化轉(zhuǎn)型的現(xiàn)代化進程。
1.教育數(shù)據(jù)質(zhì)量不高,限制了數(shù)據(jù)價值釋放
教育大數(shù)據(jù)在科學決策、支持多樣化教學場景、創(chuàng)新教學服務(wù)和提升教學效率等方面蘊含巨大的教育價值,正如徐宗本院士(2017)所言,“大數(shù)據(jù)可以帶來超凡應(yīng)用價值”。在教育領(lǐng)域,只有切實將數(shù)據(jù)應(yīng)用于解決教育發(fā)展問題,才能真正彰顯數(shù)據(jù)的價值。但實際境況與理論設(shè)想“相距甚遠”,“雖然大數(shù)據(jù)在教育領(lǐng)域的熱度日趨增加,真正利用大數(shù)據(jù)解決教育問題的成功案例卻很少”(祝智庭,2017)。究其原因,數(shù)據(jù)質(zhì)量是影響數(shù)據(jù)價值發(fā)揮的重要因素。
質(zhì)量是教育數(shù)據(jù)的靈魂,是大數(shù)據(jù)發(fā)揮價值的基礎(chǔ)和保障,涉及數(shù)據(jù)規(guī)范性、準確性、完備性和一致性等。在智慧教育時代,人工智能、云計算、虛擬現(xiàn)實和物聯(lián)網(wǎng)等智能技術(shù)擴展了教學管理和實踐的時空邊界,政府部門、社會組織及各類院校等產(chǎn)生的海量數(shù)據(jù)在數(shù)據(jù)規(guī)模、結(jié)構(gòu)類型、數(shù)據(jù)收集和存儲工具、時效價值等方面存在很大差異,教育數(shù)據(jù)的規(guī)范性、準確性、完備性、一致性等數(shù)據(jù)質(zhì)量問題疊出,導(dǎo)致難以充分發(fā)揮數(shù)據(jù)的價值。這可歸因為以下幾點:其一,各教育主體間的“煙囪效應(yīng)”。人工智能技術(shù)賦能多元化數(shù)據(jù)生產(chǎn)主體和治理主體,但各主體間因業(yè)務(wù)需求不同往往“各自為政”,未能形成統(tǒng)一的數(shù)據(jù)規(guī)范標準。在這種“煙囪式”治理模式下,數(shù)據(jù)冗余、數(shù)據(jù)片面、死數(shù)據(jù)等問題頻出,導(dǎo)致教育決策科學性不高。其二,學習分析技術(shù)與數(shù)據(jù)之間的“弱耦合性”。區(qū)別于一般大數(shù)據(jù),教育大數(shù)據(jù)是在教育場景中產(chǎn)生的數(shù)據(jù),結(jié)構(gòu)多樣(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化),模態(tài)豐富(行為、生理、心理),格式繁雜(視頻、音頻、文本、平臺日志、生物傳感)(吳永和等,2021),現(xiàn)有學習分析技術(shù)難以捕獲數(shù)據(jù)之間的關(guān)聯(lián)性和一致性。此外,高效的學習分析工具推廣不易,如果沒有利益相關(guān)者的批準和監(jiān)管,高效的學習分析技術(shù)不會被教育系統(tǒng)采納??梢?,學習分析技術(shù)與數(shù)據(jù)之間的“弱耦合”極大地限制了數(shù)據(jù)價值釋放。其三,從技術(shù)角度看,機器學習算法偏好“好數(shù)據(jù)”。教育領(lǐng)域可視為數(shù)據(jù)驅(qū)動下的智能算法的運行場域(趙磊磊等,2021)。流行的機器學習算法,如K-最近鄰(KNN)、樸素貝葉斯(NB)、支持向量機(SVM)和深度學習等對特征空間的變化非常敏感,高質(zhì)量的訓(xùn)練數(shù)據(jù)集才能形成高性能的特征向量,進而將機器學習算法訓(xùn)練成“好”的模型(Singh et al., 2022)。然而,教育實踐中通常存在降低數(shù)據(jù)質(zhì)量的因素,如噪聲、缺失值、數(shù)據(jù)不一致或異常值等,嚴重影響機器學習算法的學習性能,造成模型訓(xùn)練數(shù)據(jù)的欠擬合或過擬合,進而導(dǎo)致決策失誤。
2.開放共享程度擴大,加劇數(shù)據(jù)安全風險
2017年,國務(wù)院印發(fā)《國家教育事業(yè)發(fā)展“十三五”規(guī)劃》指出,要加快推進教育大數(shù)據(jù)建設(shè)與開放共享,形成教育數(shù)據(jù)資源開放共享機制(教育部,2017)。人工智能時代,教育系統(tǒng)內(nèi)部自組織、自生產(chǎn)形成的“熵減”現(xiàn)象和自我加強的“馬太效應(yīng)”均蘊含著教育數(shù)據(jù)開放共享的迫切訴求。開放共享對數(shù)據(jù)資源的快速流轉(zhuǎn)與價值挖掘至關(guān)重要(陳雅云等,2021)。擴大教育數(shù)據(jù)的開放共享空間有利于促進教育數(shù)據(jù)的整合、流轉(zhuǎn),打破各教育子系統(tǒng)之間的數(shù)據(jù)壁壘,提升數(shù)據(jù)的應(yīng)用價值,形成相互支持的產(chǎn)業(yè)鏈。
移動互聯(lián)網(wǎng)、區(qū)塊鏈、邊緣計算、人工智能等技術(shù)深度發(fā)展,各教育系統(tǒng)、平臺和信息門戶等的加強,為教育數(shù)據(jù)的開放和共享提供了強有力的技術(shù)支撐,開放數(shù)據(jù)獲取、傳輸、存儲、處理和應(yīng)用的力度不斷增強。在此過程中,數(shù)據(jù)泄露和數(shù)據(jù)破壞等數(shù)據(jù)安全風險問題不可忽視。一方面,教師、學生等數(shù)據(jù)生產(chǎn)者的隱私泄露風險加大。從宏觀上看,數(shù)據(jù)的開放共享具有高度復(fù)雜性和系統(tǒng)性,涉及各利益相關(guān)者的隱私。隨著數(shù)據(jù)開放共享力度的提升,學校、教師、學生等數(shù)據(jù)提供者的隱私空間被嚴重壓縮(田賢鵬,2020)。從技術(shù)視角看,學習分析系統(tǒng)的設(shè)計未能完全保證師生的隱私安全。隨著數(shù)據(jù)資源更加多模態(tài),學習分析工具更加移動,原本無法追蹤、統(tǒng)計和檢索的蹤跡變得有跡可循,隱私侵犯現(xiàn)象變得普遍。另一方面,數(shù)據(jù)在共享過程中被破壞的風險增大。其一,開放共享為不法之徒竊取、篡改、濫用數(shù)據(jù)提供了可能,尤其是一些教育機構(gòu)為了利益竊取開放共享的數(shù)據(jù)以換取商業(yè)報酬。其二,數(shù)據(jù)在傳輸和交換過程中會丟失。教育系統(tǒng)各組織間數(shù)字媒介和數(shù)據(jù)維度等不一致,使得數(shù)據(jù)在交換過程中易丟失或損壞,造成數(shù)據(jù)缺失或不完整??偠灾?,數(shù)據(jù)安全治理是教育數(shù)據(jù)開放和共享過程中不可或缺的重要環(huán)節(jié),也是教育數(shù)據(jù)治理亟需解決的核心問題。
3.人工智能技術(shù)帶來算法失衡風險
人工智能時代是一個讓數(shù)據(jù)“開口說話”的時代,數(shù)據(jù)和算法是人工智能技術(shù)發(fā)揮作用的重要基石。“如果說大數(shù)據(jù)是信息時代的石油,那么算法就是從中提煉衍生產(chǎn)品的煉油廠”(肖鳳翔等,2020)。大數(shù)據(jù)為算法提供底層支撐,算法從大數(shù)據(jù)中提煉知識和信息,可見,算法優(yōu)劣嚴重影響數(shù)據(jù)治理的效能。然而,隨著智慧學習、智慧課堂等人工智能新應(yīng)用的出現(xiàn),算法在教育實踐中不可避免地遇到諸多困境,如算法失靈、算法偏好、算法濫用,給教育實踐帶來了不可預(yù)估的風險,嚴重限制了教育數(shù)據(jù)治理效能的發(fā)揮。
首先,機器學習算法在為數(shù)據(jù)治理提供強大算力的同時,其應(yīng)用存在算法失靈的風險,具體表現(xiàn)為算法運行失序,背離教育德性倫理或者不利于教育正向發(fā)展。教育領(lǐng)域算法大多移植于其他領(lǐng)域,這些算法的數(shù)理邏輯并不完全適用于教育系統(tǒng)的技術(shù)架構(gòu)和教育邏輯,無法完全滿足教育的實際需求,有的會背離以“人的發(fā)展”為核心的目標。其次,算法偏好風險。“再好的算法也不能完美反映客觀實在,其中必然存在諸多偏差與偏見”(譚維智,2019)。教育領(lǐng)域的算法應(yīng)用是將教育現(xiàn)象抽象成數(shù)據(jù)進行表征,其中的程序設(shè)計和計算邏輯是人為設(shè)計的,不可避免存在偏見,從而導(dǎo)致算法結(jié)果出現(xiàn)偏差。機器學習算法以教育數(shù)據(jù)為支撐進行模擬和診斷,診斷的準確性往往與數(shù)據(jù)質(zhì)量相關(guān),偏好“好數(shù)據(jù)”,造成“繭房效應(yīng)”。最后,算法的誤用和濫用風險。從教育實踐者的視角看,算法分析過程是個“黑匣子”,“知其然而不知其所以然”,這無疑增加了算法使用的盲目性,無法針對性地服務(wù)于教育教學。算法的濫用還模糊了公共領(lǐng)域和個人隱私邊界,可能侵犯師生的正當權(quán)益。
數(shù)據(jù)質(zhì)量、安全風險和算法倫理是教育數(shù)據(jù)治理亟需解決的難題。人工智能教育大腦本質(zhì)上是類腦復(fù)雜教育系統(tǒng),面對系統(tǒng)性和功能性如此復(fù)雜的教育大腦,本研究從結(jié)構(gòu)模型、輕量級信息模型和核心模塊三方面剖析人工智能教育大腦的整體結(jié)構(gòu)、信息流轉(zhuǎn)調(diào)度及核心功能,為教育數(shù)據(jù)治理實踐提供支架。
任何時期的教育變革都離不開物質(zhì)技術(shù)基礎(chǔ)的支持,新一代信息技術(shù)驅(qū)動的教育新基建是支持教育大腦運轉(zhuǎn)的“基石”和“底座”(見圖1)。教育大腦的底層支撐技術(shù)以人工智能為核心,通過與物聯(lián)網(wǎng)、5G、云計算、邊緣計算、大數(shù)據(jù)、數(shù)字孿生等新技術(shù)的疊加,為教育提供了一套全新的基礎(chǔ)設(shè)施——教育新基建。從功能性結(jié)構(gòu)來看,教育新基建主要包括信息基礎(chǔ)設(shè)施、融合基礎(chǔ)設(shè)施和創(chuàng)新基礎(chǔ)設(shè)施(祝智庭等,2022)。其中,信息基礎(chǔ)設(shè)施可細化為網(wǎng)絡(luò)通訊基礎(chǔ)設(shè)施、新技術(shù)基礎(chǔ)設(shè)施(如區(qū)塊鏈、數(shù)字孿生)和計算基礎(chǔ)設(shè)施。融合基礎(chǔ)設(shè)施指傳統(tǒng)教育基礎(chǔ)設(shè)施在人工智能等技術(shù)加持下形成的集時空、虛實環(huán)境于一體的融合型基礎(chǔ)設(shè)施。創(chuàng)新基礎(chǔ)設(shè)施指支持科技創(chuàng)新的基礎(chǔ)設(shè)施,可不斷為教育數(shù)字化轉(zhuǎn)型提供新型工具。
圖1 教育大腦結(jié)構(gòu)模型
正如城市神經(jīng)元網(wǎng)絡(luò)和云反射弧是城市大腦建設(shè)的重點內(nèi)容,教育神經(jīng)元網(wǎng)絡(luò)和教育云反射弧是教育大腦結(jié)構(gòu)的核心內(nèi)容。神經(jīng)元是教育神經(jīng)網(wǎng)絡(luò)的基本單元,每個神經(jīng)元代表具備一定數(shù)據(jù)收集、存儲、分析和決策功能的教育子系統(tǒng)。它從層級上可分為校級神經(jīng)元、區(qū)/縣級神經(jīng)元和市級神經(jīng)元,每個神經(jīng)元按照一定的功能標準和安全標準相互聯(lián)通、資源共享,形成教育神經(jīng)元網(wǎng)絡(luò),為教育云反射弧提供統(tǒng)一的運轉(zhuǎn)基礎(chǔ)。每條通過技術(shù)聯(lián)通的教育神經(jīng)元之間的鏈條通路便是一條教育云反射弧,對應(yīng)不同教育需求,包括個體級需求、學科級需求和管理級需求。
教育大腦本質(zhì)上是一個類腦復(fù)雜智能教育系統(tǒng),將大量的教育系統(tǒng)、子系統(tǒng)和平臺等神經(jīng)元鏈接起來,涉及眾多的復(fù)雜技術(shù)和因素。為了明晰教育大腦內(nèi)部的數(shù)據(jù)流轉(zhuǎn)和信息安全調(diào)度,本研究分別針對學生成長管理、面向特定學科的自適應(yīng)學習管理和線上線下融合智慧教育模式的需求,構(gòu)建輕量級教育大腦信息模型(見圖2),以厘清數(shù)據(jù)和算法有效治理的交互機制。
圖2 輕量級教育大腦信息模型
教育大腦作為互聯(lián)網(wǎng)大腦的進化產(chǎn)物,其構(gòu)建初衷是解決教育領(lǐng)域的重難點問題,響應(yīng)教育需求。輕量級教育大腦信息模型包括教育神經(jīng)元網(wǎng)絡(luò)、數(shù)據(jù)湖、數(shù)據(jù)倉庫、智能處理器和智能服務(wù)等模塊,遵循“問題驅(qū)動→數(shù)據(jù)輸入→數(shù)據(jù)共享→數(shù)據(jù)分析→數(shù)據(jù)服務(wù)→需求響應(yīng)”的邏輯,通過模擬生物的反射弧結(jié)構(gòu),深度挖掘教育數(shù)據(jù)的潛藏價值,對教育問題或需求進行及時且智能化的反饋。教育神經(jīng)元網(wǎng)絡(luò)由無數(shù)個相互聯(lián)結(jié)的教育神經(jīng)元構(gòu)成,每個教育神經(jīng)元信息由教育內(nèi)容、數(shù)據(jù)來源和數(shù)據(jù)集成規(guī)則等構(gòu)成。教育內(nèi)容可借助普適設(shè)備(如平板電腦等)、多模態(tài)傳感器、平臺日志、問卷和訪談等方式收集視頻、語音、文本、生物傳感等多模態(tài)數(shù)據(jù)(吳永和等,2021)。每個教育問題對應(yīng)的云反射弧均需要匯聚多個教育神經(jīng)元的數(shù)據(jù),具體操作流程為:首先,將教育神經(jīng)元中產(chǎn)生的海量異構(gòu)數(shù)據(jù)像水一樣匯聚在數(shù)據(jù)湖中,數(shù)據(jù)湖以原始格式存儲數(shù)據(jù),無需對數(shù)據(jù)進行結(jié)構(gòu)化處理,保留數(shù)據(jù)之間自然形成的“血緣關(guān)系”,包括結(jié)構(gòu)化數(shù)據(jù)、半/非結(jié)構(gòu)化數(shù)據(jù)和二進制數(shù)據(jù)(如視/音頻);其次,教育神經(jīng)元之間的數(shù)據(jù)共享和融通嚴格遵循數(shù)據(jù)質(zhì)量、數(shù)據(jù)倫理和數(shù)據(jù)安全等規(guī)范和標準,以保障數(shù)據(jù)在開放共享過程中的質(zhì)量和安全;再次,數(shù)據(jù)共享和融通將數(shù)據(jù)按一定的規(guī)范和標準格式化處理后存儲在數(shù)據(jù)倉庫中,作為智能分析容器的數(shù)據(jù)原材料;智能分析容器是將數(shù)據(jù)原材料轉(zhuǎn)為智能服務(wù)的“工廠”,由自底向上的三部分組成,分別是底層算法/模型庫、中層算法/模型匹配器和頂層服務(wù)組件;最后,提供智能決策、智能服務(wù)推送和數(shù)據(jù)可視化等智能化服務(wù),將反射響應(yīng)結(jié)果反饋給神經(jīng)元以完成云反射,同時響應(yīng)對應(yīng)的教育問題,實現(xiàn)教育的精準化治理。
人工智能的發(fā)展是不斷模擬、擴展人類智能的過程,反觀教育領(lǐng)域的現(xiàn)實境況,人工智能技術(shù)“有計算而無算計”“有智能而無智慧”“有感知而無認知”。人工智能教育大腦要實現(xiàn)“眼觀六路、耳聽八方、融合思考”的教育發(fā)展愿景(顧小清等,2021),離不開人類群體智慧和機器群體智能的深度協(xié)作,更離不開智能算法和高質(zhì)量數(shù)據(jù)的底層支撐。具體而言,教育大腦主要包括智能分析和數(shù)據(jù)融通兩大模塊(見圖3),它們可類比為教育大腦的“左右腦”,左腦追求理解與認知,右腦追求快速大量記憶和自動處理機能,左右腦相互協(xié)調(diào),提升教育大腦的“智商”和“數(shù)商”。
圖3 教育大腦的核心模塊
1.數(shù)據(jù)融通模塊
教育大腦的數(shù)據(jù)融通模塊是以數(shù)據(jù)中臺技術(shù)為架構(gòu)的數(shù)據(jù)匯聚中心,致力于實現(xiàn)教育數(shù)據(jù)的共享融通、規(guī)范統(tǒng)一和風險防范,主要功能包括:其一,基于區(qū)塊鏈、云計算和物聯(lián)網(wǎng)等技術(shù)構(gòu)建數(shù)據(jù)湖,在邏輯上聯(lián)通各神經(jīng)元以不同方式收集的多模態(tài)異構(gòu)數(shù)據(jù),既保證數(shù)據(jù)的“進化”和“血緣關(guān)系”可追蹤,又保障數(shù)據(jù)“物種”多樣性;其二,數(shù)據(jù)共享和流通需嚴格按照數(shù)據(jù)權(quán)限管理和風險防范制度,明確權(quán)責邊界,加強隱私保護,保障數(shù)據(jù)的安全流通;其三,嚴格遵循數(shù)據(jù)分類編碼標準、數(shù)據(jù)管理標準、數(shù)據(jù)質(zhì)量評估標準和數(shù)據(jù)倫理標準,對數(shù)據(jù)生命周期全流程進行規(guī)范和監(jiān)控,采用統(tǒng)一的標準化規(guī)則清洗、規(guī)范化、標簽化數(shù)據(jù),將滿足規(guī)則的數(shù)據(jù)存入數(shù)據(jù)倉庫中,為后續(xù)智能分析持續(xù)提供“燃料”。顯然,數(shù)據(jù)融通模塊通過清洗、篩選、關(guān)聯(lián)多模態(tài)異構(gòu)數(shù)據(jù),打通數(shù)據(jù)流通渠道,提升數(shù)據(jù)質(zhì)量,為教育數(shù)據(jù)的精細化治理奠定了基礎(chǔ)。
2.智能分析模塊
智能分析模塊是人工智能教育大腦的數(shù)據(jù)“加工廠”,它通過算法訓(xùn)練、情境匹配、決策服務(wù)等,充分發(fā)揮機器群體智能以挖掘教育數(shù)據(jù)的潛在價值。首先,智能分析模塊儲存了合理、科學、豐富的資源庫,包括算法庫、模型庫和教育情境庫。其中,人工智能模型是人工智能算法(移植的開源算法或教育領(lǐng)域的創(chuàng)新算法)根據(jù)教育情境產(chǎn)生的教育數(shù)據(jù)訓(xùn)練而得的。其次,智能時代的教育情境是多元變化的,只有在特定情境中選擇適切的人工智能算法/模型,才能提供精準的決策服務(wù)。因此,智能分析模塊提供了算法集選擇器、模型集選擇器和教育情境計算器,保證教育大腦能夠自主提供適切的計算和決策服務(wù),提升教育大腦的“智商”。再次,人工智能算法的監(jiān)管功能,通過設(shè)置算法的智能監(jiān)管組件監(jiān)督算法使用過程中的倫理問題,防止出現(xiàn)算法濫用、算法誤用和算法失靈等風險。最后,人工智能算法的創(chuàng)新功能,用于不斷迭代解決教育問題的人工智能算法,更新算法庫和模型庫,確保教育大腦的高效運轉(zhuǎn)。
教育數(shù)據(jù)治理是一個復(fù)雜且反復(fù)迭代的系統(tǒng)工程,目的是實現(xiàn)數(shù)據(jù)應(yīng)用價值和風險管控。本研究提出的人工智能教育大腦以新一代智能技術(shù)為基礎(chǔ),充分整合數(shù)據(jù)、算法和算力,打通教育各部門的業(yè)務(wù)壁壘,為數(shù)據(jù)資源共享與規(guī)約整合、數(shù)據(jù)安全和隱私保障、算法“善治”、決策智能化等提供治理支架。因此,基于新一代智能技術(shù),將智能治理的理念融入教育治理,在對數(shù)據(jù)和算法進行治理的同時,將“冰冷”的數(shù)據(jù)和“呆板”的算法轉(zhuǎn)化為數(shù)據(jù)質(zhì)量和風險防范的“利器”,是智能時代擺脫教育數(shù)據(jù)治理困境的實踐邏輯(見圖4)。
圖4 教育大腦賦能數(shù)據(jù)治理的實踐路徑
人工智能教育大腦為教育數(shù)據(jù)生命周期全流程提供了一系列質(zhì)量規(guī)范,如數(shù)據(jù)分類編碼、數(shù)據(jù)標準、數(shù)據(jù)質(zhì)量評估等,但我們?nèi)孕枰_展頂層設(shè)計和戰(zhàn)略規(guī)劃,建立權(quán)責明晰的數(shù)據(jù)管理組織架構(gòu),配合教育大腦形成完備的管理體系。其一,建立科學合理的數(shù)據(jù)管理組織架構(gòu)。進入智慧教育時代,教育數(shù)據(jù)管理模式已由“逐層上傳”的科層級模式逐步轉(zhuǎn)向“網(wǎng)格管理”的扁平化模式,各級教育部門需建立權(quán)責分明的數(shù)據(jù)管理中心,落實各級部門的權(quán)力和責任。這包括:一是確保數(shù)據(jù)生命周期的每一流程都“有人負責,有人監(jiān)督”,一旦發(fā)現(xiàn)數(shù)據(jù)質(zhì)量等問題能夠及時溯源;二是搭建各層級業(yè)務(wù)間的“溝通橋梁”,相互驗證數(shù)據(jù)的真實性和有效性,保障數(shù)據(jù)的質(zhì)量和安全流轉(zhuǎn)。其二,完善數(shù)據(jù)生命周期全流程規(guī)范化制度。數(shù)據(jù)質(zhì)量參差不齊歸根究底是缺乏規(guī)范化的數(shù)據(jù)標準和流程。這就有必要從政策和制度著手,加強數(shù)據(jù)全生命周期的制度建設(shè):1)以數(shù)據(jù)標準、質(zhì)量管控、數(shù)據(jù)共享權(quán)限等政策為依據(jù),進行整體性制度設(shè)計,制定通用的數(shù)據(jù)規(guī)范格式;2)全流程遵循“數(shù)據(jù)收集→數(shù)據(jù)存儲→數(shù)據(jù)處理→數(shù)據(jù)傳輸→數(shù)據(jù)交換→數(shù)據(jù)銷毀”的數(shù)據(jù)標準制度,各層級數(shù)據(jù)管理中心采用統(tǒng)一的規(guī)范進行數(shù)據(jù)流通,保障數(shù)據(jù)的規(guī)范性、準確性、完備性和一致性,提升數(shù)據(jù)的應(yīng)用價值。
人工智能時代,教育數(shù)據(jù)安全問題日益突出,如何利用技術(shù)手段防范安全風險成為教育數(shù)據(jù)治理的當務(wù)之急。人工智能教育大腦通過教育神經(jīng)元網(wǎng)絡(luò)響應(yīng)教育需求的過程中,為規(guī)避數(shù)據(jù)治理的安全風險需設(shè)置防范措施,如共享數(shù)據(jù)權(quán)限管理、數(shù)據(jù)風險防范、數(shù)據(jù)安全加固和隱私安全保障等,這些措施以智能技術(shù)為依托,遵循“風險識別→風險預(yù)警→風險管控”的系統(tǒng)流程,將風險防范的“先手”與風險消解的“后招”有效結(jié)合。第一,建立數(shù)據(jù)安全風險智能識別機制。這需要明確數(shù)據(jù)安全風險類別,通過數(shù)據(jù)挖掘和特征提取等技術(shù)對風險源進行特征提取,并建立數(shù)據(jù)安全風險模型準確識別數(shù)據(jù)安全風險。第二,建立數(shù)據(jù)安全風險實時預(yù)警機制,即基于數(shù)據(jù)挖掘、物聯(lián)網(wǎng)、大數(shù)據(jù)和機器學習等技術(shù),快速整合多源的多模態(tài)風險數(shù)據(jù),構(gòu)建數(shù)據(jù)安全風險預(yù)警平臺,完善“快速感知、實時監(jiān)測、事先預(yù)警”的一體化流程,實現(xiàn)對數(shù)據(jù)安全風險的實時預(yù)警。第三,建立數(shù)據(jù)安全風險智能管控機制。風險管控指針對數(shù)據(jù)泄露和數(shù)據(jù)破壞等風險預(yù)先采取的挽救措施,如梳理數(shù)據(jù)湖中的數(shù)據(jù)來源,進行數(shù)據(jù)血緣分析,對重要性和敏感程度不同的數(shù)據(jù)啟動不同級別的數(shù)字加密等。
人工智能技術(shù)嵌入教育系統(tǒng)帶來的不僅是技術(shù)問題,更多的是源于人類自身的人性和倫理問題。事實上,人們對技術(shù)應(yīng)用于教育的監(jiān)管能力遠不及技術(shù)的革新速度(譚維智,2019)。因此,為了確保人工智能教育大腦的良性運轉(zhuǎn),我們需要凝聚多元教育主體的智慧,對算法/模型進行倫理監(jiān)管,以保證其符合“以人為本”的教育價值觀。這包括:1)算法設(shè)計需符合教育邏輯。算法設(shè)計者需以“人的發(fā)展”為設(shè)計理念,根據(jù)“人的體驗”不斷改善算法設(shè)計的影響因素。2)算法選擇需進行評估。算法對大多數(shù)教師、學生或教育管理者等使用者來說是“黑匣子”,這就需要對算法進行質(zhì)量評估和風險評估。一方面,算法使用者應(yīng)根據(jù)具體教育情境進行算法遷移、模型訓(xùn)練和算法更新,評估模型計算是否丟棄了數(shù)據(jù)攜帶的重要信息以及從其他領(lǐng)域遷移的算法是否符合教育情境需要;另一方面,算法使用者應(yīng)具備自主評估和管控算法風險的能力,厘清算法或模型的局限性及可能帶來的風險,預(yù)設(shè)風險應(yīng)對方案。3)算法應(yīng)用需先經(jīng)測試。智能產(chǎn)品進入學校,需經(jīng)過情境測試和教育效果評估,接受家長、教師、管理者和專家的審查。可見,人工智能教育大腦為凝聚教育管理者、教師、學生、家長等的集體智慧提供了接口,從“算法設(shè)計、算法選擇、算法應(yīng)用”三個層面構(gòu)建算法倫理監(jiān)管機制,為教育數(shù)據(jù)治理提供算法倫理保障。