李磊 陳靜 張志鴻
摘 要:教育數(shù)據(jù)共享是教育治理能力優(yōu)化的重要途徑,但其普遍面臨數(shù)據(jù)存儲分散、數(shù)據(jù)安全風(fēng)險、流程煩瑣、數(shù)據(jù)維度有限等問題,而新興的區(qū)塊鏈技術(shù)可以有效解決這些問題。本研究提出了一種基于區(qū)塊鏈的教育數(shù)據(jù)共享方案,能夠安全、公平、高效地實現(xiàn)教育數(shù)據(jù)共享,提升教育治理能力。
關(guān)鍵詞:區(qū)塊鏈;數(shù)據(jù)共享;教育數(shù)據(jù)
我國的互聯(lián)網(wǎng)規(guī)模龐大、發(fā)展迅速。中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第48次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2021年6月,我國網(wǎng)民規(guī)模超過10.1億,互聯(lián)網(wǎng)普及率達71.6%。在線上、線下平臺的交互中,各種數(shù)據(jù)的產(chǎn)生和使用都越來越多,大數(shù)據(jù)逐漸在各個領(lǐng)域得到應(yīng)用。對相關(guān)數(shù)據(jù)進行采集、處理、挖掘和分析,可以起到改善工作環(huán)境、提高工作效率以及預(yù)測發(fā)展趨勢等作用。在教育領(lǐng)域,大數(shù)據(jù)的研究和應(yīng)用也受到學(xué)者們的廣泛關(guān)注。
教育部印發(fā)的《教育信息化2.0行動計劃》提出實施“教育治理能力優(yōu)化行動”,要求深化教育大數(shù)據(jù)應(yīng)用,以“互聯(lián)互通、信息共享、業(yè)務(wù)協(xié)同”為目標(biāo),打破數(shù)據(jù)壁壘,完善教育數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,優(yōu)化業(yè)務(wù)管理,提升公共服務(wù),促進決策支持。可見,教育數(shù)據(jù)共享已成為我國推進教育治理現(xiàn)代化的重要途徑。
近年,快速發(fā)展的區(qū)塊鏈等新興信息技術(shù)為教育數(shù)據(jù)的大規(guī)模共享提供了重要技術(shù)支持。區(qū)塊鏈作為一種新興的分布式數(shù)據(jù)存儲技術(shù),具有去中心化、防篡改、可追溯和高度信任等特征,已經(jīng)在金融、醫(yī)療、農(nóng)業(yè)等領(lǐng)域得到應(yīng)用。習(xí)近平總書記在中共中央政治局第十八次集體學(xué)習(xí)時指出,要探索“區(qū)塊鏈+”在民生領(lǐng)域的運用,積極推動區(qū)塊鏈技術(shù)在教育、就業(yè)、養(yǎng)老、精準(zhǔn)脫貧、醫(yī)療健康、商品防偽、食品安全、公益、社會救助等領(lǐng)域的應(yīng)用。教育部印發(fā)的《高等學(xué)校區(qū)塊鏈技術(shù)創(chuàng)新行動計劃》也提出,針對教育管理與服務(wù)中面臨的版權(quán)確認、數(shù)據(jù)取信、隱私保障等問題,研究基于區(qū)塊鏈的教育資源共享、教育成果評價、學(xué)生綜合測評、教育檔案存證與追蹤、信息流通控制與隱私保護等技術(shù),構(gòu)建基于區(qū)塊鏈的教育管理與服務(wù)協(xié)同平臺。綜上所述,區(qū)塊鏈技術(shù)對于解決教育數(shù)據(jù)共享中面臨的數(shù)據(jù)安全和防控教育數(shù)據(jù)共享中存在的風(fēng)險等問題,具有重要的實踐應(yīng)用價值。
一、教育數(shù)據(jù)共享面臨的問題
課題組通過對鄭州大學(xué)教務(wù)處、信息工程學(xué)院、計算機與人工智能學(xué)院、厚山學(xué)堂等部門以及中原工學(xué)院等院校的調(diào)研發(fā)現(xiàn),在教育數(shù)據(jù)共享中存在以下四個問題:
一是數(shù)據(jù)分散存儲,校際共享難。高校的教育數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)異構(gòu)等特點,這些數(shù)據(jù)分散存儲在多個業(yè)務(wù)系統(tǒng)中,如教務(wù)系統(tǒng)、學(xué)生信息系統(tǒng)、檔案管理系統(tǒng)等。這些被不同高校的不同部門保存并管控的數(shù)據(jù)共享非常困難,信息孤島現(xiàn)象嚴(yán)重,迫切需要打通校際數(shù)據(jù)共享通道。
二是存在隱私泄露、數(shù)據(jù)篡改等數(shù)據(jù)安全風(fēng)險。高校的教育數(shù)據(jù)涉及大量學(xué)生和教師的個人信息,但系統(tǒng)中的業(yè)務(wù)辦理人員、系統(tǒng)管理人員、數(shù)據(jù)庫管理人員等均有不同級別的數(shù)據(jù)訪問權(quán)限,存在多方串通篡改或泄露數(shù)據(jù)的風(fēng)險。此外,采用傳統(tǒng)的數(shù)據(jù)存儲方式建立的數(shù)據(jù)共享平臺,被不法分子攻擊、獲取數(shù)據(jù)并濫用的風(fēng)險也較大。
三是業(yè)務(wù)流程煩瑣。不同高校之間以及高校內(nèi)不同部門之間在使用其他高校或部門的數(shù)據(jù)前,需要層層審批,成本較高。
四是數(shù)據(jù)維度有限。分散在業(yè)務(wù)系統(tǒng)中的大多是靜態(tài)和片面的業(yè)務(wù)數(shù)據(jù),只包含有限的數(shù)據(jù)維度,這會導(dǎo)致高校在業(yè)務(wù)協(xié)同、決策支持等方面不能獲取完整有效的數(shù)據(jù),無法滿足教育治理優(yōu)化的需求。
二、區(qū)塊鏈的核心技術(shù)及其對教育數(shù)據(jù)共享的支撐
區(qū)塊鏈技術(shù)是以塊鏈結(jié)構(gòu)作為數(shù)據(jù)存儲載體,以點對點網(wǎng)絡(luò)作為通信載體,依賴密碼學(xué)確定所有權(quán)和保障隱私,以分布式系統(tǒng)共識框架保障一致性,旨在構(gòu)建價值交換系統(tǒng)的技術(shù)。區(qū)塊鏈的核心技術(shù)主要包括去中心化的共識協(xié)議、以塊鏈結(jié)構(gòu)組織的數(shù)據(jù)庫、公平可信的智能合約。
(一)去中心化的共識協(xié)議
區(qū)塊鏈按照中心化程度可以分為公有鏈、私有鏈和聯(lián)盟鏈。公有鏈的去中心化程度最高,任何節(jié)點都可以加入并參與共識協(xié)議的運行;私有鏈的去中心化程度最低,一般由單一的組織進行維護;聯(lián)盟鏈的去中心化程度介于上述二者之間,只允許聯(lián)盟內(nèi)部節(jié)點加入,節(jié)點必須經(jīng)過授權(quán)后才能參與共識協(xié)議的運行。
區(qū)塊鏈中的共識協(xié)議保證了分布式系統(tǒng)中的數(shù)據(jù)一致性。目前,區(qū)塊鏈的共識協(xié)議主要包括三類:一是證明類共識協(xié)議。這類共識協(xié)議中,節(jié)點在每一輪共識過程中必須證明自己具有某種特定的資源或能力,在競爭中勝出的節(jié)點將獲得數(shù)據(jù)寫入權(quán),如工作量證明(POW)和權(quán)益證明(POS)等。二是隨機類共識協(xié)議。這類共識協(xié)議是為解決證明類共識協(xié)議存在的算力浪費問題而提出的。節(jié)點根據(jù)某種隨機方式直接確定每一輪的數(shù)據(jù)寫入節(jié)點,如Algorand和所用時間證明(POET)等。三是拜占庭容錯(BFT)類共識協(xié)議。這類共識協(xié)議中,節(jié)點通過“投票選舉”的方式選出當(dāng)前輪次的數(shù)據(jù)寫入節(jié)點,如實用拜占庭容錯(PBFT)和冗余拜占庭容錯(RBFT)等。
在這三類共識協(xié)議的基礎(chǔ)上,學(xué)者們還提出了許多優(yōu)化的、組合的或分階段的共識協(xié)議。通過這些共識協(xié)議,在點對點網(wǎng)絡(luò)上的分布式節(jié)點可以達成數(shù)據(jù)一致,并將數(shù)據(jù)記錄到區(qū)塊鏈上。區(qū)塊鏈的共識協(xié)議為建立去中心化的、分布式的教育數(shù)據(jù)共享平臺提供了技術(shù)支撐,是解決校際教育數(shù)據(jù)分散存儲、難以共享問題的有效方法之一。
(二)以塊鏈結(jié)構(gòu)組織的數(shù)據(jù)庫
區(qū)塊鏈的核心數(shù)據(jù)結(jié)構(gòu)是一條由哈希指針鏈接而成的區(qū)塊鏈,每個區(qū)塊中包含多條數(shù)據(jù)記錄。根據(jù)不同的應(yīng)用場景,數(shù)據(jù)記錄可以設(shè)計成不同的字段?;诿艽a學(xué)原理設(shè)計的區(qū)塊結(jié)構(gòu),可以保證存儲在區(qū)塊中的數(shù)據(jù)的安全。
區(qū)塊由區(qū)塊頭和區(qū)塊體組成。數(shù)據(jù)記錄保存在區(qū)塊體中,組織成默克爾樹(Merkle Tree)的形式。默克爾樹是一種哈希樹,其葉子節(jié)點保存數(shù)據(jù)記錄,非葉子節(jié)點保存對應(yīng)子節(jié)點數(shù)據(jù)的哈希值。數(shù)據(jù)記錄的任何改變都會體現(xiàn)在默克爾樹根的值上,因此默克爾樹可以驗證數(shù)據(jù)記錄是否被篡改過。此外,存儲在默克爾樹的葉子節(jié)點中的數(shù)據(jù)記錄是經(jīng)過私鑰簽名的數(shù)據(jù),基于非對稱密碼體制設(shè)計的數(shù)字簽名機制可以保障數(shù)據(jù)的所有權(quán)。
默克爾樹根的值保存在區(qū)塊頭中。區(qū)塊頭中還保存有前驅(qū)區(qū)塊的哈希指針、本區(qū)塊的生成證明以及時間戳等信息。前驅(qū)區(qū)塊的哈希指針用于鏈接各個區(qū)塊,并可以用來驗證前驅(qū)區(qū)塊的數(shù)據(jù)是否被篡改過;本區(qū)塊的生成證明用于說明生成區(qū)塊的節(jié)點的身份信息,該證明與共識協(xié)議有關(guān),不同的共識協(xié)議需要提交不同的證明信息;時間戳用于記錄區(qū)塊生成時間。
區(qū)塊鏈的數(shù)據(jù)結(jié)構(gòu)為鏈上的數(shù)據(jù)提供了防篡改、隱私保護、數(shù)據(jù)所有權(quán)保護等多種安全屬性,是解決教育數(shù)據(jù)共享中數(shù)據(jù)安全問題的有效方法。
(三)公平可信的智能合約
智能合約的概念最早由密碼學(xué)家尼克·薩博提出。智能合約可以看作一段能夠按照事先約定的規(guī)則自動執(zhí)行的代碼。然而,智能合約提出時,由于缺少可信的執(zhí)行環(huán)境而未得到應(yīng)用。區(qū)塊鏈系統(tǒng)的出現(xiàn)為智能合約的應(yīng)用提供了去中心化的可信環(huán)境,使得智能合約得以應(yīng)用。
區(qū)塊鏈系統(tǒng)中,多方用戶對規(guī)則協(xié)商一致后創(chuàng)建合約代碼,然后將合約代碼作為數(shù)據(jù)記錄寫入?yún)^(qū)塊鏈,一旦滿足觸發(fā)條件,節(jié)點將執(zhí)行合約代碼,并將執(zhí)行后的合約狀態(tài)寫入?yún)^(qū)塊鏈。智能合約的執(zhí)行過程和結(jié)果由區(qū)塊鏈共識協(xié)議保證一致性,因此區(qū)塊鏈上的智能合約是公平可信的。
智能合約為多方事務(wù)處理提供了公平可信的技術(shù)方案,是解決教育數(shù)據(jù)共享中流程煩瑣問題,提高數(shù)據(jù)共享效率的有效方法之一。此外,在區(qū)塊鏈基礎(chǔ)上,還可以利用數(shù)據(jù)聯(lián)邦、零知識證明、同態(tài)加密等技術(shù)賦予教育數(shù)據(jù)共享平臺更多的能力,滿足教育治理優(yōu)化的需求。
三、基于區(qū)塊鏈的教育數(shù)據(jù)共享方案
在校際教育數(shù)據(jù)共享場景中,區(qū)塊鏈節(jié)點屬于多個高校以及各高校的多個部門,數(shù)據(jù)并未面向大眾完全公開,加入?yún)^(qū)塊鏈的節(jié)點需要經(jīng)過主管部門的審核。因此,課題組提出的教育數(shù)據(jù)共享方案使用的是聯(lián)盟鏈。
由于高校內(nèi)各部門之間的數(shù)據(jù)共享與高校間的校際數(shù)據(jù)共享具有不同的數(shù)據(jù)屬性、權(quán)限和安全需求,課題組提出了教育數(shù)據(jù)共享方案,在校內(nèi)和校際分別建設(shè)聯(lián)盟鏈,最終構(gòu)建多層聯(lián)盟鏈體系,以滿足校際教育數(shù)據(jù)共享中多樣化的需求?;诙鄬勇?lián)盟鏈的教育數(shù)據(jù)共享平臺框架如圖1所示。
基礎(chǔ)設(shè)施層包括云服務(wù)器、高性能存儲設(shè)施和高速網(wǎng)絡(luò)設(shè)施等,可以為教育數(shù)據(jù)共享平臺提供計算、存儲和網(wǎng)絡(luò)等基礎(chǔ)服務(wù)。基礎(chǔ)設(shè)施層可以直接利用教育科研網(wǎng)已有的信息基礎(chǔ)設(shè)施和網(wǎng)絡(luò)設(shè)施構(gòu)建。
區(qū)塊鏈服務(wù)層是教育數(shù)據(jù)共享平臺的核心組成部分,包括各高校的校內(nèi)區(qū)塊鏈、校際聯(lián)盟鏈以及智能合約模塊,可以提供統(tǒng)一安全的數(shù)據(jù)服務(wù)和公平高效的業(yè)務(wù)流程服務(wù)等。區(qū)塊鏈服務(wù)層中的校內(nèi)區(qū)塊鏈在高校內(nèi)部構(gòu)建,采用聯(lián)盟鏈系統(tǒng)架構(gòu),高校內(nèi)的教學(xué)和行政部門經(jīng)過授權(quán)后,作為校內(nèi)鏈節(jié)點參與校內(nèi)鏈共識,提供教育數(shù)據(jù)。原始教育數(shù)據(jù)仍然保存在傳統(tǒng)數(shù)據(jù)庫服務(wù)器中,但教育數(shù)據(jù)的哈希值保存在校內(nèi)鏈中。每個高校從校內(nèi)鏈節(jié)點中選舉一個節(jié)點作為代表節(jié)點,與其他高校的代表節(jié)點共同構(gòu)建校際聯(lián)盟鏈。代表節(jié)點需要經(jīng)過授權(quán)才能參與校際聯(lián)盟鏈的共識,代表節(jié)點根據(jù)需求將校內(nèi)教育數(shù)據(jù)的哈希值保存在校際聯(lián)盟鏈中。校內(nèi)區(qū)塊鏈和校際聯(lián)盟鏈均采用實用拜占庭容錯協(xié)議作為共識協(xié)議。各高校的代表節(jié)點同時參與校內(nèi)區(qū)塊鏈和校際聯(lián)盟鏈的共識,實現(xiàn)跨鏈訪問功能。在聯(lián)盟鏈之上,基于Solidity語言封裝智能合約模塊,為教育數(shù)據(jù)共享提供智能合約運行環(huán)境。根據(jù)需求設(shè)計并部署教育數(shù)據(jù)開放合約、查詢合約等,為上層應(yīng)用提供統(tǒng)一的數(shù)據(jù)和流程服務(wù)。
增值服務(wù)層是在區(qū)塊鏈服務(wù)層的基礎(chǔ)上提供的擴展服務(wù)。在保障用戶隱私、保護數(shù)據(jù)所有權(quán)的前提下,提供數(shù)據(jù)整合、分析等服務(wù),用以滿足教育治理中的各種數(shù)據(jù)需求。
應(yīng)用層包括實現(xiàn)各種業(yè)務(wù)的應(yīng)用程序,如學(xué)分銀行、教育評價和檔案存證等。應(yīng)用程序可以進行擴展,以滿足用戶新增的業(yè)務(wù)需求。
推進教育治理能力優(yōu)化,深化教育大數(shù)據(jù)應(yīng)用都需要安全高效的教育數(shù)據(jù)共享平臺。區(qū)塊鏈技術(shù)能夠在網(wǎng)絡(luò)中建立點到點之間的信任,保障數(shù)據(jù)公平、高效、安全地共享,化解數(shù)據(jù)共享面臨的安全與效率矛盾,為教育數(shù)據(jù)共享提供了有效的技術(shù)手段。課題組提出的基于區(qū)塊鏈的教育數(shù)據(jù)共享方案,能夠從技術(shù)上解決教育數(shù)據(jù)共享面臨的問題,提高數(shù)據(jù)共享的效率,促進教育治理能力優(yōu)化。
參考文獻:
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心.第48次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].(2021-09-15).http://www.
cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/202109/
t20210915_71543.htm.
[2]教育部.關(guān)于印發(fā)《教育信息化2.0行動計劃》的通知[EB/OL].(2021-04-18).http://www.moe.gov.cn/
srcsite/A16/s3342/201804/t20180425_334188.html.
[3]習(xí)近平在中央政治局第十八次集體學(xué)習(xí)時強調(diào)把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新重要突破口加快推動區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展[EB/OL].(2019-10-25).http://jhsjk.people.cn/article/31421403.
[4]教育部.關(guān)于印發(fā)《高等學(xué)校區(qū)塊鏈技術(shù)創(chuàng)新行動計劃》的通知[EB/OL].(2020-07-08).https://www.sdaai.org.cn/newsinfo/574598.html.
[5]蔡曉晴,鄧堯,張亮,等.區(qū)塊鏈原理及其核心技術(shù)[J].計算機學(xué)報,2021(1).
責(zé)編:初 心