羅劉敏 朱彥霞 華 南
(1.洛陽職業(yè)技術(shù)學(xué)院,河南 洛陽 471000;2.河南省職工醫(yī)院,河南 鄭州 450002;3.中廣智媒科技有限公司,河南 鄭州 450000)
隨智慧校園建設(shè)的推進(jìn),高校信息系統(tǒng)中產(chǎn)生了海量的多類型數(shù)據(jù),出現(xiàn)存儲容量不足的現(xiàn)象,亟待優(yōu)化擴(kuò)展成為智慧校園大數(shù)據(jù)環(huán)境的重中之重。如何在高?,F(xiàn)有軟硬件的基礎(chǔ)上,進(jìn)行分布式存儲的優(yōu)化[1],挖掘智慧校園背景下,學(xué)生、教師、課程等多元群體的數(shù)據(jù)特征,建立相應(yīng)畫像,并將其作為數(shù)據(jù)標(biāo)簽來建立行為模型,為后期的延伸應(yīng)用及高校管理工作提供輔助決策。打通業(yè)務(wù)信息通道,建立高校數(shù)據(jù)全生命周期管理模型,并通過數(shù)據(jù)價(jià)值信息賦能管理決策是高校信息化建設(shè)的重要任務(wù)?!秶抑虚L期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》中提出要推進(jìn)數(shù)字化校園建設(shè),各大高校紛紛加快了智慧校園建設(shè)的步伐,搭建高校大數(shù)據(jù)平臺,推進(jìn)大數(shù)據(jù)賦能管理和決策。目前,智慧校園推進(jìn)建設(shè)也面臨數(shù)據(jù)量龐大、數(shù)據(jù)質(zhì)量參差不齊[2]、存儲空間不足、數(shù)據(jù)信息利用不夠充分等問題。作為新一代多源融合的存儲數(shù)據(jù)系統(tǒng),分布式存儲可融合其他新一代信息技術(shù)[3],提高數(shù)字經(jīng)濟(jì)增速。在分布式存儲的背景下,多源數(shù)據(jù)融合存儲、多源數(shù)據(jù)的匯聚是技術(shù)核心,也是高校信息化建設(shè)進(jìn)程中新的研究方向和重點(diǎn)。
數(shù)據(jù)存儲技術(shù)最早應(yīng)用在醫(yī)學(xué)行業(yè),可有效提升工作效率。隨著檢測信息的數(shù)據(jù)化,形成了大量的數(shù)據(jù)資源,在傳統(tǒng)的存儲模式下,硬件設(shè)施要不斷擴(kuò)充,此外存在部分設(shè)備有閑置時(shí)間未有效利用的問題。隨著高校智慧化建設(shè)管理工作的推進(jìn),高校的課程資源信息、試驗(yàn)數(shù)據(jù)信息、日常運(yùn)行數(shù)據(jù)信息、學(xué)生及教師成長點(diǎn)的觀測信息等,也形成了大規(guī)模的結(jié)構(gòu)性和異構(gòu)性數(shù)據(jù)資源,有待于管理、匯聚和融合可視化[4]。受關(guān)注及研究熱點(diǎn)的提升與學(xué)術(shù)期刊論文增長變化趨勢相吻合的影響,2019—2021年分布式存儲結(jié)合大數(shù)據(jù)技術(shù)和數(shù)據(jù)融合技術(shù)學(xué)術(shù)期刊文獻(xiàn)數(shù)量共計(jì)2 576篇,其中20篇是與高校相關(guān),占總數(shù)的0.7%。眾多研究者對分布式存儲的研究也由最初的理論研究、平臺構(gòu)建研究到目前存儲優(yōu)化多維度觀測。研究方向加入了多平臺共享優(yōu)化機(jī)制與可持續(xù)改進(jìn)機(jī)制、高校信息化生態(tài)系統(tǒng)構(gòu)建及應(yīng)用等。目前,高校信息化智慧化水平在穩(wěn)步提升,教師、學(xué)生、高校、社會四維主體在信息化建設(shè)和應(yīng)用過程中多方受益。但在推進(jìn)和應(yīng)用過程中,尚有一些難點(diǎn)問題需要解決,主要有以下3個(gè)方面。①研究結(jié)合地域和院校特色的數(shù)據(jù)分布式存儲、數(shù)據(jù)匯聚和數(shù)據(jù)維護(hù)問題還要進(jìn)行探索。②基于大數(shù)據(jù)模式的高校數(shù)據(jù)存儲研究多是從計(jì)算機(jī)技術(shù)、管理學(xué)、大數(shù)據(jù)技術(shù)角度進(jìn)行研究,缺少數(shù)據(jù)作為提升高校管理效率及保護(hù)學(xué)生隱私等制定針對性方案的依據(jù)。③基于多源融合的背景,并結(jié)合分布式存儲技術(shù)[5]、文件切片技術(shù)及新型合約技術(shù)來保證電子數(shù)據(jù)安全及應(yīng)用的研究較少。鑒于此,本研究提出構(gòu)建高校存儲平臺,以解決高校數(shù)據(jù)存儲的全生態(tài)系統(tǒng)構(gòu)建融合應(yīng)用問題。
本研究利用高?,F(xiàn)有硬件資源平臺,將原有的閑散存儲設(shè)備進(jìn)行碎片化整合,并分時(shí)段管理,從而提升利用率,多平臺數(shù)據(jù)匯聚后,利用同一用戶的同源畫像機(jī)制來分析異源特色數(shù)據(jù),有利于對教學(xué)、管理及日常運(yùn)維中的各主體共性特色和個(gè)性特色進(jìn)行挖掘,從而提升設(shè)備利用率和管理的效率,以期提升高校的智慧化、信息化水平。在存儲平臺的公有云和私有云聯(lián)用的基礎(chǔ)上,構(gòu)建多個(gè)數(shù)據(jù)存儲基礎(chǔ)數(shù)據(jù)庫,即辦事辦公、校園生活、學(xué)習(xí)平臺等,多個(gè)基礎(chǔ)數(shù)據(jù)庫支撐1個(gè)共享融合平臺。云平臺提供技術(shù)支撐和數(shù)據(jù)匯聚共享及優(yōu)化處理,通過構(gòu)建分布式存儲平臺,實(shí)現(xiàn)資源數(shù)據(jù)的匯聚抽取及有效利用,監(jiān)測數(shù)據(jù)的同源與異源同發(fā),檢測教師和學(xué)生用戶在不同數(shù)據(jù)池中的活躍度,構(gòu)建比較完整的數(shù)據(jù)流通共享機(jī)制,以期為高校數(shù)據(jù)存儲效率提升、數(shù)據(jù)賦能教學(xué)與管理貢獻(xiàn)力量。
基于區(qū)塊鏈的存儲服務(wù)可提高系統(tǒng)數(shù)據(jù)資源的隱私性、保護(hù)性,同時(shí)能有效避免中心化管理在異常情況下帶來的數(shù)據(jù)損壞、數(shù)據(jù)丟失或泄露、數(shù)據(jù)遷移難度大等問題,從而有效提升網(wǎng)絡(luò)硬件資源的利用率。為確保文件分布與存儲資源的對等性、數(shù)據(jù)資源傳輸與訪問的安全性,數(shù)據(jù)文件的分發(fā)及訪問控制機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)顯得尤為重要。
1.2.1 基于區(qū)塊鏈的訪問控制機(jī)制。不同于傳統(tǒng)的公鑰密碼學(xué)機(jī)密算法,基于屬性的加密(Attribute-based encryption,ABE)被視為基于用戶身份的加密算法,用戶身份被定義為一組屬性,并且消息可根據(jù)屬性子集(密鑰-策略)或(密文-策略)進(jìn)行加密,由此加密算法被分為KP-ABE、CPABE兩大類。KP-ABE算法將訪問策略編碼到用戶密鑰中,解密時(shí)根據(jù)訪問策略來匹配密文中的屬性,若匹配成功,則可解密,這也意味著不同訪問策略要生成不同密鑰文件,系統(tǒng)擴(kuò)展性可能受到局限。CP-ABE算法則將部分用戶屬性編碼到密鑰中,訪問策略與密文捆綁,用戶根據(jù)自己屬性對應(yīng)的私鑰對文件進(jìn)行解密,訪問策略的靈活性更高。基于KP-ABE與CP-ABE算法能有效提高數(shù)據(jù)機(jī)密系統(tǒng)的可靠性,但往往要有一個(gè)權(quán)威的認(rèn)證機(jī)構(gòu)。本研究設(shè)計(jì)的基于區(qū)塊鏈的訪問控制機(jī)制,在ABE技術(shù)上實(shí)現(xiàn)區(qū)中心化的屬性加密,能有效提高系統(tǒng)的擴(kuò)展性、靈活性與安全性,其加密關(guān)鍵步驟如下。
①Global Setup(λ)→GP//系統(tǒng)初始化生成全局參數(shù)GP(每個(gè)用戶擁有唯一的GID)。
②Generate PK,SK→(PK,SK)//數(shù)據(jù)擁有者選取部分屬性,生成公鑰PK與私鑰SK。
③Encrypt(M,(A,ρ),GP,PK)→CT//數(shù)據(jù)讓擁有著根據(jù)明文M、訪問策略(A,ρ)、全局參數(shù)GP、公鑰PK進(jìn)行加密,得到密文CT。
④Generate(GID,GP,SK)→{Key,GID}//數(shù)據(jù)擁有者根據(jù)訪問者的GID標(biāo)識,生成對應(yīng)的私鑰對{Key,GID}。
⑤Decrypt(CT,{Key,GID},GP)→M//訪問者根據(jù)密文、私鑰對{Key,GID}、全局參數(shù)GP進(jìn)行解密,得到明文M。
1.2.2 基于資源對等的文件切片及分發(fā)機(jī)制。
①文件切分處理。在分布式存儲網(wǎng)絡(luò)中,為提升文件上傳效率及降低文件集中存儲的風(fēng)險(xiǎn),將較大的文件進(jìn)行切片后分散存儲在存儲網(wǎng)絡(luò)中。假設(shè)加密后文件Fm的大小為s,切片文件大小為t,則切分?jǐn)?shù)量切片文件集合見式(1)。
切片文件將復(fù)制m份后交由多線程處理,并分散存儲于分布式網(wǎng)絡(luò)中,復(fù)制后的切片文件將形成切片矩陣Fij,見式(2)。
②文件分發(fā)機(jī)制。在文件分發(fā)前,要構(gòu)建基于網(wǎng)絡(luò)各節(jié)點(diǎn)信息loc(fij)與碎片文件Fseg的文件信息標(biāo)識,從而確保文件在網(wǎng)絡(luò)傳輸過程中的唯一性識別。在文件分發(fā)過程中,為避免隨機(jī)分發(fā)可能造成的節(jié)點(diǎn)資源分布的不可控、資源利用率低下等問題,本研究采用基于資源對等的文件分發(fā)機(jī)制。假設(shè)分布式系統(tǒng)中有n個(gè)用戶提供網(wǎng)絡(luò)共享資源,fi為用戶i可提供的硬件存儲空間,那么該用戶被選中分發(fā)存儲的概率見式(3)。
高校的數(shù)據(jù)資源和應(yīng)用軟件都比較豐富,目前仍存在多個(gè)軟件分時(shí)運(yùn)行的情況,集約化管理和存儲有助于提升高校的工作效率及發(fā)揮數(shù)據(jù)在管理中的重要作用。智慧化平臺構(gòu)建是融合了校內(nèi)多個(gè)應(yīng)用軟件和平臺,在應(yīng)用過程中對數(shù)據(jù)資源進(jìn)行多平臺匯聚融合,從而提升數(shù)據(jù)分析后的集約管理效率,發(fā)揮數(shù)據(jù)支撐決策、制度和優(yōu)化機(jī)制的作用。主流的智慧化融合平臺應(yīng)用多種開發(fā)技術(shù),并結(jié)合DTFS的存儲理念,采用B/S模式的應(yīng)用程序,來滿足數(shù)據(jù)賦能、支撐管理和優(yōu)化教學(xué)三個(gè)維度,搭建共享開放的多功能一體化的高校融合云平臺。
搭建高校融合存儲云平臺主要用于高校各系統(tǒng)平臺的數(shù)據(jù)共享及集約化管理,從而提升數(shù)據(jù)賦能的效率和數(shù)據(jù)存儲效率。考慮到分布式存儲是利用碎片化的系統(tǒng)資料閑時(shí)碎片來優(yōu)化存儲模式,進(jìn)行多樣化智慧管理,將整個(gè)存儲平臺劃分為多個(gè)層次(見圖1),其中實(shí)線箭頭表示下層為上層提供服務(wù),虛箭頭表示上層應(yīng)用。
圖1 高校融合存儲平臺架構(gòu)設(shè)計(jì)
高校數(shù)據(jù)資源豐富,從學(xué)生入校的注冊報(bào)到,到學(xué)生的在校學(xué)習(xí)流程、不同學(xué)科的課程資源平臺數(shù)據(jù)、日常測試成績數(shù)據(jù),再到畢業(yè)生實(shí)習(xí)就業(yè)數(shù)據(jù)。應(yīng)用系統(tǒng)包含學(xué)工口、教學(xué)口、教輔支持口、管理口等不同平臺數(shù)據(jù)。通過打通一站式平臺,設(shè)計(jì)優(yōu)化智慧管理存儲終端,實(shí)行一站式的管理模式,數(shù)據(jù)流通中設(shè)有公有池和私有池,從而兼顧數(shù)據(jù)層的共享和安全保護(hù)。智慧平臺的數(shù)據(jù)存儲設(shè)計(jì)是基于私有區(qū)塊鏈及DTFS的分布式教育資源數(shù)據(jù)存儲原型的,將關(guān)鍵信息封鎖在私有區(qū)塊鏈中,并采用“鏈外存儲”的方式將數(shù)據(jù)存儲在私有局域網(wǎng)內(nèi),支持?jǐn)?shù)據(jù)的完整性驗(yàn)證及協(xié)議的解除。將文件進(jìn)行切片處理,并根據(jù)對硬件資源時(shí)間輪巡狀態(tài)的檢測情況,利用DTSF實(shí)現(xiàn)數(shù)據(jù)的快速分布式存儲來實(shí)現(xiàn)上傳整合高校數(shù)據(jù)與硬件資源,運(yùn)用DTFS、區(qū)塊鏈技術(shù)來實(shí)現(xiàn)教育圖書、影像資料、課程資源、學(xué)校多平臺的數(shù)據(jù)資源的高速存儲、上傳、訪問[6]。通過融合設(shè)計(jì),提高通用性和可操作性,形成可復(fù)制、可推廣的經(jīng)驗(yàn)。高校融合存儲平臺功能結(jié)構(gòu)如圖2所示。
圖2 高校融合存儲平臺功能結(jié)構(gòu)圖
在高校融合存儲平臺中,以師生行為類庫、教學(xué)數(shù)據(jù)庫、圖像頻度系統(tǒng)等支撐校園輿情,數(shù)字賦能教學(xué)管理改革與優(yōu)化,可使用多種數(shù)據(jù)分布式存儲工具來實(shí)現(xiàn)閑時(shí)節(jié)點(diǎn)的碎片化管理與存儲應(yīng)用,從而提升存儲應(yīng)用效率[7]。通過數(shù)據(jù)的全方位匯聚融合,構(gòu)建“匯聚-融合-分析-可視化”管理系統(tǒng),在平臺建設(shè)過程中,注重對私有數(shù)據(jù)加密服務(wù)和數(shù)據(jù)版本管理服務(wù),由于用戶采集的信息中很多包含隱私保護(hù)或涉密要求,而傳統(tǒng)的單一密鑰或分模塊密鑰的加密方式對數(shù)據(jù)的保護(hù)有限,密鑰泄露和數(shù)據(jù)篡改風(fēng)險(xiǎn)較大[8]。采用獨(dú)立的數(shù)據(jù)加密服務(wù)技術(shù)可對數(shù)據(jù)提供更加有效的保護(hù),通過數(shù)據(jù)索引、獨(dú)立密鑰庫和加密分離的方式對每條數(shù)據(jù)進(jìn)行獨(dú)立的加密保護(hù)[9]。同時(shí),密鑰倉庫和數(shù)據(jù)索引是分開存儲的,并采用分布式方式進(jìn)行維護(hù),擁有一定的冗余機(jī)制,再加上系統(tǒng)采用內(nèi)網(wǎng)或?qū)>W(wǎng)模式,從而使數(shù)據(jù)傳輸效率有保障,進(jìn)一步降低網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。
在進(jìn)行數(shù)據(jù)資源整合過程中,融合處理的數(shù)據(jù)通過資源管理平臺進(jìn)行優(yōu)化展示。通過多平臺的數(shù)據(jù)匯聚及預(yù)分析后,選取具有代表性的數(shù)據(jù)資源,在融合平臺的模塊區(qū)域進(jìn)行展示,涉及數(shù)據(jù)倉庫中的數(shù)據(jù)讀取和存儲操作,并抓取數(shù)據(jù)到數(shù)據(jù)集的過程。利用分時(shí)段的碎片存儲空間,及數(shù)據(jù)匯聚后的優(yōu)化存儲,來提升多源共享互用的能力。融合存儲平臺的成果展示模塊中涉及數(shù)據(jù)庫的連接、頁面數(shù)據(jù)的獲取、查詢語句的定義判斷、數(shù)據(jù)庫資源表的寫入,數(shù)據(jù)及圖片的存儲采用簡數(shù)據(jù)路徑模式,可提升成果展示模塊的訪問應(yīng)用效率。這里僅以成果展示平臺的存儲寫入為例,展示部分代碼。
融合存儲平臺匯聚了諸多平臺資源,實(shí)現(xiàn)了用戶數(shù)據(jù)的互享共通。通過融合存儲系統(tǒng)平臺的設(shè)計(jì)與應(yīng)用,學(xué)校網(wǎng)絡(luò)中心監(jiān)測數(shù)據(jù)承載量顯示,通過融合存儲平臺應(yīng)用將多個(gè)平臺數(shù)據(jù)打通實(shí)施一站式管理,提升了用戶的工作和使用效率,提高了高校的管理效率,后臺數(shù)據(jù)存儲容量的擴(kuò)容及通過DTFS的分布式應(yīng)用提升了閑時(shí)碎片的存儲效率,在一定程度上節(jié)約了成本,提升了硬件和資源的利用效率。經(jīng)后臺多個(gè)應(yīng)用模塊數(shù)據(jù)匯聚,將原多平臺數(shù)據(jù)進(jìn)行多維度整合,以提升數(shù)據(jù)賦能的機(jī)制,實(shí)現(xiàn)數(shù)據(jù)支撐教學(xué)改革、人才培養(yǎng)、管理效率提升。通過數(shù)據(jù)監(jiān)測和試驗(yàn)結(jié)果來看,融合存儲應(yīng)用多模塊匯聚數(shù)據(jù)使用情況優(yōu)于傳統(tǒng)的單一系統(tǒng)模式,疫情防控模塊是教職工和學(xué)生的日常應(yīng)用,每天定時(shí)訪問基于持平,其余模塊的應(yīng)用效率均有不同程序的提升(見圖3)。
圖3 融合存儲前后平臺模塊使用效率變化圖
在智慧化校園建設(shè)與應(yīng)用背景下,高校硬件資源的有效利用能有效提升存儲和利用效率,利用DTFS存儲能有效提升資源的利用率及存儲效果,將學(xué)校的多平臺模塊打通[9],實(shí)現(xiàn)一站式管理,有利于高校節(jié)約成本,提升資源利用率及數(shù)字服務(wù)教學(xué)管理,賦能決策的能力。
隨著物聯(lián)網(wǎng)技術(shù)、計(jì)算機(jī)技術(shù)及大數(shù)據(jù)技術(shù)的快速持續(xù)發(fā)展,高校智慧化校園建設(shè)的持續(xù)推進(jìn),在日常教學(xué)和管理中,高校與信息技術(shù)的結(jié)合緊密度在不斷提升,教學(xué)、科研、日常管理、資源庫等多身份多平臺的數(shù)據(jù)打通及平臺共建工作取得一定的進(jìn)展,基于DTFS的存儲理念為高校數(shù)據(jù)的有效存儲和利用提供了技術(shù)支撐。通過對軟硬件閑置資源的利用,能有效提升數(shù)據(jù)的存儲效率,為數(shù)據(jù)庫及數(shù)據(jù)賦能提供基礎(chǔ)數(shù)據(jù)支持。