馬彪 王繼東
基于云平臺(tái)的省級(jí)教育考試機(jī)構(gòu)數(shù)據(jù)中心建設(shè)初探
——以江蘇省教育考試院為例
馬彪 王繼東
教育考試信息化是提高教育考試管理工作效率、促進(jìn)教育考試改革發(fā)展的重要手段。省級(jí)教育考試機(jī)構(gòu)承擔(dān)的考試項(xiàng)目眾多、規(guī)模不等,各種信息系統(tǒng)并存,數(shù)據(jù)共享的要求較高。本文圍繞這一問題提出用建立省級(jí)教育考試機(jī)構(gòu)數(shù)據(jù)中心的辦法來打破業(yè)務(wù)壁壘、重組業(yè)務(wù)模式,建立高可靠性、高可用性、高內(nèi)聚、松耦合的應(yīng)用基礎(chǔ)平臺(tái)。本文結(jié)合江蘇省教育考試院的實(shí)際情況,探究了省級(jí)教育考試機(jī)構(gòu)數(shù)據(jù)中心建設(shè)的必要性與可行性,提出了較為完整的建設(shè)方案。
教育考試;數(shù)據(jù)中心;云平臺(tái);建設(shè)方案
江蘇省教育考試院由原招辦、考辦、會(huì)考辦三辦合一,成立伊始,即非常重視教育考試的信息化工作,目前已經(jīng)進(jìn)入第二個(gè)信息化規(guī)劃的實(shí)施階段。省級(jí)教育考試機(jī)構(gòu)的招考項(xiàng)目很多,種類復(fù)雜,有招生類考試、自學(xué)考試、非學(xué)歷證書考試,且教育考試項(xiàng)目本身存在著階段性強(qiáng),業(yè)務(wù)項(xiàng)目之間耦合性較低的特點(diǎn)。目前江蘇省教育考試院信息系統(tǒng)從招考項(xiàng)目上劃分包括:普通高考信息系統(tǒng)、自學(xué)考試信息系統(tǒng)、證書類考試信息系統(tǒng),各大系統(tǒng)中又包含若干子系統(tǒng)。從考試環(huán)節(jié)上分有:報(bào)名系統(tǒng)、考務(wù)管理系統(tǒng)、評卷系統(tǒng)、成績處理系統(tǒng)、錄取系統(tǒng),相互交叉后,大大小小的系統(tǒng)幾十個(gè),缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)、統(tǒng)一的開發(fā)標(biāo)準(zhǔn),系統(tǒng)間難以實(shí)現(xiàn)數(shù)據(jù)共享,為更高水平的教育考試事業(yè)發(fā)展造成了一定的阻礙。
在第二個(gè)信息化規(guī)劃中,江蘇省教育考試院明確將建立教育考試省級(jí)數(shù)據(jù)中心,逐步集成各類信息系統(tǒng),以提高教育考試信息化的水平和效率。
云平臺(tái)是指在大量的分布式計(jì)算機(jī)上,而非本地計(jì)算機(jī)或遠(yuǎn)程服務(wù)器中,建立與互聯(lián)網(wǎng)相似的數(shù)據(jù)資源池,使得用戶能夠?qū)①Y源切換到需要的應(yīng)用上,根據(jù)需求訪問計(jì)算機(jī)和存儲(chǔ)系統(tǒng)。
云平臺(tái)的優(yōu)勢在于提供了看起來沒有上限的可用計(jì)算資源,用戶不需要提前考慮設(shè)備的需求量,免去了用戶的前期投入,可以從一個(gè)規(guī)模較小的硬件資源起家,并根據(jù)自己的需要增加資源。云平臺(tái)資源擁有很好的彈性,當(dāng)資源需求下降時(shí),傳統(tǒng)方式部署的服務(wù)器資源就被閑置了,而通過云部署的資源則靈活很多。
云平臺(tái)包含兩方面內(nèi)容,一是在網(wǎng)絡(luò)上提供的為計(jì)算服務(wù)的應(yīng)用,例如以前被稱為SaaS(Software as a Service)的一類應(yīng)用;二是提供這些服務(wù)的在數(shù)據(jù)中心的硬件和系統(tǒng)軟件。
根據(jù)江蘇省教育考試院信息建設(shè)二期目標(biāo),按照打破業(yè)務(wù)壁壘,重組業(yè)務(wù)模式,建立高可靠性、高可用性、高內(nèi)聚、松耦合的應(yīng)用基礎(chǔ)支撐平臺(tái)的基本原則,數(shù)據(jù)中心建設(shè)包含兩大層面任務(wù):一是數(shù)據(jù)中心云平臺(tái)建設(shè),通過建立教育考試私有云,提供統(tǒng)一的數(shù)據(jù)管理、網(wǎng)絡(luò)接入、系統(tǒng)安全,主要面向硬件系統(tǒng)以及中心數(shù)據(jù)庫建設(shè);二是應(yīng)用系統(tǒng)建設(shè),面向各項(xiàng)業(yè)務(wù),專注系統(tǒng)功能的實(shí)現(xiàn),并遵循統(tǒng)一的開發(fā)規(guī)范和接口要求。
數(shù)據(jù)中心整體系統(tǒng)架構(gòu)如圖1所示,從兩大任務(wù)中可衍生擴(kuò)展出六大建設(shè)內(nèi)容,分別為云平臺(tái)網(wǎng)絡(luò)基礎(chǔ)建設(shè)、云存儲(chǔ)數(shù)據(jù)中心建設(shè)、數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)、容災(zāi)備份、接入服務(wù)和資源調(diào)度和應(yīng)用系統(tǒng)建設(shè)。其中,數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)和容災(zāi)備份又是數(shù)據(jù)中心系統(tǒng)建設(shè)的基礎(chǔ)和安全保障,貫穿于兩大層面的各個(gè)部分。
圖1 數(shù)據(jù)中心系統(tǒng)架構(gòu)
數(shù)據(jù)中心建設(shè)是一個(gè)龐大的系統(tǒng)工程,涉及基礎(chǔ)層、數(shù)據(jù)層和中間層等許多方面,而其中關(guān)鍵性的建設(shè)內(nèi)容則是云平臺(tái)網(wǎng)絡(luò)基礎(chǔ)建設(shè)、云存儲(chǔ)數(shù)據(jù)中心建設(shè)、數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)和容災(zāi)備份。
基于虛擬技術(shù)已在江蘇省多項(xiàng)評卷中采用,且效果突出,在數(shù)據(jù)中心建設(shè)中進(jìn)一步建立以System Center為中心的私有云管理平臺(tái),通過建立自服務(wù)管理模式降低管理人員的壓力。在硬件層之上建立虛擬化的資源池,啟用Hyper-V作為底層虛擬化的管理層,采用規(guī)?;娜杭軜?gòu)來降低成本、提高效率和管理能力,虛擬化后統(tǒng)一硬件底層結(jié)構(gòu),便于遷移和管理。
數(shù)據(jù)中心的建設(shè)核心問題在于如何解決不同系統(tǒng)之間的數(shù)據(jù)交互與共享,數(shù)據(jù)的交互存在兩種模式,點(diǎn)對點(diǎn)的信息交互模式以及中心數(shù)據(jù)庫的交互模式。前者結(jié)構(gòu)簡單,容易在原有系統(tǒng)上升級(jí)改造;一個(gè)節(jié)點(diǎn)錯(cuò)誤不會(huì)影響其他節(jié)點(diǎn)。缺點(diǎn)在于:隨著系統(tǒng)的增加,每個(gè)系統(tǒng)需要建立的接口越來越多;參與數(shù)據(jù)交互的雙方必須同時(shí)在線;需購置多套數(shù)據(jù)庫及中間件等軟件,成本較大。后者所有應(yīng)用系統(tǒng)均基于中心數(shù)據(jù)庫,各系統(tǒng)分別根據(jù)各自權(quán)限從中心數(shù)據(jù)庫中讀取數(shù)據(jù)。其優(yōu)點(diǎn)是:數(shù)據(jù)單一,接口簡單,不會(huì)存在不一致性;各個(gè)系統(tǒng)相互獨(dú)立,不需要為交互數(shù)據(jù)而實(shí)時(shí)在線;可集中對中心數(shù)據(jù)庫做好容災(zāi)備份。缺點(diǎn)是:中心數(shù)據(jù)庫須面對較大的吞吐量,其穩(wěn)定性和性能要求較高。
江蘇省教育考試院現(xiàn)存系統(tǒng)較多,相對割裂,要想以點(diǎn)對點(diǎn)的方式實(shí)現(xiàn)數(shù)據(jù)交互,工作量極大,且難以維護(hù),故提出建設(shè)中心數(shù)據(jù)庫的方案。
由圖4可見,云存儲(chǔ)數(shù)據(jù)中心平臺(tái)包括三大模塊組成:數(shù)據(jù)資源管理模塊、數(shù)據(jù)處理模塊、系統(tǒng)管理模塊。這三個(gè)部分相互配合,完成對數(shù)據(jù)的收集、存儲(chǔ)、處理、調(diào)用以及管理,及時(shí)獲取各類教育考試評價(jià)與決策分析數(shù)據(jù),并抽取數(shù)據(jù)為應(yīng)用系統(tǒng)服務(wù)。
圖2 點(diǎn)對點(diǎn)的信息交互模式
圖3 中心數(shù)據(jù)庫交互模式
圖4 云存儲(chǔ)數(shù)據(jù)中心層次結(jié)構(gòu)
對于省級(jí)考試機(jī)構(gòu)數(shù)據(jù)中心而言,數(shù)據(jù)源是一切業(yè)務(wù)系統(tǒng)的基礎(chǔ),萬一數(shù)據(jù)丟失或不能訪問,從而導(dǎo)致工作停頓,將給全省的教育考試工作帶來極大損失。為將因?yàn)?zāi)難引發(fā)的數(shù)據(jù)損耗風(fēng)險(xiǎn)降低到最低,一旦發(fā)生災(zāi)難,可跨越不同磁盤系統(tǒng),快速切換,實(shí)現(xiàn)系統(tǒng)同步,本數(shù)據(jù)中心考慮使用同步遠(yuǎn)程鏡像技術(shù)進(jìn)行容災(zāi)系統(tǒng)的建設(shè)。利用光纖連接數(shù)據(jù)中心和災(zāi)備中心,兩中心可保證業(yè)務(wù)系統(tǒng)24×7小時(shí)不間斷運(yùn)行,實(shí)時(shí)同步數(shù)據(jù),可在較短時(shí)間內(nèi)將核心業(yè)務(wù)接管到異地的災(zāi)備中心直至主站點(diǎn)完全修復(fù)。
目前江蘇省考試院現(xiàn)有大小系統(tǒng)幾十個(gè),由于沒有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和開發(fā)標(biāo)準(zhǔn),各系統(tǒng)間不能進(jìn)行數(shù)據(jù)交換、數(shù)據(jù)共享,形成一個(gè)個(gè)“信息孤島”。為將這些“孤島”式的應(yīng)用系統(tǒng)集成起來,就需要制定出各個(gè)業(yè)務(wù)系統(tǒng)統(tǒng)一遵循的標(biāo)準(zhǔn)規(guī)范和格式數(shù)據(jù),統(tǒng)一基礎(chǔ)數(shù)據(jù)并進(jìn)行管理。
數(shù)據(jù)標(biāo)準(zhǔn)的體系結(jié)構(gòu)建設(shè)主要包含兩大任務(wù):管理信息標(biāo)準(zhǔn)的建設(shè)與數(shù)據(jù)交換標(biāo)準(zhǔn),而管理信息標(biāo)準(zhǔn)分為數(shù)據(jù)元標(biāo)準(zhǔn)和代碼標(biāo)準(zhǔn)。數(shù)據(jù)元(Data element)是通過標(biāo)識(shí)、定義、表示以及允許值等一系列屬性描述的數(shù)據(jù)單元,在特定的語義環(huán)境中被認(rèn)為是不可再分的最小的數(shù)據(jù)單元。
數(shù)據(jù)元概念的構(gòu)成是對象類與特征的結(jié)合。例如:考生這個(gè)“對象”可以有性別、年齡、成績等多個(gè)“特性”,將它與其中的某一個(gè)特性結(jié)合組成“數(shù)據(jù)元概念”,如考生性別、考生成績。數(shù)據(jù)元由數(shù)據(jù)元概念和表示兩部分組成,如考生性別,性別={男,女},性別={男,女,未知},分別構(gòu)成兩個(gè)不同的數(shù)據(jù)元。數(shù)據(jù)元標(biāo)準(zhǔn)是數(shù)據(jù)標(biāo)準(zhǔn)的重要組成部分,通過對數(shù)據(jù)元名稱、數(shù)據(jù)元定義、數(shù)據(jù)元類型、數(shù)據(jù)元長度、數(shù)據(jù)元值域、數(shù)據(jù)元表示與數(shù)據(jù)元表示方法一致,保證同一個(gè)數(shù)據(jù)元只有一個(gè)定義,一個(gè)編碼,從而實(shí)現(xiàn)各應(yīng)用系統(tǒng)間高效、準(zhǔn)確的數(shù)據(jù)交換和數(shù)據(jù)共享。
管理信息標(biāo)準(zhǔn)中的代碼標(biāo)準(zhǔn)具體來源包括:已經(jīng)形成標(biāo)準(zhǔn)文件的各類規(guī)范,上級(jí)部門下發(fā)的各類文件,江蘇省制定的各類招考文件、規(guī)章制度以及工作流程規(guī)范。
數(shù)據(jù)元標(biāo)準(zhǔn)和代碼標(biāo)準(zhǔn)只解決了信息描述層面的標(biāo)準(zhǔn),而沒有對信息本身的存儲(chǔ)格式、權(quán)限以及信息的描述方法等進(jìn)行統(tǒng)一的標(biāo)準(zhǔn)化。為使數(shù)據(jù)平臺(tái)內(nèi)各信息系統(tǒng)能夠進(jìn)行數(shù)據(jù)交換和訪問互通,需要制定統(tǒng)一的數(shù)據(jù)交換信息標(biāo)準(zhǔn),包括數(shù)據(jù)描述標(biāo)準(zhǔn)、權(quán)限描述標(biāo)準(zhǔn)、信息采集標(biāo)準(zhǔn)、信息發(fā)布標(biāo)準(zhǔn)以及數(shù)據(jù)交換接口標(biāo)準(zhǔn)等。
接入服務(wù)是各類主要應(yīng)用系統(tǒng)實(shí)現(xiàn)的基礎(chǔ),各類應(yīng)用系統(tǒng)使用接入服務(wù)訪問云存儲(chǔ)中的各類數(shù)據(jù)。根據(jù)江蘇省教育考試院的實(shí)際需要本數(shù)據(jù)中心的接入服務(wù)大致包括以下幾個(gè)方面:用戶認(rèn)證,權(quán)限管理,公用API接口與Web Service服務(wù)。
優(yōu)秀的用戶認(rèn)證、權(quán)限管理機(jī)制可以提升數(shù)據(jù)中心數(shù)據(jù)的安全性,保證只有經(jīng)過授權(quán)的人員才可以訪問數(shù)據(jù),并且可以為不同的人員設(shè)置不同的權(quán)限。這樣不僅僅可以防止數(shù)據(jù)被非法修改,還可以從制度上避免舞弊等惡意行為的發(fā)生。
公用API接口是連接應(yīng)用系統(tǒng)與數(shù)據(jù)中心的直接通道,豐富的公用API接口使應(yīng)用系統(tǒng)更加準(zhǔn)確方便的獲得所需數(shù)據(jù)。適當(dāng)?shù)腤eb Service服務(wù)利于整個(gè)數(shù)據(jù)中心的維護(hù)與應(yīng)用的開發(fā)。
1)高招管理系統(tǒng):面向普高、學(xué)測、對口單招、研究生考試等相關(guān)業(yè)務(wù)的管理子系統(tǒng),處理高招業(yè)務(wù)的報(bào)名管理、計(jì)劃管理、考務(wù)考籍管理、特殊考生管理、體檢信息管理、成績信息管理、志愿填報(bào)管理、錄取信息管理,并通過數(shù)據(jù)中心的高招業(yè)務(wù)數(shù)據(jù)快照,形成高招業(yè)務(wù)的初步數(shù)據(jù)分析。
2)自考管理系統(tǒng):面向自考的社會(huì)自考、助學(xué)專業(yè)、專接本等相關(guān)業(yè)務(wù)的管理子系統(tǒng),處理自考業(yè)務(wù)的報(bào)名報(bào)考管理、計(jì)劃管理、考務(wù)考籍管理、成績信息管理、實(shí)踐課程與論文管理、畢業(yè)生管理、教材管理,并通過數(shù)據(jù)中心的自考業(yè)務(wù)數(shù)據(jù)快照,形成自考業(yè)務(wù)的初步數(shù)據(jù)分析。
3)成招、專轉(zhuǎn)本管理系統(tǒng):面向成招、專轉(zhuǎn)本的管理子系統(tǒng),處理報(bào)名管理、計(jì)劃管理、考務(wù)考籍管理、成績信息管理、志愿填報(bào)管理、錄取信息管理,并通過數(shù)據(jù)中心的成招、專轉(zhuǎn)本數(shù)據(jù)快照,形成初步數(shù)據(jù)分析。
4)社考管理系統(tǒng):面向各類非學(xué)歷社會(huì)證書考試的管理子系統(tǒng),處理報(bào)名管理、考務(wù)考籍管理、成績管理、證書管理,并通過數(shù)據(jù)中心的社考數(shù)據(jù)快照,形成社考業(yè)務(wù)的初步數(shù)據(jù)分析。
5)中招管理系統(tǒng):面向高中階段入學(xué)的管理子系統(tǒng),銜接高中階段的報(bào)名信息、成績信息、錄取信息,并通過數(shù)據(jù)中心的中招數(shù)據(jù)快照,形成中招業(yè)務(wù)的初步數(shù)據(jù)分析。
6)標(biāo)準(zhǔn)化考場建設(shè)系統(tǒng):包括視頻及網(wǎng)絡(luò)監(jiān)控系統(tǒng)、應(yīng)急指揮系統(tǒng)、考生身份驗(yàn)證系統(tǒng)、作弊防控系統(tǒng)、考試綜合業(yè)務(wù)系統(tǒng)五大系統(tǒng)平臺(tái)。
7)公眾免費(fèi)服務(wù)系統(tǒng):面向公眾、考生的免費(fèi)服務(wù)子系統(tǒng),建設(shè)涵蓋成績信息、錄取信息、公示信息、證書信息等網(wǎng)絡(luò)免費(fèi)查詢的門戶網(wǎng)站,提供諸如在線訪談、博客、論壇等多種形式的各類招生考試資源、信息發(fā)布渠道,提供考生電話免費(fèi)呼叫中心,提供辦公大樓一站式窗口服務(wù)。
8)辦公電子政務(wù)系統(tǒng):面向教育考試系統(tǒng)的辦公電子政務(wù)子系統(tǒng),提供公文處理、通知收發(fā)、人力資源、綜合檔案、設(shè)備資產(chǎn)、課題成果等辦公電子管理和方便不同業(yè)務(wù)群體之間的實(shí)時(shí)交流。
9)電子支付系統(tǒng):面向報(bào)考費(fèi)用、錄取費(fèi)用、增值服務(wù)費(fèi)用的電子支付子系統(tǒng),建立與銀行的電子支付接口,實(shí)現(xiàn)所有收費(fèi)項(xiàng)目的網(wǎng)上電子支付。
10)決策分析與評價(jià)系統(tǒng):依托信息統(tǒng)計(jì)的科學(xué)決策要求,實(shí)現(xiàn)基于數(shù)據(jù)中心的考試評價(jià)體系,滿足社會(huì)、學(xué)校、地區(qū)、個(gè)人對考試評價(jià)的迫切需求。
基于云平臺(tái)的省級(jí)考試院數(shù)據(jù)中心的成功建設(shè)必將進(jìn)一步推動(dòng)江蘇省教育考試信息化進(jìn)程,提升工作效率并促進(jìn)教育考試改革,更好地服務(wù)于考生、高校、社會(huì)??梢灶A(yù)料在其建設(shè)過程中可能存在各種困難和阻力,科學(xué)規(guī)劃、分步實(shí)施,廣泛調(diào)動(dòng)各種資源是項(xiàng)目成功實(shí)施的保證。
[1]王寧,等.一種基于數(shù)據(jù)中心的政府信息資源整合系統(tǒng)架構(gòu)設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用研究,2005(9):67-71.
[2]李冬梅.統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)實(shí)現(xiàn)業(yè)務(wù)協(xié)同[J].信息技術(shù),2010(6):235-240.
[3]許鑫,蘇新寧.高校共享數(shù)據(jù)中心平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2005(6):48-53.
[4]董歡.數(shù)據(jù)挖掘技術(shù)概述[J].信息產(chǎn)業(yè),100.
[5]胡茂勝.基于數(shù)據(jù)中心模式的分布式異構(gòu)空間數(shù)據(jù)無縫集成技術(shù)研究[D].武漢:中國地質(zhì)大學(xué)(武漢),2009.
[6]張曉華,林紅,吳娟.數(shù)據(jù)中心在高校綜合信息系統(tǒng)中的作用探究——以華北電力大學(xué)(北京)校園網(wǎng)絡(luò)規(guī)劃為例[J].軟件導(dǎo)刊,2010,9(8):69-70.
[7]張錦珠.數(shù)據(jù)中心平臺(tái)的一種設(shè)計(jì)與實(shí)現(xiàn)技術(shù)探討[J].信息安全與技術(shù),2011(12):46-49.
[8]蔣菱,葉明亮.基于BP神經(jīng)網(wǎng)絡(luò)算法的數(shù)據(jù)挖掘方法研究[J].電腦編程技巧與維護(hù),2011(18):44-45.
[9]陶安,王軍武.利用虛擬磁帶庫技術(shù)實(shí)現(xiàn)異地?cái)?shù)據(jù)容災(zāi)備份[J].軟件導(dǎo)刊,2011(12):50-51.
[10]劉麗娜,于治樓,張化祥,等.一種云環(huán)境下基于Xen的分布式存儲(chǔ)模式[J].信息技術(shù)與信息化,2011(6):18-20.
[11]王濤.基于數(shù)據(jù)倉庫ETL技術(shù)的數(shù)據(jù)提取與數(shù)據(jù)轉(zhuǎn)換研究[D].吉林大學(xué).2011.
[12]戴浩.基于業(yè)務(wù)元數(shù)據(jù)的多維建模系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(24):5248-5256.
[13]林莉,傅曉娟,陳麗麗.XML數(shù)據(jù)交換技術(shù)在高校信息化中的應(yīng)用[J].信息技術(shù)與課程整合,2012,8(3):713-715.
[14]陳彩虹.國內(nèi)外元數(shù)據(jù)標(biāo)準(zhǔn)宏觀比較研究[J].河北科技圖苑,2011,24(1):65-67.
Cloud-platform Based Cata Center for Provincial Education Examination Institution:Taking Jiangsu Provincial Education Examination Authority as an Example
MA Biao and WANG Jidong
Informationization is an important means of improving the education examination management efficiency,thus promoting the reform and development of educational testing.The provincial education examination institutions undertake numerous examinations on different scales,and the coexistence of various information systems poses a higher demand for data sharing.In this paper,it proposes to establish provincial education examination authority data center to break the barriers of business and restructure the business model,aiming to establish an application platform of great reliability,high availability,high cohesion and low coupling.By referring to the reality of Jiangsu Provincial Education Examination Authority,this article explores the necessity and feasibility of data center construction,proposing a more integrated construction program.
Education Examination;Data Center;Cloud Platform;Building Programs
G405
B
1005-8427(2012)08-0034-5
江蘇省教育考試院
南京信息工程大學(xué)