孫曉磊,馮 濤,李 朋,李亞娟,張金芳
(1.河北水利電力學(xué)院教務(wù)處,河北省滄州市重慶路1號(hào) 061001; 2.河北水利電力學(xué)院計(jì)算機(jī)科學(xué)與信息工程學(xué)院,河北省滄州市重慶路1號(hào) 061001)
信息技術(shù)的飛速發(fā)展對(duì)生產(chǎn)、生活和學(xué)習(xí)等方方面面都產(chǎn)生了巨大的影響,目前,大部分高校都已經(jīng)建立了適合自己業(yè)務(wù)的信息管理系統(tǒng),比如教務(wù)系統(tǒng)、辦公系統(tǒng)、財(cái)務(wù)系統(tǒng)、科研系統(tǒng)等[1][2]。信息技術(shù)已經(jīng)對(duì)高校管理工作帶來(lái)了極大便利,提高了工作效率。
隨著業(yè)務(wù)逐漸增加,高校引入更多的信息系統(tǒng)來(lái)輔助和推進(jìn)工作,愈來(lái)愈依賴信息系統(tǒng),同時(shí),一些問(wèn)題也慢慢凸顯出來(lái)。這些系統(tǒng)基本上都是獨(dú)立存在的,盡管這些系統(tǒng)可能同時(shí)需要一些共同的數(shù)據(jù)信息,但是基本上都是通過(guò)人工轉(zhuǎn)換、導(dǎo)入導(dǎo)出等方式來(lái)實(shí)現(xiàn)基本數(shù)據(jù)的共享,信息傳遞過(guò)程中,可能造成數(shù)據(jù)的不準(zhǔn)確性、數(shù)據(jù)更新和變動(dòng)的滯后性等問(wèn)題。并且這些信息系統(tǒng)沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),后臺(tái)數(shù)據(jù)庫(kù)不同,數(shù)據(jù)格式也不相同,如果實(shí)現(xiàn)數(shù)據(jù)信息共享,難度很大。比如,在新生入學(xué)時(shí),教務(wù)系統(tǒng)會(huì)獲取學(xué)生的基本信息,這些信息是比較準(zhǔn)確的,而其他系統(tǒng)中也有可能會(huì)用到學(xué)生信息,例如高校的財(cái)務(wù)系統(tǒng)需要學(xué)生相關(guān)信息來(lái)統(tǒng)計(jì)繳納學(xué)費(fèi)等情況,財(cái)務(wù)系統(tǒng)中的學(xué)生數(shù)據(jù)應(yīng)該和教務(wù)系統(tǒng)中的數(shù)據(jù)相同。如果這兩個(gè)系統(tǒng)不能實(shí)現(xiàn)數(shù)據(jù)的共享或者數(shù)據(jù)的同步更新,長(zhǎng)此以往,將不利于后續(xù)的數(shù)據(jù)統(tǒng)計(jì)和分析等操作,逐漸形成信息的“孤島現(xiàn)象”[3],管理系統(tǒng)之間的數(shù)據(jù)不能得到最大化的利用和整合。因此,如何高效的使用高校管理系統(tǒng)中的數(shù)據(jù)信息,并實(shí)現(xiàn)數(shù)據(jù)之間的共享和利用也就成為目前亟待解決的問(wèn)題。
當(dāng)前,各大高校使用的信息系統(tǒng)按照用途有以下幾種類(lèi)型:
教學(xué)管理類(lèi):教務(wù)管理系統(tǒng)、考勤管理系統(tǒng)、實(shí)踐教學(xué)管理系統(tǒng)、圖書(shū)館管理系統(tǒng)等。
教學(xué)輔助類(lèi):網(wǎng)絡(luò)教學(xué)平臺(tái)、視頻制作播放平臺(tái)等[4]。
后勤服務(wù)類(lèi):校園一卡通系統(tǒng)、后勤管理系統(tǒng)等。
行政管理類(lèi):OA系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、人事管理系統(tǒng)、科研管理系統(tǒng)等。
使用這些信息系統(tǒng)來(lái)輔助教學(xué)管理工作,有效地提高了工作效率,但隨著高校對(duì)信息系統(tǒng)的依賴性的增強(qiáng),越來(lái)越多的信息系統(tǒng)被引入和使用。因此,也帶來(lái)了一些弊端?,F(xiàn)如今,高校的信息系統(tǒng)存在以下問(wèn)題。
(1)高校采用的信息系統(tǒng)眾多,使用的后臺(tái)數(shù)據(jù)庫(kù)、開(kāi)發(fā)工具各不相同,采用的數(shù)據(jù)格式也不盡相同。
(2)高校相關(guān)部門(mén)在采用該信息系統(tǒng)時(shí),考慮更多的是如何更加方便自己的業(yè)務(wù)管理,對(duì)于信息共享等方面考慮較少。多個(gè)信息系統(tǒng)之間基本上也沒(méi)有數(shù)據(jù)的共享,但是卻又對(duì)同一信息有管理和使用權(quán),比如,考勤管理系統(tǒng)和教務(wù)系統(tǒng)中都存在著學(xué)生信息管理的功能。
(3)大部分信息系統(tǒng)都是基于信息的管理[4]。
針對(duì)上述問(wèn)題,大部分高校采取的辦法和措施主要有虛擬數(shù)據(jù)模式和數(shù)據(jù)倉(cāng)庫(kù)兩種模式[5]。虛擬數(shù)據(jù)模式提供異構(gòu)統(tǒng)一的全局邏輯視圖將底層的詳細(xì)數(shù)據(jù)屏蔽掉,使得用戶可以像對(duì)待一個(gè)數(shù)據(jù)源那樣對(duì)多個(gè)數(shù)據(jù)源實(shí)時(shí)查詢和處理,同時(shí)保持?jǐn)?shù)據(jù)源各自的獨(dú)立性和完整性[5];數(shù)據(jù)倉(cāng)庫(kù)模式將不同數(shù)據(jù)庫(kù)中大量分散的數(shù)據(jù)經(jīng)過(guò)ETL環(huán)節(jié)[6-7]抽
圖1 ETL結(jié)構(gòu)圖
取、清洗、處理到一個(gè)數(shù)據(jù)倉(cāng)庫(kù)中,其他信息系統(tǒng)或用戶可以像訪問(wèn)普通數(shù)據(jù)庫(kù)一樣來(lái)訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),抽取的數(shù)據(jù)需要轉(zhuǎn)換成數(shù)據(jù)倉(cāng)庫(kù)模式才可以存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)[2][8],其ETL結(jié)構(gòu)如圖1所示。虛擬數(shù)據(jù)模式和數(shù)據(jù)倉(cāng)庫(kù)模式是基于全局?jǐn)?shù)據(jù)模型或者通過(guò)直接將需要的數(shù)據(jù)通過(guò)數(shù)據(jù)復(fù)制或遷移手段存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)的方式完成數(shù)據(jù)集成和共享的。
本校需要數(shù)據(jù)交互的軟件主要有實(shí)踐教學(xué)管理系統(tǒng)、財(cái)務(wù)軟件系統(tǒng)、科研管理系統(tǒng)、教務(wù)管理系統(tǒng)、圖書(shū)管理系統(tǒng)、一卡通、雨課堂、OA系統(tǒng)、學(xué)生考勤管理系統(tǒng)等。這些信息系統(tǒng)軟件的數(shù)據(jù)比較分散,系統(tǒng)之間交換數(shù)據(jù)比較困難。如果需要對(duì)方的數(shù)據(jù),通常都是進(jìn)行excel或者文本方式的傳輸,這種傳輸方式效率很低,并且數(shù)據(jù)不準(zhǔn)確、易出錯(cuò)。如果數(shù)據(jù)源更新,不能在第一時(shí)間進(jìn)行同步和獲取實(shí)時(shí)數(shù)據(jù),導(dǎo)致這些數(shù)據(jù)形成了信息孤島,不能很好的形成數(shù)據(jù)共享。
因此對(duì)校內(nèi)的部分信息系統(tǒng)的相關(guān)信息進(jìn)行了調(diào)查和分析,旨在保持原有系統(tǒng)的繼續(xù)使用,在此基礎(chǔ)上,根據(jù)不同系統(tǒng)軟件來(lái)規(guī)劃和設(shè)計(jì)獲取數(shù)據(jù)和更新數(shù)據(jù)的方法[8]。如表1所示。
表1 本校信息系統(tǒng)相關(guān)信息
本校的公共數(shù)據(jù)眾多,目前列出主要的幾種公共數(shù)據(jù)集。
(1)學(xué)生信息
高校管理中,最主要的一個(gè)群體就是學(xué)生,高校管理系統(tǒng)中,比如實(shí)踐教學(xué)管理系統(tǒng)、學(xué)生考勤管理系統(tǒng)、教務(wù)管理系統(tǒng)、圖書(shū)管理系統(tǒng)、一卡通、雨課堂等信息系統(tǒng)都是針對(duì)學(xué)生的管理。這些系統(tǒng)中都需要學(xué)生信息,使用率很高,但是需要一個(gè)統(tǒng)一的信息來(lái)源,根據(jù)本校的實(shí)際情況,學(xué)生信息主要來(lái)源可以是教務(wù)管理系統(tǒng)或一卡通。其中圖書(shū)管理系統(tǒng)從一卡通中抽取學(xué)生信息,而學(xué)生考勤管理系統(tǒng)、實(shí)踐教學(xué)管理系統(tǒng)、雨課堂、財(cái)務(wù)軟件系統(tǒng)從教務(wù)管理系統(tǒng)中讀取學(xué)生信息。
(2)教師信息
除了學(xué)生之外,在高校管理中,另外一個(gè)主體就是教師,比如,教務(wù)管理系統(tǒng)、科研管理系統(tǒng)、財(cái)務(wù)管理系統(tǒng)等都與教師相關(guān),因此教師信息的使用率也很高。教工信息包括教師的職工號(hào)、研究方向、最高學(xué)歷、職稱、職務(wù)等基本信息。由于本校無(wú)人事管理系統(tǒng),所以教師信息主要由科研管理系統(tǒng)和教務(wù)系統(tǒng)共同提供。
(3)上課信息
上課信息主要包括學(xué)生選課情況、學(xué)生課表、學(xué)生成績(jī)、教師課表、教師調(diào)停課信息等等。上課信息是高校最主要的任務(wù),也是教學(xué)質(zhì)量監(jiān)督的重要依據(jù),影響著高校的很多決策。本校使用教務(wù)管理系統(tǒng)來(lái)對(duì)教學(xué)進(jìn)行管理和運(yùn)行,因此上課信息的主要來(lái)源是教務(wù)管理系統(tǒng)[9]。本校主要有學(xué)生考勤管理系統(tǒng)和雨課堂兩個(gè)信息系統(tǒng)需要從教務(wù)系統(tǒng)中讀取上課信息。
(4)專業(yè)班級(jí)信息
本校存在學(xué)生轉(zhuǎn)專業(yè)、專接本、大類(lèi)招生等,這些情況都會(huì)使專業(yè)班級(jí)信息發(fā)生變動(dòng),實(shí)踐教學(xué)管理系統(tǒng)、雨課堂、學(xué)生考勤管理系統(tǒng)需要從教務(wù)系統(tǒng)中獲取專業(yè)班級(jí)信息。
很多系統(tǒng)軟件可以通過(guò)訪問(wèn)和查詢某一軟件系統(tǒng)創(chuàng)建的數(shù)據(jù)庫(kù)視圖來(lái)實(shí)現(xiàn)數(shù)據(jù)的共享[6]。教務(wù)管理系統(tǒng)采用了Oracle數(shù)據(jù)庫(kù),在該數(shù)據(jù)庫(kù)上建立共享用戶,并授予部分基本信息視圖的查詢、讀取等權(quán)限。在獲取數(shù)據(jù)的目的系統(tǒng),通過(guò)共享用戶對(duì)基本信息視圖進(jìn)行查詢和讀取[4]。
例如,教務(wù)管理系統(tǒng)是Oracle數(shù)據(jù)庫(kù),考勤管理系統(tǒng)是MySql數(shù)據(jù)庫(kù),在教務(wù)系統(tǒng)的數(shù)據(jù)庫(kù)中新建用戶kad,賦予查詢、讀取權(quán)限,同時(shí)創(chuàng)建xsxx(學(xué)生信息)、jsxx(教師信息)、kcb(課程表)等視圖??记诠芾硐到y(tǒng)運(yùn)行時(shí),需要訪問(wèn)kad用戶下的xsxx、jsxx、kcb來(lái)獲取需要的數(shù)據(jù),并將讀取的信息進(jìn)行計(jì)算,成為自己數(shù)據(jù)庫(kù)中的數(shù)據(jù)。
學(xué)生退學(xué)、留級(jí)、新生入學(xué),教師入職、教師更換部門(mén),課程調(diào)整、更改,這些數(shù)據(jù)源信息一直變動(dòng),作為獲取這些數(shù)據(jù)的信息系統(tǒng)來(lái)說(shuō),需要更新后的數(shù)據(jù)來(lái)保證數(shù)據(jù)的一致性和準(zhǔn)確性。在數(shù)據(jù)同步時(shí),結(jié)合本校的實(shí)際情況采用以下方法來(lái)實(shí)現(xiàn)。
圖2 數(shù)據(jù)獲取方法
(1)同構(gòu)數(shù)據(jù)庫(kù)中,采用觸發(fā)器方式,一旦源數(shù)據(jù)有更新,則將更新的數(shù)據(jù)傳遞到另一端。比如一卡通系統(tǒng)和圖書(shū)管理系統(tǒng)系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)都在Oracle數(shù)據(jù)庫(kù)上,圖書(shū)系統(tǒng)需要學(xué)生的相關(guān)信息,那么一卡通系統(tǒng)可以在數(shù)據(jù)庫(kù)中建立學(xué)生信息視圖,圖書(shū)管理系統(tǒng)可以調(diào)用一卡通系統(tǒng)中的視圖來(lái)完成一系列操作。如果一卡通中的學(xué)生信息有更新,那么需要在學(xué)生信息表上建立相應(yīng)的觸發(fā)器,可以將變動(dòng)的內(nèi)容觸發(fā)到圖書(shū)管理系統(tǒng)中相應(yīng)的表中[4]。
(2)在異構(gòu)數(shù)據(jù)庫(kù)中,例如考勤系統(tǒng)的數(shù)據(jù)庫(kù)是MySql,教務(wù)系統(tǒng)的數(shù)據(jù)庫(kù)是Oracle。對(duì)于不同數(shù)據(jù)庫(kù)的信息系統(tǒng)之間的數(shù)據(jù)傳遞,需要采用以下方法進(jìn)行更新。
①全部更新
即使數(shù)據(jù)源的部分內(nèi)容有變動(dòng)或更新,目標(biāo)數(shù)據(jù)庫(kù)仍然抽取數(shù)據(jù)源中所需表格(或視圖)中的所有內(nèi)容[8]。這種方法能夠確保數(shù)據(jù)源的數(shù)據(jù)和目標(biāo)數(shù)據(jù)庫(kù)中的數(shù)據(jù)完全一致,準(zhǔn)確率很高。但是抽取全部數(shù)據(jù)會(huì)涉及大量的數(shù)據(jù),消耗大量的資源和時(shí)間,并且對(duì)服務(wù)器配置和性能要求很高。
②增量更新
增量更新是指僅對(duì)發(fā)生改變的那部分內(nèi)容抽取到目標(biāo)數(shù)據(jù)庫(kù)中,增量更新減輕了服務(wù)器端的負(fù)擔(dān)。
本校采用增量更新來(lái)進(jìn)行數(shù)據(jù)的同步更新??记诠芾硐到y(tǒng)需要從教務(wù)系統(tǒng)中獲取學(xué)生信息、教師信息、課程信息等,其中課程信息涉及到上課時(shí)間、地點(diǎn)和任課教師等,其中課程信息變動(dòng)頻率較高,數(shù)據(jù)量也較大,所以需要定時(shí)對(duì)視圖中變動(dòng)的那部分內(nèi)容進(jìn)行重新讀取,此時(shí)需要設(shè)置定時(shí)任務(wù),例如設(shè)置每天在特定的一個(gè)時(shí)間點(diǎn)(盡量晚上時(shí)間)進(jìn)行數(shù)據(jù)的更新和同步。
此外,有的數(shù)據(jù)變動(dòng)較少,比如實(shí)踐教學(xué)管理系統(tǒng)等軟件從數(shù)據(jù)源中讀取原始數(shù)據(jù)以后,如果期間有數(shù)據(jù)的更新,則僅僅需要在該系統(tǒng)的編輯界面上進(jìn)行增刪等操作即可。實(shí)踐教學(xué)管理系統(tǒng)在本校剛引進(jìn),處于初級(jí)階段,功能少,需要數(shù)據(jù)源中的學(xué)生信息、教師信息,那么針對(duì)這些信息而言,變動(dòng)比較少,所以可以選擇直接在編輯頁(yè)面進(jìn)行修改;雨課堂需要從數(shù)據(jù)源中獲取學(xué)生信息、教師信息、班級(jí)信息,針對(duì)班級(jí)信息的變動(dòng),也選擇在雨課堂的編輯頁(yè)面進(jìn)行修改,這種方式更有效,可以減輕每次都需要將所有信息在后臺(tái)更新帶來(lái)的負(fù)擔(dān)。
通過(guò)采用上述建立虛擬視圖和更新數(shù)據(jù)的方法,提高了工作效率,首先不需要每次提供文本或excel文件,再次,如果有數(shù)據(jù)更新,也不需要時(shí)刻將更新的數(shù)據(jù)提供給其他信息系統(tǒng),節(jié)省了大量時(shí)間。
目前高校的數(shù)據(jù)共享方式多樣化,沒(méi)有一個(gè)規(guī)范化的方式,缺點(diǎn)是雜亂無(wú)章,數(shù)據(jù)可靠性太低,當(dāng)下數(shù)據(jù)量不多的情況還能應(yīng)付。但是學(xué)校規(guī)模在逐步擴(kuò)大,隨之,管理要求也會(huì)提高,部門(mén)之間的聯(lián)系越來(lái)越緊密,軟件之間的數(shù)據(jù)共享會(huì)越來(lái)越多,我們?cè)谠械哪J缴线€需要進(jìn)一步規(guī)劃和設(shè)計(jì),結(jié)合當(dāng)下的新技術(shù)將所有基礎(chǔ)數(shù)據(jù)抽取出來(lái)進(jìn)行整合,建立一個(gè)統(tǒng)一的數(shù)據(jù)共享平臺(tái),使各學(xué)院和職能部門(mén)都能進(jìn)行訪問(wèn)和讀取,同時(shí)可以建立外部接口,供外部用戶查詢公共信息,進(jìn)一步實(shí)現(xiàn)信息化資源共享[8]。