劉 鵬,李 丹,孫思邈,黃 新,閆朝升
(1.黑龍江中醫(yī)藥大學人事處,黑龍江哈爾濱 150040;2.黑龍江中醫(yī)藥大學現(xiàn)代教育技術(shù)與信息中心,黑龍江哈爾濱 150040;3.黑龍江中醫(yī)藥大學醫(yī)學信息工程學院,黑龍江哈爾濱 150040)
教育大計,教師為本。全面加強教師隊伍建設(shè)已成為一項重大政治任務(wù)和根本性民生工程[1]。高校師資管理工作在教師隊伍建設(shè)中占有極其重要的地位。面對知識經(jīng)濟時代,對于高校師資管理,應(yīng)積極運用現(xiàn)代信息技術(shù),探尋師資管理決策支持的有效實現(xiàn)途徑,為教師隊伍建設(shè)提供科學依據(jù)。隨著數(shù)據(jù)分析、數(shù)據(jù)挖掘、大數(shù)據(jù)等前沿信息技術(shù)的飛速發(fā)展及其應(yīng)用日趨廣泛,我國加大了師資管理信息化的重視度,為師資的管理工作及其隊伍建設(shè)提出了更高要求[2]。目前,高校紛紛開展了人事管理信息化建設(shè),應(yīng)用了人事管理信息系統(tǒng),提高了師資隊伍管理工作水平,積累了大量歷史性、細節(jié)性的師資建設(shè)數(shù)據(jù)[3-8]。在此基礎(chǔ)上,面對師資管理決策支持需求,將數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等前沿信息技術(shù)應(yīng)用于高校師資管理工作,旨在發(fā)現(xiàn)隱藏的、有價值的師資隊伍信息,為科學決策提供可靠依據(jù)[9-12]。
聯(lián)機分析處理(On-Line Analytical Processing,OLAP)利用上卷、下鉆、切片、切塊、旋轉(zhuǎn)等操作,從數(shù)據(jù)倉庫(或數(shù)據(jù)集市)中,快速、一致和交互地獲取多維度、多層次的觀測指標(即度量)數(shù)值,為用戶提供隱藏的、有價值的信息,進一步為數(shù)據(jù)挖掘、機器學習等過程提供數(shù)據(jù)預處理結(jié)果,以便發(fā)現(xiàn)更深層次、更有價值的知識[13]。目前,一些研究者已將OLAP 技術(shù)應(yīng)用到教學質(zhì)量、學生行為、教學狀況、招生就業(yè)等領(lǐng)域,驗證了基于OLAP 數(shù)據(jù)分析處理的快速性、便捷性和互動性[13-18]。如何有效地利用OLAP 技術(shù),從大量的師資管理事務(wù)數(shù)據(jù)中,快速、便捷地發(fā)現(xiàn)隱藏的、有價值的師資隊伍信息,深度、全面、準確地把握師資隊伍建設(shè)狀況,支持科學、及時、準確的師資隊伍建設(shè)決策,成為高校師資管理工作的重要任務(wù)。因此,文中提出了基于OLAP 的高校師資數(shù)據(jù)分析處理系統(tǒng)。該系統(tǒng)具有開發(fā)周期短、開發(fā)成本低、運行維護便捷等特點,為其他職能部門的OLAP 系統(tǒng)設(shè)計與實現(xiàn)提供一種可行高效的方案與途徑。
該系統(tǒng)采用C/S(客戶機/服務(wù)器,Client/Server)模式,設(shè)計了高校師資數(shù)據(jù)聯(lián)機分析處理系統(tǒng)的體系結(jié)構(gòu),如圖1 所示。選擇C/S 模式的原因主要包括四方面。其一,系統(tǒng)用戶范疇主要界定為校領(lǐng)導、人事管理部門領(lǐng)導以及師資管理干事等三類人員,重點解決師資數(shù)據(jù)的多維分析需求。其二,基于C/S 模式的系統(tǒng)具有開發(fā)周期短、調(diào)試容易、網(wǎng)絡(luò)依賴度低等優(yōu)勢。其三,系統(tǒng)的數(shù)據(jù)存儲環(huán)境易在局域網(wǎng)內(nèi)進行部署。其四,系統(tǒng)屬于分析型系統(tǒng),其使用的頻繁度低于操作型事務(wù)系統(tǒng)。
圖1 系統(tǒng)體系結(jié)構(gòu)
由圖1 可知,系統(tǒng)的體系結(jié)構(gòu)包括3 個層次,即客戶端、應(yīng)用服務(wù)端和數(shù)據(jù)服務(wù)端。作為用戶與系統(tǒng)交互的前臺接口,客戶端提供前端界面,調(diào)用應(yīng)用服務(wù)端的功能模塊。其中,多維分析界面用于生成和發(fā)送多維分析要求以及顯示分析結(jié)果信息,主要包括分析要求生成和分析結(jié)果顯示兩個子區(qū)域。上述兩個子區(qū)域分別對應(yīng)著“維度和度量”選擇區(qū)和“多維數(shù)據(jù)表”顯示區(qū)。用戶利用多維分析要求生成子區(qū)域,選定維度、層次和度量,生成分析要求并將其發(fā)送給應(yīng)用服務(wù)端。分析結(jié)果顯示子區(qū)域能夠多維多層地顯示應(yīng)用服務(wù)端返回的結(jié)果信息,并進一步生成和發(fā)送分析要求(即用戶可以在分析結(jié)果顯示子區(qū)域中,通過鼠標的單擊操作,快速生成新的分析要求)。應(yīng)用服務(wù)端是后臺數(shù)據(jù)服務(wù)端和前端界面之間的溝通橋梁,主要包括多維分析、結(jié)果輸出、數(shù)據(jù)加載和系統(tǒng)維護等功能模塊。作為系統(tǒng)的后臺數(shù)據(jù)存儲環(huán)境,數(shù)據(jù)服務(wù)端存儲著數(shù)據(jù)集市,為應(yīng)用服務(wù)端提供多維度、綜合、緊湊的數(shù)據(jù)源。另外,為了支持系統(tǒng)管理,數(shù)據(jù)集市存儲著系統(tǒng)維護的相關(guān)數(shù)據(jù),如用戶基本信息、數(shù)據(jù)加載日志等。
系統(tǒng)功能模塊主要包括多維分析模塊、結(jié)果輸出模塊、數(shù)據(jù)加載模塊和系統(tǒng)維護模塊等。
1)多維分析模塊:用于接收客戶端的分析要求,調(diào)用上卷、下鉆、切片、切塊、旋轉(zhuǎn)等OLAP 操作子模塊,生成查詢要求并將其發(fā)送給數(shù)據(jù)服務(wù)端,以及接收數(shù)據(jù)服務(wù)端返回的結(jié)果(即多維數(shù)據(jù)集)并將其發(fā)送至客戶端,顯示多維分析結(jié)果。
2)數(shù)據(jù)加載模塊:用于將外部數(shù)據(jù)源(如人事管理系統(tǒng)的后臺數(shù)據(jù)庫、Excel 數(shù)據(jù)文件等)的數(shù)據(jù),通過抽取、轉(zhuǎn)換和載入(Extract-Transform-Load,ETL)過程,生成多維度、多層次的聚合數(shù)據(jù),存入數(shù)據(jù)服務(wù)端的數(shù)據(jù)集市,生成數(shù)據(jù)加載日志。
3)結(jié)果輸出模塊:用于接收客戶端的輸出要求,生成Excel 文件,導出分析結(jié)果。
4)系統(tǒng)維護模塊:用于管理用戶基本信息、查閱數(shù)據(jù)加載日志、備份與恢復后臺數(shù)據(jù)等。
作為決策支持后臺的兩類數(shù)據(jù)存儲環(huán)境,數(shù)據(jù)倉庫(Data Warehouse)和數(shù)據(jù)集市(Data Mart)在信息需求和開發(fā)方法等方面存在著區(qū)別[13]。文中采用獨立數(shù)據(jù)集市,構(gòu)建系統(tǒng)的后臺數(shù)據(jù)環(huán)境。上述選擇的主要原因在于:一方面,數(shù)據(jù)集市的多維結(jié)構(gòu)能夠保證OLAP 操作與后臺數(shù)據(jù)存儲環(huán)境之間的有效銜接[19];另一方面,獨立數(shù)據(jù)集市可以由特定部門直接創(chuàng)建,而無需以數(shù)據(jù)倉庫為前提,降低了數(shù)據(jù)存儲環(huán)境構(gòu)建費用,縮短了系統(tǒng)開發(fā)周期,有助于快速、高效地構(gòu)建后臺數(shù)據(jù)存儲環(huán)境。
為了保障師資(尤其專任教師)隊伍建設(shè)決策的科學性、合理性和可行性,高校師資管理決策者所需進行的多維分析主要包括以專任教師數(shù)量和比例為目標值(即度量值),在年齡、學歷、職稱、學緣等基本要素維度上的分布情況分析以及多維組合分析,在教師狀態(tài)、學科、系列、性別等開放性維度上的變化情況分析以及多維組合分析,在時間維度上的多層次(如近1 年、3 年、5 年等)變化情況分析以及基于基本要素維度、開放性維度和時間維度的組合分析。依據(jù)上述的高校師資管理決策多維分析特點,文中設(shè)計了3 類維度,如表1 所示。
表1 高校師資數(shù)據(jù)分析的維度設(shè)計表
在上述的維度設(shè)計基礎(chǔ)上,該系統(tǒng)設(shè)計了基于星形模型的師資數(shù)據(jù)集市多維數(shù)據(jù)結(jié)構(gòu),如圖2 所示。該模型以事實表為中心,包含職稱、學歷、系列、學緣、年齡、學科、狀態(tài)、性別、時間9 個維度表。每一個維度表對應(yīng)一個維度。事實表由每個維度表的外鍵(包括職稱碼、學歷碼、系列碼、學緣碼、年齡碼、學科碼、狀態(tài)碼、性別碼、時間碼等)和度量(包括人數(shù)和百分比)組成,支撐師資數(shù)據(jù)分析的多維性、多層性和快速性。其中,外鍵能夠連接維度表和事實表,支撐多維度、多層次的師資數(shù)據(jù)訪問。
圖2 數(shù)據(jù)集市的星形模型
圖3 給出了部分維度的層次設(shè)計情況。以“學科”維度為例,該維度分為三層,依次為頂層(即學科維度)、學科門類層和一級學科層。“系列”、“性別”和“時間”維度未進行分層處理。其中,“系列”維度具體包括教師、衛(wèi)生、研究、實驗技術(shù)、工程技術(shù)、圖書資料、出版、檔案、會計、審計、統(tǒng)計等成員;“性別”維度包括男和女兩個成員;“時間”維度包括近10 年的具體年份。
圖3 部分維度的層次設(shè)計
通過上述設(shè)計,師資數(shù)據(jù)集市能夠支持9 個維度及其不同層次的度量值存儲和訪問,滿足多維度、多層次的數(shù)據(jù)分析需求。
為降低系統(tǒng)存儲空間消耗和系統(tǒng)維護復雜度,數(shù)據(jù)服務(wù)端不負責存儲細節(jié)性師資歷史數(shù)據(jù)。根據(jù)數(shù)據(jù)集市的多維數(shù)據(jù)模型,該系統(tǒng)利用人事管理系統(tǒng)的后臺數(shù)據(jù)庫、Excel 數(shù)據(jù)文件等外部數(shù)據(jù)源,通過數(shù)據(jù)抽取、轉(zhuǎn)換和載入,完成數(shù)據(jù)集市的數(shù)據(jù)加載。
針對職稱、學歷、系列、學緣、年齡、學科、狀態(tài)、性別、時間9 個維度,該系統(tǒng)調(diào)用與人事管理系統(tǒng)之間的接口程序,訪問人事管理系統(tǒng)的后臺數(shù)據(jù)庫,獲取相應(yīng)字段的師資數(shù)據(jù)(見表2),生成細節(jié)性數(shù)據(jù)集,完成數(shù)據(jù)抽取。之后,根據(jù)維度表的內(nèi)容以及事實表的外鍵和度量,聚合細節(jié)性數(shù)據(jù),生成多維度、多層次的匯總性數(shù)據(jù)集,完成數(shù)據(jù)轉(zhuǎn)換。最后,將上述匯總性數(shù)據(jù)集存入數(shù)據(jù)集市的事實表,完成數(shù)據(jù)載入。
表2 維度與源字段的對應(yīng)關(guān)系表
上述數(shù)據(jù)加載可以采用定期增量加載和事件觸發(fā)加載兩種模式。前者是指在特定時間(如一年)自動(或管理員手動)調(diào)用數(shù)據(jù)加載功能,利用外部數(shù)據(jù)源生成匯總性數(shù)據(jù),并載入數(shù)據(jù)集市。后者是指通過在人事管理系統(tǒng)后臺數(shù)據(jù)庫的關(guān)系上定義觸發(fā)器,針對數(shù)據(jù)更新和插入操作(分別對應(yīng)著更新觸發(fā)器和插入觸發(fā)器),在職稱晉升、新教師入職等事務(wù)發(fā)生時,執(zhí)行數(shù)據(jù)加載,更新數(shù)據(jù)集市。后一種模式需要完善現(xiàn)有人事管理系統(tǒng)。因此,該系統(tǒng)采用定期增量加載模式。
該系統(tǒng)的實現(xiàn)采用了Visual Basic 6.0和Microsoft SQL Server 2008。
圖4 給出了“師資數(shù)據(jù)多維分析”界面,包含“維度和度量”選擇區(qū)和“多維數(shù)據(jù)表”顯示區(qū)。用戶在“維度和度量”選擇區(qū),選定維度層次以及度量,并單擊【分析】按鈕。之后,系統(tǒng)將調(diào)用“維度顯示順序設(shè)置”界面,用于確定所選維度在多維數(shù)據(jù)表中的先后次序,如圖5 所示。根據(jù)顯示順序的選定情況,多維數(shù)據(jù)表將依次顯示學歷維、職稱維以及人數(shù)、百分比。最后,用戶單擊【確定】按鈕,獲取多維分析結(jié)果,詳見圖4 所示的多維數(shù)據(jù)表。該多維數(shù)據(jù)表呈現(xiàn)了“學歷維的一級層次→職稱維的二級層次”、近1年的專任教師人數(shù)和百分比情況。其中,在多維數(shù)據(jù)表的度量值中,“—”用于表示0 和0%狀態(tài)下的人數(shù)和百分比。通過圖4 所示的多維數(shù)據(jù)表,用戶可以獲取“研究生學歷→具體職稱級”的人數(shù)與百分比情況,如近1 年的“研究生→正高”和“研究生→副高”專任教師人數(shù)226 和326 以及百分比20.58%和29.69%。
圖4 系統(tǒng)多維分析界面(1)
圖5 維度顯示順序設(shè)置界面
在多維數(shù)據(jù)表中,維度項前面的“+”和“-”表征用戶可以在該維度項上進行下鉆和上卷操作,獲取更為豐富的分析結(jié)果。例如,在圖4 所示的多維數(shù)據(jù)表中,用戶可以分別單擊“+研究生”和“+非研究生”項,進行“學歷”維的下鉆操作,獲取“學位→具體職稱”的人數(shù)和百分比結(jié)果,如圖6 所示;或者用戶可以分別單擊“-高級”和“-非高級”,進行“職稱”維的上卷操作,獲取“研究生”和“非研究生”學歷維度層次上的“高級”和“非高級”職稱的人數(shù)與百分比匯總情況。
圖6 系統(tǒng)多維分析界面(2)
通過圖4 和圖6 對比,用戶可以根據(jù)近1 年的“研究生→正高”專任教師人數(shù)226 進一步發(fā)現(xiàn),近1年的“博士→正高”、“碩士→正高”專任教師人數(shù)分別為158 和68,且前者是后者的兩倍以上。借助圖6 用戶可以發(fā)現(xiàn),百分比居前三的分別是“博士→副高”(22.22%)、“碩士→中級”(21.31%)、“博士→正高”(14.39%)。
另外,“維度顯示順序設(shè)置”界面可以用于實現(xiàn)旋轉(zhuǎn)操作。在“維度和度量”選擇區(qū)結(jié)果未變化情況下,用戶可以利用“維度顯示順序設(shè)置”界面,調(diào)整維度先后次序,形成旋轉(zhuǎn)要求。例如,針對圖6 的多維數(shù)據(jù)表,用戶能夠發(fā)現(xiàn)“博士→正高”、“碩士→正高”、“學士→正高”的專任教師人數(shù)分布差異。鑒于上述的多維分析順序?qū)е氯椂攘恐颠^于分散而不利于結(jié)果的觀察,用戶可以利用“維度顯示順序設(shè)置”界面,調(diào)整維度顯示順序(即“職稱→學歷”),集中“正高→博士”、“正高→碩士”、“正高→學士”的度量值,提高多維度、多層次分析結(jié)果觀察的便捷性,有助于發(fā)現(xiàn)更有價值的師資隊伍信息。
師資隊伍建設(shè)是高校高質(zhì)量發(fā)展的基石。文中針對高校師資管理決策支持工作,提出了基于C/S 模式和獨立數(shù)據(jù)集市的高校師資數(shù)據(jù)聯(lián)機分析處理系統(tǒng)設(shè)計方案,形成了實現(xiàn)途徑。該系統(tǒng)能夠快速、便捷地發(fā)現(xiàn)隱藏的、有價值的師資隊伍信息,為高校師資隊伍建設(shè)提供可靠的科學決策依據(jù),并為部門級的聯(lián)機分析處理系統(tǒng)及其分析型數(shù)據(jù)環(huán)境的構(gòu)建提供有益借鑒。