嚴衛(wèi)
(常熟理工學(xué)院計算機科學(xué)與工程學(xué)院,江蘇常熟 215500)
基于數(shù)據(jù)倉庫的高校就業(yè)信息管理系統(tǒng)
嚴衛(wèi)
(常熟理工學(xué)院計算機科學(xué)與工程學(xué)院,江蘇常熟 215500)
在現(xiàn)有的高校學(xué)生就業(yè)信息管理系統(tǒng)基礎(chǔ)上,增設(shè)了就業(yè)信息數(shù)據(jù)分析模塊,該模塊具有基本信息管理、后臺信息管理、維度分析、就業(yè)趨勢預(yù)測等功能.利用SQL Server 2005數(shù)據(jù)倉庫技術(shù)創(chuàng)建多維數(shù)據(jù)模型,實現(xiàn)多維分析.
就業(yè);模塊;數(shù)據(jù)倉庫
原就業(yè)信息管理系統(tǒng)作為就業(yè)平臺,主要是獲取信息和發(fā)布信息,功能比較簡單.筆者在現(xiàn)有的系統(tǒng)上開發(fā)了一個數(shù)據(jù)分析模塊,運用數(shù)據(jù)倉庫及OLAP技術(shù)對高校就業(yè)信息數(shù)據(jù)進行分析和處理,增強高校就業(yè)信息管理系統(tǒng)處理分析數(shù)據(jù)的功能.
1.1 高校就業(yè)信息管理系統(tǒng)的功能結(jié)構(gòu)
現(xiàn)有的高校就業(yè)信息管理系統(tǒng)由角色權(quán)限管理,單位信息管理,招聘信息管理,學(xué)生信息管理,供需見面會管理,校園專場招聘管理,信息發(fā)布新聞管理,專家?guī)旃芾淼炔糠謽?gòu)成.增設(shè)就業(yè)信息數(shù)據(jù)分析模塊后的高校就業(yè)信息管理系統(tǒng)功能結(jié)構(gòu)如圖1所示.
1.2 就業(yè)信息數(shù)據(jù)分析模塊的功能結(jié)構(gòu)
高校就業(yè)信息分析模塊的功能包括基本信息管理、后臺信息管理,維度分析以及就業(yè)趨勢四部分(如圖2).
(1)基本信息管理:主要包括單位性質(zhì)、就業(yè)行業(yè)信息、就業(yè)分布信息、教育情況信息、學(xué)生基本情況等信息的管理操作.
(2)后臺信息管理:主要是管理員對于已審核通過的用戶做權(quán)限增加或減少的設(shè)置以及賬號管理等操作.
(3)維度分析:按照實際需求情況,對數(shù)據(jù)進行多方位的維度分析,最后以報表的形式展現(xiàn)出來.
(4)就業(yè)趨勢預(yù)測:詳細分析就業(yè)信息,通過數(shù)據(jù)導(dǎo)航和靈活的OLAP分析對其進行趨勢預(yù)測.
圖1 高校就業(yè)信息管理系統(tǒng)功能結(jié)構(gòu)圖
1.3 就業(yè)信息數(shù)據(jù)分析模塊的數(shù)據(jù)處理流程
就業(yè)信息數(shù)據(jù)分析模塊的處理流程是:把需要處理的數(shù)據(jù)庫和外部數(shù)據(jù)通過數(shù)據(jù)整理,進入ODS數(shù)據(jù)庫元數(shù)據(jù),然后運用OLAP的多角度分析后,最后以報表形式提供給決策者.數(shù)據(jù)處理流程如圖3所示.
操作數(shù)據(jù)源是整個系統(tǒng)的數(shù)據(jù)基礎(chǔ)也是系統(tǒng)體系結(jié)構(gòu)的最底層.一般來說,其來源是基于OLTP(On-Line Transaction Processing)的操作性數(shù)據(jù).
ODS(Operational Data Store)數(shù)據(jù)庫維持著一個分析型的環(huán)境,具有面向主題的特征,它由操作型環(huán)境中分散的DB記錄經(jīng)過濾后形成ODS系統(tǒng)的記錄系統(tǒng),向ODS系統(tǒng)中提供數(shù)據(jù).
OLAP分析服務(wù)器是一個經(jīng)過特殊設(shè)計,用于支持和管理多維數(shù)據(jù)結(jié)構(gòu)的高性能、多用戶的數(shù)據(jù)處理引擎.多維數(shù)據(jù)結(jié)構(gòu)是將原始數(shù)據(jù)按維度進行整理后所得的結(jié)果,其中的數(shù)據(jù)項訪問需根據(jù)定義該項的維度成員來訪問.該多維數(shù)據(jù)結(jié)構(gòu)能夠靈活、快速地處理原始數(shù)據(jù),且對各種查詢具有一致的響應(yīng)速度. OLAP的應(yīng)用過程就是“數(shù)據(jù)一信息一知識一計劃一行動”的過程.
1.4 就業(yè)信息數(shù)據(jù)分析模塊的邏輯模型設(shè)計
就業(yè)信息數(shù)據(jù)分析模塊的邏輯模型采用星型模型.星型模型是由中心向外輻射的結(jié)構(gòu),一個主題對應(yīng)一個星型模型,模型中心的對象稱為事實表(Fact Table),與之相連的對象稱為維度表(Dimen?sion Table).一個簡單的星型模型由一個事實表和若干個維度表組成,如圖4所示.
事實表是由維度表的主鍵和度量值組成的,在做事實表時要注意兩點:第一、事實表中要記錄數(shù)據(jù)分析用到的所有基本數(shù)據(jù).第二、數(shù)據(jù)的記錄方式要以業(yè)務(wù)需求為準,有什么樣的主題就要做什么樣的事實表.事實表中除了包括那些用于分析的數(shù)據(jù)外,還有一個或多個外鍵,他們是聯(lián)系事實表和數(shù)據(jù)維度表之間的紐帶.表1是畢業(yè)生事實表.
維度表中存放的是對事實表中度量的描述,里面的信息包括字段名稱、數(shù)據(jù)類型、長度、主鍵、是否允許空、字段說明.每張維度表除包含每一維的主鍵,還有說明該維的一些屬性字段,維度表中的數(shù)據(jù)由維度表主鍵和描述實體的文本數(shù)據(jù)組成.
在就業(yè)信息分析模塊(圖5中)的邏輯模型結(jié)構(gòu)中,“畢業(yè)生”事實表位于模型連接的中心,存儲了大量的數(shù)據(jù),在“畢業(yè)生”事實表的周圍分別是“性別”、“專業(yè)”、“民族”、“畢業(yè)去向”、“單位名稱”、“學(xué)歷”、“培養(yǎng)方式”、“政治面貌”、“單位所在地”、“學(xué)籍變動”、“畢業(yè)生”等11個維度表.
圖2 就業(yè)信息數(shù)據(jù)分析模塊的功能結(jié)構(gòu)圖
圖3 數(shù)據(jù)處理流程
圖4 星型模型結(jié)構(gòu)示意圖
圖5 就業(yè)信息分析模塊的邏輯模型
表1 畢業(yè)生事實表
通過就業(yè)信息數(shù)據(jù)分析模塊,可以實現(xiàn)數(shù)據(jù)導(dǎo)航和靈活的OLAP分析,包括切片、切塊、上鉆、下鉆和交互式圖表,為決策者提供了友好的圖形界面,為數(shù)據(jù)探查和決策制定提供了一個直觀的環(huán)境,使得各個層次的分析數(shù)據(jù)都可以流暢的在決策者面前呈現(xiàn).并可提供多種可視化方式來展示分析結(jié)果.數(shù)據(jù)分析效果如圖6、圖7.
本文對高校就業(yè)信息管理系統(tǒng)進行了改進設(shè)計,增加了一個就業(yè)信息分析模塊,將數(shù)據(jù)倉庫與OLAP技術(shù)應(yīng)用于高校就業(yè)信息數(shù)據(jù)分析中.和原來的系統(tǒng)相比,功能更加完善實用,尤其是對海量數(shù)據(jù)可以進行多維分析,為高校管理層提供準確的信息.
圖6 學(xué)科專業(yè)數(shù)據(jù)分析效果圖
圖7 圖形報表
參考文獻:
[1]InmonW H.數(shù)據(jù)倉庫[M].北京:機械工業(yè)出版社,2006:20-24.
[2]胡耀民,余明輝.商務(wù)智能系統(tǒng)模型的研究和應(yīng)用[J].計算機與現(xiàn)代化,2010(3):58-61.
[3]陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2007:93-100.
[4]Ralph K,Joe C.The DataWarehouse ETL Toolkit:Practical Techniques for Extracting,Cleanin[M].W iley,2004:29-48.
[5]張中平,徐佑軍.OLAP技術(shù)在電信領(lǐng)域中的應(yīng)用[J].計算機工程與設(shè)計,2005,26(7):1950-1952.
[6]吳遠紅.ETL執(zhí)行過程的優(yōu)化研究[J].計算機科學(xué),2007,34(1):81-83.
[7]朱德利.SQLServer 2005數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].北京:電子工業(yè)出版社,2007:77-80.
[8]陳文偉,黃金才.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2004:54-55.
[9]李紅良.智能決策支持系統(tǒng)的發(fā)展現(xiàn)狀及應(yīng)用展望[J].重慶理工大學(xué)學(xué)報:自然科學(xué)版,2009,23(10):140-144.
[10]金芳.淺談數(shù)據(jù)倉庫技術(shù)在電信行業(yè)中的應(yīng)用[J].長春大學(xué)學(xué)報:自然科學(xué)版,2009,19(6):68-69,75.
An Analysis of College Employment Information Data Based on the Data Warehouse Management System
YANWei
(School of Computer Science and Engineering,Changshu Institute of Technology,Changshu 215500,China)
Based on the study of College Employment Information Management System,the employment informa?tion analysismodule is added,which is capable ofmanaging basic information and background programs,analyz?ing data in various dimensions as well as forecasting career trends.Multi-dimensional analyses are realized by means of SQL Serve 2005 data warehouse technology ofmulti-dimensional datamodel.
employment;module;data warehouse
TP311.13
A
1008-2794(2012)08-0114-04
2012-05-21
嚴衛(wèi)(1980—),男,江蘇常熟人,助理實驗師,碩士,研究方向:計算機技術(shù)、數(shù)據(jù)挖掘.