占 小 憶
(安徽三聯(lián)學(xué)院 計(jì)算機(jī)工程學(xué)院,安徽 合肥 230601)
?
數(shù)據(jù)倉(cāng)庫(kù)和OLAP技術(shù)在高校教學(xué)決策系統(tǒng)中的應(yīng)用研究
占 小 憶
(安徽三聯(lián)學(xué)院 計(jì)算機(jī)工程學(xué)院,安徽 合肥 230601)
摘要:借助某高校教務(wù)系統(tǒng)中的教學(xué)數(shù)據(jù),使用ETL(Extract-Transform-Load)技術(shù)把適合主題分析的數(shù)據(jù)抽取到目的數(shù)據(jù)倉(cāng)庫(kù),并使用OLAP(Online Analytical Process)技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行多角度分析,從而找出成績(jī)變化的趨勢(shì),成功地分析了變化的原因,為該校的管理者提供了有效的決策依據(jù)和初步的決策建議。
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);教學(xué)決策;聯(lián)機(jī)分析處理;多維分析
計(jì)算機(jī)技術(shù)的發(fā)展使各大高校的教學(xué)管理基本完全走向信息化[1]。他們的管理系統(tǒng)大多是建立在面向事務(wù)的基礎(chǔ)上的,基本上能夠滿足日常教學(xué)的需求,如對(duì)學(xué)生成績(jī)的管理,對(duì)教學(xué)的安排,對(duì)考試的管理等等。但這種管理系統(tǒng)往往只是停留在管理的層面上,對(duì)于教學(xué)管理過(guò)程中出現(xiàn)的一些問(wèn)題,比如同一個(gè)專業(yè)多個(gè)平行班成績(jī)出現(xiàn)較大的差距,再比如同一個(gè)專業(yè)不同年級(jí)的學(xué)生成績(jī)出現(xiàn)的下滑或上升的趨勢(shì),學(xué)生報(bào)到人數(shù)在地區(qū)上有著什么樣的分布趨勢(shì)等等。類似這樣的問(wèn)題通過(guò)管理系統(tǒng)是解決不了的,對(duì)于以上這些問(wèn)題,可以通過(guò)建立相應(yīng)的數(shù)據(jù)倉(cāng)庫(kù)[2],然后利用OLAP[3]分析工具對(duì)隱藏在系統(tǒng)中的海量數(shù)據(jù)進(jìn)行分析,找出其中的規(guī)律,從而幫助教學(xué)管理人員更好的作出決策。本文就是針對(duì)某高校近幾年積累下來(lái)的學(xué)生某些課程的成績(jī)數(shù)據(jù),首先構(gòu)建學(xué)生成績(jī)數(shù)據(jù)倉(cāng)庫(kù),然后利用OLAP工具對(duì)其進(jìn)行多角度的分析,找出其中的規(guī)律,并發(fā)現(xiàn)了一些問(wèn)題,供管理者參考。
1成績(jī)管理數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
1.1分析需求,確定主題域
根據(jù)調(diào)查結(jié)果整理出以下幾個(gè)方面的分析需求:希望對(duì)全校的公共課做成績(jī)分析,如大學(xué)英語(yǔ)B級(jí)和計(jì)算機(jī)基礎(chǔ)這兩門公共課;希望能分析成績(jī)變化的趨勢(shì)。通過(guò)對(duì)以上需求進(jìn)行歸納,發(fā)現(xiàn)分析的角度可以分為教師、課程、時(shí)間和班級(jí)四大類,而此需求所涉及的主題域?qū)嶋H上只有一個(gè)——成績(jī)。
1.2ETL的具體實(shí)現(xiàn)
數(shù)據(jù)抽取。確定了主題域后,接下來(lái)就從操作型數(shù)據(jù)庫(kù)中提取分析所需的數(shù)據(jù)[4]。在此只提取原教務(wù)管理系統(tǒng)中與成績(jī)主題相關(guān)的數(shù)據(jù),源數(shù)據(jù)中的數(shù)據(jù)有可能會(huì)出現(xiàn)錯(cuò)誤,根據(jù)不同的錯(cuò)誤類型,在提取數(shù)據(jù)時(shí)要采取相應(yīng)的手段來(lái)處理這些錯(cuò)誤數(shù)據(jù);對(duì)于原數(shù)據(jù)中部分記錄中的某些數(shù)據(jù)項(xiàng)出現(xiàn)空值或不規(guī)范值,可以利用系統(tǒng)的數(shù)據(jù)篩選功能將這些數(shù)據(jù)篩選出來(lái)再進(jìn)行手工處理;對(duì)于一些可疑數(shù)據(jù),則要看具體情況,如某個(gè)學(xué)生的學(xué)期平均成績(jī),則要查詢?cè)搶W(xué)生的所有課程成績(jī),如有部分課程成績(jī)?yōu)榭眨瑒t可認(rèn)為該同學(xué)部分課程缺考,當(dāng)以零分參加計(jì)算平均值,如果該同學(xué)所有成績(jī)都為空,則可認(rèn)為該同學(xué)在該學(xué)期發(fā)生變更(如休學(xué)或退學(xué)),此時(shí)應(yīng)當(dāng)刪除該無(wú)效記錄;另外,抽取后的各表數(shù)據(jù)要保持一致性,如發(fā)現(xiàn)抽取后的學(xué)生信息表中的人數(shù)和成績(jī)表的人數(shù)不一致,即一張表中的記錄在另一張表中沒(méi)有對(duì)應(yīng)的數(shù)據(jù),則應(yīng)刪除這些記錄,以免對(duì)后續(xù)的分析造成麻煩。
數(shù)據(jù)匯總和加載。從源數(shù)據(jù)庫(kù)抽取的數(shù)據(jù)大多是細(xì)節(jié)數(shù)據(jù),如學(xué)生的成績(jī)數(shù)據(jù)存儲(chǔ)的是每學(xué)期每門課程的成績(jī),而管理者在對(duì)基礎(chǔ)課成績(jī)做趨勢(shì)分析時(shí)需要的是每學(xué)期或每學(xué)年的成績(jī)數(shù)據(jù),因此,還需要對(duì)抽取的數(shù)據(jù)在不同的維度層次上進(jìn)行匯總。接下來(lái)將以上經(jīng)過(guò)處理的數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù),本系統(tǒng)采用MicrosoftSQL Server中的DTS功能將數(shù)據(jù)導(dǎo)入目的數(shù)據(jù)倉(cāng)庫(kù)。
1.3構(gòu)建成績(jī)管理數(shù)據(jù)倉(cāng)庫(kù)
維表和事實(shí)表的設(shè)計(jì)和事務(wù)型數(shù)據(jù)庫(kù)設(shè)計(jì)沒(méi)有區(qū)別,在此就不敘述維表和事實(shí)表的設(shè)計(jì)過(guò)程。星型模型是最流行的數(shù)據(jù)倉(cāng)庫(kù)導(dǎo)出數(shù)據(jù)層的設(shè)計(jì)結(jié)構(gòu)。星型模型通過(guò)使用一個(gè)包含主題的事實(shí)表和多個(gè)包含事實(shí)的非規(guī)范化描述的維度表來(lái)執(zhí)行典型的決策支持查詢[5]。根據(jù)維表和事實(shí)表的設(shè)計(jì),本系統(tǒng)采用星型架構(gòu)。圖1是教學(xué)管理系統(tǒng)的維表和事實(shí)表的星型結(jié)構(gòu)圖。
圖1 成績(jī)管理系統(tǒng)星型模型
2數(shù)據(jù)展示及分析
2.1學(xué)生維成績(jī)分析
學(xué)生維成績(jī)分析就是針對(duì)某個(gè)學(xué)生單科成績(jī)?cè)诓煌瑢W(xué)期所發(fā)生的變化或某個(gè)班級(jí)所有學(xué)生成績(jī)的分布趨勢(shì)。由于本課題主要針對(duì)實(shí)用英語(yǔ)和計(jì)算機(jī)兩門課程的成績(jī)分析,對(duì)學(xué)生維的成績(jī)分析沒(méi)有實(shí)際意義。因此,在此暫不做分析。
2.2教師維成績(jī)分析
教師維成績(jī)分析主要是把教師作為維度,從專業(yè)維、班級(jí)維和學(xué)年學(xué)期維來(lái)觀察分析成績(jī)的差異。例如,可以針對(duì)同一教師所授的不同班級(jí)學(xué)生做成績(jī)分析,雖然入學(xué)時(shí)各班級(jí)學(xué)生并沒(méi)有按照成績(jī)好壞來(lái)分班,各班的成績(jī)相差不大,后來(lái)可能受其它因素的影響導(dǎo)致同一門課程同一個(gè)授課老師,但是成績(jī)卻相差很大;還可以針對(duì)同一教師,將不同時(shí)期所帶班級(jí)的學(xué)生成績(jī)進(jìn)行比較,找出差異,對(duì)于成績(jī)較好的學(xué)期可以總結(jié)出在這一段時(shí)間內(nèi)教師的授課優(yōu)點(diǎn),對(duì)于成績(jī)較差的學(xué)期可以總結(jié)該段時(shí)間授課的缺點(diǎn)和影響成績(jī)的因素,例如是否有些學(xué)期教學(xué)周數(shù)較多,而有些學(xué)期周數(shù)較少造成課時(shí)的差異或者是否有不同專業(yè)該課程開(kāi)設(shè)在不同學(xué)期造成的成績(jī)差異。圖2是教師維的分析。
圖2教師維成績(jī)分析
從圖2可以看出以下兩點(diǎn):
第一,在平行班的教學(xué)中,10級(jí)計(jì)應(yīng)1班和10級(jí)計(jì)應(yīng)3班成績(jī)竟然相差十幾分,而這些班級(jí)是由同一教師授課的。究其原因,這些班級(jí)中是由不同的班主任管理的。不同的班主任,他們管理方式不同,班級(jí)文化不同,學(xué)生的學(xué)習(xí)氛圍不同,學(xué)習(xí)效果也就不同。如10級(jí)計(jì)算機(jī)應(yīng)用專業(yè)3個(gè)班中2班的成績(jī)較低而3班的成績(jī)最高。經(jīng)調(diào)查發(fā)現(xiàn),3班的班主任對(duì)學(xué)生要求非常嚴(yán)格,不允許學(xué)生無(wú)故曠課,不隨意批請(qǐng)假條,還經(jīng)常給同學(xué)召開(kāi)班會(huì),這樣,學(xué)生的學(xué)習(xí)氛圍很好,都愿意去學(xué),自然成績(jī)就好。而作為平行班的10級(jí)2班班主任是另外一個(gè)老師,該班的管理較松散,學(xué)生的學(xué)習(xí)積極性很差,還有些學(xué)生經(jīng)常曠課,整個(gè)班級(jí)的學(xué)習(xí)風(fēng)氣很差,因此學(xué)習(xí)效果也就很差。針對(duì)此現(xiàn)象,學(xué)校應(yīng)采取一定的措施綜合對(duì)班主任進(jìn)行考評(píng),而考評(píng)結(jié)果可以與待遇或年終獎(jiǎng)金掛鉤,從而健全學(xué)校教職工的激勵(lì)機(jī)制。
第二,對(duì)于相同專業(yè)不同班級(jí),不同老師所授課程的成績(jī)有時(shí)也有很大的差距。例如,同是10級(jí)郭常根老師所帶班級(jí)的平均分要比杜林老師的高出10多分,分析原因,原來(lái)是郭常根老師帶這門課程已有幾年的教學(xué)經(jīng)驗(yàn),而杜林老師帶這門課程時(shí)間較短。此時(shí)學(xué)校要考慮在教學(xué)安排上對(duì)于課程安排盡量讓同一個(gè)老師帶相同的課程。同時(shí)學(xué)校在教學(xué)安排中要綜合考慮班級(jí)學(xué)生自身的素質(zhì)、班主任和授課教師的因素。
2.3學(xué)年學(xué)期維分析
從學(xué)年學(xué)期維可以分析所有課程在不同時(shí)間的成績(jī)趨勢(shì)。圖3是所有學(xué)生的計(jì)算機(jī)基礎(chǔ)和實(shí)用英語(yǔ)B級(jí)在每學(xué)年的成績(jī)比較??梢钥闯?,計(jì)算機(jī)基礎(chǔ)的成績(jī)?cè)诓煌瑢W(xué)年呈上升趨勢(shì),而實(shí)用英語(yǔ)B級(jí)在2011-2012學(xué)年的成績(jī)較低。經(jīng)過(guò)進(jìn)一步分析,計(jì)算機(jī)基礎(chǔ)在2011-2012學(xué)年以后采取了激勵(lì)機(jī)制,授課老師比以前更加盡心盡責(zé)輔導(dǎo)學(xué)生操作。而實(shí)用英語(yǔ)B級(jí)2011-2012學(xué)年調(diào)換了幾個(gè)年輕老師授課導(dǎo)致成績(jī)下降。作為學(xué)院教學(xué)管理者,要想提高基礎(chǔ)課的成績(jī)就要進(jìn)一步采取一些措施,例如將激勵(lì)機(jī)制同時(shí)應(yīng)用到實(shí)用英語(yǔ)上,同時(shí)加強(qiáng)對(duì)年輕老師的培訓(xùn),使他們盡快成長(zhǎng)起來(lái),以提高基礎(chǔ)課成績(jī)。
圖3學(xué)年學(xué)期維切塊分析結(jié)果
3結(jié)束語(yǔ)
本文從某高校近幾年的部分學(xué)生成績(jī)相關(guān)數(shù)據(jù)出發(fā),使用OLAP技術(shù)對(duì)該部分?jǐn)?shù)據(jù)進(jìn)行分析,從而找出成績(jī)變化的趨勢(shì),成功地分析變化的原因,最終為該校的管理者提供了有效的決策依據(jù)和初步的決策建議。在此,該系統(tǒng)只是提供了少量的數(shù)據(jù)分析結(jié)果,我們可以將此方法推廣到其它課程,甚至是整個(gè)學(xué)校的教務(wù)系統(tǒng),這將會(huì)更加有效地保障教學(xué)效果。
參考文獻(xiàn):
[1] 張雪. 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在高校信息系統(tǒng)中的應(yīng)用[J]. 電子技術(shù)與軟件工程, 2014(21): 212.
[2] 何玉潔, 張俊超. 數(shù)據(jù)倉(cāng)庫(kù)與OLAP實(shí)踐教程[M]. 北京: 清華大學(xué)出版社, 2008: 5.
[3] 夏火松. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)[M]. 北京: 清華大學(xué)出版社, 2011.
[4] 馬春艷, 曲偉峰, 化松收. 基于數(shù)據(jù)倉(cāng)庫(kù)、OLAP和數(shù)據(jù)挖掘的智能決策支持系統(tǒng)研究[J]. 無(wú)線互聯(lián)科技, 2013(3): 132, 154.
[5] 陳志泊. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M]. 北京: 清華大學(xué)出版社, 2009: 43.
Applied Research of Data Warehouse and OLAP in the Decision-making System of Teaching in Universities
ZHAN Xiao-yi
(Anhui Sanlian University, Computer Engineering Department, Hefei 230601, China)
Abstract:In this paper, with the aid of a university educational administration system of teaching data, using the ETL (Extract-Transform-Load) technology to Extract suitable for the analysis of the theme data in data warehouse, and using OLAP technology to multi-angle analyses on these data thus we find out the performance change trend, analyses the reasons of the change successfully, in the end, provide effective decision-making basis and preliminary decision-making advice for the school managers.
Key words:data warehouse, teaching decisions, OLAP, multi-dimensional analysis
文章編號(hào):1007-4260(2015)03-0117-03
中圖分類號(hào):TP392
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.13757/j.cnki.cn34-1150/n.2015.03.031
作者簡(jiǎn)介:占小憶,女,安徽懷寧人,碩士,安徽三聯(lián)學(xué)院計(jì)算機(jī)工程學(xué)院講師,研究方向?yàn)閿?shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘。
基金項(xiàng)目:安徽三聯(lián)學(xué)院項(xiàng)目(2012012)。
收稿日期:2015-06-09
網(wǎng)絡(luò)出版時(shí)間:2015-8-25 15:40網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/34.1150.N.20150825.1540.031.html
安慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年3期