摘 要 提出基于數(shù)據(jù)倉庫的解決方案。以數(shù)據(jù)倉庫及OIAP為工具實現(xiàn)題庫管理系統(tǒng),給出了題庫管理系統(tǒng)數(shù)據(jù)倉庫的體系結(jié)構(gòu),并對事實表、維表以及多維數(shù)據(jù)模型進(jìn)行了設(shè)計,為如何充分利用現(xiàn)有的數(shù)據(jù)為題庫管理系統(tǒng)的管理和決策服務(wù)提供新的思路和途徑。
關(guān)鍵詞 題庫管理系統(tǒng);數(shù)據(jù)倉庫;OLAP;多維數(shù)據(jù)模型
中圖分類號TP311.52 文獻(xiàn)標(biāo)識碼A 文章編號1673—9671—f2009)122—0015—01
計算機應(yīng)用技術(shù)的日益發(fā)展為教育技術(shù)學(xué)的研究與發(fā)展帶來了新的機遇,利用計算機題庫系統(tǒng)平臺取代傳統(tǒng)的紙張考試模式,具備公正、安全、高效的特點,題庫系統(tǒng)的建設(shè)和自動組卷、閱卷系統(tǒng)的創(chuàng)建很大程度上減輕了考試各環(huán)節(jié)的工作強度并消除地域差異。然而試題庫的建設(shè)是一項復(fù)雜而又系統(tǒng)的工程,很多高校在信息化的建設(shè)中,陸續(xù)建立了題庫管理系統(tǒng),但由于每位教師在出卷中由于各自的個性原因,很難保證所出的試題都是優(yōu)質(zhì)的和合理的,加上每次考試后沒有合理的對考試情況進(jìn)行分析研究,使題庫系統(tǒng)不夠?qū)I(yè)化、智能化、缺少決策與分析功能,為了充分發(fā)揮這些數(shù)據(jù)的效用,迅速、準(zhǔn)確、有效、適量地提供用戶所需的信息,支持管理決策,實現(xiàn)數(shù)據(jù)一信息一知識的轉(zhuǎn)變,就必須運用數(shù)據(jù)倉庫技術(shù)。
1 數(shù)據(jù)倉庫概念和與數(shù)據(jù)庫的區(qū)別
數(shù)據(jù)倉庫是一個面向主題的、集成的、反映歷史變化、相對穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉庫具有面向主題、高度集成、相對穩(wěn)定、反映歷史變化四個最重要的特征。 數(shù)據(jù)庫是面向事務(wù)的設(shè)計,它一般存儲在線交易數(shù)據(jù)。數(shù)據(jù)倉庫是面向主題的設(shè)計,它一般存儲的是歷史數(shù)據(jù)。數(shù)據(jù)庫設(shè)計一般采用符合范式的規(guī)則用來避免冗余,數(shù)據(jù)倉庫是采用反范式的方式來設(shè)計為了引入冗余。數(shù)據(jù)庫是為捕獲數(shù)據(jù)而設(shè)計,數(shù)據(jù)倉庫是為分析數(shù)據(jù)而設(shè)計,它的兩個基本元素是維表和事實表。維是看問題的角度,如時間,部門,維表放的就是這些東西的定義,事實表里放著要查詢的數(shù)據(jù),同時有維的ID。 單從概念上講,有些晦澀。任何技術(shù)都是為應(yīng)用服務(wù)的,結(jié)合題庫管理系統(tǒng)可以很容易地理解。以學(xué)生考試成績?yōu)槔?shù)據(jù)庫是事務(wù)系統(tǒng)的數(shù)據(jù)平臺,學(xué)生每次的考試成績都會被寫人數(shù)據(jù)庫記錄下來,在這里,我們可以簡單理解為用數(shù)據(jù)庫記帳。數(shù)據(jù)倉庫是分析系統(tǒng)的數(shù)據(jù)平臺,它從事務(wù)系統(tǒng)獲取數(shù)據(jù),并做進(jìn)一步的匯總、加工,為決策者提供決策依據(jù)。比如,學(xué)生的考試成績分布如何,哪些知識點失分較多,有哪些類型,男女比例如何,這些多角度信息便于教師全面掌握該次考情況及試題屬性,以便進(jìn)一步研究這些信息為管理決策者提供了決策支持。
2 試題庫的OLAP分析
1)什么是OLAP。OLAP(聯(lián)機分析處理)是使分析人員、管理人員或執(zhí)行人員能夠從多角度對信息進(jìn)行快速、一致、交互地存取,從而獲得對數(shù)據(jù)進(jìn)一步了解的軟件技術(shù)。滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報表需求是JAP的目標(biāo),它的技術(shù)核心是“維”這個概念。
“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分?!熬S”有時會包含相當(dāng)復(fù)雜的層次關(guān)系。通過把一個實體的多項重要的屬性定義為多個維(dimension),使用戶能對不同維上的數(shù)據(jù)進(jìn)行比較。因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。
OLAP的基本多維分析操作有鉆取(roll up Id611 down)、切片(slice)和切塊(dice)、以及旋轉(zhuǎn)(pivct)、drill across、drill through等。
鉆取是改變維的層次,變換分析的力度。它包括向上鉆取(roll up)和向下鉆取(drill down)。roll up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而drill down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。
切片和切塊是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個,則是切片;如果有三個,則是切塊。
旋轉(zhuǎn)是變換維的方向,即在表格中重新安排維的放置。
2)試題庫的0LAPSY析框架如圖1所示。
首先我們從試題庫中通過某種算法抽取試題資源,然后對考試結(jié)果從多個維進(jìn)行分析研究,便于教師與管理人員掌握情況并進(jìn)行決策,對優(yōu)化后的試題再重新人庫。所以本系統(tǒng)的任務(wù)是如何酞考試試卷中進(jìn)行統(tǒng)計信息;二是如何進(jìn)行OLAP的決策來完善試題庫。
3)試題庫的OLAP析模塊劃分。試題庫的OLAP~析模型分為試題得分率分析、試題對比分析、試題多維分析三個模塊。試題得分率分析主要從試題^庫時間、類型、知識點等角度來分析試題的得分率情況,多角度分析試題,能夠讓教師全面掌握該次考考試情況以便作出分析決策,從而改善試題庫的質(zhì)量。試題對比分析主要從試題的知識點,難易程度角度對比試題被答對的情況,從而改善知識點的疏漏及調(diào)整試題的難度。試題多維分析主要通過切片、切塊、旋轉(zhuǎn)和鉆取等操作綜合各個維度來觀察一道試題的量,分析全面,定位準(zhǔn)確,便于教師更容易準(zhǔn)確地得出結(jié)論。三個功能模塊如圖2所示。
3 設(shè)計多維數(shù)據(jù)集的模式(以客觀題為倒)星型雪花架構(gòu)
設(shè)計多維數(shù)據(jù)集的模式采用ROLAP(relational online analyticalprocessing),可以采用SQL數(shù)據(jù)庫來實現(xiàn),將多維結(jié)構(gòu)化分為事實表與維度表兩類。本系統(tǒng)的實現(xiàn)采用星型雪花模型,維度表與事實表關(guān)聯(lián),維度表彼此之間沒有關(guān)聯(lián)。以試題得分率統(tǒng)計事實表為中心。 需要注意的是以得分率為度量。對于知識點維、入庫時間維、類型維,難度維,學(xué)科維度和用戶維的粒度劃分要符合細(xì)度,如知識要劃分到章、節(jié),時間維劃分為到年、月,難度劃分到難、較難、中、較容易、容易等,得分率受到試題知識點,難易程度,試題類型等因素的影響,體現(xiàn)了事實表和維度表的關(guān)系。
4 結(jié)語
目前很多高校的題庫管理系統(tǒng)都是操作型管理系統(tǒng),缺少對題庫的分析與決策。為改善試題質(zhì)量,提高教師的工作效率需建立新的合理、有效的數(shù)據(jù)倉庫模型。本文就題庫管理系統(tǒng)數(shù)據(jù)倉庫的建立、OLJAP分析與模塊的劃分進(jìn)行了一些有益探索。