朱晴
摘 ?要: 為提升高校教學(xué)管理的水平與效率,設(shè)計融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng)。該系統(tǒng)的關(guān)鍵組成部分為客戶端、服務(wù)器和數(shù)據(jù)庫,客戶端和服務(wù)器分別負(fù)責(zé)面向用戶的交互功能呈現(xiàn)和系統(tǒng)應(yīng)用程序的邏輯運(yùn)行,系統(tǒng)通過創(chuàng)建涵蓋教學(xué)管理不同方面數(shù)據(jù)的數(shù)據(jù)庫體系,采用改進(jìn)關(guān)聯(lián)規(guī)則挖掘算法,從系統(tǒng)數(shù)據(jù)庫內(nèi)挖掘用戶各方面教育信息關(guān)聯(lián)數(shù)據(jù),并通過客戶端主界面為用戶提供教學(xué)、選課、課程等服務(wù)。以某高校信息平臺為例測試該系統(tǒng)性能,結(jié)果表明,該系統(tǒng)能夠?qū)崿F(xiàn)課程查詢功能,客戶端兼容性較好,能夠應(yīng)用于各類瀏覽器及操作系統(tǒng)內(nèi),應(yīng)用性較強(qiáng),且具有良好的數(shù)據(jù)挖掘性能。
關(guān)鍵詞: 教學(xué)管理; 關(guān)聯(lián)規(guī)則; 挖掘算法; 數(shù)據(jù)挖掘; 數(shù)據(jù)庫管理; 課程查詢
中圖分類號: TN02?34; G434 ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)23?0159?05
Abstract: In order to improve the level and efficiency of teaching management in colleges and universities, an information?based teaching management system integrating the association rule mining algorithm is designed. The key components of the system are client?side, server and database. The client?side and server are respectively responsible for the presentation of user oriented interactive functions and the logical operation of system application program. The improved association rule mining algorithm is used in the system to mine the association data in each aspect of user′s education information from the system database by creating a database system covering the data in different aspects of teaching management, and provide users with services such as teaching, course selection and courses in the main interface of client?side. The performance of the system is tested by taking a university information platform as an example. The results show that the system can achieve the function of course query, its client?side compatibility is good, it can be used in various browsers and operating systems, and it has strong applicability and good data mining performance.
Keywords: teaching management; association rule; mining algorithm; data mining; database management; course query
0 ?引 ?言
當(dāng)前各高校管理中的重點(diǎn)即為教學(xué)管理,有效的教學(xué)管理不但需要管理人員設(shè)定良好的管理制度,而且應(yīng)具備理想的信息管理系統(tǒng)[1]。由于各高校的管理方式與教學(xué)模式各不相同,因而各高校所應(yīng)用的教學(xué)管理系統(tǒng)也有區(qū)別,各高校的日常教學(xué)管理中,教師信息、學(xué)生信息、課程信息及成績信息等數(shù)據(jù)信息對于教學(xué)管理人員來說較為繁瑣,但若通過教學(xué)管理系統(tǒng)依據(jù)各自的管理特點(diǎn)將此類信息數(shù)據(jù)與不同管理方向相結(jié)合,便可有效地降低管理人員的壓力,同時將教學(xué)管理系統(tǒng)的效果最大程度地發(fā)揮出來[2?4]。作為當(dāng)前一種新穎的教學(xué)管理方式的信息化教學(xué)管理被逐漸引入高校管理中[5],能夠從根本上簡化管理人員的工作內(nèi)容,因而設(shè)計信息化教學(xué)管理系統(tǒng)成為各高校管理的重中之重。
數(shù)據(jù)挖掘(Data Mining)是指由數(shù)據(jù)庫內(nèi)將感興趣的知識提取出來,關(guān)聯(lián)規(guī)則挖掘?yàn)閿?shù)據(jù)挖掘領(lǐng)域內(nèi)的研究重點(diǎn)[6?7]。關(guān)聯(lián)規(guī)則是指數(shù)據(jù)庫內(nèi)某組對象間某種聯(lián)系的規(guī)則,其挖掘?qū)ο笸ǔ槭聞?wù)數(shù)據(jù)庫[8]。由于高校的教學(xué)管理中會持續(xù)累積大量的歷史數(shù)據(jù),其中包括很多有價值的信息,將關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘應(yīng)用在高校的信息化教學(xué)管理中,能夠分析并挖掘出教學(xué)管理中的有用信息,為高校教學(xué)管理人員實(shí)現(xiàn)科學(xué)有效地管理提供幫助[9]。
基于以上分析,本文設(shè)計融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng),可提升高校教學(xué)管理效率與管理水平,為實(shí)現(xiàn)科學(xué)全面地管理高校教學(xué)奠定基礎(chǔ)。
1 ?融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng)
1.1 ?系統(tǒng)設(shè)計
1.1.1 ?系統(tǒng)總體結(jié)構(gòu)設(shè)計
通過客戶端、服務(wù)器、數(shù)據(jù)庫三個關(guān)鍵部分共同組成信息化教學(xué)管理系統(tǒng),其結(jié)構(gòu)如圖1所示。其中,向用戶提供呈現(xiàn)與交互功能的為客戶端的核心功能[10],完成應(yīng)用程序的邏輯運(yùn)行則通過服務(wù)器核心功能實(shí)現(xiàn)??蛻舳嗽诖讼到y(tǒng)內(nèi)應(yīng)用C/S結(jié)構(gòu)模式,重點(diǎn)針對當(dāng)下普遍使用的智能手機(jī)移動終端;服務(wù)器在系統(tǒng)內(nèi)可應(yīng)用B/S與C/S兩種結(jié)構(gòu)模式,并且通信協(xié)議能夠兼容HTTP與SOCKET。分析圖1可得,在分層原理的基礎(chǔ)上開發(fā)信息化教學(xué)管理系統(tǒng),系統(tǒng)數(shù)據(jù)庫采用關(guān)系型在線處理分析(ROLAP)方法儲存全部數(shù)據(jù),利用融合關(guān)聯(lián)規(guī)則挖掘算法有效挖掘數(shù)據(jù)后,通過客戶端的主界面呈現(xiàn)系統(tǒng)信息化管理各項(xiàng)功能,如成績管理、課程管理、選課管理等,并在系統(tǒng)網(wǎng)絡(luò)內(nèi)通過防火墻等方式提升系統(tǒng)及數(shù)據(jù)信息的安全性。
1.1.2 ?系統(tǒng)數(shù)據(jù)庫設(shè)計
采用SQL Server 2009軟件設(shè)計系統(tǒng)數(shù)據(jù)庫。數(shù)據(jù)庫中包含學(xué)生表、教師表、學(xué)習(xí)調(diào)查表、課程表等,完全涵蓋教學(xué)管理中不同方面的數(shù)據(jù)。數(shù)據(jù)庫中的數(shù)據(jù)模型如圖2所示。
基于數(shù)據(jù)模型圖中的數(shù)據(jù),創(chuàng)建系統(tǒng)數(shù)據(jù)庫,為簡化數(shù)據(jù)挖掘流程并提升挖掘效率,設(shè)計系統(tǒng)數(shù)據(jù)庫體系架構(gòu),如圖3所示。具體過程描述為:通過數(shù)據(jù)抽取、轉(zhuǎn)換及裝載等過程將數(shù)據(jù)源放入數(shù)據(jù)集內(nèi),整合數(shù)據(jù)集之后生成數(shù)據(jù)庫,同時通過ROLAP方法儲存數(shù)據(jù);當(dāng)用戶登錄系統(tǒng)后,可通過數(shù)據(jù)挖掘及查詢等工具實(shí)現(xiàn)對數(shù)據(jù)庫的訪問,同時能夠管理、維護(hù)數(shù)據(jù)庫數(shù)據(jù);將經(jīng)由數(shù)據(jù)挖掘后獲取的知識通過客戶端的主界面向用戶呈現(xiàn)。
1.2 ?關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用
1.2.1 ?數(shù)據(jù)挖掘過程設(shè)計
數(shù)據(jù)挖掘過程為:將需要挖掘的數(shù)據(jù)類型進(jìn)行確準(zhǔn),對數(shù)據(jù)庫中的數(shù)據(jù)實(shí)行轉(zhuǎn)換、清洗等預(yù)處理,依據(jù)確準(zhǔn)的數(shù)據(jù)類型通過關(guān)聯(lián)規(guī)則挖掘算法實(shí)行數(shù)據(jù)挖掘,完成挖掘之后,分析評估挖掘結(jié)果,經(jīng)由客戶端向用戶展現(xiàn)。系統(tǒng)的數(shù)據(jù)挖掘詳細(xì)過程如圖4所示。
1.2.2 ?關(guān)聯(lián)規(guī)則挖掘算法設(shè)計
1) 關(guān)聯(lián)規(guī)則挖掘算法
通常可將關(guān)聯(lián)規(guī)則挖掘算法Apriori的根本思想分為兩個子問題:
① 頻繁項(xiàng)目集的發(fā)現(xiàn)[11]。依據(jù)用戶所給定的最小支持度(minsupport)對全部大于等于最小支持度的頻繁項(xiàng)目集(Frequent Itemset)予以找尋,所找尋的頻繁項(xiàng)目集或許存在包含關(guān)系,通常情況下僅對不包含在其余頻繁項(xiàng)目集內(nèi)的頻繁大項(xiàng)集(Frequent Large Itemset)的集合予以找尋,此類頻繁大項(xiàng)集即為生成關(guān)聯(lián)規(guī)則的根本。
② 關(guān)聯(lián)規(guī)則的生成[12]。以用戶給定的最小可信度(minconfidence)為依據(jù),由各最大頻繁項(xiàng)目集內(nèi)將可信度(confidence)大于等于最小可信度的關(guān)聯(lián)規(guī)則找尋到。
2) Apriori算法核心
為實(shí)現(xiàn)全部頻繁集的生成,Apriori算法運(yùn)用遞推的方式,具體如下:
[K1=]{large 1?itemsets}
For([l]=2;[Kl-1≠μ];[l]++) do begin
[Al=]apriori?gen([Kl-1]) //新候選集
For all transactions [t][JB] do begin
[At=]subset[(Al,t)] //事務(wù)[t]內(nèi)所含候選集
For all candidates c[J] [At] do
c.count++
End
[Kl]={c[J][Al]c.count3minsup}
End
Reply =[l?Kl]
頻繁第一項(xiàng)集[K1]與頻繁第二項(xiàng)集[K2]相繼生成,直至出現(xiàn)某個[u]值令[Ku]為空,算法終止。在第[l]次循環(huán)中,將候選[l]項(xiàng)集的集合[Al]生成,[Al]內(nèi)各項(xiàng)集的作用是生成頻集的候選集,各項(xiàng)集的生成是通過([l-2])連接僅存在一個不同項(xiàng)的[Kl-1]頻集完成的,最終生成的頻集[Kl]一定為[Al]的某個子集。需在數(shù)據(jù)庫內(nèi)驗(yàn)證[Al]內(nèi)的各個元素,確定各元素能否向[Kl]內(nèi)加入,驗(yàn)證時需數(shù)次對數(shù)據(jù)庫實(shí)行掃描,若頻集內(nèi)最多有12項(xiàng),則應(yīng)對數(shù)據(jù)庫實(shí)行12次掃描,需較大的I/O負(fù)載,且數(shù)次循環(huán)將生產(chǎn)大量候選集,為此造成驗(yàn)證時仍需多次掃描數(shù)據(jù)庫。故Apriori算法的缺點(diǎn)即為候選集生成量過大且反復(fù)多次掃描數(shù)據(jù)庫導(dǎo)致掃描時間過長,此為Apriori算法的瓶頸。
3) Apriori算法改進(jìn)
為改進(jìn)Apriori算法,提升算法的效率,將修剪技術(shù)加入算法中,降低候選集[Al]量的大小。修剪技術(shù)向算法內(nèi)加入所依據(jù)的性質(zhì)為:某個項(xiàng)集屬于頻集并且其全部子集均為頻集[13],若[Al]內(nèi)某個候選項(xiàng)集存在一個([l-1])子集不屬于頻集([Kl-1]),可將此候選項(xiàng)集修剪掉,此方法能夠?qū)⑦\(yùn)算全部候選集的支持度代價降低。
1.2.3 ?改進(jìn)Apriori算法在系統(tǒng)中的應(yīng)用
依據(jù)改進(jìn)Apriori算法獲得在約束基礎(chǔ)上的關(guān)聯(lián)規(guī)則。
定義1:設(shè)[n]個不同項(xiàng)目的集合為[J=j1,j2,…,jn],針對[J]的管理集合為[B],每一次管理包括數(shù)個項(xiàng)目[j1,j2,…,jl],關(guān)聯(lián)規(guī)則可表示成:
將以上關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用于信息化教學(xué)管理系統(tǒng)中,能夠挖掘出用戶各方面的教育信息,以挖掘的關(guān)聯(lián)信息為依據(jù)進(jìn)行相應(yīng)的管理[14],提升系統(tǒng)的管理性能。
1.3 ?查詢課程實(shí)現(xiàn)
課程查詢主要包含選課信息查詢及課程成績查詢。由教學(xué)管理人員設(shè)置開設(shè)的課程,學(xué)生進(jìn)行網(wǎng)絡(luò)選課,教師能夠隨時查看不同選課的學(xué)生名單,并在課程結(jié)束之后將課程成績錄入到系統(tǒng)內(nèi),學(xué)生可隨時通過系統(tǒng)查看自身課程成績。期間教學(xué)管理人員不僅能夠查看教師的信息,而且能夠查看與統(tǒng)計學(xué)生的成績信息,教學(xué)管理人員通過系統(tǒng)實(shí)現(xiàn)對所開設(shè)課程的管理[15]。課程查詢過程圖如圖5所示。用戶輸入“課程查詢”關(guān)鍵字之后,點(diǎn)擊開始查詢即可進(jìn)入課程查詢選擇頁面,選取選課信息或成績查詢后,點(diǎn)擊開始,若系統(tǒng)內(nèi)有相關(guān)信息,查詢到結(jié)果后可退出,若用戶想繼續(xù)查詢其他信息,可點(diǎn)擊返回查詢,重新回到輸入頁面;若無相關(guān)信息則自動跳轉(zhuǎn)到初始輸入頁面。
2 ?系統(tǒng)性能測試
以某高校為例,將本文系統(tǒng)應(yīng)用于此高校的信息平臺中,通過檢驗(yàn)本文系統(tǒng)在此平臺運(yùn)行時的課程查詢功能、兼容性及數(shù)據(jù)挖掘各方面性能,測試本文系統(tǒng)的總體性能。本文系統(tǒng)的運(yùn)行環(huán)境為:酷睿i5 CPU,1 TB硬盤容量、8 GB內(nèi)存、華為USG6330防火墻、Windows 8操作系統(tǒng)及谷歌瀏覽器。
2.1 ?系統(tǒng)功能測試
從實(shí)驗(yàn)高校某班級中隨機(jī)挑選出一名學(xué)生,采用本文系統(tǒng)對其課程成績進(jìn)行查詢,測試查詢過程中本文系統(tǒng)的查詢課程功能。學(xué)生進(jìn)入課程成績查詢界面后,界面顯示如圖6所示。由圖6中的課程成績查詢界面可看出,本文系統(tǒng)能夠?qū)崿F(xiàn)課程查詢功能,且界面顯示清晰。
2.2 ?系統(tǒng)兼容性測試
對本文系統(tǒng)客戶端實(shí)行兼容性測試,測試中對各種瀏覽器與操作系統(tǒng)環(huán)境下程序能否正常運(yùn)行實(shí)行檢測,測試中主要針對當(dāng)前比較常用的谷歌瀏覽器、IE瀏覽器、360瀏覽器及火狐瀏覽器等實(shí)行測試,操作系統(tǒng)為Windows 8和Windows XP操作系統(tǒng)。以兩臺電腦分別安裝兩種操作系統(tǒng)、兩種瀏覽器實(shí)行本文系統(tǒng)的兼容性測試。
從實(shí)驗(yàn)高校的某班級中隨機(jī)挑選一名學(xué)生和一名教師分別對兩臺電腦實(shí)行操作,操作內(nèi)容為:輸入個人驗(yàn)證信息登錄本文系統(tǒng)后,進(jìn)入到各自所需的信息查詢頁面,查詢個人成績與選課名單,然后退出登錄。對整個操作過程中本文系統(tǒng)能否按不同用戶需求正常運(yùn)行進(jìn)行記錄,記錄結(jié)果如表1所示。
通過表1可看出,本文系統(tǒng)僅在應(yīng)用IE瀏覽器時查詢信息的文本顯示格式略有誤差,但數(shù)據(jù)準(zhǔn)確且運(yùn)行正常,不影響日常使用,其余瀏覽器下應(yīng)用均正常,且數(shù)據(jù)準(zhǔn)確,由此說明,本文系統(tǒng)能夠?qū)崿F(xiàn)在不同瀏覽器下正常運(yùn)行,系統(tǒng)客戶端具備較好的兼容性,能夠應(yīng)用于各類瀏覽器及操作系統(tǒng)內(nèi),應(yīng)用性較強(qiáng)。
2.3 ?系統(tǒng)數(shù)據(jù)挖掘性能分析
為檢驗(yàn)本文系統(tǒng)數(shù)據(jù)挖掘的性能,從實(shí)驗(yàn)平臺中隨機(jī)抽選21 000條數(shù)據(jù),通過本文系統(tǒng)對所抽選數(shù)據(jù)實(shí)行課程信息、教師信息、檔案信息及成績信息等關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,檢驗(yàn)所挖掘結(jié)果的漏檢與誤檢情況,分析本文系統(tǒng)的數(shù)據(jù)挖掘性能,檢驗(yàn)結(jié)果如表2所示。
通過分析表2中數(shù)據(jù)可知,本文系統(tǒng)在對實(shí)驗(yàn)平臺中的關(guān)聯(lián)規(guī)則數(shù)據(jù)實(shí)行挖掘時,對小于12 000條數(shù)據(jù)的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘精準(zhǔn)度更高,未出現(xiàn)漏檢與誤檢的情況,隨著數(shù)據(jù)量總數(shù)的增加,漏檢率與誤檢率略有上升, 但上升趨勢不明顯,說明,本文系統(tǒng)整體數(shù)據(jù)挖掘性能良好,能夠?qū)崿F(xiàn)關(guān)聯(lián)規(guī)則數(shù)據(jù)的有效挖掘。
3 ?結(jié) ?論
本文設(shè)計一種融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng),關(guān)聯(lián)規(guī)則挖掘算法可實(shí)現(xiàn)從海量數(shù)據(jù)中通過某種關(guān)聯(lián)規(guī)則挖掘所需信息的目的,通過此方法挖掘的信息為高校實(shí)行信息化教學(xué)管理提供了科學(xué)有效的依據(jù),本文通過此方法從數(shù)據(jù)庫中挖掘?qū)嵤┙虒W(xué)管理的所需信息,實(shí)現(xiàn)信息化教學(xué)管理,并通過實(shí)驗(yàn)驗(yàn)證本文系統(tǒng)的查詢課程功能、客戶端兼容性及數(shù)據(jù)挖掘各方面優(yōu)越性能,未來的研究中將繼續(xù)檢驗(yàn)本文系統(tǒng)的運(yùn)行性能及其他功能性能,驗(yàn)證本文系統(tǒng)的實(shí)際應(yīng)用性,擴(kuò)大本文系統(tǒng)的應(yīng)用范圍。
參考文獻(xiàn)
[1] 常凱,趙艷莉,黃文峰.“新常態(tài)”下的研究生教育管理信息化系統(tǒng)設(shè)計:以福州大學(xué)為例[J].中國遠(yuǎn)程教育(綜合版),2017(1):71?76.
[2] 余舒萍,熊越強(qiáng).基于OpenKM的高校校院二級教學(xué)檔案管理系統(tǒng)的設(shè)計與應(yīng)用[J].山西檔案,2017(6):78?80.
[3] 黃波,朱昌平,黃健元,等.基于用戶視角的教學(xué)管理信息化建設(shè)績效評價:以教學(xué)管理信息系統(tǒng)建設(shè)為例[J].中國電化教育,2018(9):69?74.
[4] 張寶君,邢西深,楊辰,等.邁向2.0時代的天津市基礎(chǔ)教育信息化調(diào)查研究[J].中國電化教育,2019(7):127?133.
[5] 李尚濱,王德才.基于網(wǎng)絡(luò)平臺的高校體育教師評教系統(tǒng)設(shè)計與實(shí)現(xiàn)[J].繼續(xù)教育研究,2017(10):81?83.
[6] 張曉楓,郭芳,王利軍,等.基于關(guān)聯(lián)規(guī)則挖掘算法的審計綜合管理系統(tǒng)研究[J].電網(wǎng)與清潔能源,2017,33(12):48?51.
[7] 李濤,郁美辰,陸正邦,等.基于關(guān)聯(lián)規(guī)則挖掘的氣象觀測設(shè)備一致性檢測算法[J].電子測量與儀器學(xué)報,2017,31(10):1568?1573.
[8] 劉亞男.一生一檔·對癥施策:基于大數(shù)據(jù)挖掘的區(qū)域教學(xué)改進(jìn)[J].中小學(xué)管理,2019(2):30?33.
[9] 張琳,李小平,來林靜,等.基于游戲教學(xué)的分層數(shù)據(jù)挖掘方法研究與應(yīng)用[J].中國電化教育,2019(2):87?94.
[10] 劉軍煜,賈修一.一種利用關(guān)聯(lián)規(guī)則挖掘的多標(biāo)記分類算法[J].軟件學(xué)報,2017,28(11):2865?2878.
[11] 王玲,李樹林,徐培培,等.基于頻繁項(xiàng)集樹的時態(tài)關(guān)聯(lián)規(guī)則挖掘算法[J].控制與決策,2018,33(4):591?599.
[12] 劉莉萍,章新友,牛曉錄,等.基于Spark的并行關(guān)聯(lián)規(guī)則挖掘算法研究綜述[J].計算機(jī)工程與應(yīng)用,2019,55(9):1?9.
[13] 黃文成,賈立,彭道剛,等.基于Apriori的關(guān)聯(lián)規(guī)則算法及其在電廠中的應(yīng)用[J].系統(tǒng)仿真學(xué)報,2018,30(1):266?271.
[14] 侯燕,劉辛.基于主從架構(gòu)和GA的模糊關(guān)聯(lián)規(guī)則挖掘算法[J].控制工程,2017,24(2):276?282.
[15] 胡玉寧,丁明,伊鵬.基于數(shù)據(jù)挖掘的大學(xué)生虛擬社群社會網(wǎng)絡(luò)分析[J].中國成人教育,2017(8):64?68.