葉茂華
摘 要:高校一般采用綜合評定的手段對教學質(zhì)量進行評估,評估結(jié)果不僅有助于教師及時發(fā)現(xiàn)問題,也能夠?qū)虒W管理者進行管理決策。本文提出了一種改進型的關(guān)聯(lián)規(guī)則算法并用于高校教學評價系統(tǒng)中,該算法的運用對高校教學質(zhì)量的提高與發(fā)展有著重要的積極意義。
關(guān)鍵詞:高校;改進型關(guān)聯(lián)規(guī)則;教學評價
DOI:10.16640/j.cnki.37-1222/t.2017.23.242
1 引言
高校一般采用定量評價的方法來實現(xiàn)對教學情況的客觀評價,通過各方面的量化打分來反映教師的實際教學情況。目前高校對評價數(shù)據(jù)的發(fā)掘利用仍停留在數(shù)據(jù)表面,僅通過分值的高低采取相應的獎懲措施,對數(shù)據(jù)背后的潛在規(guī)律缺乏深入的認識和挖掘,導致大數(shù)據(jù)的價值得不到有效利用,因此利用關(guān)聯(lián)規(guī)則算法對評價結(jié)果進行數(shù)據(jù)挖掘,對高校的管理與決策有著現(xiàn)實意義。
2 關(guān)聯(lián)規(guī)則算法介紹
關(guān)聯(lián)規(guī)則主要用于發(fā)現(xiàn)事務(wù)各屬性間的潛在聯(lián)系性,為事務(wù)的相關(guān)決策提供有力支持。在高校教學評價系統(tǒng)中,利用關(guān)聯(lián)規(guī)則對大量的評價數(shù)據(jù)進行挖掘,能夠發(fā)現(xiàn)諸多潛在的有用價值。例如在教師隊伍中具有博士學位的教師,教學質(zhì)量為優(yōu)秀的比例最高,因此可以推斷教學質(zhì)量與教師學歷有著重要的關(guān)系,高校可以鼓勵教師進修學習,提高個人學歷,進而提升高校的教學水平。
(1)事務(wù)與項。事務(wù)是指描述的對象,項是指事務(wù)可能具有的屬性,一般采用數(shù)據(jù)集的形式描述事務(wù)與項的關(guān)聯(lián)關(guān)系。如表 1所示,數(shù)據(jù)集的每一行表示一組記錄,對應一個事務(wù)的描述,每一列表示一種事務(wù)可能存在的屬性,整張數(shù)據(jù)表稱為數(shù)據(jù)庫的全體事務(wù)集。某一行某一列數(shù)據(jù)為“1”則表示該行所指事務(wù)具備該列所指屬性,數(shù)據(jù)為“0”則表示該事務(wù)不具備該屬性。
(2)數(shù)據(jù)項集。在關(guān)聯(lián)規(guī)則中數(shù)據(jù)項的集合也被稱為數(shù)據(jù)項集,如果某項集共包含k個項,則稱為k-項集,當k為0時為空項集,在項集中任意一個項都是該數(shù)據(jù)項集的一個子集。
(3)數(shù)據(jù)項集的支持度。在全體事務(wù)集中某項集X出現(xiàn)的次數(shù)稱為全體數(shù)據(jù)項集對項集X的支持數(shù),進一步利用概率值表示該支持數(shù),即支持數(shù)比上全體事務(wù)集的總項數(shù)即為數(shù)據(jù)項集對項集X的支持度。
(4)關(guān)聯(lián)規(guī)則。對于全體事務(wù)數(shù)據(jù)集中不相交的兩項集X與Y,通過表達式X?Y來表示項集間的關(guān)聯(lián)規(guī)則,并利用規(guī)則支持度(Sup ( X Y) )與規(guī)則可信度(Conf (X Y) )兩個指標來表示項集X與項集Y關(guān)聯(lián)規(guī)則的強度。
3 改進型關(guān)聯(lián)規(guī)則挖掘算法介紹
改進型關(guān)聯(lián)規(guī)則挖掘方法首先利用關(guān)聯(lián)規(guī)則對全體事務(wù)數(shù)據(jù)集進行預處理,剔除非頻繁項集的候選子集以減少數(shù)據(jù)處理量;其次對數(shù)據(jù)庫進行全面的掃描處理,運用哈希函數(shù)、分組表等方式對全體事務(wù)集中的事務(wù)樹進行剪枝處理,極大減少了數(shù)據(jù)庫的掃描時間,提高了全體事務(wù)集中頻繁項集的提取速度,使得算法的效率得到顯著提高。算法的具體實施流程如下所述:
(1)產(chǎn)生頻繁2-項集。利用哈希函數(shù)對全體事務(wù)數(shù)據(jù)庫進行掃描處理,生成頻繁2-項集。
(2)修剪數(shù)據(jù)庫。通過生成的頻繁2-項集,對全體事務(wù)數(shù)據(jù)庫進行修剪,剔除非頻繁2-項集的其他無交集項目,減少了待處理的數(shù)據(jù)量,節(jié)約了數(shù)據(jù)的存儲空間。
(3)數(shù)據(jù)分組記錄。根據(jù)數(shù)據(jù)與頻繁2-項集的關(guān)聯(lián)關(guān)系將修剪得到的數(shù)據(jù)分別存入相應的分組數(shù)據(jù)表中以待進一步處理。
(4)產(chǎn)生候選項目集。從頻繁2-項集開始搜索,通過相鄰層頻繁項集的結(jié)合建立頻繁項樹,并通過剪枝操作對關(guān)系樹進行修剪,最終得到全部候選項目集。
(5)產(chǎn)生頻繁項目集。對候選項目集的支持度進行計算,若某項集中分組表的支持度均大于等于某一閾值,則該候選項集為頻繁項目集。
4 改進型關(guān)聯(lián)規(guī)則挖掘算法在高校教學評價中的具體應用
根據(jù)改進型關(guān)聯(lián)規(guī)則挖掘算法的具體設(shè)計要求,并對現(xiàn)有的教學評價數(shù)據(jù)及各教學主體的實際需求進行分析,整個數(shù)據(jù)挖掘分析子模塊工作流程圖如圖1所示。從圖中可以看出,改進型關(guān)聯(lián)規(guī)則算法主要通過以下三個步驟。
第一步數(shù)據(jù)預處理階段,通過對收集的教學評價數(shù)據(jù)表進行預處理,將冗余的字段信息進行刪除,得到教學評價因素信息表。對于部分學生的非正常評價,可設(shè)置條件進行刪除,以避免對后續(xù)評價結(jié)果的影響。
第二步采用關(guān)聯(lián)規(guī)則算法對頻繁項集進行確認,由于在數(shù)據(jù)表中有些數(shù)據(jù)會影響到挖掘的結(jié)果,因此需要通過該算法對影響到挖掘質(zhì)量的相關(guān)信息進行處理。例如:對熟悉教材、內(nèi)容豐富、信息量大等同類評價信息可進行歸類,設(shè)置最小支持度,將重復評價記錄進行刪除,最后再通過該算法對評價信息表中的數(shù)據(jù)進行不斷讀取和比較,從而找到所需的頻繁項集,提高了挖掘精度。
第三步推導關(guān)聯(lián)規(guī)則,通過設(shè)置的最小置信度和頻繁項集進行關(guān)聯(lián),對滿足所需條件的關(guān)聯(lián)規(guī)則進行推導和確認。
5 小結(jié)
挖掘教學評價數(shù)據(jù)中的潛藏信息,對提高教師的教學能力、指導高校進行教學改革以及提升辦學實力都有著重要的作用。本文主要對關(guān)聯(lián)規(guī)則算法所存在的弊端,提出了一種改進型的關(guān)聯(lián)規(guī)則算法,通過該算法能夠較好的解決高校教學評價的提取與分析效率,具有一定的應用價值。
參考文獻:
[1]陳正權(quán).關(guān)聯(lián)規(guī)則挖掘算法及其在職校教學評價系統(tǒng)中的應用研究[D].蘇州大學,2015:21-23.
[2]王偉.關(guān)聯(lián)規(guī)則中的Apriori算法的研究與改進[D].中國海洋大學,2016:10-12.
[3]張麗梅.提升高校教師教學質(zhì)量評價工作的探討[J].內(nèi)蒙古財經(jīng)學院學報(綜合版),2015:
12-15.endprint