周梅
摘要摘要:教學質量是高等教育的核心,教學質量與教學管理手段直接相關。如何在教學過程中實施科學合理的教學管理方法,對于提高教學效果十分關鍵,而科學合理的教學管理手段必須建立在教與學過程的客觀現(xiàn)象之上。利用教學過程中產生的數(shù)據,通過數(shù)據挖掘技術發(fā)現(xiàn)隱藏在其中的教學規(guī)律,根據規(guī)律建立合理的考核方法和手段,從而達到保障教學效果、提高教學質量之目的。
關鍵詞關鍵詞:數(shù)據挖掘;關聯(lián)分析;教學管理
DOIDOI:10.11907/rjdk.171118
中圖分類號:G434
文獻標識碼:A文章編號文章編號:16727800(2017)005021303
0引言
大學教學質量與大學發(fā)展息息相關。教學過程中,教師的“教”受到多種因素影響,既有教師個體因素,也受到教學管理手段制約??茖W合理的教學管理手段不僅有助于提高教師的教學興趣,還有助于科學有效地實施教學目標和方法,從而提高教學效果。
1教學管理現(xiàn)狀
目前的教學管理手段主要是監(jiān)管型與懲罰型[1]。監(jiān)管型手段主要包括各種領導和退休教師的督導活動,還有學生對教學過程進行監(jiān)控和反映,以及不斷出臺的各種措施,對教師教的行為進行約束。懲罰型手段主要包括對教學過程中可能出現(xiàn)的失誤或過失行為進行懲戒。這些措施的主要目的是針對教學過程的“教”。從實際效果來看,這些措施效果有限,導致出現(xiàn)以下現(xiàn)象:
(1)教師的積極性不高,過多的無效管理措施限制了教師的主觀能動性,過多的監(jiān)管措施導致教師疲于應付,教師只是簡單根據措施實施,這些措施以外的可以有效促進教學的手段未必愿意執(zhí)行。
(2)教學管理手段針對性不強,手段目標不夠明確,雖然措施不斷增加,但并未真正解決問題。
(3)缺乏發(fā)現(xiàn)教與學癥結的工具和方法。目前,主要通過和學生交流的方式來發(fā)現(xiàn)問題,無法通過數(shù)據發(fā)現(xiàn)存在的問題。
2教學信息挖掘
教學過程中產生了大量的教學信息,包括平時成績、考勤情況、實驗情況、平時作業(yè)成績以及期末考試成績等。若能從這些大量數(shù)據中找出有用信息,在此基礎上制定合理有效的教學管理措施,對提高教學效果將大有裨益。
數(shù)據挖掘技術能夠自動高效地從海量數(shù)據中提取有價值的信息,從而有效支持決策[2]。數(shù)據挖掘技術有多種方法,其中之一就是關聯(lián)分析,即發(fā)現(xiàn)數(shù)據之間的關聯(lián)關系。大多數(shù)情況下,分析人員對數(shù)據中隱藏的關聯(lián)性是未知的,即使由于經驗積累,意識到數(shù)據間可能存在關聯(lián)性也是不確定的,所以頻繁模式的關聯(lián)規(guī)則挖掘便于找到數(shù)據之中一些隱藏的、高可信度的關聯(lián)規(guī)則[35]。
數(shù)據挖掘方法在學生成績和學生行為方面能夠發(fā)現(xiàn)學生活動與學習成績之間的關聯(lián)性[67],為學校管理人員及教師提供參考,在很大程度上提高學習管理決策有效性,提高教學質量和管理效率,因而挖掘學習成績與學生行為的關聯(lián)性十分必要。
與學習相關的行為主要包括平時成績、期末成績以及平時表現(xiàn)等,本文主要工作是挖掘學生期末成績與其平時成績的關聯(lián)性,探討其缺勤情況與第一次考勤情況的相關性,以及與寢室其他同學的缺勤情況相關性,從而明確何時采取怎樣的措施防止上課缺勤現(xiàn)象。
3基于Apriori算法的學生成績關聯(lián)分析
Apriori算法是一種通過逐層搜索的迭代方法挖掘關聯(lián)規(guī)則的算法,具體就是使用“k-1項集”搜索“k項集”。利用該算法挖掘平時成績與期末成績之間的關聯(lián)關系過程如圖1所示[8]。
3.1挖掘對象確定
根據教學經驗,推斷學生的平時成績和期末成績之間可能會有一定的關聯(lián)性,學生的出勤情況之間可能存在一定的關聯(lián)規(guī)則,除此之外,學生上課出勤情況很有可能會受到其所處環(huán)境的影響,所以挖掘學生缺勤情況與同一寢室的關聯(lián)性也是十分必要的。
3.2數(shù)據收集
從歷年的教學資料中收集不同年級學生在若干不同專業(yè)課上的表現(xiàn)情況,包括出勤情況以及平時成績、期末卷面成績等信息,并得到學生寢室分配情況。
3.3數(shù)據預處理
對收集到的學生成績和出勤情況數(shù)據進行數(shù)據預處理,主要包括數(shù)據清理和數(shù)據變換兩個步驟。
(1)數(shù)據清理。數(shù)據清理的主要目的是消除原始數(shù)據庫中的冗余數(shù)據、噪聲數(shù)據以及重復記錄。
學生成績數(shù)據中,有可能因為未參加考試或在考試中存在違規(guī)行為,導致考試成績缺失或者為0。這些數(shù)據對學生學習情況分析意義不大,所以要把這些數(shù)據刪除。
而對于學生出勤表,通過調查發(fā)現(xiàn)其缺勤是請假或其它原因,對于此類數(shù)據統(tǒng)一記為在勤。
(2)數(shù)據變換。將清理過的數(shù)據轉換為簡單易懂的模式。例如學生成績是以大量不同的數(shù)字呈現(xiàn)的,數(shù)據量較大且不易找到規(guī)律,因此需對各科成績的連續(xù)屬性值進行離散化處理。
成績相關的數(shù)據按照通用的五級制(A,B,C,D,E)來劃分,大于90分的記為”A”,小于60分的記為”E”。
對于出勤情況,可以按照字母順序(A、B、C、D……)定義若干次出勤,然后將出勤記為“1”,缺勤記為“0”,則第一次查勤,若出勤記為“A1”,否則記為“A0”,最后總的缺勤次數(shù)記為n。
經過以上變換,原始的學生成績庫被轉換成包含多個有效項集的表。由于學生姓名及學號與分析目標無關,也將其刪除。
為了挖掘學生缺勤和所處寢室之間的關聯(lián)性,收集有缺勤記錄的全部學生信息,然后以宿舍為單位,選取其中若干個代表宿舍。事務1包含宿舍第一次點名該寢室缺勤學生的學號,事務2包含該宿舍第二次點名該寢室缺勤學生的學號,以此類推。由于單個寢室的數(shù)據量較少,可選取多個典型寢室,使分析結果更具可信度。
3.4關聯(lián)規(guī)則產生
Apriori算法通過多次掃描經過處理的數(shù)據庫來尋找所有的頻繁項集。對于經過處理的學生成績表而言,每個事務包含有“平時成績”和“期末成績”兩個項。在對頻繁1-項集連接后,因為采用的是頻繁1項集,所以無需再對其子集進行判斷剪枝,直接對數(shù)據庫進行掃描計數(shù),刪除不滿足支持度閾值的候選項集,保留頻繁項集。
對于經過數(shù)據轉換的學生出勤表,每個事務包含有若干次出勤情況以及缺勤總數(shù)若干項。在對頻繁1-項集處理得到頻繁2-項集后,將其連接然后分析,得到各候選3-項集的子集。若有非頻繁子項集,則剪掉該項集,保留全部非空子集均為頻繁子項集的候選3-項集,然后掃描數(shù)據庫,比較支持度計數(shù),剔除小于最小支持度計數(shù)的候選項集,得到頻繁3-項集。以此類推,得到頻繁k-項集。
執(zhí)行算法,得到期末成績與平時成績的關聯(lián)規(guī)則如圖2所示。
4結果分析
4.1期末成績與平時成績的關聯(lián)規(guī)則挖掘結果
(1)挖掘到關聯(lián)規(guī)則,意味在平時成績?yōu)?0分以下時,期末卷面成績有83.3%的幾率仍維持在60分以下。對于這部分學生,教師需要重點關注,監(jiān)督他們平時學習情況,督促他們到課并幫助他們掌握每堂課所學知識,解決每次課程中的疑難問題。
(2)通過觀察頻繁項集可發(fā)現(xiàn),平時成績?yōu)锽0、C0、D0、E0(等同于90分以下)的學生,期末考試難以達到90分,這意味著在平時學習一般的學生期末也很難取得好的成績。相應的,平時成績?yōu)锳0(90分以上的學生)在期末考試僅有10%的概率達到90分以上,同時也有可能得到B1、C1、E1等較低分數(shù),這在某種程度上表明平時成績并不能準確體現(xiàn)學生知識掌握程度,學生在平時學習中存在到課不聽講、作業(yè)抄襲等情況,需要加以制止。
(3)按照及格與不及格情況分類得到的關聯(lián)規(guī)則可以看出,平時成績及格的學生,期末卷面成績及格率高達69%。整體而言,平時學習態(tài)度較為端正的學生在期末考試中不及格的概率很低。
4.2缺勤相關性
本文重點研究了第一次考勤與最后一次考勤及總體缺勤次數(shù)的相關性。
(1)第一次考勤與最后一次考勤的相關性。根據關聯(lián)規(guī)則給出的信息,第一次缺勤的學生最后一次出勤的概率高達77.8%,分析大概有兩方面原因:①因為最后一次課可能是復習課,這部分學生因為平時不聽講,在考前意識到上課的重要性,所以最后一次課選擇來上課;②點名累計未達到一定次數(shù),無法參加考試,有些學生可能意識到問題的嚴重性,最后一次選擇來上課。從這兩個原因來看,大部分學生還是希望能夠順利通過考試的,但有時因為懶散來上課。教師要向這部分學生強調上課的重要性,讓他們明確考試難度,靠最后的突擊復習通過考試不是很容易的。
(2)第一次考勤與總體缺勤次數(shù)的相關性。根據關聯(lián)規(guī)則可以看到,第一次出勤后再缺勤一次的學生占比較多,這部分學生可能學習態(tài)度還算端正,但偶爾會因為各種原因有一點懶散。此外,根據求得的各種規(guī)則置信度結果可以看出,第一次缺勤,后面仍會缺勤的概率在77.8%,所以對第一次點名就缺勤的學生要重點關注,因為這部分學生后期很可能再次出現(xiàn)不上課情況。
5結語
根據關聯(lián)分析結果可以看出學生的期末成績與平時成績的相關度,前面若干次考勤與后面考勤之間的關系,以及同一寢室學生之間相互影響的關系。通過這些分析,對于制定教學管理措施很有幫助。例如當學生兩次考勤不到時,就需要進行相應警告;對于平時抄襲行為需要制定較為嚴格的措施;同一寢室學生之間相互不良影響要采取措施。
通過數(shù)據挖掘分析技術,從大量客觀的教學數(shù)據中分析和發(fā)現(xiàn)相應的規(guī)律,并根據這些規(guī)律制定相應的教學管理措施,對改善教學效果大有幫助。
參考文獻參考文獻:
[1]王向東. 大學教師教學管理制度的反思與完善——基于教學行為與制度關系的視角[J].現(xiàn)代大學教育,2011(3):97102.
[2]楊秀萍. 數(shù)據挖掘技術及其在收視行為分析中的應用[J].福建電腦, 2013(4):124126.
[3]崔妍,包志強. 關聯(lián)規(guī)則挖掘綜述[J].計算機應用研究,2016(2):330334.
[4]章麗芳. 基于關聯(lián)挖掘的學生成績分析系統(tǒng)的研究[D].杭州:浙江工業(yè)大學,2011.
[5]崔學文. 關聯(lián)規(guī)則挖掘算法Apriori在學生成績分析中的應用[J].北方學院學報:自然科學版,2011(1):4447.
[6]C ANURADHA,T VELMURUGAN.A data mining based survey on student performance evaluation system[C].IEEE International Conference on Computational Intelligence and Computing Research (ICCIC), 2014.
[7]K B BRIJESH,P SAURABH.Mining educational data to analyze students performance[J].In International Journal of Advanced Computer Science and Applications, 2011,2(6):6369.
[8]趙洪英,蔡樂才,李先杰. 關聯(lián)規(guī)則挖掘的Apriori算法綜述[J].四川理工學院學報:自然科學版,2011(1):6670.
責任編輯(責任編輯:杜能鋼)