摘 要: 對于教育測評所積累的大量數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)能產(chǎn)生出對學(xué)生、教師、教育管理者有用的知識。為此,從教育測評的目的、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)積累方法,到數(shù)據(jù)的知識挖掘等幾個方面,系統(tǒng)地研究了教育測評的知識發(fā)現(xiàn)的過程,并分別就三種需求的知識發(fā)現(xiàn)方法進(jìn)行探討,以改變教育測評僅能提供定性的結(jié)論而不能發(fā)現(xiàn)知識的狀況,豐富教育測評的內(nèi)涵。
關(guān)鍵詞: 教育測評; 知識; 知識發(fā)現(xiàn); 數(shù)據(jù)挖掘
中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2013)04-12-03
Research and implementation of network training analysis system based on data mining technology
Huo Xiaogang
(Zhejiang Technical Institute of Economics, Hangzhou, Zhejiang 310018, China)
Abstract: As for a large amount of data accumulated in education evaluation, useful knowledge for students, teachers and education administrators can be produced through data mining technology. Therefore, from the purpose of the education evaluation, to the data preparation, data accumulation method and data knowledge mining, the process of knowledge discovery in education evaluation system is systematically researched. Three kinds of knowledge discovery methods are respectively discussed, to change the situation that the education evaluation can only provide qualitative conclusion and can not find the status of knowledge, and it also enriches the connotation of education evaluation.
Key words: education evaluation; knowledge; knowledge discovery; data mining
0 引言
在教學(xué)中,隨著電子試卷的普及,在教學(xué)實施過程中已積累了大量的數(shù)據(jù),但目前這些數(shù)據(jù)大多僅僅起到對學(xué)習(xí)者進(jìn)行一種終結(jié)性的定性作用,而沒有起到教育測評的另一個重要作用——激勵。并且,當(dāng)數(shù)據(jù)積累到一定程度后,這些數(shù)據(jù)又將成為某種形式的數(shù)據(jù)垃圾,與當(dāng)年的商業(yè)數(shù)據(jù)一樣,產(chǎn)生了“數(shù)據(jù)爆炸,但又同時出現(xiàn)知識貧乏”現(xiàn)象,失去了收集數(shù)據(jù)作為決策依據(jù)的實際意義。測試所產(chǎn)生的數(shù)據(jù)對學(xué)習(xí)可能是毫無幫助的,如果擔(dān)心不理想的測試結(jié)果會影響將來,那么測試將成為學(xué)習(xí)者學(xué)習(xí)的負(fù)擔(dān)。因此,應(yīng)用現(xiàn)代信息技術(shù)對教育測評產(chǎn)生的數(shù)據(jù)進(jìn)行合理處理,對其中所包含的信息進(jìn)行挖掘,產(chǎn)生出對教育者與受教育者有指導(dǎo)意義的知識,使每一次教育測評的結(jié)果能為教育者與學(xué)習(xí)者指明方向,使其從懼怕測試變?yōu)橹鲃討?yīng)用測試以指導(dǎo)教學(xué)與學(xué)習(xí),逐步提高教育教學(xué)與學(xué)習(xí)效果。
1 教育測評數(shù)據(jù)挖掘的數(shù)據(jù)準(zhǔn)備
教育測評的主體是受教育者,受教育者在接受一定時期的指導(dǎo)后,通過教育測評來檢查學(xué)習(xí)的成果,教育者也可以通過受教育者檢查的結(jié)果來反觀自己的教育成果,從中找出雙方都需要的“知識”。因此,在教育測評前應(yīng)該想到教育測評數(shù)據(jù)的后期作用,在系統(tǒng)設(shè)計階段對數(shù)據(jù)庫表的設(shè)計加以研究,以方便以后的數(shù)據(jù)挖掘工作。
1.1 數(shù)據(jù)源的產(chǎn)生
就某一門學(xué)科而言,表面上來看,教育測評就是根據(jù)教學(xué)大綱所要求的內(nèi)容,制定出符合實際要求的試題,對受教育者進(jìn)行測試。但實際過程中與測試有關(guān)的數(shù)據(jù)還有:教育者、學(xué)科知識等,因此,教育測評的數(shù)據(jù)主要有五個來源:⑴教育者數(shù)據(jù)源;⑵被測試者數(shù)據(jù)源;⑶測試科目知識點(diǎn)數(shù)據(jù)源;⑷測試者行為數(shù)據(jù)源;⑸測試題目數(shù)據(jù)源。
⑴ 教育者數(shù)據(jù)源主要是指:在教育過程中,施教者——教師的個人的各種屬性。如姓名、性別、年齡、所授課程等。在本文中,教育者數(shù)據(jù)源的集合用T來表示。
⑵ 被測試者數(shù)據(jù)源主要是指:教育過程中的主體——學(xué)生的各種個人屬性的集合。如姓名、性別、年齡、年級、班級、上課課程等。在本文中,被測試者數(shù)據(jù)源的集合用S來表示的。
⑶ 測試科目知識點(diǎn)數(shù)據(jù)源主要是指:測試測試科目所規(guī)定的要求掌握的知識點(diǎn),知識點(diǎn)的屬性可用知識點(diǎn)所在科目的章、節(jié)、條來表示。在本文中,知識點(diǎn)數(shù)據(jù)源的集合用K來表示。
⑷ 測試者行為數(shù)據(jù)源主要是指:測試者在進(jìn)行測試時所產(chǎn)生的行為的記錄的集合。一般是指測試者對測試題目回答的記錄。如果要對其回答題目時間進(jìn)行判斷,也可加入時間量。在本文中,測試者行為數(shù)據(jù)源的集合用A來表示。
⑸ 測試題目數(shù)據(jù)源是指:測試者或教師,根據(jù)科目對知識點(diǎn)要求的情況,制訂的測試題目的集合。在本文中,測試題目數(shù)據(jù)源的集合用Q來表示。
在實際的測試過程中,測試者行為數(shù)據(jù)源的集合A收集的是測試者對測試試題的集合Q的子集的響應(yīng)情況,反映對知識點(diǎn)掌握的程度,隨測試者行為的變化而變化,其他四個數(shù)據(jù)源則相對穩(wěn)定。其目的是在知識發(fā)現(xiàn)過程中,由測試者行為數(shù)據(jù)源A找出受教育者的學(xué)習(xí)情況、教育者教學(xué)后的效果、被測試者學(xué)習(xí)情況和教育者關(guān)心的各知識點(diǎn)掌握情況的關(guān)聯(lián)程度,以及學(xué)習(xí)者對自己掌握知識點(diǎn)與未掌握知識點(diǎn)全面了解。通過對測試者知識面掌握情況的分析,發(fā)現(xiàn)相關(guān)教育者的教學(xué)情況、測試題目的難易情況、試卷組合的合理性等方面的知識。
1.2 數(shù)據(jù)源屬性的設(shè)置
⑴ 教育者數(shù)據(jù)源的集合T:T={t1,t2,…,tn},每一個元素ti表示一個教育者的屬性的記錄。
⑵ 被測試者數(shù)據(jù)源的集合S:S=S{(s1,t1),(s2,t1),…,(sn,tm),},si表示一個測試者屬性的記錄,ti∈T。
⑶ 學(xué)科知識點(diǎn)數(shù)據(jù)源的集合K:K=K{k1,k2…,kn},ki表示一個學(xué)科知識點(diǎn)的記錄。
⑷ 測試題目數(shù)據(jù)源的集合用Q:Q=Q{(q1,k1),(q2,k1),…,(qn,km),},qi表示一個測試題目屬性的記錄,ki∈K。
⑸ 測試者行為數(shù)據(jù)源的集合用A:A=A{(s1,q1,a1),(s2,q2,a2),…,(sm,qn,ap)},ai表示一個測試者對問題響應(yīng)的結(jié)果的記錄是布爾型變量,其中q i∈Q,si∈S。
1.3 數(shù)據(jù)源之間的關(guān)系
通過以上的設(shè)置,從測試者行為數(shù)據(jù)源集A中ai的狀況能直接判斷出測試者si對問題qi的反映情況,建立了一個通過測試者行為數(shù)據(jù)源A與教育者T、測試者S和知識點(diǎn)K之間的關(guān)系圖(如圖1所示)。通過測試者的行為反映出接受教育的情況,從而能挖掘出有效的知識,供教育者、教育管理者、測試者來使用。
1.4 測試者行為對各種數(shù)據(jù)積累方法
每當(dāng)測試者si對Q中所產(chǎn)生的問題qi響應(yīng)的行為時,通過A、S、T、K所建立起的關(guān)系把所產(chǎn)生的數(shù)據(jù)累積到各對應(yīng)的數(shù)據(jù)集的屬性中,為挖掘知識的積累所需的原始數(shù)據(jù)。
測試者si的行為是所有知識挖掘的基礎(chǔ),當(dāng)測試者對問題Q進(jìn)行響應(yīng)時,將會產(chǎn)生連鎖反應(yīng)。
⑴ 測試試題數(shù)據(jù)積累方法。對于某一個si∈S,對A中的qi(qi∈Q)的響應(yīng),產(chǎn)生測試者行為an,an是布爾變量,或真(.T.)或假(.F.)。對于an=.F.的響應(yīng),首先對于其對應(yīng)的qi∈Q,在Q中找到qi,記錄下本次響應(yīng)的結(jié)果(an=.T.的響應(yīng)不用記錄)。并進(jìn)行累積,為研究Q中每一元素的合理性積累數(shù)據(jù)。
⑵ 學(xué)科知識點(diǎn)掌握情況數(shù)據(jù)積累方法。對于某一個si∈S,對A中的qi(qi∈Q)的響應(yīng),同時,qi對應(yīng)著K中的某一處kj∈K。當(dāng)an=.F.時,通過qi∈Q中的(qi,kj)關(guān)系,都可以找到對應(yīng)的kj,把a(bǔ)n=.F.的響應(yīng)通過qi累積到kj中。為研究挖掘K中知識發(fā)現(xiàn)作好數(shù)據(jù)準(zhǔn)備。
⑶ 受試者數(shù)據(jù)積累方法。對于某一個si∈S,對A中的每一次選擇的Q的子集Qi的所有元素的響應(yīng)。把Qi中所有an=.T.記錄在si的行為記錄中,把所有an=.F.也記錄在si的行為記錄中。對每一次si∈S的行為分開記錄,構(gòu)成si的完整的行為響應(yīng)軌跡,這樣可以通過后面的挖掘找出si的某些方面的知識。
⑷ 教育者數(shù)據(jù)積累方法。對于某一個tj∈T,通過與S的關(guān)系(si,tj),對S中的數(shù)據(jù)積累進(jìn)行引用,將能挖掘測試者行為,而且生出對每一個ti的知識。
2 教育測評后知識挖掘的實現(xiàn)
教育過程是由課程的知識點(diǎn)來構(gòu)成的,當(dāng)每一次的教育測評完成,實質(zhì)是對該課程知識點(diǎn)接受情況的反映。同時,也反映出講授本課程的教師的授課情況。對于某一課程,理想狀況是當(dāng)受教育者掌握了本課程的所有知識點(diǎn),則表明受教育者完成本課程的學(xué)習(xí)。
對于教育測評完成后,有關(guān)的教育參與者與管理者所關(guān)心的側(cè)重點(diǎn)是不同的。通過多次的測評,學(xué)生(測試者)、老師(教育者)和教學(xué)管理人員將期望從測評的結(jié)果中產(chǎn)生對自己有用的知識。
測試者(學(xué)生)所關(guān)心的是:
⑴ 學(xué)習(xí)效果鑒定情況;
⑵ 學(xué)科知識點(diǎn)掌握的總體情況;
⑶ 獲得指導(dǎo)性學(xué)習(xí)意見。
教育者(教師)所關(guān)心的是:
⑴ 施教效果分析(掌握所授學(xué)科知識點(diǎn)學(xué)生總體情況);
⑵ 施教改進(jìn)方向(知識點(diǎn)掌握情況);
⑶ 測試題目效果分析與改進(jìn)。
教育管理者(教學(xué)管理者)所關(guān)心的是:
⑴ 教育執(zhí)行總體情況分析(老師);
⑵ 教育執(zhí)行分布情況分析。
通過教育測評,由測試者的行為分別對A、Q、K、S數(shù)據(jù)集產(chǎn)生影響,形成原始的數(shù)據(jù)積累后,根據(jù)教育統(tǒng)計學(xué)原理,挖掘出所關(guān)心的各種知識。
2.1 學(xué)生所需知識的挖掘方法
當(dāng)測試完畢,測試者得到對自己學(xué)習(xí)成果的鑒定與今后學(xué)習(xí)的指導(dǎo)性意見。即對于某個si∈S,產(chǎn)生A的子集,對Q的子集Q(j)作出響應(yīng)后,a=.T.的比率及a=.F.所對應(yīng)的K集合中所影響的元素k。
⑴ 用匯總的方法計算學(xué)生鑒定的效果
在A中,某個si∈S,計算成績
其中,qj∈Q(j)。
若結(jié)果C(si)大于所設(shè)定的闞值(及格線)m,則鑒定為合格。同時,也可以計算出某一有共同特征的S的子集S(j)中所有元素si的成績C(si)(si∈S),排列出si的相對位置作為激勵。
⑵ 用分類的方法指出學(xué)生的學(xué)習(xí)方向
指導(dǎo)性意見來自于對學(xué)科知識點(diǎn)的反應(yīng)。在K中通過Q記錄下a=.F.所影響的元素kj,根據(jù)其所在章節(jié)進(jìn)行分類,給出學(xué)生學(xué)習(xí)導(dǎo)向。A中所記錄測試者si對Q的響應(yīng)中a=.F.所有qi,反映了對問題的錯誤響應(yīng)。而問題qi中與知識點(diǎn)ki∈K相對應(yīng)的所有qi,反映了學(xué)生對知識點(diǎn)ki的掌握情況。
對于某一學(xué)科的知識點(diǎn)集合K(j)?K,包含有n個知識點(diǎn)kn∈K(j),其中n=1,2,…,n。在A中si∈S,計算si對K(j)的錯誤響應(yīng)個數(shù)M(kj):
將M(kj)與相對應(yīng)的知識點(diǎn)進(jìn)行列表,如表1所示。
其中,Q(j)?Q,且滿足Q(qj,kn),kn∈K(j)。學(xué)生可以根據(jù)上表所列情況,得出學(xué)習(xí)弱點(diǎn),找尋自己的學(xué)習(xí)方向。
2.2 教師所需知識的挖掘方法
教育測評后,教師ti∈T所關(guān)心是的自己的施教手段與方法是否達(dá)到了預(yù)期的效果。主要表現(xiàn)在授課對象(測試者)的集合S(i)=S(t,s)?S,其中t=ti,對問題Q的響應(yīng)情況,實質(zhì)上是對Q中相對應(yīng)的學(xué)科知識點(diǎn)K的認(rèn)識是否正確。同時,在眾多測試者響應(yīng)后,對問題qi是否設(shè)置合理得當(dāng),也可以通過測試者的響應(yīng)情況作出相應(yīng)的判斷,教師也可以根據(jù)情況,得出是否對問題qi的改進(jìn)。
⑴ 教師對整體的期望
對于某一個ti∈T。求出
其中,S(i)=S(t,s)?S,t=ti ;Q(i)是ti所關(guān)心某一個或一些知識點(diǎn)相關(guān)的qi所組成的Q的子集。通過這一計算,教師取得了在本次測試的整體狀態(tài)的情況。
⑵ 學(xué)科知識點(diǎn)掌握情況
關(guān)于某一個章節(jié)知識點(diǎn)K(i)?K學(xué)生響應(yīng)情況的統(tǒng)計結(jié)果|A(S(i),Q(i),a=.F.)|,其中S(i)=S(t,s)?S,其中t=ti ;Q(i)=Q(ki,qi)?Q,其中ki∈K(i)。
從統(tǒng)計結(jié)果分析,在教師授課后,對于學(xué)生對各章節(jié)知識點(diǎn)的掌握情況,我們采用分類匯總的方式。對于某一章節(jié)的知識點(diǎn)的集合K(i)?K中的元素ki∈K(i),分析當(dāng)t=ti時,
得出教師ti關(guān)于知識點(diǎn)ki的授課后學(xué)生對知識點(diǎn)的掌握情況。
通過表2教師可以發(fā)現(xiàn)教學(xué)過程中學(xué)科知識點(diǎn)掌握的分布情況,找出相應(yīng)的提高教學(xué)效果的策略。
⑶ 試題效果的改進(jìn)
相同知識點(diǎn)的不同表述所產(chǎn)生的題目可能會影響測試者的響應(yīng)行為,因此,對同一知識點(diǎn)的不同表述所產(chǎn)生的題目的難度系數(shù)不同,若通過多批次的測試,難度系數(shù)發(fā)散,則說明關(guān)于知識點(diǎn)ki的表述不盡合理,就需改進(jìn)出題策略。用dj表示題目qj∈Q難度系數(shù),統(tǒng)計其變化,難度也將會收斂于某一個值。
其中,N為所有選擇題目qj的累積人數(shù)。通過比較同一個ki下的不同qj的難度系數(shù),就可以得出出題情況的不同表述。
2.3 管理者所需知識的挖掘方法
教育管理者關(guān)心的是教師授課的執(zhí)行情況,教師授課情況的信息來源主要是學(xué)生對于所學(xué)課程測試的響應(yīng)情況。從測試者對測試的響應(yīng)中來判斷知識點(diǎn)掌握情況,同時反映出教師對所授課的知識點(diǎn)的授課情況。因此,對教師一個時期的考查可以從知識點(diǎn)掌握的分布與知識點(diǎn)掌握情況通過測試卷之間的差距來判斷。
⑴ 對于所有的ti∈T,建立知識點(diǎn)掌握情況矩陣
表3中,rij是ti教學(xué)中知識點(diǎn)kj的掌握情況,
從這個矩陣中,教育管理者可以對所有老師的知識點(diǎn)授課情況做一個全面的比較和了解??梢葬槍δ骋焕蠋煹慕虒W(xué)弱點(diǎn)進(jìn)行指導(dǎo)。
⑵ 知識點(diǎn)掌握情況方差分析
方差主要用來表現(xiàn)數(shù)據(jù)波動的大小。對于教師由時間順序進(jìn)行的測試,進(jìn)行方差分析,結(jié)果見表4。對于方差漸大的ti,說明教學(xué)過程中分化越來越嚴(yán)重。表4與表3相對照,就能反應(yīng)出教師授課情況。這些可為教育管理者提供管理的依據(jù)。
3 結(jié)束語
數(shù)據(jù)挖掘技術(shù)起源于商業(yè)活動中所產(chǎn)生的海量數(shù)據(jù)的處理,把數(shù)據(jù)轉(zhuǎn)化為用于商業(yè)決策的信息,并成功解決眾多的實際問題,目前已廣泛應(yīng)用于商業(yè)活動,技術(shù)已相當(dāng)成熟。對于教育活動中產(chǎn)生大量數(shù)據(jù)的網(wǎng)絡(luò)化訓(xùn)練與測試,也可利用數(shù)據(jù)挖掘技術(shù)了解學(xué)習(xí)者的學(xué)習(xí)動態(tài),制定學(xué)習(xí)與教學(xué)計劃的重點(diǎn)與難點(diǎn),發(fā)現(xiàn)隱藏在數(shù)據(jù)中的有用信息,使之成為指導(dǎo)學(xué)習(xí)的“知識”,從而成為教師與學(xué)生提高學(xué)習(xí)效率的“智慧”。通過知識的挖掘培養(yǎng)學(xué)生的自我評價能力,學(xué)生從畏懼評價,到主動參與評價,使評價真正起到指導(dǎo)學(xué)習(xí)方向、激勵學(xué)習(xí)的作用,同時也使評價成為教師制訂授課指導(dǎo)重點(diǎn)與難點(diǎn)的依據(jù)。
參考文獻(xiàn):
[1] 閆寒冰.信息化教學(xué)評價[M].教育科學(xué)出版社,2003.
[2] 楊永斌.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用研究[J].計算機(jī)科學(xué),2006.12.
[3] Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques[M].機(jī)械工業(yè)出版社,2001.
[4] 朱德利.SQL SERVER 2005數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].電子工業(yè)出版社,2007.
[5] 毛國君,段立娟,王實,石云.數(shù)據(jù)挖掘原理與算法[M].清華大學(xué)出版社,2007.
[6] 安淑芝.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].清華大學(xué)出版社,2005.
[7] 朱德全.教育統(tǒng)計與測評技術(shù)[M].西南大學(xué)出版社,2007.
[8] 陳安,陳寧,周龍驤.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].科學(xué)出版社,2006.