李蘭春,王雙成,王 輝
(1.上海立信會計學(xué)院外語學(xué)院,上海 201620;2.上海立信會計學(xué)院數(shù)學(xué)與信息學(xué)院,上海 201620;3.中央民族大學(xué)信息工程學(xué)院,北京 100081)
課堂教學(xué)評估的多層次貝葉斯網(wǎng)絡(luò)分類器方法
李蘭春1,王雙成2,王 輝3
(1.上海立信會計學(xué)院外語學(xué)院,上海 201620;2.上海立信會計學(xué)院數(shù)學(xué)與信息學(xué)院,上海 201620;3.中央民族大學(xué)信息工程學(xué)院,北京 100081)
課堂教學(xué)是為實現(xiàn)一定的教學(xué)目標(biāo)而展開的信息傳遞、過程控制和策略實施過程.依據(jù)課堂教學(xué)的特點給出了課堂教學(xué)評估的指標(biāo)體系,并在此基礎(chǔ)上建立了課堂教學(xué)評估的層次貝葉斯網(wǎng)絡(luò)分類器模型.為提高分類器的分類識別準(zhǔn)確率,在連續(xù)屬性中引入形狀參數(shù),實驗結(jié)果顯示,通過形狀參數(shù)的優(yōu)化能夠顯著提高分類器的分類識別可靠性.
課堂教學(xué);樸素貝葉斯網(wǎng)絡(luò);分類器;評估
課堂教學(xué)是為實現(xiàn)一定的教學(xué)目標(biāo),通過信息傳遞、過程控制和策略實施而展開的師生之間的雙邊活動.[1-2]課堂教學(xué)已經(jīng)具有悠久的歷史,在相當(dāng)長的一段時間內(nèi)仍將是一種主要的教學(xué)方式,也是學(xué)生建立知識結(jié)構(gòu)、發(fā)展認(rèn)知結(jié)構(gòu)和人格形成的主要途徑.課堂教學(xué)質(zhì)量評估能夠為制定更科學(xué)的教學(xué)策略提供具有針對性的信息,有助于推動教學(xué)改革和提高教學(xué)質(zhì)量.目前課堂教學(xué)評估主要采用三級指標(biāo)體系[3-4],在指標(biāo)之間具有線性關(guān)系的假設(shè)下,根據(jù)三級指標(biāo)計算出二級指標(biāo),再由二級指標(biāo)最終確定一級指標(biāo)的等級.這一等級判斷過程是一個層次分類問題(模擬人類概念學(xué)習(xí)與應(yīng)用的技術(shù)),而且基于分類器的課堂教學(xué)質(zhì)量等級判斷不需要線性關(guān)系的假設(shè),因此在評價的可靠性方面具有優(yōu)勢,并可開拓課堂教學(xué)評估的新思路.
現(xiàn)在已經(jīng)有了許多著名的分類器,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹、統(tǒng)計判別分析和貝葉斯網(wǎng)絡(luò)等,它們在許多領(lǐng)域得到了廣泛的應(yīng)用.但這些分類器往往都需要許多例子數(shù)據(jù)進(jìn)行學(xué)習(xí).課堂教學(xué)方面的例子數(shù)據(jù)一般比較少,而且其中的連續(xù)數(shù)據(jù)也不適合于離散化(離散化會丟失過多的信息).樸素貝葉斯網(wǎng)絡(luò)(naive Bayesian network,簡記為NBN)[5-6]分類器是目前最適合于小例子集分類預(yù)測的概率分類器,這種分類器不需要許多例子數(shù)據(jù)用于訓(xùn)練,并且能夠直接處理連續(xù)屬性.在樸素貝葉斯網(wǎng)絡(luò)分類器中處理連續(xù)屬性的核心問題是條件密度估計,目前主要采用兩種方式來估計條件密度[7-8]:一種是使用高斯函數(shù)來估計屬性條件密度,而高斯函數(shù)可能與實際密度函數(shù)有較大的差距,從而影響分類器的分類準(zhǔn)確性;另一種是采用高斯核函數(shù)估計屬性條件密度,高斯核函數(shù)又易于導(dǎo)致對例子的過度擬合,也同樣會降低分類器的泛化能力.
本文從課堂教學(xué)的信息傳遞、過程控制和教學(xué)策略三個方面來制定課堂教學(xué)質(zhì)量評估的指標(biāo)體系,并針對課堂教學(xué)質(zhì)量評估的實際情況和需求建立多層次樸素貝葉斯網(wǎng)絡(luò)(mult-h(huán)ierarchical naive Bayesian network,簡記為MHNBN)分類器模型.為避免使用高斯核函數(shù)估計屬性條件密度可能導(dǎo)致的對例子過度擬合問題,在高斯核函數(shù)中引入形狀參數(shù),并通過形狀參數(shù)的優(yōu)化來提高分類器的分類識別準(zhǔn)確性.
MHNBN分類器學(xué)習(xí)包括結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩部分.結(jié)構(gòu)學(xué)習(xí)一般是依據(jù)專家的領(lǐng)域知識確定指標(biāo)之間的層次關(guān)系;參數(shù)學(xué)習(xí)是使用例子數(shù)據(jù)進(jìn)行邊緣和條件概率估計,以及在某種分布假設(shè)下的連續(xù)屬性條件密度估計.
NBN分類器基于這樣的假設(shè):當(dāng)類變量給定時,屬性變量之間條件獨立.這一假設(shè)決定了NBN分類器結(jié)構(gòu)是星形結(jié)構(gòu).MHNBN分類器是NBN分類器的層次組合,下面給出標(biāo)準(zhǔn)NBN分類器結(jié)構(gòu)(用S表示)和一個三層次MHNBN分類器的層次樹,如圖1所示.
圖1 NBN分類器結(jié)構(gòu)和分類器層次樹
在圖1(a)的標(biāo)準(zhǔn)NBN分類器結(jié)構(gòu)中,類結(jié)點是所有屬性結(jié)點的唯一父結(jié)點;圖1(b)是將NBN分類器作為一個結(jié)點而得到的MHNBN分類器層次結(jié)構(gòu)樹,將圖1(b)的上面兩層展開后的分類器結(jié)構(gòu)如圖2所示.
圖2 展開后的兩層次分類器結(jié)構(gòu)
MHNBN分類器參數(shù)學(xué)習(xí)是依據(jù)例子數(shù)據(jù)估計概率和密度的過程,以圖2所示的兩層次分類器(分別稱為上層分類器和下層分類器)為例給出參數(shù)學(xué)習(xí)方法.在由一級和二級指標(biāo)構(gòu)成的上層分類器中,C和X u1,…,X ut都是離散指標(biāo)變量;而由二級和三級指標(biāo)構(gòu)成的下層分類器中,底層指標(biāo)X u11,…,X u1v1,X u21,…,X u2v2,…,X ut1,…,X utvt可以是離散或連續(xù)指標(biāo).
1.2.1 一級和二級指標(biāo)邊緣概率估計
采用最大似然估計方法,那么,一級和二級指標(biāo)需要估計邊緣概率(先驗概率).
一級指標(biāo)邊緣概率估計:
其中N(c|D)為例子數(shù)據(jù)集D中第c類(C=c)的例子數(shù)量,N(D)為所有例子數(shù)量.
二級指標(biāo)邊緣概率估計:
其中N(x ui|D)為例子數(shù)據(jù)集D中第x ui類(X ui=x ui)的例子數(shù)量.
1.2.2 二級和三級指標(biāo)條件概率或密度估計
對于非葉子結(jié)點的二級或三級指標(biāo),只需要估計條件概率;而對作為葉子結(jié)點的二級或三級指標(biāo)可能要估計條件概率(離散指標(biāo))和條件密度(連續(xù)指標(biāo)).
二級離散指標(biāo)的條件概率估計:
其中N(x ui,c|D)為第c類中X ui=x ui的例子數(shù)量.
三級離散指標(biāo)的條件概率估計:
其中N(x ui k,x ui|D)為第x ui類中X uik=x uik的例子數(shù)量.
三級連續(xù)指標(biāo)的條件密度估計:
以兩個層次的MHNBN分類器為例,給出MHNBN分類器的表示形式和分類過程.基于貝葉斯網(wǎng)絡(luò)理論和貝葉斯公式,以及圖2中所體現(xiàn)的條件獨立性關(guān)系,可得:
分類過程是:首先由下層分類器確定二級指標(biāo)X u1,…,X ut的值,然后再基于上層分類器得到一級指標(biāo)的值.多層次分類器的分類也是這樣的自下而上的過程.
首先建立課堂教學(xué)評估指標(biāo)體系,然后結(jié)合指標(biāo)體系與例子數(shù)據(jù)便能夠建立MHNBN分類器,并基于MHNBN分類器進(jìn)行課堂教學(xué)評估.
指標(biāo)體系是進(jìn)行課堂教學(xué)評估的前提,依據(jù)教育控制論、系統(tǒng)科學(xué)原理和課堂教學(xué)機(jī)制等建立一個課堂教學(xué)評估三級指標(biāo)體系,也可根據(jù)實際需要對指標(biāo)體系進(jìn)行層次擴(kuò)展.
(1)一級指標(biāo)
課堂教學(xué)等級(C)分4個級別,分別是:A級(優(yōu)秀),B級(良好),C級(一般),D級(較差).
(2)二級指標(biāo)
課堂教學(xué)所屬的二級指標(biāo)是:課堂信息傳遞(X1),課堂教學(xué)控制(X2),課堂教學(xué)策略(X3).它們都分三個等級,分別是A級(好),B級(中)和C級(差)
(3)三級指標(biāo)
課堂信息傳遞所屬的三級指標(biāo):教師向?qū)W生的信息傳遞(語法信息傳遞(X11),語義信息傳遞(X12),語用信息傳遞(X13)),學(xué)生向教師的信息傳遞(反饋信息(X14),前饋信息(X15),退饋信息(X16)).
課堂教學(xué)控制所屬的三級指標(biāo):知識結(jié)構(gòu)控制(概念(X21),規(guī)則(X22),問題解決(X23)),認(rèn)知結(jié)構(gòu)控制(認(rèn)知操作(X24),動力供給(X25),認(rèn)知策略(X26)),方式控制(程序控制(X27),隨機(jī)控制(X28)).
課堂教學(xué)策略所屬的三級指標(biāo):講授式教學(xué)(X31),啟發(fā)式教學(xué)(X32),演繹式教學(xué)(X33),概括式教學(xué)(X34),回溯式教學(xué)(X35).
根據(jù)上面的課堂教學(xué)評估指標(biāo)體系可得到兩層次的MHNBN分類器結(jié)構(gòu),如圖3所示.
圖3 用于課堂教學(xué)評估的MHNBN分類器結(jié)構(gòu)
基于分類器結(jié)構(gòu)和例子數(shù)據(jù)進(jìn)行參數(shù)估計,從而得到用于課堂教學(xué)評估的MHNBN分類器,輸入最新課堂教學(xué)信息,通過分類運算便可獲得課堂教學(xué)的等級.
在UCI機(jī)器學(xué)習(xí)數(shù)據(jù)倉庫[9]中選擇12個具有連續(xù)屬性的分類數(shù)據(jù)集,分別使用對連續(xù)屬性離散化(DNBN)、高斯密度估計(GNBN)、高斯核密度估計(GKNBN)和引入形狀數(shù)的高斯核密度估計(GKSNBN)而得到的NBN分類器進(jìn)行分類預(yù)測,采用10折交叉有效性(10-fold cross-validation)驗證方法進(jìn)行分類器的分類準(zhǔn)確性估計,如表1所示.
表1 分類預(yù)測準(zhǔn)確率比較
從表1中可以看出,DNBN分類器具有良好的分類準(zhǔn)確率,而GKNBN分類器要優(yōu)于DNBN和GNBN分類器,GKSNBN分類器還要優(yōu)于GKNBN分類器.這表明使用把DNBN分類器和GKSNBN分類器層次組合而得到的MHNBN分類器,進(jìn)行課堂教學(xué)評估等級判斷將是比較可靠的.
根據(jù)教育控制論、系統(tǒng)科學(xué)原理和課堂教學(xué)機(jī)制等給出了一個課堂教學(xué)評估的三級指標(biāo)體系,在此基礎(chǔ)上,具有針對性地建立了用于課堂教學(xué)評估的動態(tài)層次樸素貝葉斯網(wǎng)絡(luò)分類器.為提高分類器層次組件的分類準(zhǔn)確性,在連續(xù)屬性的條件密度估計中引入了形狀參數(shù),并通過形狀參數(shù)的優(yōu)化來提高分類器的泛化能力,實驗結(jié)果顯示,形狀參數(shù)的優(yōu)化能夠顯著提高分類器的分類準(zhǔn)確性,這表明將其用于課堂教學(xué)質(zhì)量評估,所得到的評估識別結(jié)果會更加可靠.
[1]王黎.應(yīng)用型本科經(jīng)濟(jì)學(xué)課堂教學(xué)改革探索[J].教育探索,2010,1:64-65
[2]楊金觀,聶建峰.課堂教學(xué)質(zhì)量評價——一個在高校實際工作中被誤解的概念[J].高教發(fā)展與評估,2010,1:15-20.
[3]陳弘,李幽錚,鄭鋼.基于AHP法的教師教學(xué)質(zhì)量評估改進(jìn)模型[J].金陵科技學(xué)院學(xué)報,2010,26(1):31-34.
[4]劉香芹,陳俠.模糊多層次多屬性高校教師教學(xué)質(zhì)量評估[J].沈陽航空工業(yè)學(xué)院學(xué)報,2010,27(2):90-92.
[5]RAMONI M,SEBASTIANI P.Robust Bayes classifiers[J].Artificial Intelligence,2001,125(1/2):209-226.
[6]JING Y S,PAVLOVI C'V,REHG J M.Boosted Bayesian network classifiers[J].Machine Learning,2008,73(2):155-184.
[7]JOHN G H,LANGLEY P.Estimating continuous distributions in Bayesian classifiers.[C]//Proceedings of the 11th International Conference on Uncertainty in Artificial Intelligence,Bec Canada:Qu &Eacute,1995:106-143.
[8]PéREZ A,LARRANAGA P,INZA I.Bayesian classifiers based on kernel density estimation[J].International Journal of Approximate Reasoning:Flexible Classifiers,2009,50(2):341-362.
[9]MURPHY S L,AHA D W.UCI repository of machine learning databases[EB/OR].[2009-12-04].http://www.ics.uci.edu/~mlearn/MLRepository.Html.
The method of mult-h(huán)ierarchical Bayesian network classifier for classroom teaching assessment
LI Lan-chun1,WANG Shuang-cheng2,WANG Hui3
(1.School of Foreign Studies,Shanghai Lixin University of Commerce,Shanghai 201620,China;2.School of Mathematics and Information,Shanghai Lixin University of Commerce,Shanghai 201620,China;3.School of Information Engineering,The Central University for Nationalities,Beijing 100081,China)
The classroom teaching is a process of teaching information transfer,classroom control and implementation of teaching strategies for realizing certain educational objectives.A index system of classroom teaching assessment is presented based on the features of classroom teaching.And a model of mult-h(huán)ierarchical naive Bayesian network classifier is developed for classroom teaching assessment.In order to improve the classification accuracy of classifier,the shape parameter is pulled in continuous attributes.Experimental results show that the reliability of classifier can be significantly improved by shape parameter optimization.
classroom teaching;naive Bayesian network;classifier;assessment
TP 181
520·20
A
1000-1832(2012)01-0050-05
2011-02-04
國家自然科學(xué)基金資助項目(60675036);教育部人文社科基金資助項目(10YJA630154);上海市教委重點學(xué)科建設(shè)項
目(J51702);上海市教委科研創(chuàng)新重點項目(09zz202).
李蘭春(1959—),女,講師,主要從事教育原理與評估研究;王雙成(1958—),男,博士,教授,主要從事智能數(shù)據(jù)處理研究;王輝(1961—),男,碩士,教授,主要從事決策支持技術(shù)研究.
陶 理)