摘 要:網(wǎng)絡(luò)學(xué)習(xí)中客觀題基本實現(xiàn)了自動批改,但主觀題自動批改仍有待研究。本文利用數(shù)據(jù)挖掘中的機器學(xué)習(xí)方法,提出一種基于決策樹的主觀題自動批改方法。該方法從教師給出的標(biāo)準(zhǔn)答案中自動發(fā)現(xiàn)批改規(guī)則,依據(jù)這些規(guī)則自動批改學(xué)生的作業(yè)。文中給出了實驗的結(jié)果,該結(jié)果顯示了決策樹方法的有效性。
關(guān)鍵詞:主觀題 自動批改 決策樹
中圖分類號:TP751 文獻標(biāo)識碼:A 文章編號:1672-3791(2012)12(a)-0207-02
網(wǎng)絡(luò)學(xué)習(xí)作為一種新的教學(xué)形式,受到越來越多的關(guān)注。與傳統(tǒng)課堂教學(xué)相比,現(xiàn)代網(wǎng)絡(luò)學(xué)習(xí)有一定的優(yōu)勢,主要體現(xiàn)在:網(wǎng)絡(luò)學(xué)習(xí)不受時間、地點的限制,學(xué)生可以自由安排學(xué)習(xí)的時間和地點;網(wǎng)絡(luò)學(xué)習(xí)是一種整體式教學(xué)、個性化學(xué)習(xí)的教學(xué)模式,學(xué)生可以根據(jù)自己的需求自主選擇學(xué)習(xí)的內(nèi)容和方式,自由調(diào)節(jié)學(xué)習(xí)進度;網(wǎng)絡(luò)學(xué)習(xí)可以利用龐大的教學(xué)信息資源,通過電子郵件、論壇等多種形式實現(xiàn)師生間的互動,為學(xué)生提供有效的知識體系[1];網(wǎng)絡(luò)教學(xué)具有信息容量大、資料更新快和多向演示、模擬生動的顯著特征,這一點是有限空間、有限時間的傳統(tǒng)教學(xué)方式所無法比擬的。
隨著計算機虛擬現(xiàn)實技術(shù)、仿真技術(shù)、數(shù)據(jù)挖掘技術(shù)、人工智能等技術(shù)的不斷發(fā)展,傳統(tǒng)課堂教學(xué)在作業(yè)批改、實時反饋、情感交流滲透等方面獨有的優(yōu)勢,將逐漸被網(wǎng)絡(luò)教學(xué)系統(tǒng)引入和完善。
作業(yè)批改是保證學(xué)生掌握知識和改進教學(xué)的重要環(huán)節(jié)。作業(yè)題主要有兩大類:一類是客觀題,答案比較明確。評分通常采用精確匹配方法,答案相同則得分,否則不得分;另一類主觀題,答案沒有唯一標(biāo)準(zhǔn)。一般是敘述方式答題,個人對知識的理解程度不同,表述也不一致[2]。利用計算機技術(shù)實現(xiàn)自動批改,不僅可以節(jié)省大量手工批改工作,能及時反饋評分結(jié)果,而且避免了批改過程的人為因素[3]。目前客觀題的自動批改基本日趨成熟,被廣泛應(yīng)用到各類大規(guī)模的考試中。而主觀題的批改由于涉及人工智能、模式識別和自然語言理解等領(lǐng)域的知識,主觀題的自動批改已成為亟待解決的問題[4]。
21世紀(jì)以來,主觀題自動批改的研究得到了一些發(fā)展。劉建舟等提出了一種利用中文信息處理中的句子相似度的主觀題自動批改方法[5];李佳林通過分析主觀題人工評分的思維習(xí)慣,提出了關(guān)鍵字匹配和關(guān)鍵字貼近度匹配相結(jié)合的主觀題自動評分方法[6];潘國清提出了文本語義形式化的表示方法,即語片表示法,實現(xiàn)了主觀題的自動判分系統(tǒng)[7]。
已開發(fā)的主觀題自動批改系統(tǒng),主要采用學(xué)生作業(yè)與標(biāo)準(zhǔn)答案匹配的模式進行評分,對標(biāo)準(zhǔn)答案要求具有嚴(yán)格、詳細的格式,增加了出題的難度;有些系統(tǒng)只能處理具有特定句型的答案,當(dāng)學(xué)生的答案不屬于規(guī)定句型,系統(tǒng)不能進行正確批改。
針對主觀題自動批改目前存在的問題,本文運用決策樹方法,探討自動評定主觀題等級的方法。該方法對于完善網(wǎng)絡(luò)教學(xué)模式、保證網(wǎng)絡(luò)學(xué)習(xí)質(zhì)量具有重要的意義。
1 決策樹方法的原理
決策樹方法是非常有效的分類方法,類似一個流程圖的樹型結(jié)構(gòu),其中樹的每個非葉子結(jié)點代表對一個特征的測試,決定了數(shù)據(jù)是如何劃分的,而樹的每個葉結(jié)點代表一個類別,樹的最高層就是根結(jié)點。圖1是和表1對應(yīng)的決策樹示意圖,該決策樹可以用于鑒別未來保險申請人的申請是高風(fēng)險還是低風(fēng)險[8]。
通過對樣本集中各數(shù)據(jù)行內(nèi)容的分析來創(chuàng)建決策樹。根據(jù)給定的樣本集,找到一個函數(shù)Y=f(X);使用該函數(shù)判別新樣本的類別。該方法采用信息論中的概念,用信息增益作為決策屬性分類判別能力的依據(jù),進行決策節(jié)點屬性的選擇。根據(jù)主觀題數(shù)據(jù)的特點,本文采用最典型的決策樹方法C4.5[8],該方法構(gòu)造簡單,速度較快,容易實現(xiàn)。
2 基于決策樹的主觀題自動批改方法設(shè)計
將主觀題批改轉(zhuǎn)化為分類問題,具有不同關(guān)鍵詞的主觀題劃分到不同類別,最終實現(xiàn)主觀題的自動評分。主觀題自動批改方法的大致流程如圖2所示。
2.1 實驗用例
整個實驗基于weka軟件完成,weka是一個免費的機器學(xué)習(xí)軟件環(huán)境,包含了常用的機器學(xué)習(xí)方法。本文以一個常見的化學(xué)主觀題為例來說明方法的有效性。
主觀題:什么是分子?
標(biāo)準(zhǔn)答案:分子是保持物質(zhì)化學(xué)性質(zhì)的一種微粒。
關(guān)鍵詞和相應(yīng)的權(quán)值:關(guān)鍵詞1:化學(xué)性質(zhì);權(quán)值:0.7,關(guān)鍵詞2:微粒;權(quán)值:0.3。
學(xué)生答案1:分子是一種物質(zhì)。
學(xué)生答案2:分子是一種微粒。
學(xué)生答案3:分子是保持物質(zhì)化學(xué)性質(zhì)的一種微粒。
2.2 實驗結(jié)果
將標(biāo)準(zhǔn)答案、關(guān)鍵詞、及其權(quán)值作為輸入,構(gòu)建如圖3所示決策樹。依據(jù)該決策樹,假設(shè)該題滿分為10分。學(xué)生1得分為0分;學(xué)生2得分為3分;學(xué)生3得分為10分。
3 結(jié)論
在主觀題自動批改方法中,利用決策樹從標(biāo)準(zhǔn)答案中提取批改規(guī)則,而且提取的規(guī)則描述簡單,應(yīng)用時只需將學(xué)生作業(yè)與批改規(guī)則進行對照,即可得出正確的分?jǐn)?shù),為主觀題批改的數(shù)字化提供了一條途徑。
實驗的結(jié)果可以看出,為了提高批改的精度,需要進一步改進決策樹方法,以進一步揭示標(biāo)準(zhǔn)答案與學(xué)生作業(yè)之間的關(guān)聯(lián),提高批改準(zhǔn)確率。
參考文獻
[1]袁一達.網(wǎng)絡(luò)教學(xué)的優(yōu)勢與不足[J].現(xiàn)代遠距離教育,2008,5(119):44-45.
[2]李志清.電子作業(yè)自動批改中問題的研究[D].湖南:湘潭大學(xué),2003.
[3]黃康,袁春風(fēng).基于領(lǐng)域概念網(wǎng)絡(luò)的自動批改技術(shù)[J].計算機應(yīng)用研究,2004(11):260-262.
[4]馮娟,詹國華.基于數(shù)據(jù)挖掘技術(shù)的電子作業(yè)批改機制[J].中國教育信息化,2008(8):46-48.
[5]劉建舟,劉曉華.主觀題自動批改技術(shù)的研究[J].湖北工業(yè)大學(xué)學(xué)報,2006,4(21):62-65.
[6]李佳林.在線考試系統(tǒng)中主觀題自動閱卷的設(shè)計[J].中國教育技術(shù)裝備,2008(24):113-114.
[7]潘國清.受限主觀題自動判分系統(tǒng)設(shè)計與實現(xiàn)[J].北京教育學(xué)院學(xué)報,2009,1(4):10-14,23.
[8]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2006.