郝小靜
摘要:現(xiàn)今的教育領(lǐng)域中應用先進的技術(shù)對學生學習成績進行評價和分析,能節(jié)省教師更多的時間,并能提高對學生成績的準確的評價?;谶@樣的原因,在此次的研究中,對數(shù)據(jù)挖掘技術(shù)的英語成績評價進行分析和研究,主要從數(shù)據(jù)挖掘的方法、數(shù)據(jù)準備和數(shù)據(jù)模型進行分析和探討。望此次的論述能為現(xiàn)今英語教學效果評價體系的建立,提供可行性的建議,進而提升對學生英語成績評價結(jié)果的準確性。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 英語成績評價 數(shù)據(jù)庫
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2016)12-0246-01
目前,在現(xiàn)今的高校教育體系中,教學管理方面涉及到眾多的地數(shù)據(jù),但是現(xiàn)今在對教學數(shù)據(jù)進行管理的技術(shù)仍舊停留在查詢、備份和統(tǒng)計的階段,對學生學習狀況予以該種的管理方式,未能真實的反應出學生實際的學習狀況。因此,本文從以下幾個方面進行具體論述。
1 數(shù)據(jù)挖掘技術(shù)使用分析
1.1 項目簡介
在現(xiàn)今的高校中,教師積累了大量學生英語考試成績的數(shù)據(jù),對學生英語成績評價的分析和評價的標準為優(yōu)、良、中、及格、不及格等,對于學生取得成績的影響因素的了解不深。在此次研究中,主要對A高校財會管理專業(yè)986名學生的英語成績作為研究數(shù)據(jù),通過對英語考試成績學生分數(shù)的情況分析出影響學生成績主要因素,進而輔助教師制定針對性教學改進方法,提升學生的英語成績。
1.2 數(shù)據(jù)挖掘方法的使用
在此次研究中,數(shù)據(jù)挖掘的方法主要采用ID3的運算方法,在對該課題進行研究的過程中,主要采用決策樹當中的ID3的計算方法對學生英語考試成績進行系統(tǒng)的分析和研究,由于該種算法的理論較為清晰,對數(shù)據(jù)和信息處理的能力較強,適合對海量學習方面的數(shù)據(jù)進行管理[1]。
2 數(shù)據(jù)挖掘技術(shù)在英語評價中的實施探究
2.1 數(shù)據(jù)準備
由于數(shù)據(jù)準備屬于整個研究過程中較為重要的環(huán)節(jié),要對研究的數(shù)據(jù)進行處理,首先,對研究數(shù)據(jù)進行清理,在該高校的專業(yè)中,由于存在缺考和取消考試成績的現(xiàn)象存在,對該部分的數(shù)據(jù)進行清理,得到最終有效數(shù)據(jù)為980條。其次,要對數(shù)據(jù)進行的總結(jié)和歸納,對英語考試成績中各種題型及其屬性生成決策樹的模型,并構(gòu)建學生英語考試成績的數(shù)據(jù)分析圖表。最后,要對數(shù)據(jù)進行轉(zhuǎn)換,在完成決策樹的過程中需要應用離散值,學生英語考試成績是呈連續(xù)值出現(xiàn)的,在研究的過程中,應轉(zhuǎn)化成離散值,在此次研究中,主要將考試成績劃分為兩種:一種是成績合格,其分數(shù)段為60~100分;另一種是不合格,分數(shù)為0~60分。
2.2 數(shù)據(jù)模型系統(tǒng)構(gòu)建
通過基礎(chǔ)數(shù)據(jù)集的編輯,各個題型分數(shù)等級為:A(優(yōu))、B(良)、C(不合格),四種題型(語法結(jié)構(gòu)、完形填空、閱讀理解、翻譯)中,得到兩個C等級的分數(shù),則視為學生英語總成績?yōu)椴缓细?。根?jù)這樣的計算方法來建立決策樹,首先,對研究對象的所有數(shù)據(jù)進行計算,將成績合格來分類即合格與不合格。其次,對所有數(shù)據(jù)的信息量進行計算,通過使用ID3的算法對研究數(shù)據(jù)進行計算得知,各個題型的信息量分別為:
E=(語法結(jié)構(gòu))=0.9478
E=(閱讀理解)=0.9482
E=(完形填空)=0.9324
E=(翻譯)=0.9381
再者,對四種題型得分數(shù)據(jù)繼續(xù)進行細化,計算出英語測試屬性中信息的增益率,得到的計算結(jié)果為:
Gain(語法結(jié)構(gòu))=0.0121
Gain(閱讀理解)=0.0122
Gain(完形填空)=0.0254
Gain(翻譯)=0.0217
最后,通過對每項英語測試的結(jié)果進行分析得知,在四項英語考試成績中,增益率較高的考試類型是完形填空,其對學生英語考試成績的影響較大,由于該項研究內(nèi)容的信息增益率同其他項目相比較高,選擇將其作為測試的屬性[2]。創(chuàng)建出研究和測試的節(jié)點,將完形填空作為標記,然后將其他三項考試類型的屬性值最為分支,進而生成評價學生英語成績是否合格的決策樹模型。
在學生學習英語課程的過程中,影響學生英語水平和考試成績的因素一直未能確定,通過ID3的計算方式,能將影響學生英語考試成績的因素分析出來?;谶@樣的狀況,以分類為合格的方式為此次研究中最應遵守的原則,從上圖的分析中得到學生英語成績評價和分析的計算方法:
If:完形填空=A and翻譯=A and語法結(jié)構(gòu)=A,Then:總成績=合格
If:完形填空=A and翻譯=C and閱讀理解=A,Then:總成績=合格
If:完形填空=A and翻譯=B and閱讀理解=A,Then:總成績=合格
If:完形填空=A and翻譯=C and語法結(jié)構(gòu)=A,閱讀理解=B,Then:總成績=合格
If:完形填空=A and翻譯=A and閱讀理解=A and語法結(jié)構(gòu)=B,Then:總成績=合格
……
通過對學生考試成績的分析得知,影響高校學生英語考試成績的主要的因素是完形填空題型解題方面,由于其包含了眾多的英語知識,即語法、翻譯和閱讀理解等方面的英語知識。
3 結(jié)語
在本文的論述中,主要針對高校學生英語考試評價方面,利用數(shù)據(jù)挖掘技術(shù)的相應處理和計算,來掌握影響學生英語考試成績的重要因素。在此次研究中,從介紹研究對象和數(shù)據(jù)處理方式方法開始,對英語考試中數(shù)據(jù)的屬性進行細化,從四項英語題型合格的信息量和增益率的角度對題型進行劃分,從而探索出影響學生英語考試成績的主要因素,并在文中對學生英語考試成績合格評價決策樹進行構(gòu)建,進而得到評價學生英語考試合格的準確方法。通過本文的論述得知,ID3的計算方法,對數(shù)據(jù)處理的能力較強,適用于對學生英語成績評價和分析,望此次的研究結(jié)果能為高校教師和學生提供教學和學習的輔助方法,提升學生的學習成績。
參考文獻
[1]王士虎,呂紀榮,馮波 等.基于數(shù)據(jù)挖掘的英語四級成績分析與預測[J].電腦知識與技術(shù),2014,03:452-454.
[2]吳燕萍,樓彩虹,沈清 等.數(shù)據(jù)挖掘技術(shù)在高職高專醫(yī)學生綜合學業(yè)成績評價中的應用[J].中國高等醫(yī)學教育,2014,05:40-41.