楊東海 錢瑩
[摘?????????? 要]? 考試成績是評價教學(xué)質(zhì)量的重要指標(biāo),對學(xué)生考試成績的準(zhǔn)確預(yù)測可以幫助教師提前預(yù)估學(xué)生學(xué)習(xí)效果并及時調(diào)整教學(xué)方法和策略。回顧利用數(shù)據(jù)挖掘算法搭建學(xué)生考試成績預(yù)測模型的關(guān)鍵步驟,重點討論該模型在高職教育中的應(yīng)用方法、關(guān)鍵要點以及如何根據(jù)預(yù)測結(jié)果來優(yōu)化調(diào)整后續(xù)的教學(xué)工作并提高學(xué)生培養(yǎng)質(zhì)量。
[關(guān)鍵詞考試成績;預(yù)測;數(shù)據(jù)挖掘;高職教育
[中圖分類號]G712?? ? [文獻(xiàn)標(biāo)志碼]? A??? ? [文章編號]? 2096-0603(2018)34-0001-03
一、引言
近年來,我國出臺了一系列政策來支持發(fā)展現(xiàn)代職業(yè)教育,希望培養(yǎng)大批技能型人才來服務(wù)于經(jīng)濟(jì)社會的發(fā)展。同時,“中國制造2025”計劃的提出,也將帶來新一輪的制造業(yè)升級,對具有“工匠精神”的應(yīng)用型人才的迫切需求向高等職業(yè)教育提出了越來越高的要求。在我國,高職院校是培養(yǎng)應(yīng)用技能型人才的主要基地,其在高等職業(yè)教育系統(tǒng)內(nèi)的重要地位不言而喻。隨著我國高等教育招生規(guī)模的逐年擴(kuò)大,高職院校也在快速發(fā)展,但依然面臨著生源質(zhì)量不高等一系列問題。在高考中,高職院校的分?jǐn)?shù)線普遍低于本科,是最后一個批次錄取。進(jìn)入高職院校就讀的學(xué)生往往高考成績不夠理想,其知識基礎(chǔ)、學(xué)習(xí)習(xí)慣、自我約束力、自我激勵等主客觀因素都存在很大的改善空間[1]。因此,學(xué)生求知欲不強(qiáng)、缺乏刻苦鉆研的精神、與教師的課堂互動不積極等現(xiàn)象普遍存在于高職院校的教學(xué)過程中。最終的結(jié)果體現(xiàn)在教學(xué)質(zhì)量不高,學(xué)生實際能力難以滿足社會的需要。
在高等教育中,學(xué)生的考試成績往往是評價教學(xué)質(zhì)量的重要依據(jù)之一,考試分?jǐn)?shù)能夠在一定程度上反映學(xué)生對專業(yè)知識的掌握程度[2]。然而在實際教學(xué)中,期末考試往往意味著該門課程教學(xué)過程的完結(jié),在考試結(jié)束后即使知曉了學(xué)生的分?jǐn)?shù),也再沒有機(jī)會對已經(jīng)結(jié)束的教學(xué)過程進(jìn)行調(diào)整和優(yōu)化。因此,許多高校教師迫切希望使用更加有預(yù)見性的工具,在教學(xué)過程中能夠隨時評估教學(xué)質(zhì)量,從而可以根據(jù)預(yù)先評估的結(jié)果對教學(xué)進(jìn)行實時調(diào)整,強(qiáng)化優(yōu)勢,彌補(bǔ)不足,進(jìn)一步改善教學(xué)質(zhì)量。事實上,在學(xué)生參加期末考試且分?jǐn)?shù)真正揭曉之前,其學(xué)習(xí)效果并非無跡可尋,而是隱藏在一系列“蛛絲馬跡”中,例如學(xué)生自身的特點、前導(dǎo)課程的成績、出勤統(tǒng)計、聽課狀態(tài)、平時作業(yè)完成情況等,這些特征都與其考試成績有著千絲萬縷又難以解釋的聯(lián)系。具有多年教學(xué)經(jīng)驗的教師能夠憑經(jīng)驗從這些特征中得到一些模糊的“感覺”,然而僅僅憑主觀經(jīng)驗和感覺來評估學(xué)生的學(xué)習(xí)效果,其準(zhǔn)確性和科學(xué)性都是值得商榷的。
為了解決這個問題,學(xué)者提出使用數(shù)據(jù)挖掘算法來搭建學(xué)生考試成績預(yù)測模型,通過對學(xué)生成績的預(yù)測,來提前評估教學(xué)質(zhì)量。數(shù)據(jù)挖掘技術(shù)是一種深層次的數(shù)據(jù)分析方法,通過仔細(xì)分析大量數(shù)據(jù)來揭示有意義的新的關(guān)系、趨勢和模式的過程,其任務(wù)就是發(fā)現(xiàn)隱藏在數(shù)據(jù)中潛在的模式,為決策提供支持[3,4]。所以數(shù)據(jù)挖掘技術(shù)非常適合用于揭示學(xué)生考試成績與其他相關(guān)因素之間隱含的非線性的復(fù)雜關(guān)系,其搭建的成績預(yù)測模型是將教師的一些主觀經(jīng)驗和感覺以數(shù)學(xué)的形式進(jìn)行量化描述。近幾年,決策樹、核Fisher判別分析、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)、多元回歸分析等數(shù)據(jù)挖掘算法已經(jīng)用于實現(xiàn)學(xué)生成績預(yù)測模型的搭建,并取得了良好的效果[1,4-6]。然而,大部分學(xué)者的研究重點放在如何在“技術(shù)”上取得突破(例如,各種數(shù)據(jù)挖掘算法的應(yīng)用、改進(jìn)與創(chuàng)新),卻很少有學(xué)者討論應(yīng)用該模型的初衷——如何在“教育”(特別是高職教育)中基于該模型的預(yù)測結(jié)果來優(yōu)化調(diào)整后續(xù)的教學(xué)工作并提高學(xué)生培養(yǎng)質(zhì)量。
為了能夠更好地將“技術(shù)”服務(wù)于“教育”,本文在作者前期研究成果的基礎(chǔ)上,首先回顧了利用數(shù)據(jù)挖掘算法搭建學(xué)生成績預(yù)測模型的主要步驟,然后分析討論了在高職教學(xué)中應(yīng)用預(yù)測模型的若干關(guān)鍵問題,如使用模型的目的和方法、如何根據(jù)預(yù)估的成績采取有針對性的措施來優(yōu)化當(dāng)前的教學(xué)過程等。
二、建立學(xué)生考試成績預(yù)測模型的主要步驟
在不同的教學(xué)場景,教師對成績預(yù)測的要求也不盡相同,一部分教師僅僅希望知曉學(xué)生的成績是否能夠及格,而另一部分教師則希望看到學(xué)生考試成績具體分?jǐn)?shù)的預(yù)測結(jié)果。根據(jù)采集到的數(shù)據(jù)和預(yù)測結(jié)果的不同類型,成績預(yù)測可以轉(zhuǎn)化為分類、關(guān)聯(lián)分析、回歸分析等問題,因此建立預(yù)測模型所采用的數(shù)據(jù)挖掘算法、輸入和輸出數(shù)據(jù)的形式也不同。在目前的研究中,更多的是把預(yù)測模型假設(shè)為“黑箱”,影響考試成績的因素是黑箱的輸入,考試成績作為黑箱的輸出,則搭建預(yù)測模型的問題可以簡化對黑箱功能函數(shù)的逼近[7]。
無論采用哪種數(shù)據(jù)挖掘算法,其建立預(yù)測模型的框架是類似的,包含的主要步驟為:
(一)數(shù)據(jù)收集
學(xué)生考試成績與影響成績的因素之間的復(fù)雜關(guān)系隱藏在樣本數(shù)據(jù)中,最終的模型也是通過數(shù)據(jù)挖掘算法對樣本數(shù)據(jù)訓(xùn)練而得到的,因此數(shù)據(jù)是模型搭建的核心要素之一。需要收集的數(shù)據(jù)范圍主要是學(xué)生的考試成績和那些對成績影響比較大的要素,比較常用的包括學(xué)生個人信息(性別、生源地、入學(xué)成績等)、教學(xué)過程中的相關(guān)信息(前導(dǎo)課程的成績、學(xué)生的出勤統(tǒng)計、平時作業(yè)分?jǐn)?shù)等)等。
(二)數(shù)據(jù)預(yù)處理
收集到的原始樣本數(shù)據(jù)可能會存在缺失、冗余、不在合理區(qū)間等現(xiàn)象,直接使用這些不規(guī)范的數(shù)據(jù)會影響預(yù)測模型的準(zhǔn)確性和泛化能力,因此需要在使用之前對數(shù)據(jù)進(jìn)行篩選、補(bǔ)充等預(yù)處理操作,有些數(shù)據(jù)挖掘算法還要求對數(shù)據(jù)做進(jìn)一步的采樣、離散化、歸一化等操作。
(三)確定輸入特征變量
輸入特征變量代表模型輸入數(shù)據(jù)的維度屬性,應(yīng)該從原始樣本數(shù)據(jù)中選擇那些對學(xué)生考試成績影響最大的一組變量。
(四)建立預(yù)測模型
采用某種數(shù)據(jù)挖掘算法對訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,得到預(yù)測模型。
(五)優(yōu)化模型參數(shù)
預(yù)測模型中會包含某些參數(shù)(不同的數(shù)據(jù)挖掘算法所使用的參數(shù)不同),這些參數(shù)會對模型的性能產(chǎn)生比較大的影響,因此需要基于不同的參數(shù)組合反復(fù)訓(xùn)練模型,并利用驗證數(shù)據(jù)集的測試結(jié)果選擇一組最優(yōu)的參數(shù)組合,用于訓(xùn)練最終的預(yù)測模型。
(六)進(jìn)行學(xué)生成績預(yù)測
利用搭建好的模型對學(xué)生成績進(jìn)行預(yù)測(如果是進(jìn)行實驗,則可以對測試數(shù)據(jù)集進(jìn)行測試,并基于測試結(jié)果進(jìn)行評價)。
三、在高職教學(xué)中應(yīng)用成績預(yù)測模型的若干關(guān)鍵
問題
使用數(shù)據(jù)挖掘算法搭建學(xué)生考試成績預(yù)測模型在技術(shù)上已經(jīng)趨于成熟,作為專業(yè)教師,我們還應(yīng)該關(guān)注如何在高職教學(xué)中應(yīng)用這種模型工具來輔助教學(xué)。
(一)明確使用預(yù)測模型的目的
作為在高職教學(xué)一線工作的教師,我們需要意識到,對學(xué)生考試成績進(jìn)行預(yù)測僅僅是一種手段,而高職教育的最終目的是為了通過高質(zhì)量教學(xué)來培養(yǎng)動手能力強(qiáng)的應(yīng)用技能型人才。因此,在應(yīng)用預(yù)測模型時,不應(yīng)該僅僅沉迷于建立一個預(yù)測精度高的數(shù)學(xué)模型,卻忽略了教學(xué)的本質(zhì)——建立模型并進(jìn)行成績預(yù)測并不是工作的終點,恰恰相反,這才是后續(xù)一系列重要教學(xué)工作的起點。教師需要根據(jù)預(yù)測的結(jié)果來綜合評估每個學(xué)生的學(xué)習(xí)狀態(tài)和整體教學(xué)效果,并根據(jù)學(xué)生的不同狀態(tài)因材施教,切實根據(jù)學(xué)生個體作個性化的指導(dǎo)。對有可能不及格的學(xué)生及時找出原因,有針對性地采取具體措施提高他們的學(xué)習(xí)成績;對成績優(yōu)異的學(xué)生則可以引導(dǎo)其進(jìn)行更深入的自主學(xué)習(xí)或者參與課外項目。
(二)模型輸入特征變量的選擇
預(yù)測模型的準(zhǔn)確性與數(shù)據(jù)挖掘算法的特點、模型參數(shù)及輸入特征變量的選擇息息相關(guān)。為了得到盡可能準(zhǔn)確的預(yù)測結(jié)果,教師應(yīng)根據(jù)講授課程的實際情況,從學(xué)生的自身特點、前導(dǎo)課程的成績、教學(xué)過程數(shù)據(jù)等信息中提取出一組對成績影響最大的關(guān)鍵因素作為輸入的特征變量。這里需要注意的是,不同的學(xué)校、課程和學(xué)生有其獨特性,對成績影響最大的關(guān)鍵因素也不盡相同,不能盲目地將其他成績預(yù)測模型的輸入特征變量全盤照搬過來。如對于深圳信息職業(yè)技術(shù)學(xué)院物流管理專業(yè)的學(xué)生來講,深圳市外的生源普遍好于深圳本市的生源,女同學(xué)的平均成績高于男同學(xué),因此在我們搭建的學(xué)生成績預(yù)測模型中,生源地和性別作為兩個與成績相關(guān)性很強(qiáng)的屬性被選擇成為輸入變量特征中的成員要素,這些都是針對本校學(xué)生的自身特點而定制的[1]。但是對于其他高校的某些專業(yè)來講,生源地和性別對成績的影響未必如此突出,需要任課教師重新考慮是否將它們納入輸入特征變量的選擇范圍內(nèi)。
除了依靠教師的經(jīng)驗選擇輸入特征變量外,還可以借助于特定的特征遴選方法[4]、主成分分析[8]等方式選擇或加工得到最優(yōu)的一組屬性特征(在數(shù)據(jù)挖掘領(lǐng)域,特征選擇是一個比較重要的研究領(lǐng)域),這些方法不僅有助于得到一個更高預(yù)測精度的模型,還從客觀上幫助教師辨識出對學(xué)生成績潛在影響較大的那些因素,它們會成為教師開展后續(xù)工作的重要參考依據(jù)。
(三)提高學(xué)生成績的舉措
對預(yù)測成績較差、有可能不及格的學(xué)生,教師應(yīng)給予較多的關(guān)注,并采取有效的措施幫助他們提高成績。
1.找出學(xué)生成績欠佳的根本性原因
學(xué)生某門課程的成績欠佳是有多方面原因的,既有個體性原因(學(xué)習(xí)方法不當(dāng)、家庭變故等),也有普遍性原因(教師的教學(xué)方法不當(dāng)?shù)龋?,多種因素錯綜復(fù)雜地糾纏在一起,很難將全部因素進(jìn)行量化處理。因此在采取明確的教學(xué)措施之前,可以通過與學(xué)生交流或向?qū)W生輔導(dǎo)員調(diào)研的方式了解其成績欠佳的根本性原因,基于具體原因開展有針對性的工作,可以避免眉毛胡子一把抓,從而最終高效解決問題。
2.及時優(yōu)化教學(xué)方法和教學(xué)設(shè)計
如果預(yù)測結(jié)果顯示大部分學(xué)生有可能不通過考試或成績欠佳,則警示的是一種整體性的教學(xué)效果不理想,此時教師需要及時調(diào)整教學(xué)方法和教學(xué)設(shè)計。面對任課教師所展現(xiàn)出的不同的教學(xué)方法、態(tài)度和風(fēng)格,學(xué)生對該門課程的學(xué)習(xí)積極性也會有所不同。高職學(xué)生的特點決定了他們往往覺得理論性較強(qiáng)的課程比較枯燥,排斥機(jī)械死板、照本宣科的授課模式。而幽默風(fēng)趣的講解風(fēng)格搭配上多案例、多實操的教學(xué)形式,會激發(fā)學(xué)生的學(xué)習(xí)興趣,活躍課堂氛圍,學(xué)生在這種輕松的氛圍中接受新知識的意愿也較強(qiáng)。因此,教師應(yīng)努力強(qiáng)化自己的教學(xué)基本功,積極優(yōu)化教學(xué)設(shè)計,力求在課堂上實現(xiàn)理論與實際案例相結(jié)合,同時適度運用多媒體和信息化技術(shù)提升學(xué)生的感性認(rèn)知,在輕松的課堂氣氛中提高學(xué)生學(xué)習(xí)的效果。
3.增加師生互動,提高學(xué)生自信心
當(dāng)前高職院校在讀學(xué)生,他們的特點是思維開放、接受新鮮事物快、自尊心強(qiáng)、比較排斥傳統(tǒng)說教式的管理方法。有部分學(xué)生成績不佳是因為對學(xué)習(xí)新知識主觀能動性差,厭學(xué)情緒嚴(yán)重。在面對這類學(xué)生時,教師要根據(jù)學(xué)生的特點因勢利導(dǎo),應(yīng)避免面對面的直接批評教育,轉(zhuǎn)而采取相對委婉的態(tài)度和迂回的策略。可以在課堂上有針對性地增加與這些學(xué)生的互動,以正面鼓勵的方式提升他們的自信心,激發(fā)他們對學(xué)習(xí)的興趣。
4.關(guān)注特別的學(xué)生個體
對于那些在主觀上樂于學(xué)習(xí),但由于自身基礎(chǔ)知識薄弱、家庭變故等客觀原因而造成成績欠佳的學(xué)生,任課教師也應(yīng)給予特別的關(guān)注——可以用課下個別輔導(dǎo)的方式彌補(bǔ)其基礎(chǔ)知識的不足,還可以采取談心的方式對其心理進(jìn)行疏導(dǎo),使他們恢復(fù)到正常的學(xué)習(xí)狀態(tài)。
(四)引導(dǎo)成績優(yōu)異的學(xué)生拓展能力
如果成績預(yù)測模型是基于回歸分析建立的,教師可以利用它來估計學(xué)生考試成績的具體分?jǐn)?shù),如果預(yù)測的分?jǐn)?shù)較高,則表明該學(xué)生對課程內(nèi)容理解深入,從一定程度上反映出該學(xué)生具有較強(qiáng)的學(xué)習(xí)能力。對于這類學(xué)生,教師可以引導(dǎo)其進(jìn)行更深入的自主學(xué)習(xí)和課外學(xué)習(xí),如鼓勵他們參加相關(guān)的技能大賽、協(xié)助教師進(jìn)行課程建設(shè)、參與教研科研項目等。在學(xué)生學(xué)有余力的情況下指導(dǎo)他們參與課外項目,有利于學(xué)生儲備更廣泛的知識技能,增強(qiáng)未來職業(yè)發(fā)展的競爭力。
四、結(jié)束語
基于高職院校生源和課程體系的特點,為教學(xué)一線的教師提供預(yù)測學(xué)生考試成績的工具可以幫助教師提前評估教學(xué)效果,優(yōu)化教學(xué)方法和策略。本文回顧了使用數(shù)據(jù)挖掘算法搭建學(xué)生成績預(yù)測模型的關(guān)鍵步驟,分析在高職教育中應(yīng)用該模型的方法和關(guān)鍵問題,最后重點討論在得到預(yù)測結(jié)果后如何采取具體的教學(xué)措施來提高教學(xué)質(zhì)量。
雖然基于數(shù)據(jù)挖掘算法搭建學(xué)生考試成績預(yù)測模型的方法在技術(shù)上已經(jīng)日趨成熟,但是如何將模型更好地與教學(xué)相結(jié)合還需要更深入的研究。相信經(jīng)過在實踐中不斷的摸索,學(xué)生考試預(yù)測模型會成為高職教師對學(xué)生因材施教、改善學(xué)生學(xué)習(xí)效果并挖掘其成長潛力的有力工具。
參考文獻(xiàn):
[1]楊東海,胡凌,錢瑩.基于核Fisher判別分析的高職學(xué)生考試成績預(yù)測[J].中國教育信息化,2016(16):76-79.
[2]黃建明.貝葉斯網(wǎng)絡(luò)在學(xué)生成績預(yù)測中的應(yīng)用[J].計算機(jī)科學(xué),2012(S3):280-282.
[3]王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟(jì)大學(xué)學(xué)報(自然科學(xué)版),2004(2):246-252.
[4]孫力,程玉霞.大數(shù)據(jù)時代網(wǎng)絡(luò)教育學(xué)習(xí)成績預(yù)測的研究與實現(xiàn):以本科公共課程統(tǒng)考英語為例[J].開放教育研究,2015(3):74-80.
[5]吳青,羅儒國.基于在線學(xué)習(xí)行為的學(xué)習(xí)成績預(yù)測及教學(xué)反思[J].現(xiàn)代教育技術(shù),2017,27(6):18-24.
[6]孫毅,劉仁云,王松,等.基于多元線性回歸模型的考試成績評價與預(yù)測[J].吉林大學(xué)學(xué)報(信息科學(xué)版),2013(4):404-408.
[7]邱文教.基于人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成績預(yù)測[J].計算機(jī)與信息技術(shù),2010(4):5-6.
[8]譚常春,張雪蓮,胡俊迎.基于Adaptive-Lasso的本科成績統(tǒng)計分析[J].應(yīng)用概率統(tǒng)計,2016(5):541-550.
◎編輯 張 慧