柴容倩
隨著大數(shù)據(jù)應(yīng)用及數(shù)據(jù)挖掘技術(shù)的不斷推廣,教育領(lǐng)域存在著大量數(shù)據(jù)等待挖掘分析,這些數(shù)據(jù)能夠提供有價(jià)值的信息,幫助我們找到學(xué)生在學(xué)習(xí)、生活、就業(yè)等方面被忽視的東西,從而為教育教學(xué)改革提供參考意見,以及給具體學(xué)生提供有針對(duì)性的指導(dǎo)。
2.1 關(guān)聯(lián)規(guī)則在制定教學(xué)計(jì)劃中的應(yīng)用
在高校教學(xué)計(jì)劃制定過(guò)程中,課程間的關(guān)聯(lián)程度及課程教學(xué)的先后順序直接影響著教師的教學(xué)效果。因此,基于教務(wù)系統(tǒng)中大量課程信息及學(xué)生成績(jī)數(shù)據(jù)進(jìn)行挖掘分析,找出課程間的關(guān)聯(lián)程度,可以為教學(xué)計(jì)劃的制定提供指導(dǎo),從而提高教學(xué)質(zhì)量。
關(guān)聯(lián)分析是數(shù)據(jù)挖掘的核心技術(shù)之一,其關(guān)聯(lián)規(guī)則模型及數(shù)據(jù)挖掘算法是由IBM公司的R.Agrawal在1993年首先提出的,旨在從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間的有趣關(guān)聯(lián)或相互關(guān)系,關(guān)聯(lián)性的強(qiáng)度則由關(guān)聯(lián)分析中的三個(gè)核心概念——支持度、置信度和提升度控制和評(píng)價(jià)。其中,Apriori算法較為經(jīng)典,在關(guān)聯(lián)規(guī)則分析領(lǐng)域具有較大影響力。
運(yùn)用關(guān)聯(lián)規(guī)則對(duì)存儲(chǔ)在教務(wù)管理系統(tǒng)中的大量課程信息和學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析,找出課程間潛在的多種關(guān)聯(lián)性,進(jìn)而發(fā)現(xiàn)課程在先后順序方面的關(guān)系及其他有價(jià)值信息,從而為教學(xué)服務(wù)工作的開展提供參考意見。
2.2 決策樹在學(xué)生掛科預(yù)警機(jī)制中的應(yīng)用
高等院校學(xué)生的學(xué)習(xí)成績(jī)是評(píng)判教育教學(xué)質(zhì)量的重要標(biāo)準(zhǔn),也是教師判斷學(xué)生對(duì)知識(shí)掌握程度的重要依據(jù)。對(duì)學(xué)生課程成績(jī)進(jìn)行挖掘分析,從中提取有價(jià)值的信息,可以為教師教學(xué)及學(xué)生學(xué)習(xí)提供指導(dǎo),從而提高教學(xué)質(zhì)量和學(xué)習(xí)效率。
決策樹是最經(jīng)典的數(shù)據(jù)挖掘方法之一,該方法以樹形結(jié)構(gòu)形式將決策過(guò)程展現(xiàn)出來(lái),簡(jiǎn)單直觀、解讀性強(qiáng)。根據(jù)適用情況的不同,有時(shí)也被稱為分類樹或回歸樹。簡(jiǎn)單來(lái)說(shuō),其目的是根據(jù)若干輸入變量的值構(gòu)造一個(gè)相適應(yīng)的模型,近而預(yù)測(cè)輸出變量的值。
運(yùn)用決策樹算法對(duì)存儲(chǔ)在教務(wù)管理系統(tǒng)中的學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析,提前預(yù)測(cè)學(xué)生課程成績(jī),建立學(xué)生掛科預(yù)警機(jī)制。教師可根據(jù)分析結(jié)果了解學(xué)生掌握知識(shí)情況,從而調(diào)整教學(xué)進(jìn)度、教學(xué)模式和教學(xué)方法,同時(shí),對(duì)不同學(xué)生做出針對(duì)性的指導(dǎo)。學(xué)生可以根據(jù)分析結(jié)果,發(fā)現(xiàn)后續(xù)課程中有掛科風(fēng)險(xiǎn)的學(xué)科,做好針對(duì)性的學(xué)習(xí)。
2.3 聚類分析在學(xué)生就業(yè)管理中的應(yīng)用
隨著影響就業(yè)的因素、就業(yè)行業(yè)的多元化及高等院校畢業(yè)生數(shù)量的增加,預(yù)測(cè)畢業(yè)生就業(yè)趨勢(shì)以及改革創(chuàng)新學(xué)生培養(yǎng)模式,越來(lái)越多的依賴于對(duì)畢業(yè)生就業(yè)信息的分析。對(duì)就業(yè)信息進(jìn)行多層次、多角度的分析,挖掘這些數(shù)據(jù)中所蘊(yùn)含的有價(jià)值的信息,形成準(zhǔn)確的就業(yè)數(shù)據(jù)模型,有助于提高學(xué)生就業(yè)管理水平及學(xué)生就業(yè)質(zhì)量。
聚類分析是一種原理簡(jiǎn)單、應(yīng)用廣泛的數(shù)據(jù)挖掘技術(shù)。顧名思義,聚類分析就是把若干事務(wù)按照某種標(biāo)準(zhǔn)歸為幾個(gè)類別,其中較為接近的聚為一類,不那么接近的聚于不同類。常見的聚類算法有K—均值聚類、K—中心點(diǎn)聚類、密度聚類、系譜聚類、期望最大化聚類等。
運(yùn)用聚類算法對(duì)畢業(yè)生課程成績(jī)、計(jì)算機(jī)能力、英語(yǔ)能力、表達(dá)能力、生源地等相關(guān)屬性進(jìn)行分析,從而實(shí)現(xiàn)對(duì)學(xué)生的精準(zhǔn)聚類。同理,通過(guò)對(duì)招聘單位基于注冊(cè)資本、企事業(yè)單位性質(zhì)、企業(yè)所屬行業(yè)、行業(yè)前景等相關(guān)屬性進(jìn)行聚類分析,從而實(shí)現(xiàn)對(duì)招聘單位精準(zhǔn)分類。基于以上分析結(jié)果,有針對(duì)性的向畢業(yè)生推薦就業(yè)單位,或者為學(xué)生尋找就業(yè)單位提供參考意見,從而實(shí)現(xiàn)畢業(yè)生與就業(yè)單位的完美對(duì)接,提高就業(yè)服務(wù)質(zhì)量。
目前,數(shù)據(jù)挖掘技術(shù)被應(yīng)用于各行各業(yè),作為大數(shù)據(jù)的生產(chǎn)者,高等院校各類業(yè)務(wù)系統(tǒng)為學(xué)校的各項(xiàng)信息化工作提供了基礎(chǔ)保障,其中存儲(chǔ)的大量數(shù)據(jù)隱含了很多有價(jià)值的信息,通過(guò)對(duì)各類數(shù)據(jù)進(jìn)行挖掘分析,能夠?yàn)楦叩仍盒H粘=虒W(xué)、學(xué)生管理、就業(yè)管理以及個(gè)性化服務(wù)等提供科學(xué)合理的保障。
本研究為四川大學(xué)錦城學(xué)院課題項(xiàng)目:數(shù)據(jù)挖掘在學(xué)生管理中的應(yīng)用研究(編號(hào):2018JCKY0009)
(作者單位:四川大學(xué)錦城學(xué)院)