亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘決策樹技術(shù)的學(xué)生成績分析

        2019-04-11 11:49:42張貴元
        科教導(dǎo)刊·電子版 2019年6期
        關(guān)鍵詞:數(shù)據(jù)挖掘英語學(xué)生

        張貴元

        摘 要 在目前深化產(chǎn)教融合,推進職業(yè)教育的形勢下,職業(yè)化專業(yè)人才可持續(xù)培養(yǎng)已經(jīng)成為趨勢,傳統(tǒng)的成績分析有一定的局限性。本文介紹了決策樹技術(shù)算法的原理,針對學(xué)生成績數(shù)據(jù)進行預(yù)處理和集成轉(zhuǎn)化,基于Microsoft SQL Server BI平臺運用決策樹算法對學(xué)生成績數(shù)據(jù)進行挖據(jù)分析。通過試驗結(jié)果分析,打破原有成績分析得局限,使現(xiàn)有數(shù)據(jù)體現(xiàn)更好的價值,從而輔助教學(xué)管理者做出相應(yīng)決策,更好的提高教學(xué)質(zhì)量。

        關(guān)鍵詞 數(shù)據(jù)挖掘 Microsoft決策樹算法 成績分析

        中圖分類號:TP311.13 文獻標(biāo)識碼:A

        0引言

        在目前深化產(chǎn)教融合,推進職業(yè)教育的形勢下,職業(yè)化專業(yè)人才可持續(xù)培養(yǎng)已經(jīng)成為趨勢,特別是2018年廣東省教育廳關(guān)于中職畢業(yè)生考取本科的政策,在此新政下中職學(xué)校的學(xué)生參加高職高考繼續(xù)深造學(xué)習(xí)是以后新的方向,新政下的深化教學(xué)改革,拓寬學(xué)生升學(xué)途徑,推動新的人才培養(yǎng)體系,健全學(xué)生需求導(dǎo)向的課程調(diào)整,統(tǒng)籌職業(yè)教育與升學(xué)的合理布局,是每個學(xué)校面臨的問題。而高職高考的必備條件是等級證書+文化基礎(chǔ)課程,那么提高等級證書的通過率是迫在眉睫。目前利用數(shù)據(jù)挖掘研究中職學(xué)校等級考證的較少,學(xué)校教務(wù)系統(tǒng)也沒有對學(xué)生各課程成績和技能證書通過時間以及通過率進行深層次分析。因此通過數(shù)據(jù)挖掘決策樹技術(shù),研究英語等級考證通過率和其他因素之間的潛在關(guān)系,提高等級考試通過率,保證高職高考上線率,就顯得尤為重要。

        1 Microsoft SQL Server BI 數(shù)據(jù)挖掘功能

        本文應(yīng)用決策樹技術(shù)對成績的分析是在Microsoft SQL Server BI平臺上完成。Microsoft SQL Server BI 平臺具有很強大的功能,涵蓋了常用的數(shù)據(jù)挖掘技術(shù)。它將數(shù)據(jù)挖掘技術(shù)以集成化,模塊化,系統(tǒng)化、界面化的方式簡潔的呈現(xiàn)出來,即使不具備很深的專業(yè)知識,也能夠很容易上手,簡單的操作,讓它具備更廣泛的應(yīng)用市場。適合數(shù)據(jù)研究分析實驗,可以得到有效的數(shù)據(jù)研究結(jié)果。該智能平臺中包括了很多數(shù)據(jù)挖掘的算法,其中常用的決策樹、聚類分析、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)等都可以選擇,并且在實驗過程中可以設(shè)置不同的參數(shù)來對比實驗結(jié)果。Microsoft SQL Server BI平臺除了內(nèi)置的算法,還可以根據(jù)實際需求將設(shè)計好的算法程序以插件的形式導(dǎo)入 Microsoft SQL Server BI 平臺以滿足實驗的需求。

        2 Microsoft 決策樹算法

        在構(gòu)建決策樹模型之前先闡述一下Microsoft 決策樹算法的基本理論基礎(chǔ),Microsoft 決策樹算法它是集結(jié)了各種創(chuàng)建樹在一起的綜合性的算法。通過在樹中創(chuàng)建一系列拆分來生成數(shù)據(jù)挖掘模型。Microsoft 決策樹算法提供了三種信息獲取計分公式,第一種是信息量的均Shannon,第二種是使用K2先驗的Bayesian網(wǎng)絡(luò),第三種是使用先驗統(tǒng)一Dirichlet分布的 Bayesian網(wǎng)絡(luò)。這三種都是經(jīng)過論證,并且使用在數(shù)據(jù)挖掘領(lǐng)域的方法。在使用的過程中,我們可以設(shè)置不同的參數(shù)進行數(shù)據(jù)分析,對分析結(jié)果進行觀察求證,得到最優(yōu)化的實驗結(jié)果。

        Microsoft決策樹算法經(jīng)過實踐,是一種速度快而且效率高的算法,并且兼容度高。這樣的優(yōu)勢在于多個處理器可以協(xié)同處理數(shù)據(jù),共同生成一個一致的模型?;谶@些優(yōu)點和特征,Microsoft決策樹分類器就是我們試驗中較為具有優(yōu)勢的工具。并且在實驗的過程中我們通過設(shè)置COMPLEXITY_PENALTY 參數(shù),增大它的值可以限制樹的增長。限制關(guān)聯(lián)模型中的項數(shù)以限制生成的樹的數(shù)量。增大MINIMUM_SUPPORT 參數(shù)的值可以避免過度擬合。

        在Microsoft決策樹算法中樹的形狀和深度是由選擇的計分方法和參數(shù)的設(shè)定來決定的,參數(shù)的值不同引起節(jié)點拆分的位置也不同。因此,我們在試驗中要掌握各個參數(shù)屬性,通過設(shè)定不同的數(shù)值,去控制樹的增長、樹的形狀以及輸入和輸出屬性。

        主要的參數(shù)如下:

        2.1 Complexity_Penalty

        Complexity_Penalty 該參數(shù)是一個浮點類型的參數(shù),它的取值范圍是[0,1]之間。在實驗中,當(dāng)設(shè)定的值接近0的時候,生成的樹會比較大,因為這樣的值對樹的增長限制比較小,反之,當(dāng)設(shè)定的值接近1的時候,數(shù)據(jù)所創(chuàng)建的樹會比較小。

        2.2 Minimum_Support

        Minimum_Support 該參數(shù)是規(guī)定生成樹中最小節(jié)點的個數(shù),參數(shù)默認(rèn)值一般為10,根據(jù)實驗數(shù)據(jù)訓(xùn)練集的數(shù)量來確定該參數(shù)值,訓(xùn)練數(shù)據(jù)集中的事例越多該參數(shù)值越大,這樣設(shè)置實驗數(shù)據(jù)比較科學(xué)。

        2.3 Score_Method

        Score_Method 該參數(shù)是決定決策樹增長使用的方法。根據(jù)參數(shù)值的不同選擇不同的方法。當(dāng)它的值為1的時候,使用信息熵來控制樹的增長;當(dāng)它的值為3的時候,使用Bayesian with K2 Prior方法;當(dāng)它的值為4的時候,使用 Bayesian Dirichlet Equivalent with Uniform prior(BDEU)方法。該參數(shù)的默認(rèn)值是4,我們在試驗中可以通過設(shè)置不同參數(shù)來對比試驗數(shù)據(jù)結(jié)果的精確性。

        3決策樹技術(shù)在學(xué)生成績分析中的應(yīng)用

        3.1數(shù)據(jù)預(yù)處理和集成

        本文研究的是英語一級考試成績和學(xué)生其他成績之間的關(guān)聯(lián)關(guān)系。因此,把英語一級成績當(dāng)成研究指標(biāo),為了達到實驗的完整性以及準(zhǔn)確性,試驗數(shù)據(jù)采集,涵蓋了五個專業(yè)層次不同的學(xué)生三年在校的各科成績,通過分類手段選擇了200個左右的學(xué)生成績信息來當(dāng)作數(shù)據(jù)挖掘的主要分析對象,經(jīng)過預(yù)處理保留有效信息1354條。針對預(yù)處理后的1354條學(xué)生原始成績數(shù)據(jù),結(jié)合試驗需求,需要對成績數(shù)據(jù)進行集成和轉(zhuǎn)化,由于本文分析學(xué)生英語一級成績和公共基礎(chǔ)課程、專業(yè)課程、專業(yè)類別、通過的時間等之間的關(guān)聯(lián)關(guān)系。因此,將學(xué)生的各科成績集成轉(zhuǎn)化為專業(yè)課平均成績、公共課平均成績、英語平均成績、英語一級成績、英語一級考試學(xué)期、專業(yè)類別等試驗所用的數(shù)據(jù)信息。

        3.2構(gòu)建和使用決策樹分類模型

        創(chuàng)建決策樹模型,利用 Microsoft Visual Studio 打開“挖

        掘模型”的界面,右鍵單擊“Microsoft_Decision_Trees”命令,打開“算法參數(shù)”選項窗口,在該窗口中設(shè)置算法參數(shù),經(jīng)過不同參數(shù)設(shè)置對比實驗結(jié)果,該實驗使用模型默認(rèn)的參數(shù)得到的數(shù)據(jù)分析結(jié)果較準(zhǔn)確。

        使用微軟的程序開發(fā)工具集(Business Intelligence Development Studio, BI Dev Studio)按照界面的操作提示,能夠快速有效的完成實驗數(shù)據(jù)的數(shù)據(jù)挖掘分析。本文使用 BI Dev Studio部署SQL Server Analysis(SSAS)數(shù)據(jù)挖掘項目,使用該向?qū)芸焖俚貏?chuàng)建和使用決策樹模型進行數(shù)據(jù)挖掘,具體步驟如下:

        (1)創(chuàng)新建數(shù)據(jù)源。創(chuàng)建新數(shù)據(jù)源的時候,要新建一個項目為 “Analysis Services 項目”,然后我們進入數(shù)據(jù)源向?qū)Т翱冢谔峁┑倪x項中選擇“使用服務(wù)賬號”。

        (2)創(chuàng)建數(shù)據(jù)源視圖。在“數(shù)據(jù)源視圖向?qū)А贝翱谥羞x擇提前預(yù)處理過的實驗數(shù)據(jù)源,生成數(shù)據(jù)源的視圖。

        (3)創(chuàng)建數(shù)據(jù)挖掘結(jié)構(gòu)。創(chuàng)建數(shù)據(jù)挖掘結(jié)構(gòu)的方法很簡單,只單擊“解決方案資源管理器”命令,在菜單選擇 “挖掘結(jié)構(gòu)”命令,然后選擇“新建數(shù)據(jù)挖掘結(jié)構(gòu)”命令完成操作,在“創(chuàng)帶有挖掘模型的挖掘結(jié)構(gòu)”選項中根據(jù)實驗要求選擇算法,在這里我們選擇“Microsoft決策樹”。點擊“下一步”后在窗口中指定定型數(shù)據(jù),最后完成數(shù)據(jù)挖掘結(jié)構(gòu)的創(chuàng)建。

        4決策樹算法挖掘?qū)W生成績結(jié)果分析

        通過SQL Server 2008 BI利用算法對數(shù)據(jù)進行挖掘,得到實驗決策樹的模型圖和屬性關(guān)系的拓?fù)鋱D,如圖1所示。結(jié)合決策樹節(jié)點屬性數(shù)據(jù),根據(jù)模型圖和關(guān)系拓?fù)鋱D得出英語一級成績和其它屬性之間的內(nèi)在關(guān)聯(lián)關(guān)系。

        4.1產(chǎn)生分類規(guī)則

        Microsoft 的決策樹模型圖中從根節(jié)點到葉子節(jié)點代表了一條數(shù)據(jù)挖掘規(guī)則,通過分析模型而得出部分有效的規(guī)則,如下所示:

        (1)通過學(xué)期>3.333 and專業(yè)不等于汽修,通過一級,概率=10%

        (2)通過學(xué)期>3.333 and專業(yè)=汽修,通過一級,概率=11%

        (3)通過學(xué)期<3.333 and專業(yè)=軟件與信息服務(wù),一級不合格,概率=37%

        (4)通過學(xué)期<3.333 and專業(yè)不等于軟件與信息服務(wù) and專業(yè)不等于會計,通過一級,概率=21%

        (5)通過學(xué)期<3.333 and專業(yè)=會計,通過一級,概率=42%

        通過規(guī)則得知,通過學(xué)期對一級通過率有直接影響,專業(yè)屬性的不同一級通過率有很大差異性,結(jié)合節(jié)點“挖掘圖例”中的屬性詳情,找出一級成績和其他成績屬性的關(guān)聯(lián),分析如下:

        (1)在第二、三學(xué)期參加英語一級考試通過率是56%,而在第四學(xué)期以后參加英語一級考試通過率僅有10%左右。

        (2)在第二、三學(xué)期軟件與信息服務(wù)專業(yè)的通過率較高為63%,會計專業(yè)為42%,其余專業(yè)總的通過率21%。

        (3)在第二、三學(xué)期通過英語一級的學(xué)生入學(xué)成績、專業(yè)課程、英語平均成績都屬于中等水平以上。而不能通過的學(xué)生這幾個成績屬于合格或者以下。

        (4)在第四學(xué)期以后參加英語一級通過的學(xué)生入學(xué)成績、公共課程成績、英語平均成績、專業(yè)課程成績屬于合格至中等水平。

        4.2結(jié)果分析

        在本文中把英語一級分?jǐn)?shù)當(dāng)作目標(biāo)對象,分析其他方面對分?jǐn)?shù)的作用。在對分?jǐn)?shù)產(chǎn)生影響的各種條件里,學(xué)生最開始進入學(xué)校時取得的成績和英語平均成績的作用是最明顯的。這主要是由于進入學(xué)校時成績不錯的同學(xué),各方面學(xué)習(xí)能力較強,可以自覺的進行學(xué)習(xí),考試的分?jǐn)?shù)也很高。而入學(xué)考試分?jǐn)?shù)低的學(xué)生,由于分?jǐn)?shù)較低就到了中等的職業(yè)學(xué)校,之前的學(xué)習(xí)不是很好,尤其是在英語以及數(shù)學(xué)方面比較明顯,所以英語考級達到標(biāo)準(zhǔn)的幾率也不是很高。公共課的分?jǐn)?shù)又比專業(yè)性課程明顯,主要是因為在中職學(xué)校,特別是汽修數(shù)控專業(yè),同學(xué)們都將專業(yè)課當(dāng)作重點,對公共課程的要求不是很高,但是英語就屬于公共課的一種。由于我們學(xué)校專業(yè)的差異性以及“三二分段”中高職連貫培養(yǎng)的特殊性,進入二年級之后就要準(zhǔn)備“三二分段”考試了,這些方面的考試考察的重要是同學(xué)們的專業(yè)能力以及技能。所以,在第四以及第四學(xué)期以后就不會進行更深入的英語學(xué)習(xí),因此,這部分同學(xué)們在四學(xué)期以后,缺乏英語上的提升,考試達標(biāo)的概率就會更低。汽修專業(yè)、數(shù)控專業(yè)、媒體傳播專業(yè)的同學(xué)在錄取分?jǐn)?shù)不是很高,學(xué)習(xí)基礎(chǔ)較弱,第二、三學(xué)期考試通過率不高。計算機專業(yè)的同學(xué)合格率是最高的,計算機專業(yè)和東莞職業(yè)技術(shù)學(xué)院進行合作辦學(xué),“軟件信息與服務(wù)”專業(yè)是中高職連貫培養(yǎng),學(xué)生招生分?jǐn)?shù)線較高,部分學(xué)生成績比高中的分?jǐn)?shù)線還要高,學(xué)生綜合素質(zhì)較高。會計專業(yè)女生多,招生成績也較好,因此在第二、三學(xué)期的考試中通過率也不錯,除了軟件與信息服務(wù)專業(yè),其它幾個專業(yè)成績都比較好。

        4.3數(shù)據(jù)挖掘結(jié)論和意見

        因為我們學(xué)校的教學(xué)任務(wù)方向和專業(yè)屬性有很大程度上的關(guān)聯(lián)性,一些專業(yè)是“3+2”類型的,并且這種類型的學(xué)生占有很大比率,而其余專業(yè)進行高職考試的也很多,而參加高職高考的班級對于英語一級證書的需求迫切度更高,在對英語一級考試有影響的相關(guān)因素進行分析后,對課程進行合理穩(wěn)定的調(diào)整操作。打破常規(guī)的統(tǒng)一模式,進行有差別,有針對的去安排。

        (1)安排“三二分段”中高職連貫培養(yǎng)班級的課程時,因為學(xué)生的入學(xué)考試分?jǐn)?shù)很高,基礎(chǔ)較好,因此,英語方面的教學(xué)依據(jù)學(xué)校的正常教學(xué)安排來完成,根據(jù)我們學(xué)校實際排課情況,即在前兩個學(xué)期正常進度進行英語教學(xué),學(xué)生的英語考級都會被安排到第二第三學(xué)期,確保英語考級的分?jǐn)?shù)能夠達標(biāo)。

        (2)非“三二分段”中高職連貫培養(yǎng)班級這些學(xué)生基礎(chǔ)稍弱,通過對這些同學(xué)在英語考級方面的要求以及教務(wù)管理系統(tǒng)對課程調(diào)整進行細致分析之后,可以根據(jù)專業(yè)實際需求在第一、二學(xué)期適當(dāng)減少專業(yè)課程,增加英語課程課時(由于專業(yè)特征和學(xué)生的需求都不同,學(xué)校課程安排計劃是第1、2、5、6學(xué)期安排英語課程),保證這些專業(yè)的學(xué)生盡量在第二三學(xué)期通過英語一級考試,提升英語一級通過率。

        (3)針對專業(yè)差異性,數(shù)控、汽修男生多,他們對實踐操作容易產(chǎn)生興趣,但是他們對英語這種基礎(chǔ)課程的學(xué)習(xí)興趣卻不是很濃厚。所以,在對性別、入學(xué)考試的分?jǐn)?shù)等各方面因素進行了分析之后,主要針對汽修、數(shù)控等專業(yè)的學(xué)生,學(xué)校能夠為其分配教學(xué)水平以及專業(yè)水平較高的教師來幫助他們。并且,在日常教學(xué)里,還能夠在一二三學(xué)期里增加英語教學(xué)的頻率,平衡英語課和其他課程的差別,提升通過英語考級的人數(shù)比例。

        5結(jié)束語

        本文通過 Microsoft SQL Server BI 智能平臺的決策樹算法分析學(xué)生英語一級成績和其他成績以及通過學(xué)期之間的關(guān)系,挖掘出有用的規(guī)則,通過該算法對學(xué)生成績數(shù)據(jù)的分析,能夠精準(zhǔn)的對成績做出正確有效的評估,為提高英語一級的通過率做出有效的決策支持。

        參考文獻

        [1] 鄧蓓蓓.基于信息增益的量化算法及其在決策樹中應(yīng)用的研究[D].廣州:廣東工業(yè)大學(xué),2016.

        [2] 瞿花斌.數(shù)據(jù)挖掘的決策樹技術(shù)在高校畢業(yè)生管理中的應(yīng)用[D].濟南:山東大學(xué),2014.

        [3] 李宣冬.C4.5 決策樹算法在素質(zhì)教育學(xué)分成績分析與評價中的應(yīng)用[J].中小企業(yè)管理與科技,2015.

        [4] 李杰.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績分析中的應(yīng)用研究[D].西安:西安石油大學(xué),2010.

        猜你喜歡
        數(shù)據(jù)挖掘英語學(xué)生
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        趕不走的學(xué)生
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        學(xué)生寫話
        學(xué)生寫的話
        讀英語
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        酷酷英語林
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        聰明的學(xué)生等
        秋霞午夜无码鲁丝片午夜精品| 国产在线视频一区二区天美蜜桃| 国产美女爽到喷出水来视频| 中文字幕无码日韩专区免费| 一级一级毛片无码免费视频 | 人妻丰满熟妇av无码片| 亚洲AV无码精品呻吟| 男女视频网站免费精品播放| 国产主播一区二区三区蜜桃| 欧美一性一乱一交一视频| 久久aⅴ无码av免费一区| 激情亚洲综合熟女婷婷| 国产自拍在线视频91| 国产成人精品午夜视频| 亚洲日韩乱码中文无码蜜桃臀| 97人妻无码免费专区| 手机在线播放av网址| 久久天堂综合亚洲伊人hd妓女| 亚洲国际无码中文字幕| 蜜桃伦理一区二区三区| 大香蕉av一区二区三区| 无码人妻久久一区二区三区app| 亚洲人成网站在线播放观看| 91青青草免费在线视频| 国产一区二区三区高清视频| 国产人妖视频一区二区| 午夜性色一区二区三区不卡视频| 最新亚洲人成无码网站| 国产内射视频在线播放| 国产一区二区黄色的网站| 中文字幕乱码一区av久久不卡 | 久久婷婷人人澡人人爽人人爱| 国产精品日韩高清在线蜜芽| 中文在线最新版天堂av| 日日碰日日摸日日澡视频播放| 性生交大全免费看| 中文字幕有码一区二区三区| 国产午夜精品视频观看| 无码人妻少妇久久中文字幕蜜桃| 99国产精品99久久久久久| 97自拍视频国产在线观看|