亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高校學(xué)生修正成績的課程關(guān)聯(lián)數(shù)據(jù)挖掘*

        2023-02-21 07:38:28張偉武延濤
        智庫時(shí)代 2023年4期
        關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)課程

        張偉 武延濤

        (中國礦業(yè)大學(xué)徐海學(xué)院)

        一、引言

        高校教育數(shù)據(jù)挖掘是高等教育研究的重要課題之一,利用數(shù)據(jù)挖掘技術(shù)可以發(fā)掘出數(shù)據(jù)中隱藏的規(guī)律和模式,從而為教育教學(xué)決策提供科學(xué)依據(jù)。高校學(xué)生課程關(guān)聯(lián)研究要對(duì)多門課程成績進(jìn)行數(shù)據(jù)挖掘,成績統(tǒng)計(jì)特征存在顯著差異。本文將在以課程成績分布為正態(tài)分布前提下,將不同課程成績分布變換至同一均值和標(biāo)準(zhǔn)差的正態(tài)分布,利用插值函數(shù)法將不同課程成績進(jìn)行修正,然后依據(jù)等級(jí)賦分理論對(duì)各課程進(jìn)行等級(jí)評(píng)定,再利用Apriori算法挖掘各課程間的聯(lián)系。

        二、課程成績的修正

        利用抽樣課程成績樣本均值和樣本標(biāo)準(zhǔn)差確定課程正態(tài)總體分布,利用正態(tài)總體分布確定成績等級(jí)的期望比例,對(duì)所有課程進(jìn)行標(biāo)準(zhǔn)化等級(jí)劃分,再利用插值函數(shù)法對(duì)成績進(jìn)行修正。

        (一)課程成績正態(tài)總體估計(jì)

        設(shè)抽樣學(xué)生人數(shù)為n課程總數(shù)為N門,課程成績總體為X,假設(shè)總體服從正態(tài)分布,第j門課程成績的總體為Xj,第i名學(xué)生第j門課程成績?yōu)?i= 1,… ,n;j= 1,… ,N),根據(jù)學(xué)生的成績xij估計(jì)第j門課程Xj,的樣本均值與樣本標(biāo)準(zhǔn)差:

        課程考試成績總體X,的樣本均值與樣本標(biāo)準(zhǔn)差:

        利用公式(3)估計(jì)X,的分布,即課程成績總體近似服從。

        (二)成績等級(jí)分類的期望比例

        表1 等級(jí)制與百分制的對(duì)應(yīng)關(guān)系

        由公式(1)-(3)可得學(xué)生課程成績總體X,的近似分布,于是課程總體第l個(gè)分?jǐn)?shù)段的期望人數(shù)比例為:

        (三)線性插值成績修正模型

        依據(jù)表1的等級(jí)制劃分,按照各分?jǐn)?shù)段人數(shù)的期望比例pl將每門課程成績分段,記為 第j門 課 程 第l個(gè)成績分?jǐn)?shù)段上下限(約定,應(yīng)用線性函數(shù)插值法修正原始成績,記修正成績?yōu)?i= 1 ,… ,n;j= 1,… ,N),根據(jù)原始成績確定所屬分?jǐn)?shù)段l值,且

        三、課程關(guān)聯(lián)規(guī)則與Apriori算法

        (一)課程成績的事務(wù)數(shù)據(jù)庫

        第i門課程成績集合構(gòu)成一個(gè)項(xiàng)集;k門課程成績集合構(gòu)成k-;包含所有k-(k= ( 1,… ,N)稱為事務(wù)數(shù)據(jù)庫,記為D。

        (二)頻繁項(xiàng)集與關(guān)聯(lián)規(guī)則

        1.頻繁項(xiàng)集的概念

        記μ為項(xiàng)集事務(wù)數(shù)的計(jì)數(shù),一門或多門課程成績構(gòu)成的項(xiàng)集A支持度為項(xiàng)集A 事務(wù)數(shù)占事務(wù)數(shù)據(jù)庫事務(wù)數(shù)的比例,即

        預(yù)先設(shè)定的最小支持度閾值min_sup ,若

        則稱項(xiàng)集A為頻繁項(xiàng)集,k為k-。

        2.關(guān)聯(lián)規(guī)則的指標(biāo)

        設(shè)課程項(xiàng)集中事項(xiàng)A和B關(guān)聯(lián)規(guī)則表現(xiàn)為邏輯關(guān)系A(chǔ)?B,即課程項(xiàng)集中事項(xiàng)A蘊(yùn)含事項(xiàng)B的關(guān)系,度量關(guān)聯(lián)規(guī)則的三個(gè)指標(biāo)分別為:邏輯關(guān)系的支持度、置信度和提升度。

        支持度為包含事項(xiàng)A或B事務(wù)數(shù)占事務(wù)數(shù)據(jù)庫事務(wù)數(shù)的比例,即

        置信度為包含項(xiàng)集A和B同時(shí)發(fā)生事務(wù)數(shù)占項(xiàng)集A事務(wù)數(shù)據(jù)庫事務(wù)數(shù)的比例,即

        提升度為事項(xiàng)A蘊(yùn)含事項(xiàng) B出現(xiàn)的可能性,即

        若lif.(A,B)=1時(shí),則說明事項(xiàng)A和事項(xiàng)B相互獨(dú)立;若lif.(A,B)<1,事項(xiàng)A導(dǎo)致事項(xiàng)B不出現(xiàn);若lif.(A,B)>1,事項(xiàng)A蘊(yùn)含事項(xiàng)B出現(xiàn)。

        3.課程累計(jì)支持度

        記“Ai”為第i門課程成績?yōu)閮?yōu)秀,記“Bi”為第i門課程成績?yōu)榱己茫洝癈i”為第i門課程成績?yōu)橹械?,記“Di”為第i門課程成績?yōu)榧案瘢洝癊i”為第i門課程成績?yōu)椴患案?。第i門課程與第j門課程的累計(jì)支持度:

        (三)累計(jì)支持度原則

        基于上述成績修正模型和等級(jí)賦分原則,課程各相應(yīng)期望等級(jí)人數(shù)相等,且各等級(jí)樣本容量較少,當(dāng)課程間出現(xiàn)至少兩個(gè)等級(jí)頻繁項(xiàng)集,且大于預(yù)先設(shè)定的最小累計(jì)支持度閾值時(shí),即

        則稱課程間存在強(qiáng)關(guān)聯(lián)。

        (四)Apriori算法及關(guān)聯(lián)規(guī)則

        根據(jù)關(guān)聯(lián)規(guī)則的Apriori算法思想:首先,通過設(shè)置最小支持度,找出所有頻繁項(xiàng)集;其次,在頻繁項(xiàng)集中產(chǎn)生關(guān)聯(lián)規(guī)則;最后,設(shè)置最小累計(jì)支持度,計(jì)算課程間累計(jì)支持度,確定強(qiáng)關(guān)聯(lián)課程。

        四、實(shí)例分析

        (一)案例分析數(shù)據(jù)準(zhǔn)備

        金融學(xué)專業(yè)以銀行方向?yàn)槔鶕?jù)調(diào)研法,選取體現(xiàn)學(xué)生通識(shí)素質(zhì)、數(shù)理能力、專業(yè)素質(zhì)、專業(yè)拓展課程18門課程,125名學(xué)生成績。按照學(xué)期開設(shè)情況如表2。

        表2 金融學(xué)專業(yè)前三學(xué)年課程列表

        (二)績數(shù)據(jù)標(biāo)準(zhǔn)化處理

        根據(jù)學(xué)生成績計(jì)算可得各門課程的樣本均值與樣本標(biāo)準(zhǔn)差(如圖1)。

        圖1 抽樣課程成績均值與標(biāo)準(zhǔn)差

        課程考試的成績分布因課程不同分布不盡相同,抽樣課程成績期望等級(jí)分布如表3,各課程在不同等級(jí)的人數(shù)偶然性較大,實(shí)際成績分布中如KC16,KC17在B等級(jí)大量集中,其余各等級(jí)偏少,在數(shù)據(jù)挖掘中將影響課程關(guān)聯(lián)分析。

        表3 抽樣課程期望等級(jí)人數(shù)分布

        現(xiàn)將不同課程成績變換至同一標(biāo)尺下進(jìn)行修正。由公式(3)計(jì)算得課程成績總體的均值與標(biāo)準(zhǔn)差為:

        由公式(4)可得各分?jǐn)?shù)段人數(shù)的期望比例如下表所示。

        表4 期望比例與等級(jí)人數(shù)

        依據(jù)各分?jǐn)?shù)段人數(shù)的期望比例,利用插值公式(5)對(duì)18門課程進(jìn)行成績修正。

        (三)課程關(guān)聯(lián)數(shù)據(jù)挖掘

        利用Apriori算法,對(duì)修正的成績進(jìn)行數(shù)據(jù)挖掘。設(shè)置支持度最小閾值,置信度最小閾值為0.50,累計(jì)支持度最小閾值。按照課程開課先后順序,可計(jì)算得到表5。

        (四)修正后成績與原始成績課程關(guān)聯(lián)對(duì)比

        利用Apriori算法計(jì)算并與成績修正后的計(jì)算結(jié)果相比較,得出下列結(jié)論。

        (1)成績修正前后成績分布變化。成績修正前,課程成績樣本均值偏差較大,最小值為66.03,最大值為81.92;樣本標(biāo)準(zhǔn)差最小值為4.23,最大值為17。利用成績正態(tài)總體分布在保持排名不變的情況下對(duì)成績進(jìn)行標(biāo)準(zhǔn)化,保證課程各等級(jí)人數(shù)相等。

        (2)成績修正前后課程關(guān)聯(lián)表現(xiàn)形式。原始成績數(shù)據(jù)挖掘因?yàn)檎n程在某等級(jí)分?jǐn)?shù)較為集中,兩門課程關(guān)聯(lián)比較集中,在關(guān)聯(lián)結(jié)果中大多數(shù)僅顯示一條關(guān)聯(lián)記錄;成績修正后進(jìn)行數(shù)據(jù)挖掘,兩門課程可能出現(xiàn)多等級(jí)關(guān)聯(lián),結(jié)果記錄顯示多條記錄,課程關(guān)聯(lián)以同等級(jí)關(guān)聯(lián)為主,極大的呈現(xiàn)課程間的強(qiáng)關(guān)聯(lián)。

        (3)成績修正前后課程關(guān)聯(lián)結(jié)果比較。我們對(duì)比7對(duì)成績修正前后課程關(guān)聯(lián)。利用原始數(shù)據(jù)分析的結(jié)果中三對(duì)課程(KC3,KC4)、(KC5,KC10)、(KC7,KC10)無關(guān)聯(lián),但事實(shí)上,對(duì)成績進(jìn)行修正后,以上三對(duì)課程存在兩個(gè)不同等級(jí)的關(guān)聯(lián)。

        (4)成績修正前后課程關(guān)聯(lián)參數(shù)比較。通過對(duì)比表5和表6,修正成績后四對(duì)課程關(guān)聯(lián)(KC3,KC14)、(KC5,KC7)、(KC11,KC14)、(KC13,KC18)累計(jì)支持度明顯高于原始成績對(duì)應(yīng)的情況,(KC3,KC14)累計(jì)支持度達(dá)0.44,具有較高的關(guān)聯(lián)性。成績修正前后提升度均大于1,按照課程開設(shè)順序有相應(yīng)的蘊(yùn)含關(guān)系,可提前積極指導(dǎo)學(xué)生后期課程學(xué)習(xí)。

        表5 修正后關(guān)聯(lián)課程支持度、累計(jì)支持度、置信度和提升度

        表6 修正前關(guān)聯(lián)課程支持度、累計(jì)支持度、置信度和提升度

        五、結(jié)束語

        本文基于課程正態(tài)分布總體對(duì)課程成績進(jìn)行標(biāo)準(zhǔn)化,利用線性函數(shù)插值法對(duì)學(xué)生成績進(jìn)行修正,消除成績分布和標(biāo)準(zhǔn)差的差異性,在同一標(biāo)尺下進(jìn)行課程強(qiáng)關(guān)聯(lián)分析。成績修正的Apriori算法是在統(tǒng)一課程成績標(biāo)準(zhǔn)前提下進(jìn)行的數(shù)據(jù)挖掘,消除課程成績?cè)u(píng)價(jià)對(duì)課程關(guān)聯(lián)規(guī)則的影響,更加準(zhǔn)確地分析課程的關(guān)聯(lián)程度,對(duì)學(xué)生課程學(xué)習(xí)指導(dǎo)更加具有針對(duì)性,為專業(yè)教學(xué)管理提供依據(jù)。

        猜你喜歡
        數(shù)據(jù)挖掘關(guān)聯(lián)課程
        “苦”的關(guān)聯(lián)
        數(shù)字圖像處理課程混合式教學(xué)改革與探索
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        軟件設(shè)計(jì)與開發(fā)實(shí)踐課程探索與實(shí)踐
        為什么要學(xué)習(xí)HAA課程?
        奇趣搭配
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        特黄特色的大片观看免费视频| 一区二区三区黄色一级片| 国产自拍视频一区在线| 午夜视频在线瓜伦| 和外国人做人爱视频| 午夜天堂一区人妻| 亚洲成av人片天堂网| 97性视频| 人妻久久999精品1024| 国产不卡一区二区av| 亚州中文热码在线视频| 黄片视频大全在线免费播放| 色欲一区二区三区精品a片| 亚洲精品乱码久久久久久金桔影视| 亚洲激情成人| 久久伊人中文字幕有码久久国产| 与漂亮的女邻居少妇好爽 | 天堂av一区二区在线观看| 无码人妻专区一区二区三区| 日本一区二区三区清视频| 中文乱码字字幕在线国语| 午夜毛片不卡免费观看视频| 精品四虎免费观看国产高清| 亚洲色图第一页在线观看视频| 黄片视频免费在线播放观看| 久久久无码人妻精品一区| Y111111国产精品久久久| 国产盗摄一区二区三区av| 日韩 无码 偷拍 中文字幕| 色偷偷久久一区二区三区| 久久青草亚洲AV无码麻豆| 激情亚洲不卡一区二区| 人妻无码一区二区三区免费| 无码少妇一级AV便在线观看 | 日韩一区在线精品视频| 久激情内射婷内射蜜桃人妖| 午夜短无码| 日本午夜理论一区二区在线观看| 国内揄拍国内精品少妇| 亚洲日本va中文字幕久久| 女同性恋亚洲一区二区|