亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FP-Growth算法的高校學(xué)生公共課成績與專業(yè)課成績相關(guān)性研究

        2021-07-10 09:04:58余弦周誼芬
        關(guān)鍵詞:樹結(jié)構(gòu)公共課項集

        余弦,周誼芬

        (南通大學(xué)a.杏林學(xué)院,b.醫(yī)學(xué)院,江蘇 南通 226000)

        高校人才培養(yǎng)方案中所計劃開設(shè)的課程,一般可分為公共課(包含公共選修課和公共必修課)和專業(yè)課(包含專業(yè)基礎(chǔ)課和專業(yè)課)兩種[1]。一般而言,公共課和專業(yè)課之間有一定的相關(guān)性,公共課所學(xué)習(xí)的內(nèi)容在一定程度上是專業(yè)課內(nèi)容的基礎(chǔ),熟悉公共課知識對掌握專業(yè)課內(nèi)容具有促進作用[2],但是否每一門公共課的成績都會對相關(guān)專業(yè)課的成績產(chǎn)生影響,以及會產(chǎn)生多大的影響,仍有待研究和驗證。

        隨著信息技術(shù)的快速發(fā)展,數(shù)據(jù)挖掘及相關(guān)技術(shù)在高校的教學(xué)、科研等領(lǐng)域得到不斷拓展應(yīng)用。數(shù)據(jù)挖掘技術(shù)在尋找海量數(shù)據(jù)的內(nèi)在關(guān)聯(lián)規(guī)則方面具有效率高、適用靈活等優(yōu)點。在教學(xué)過程中累積的學(xué)生成績已經(jīng)形成一個體量龐大的數(shù)據(jù)庫,通過數(shù)據(jù)挖掘的相關(guān)算法來尋找大量學(xué)生成績數(shù)據(jù)之間潛在的關(guān)聯(lián)規(guī)律,進而提高高校課程設(shè)置合理性和學(xué)生學(xué)習(xí)效率,已經(jīng)成為高等教育管理領(lǐng)域的研究熱點之一[3]。應(yīng)用FPGrowth算法對某高校部分計算機專業(yè)學(xué)生的公共課成績和專業(yè)課成績進行相關(guān)性分析,針對二者的關(guān)聯(lián)程度展開實證研究,為高校教學(xué)計劃的課程設(shè)置和教學(xué)改革提供有力的科學(xué)依據(jù)。

        1 FP-Growth算法原理和實現(xiàn)

        FP-Growth(Frequent Pattern Tree,頻繁模式樹)算法是一種在經(jīng)典Apriori算法基礎(chǔ)上演變而來的挖掘頻繁項集方法[4]。它針對Apriori算法運行效率較低,實現(xiàn)過程中需要多次掃描整個事務(wù)集,進而產(chǎn)生大量候選集的缺點做了明顯的改進。FP-Growth算法比Apriori算法效率更高,它將數(shù)據(jù)集存儲于一個按特定順序構(gòu)成的樹結(jié)構(gòu)(FP樹),通過構(gòu)建FP樹來壓縮事務(wù)數(shù)據(jù)庫中的信息,從而更加有效地產(chǎn)生頻繁項集[5]。在整個算法執(zhí)行過程中,只需遍歷事務(wù)集兩次,通過遞歸調(diào)用FP樹結(jié)構(gòu),刪除不符合最小支持度(關(guān)聯(lián)度低)的項目,直至最終形成單一的樹結(jié)構(gòu),就能夠完成頻繁模式的發(fā)現(xiàn)。其發(fā)現(xiàn)頻繁項集的基本過程如下。

        將事務(wù)數(shù)據(jù)庫中的單個事務(wù)記為Tk,而T={T1,T2,...,Tk}是所有事務(wù)的集合。事務(wù)中所包含的各個項目記為Ik,所有項目的集合I={I1,I2,...,Ik}。FP-Growth算法首先掃描一遍事務(wù)集T,計算事務(wù)集T中各項目Ik出現(xiàn)的次數(shù)n,并設(shè)定最小支持度s(項目出現(xiàn)的最少次數(shù)),若項目集I中某個項目Ik的出現(xiàn)次數(shù)n小于最小支持度s,則刪除該項目,然后將原始事務(wù)集T中的各項事務(wù)Tk按項目集Ik中的項目頻次進行降序排列。之后第二次掃描事務(wù)集T,創(chuàng)建項頭表以及FP樹。項頭表的第一列是按照降序排列的頻繁項,第二列是指向該頻繁項在FP樹中節(jié)點位置的指針[6]。FP樹其實是一棵用來存儲項目出現(xiàn)次數(shù)的前綴樹,每個項目均以路徑的方式存儲在樹結(jié)構(gòu)中,與其它樹形結(jié)構(gòu)不同,各項目在FP樹中并非只出現(xiàn)一次。只有當(dāng)項目和頻次均不一致時,樹結(jié)構(gòu)才會分枝。項目每出現(xiàn)一次,若在FP樹中有同路徑的節(jié)點,則記數(shù)增加一次,若無同路徑的節(jié)點,則相應(yīng)的新增該項目節(jié)點。最終各項目按支持度降序排列,支持度越高的頻繁項離根節(jié)點越近[7],從而使得更多的頻繁項可以共享前綴。

        FP樹構(gòu)建完成之后,依照樹結(jié)構(gòu)中從下往上的順序,對于每個項目找到其條件模式基(CPB,conditional patten base),遞歸調(diào)用樹結(jié)構(gòu),刪除小于最小支持度的項。如果最終呈現(xiàn)單一路徑的樹結(jié)構(gòu),則直接列舉所有組合;非單一路徑的則繼續(xù)調(diào)用樹結(jié)構(gòu),直到形成單一路徑,即可挖掘出項目的頻繁項集。

        2 FP-Growth算法在分析學(xué)生公共課成績與專業(yè)課成績相關(guān)性中的應(yīng)用

        2.1 學(xué)生成績預(yù)處理及離散化

        根據(jù)FP-Growth算法原理及其實現(xiàn)步驟,本文以某高校計算機專業(yè)2018級學(xué)生的成績?yōu)閿?shù)據(jù)來源,研究學(xué)生公共課成績和專業(yè)課成績之間的相關(guān)性。根據(jù)該專業(yè)教學(xué)計劃的具體內(nèi)容及培養(yǎng)重點,選擇高等數(shù)學(xué)A(一)、大學(xué)英語(一)、計算機導(dǎo)論三門課程成績作為公共課成績代表,另外選擇高級語言程序設(shè)計(C++)(一)、數(shù)據(jù)庫原理及應(yīng)用、數(shù)據(jù)結(jié)構(gòu)三門課程成績作為專業(yè)課成績代表,在不考慮學(xué)生補考或重修等異常考試的情況下,共得到有效學(xué)生成績數(shù)據(jù)418條,作為全部的數(shù)據(jù)來源。限于本文篇幅,隨機選取其中的15名學(xué)生數(shù)據(jù)作為研究實例,其公共課和專業(yè)課原始成績?nèi)绫?所示。為保護學(xué)生個人信息,以學(xué)號后六位代表對應(yīng)學(xué)生。

        表1 學(xué)生公共課和專業(yè)課原始成績

        學(xué)生的成績數(shù)據(jù)部分為百分制,部分為五級計分制,為方便FP-Growth算法處理,將學(xué)生成績數(shù)據(jù)做進一步的離散化處理。若某門課程成績?yōu)槲寮売嫹种频膬?yōu)秀或良好,或者其成績?yōu)榘俜种魄曳謹(jǐn)?shù)大于等于80,則認(rèn)為其成績優(yōu)良,將其標(biāo)注為Ik,反之則不標(biāo)注。依此規(guī)則,將高等數(shù)學(xué)A(一)、大學(xué)英語(一)、計算機導(dǎo)論三門公共課成績?yōu)閮?yōu)良分別記作I1、I2、I3,高級語言程序設(shè)計(C++)(一)、數(shù)據(jù)庫原理及應(yīng)用、數(shù)據(jù)結(jié)構(gòu)三門專業(yè)課成績?yōu)閮?yōu)良分別記作I4、I5、I6。本文主要討論公共課成績優(yōu)良與專業(yè)課成績優(yōu)良之間的關(guān)系,故非優(yōu)良的成績忽略不計。原始成績離散規(guī)則如表2所示。離散化后的學(xué)生公共課成績和專業(yè)課成績?nèi)绫?所示。

        表2 原始成績離散規(guī)則

        表3 離散化后的學(xué)生公共課成績和專業(yè)課成績

        2.2 學(xué)生公共課成績與專業(yè)課成績相關(guān)性分析

        根據(jù)FP-Growth算法思想,通過以下步驟來完成學(xué)生公共課成績與專業(yè)課成績相關(guān)性分析。

        1)將表3中離散化后的學(xué)生公共課成績和專業(yè)課成績作為事務(wù)集T,各項事務(wù)中所包含的項目的集合I={I1,I2,I3,I4,I5,I6}。首先完整地掃描一遍事務(wù)集T,計算所有學(xué)生成績數(shù)據(jù)中各成績項目Ik出現(xiàn)的次數(shù)n,得到的結(jié)果如表4所示。

        表4 各成績項目Ik出現(xiàn)的次數(shù)

        2)設(shè)定最小支持度s=5。項目集I中成績項目I2的出現(xiàn)次數(shù)n為4,小于最小支持度s,故刪除此項目。按出現(xiàn)頻次將項目集I重新排序為{I1,I6,I5,I4,I3},依照此項目順序?qū)⒊煽兪聞?wù)集T中的各項事務(wù)Tk進行降序排列。刪除不符合最小支持度項目并進行降序排列前后的事務(wù)集T如表5所示。

        表5 刪除不符合最小支持度項目并進行降序排列前后的事務(wù)集

        3)掃描表5中經(jīng)過刪除不符合最小支持度項目并進行降序排列之后的事務(wù)集T,創(chuàng)建項頭表以及FP樹。FP樹的根節(jié)點記為null,不表示任何項。先根據(jù)第一條事務(wù)T1={I1,I6,I5}創(chuàng)建FP樹的第一條分支,之后將事務(wù)T2到T13中的項目逐條插入FP樹中。若新加入的項目路徑若與現(xiàn)有FP樹節(jié)點相同,則原有節(jié)點數(shù)量增加一次;若新加入的項目路徑與FP樹節(jié)點不同,則FP樹分枝,增加新的項目節(jié)點。以此構(gòu)建的項頭表和FP樹如圖1所示。

        圖1 項頭表和FP樹

        4)FP樹構(gòu)建完成之后,查找每個項目對應(yīng)的條件模式基。以項目I5和I6為例,I5的條件模式基為{I1}、{I1:7,I6:7},I6的條件模式基為{I1:9}。將I5和I6的條件模式基作為新的事務(wù)數(shù)據(jù)庫,以條件模式基的項目為節(jié)點,構(gòu)建I5和I6的條件FP樹如圖2所示。

        由圖2可知,I5和I6的條件FP樹均為單路徑,且每一節(jié)點均滿足最小支持度,所以直接列舉條件FP樹中的所有節(jié)點組合,與對應(yīng)項目取并集,即可得對應(yīng)項目的頻繁項集。I5的條件FP樹節(jié)點組合為{I1:8}、{I6:7}、{I1:8,I6:7},與I5取并集得到滿足最小支持度的頻繁項集為{(I1:8,I5:8),(I6:7,I5:7),(I1:7,I6:7,I5:7)};同理,I6的條件FP樹節(jié)點組合為{I1:9},與I6取并集得到滿足最小支持度的頻繁項集為{(I1:9,I6:9)}。

        圖2 I5和I6的條件FP樹

        據(jù)此分析,I1和I5以及I1和I6之間存在較強的關(guān)聯(lián)性。由此可以得出,如果學(xué)生的公共課高等數(shù)學(xué)A(一)的成績?yōu)閮?yōu)良,則其數(shù)據(jù)庫原理及應(yīng)用、數(shù)據(jù)結(jié)構(gòu)兩門專業(yè)課成績?yōu)閮?yōu)良的概率較大。而大學(xué)英語(一)和計算機導(dǎo)論兩門公共課成績未發(fā)現(xiàn)與數(shù)據(jù)庫原理及應(yīng)用、數(shù)據(jù)結(jié)構(gòu)兩門專業(yè)課成績存在明顯的關(guān)聯(lián)性。

        3 結(jié)語

        本文指出了高校學(xué)生公共課成績與專業(yè)課成績之間關(guān)聯(lián)的不確定性,通過分析數(shù)據(jù)挖掘的FP-Growth算法,以某高校計算機專業(yè)學(xué)生為例,選擇高等數(shù)學(xué)A(一)、大學(xué)英語(一)、計算機導(dǎo)論三門公共課成績和高級語言程序設(shè)計(C++)(一)、數(shù)據(jù)庫原理及應(yīng)用、數(shù)據(jù)結(jié)構(gòu)三門專業(yè)課成績?yōu)閿?shù)據(jù)挖掘?qū)ο?,將六門課程成績概化之后引入FP-Growth算法進行分析處理,通過構(gòu)建FP樹等步驟,高效挖掘?qū)W生公共課成績與專業(yè)課成績之間的潛在關(guān)系,得出了兩者之間的關(guān)聯(lián)規(guī)則。這些關(guān)聯(lián)規(guī)則可以為高校教學(xué)單位課程設(shè)置提供有力的理論依據(jù),進而制定更加科學(xué)合理的培養(yǎng)計劃,促進高校教學(xué)模式及人才培養(yǎng)過程的改革。學(xué)生也能以此為參考,結(jié)合自身成績特點,靈活調(diào)整學(xué)習(xí)重點,更有針對性地吸收知識,有效提高學(xué)習(xí)效率。

        猜你喜歡
        樹結(jié)構(gòu)公共課項集
        Factors Affecting Memory Efficiency in EFL
        配器課在師范高校公共課教學(xué)中的幾點思考
        北方音樂(2017年4期)2017-05-04 03:40:37
        四維余代數(shù)的分類
        大數(shù)據(jù)背景下基于B—樹結(jié)構(gòu)的SQL Server數(shù)據(jù)優(yōu)化策略研究
        實踐應(yīng)用取向的現(xiàn)代教育技術(shù)公共課實驗教學(xué)的有效實施與應(yīng)用
        基于μσ-DWC特征和樹結(jié)構(gòu)M-SVM的多維時間序列分類
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        高職院校公共課分類分項教學(xué)安排的實施與探討
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        采用動態(tài)樹結(jié)構(gòu)實現(xiàn)網(wǎng)絡(luò)課程內(nèi)容的動態(tài)更新
        河南科技(2014年11期)2014-02-27 14:17:57
        国产激情久久久久久熟女老人| 亚洲欧美国产精品久久久| 男女羞羞的视频免费网站| 在教室轮流澡到高潮h免费视| 成年女人vr免费视频| 国产黄a三级三级三级av在线看| 午夜在线观看有码无码| 中文字幕色资源在线视频| 亚洲日韩精品一区二区三区无码 | 中文人妻无码一区二区三区在线 | 成人国产精品一区二区八戒网| 男女做爰猛烈啪啪吃奶动 | 日韩在线观看你懂的| 在线观看日韩精品视频网站| 亚洲国产精品一区二区久久恐怖片 | 国产内射一级一片内射高清视频1 成人av一区二区三区四区 | 丝袜美腿av免费在线观看| 文字幕精品一区二区三区老狼| 在线视频观看免费视频18| 久久无码精品精品古装毛片| 男人深夜影院无码观看| 五月婷婷开心五月播五月| 国产亚洲成av人片在线观看| 中文字幕精品无码一区二区| 久久久久无码精品国| 国产一区二区黄色网页| 亚洲欧美国产国产综合一区| 亚洲欧美精品伊人久久| 国产精品香蕉网页在线播放| 午夜大片在线播放观看| 日本老熟妇乱| 久久精品无码专区东京热| 蜜桃av在线播放视频| 特黄aaaaaaaaa毛片免费视频| 人人妻人人澡av天堂香蕉| 加勒比精品一区二区三区| 国产成人亚洲一区二区| 蜜臀av性久久久久蜜臀aⅴ| 99久久综合九九亚洲| 青青草在线免费观看视频| 狼狼综合久久久久综合网|