亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        師范生職前課程數(shù)據(jù)關(guān)聯(lián)性分析

        2019-10-18 02:27:26施成湘
        關(guān)鍵詞:置信度關(guān)聯(lián)聚類

        施成湘, 周 婷

        (重慶第二師范學(xué)院 數(shù)學(xué)與信息工程學(xué)院, 重慶 400067)

        隨著信息技術(shù)的快速發(fā)展和普及,大量的數(shù)據(jù)和信息得以積累,如何從大量數(shù)據(jù)中提取出有用的信息已成為信息技術(shù)研究的重要課題之一,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。研究人員從不同角度、不同側(cè)重對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行了深入的研究與探討。尤其是近年來,隨著全世界對(duì)教育熱點(diǎn)問題關(guān)注度的持續(xù)升溫,新思想、新方法層出不窮。吳文玲[1]以大量學(xué)生課程數(shù)據(jù)為切入點(diǎn),探討了如何利用數(shù)據(jù)得到統(tǒng)計(jì)意義上的課程相關(guān)性,為課程設(shè)置提供決策依據(jù);張濠天等[2]對(duì)數(shù)學(xué)專業(yè)學(xué)生的成績(jī)數(shù)據(jù)進(jìn)行研究,確定了不同類型課程之間的相關(guān)性,努力探索提高學(xué)生課程成績(jī)和教學(xué)質(zhì)量的方法;陳喜華等[3]對(duì)學(xué)生成績(jī)進(jìn)行分析,挖掘出學(xué)生各門課程成績(jī)的分布情況及課程之間的關(guān)聯(lián)性,并對(duì)挖掘結(jié)果進(jìn)行了詳細(xì)的分析和說明[4];李芳[5]將數(shù)據(jù)挖掘技術(shù)應(yīng)用在學(xué)生成績(jī)數(shù)據(jù)分析中,為設(shè)計(jì)課程的順序提供了可行性建議。

        推動(dòng)高校教師改進(jìn)教學(xué), 激發(fā)學(xué)生學(xué)習(xí)積極性,需要對(duì)學(xué)科課程的設(shè)置、課程之間的相互關(guān)系、學(xué)生學(xué)科成績(jī)的綜合評(píng)定等問題進(jìn)行深入的思考。本文先利用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則技術(shù)對(duì)師范專業(yè)學(xué)生課程成績(jī)數(shù)據(jù)進(jìn)行分析,得出課程之間存在的相關(guān)性及重要性;再利用數(shù)據(jù)挖掘中的聚類分析技術(shù)預(yù)測(cè)課程重要性并得出學(xué)生在校的學(xué)習(xí)情況,為人才培養(yǎng)方案的制定、課程的設(shè)置提供決策支持。同時(shí),教師也可以根據(jù)挖掘結(jié)果因材施教,從而更加靈活地組織教學(xué),提高教學(xué)效率。

        一、相關(guān)理論

        (一)關(guān)聯(lián)規(guī)則

        關(guān)聯(lián)規(guī)則(Association Rules)是指大型數(shù)據(jù)庫系統(tǒng),它可以快速找到各種事物之間的潛在和有價(jià)值的關(guān)聯(lián),并以規(guī)則表達(dá)。關(guān)聯(lián)規(guī)則的研究和應(yīng)用是數(shù)據(jù)挖掘中最活躍、最深刻的分支。為了使挖掘出來的關(guān)聯(lián)規(guī)則有效,需要給出兩個(gè)最常用的指標(biāo):最小支持度和最小置信度。

        (1)對(duì)于規(guī)則X→Y,其規(guī)則的支持度定義為

        (1)

        其中,N(X∩Y)表示同時(shí)包含前項(xiàng)X和后項(xiàng)Y的事務(wù)數(shù)量,N表示總的事務(wù)數(shù)量。規(guī)則支持度反映了該規(guī)則的普遍程度。

        (2)對(duì)于規(guī)則X→Y,其規(guī)則的置信度定義為

        (2)

        其中,N(X∩Y)表示同時(shí)包含前項(xiàng)X和后項(xiàng)Y的事務(wù)數(shù)量,N(X)表示包含前項(xiàng)X的事務(wù)數(shù)量。規(guī)則的置信度實(shí)際上是在給定前項(xiàng)X的前提下,后項(xiàng)Y的條件概率。

        一般來說,一個(gè)“好”的關(guān)聯(lián)規(guī)則應(yīng)當(dāng)同時(shí)具有較高的支持度和置信度。因此,在實(shí)際使用過程中,通常設(shè)置最小支持度和最小置信度。

        (二) Apriori算法

        Apriori算法是一種挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法。一個(gè)有效的關(guān)聯(lián)規(guī)則應(yīng)當(dāng)滿足SX→Y≥Smin且CX→Y≥Cmin,故Apriori 算法可以分為三步:

        (1)設(shè)定最小支持度Smin及最小置信度Cmin。

        (2)根據(jù)最小支持度,生成頻繁項(xiàng)集。

        (3)根據(jù)最小置信度,基于頻繁項(xiàng)集生成最終關(guān)聯(lián)規(guī)則。

        二、基于Apriori算法的課程成績(jī)分析

        數(shù)據(jù)來源于重慶第二師范學(xué)院本科小學(xué)教育專業(yè)(全科)347名學(xué)生四年來25門專業(yè)必修課的成績(jī),通過關(guān)聯(lián)規(guī)則Apriori算法,從學(xué)生成績(jī)的數(shù)據(jù)中發(fā)現(xiàn)內(nèi)部頻繁項(xiàng)集之間的關(guān)聯(lián),找到數(shù)據(jù)與數(shù)據(jù)間的潛在關(guān)系、課程與課程之間隱含關(guān)系、某些課程對(duì)其他課程的影響程度,為課程的設(shè)置和教學(xué)計(jì)劃的制定提供一定的參考依據(jù)。整個(gè)實(shí)施過程分為數(shù)據(jù)預(yù)處理、模型建立、挖掘結(jié)果分析與評(píng)估應(yīng)用四部分。

        (一)數(shù)據(jù)預(yù)處理

        數(shù)據(jù)信息包括學(xué)年、學(xué)期、任選課程、公共必修課、實(shí)踐課、專業(yè)必修課、課程學(xué)分、學(xué)分績(jī)點(diǎn)、平時(shí)成績(jī)、期末成績(jī),對(duì)緩考、免考、曠考等情況不予考慮。由于學(xué)生成績(jī)總體水平較高,各科的差距不明顯,為了讓課程成績(jī)之間有點(diǎn)差距,方便數(shù)據(jù)分析,對(duì)課程按性質(zhì)劃分大類,相似課程進(jìn)行合并(見表1),以均值的形式呈現(xiàn),經(jīng)過處理后為12大類。

        同時(shí),為了方便數(shù)據(jù)的處理,本文采用表格格式(一般來說,進(jìn)行關(guān)聯(lián)分析的數(shù)據(jù)形式可以有表格格式和事務(wù)格式),即將學(xué)生成績(jī)高于該類課程均值(347名學(xué)生該類課程的總成績(jī)除以總?cè)藬?shù))的記為1,低于該類課程均值的記為0(如圖1所示)。

        表1 相似課程合并

        圖1 2014級(jí)小學(xué)全科專業(yè)必修課

        (二)建立Apriori模型

        將專業(yè)必修課課程成績(jī)?nèi)繉?dǎo)入SPSS Modeler中,建立如圖2所示的Apriori算法模型。

        在建模時(shí),系統(tǒng)默認(rèn)的最低條件支持度為10%,最小規(guī)則置信度為80%,最大前項(xiàng)數(shù)為10,運(yùn)行得到5505條關(guān)聯(lián)規(guī)則。規(guī)則太多,分析較復(fù)雜,所以要提高最低條件支持度和最小規(guī)則置信度,減少規(guī)則條數(shù),得到有效、有價(jià)值的信息,但當(dāng)最低條件支持度為31%、最小規(guī)則置信度為92%時(shí),得到5條關(guān)聯(lián)規(guī)則。規(guī)則太少,可能會(huì)丟失有價(jià)值的規(guī)則信息,最終選擇最低條件支持度為31%、最小規(guī)則置信度為91%,得出10條關(guān)聯(lián)規(guī)則。考慮最大鏈接數(shù)太大,得到的網(wǎng)絡(luò)圖太復(fù)雜,不方便分析,將網(wǎng)絡(luò)圖中的可顯示的最大鏈接數(shù)設(shè)置為25。

        (三) Apriori算法挖掘的結(jié)果分析

        運(yùn)行Apriori算法挖掘模型得到的結(jié)果如圖3和圖4所示。

        圖2 Apriori算法挖掘模型

        圖3 Apriori挖掘模型

        從圖4可以看出不同課程之間的關(guān)聯(lián)程度:連線越多,說明與其他課程之間的聯(lián)系越緊密;連線越粗,對(duì)其他課程的影響程度越大。彼此聯(lián)系緊密的課程應(yīng)該作為基礎(chǔ)課程使用,而且應(yīng)該優(yōu)先設(shè)置,比如教學(xué)書法、小學(xué)教學(xué)課程、班隊(duì)管理。對(duì)于彼此影響程度高的課程,重要的是要考慮哪個(gè)課程是先導(dǎo)課程,哪個(gè)是后續(xù)課程,如小學(xué)教學(xué)課程和教學(xué)書法、班隊(duì)管理和教學(xué)書法、心理學(xué)和班隊(duì)管理等。

        圖4 網(wǎng)絡(luò)圖

        根據(jù)圖3的挖掘結(jié)果,并結(jié)合對(duì)圖4的分析,可以得出:

        1.鍵盤、心理學(xué)、教育測(cè)量與評(píng)價(jià)能夠促進(jìn)教學(xué)書法的學(xué)習(xí),說明教學(xué)書法應(yīng)該開設(shè)在這三門基礎(chǔ)課程之后,教育經(jīng)典、課程與教學(xué)、媒體與課件制作雖能促進(jìn)教學(xué)書法的學(xué)習(xí),但影響并不大。

        2.教學(xué)書法和小學(xué)教學(xué)課程、班隊(duì)管理和教學(xué)書法之間是互為促進(jìn)的關(guān)系,可以同時(shí)開設(shè)。

        3.鍵盤能促進(jìn)小學(xué)教學(xué)課程的學(xué)習(xí),可以優(yōu)先考慮。

        4.模型中沒有挖掘教學(xué)書法與微課之間的關(guān)聯(lián)規(guī)則,但網(wǎng)絡(luò)圖表現(xiàn)為密切相關(guān)??赡苁菙?shù)據(jù)集成和清理、數(shù)據(jù)轉(zhuǎn)換錯(cuò)誤或它們沒有達(dá)到最小條件支持度和最小規(guī)則置信度。

        5.在模型中沒有發(fā)現(xiàn)媒體與課件制作和鍵盤之間的關(guān)聯(lián)規(guī)則,這表明這兩門課程相關(guān)性不強(qiáng)。

        通過以上分析,可以明確課程與課程之間的關(guān)聯(lián)關(guān)系以及課程之間的重要性。模型的挖掘結(jié)果可為學(xué)校的課程設(shè)置、教學(xué)計(jì)劃的制定和人才培養(yǎng)方案的修訂提供決策支持。

        (四)課程成績(jī)?cè)u(píng)估應(yīng)用

        為了更準(zhǔn)確地知道課程之間的重要性以及該年級(jí)學(xué)生的學(xué)習(xí)成績(jī)分布,繼續(xù)對(duì)學(xué)生的成績(jī)進(jìn)行聚類分析。通過K-Means算法對(duì)學(xué)生的課程成績(jī)進(jìn)行聚類,得出學(xué)生課程成績(jī)分布情況,并預(yù)測(cè)課程的重要性,從而指導(dǎo)和建議學(xué)生選課和學(xué)習(xí),達(dá)到提高教學(xué)效果的目的。建立K-Means算法模型,如圖5所示。

        圖5 K-Means算法挖掘模型

        在運(yùn)行模型之前,為了找到聚類質(zhì)量的轉(zhuǎn)折點(diǎn),選擇合適的聚類數(shù),需要分別將聚類數(shù)設(shè)置為2~6,共5個(gè)數(shù)值。每運(yùn)行一次,觀察其模型,并記錄模型的聚類質(zhì)量(見表2)。

        表2 不同K值的聚類質(zhì)量

        由表2可知,第二次,當(dāng)k=3時(shí),是聚類質(zhì)量的轉(zhuǎn)折點(diǎn)。選擇這一轉(zhuǎn)折點(diǎn)對(duì)學(xué)生的課程成績(jī)進(jìn)行分析比較合理,聚類數(shù)為3,最后運(yùn)行模型得到以下結(jié)果(見圖6)。

        圖6 各聚類均值

        根據(jù)圖6(部分圖)所示,每個(gè)類別是分?jǐn)?shù)組,每個(gè)類別中的分?jǐn)?shù)是分?jǐn)?shù)組的平均值。這些平均值是對(duì)學(xué)生成績(jī)進(jìn)行分類和評(píng)價(jià)的標(biāo)準(zhǔn)和依據(jù)。將圖6中的平均值匯總在表中,學(xué)生成績(jī)的聚類平均值如表3所示。

        根據(jù)圖7的MYMKM-K-Means的分布和對(duì)表3的學(xué)生成績(jī)聚類均值的分析可得:

        第一類學(xué)生比例最大,占總數(shù)的48.7%,他們成績(jī)中等,少數(shù)科目成績(jī)稍差。教師應(yīng)該指導(dǎo)這類學(xué)生全面發(fā)展,這類學(xué)生應(yīng)在偏差的學(xué)科上多下功夫,遇到問題主動(dòng)、積極地向同學(xué)或者老師請(qǐng)教,從而防止偏科嚴(yán)重化。

        第二類學(xué)生比例最小,占總數(shù)的17.29%,他們成績(jī)較差,其中心理學(xué)和教學(xué)書法相對(duì)更差,而普通話和微課相對(duì)較好。教師要提醒這類學(xué)生更多地了解心理學(xué)和書法知識(shí),彌補(bǔ)這方面知識(shí)的缺陷,同時(shí)督促學(xué)生自律,提高他們學(xué)習(xí)的積極性。

        表3 學(xué)生成績(jī)聚類均值

        圖7 MYMKM-K-Means的分布

        第三類學(xué)生占總數(shù)的34.01%,他們成績(jī)最好,而且所有科目的成績(jī)都比較平衡,沒有嚴(yán)重的偏差。教師在教學(xué)過程中應(yīng)注意提高他們的實(shí)踐能力和專業(yè)技能。

        從圖8可以得到12門課程的重要性,如表4所示。從表4可以清楚地看出小學(xué)教學(xué)課程是最重要的,重要性為1,微課是最不重要的,重要性為0.02。

        結(jié)合圖8和表4分析,教學(xué)管理者可以依據(jù)不同課程的重要性來適當(dāng)增加重要課程的學(xué)時(shí)。當(dāng)預(yù)測(cè)變量的重要性大于0.5時(shí),可以視為相對(duì)比較重要的課程,則從表4可以看出小學(xué)教學(xué)課程、心理學(xué)、鍵盤、教育學(xué)、教育測(cè)量與評(píng)價(jià)等課程是相對(duì)比較重要的課程,那么就可以適當(dāng)增加這幾門課程的課時(shí),從而促進(jìn)后面課程的學(xué)習(xí),也有利于教學(xué)人員的教學(xué),有利于提高學(xué)生的課程成績(jī)。應(yīng)安排具有豐富教學(xué)經(jīng)驗(yàn)的教師承擔(dān)這些課程的教學(xué)任務(wù),從而提高教學(xué)效果。

        圖8 預(yù)測(cè)變量的重要性

        表4 課程重要性

        三、結(jié)語

        本文運(yùn)用Apriori算法對(duì)學(xué)生課程成績(jī)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,得出了課程之間的相關(guān)性及重要性,提出了合理設(shè)置課程順序的建議;運(yùn)用K-Means算法對(duì)課程成績(jī)數(shù)據(jù)進(jìn)行深層次的聚類分析,不僅預(yù)測(cè)了課程的重要性,為課程的設(shè)置提供決策支持,還可讓學(xué)生了解自己整體成績(jī)的相對(duì)位置和薄弱科目,從而確定自己的學(xué)習(xí)方法;教師可以根據(jù)挖掘的結(jié)果,分析各類學(xué)生的表現(xiàn)特點(diǎn)、學(xué)習(xí)狀況以及教學(xué)中存在的問題,從而調(diào)整教學(xué)方法,以便更好地實(shí)施教學(xué)改革,提高教學(xué)質(zhì)量和教學(xué)效果。

        猜你喜歡
        置信度關(guān)聯(lián)聚類
        硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
        奇趣搭配
        基于DBSACN聚類算法的XML文檔聚類
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        基于改進(jìn)的遺傳算法的模糊聚類算法
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        亚洲成av人片天堂网无码| 中文字幕日韩人妻不卡一区| 无套内谢孕妇毛片免费看| 男女啪动最猛动态图| 精品人妻无码视频中文字幕一区二区三区 | 又湿又黄裸乳漫画无遮挡网站| 国内精品人妻无码久久久影院导航| 亚洲av无码久久寂寞少妇| 99热最新在线观看| 国产综合一区二区三区av| 日本视频一中文有码中文| 成人av综合资源在线| 国产精品免费一区二区三区四区| 黑人上司粗大拔不出来电影| 日韩黑人欧美在线视频观看| 亚洲AV秘 无码二区在线| 国产极品喷水视频| 亚洲视频精品一区二区三区| 中文字幕人妻av一区二区| 蜜桃臀av一区二区三区| 秘书边打电话边被躁bd视频| 高清破外女出血av毛片| 男女下面进入的视频| 连续高潮喷水无码| 亚洲人成网站在线播放小说| 日本一区不卡在线观看| 日本精品一区二区三区二人码 | 2021国产视频不卡在线| 2021精品综合久久久久| 国产三级c片在线观看 | 国产精品一区二区三久久不卡| av鲁丝一区鲁丝二区鲁丝三区| 亚洲欧美日本| 亚洲免费不卡| bbbbbxxxxx欧美性| 亚洲sm另类一区二区三区| 69一区二三区好的精华| 91网站在线看| 丰满少妇高潮在线观看| 一区二区三区国产精品乱码| 亚洲色www成人永久网址|