亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

        2020-12-24 06:41:08劉思皖
        無線互聯(lián)科技 2020年20期
        關(guān)鍵詞:數(shù)據(jù)挖掘數(shù)據(jù)庫分析

        劉思皖

        (寧夏財(cái)經(jīng)職業(yè)技術(shù)學(xué)院,寧夏 銀川 750001)

        0 引言

        學(xué)生成績不僅是反映學(xué)生學(xué)習(xí)效果的重要指標(biāo),也是高校改進(jìn)教學(xué)質(zhì)量的重要依據(jù)。傳統(tǒng)的學(xué)生成績管理模式主要是利用計(jì)算機(jī)技術(shù)對學(xué)生的成績進(jìn)行排名,難以有效的挖掘出潛在的有用數(shù)據(jù)信息,而數(shù)據(jù)挖掘技術(shù)則可以利用關(guān)聯(lián)規(guī)則等元素,實(shí)現(xiàn)對學(xué)生成績的自動(dòng)分析。因此本文詳細(xì)闡述基于大數(shù)據(jù)技術(shù)的學(xué)生成績分析系統(tǒng)。

        1 數(shù)據(jù)挖掘技術(shù)的概述

        數(shù)據(jù)挖掘技術(shù)是一種知識發(fā)現(xiàn)的技術(shù),從大量的不確定、模糊的數(shù)據(jù)中尋找數(shù)據(jù)內(nèi)在的特征和規(guī)律,從而發(fā)現(xiàn)潛在的有價(jià)值的信息,為決策者提供數(shù)據(jù)依據(jù)。一般而言,數(shù)據(jù)挖掘技術(shù)主要包括以下幾種:一是分類技術(shù),即從特定的數(shù)據(jù)群中找出特定類別的描述方法,以此將其進(jìn)行分類,構(gòu)造分類模型。例如我們常用的數(shù)理統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)模型等等。二是聚類技術(shù),即將數(shù)據(jù)庫中的數(shù)據(jù)集劃分為若干子集,使得每個(gè)數(shù)據(jù)子集內(nèi)部都具有較強(qiáng)的相關(guān)性。例如常見的K-Means、數(shù)據(jù)統(tǒng)計(jì)方法等。三是關(guān)聯(lián)分析,即用于發(fā)現(xiàn)數(shù)據(jù)集合中數(shù)據(jù)項(xiàng)之間的某種關(guān)聯(lián)和聯(lián)系,發(fā)現(xiàn)其內(nèi)在的規(guī)律性[1]。

        數(shù)據(jù)挖掘技術(shù)的使用流程主要包括以下幾個(gè)方面:(1)數(shù)據(jù)準(zhǔn)備,它是數(shù)據(jù)挖掘的基礎(chǔ),主要是將數(shù)據(jù)進(jìn)行集中匯總,該環(huán)節(jié)主要是消除數(shù)據(jù)中的噪聲、消除數(shù)據(jù)間的不一致和模糊性。(2)數(shù)據(jù)發(fā)現(xiàn),即選擇合適的算法和恰當(dāng)?shù)姆治龇椒▽⒂绊憯?shù)據(jù)挖掘的結(jié)果。(3)結(jié)果表達(dá)和解釋,它是數(shù)據(jù)挖掘的最后一個(gè)環(huán)節(jié),也就是將挖掘的結(jié)果以可視化的方式進(jìn)行展示。

        2 基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績系統(tǒng)設(shè)計(jì)的內(nèi)在需求

        構(gòu)建基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績系統(tǒng)設(shè)計(jì)必須要清晰地了解系統(tǒng)設(shè)計(jì)的內(nèi)在要求,結(jié)合實(shí)踐調(diào)查其內(nèi)在需求主要表現(xiàn)為:一是傳統(tǒng)的學(xué)生成績統(tǒng)計(jì)模式存在時(shí)間長、效率低的問題。例如傳統(tǒng)的學(xué)生統(tǒng)計(jì)模式主要是利用各種表格方式將學(xué)生的成績進(jìn)行排名,而沒有對學(xué)生成績的深層次問題進(jìn)行準(zhǔn)確分析。而利用數(shù)據(jù)挖掘技術(shù)則可以構(gòu)建出學(xué)生成績分析系統(tǒng),實(shí)現(xiàn)對學(xué)生成績的深層次分析。例如采取NET技術(shù)路線(ASP.NET)和Microsoft數(shù)據(jù)庫進(jìn)行開發(fā),從而設(shè)計(jì)支持多人協(xié)作開發(fā)的系統(tǒng)。二是數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)對學(xué)生成績數(shù)據(jù)的自動(dòng)化分析,挖掘出潛在有用信息。學(xué)生成績來源渠道不同,而且差異性比較突出,因此在數(shù)據(jù)采集時(shí)需要考慮到數(shù)據(jù)的變量問題,而對于數(shù)據(jù)變量的分析則必須要通過數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)[2]。

        3 基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績系統(tǒng)設(shè)計(jì)

        3.1 體系結(jié)構(gòu)設(shè)計(jì)

        基于數(shù)據(jù)挖掘的高校學(xué)生成績系統(tǒng)采用3層體系結(jié)構(gòu),結(jié)合上述學(xué)生成績模型,三層體系結(jié)構(gòu)設(shè)計(jì)如圖1所示。3層體系結(jié)構(gòu)將數(shù)據(jù)和業(yè)務(wù)邏輯以及系統(tǒng)實(shí)現(xiàn)分開,使得系統(tǒng)用戶只需專注數(shù)據(jù)分析結(jié)果而無須理會數(shù)據(jù)的操作過程,具體分為:用戶層、功能模塊層和基礎(chǔ)數(shù)據(jù)層。基礎(chǔ)數(shù)據(jù)層為最底層的結(jié)構(gòu),它將基礎(chǔ)數(shù)據(jù)存儲于數(shù)據(jù)倉庫中,對數(shù)據(jù)進(jìn)行集中管理和處理,數(shù)據(jù)庫中存儲的數(shù)據(jù)包括學(xué)生成績及相關(guān)數(shù)據(jù)、需求字典、數(shù)據(jù)挖掘方法模型庫以及知識庫等,系統(tǒng)通過數(shù)據(jù)庫對數(shù)據(jù)進(jìn)行讀取和操作。功能模塊層又稱為業(yè)務(wù)邏輯層,主要由數(shù)據(jù)挖掘流程管理、數(shù)據(jù)挖掘需求管理、數(shù)據(jù)挖掘模型方法管理、數(shù)據(jù)挖掘結(jié)果分析、系統(tǒng)配置管理、數(shù)據(jù)源配置等功能模塊構(gòu)成。用戶層為頂層結(jié)構(gòu),是系統(tǒng)的展示層,系統(tǒng)用戶主要包括學(xué)校領(lǐng)導(dǎo)、系部主任、系部教師、在校學(xué)生以及系統(tǒng)管理員等。而系部主任和系部教師則是系統(tǒng)的主要用戶,他們負(fù)責(zé)學(xué)生成績數(shù)據(jù)挖掘并將結(jié)果展示給學(xué)校領(lǐng)導(dǎo)或相關(guān)用戶。用戶角色和用戶權(quán)限通過系統(tǒng)配置管理實(shí)現(xiàn)。

        圖1 數(shù)據(jù)挖掘?qū)W生成績系統(tǒng)結(jié)構(gòu)

        3.2 功能模塊設(shè)計(jì)

        按照功能需求分析結(jié)果,系統(tǒng)劃分為學(xué)生信息管理模塊、學(xué)生成績管理模塊、數(shù)據(jù)挖掘結(jié)果分析模塊、教師課程信息管理模塊、用戶權(quán)限管理模塊和系統(tǒng)配置管理模塊等6個(gè)模塊。

        3.3 數(shù)據(jù)庫表設(shè)計(jì)

        數(shù)據(jù)庫是一個(gè)系統(tǒng)所有數(shù)據(jù)的集合,這些數(shù)據(jù)按特定的組織方式存儲在一起,通過通用的存取方式合理而高效地完成系統(tǒng)所需要的各類功能。系統(tǒng)信息表主要由系統(tǒng)所有基本編碼表組成,這些系統(tǒng)編碼表是系統(tǒng)賴以運(yùn)行的基本;教務(wù)信息表包含教學(xué)計(jì)劃表、課程表、班級表、教學(xué)資源表等;人員信息表包括教師信息表、學(xué)生信息表和教職工信息表。

        3.4 應(yīng)用Apriori算法分析學(xué)生成績

        3.4.1 數(shù)據(jù)挖掘過程

        數(shù)據(jù)挖掘過程是對相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理的過程,主要包括:(1)明確數(shù)據(jù)挖掘?qū)ο笈c目標(biāo)。數(shù)據(jù)挖掘技術(shù)使用的關(guān)鍵就是要確定具體的挖掘數(shù)據(jù),基于本文設(shè)計(jì)目標(biāo),數(shù)據(jù)挖掘的對象主要是學(xué)生的成績,因此需要相關(guān)人員將涉及學(xué)生成績的所有數(shù)據(jù)納入到數(shù)據(jù)庫系統(tǒng)中,為下一步的數(shù)據(jù)提取、清理工作打下基礎(chǔ)。(2)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理就是去除數(shù)據(jù)中的無關(guān)信息,即去除與學(xué)生成績無關(guān)或者無效成績的數(shù)據(jù)。(3)對數(shù)據(jù)進(jìn)行挖掘。對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行深入分析、挖掘,得出相應(yīng)的分析結(jié)果,為用戶提供有用信息。

        3.4.2 學(xué)生成績數(shù)據(jù)采集

        為了更好地對學(xué)生成績進(jìn)行分析,本文以我院計(jì)算機(jī)專業(yè)學(xué)生4個(gè)學(xué)期的所有課程成績數(shù)據(jù)作為研究對象,并結(jié)合學(xué)生的學(xué)習(xí)興趣,對這些數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換等,通過關(guān)聯(lián)規(guī)則的算法挖掘出影響學(xué)生成績的關(guān)鍵因素。依據(jù)學(xué)生的培養(yǎng)方案,學(xué)生在學(xué)習(xí)“必修”“限選”“任選”類課程時(shí)必須遵照培養(yǎng)方案中的學(xué)分下限要求。由于“限選”和“必修”類的課程囊括了在校學(xué)生的學(xué)科內(nèi)部專業(yè)課程和基礎(chǔ)課程兩個(gè)方面,同時(shí)高校學(xué)生的專業(yè)課程成績與學(xué)生最終的成績聯(lián)系最緊密,即:“限選”和“必修”類課程的重要程度比“任選”類課程高,因此,借助對學(xué)生“必修”和“限選”兩類課程的成績數(shù)據(jù)挖掘分析,忽略“任選”類課程。高校里不同專業(yè)開設(shè)的課程每學(xué)期都小幅度調(diào)整、更新,但是“必修”課程和“限選”課程變動(dòng)情況卻非常少,因此,數(shù)據(jù)庫當(dāng)中這兩種類型的成績出現(xiàn)率也是非常高的,數(shù)據(jù)存儲的時(shí)間跨度最大。綜合上述,把“限選”和“必修”類課程的成績作為研究對象,采集數(shù)據(jù)預(yù)期分析效果較為理想,可以有效揭示學(xué)生考試成績所蘊(yùn)含的關(guān)聯(lián)[3]。

        3.4.3 數(shù)據(jù)預(yù)處理

        考慮到學(xué)生成績的差異性特點(diǎn),本次設(shè)計(jì)將學(xué)生的每門成績按照不合格率、合格率、中等率以及優(yōu)秀率的等級進(jìn)行劃分,對原始數(shù)據(jù)進(jìn)行離散化處理,對學(xué)生成績當(dāng)中的較高成績與較低成績進(jìn)行深入分析。一方面分析學(xué)生考試成績之間所隱含的影響因素,另一方面分析不同課程之間的關(guān)聯(lián)。數(shù)據(jù)挖掘過程中應(yīng)用的數(shù)據(jù)采集自高校的教學(xué)管理的成績數(shù)據(jù)倉庫:將數(shù)據(jù)存儲在表格內(nèi)的可以直接導(dǎo)出到CSV等數(shù)據(jù)集去,預(yù)處理階段處理成績?nèi)笔е档葐栴}。

        3.4.4 關(guān)聯(lián)規(guī)則挖掘?qū)嵤?/p>

        關(guān)聯(lián)規(guī)則的挖掘?qū)嵤┦菙?shù)據(jù)挖掘算法實(shí)施的關(guān)鍵,本文選擇的是關(guān)聯(lián)規(guī)則挖掘Apriori算法,因此根據(jù)系統(tǒng)設(shè)計(jì)的原則要求,設(shè)置的最小支持度為0.2,最小置信度是0.5。首先需要建立健全Grade數(shù)據(jù)庫,據(jù)庫中的Course表是用來存儲課程信息,Special畸Inf.o用來存儲學(xué)籍信息,而且ade表是用來存儲學(xué)生的考試成績信息的;其次對數(shù)據(jù)庫中的所有信息進(jìn)行分析,并且對成績超過80分的進(jìn)行總結(jié),同時(shí)將課程的支持度和課程名稱的計(jì)數(shù)信息存放到頻繁1項(xiàng)集的數(shù)據(jù)表格Frequentl中,F(xiàn)requentl有兩個(gè)關(guān)鍵的字段nem和SupCount。再次得到頻繁項(xiàng)集之后,就可以計(jì)算出相應(yīng)的候選項(xiàng)集生成相應(yīng)的頻繁項(xiàng)集。最后算出最終的頻繁項(xiàng)目集中的非空子集所包含的置信度和支持度,并且拿它們與最小支持度和最小置信度進(jìn)行比較,比較后刪除那些小于最小置信度的記錄,并且最終會產(chǎn)生關(guān)聯(lián)規(guī)則。

        4 系統(tǒng)的測試

        為檢驗(yàn)系統(tǒng)的各項(xiàng)性能在系統(tǒng)規(guī)定允許的軟硬件環(huán)境下(包括服務(wù)器、客戶機(jī)的各類機(jī)器指標(biāo)如CPU主頻、機(jī)器結(jié)構(gòu)、硬盤速度、網(wǎng)絡(luò)帶寬、實(shí)際傳輸速率等)是否符合預(yù)期給定的指標(biāo),需要進(jìn)行性能測試,主要測試軟件在特定環(huán)境下的處理速度。而環(huán)境要盡量考慮實(shí)際運(yùn)行狀態(tài)下的環(huán)境,根據(jù)實(shí)際的測試結(jié)果分析可知,未發(fā)現(xiàn)本系統(tǒng)中存在嚴(yán)重等級較高的異?;蝈e(cuò)誤,從整體上來講通過了本次測試。

        猜你喜歡
        數(shù)據(jù)挖掘數(shù)據(jù)庫分析
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        隱蔽失效適航要求符合性驗(yàn)證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)庫
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢分析
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        最新国产在线精品91尤物| 91人妻一区二区三区蜜臀| 精品一区二区三区牛牛| 精品国产一区二区三区av麻| 国产又大又硬又粗| 一区二区三区人妻无码| 国产自国产在线观看免费观看| av中文字幕不卡无码| 日本一区二区三区看片| 蜜桃传媒免费观看视频| 麻豆国产精品久久人妻| 国产丝袜视频一区二区三区| 伊人久久大香线蕉免费视频| 国产综合一区二区三区av| 国产自拍视频在线观看免费| 国产又色又爽又黄的| 波多野结衣中文字幕久久| 久久亚洲第一视频黄色| 最新日韩精品视频免费在线观看| 风流少妇一区二区三区91| 亚洲第一幕一区二区三区在线观看 | 国产日本精品一区二区| 亚洲天堂av中文字幕在线观看| 日韩精品久久久久久久电影蜜臀| 国产精在线| 国产精品涩涩涩一区二区三区免费| 国产亚洲一本二本三道| 国产a级毛片久久久精品毛片| 国产精品国产成人国产三级| 久精品国产欧美亚洲色aⅴ大片| 亚洲av毛片一区二区久久| 中文字幕亚洲视频一区| 国产无遮挡又爽又刺激的视频老师| 国产国产人精品视频69| 日韩乱码精品中文字幕不卡| 国产一区白浆在线观看| 日本入室强伦姧bd在线观看| 日本www一道久久久免费榴莲| 精品久久久久88久久久| 日韩精品午夜视频在线| 伊人久久精品无码二区麻豆|