亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori算法的高職院校畢業(yè)生就業(yè)情況分析

        2021-04-11 14:25:44羅明全
        中阿科技論壇(中英文) 2021年3期
        關鍵詞:項集數(shù)據(jù)挖掘專業(yè)課程

        羅明全

        (瀘州職業(yè)技術學院,四川瀘州 646000)

        1 引言

        目前,隨著信息化建設的不斷深入,各高職院校存儲了大量、復雜的畢業(yè)生成績和就業(yè)信息數(shù)據(jù),如何從中挖掘出有價值的信息,成為高職院校的重要研究課題。本文對瀘州職業(yè)技術學院信息工程學院近5屆畢業(yè)生在校成績和就業(yè)相關數(shù)據(jù)進行挖掘分析,獲得一批可以為人才培養(yǎng)方案修訂和就業(yè)指導工作開展提供決策依據(jù)的有價值信息。

        2 數(shù)據(jù)挖掘及關聯(lián)規(guī)則的基本概念

        從海量數(shù)據(jù)中挖掘出潛在、有用知識的過程被稱為知識發(fā)現(xiàn)(KDD),在這個過程中,數(shù)據(jù)挖掘(Data Mining)是至關重要的一環(huán)。數(shù)據(jù)挖掘是利用特定算法,自動或半自動地發(fā)現(xiàn)有意義的數(shù)據(jù)模式。

        關聯(lián)規(guī)則(Association Rule)是數(shù)據(jù)挖掘的一個重要技術,其目標是發(fā)現(xiàn)數(shù)據(jù)項集之間的關聯(lián)關系或相關關系。關聯(lián)規(guī)則挖掘的一個典型例子是購物籃分析,通過分析“購物籃”哪些商品頻繁地被顧客同時購買,發(fā)現(xiàn)不同商品之間的關聯(lián),得出顧客的購物習慣,從而幫助零售商調整商品貨架布局以及開發(fā)更好的營銷策略[1]。

        關聯(lián)規(guī)則是形如X Y的蘊涵式,其中X為關聯(lián)規(guī)則的先導,Y為關聯(lián)規(guī)則的后繼,以下為關聯(lián)規(guī)則的幾個重要概念。

        (1)事務

        一個數(shù)據(jù)實例表視為一個數(shù)據(jù)集,每一條記錄為一個事務,使用D表示數(shù)據(jù)集,|D|表示數(shù)據(jù)集中事務數(shù)。

        (2)項集與頻繁項集

        一個數(shù)據(jù)表中,每個屬性字段具有一個或多個不同的值,每個取值稱為項,這些項的集合稱為項集,k-項集指包含k個項的項集,記為Lk。

        (3)關聯(lián)規(guī)則支持度與置信度

        (4)強關聯(lián)規(guī)則

        在數(shù)據(jù)挖掘中,為衡量關聯(lián)規(guī)則在整個數(shù)據(jù)集中的統(tǒng)計重要性和關聯(lián)規(guī)則的可信程度,需要設置最小支持度閾值min_sup和最小置信度閾值min_conf。

        3 Apriori算法實現(xiàn)

        Apriori算法是一種常用于挖掘數(shù)據(jù)關聯(lián)規(guī)則的算法,使用該算法可篩選出滿足強關聯(lián)規(guī)則的頻繁項集,Apriori算法主要由兩個階段構成:提取頻項集和產(chǎn)生強關聯(lián)規(guī)則。

        (1)Apriori算法流程

        以高職院校畢業(yè)生在校表現(xiàn)及就業(yè)信息數(shù)據(jù)挖掘為例,Apriori算法流程如下。

        輸入:畢業(yè)生在校成績及就業(yè)信息數(shù)據(jù)集D、最小支持度min_sup、最小置信度min_conf。

        輸出:畢業(yè)生在校成績與就業(yè)的關聯(lián)規(guī)則。

        Step1:掃描數(shù)據(jù)集,統(tǒng)計k=1項集及其支持度support(X),比較support(X)與min_sup,若support(X)≥min_sup,則X為頻繁1-項集L1。

        Step2:判斷頻繁k-項集Lk是否為空,為空則轉到Step6,否則轉到Step3。

        Step3:將頻繁k-項集連接,產(chǎn)生候選(k+1)-項集Ck+1。

        Step4:掃描原始數(shù)據(jù)集,計算出每個候選項集c的支持度support(c),若support(c)≥min_sup,則c屬于頻繁(k+1)-項集,否則為不滿足條件的候選項應刪除,產(chǎn)生頻繁(k+1)-項集Lk+1。

        Step5:k=k+1,返回Step2。

        Step6:計算頻繁項集L=∪kLk。

        Step7:比較頻繁項集L中的頻繁項與min_conf,得出畢業(yè)生在校表現(xiàn)與就業(yè)之間的強關聯(lián)規(guī)則。

        (2)Apriori算法程序實現(xiàn)

        本文使用PHP作為程序開發(fā)語言,Apriori類成員如下:

        4 基于Apriori算法的數(shù)據(jù)挖掘應用

        本文所使用的數(shù)據(jù)是瀘州職業(yè)技術學院信息工程學院近5屆畢業(yè)生在校期間課程成績和就業(yè)信息數(shù)據(jù),課程成績包括畢業(yè)生在校期間每學期各科目成績和綜合素質測評成績,就業(yè)信息數(shù)據(jù)包括畢業(yè)去向、單位性質、工作職位類別等[2]。

        4.1 數(shù)據(jù)預處理

        在數(shù)據(jù)挖掘之前,對數(shù)據(jù)進行預處理,主要包括以下內容。

        (1)數(shù)據(jù)變換與集成:由于不同專業(yè)課程存在差別,通過屬性與屬性的連接構造新屬性用于后續(xù)的數(shù)據(jù)挖掘計算,畢業(yè)生各學期英語、高數(shù)成績的算術平均值構造為“文化課程”新屬性,專業(yè)課程成績的算術平均值構造為“專業(yè)課程”新屬性,各學期的綜合素質測評成績的算術平均值構造為“綜合素質”新屬性。以學號為唯一字段,將教務系統(tǒng)和就業(yè)管理系統(tǒng)的數(shù)據(jù)結合起來并統(tǒng)一存儲。

        (2)冗余數(shù)據(jù)和缺失的處理:數(shù)據(jù)集成后,不避免出現(xiàn)冗余數(shù)據(jù),如學號、年級、性別等,所有冗余數(shù)據(jù)全部刪除,可節(jié)約內存并提高運算效率。個別畢業(yè)生畢業(yè)時未就業(yè)或未填報就業(yè)數(shù)據(jù),致使畢業(yè)去向、單位性質、工作職位類別等數(shù)據(jù)項缺失,處理方式為一律舍棄。

        (3)數(shù)值數(shù)據(jù)離散化處理:畢業(yè)生的成績數(shù)據(jù)均為數(shù)量屬性,我們將各成績屬性離散化處理,對文化課程、專業(yè)課程、綜合素質成績采用統(tǒng)一的量化標準,分為良好和一般兩個等級,85分及以上為良好,值使用1表示,低于85分為一般,值使用0表示。

        4.2 關聯(lián)規(guī)則挖掘

        將經(jīng)數(shù)據(jù)預處理后的數(shù)據(jù)存入數(shù)據(jù)庫中,使用Apriori算法的挖掘程序,我們設置min_sup=5%,min_conf=60%,搜素數(shù)據(jù)庫,得到強關聯(lián)規(guī)則如下所示。

        (1)專業(yè)成績(良好)→就業(yè)行業(yè)(信息傳輸、計算機服務和軟件業(yè)),support=41.2%,confidence=80.5%。

        (2)專業(yè)成績(一般)∩綜合素質(良好)→職位類別(商業(yè)和服務業(yè)),support=6.3%,confidence=71.4%。

        (3)文化成績(良好)→就業(yè)方向(專升本),support=5.2%,confidence=63.1%,同時就業(yè)方向(專升本) →文化成績(良好),confidence=87.4%。

        4.3 關聯(lián)規(guī)則分析

        規(guī)則1表明,在校期間專業(yè)成績好的畢業(yè)生就業(yè)行業(yè)為IT行業(yè),一定程度上表明,現(xiàn)開設的專業(yè)課程較為合理。

        規(guī)則2表明,專業(yè)成績一般但綜合素質較強的畢業(yè)生偏好從事商業(yè)和服務業(yè)工作。

        規(guī)則3表明,文化成績達到良好的畢業(yè)生偏好專升本,同時,大多數(shù)專升本成功的畢業(yè)生在校期間文化成績達到良好水平。

        5 結語

        本文利用關聯(lián)規(guī)則及Apriori算法對畢業(yè)生在校期間各項成績和就業(yè)數(shù)據(jù)進行了挖掘和分析,分析得出:高職學生的畢業(yè)去向與在校期間的學習和表現(xiàn)存在較大的關聯(lián)性。在就業(yè)指導中,根據(jù)學生在校表現(xiàn)情況,指導學生正確自我認知,確定合適的就業(yè)目標,同時向招聘單位進行精準的人才推薦,進一步提高就業(yè)率,促進優(yōu)質就業(yè)。

        猜你喜歡
        項集數(shù)據(jù)挖掘專業(yè)課程
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        電大學前教育專業(yè)課程改革探討——以福建電大為例
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        中美綜合大學在音樂專業(yè)課程上的比較與啟示
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        中俄臨床醫(yī)學專業(yè)課程設置的比較與思考
        關聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        專業(yè)課程群建設的探索與實踐
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        久久超碰97人人做人人爱 | av东京热一区二区三区| 国产我不卡在线观看免费| 亲少妇摸少妇和少妇啪啪| 男女性生活视频免费网站| 国产免费一区二区三区精品视频| 一本色道久久综合狠狠躁篇| 成人毛片av免费| 久久久久99精品成人片试看| 久久亚洲国产精品成人av秋霞| 亚洲AV综合A∨一区二区| 久久婷婷是五月综合色狠狠| 午夜无码片在线观看影院y| 最新国内视频免费自拍一区| 亚洲国产日韩综合天堂| 中文字幕女优av在线| 亚洲日韩久久综合中文字幕| 麻豆亚洲av永久无码精品久久| 日韩一区二区不卡av| 国语对白三级在线观看| 国产av一区二区日夜精品剧情| 华人免费网站在线观看| 美女扒开屁股让男人桶| 国产精品熟女视频一区二区| 日日摸日日碰人妻无码老牲| 亚洲九九九| 国产一区二区三区免费在线播放| 久久一二区女厕偷拍图| 久久精品国产精油按摩| 亚洲av永久无码精品秋霞电影影院 | 一本色道精品亚洲国产一区| 亚洲午夜久久久精品影院| 久久精品噜噜噜成人| 国产人澡人澡澡澡人碰视频| 久久久久综合一本久道| 国产成人美涵人妖视频在线观看| 亚洲av综合国产av日韩| 天干天干天啪啪夜爽爽av| 一区二区三区不卡在线| 女同另类一区二区三区| 狠狠躁夜夜躁av网站中文字幕|