亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于學(xué)生消費(fèi)行為與成績(jī)的分析研究

        2018-09-05 02:05:30
        許昌學(xué)院學(xué)報(bào) 2018年8期
        關(guān)鍵詞:線性消費(fèi)預(yù)測(cè)

        (許昌學(xué)院 信息化管理中心,河南 許昌 461000)

        近年來(lái),隨著高校信息化程度的不斷提升,校園一卡通系統(tǒng)發(fā)展迅速.一卡通系統(tǒng)可以為師生提供了很大的便利,可以方便他們進(jìn)行購(gòu)物,簽到等等,這些行為都會(huì)產(chǎn)生大量的相關(guān)數(shù)據(jù).用機(jī)器學(xué)習(xí)算法在數(shù)據(jù)中發(fā)現(xiàn)隱藏的關(guān)聯(lián)性,可以對(duì)學(xué)校的管理工作提供一定的參考和幫助.在國(guó)內(nèi)已經(jīng)有很多高校開始了對(duì)相關(guān)數(shù)據(jù)的研究分析.王德才[1]等人利用SVM和Apriori關(guān)聯(lián)規(guī)則算法分析學(xué)生校園一卡通消費(fèi)行為數(shù)據(jù);羅擁軍[2]等人采用基于FP-Growth算法尋找學(xué)生的貧困程度與一卡通數(shù)據(jù)之間關(guān)聯(lián)關(guān)系的依據(jù);徐劍[3]等人利用決策樹算法對(duì)一卡通的消費(fèi)數(shù)據(jù)進(jìn)行了聚類分析,并用關(guān)聯(lián)規(guī)則算法分析了學(xué)生的消費(fèi)數(shù)據(jù)與學(xué)生成績(jī)之間的關(guān)聯(lián)關(guān)系;黎旭[4]等人使用決策樹為依據(jù)對(duì)消費(fèi)行為的因素進(jìn)行了建模和實(shí)現(xiàn).

        本文研究的是學(xué)生消費(fèi)數(shù)據(jù)與學(xué)生成績(jī)之間是否具有隱藏的關(guān)聯(lián)性.首先對(duì)學(xué)生的消費(fèi)成績(jī)進(jìn)行規(guī)范化的處理,之后采用機(jī)器學(xué)習(xí)的算法對(duì)數(shù)據(jù)進(jìn)行處理建模,根據(jù)模型和歷史數(shù)據(jù)對(duì)學(xué)生的成績(jī)進(jìn)行預(yù)測(cè),并和真實(shí)數(shù)據(jù)進(jìn)行對(duì)比.

        1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理

        一般而言,在數(shù)據(jù)中心存的數(shù)據(jù)都是沒(méi)有處理過(guò)的原始數(shù)據(jù),可能會(huì)有各種各樣的問(wèn)題,例如數(shù)據(jù)缺失,數(shù)據(jù)冗余等等造成對(duì)數(shù)據(jù)質(zhì)量的影響.而數(shù)據(jù)質(zhì)量又是會(huì)直接影響到模型訓(xùn)練結(jié)果的關(guān)鍵因素.所以需要對(duì)原始數(shù)據(jù)進(jìn)行處理.另一方面,隨著支付寶等移動(dòng)支付的興起,越來(lái)越多的學(xué)生開始使用手機(jī)進(jìn)行支付,這也導(dǎo)致了數(shù)據(jù)的缺失,這一問(wèn)題可以從其他的維度想辦法考慮解決.

        機(jī)器學(xué)習(xí)需要一個(gè)訓(xùn)練集和一個(gè)測(cè)試集,訓(xùn)練集用來(lái)訓(xùn)練模型,測(cè)試集用來(lái)測(cè)試模型預(yù)測(cè)結(jié)果.把消費(fèi)數(shù)據(jù)和成績(jī)化分為訓(xùn)練集和測(cè)試集,以此來(lái)構(gòu)建模型.首先來(lái)看原始數(shù)據(jù).消費(fèi)數(shù)據(jù)如表1所示,這一條數(shù)據(jù)包含某個(gè)卡號(hào)(ECARDNO)在某一天(OPDATE)消費(fèi)了什么(CONPTYPE),吃飯的話吃的是哪一餐(DINTYPE)和消費(fèi)數(shù)額(TOTALACCOUNT).成績(jī)數(shù)據(jù)如表2所示,每條數(shù)據(jù)包含學(xué)號(hào)(XH),科目名稱(KCMC),課程類別(KCXZ)和考試成績(jī)(QMCJ).

        由于原始數(shù)據(jù)提供的信息有限,所以這里的想法是先對(duì)消費(fèi)數(shù)據(jù)進(jìn)行處理.按照機(jī)器學(xué)習(xí)的一般思路是將數(shù)據(jù)整理成一個(gè)學(xué)生一條數(shù)據(jù),后面的字段則是某一時(shí)間段的消費(fèi)信息,按照早中午飯分開計(jì)算平均消費(fèi)和總消費(fèi),此外還要區(qū)分周末和平時(shí)的情況.這些年由于外賣的發(fā)展,所以肯定會(huì)造成有很多人出現(xiàn)沒(méi)有消費(fèi)的情況,如果貿(mào)然使用這些數(shù)據(jù)可能會(huì)對(duì)預(yù)測(cè)的結(jié)果產(chǎn)生影響,所以這里會(huì)把沒(méi)有消費(fèi)也當(dāng)做一種類型來(lái)計(jì)算,如此生成訓(xùn)練集數(shù)據(jù).如表3所示.這里篇幅有限只列出了早上時(shí)段的所有數(shù)據(jù).

        表1 消費(fèi)數(shù)據(jù)表單

        表2 成績(jī)數(shù)據(jù)表單

        表3 處理后樣本數(shù)據(jù)

        處理完數(shù)據(jù)之后,如圖1所示.首先看norm平時(shí)的數(shù)據(jù),無(wú)論是總值count還是均值mean都有很多的數(shù)值為0.這有兩種可能,一是學(xué)生沒(méi)有去吃早飯,二是叫了外賣或者之前買的其他東西.這部分由于無(wú)法做交叉對(duì)比,所以不能確定是哪一種.但是可以將數(shù)值為0也當(dāng)做一種類型,可以認(rèn)為這個(gè)學(xué)生比較懶/沒(méi)時(shí)間,使用支付寶等等.Miss表示的是沒(méi)有吃早飯的次數(shù),原因和上面一樣.Weekend周末的數(shù)據(jù)則有更多為0的數(shù)據(jù),這也是符合學(xué)生周末出去吃飯的習(xí)慣的.這部分處理后的數(shù)據(jù)當(dāng)做訓(xùn)練集數(shù)據(jù).

        圖1 部分樣本數(shù)據(jù)分布圖

        然后處理測(cè)試集數(shù)據(jù),如表2,不同的學(xué)生可能有不同的課程和課程數(shù)量,所以需要一個(gè)統(tǒng)一的度量指標(biāo)來(lái)衡量不同學(xué)生的差異.選用平均成績(jī)和掛科率這兩項(xiàng)可以比較好的對(duì)不同的學(xué)生進(jìn)行比較.圖2中標(biāo)有(origin)表示的是原始平均分和掛科率,如圖2可以看出平均分是一個(gè)長(zhǎng)尾分布,一般來(lái)說(shuō)長(zhǎng)尾分布的數(shù)據(jù)是沒(méi)有意義的異常數(shù)據(jù),結(jié)合掛科率的圖表來(lái)看,可以將這些數(shù)據(jù)去掉.圖2標(biāo)有(processed)是處理過(guò)之后的數(shù)據(jù),如圖可以看出平均分基本符合正太分布,掛科率則呈現(xiàn)了一個(gè)下降的趨勢(shì).需要注意的是這里掛科率的橫軸是科目的數(shù)量.

        圖2 成績(jī)數(shù)據(jù)分布表

        2 數(shù)據(jù)建模

        本文是要研究學(xué)生消費(fèi)數(shù)據(jù)與成績(jī)之間的潛在關(guān)聯(lián)性.所以以學(xué)生的掛科率和平均分這兩項(xiàng)作為研究對(duì)象.使用回歸和分類的算法,對(duì)數(shù)據(jù)處理建模來(lái)分析不同特征的重要性.回歸可以直接預(yù)測(cè)數(shù)值目標(biāo),而分類只能預(yù)測(cè)不同的類別,所以使用分類算法時(shí)候需要將數(shù)據(jù)處理一下,改成類別數(shù)據(jù)[5].將0~10%作為1類,10%~20%作為2類,以此類推最后90%~100%作為10類,這樣將預(yù)測(cè)問(wèn)題轉(zhuǎn)換成一個(gè)多分類的問(wèn)題.這里會(huì)出現(xiàn)精度的損失,如果需求更高的精度可以用 5個(gè)百分點(diǎn)作為一個(gè)類別來(lái)分類.

        本文主要使用線性回歸(LinearRegression)來(lái)預(yù)測(cè)和隨機(jī)森林(RandomForest)來(lái)進(jìn)行分類.下面簡(jiǎn)單介紹一下這兩種算法.

        實(shí)驗(yàn)使用python的sklearn工具進(jìn)行模型的訓(xùn)練和測(cè)試.使用前面說(shuō)過(guò)使用平均成績(jī)和掛科率來(lái)對(duì)作為預(yù)測(cè)的結(jié)果.然后將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集.

        首先使用線性回歸來(lái)訓(xùn)練模型.將樣本數(shù)據(jù)和成績(jī)數(shù)據(jù)合在一起,按照75%來(lái)劃分訓(xùn)練集,剩下的是測(cè)試集.之后調(diào)用sklearn的線性回歸模型來(lái)進(jìn)行訓(xùn)練,之后進(jìn)行預(yù)測(cè).線性回歸模型一般使用RMSE來(lái)評(píng)價(jià)預(yù)測(cè)結(jié)果的好壞.

        它的值越小表示預(yù)策的精度越高,所以一般用它來(lái)衡量線性回歸預(yù)測(cè)結(jié)果.表4是線性回歸的RMSE得分.圖3是真實(shí)值和預(yù)測(cè)值的圖,實(shí)線是預(yù)測(cè)值,虛線是真實(shí)值.

        表4 預(yù)測(cè)結(jié)果評(píng)估結(jié)果

        圖3 線性回歸預(yù)測(cè)結(jié)果圖

        然后使用隨機(jī)森林訓(xùn)練模型.由于隨機(jī)森林是一個(gè)分類的算法,所以需要把預(yù)測(cè)結(jié)果改成類別型數(shù)據(jù).上面說(shuō)過(guò)這里不再闡述.同樣將樣本數(shù)據(jù)和改成類別型數(shù)據(jù)的成績(jī)數(shù)據(jù)合在一起,按照75%來(lái)劃分訓(xùn)練集和測(cè)試集.然后使用隨機(jī)森林模型訓(xùn)練,之后進(jìn)行預(yù)測(cè).分類模型一般會(huì)使用召回率(Recall)和精準(zhǔn)率(Precision)來(lái)檢驗(yàn)預(yù)測(cè)效果的好壞[5].

        綜合來(lái)看對(duì)于掛科率的預(yù)測(cè)使用線性回歸的效果較好,RMSE有0.771 5左右,而平均分效果略差一些.如果改為類別型數(shù)據(jù),則只有平均分的效果較好,召回率和精準(zhǔn)度均在70%左右,而掛科率的效果則不好.

        3 結(jié)語(yǔ)

        本文研究了學(xué)生消費(fèi)行為和成績(jī)之間的關(guān)系,并嘗試使用了線性回歸和隨機(jī)森林算法對(duì)學(xué)生的成績(jī)進(jìn)行預(yù)測(cè).效果不錯(cuò),預(yù)測(cè)的評(píng)估結(jié)果均在可以接受的范圍之內(nèi).研究只限于消費(fèi)行為,如果有其他合適的數(shù)據(jù)例如學(xué)生出入,或者是上課簽到數(shù)據(jù)等,那么相信效果會(huì)進(jìn)一步提升.

        猜你喜歡
        線性消費(fèi)預(yù)測(cè)
        無(wú)可預(yù)測(cè)
        黃河之聲(2022年10期)2022-09-27 13:59:46
        漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
        選修2-2期中考試預(yù)測(cè)卷(A卷)
        選修2-2期中考試預(yù)測(cè)卷(B卷)
        線性回歸方程的求解與應(yīng)用
        國(guó)內(nèi)消費(fèi)
        新的一年,準(zhǔn)備消費(fèi)!
        小康(2021年1期)2021-01-13 04:56:24
        40年消費(fèi)流變
        商周刊(2018年23期)2018-11-26 01:22:20
        二階線性微分方程的解法
        不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
        色婷婷日日躁夜夜躁| 国产乱码卡二卡三卡老狼| 人人妻人人澡人人爽超污| 中文字幕人妻熟在线影院| 性一交一乱一伧国产女士spa | 日韩在线精品在线观看| 亚洲免费人成在线视频观看| 国产精品国语对白露脸在线播放| 人妻丰满多毛熟妇免费区| 婷婷一区二区三区在线| 亚洲二区精品婷婷久久精品| 日本一区二区在线高清| 国产毛片视频一区二区| 亚洲精品久久国产精品| 轻点好疼好大好爽视频| 精品水蜜桃久久久久久久| 国产成人av一区二区三区无码| 在线观看精品视频一区二区三区| 亚洲精品熟女乱色一区| 白白色青青草视频免费观看| 久久久国产熟女综合一区二区三区 | 国产白丝网站精品污在线入口 | 无码AV无码免费一区二区| 久久人妻少妇中文字幕| 91精品国产综合久久久蜜| 国产麻豆剧果冻传媒一区| 一本久久a久久精品亚洲| 欧美激情五月| 久久无码中文字幕东京热| 少妇性l交大片免费1一少| 国产精品午夜夜伦鲁鲁| 朝鲜女人大白屁股ass孕交| 午夜福利麻豆国产精品| 精品十八禁免费观看| 国产精品av免费网站| 人妻少妇69久久中文字幕| 亚洲 欧美 国产 制服 动漫| 蜜臀av免费一区二区三区| 色yeye在线观看| 国产成人美涵人妖视频在线观看| 亚洲精品无码不卡在线播he|