亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于一卡通數(shù)據(jù)的高校學(xué)生行為分析與排名預(yù)測

        2018-05-07 03:27:28甘偉
        現(xiàn)代計算機(jī) 2018年9期
        關(guān)鍵詞:可視化學(xué)生

        甘偉

        (四川大學(xué)計算機(jī)學(xué)院,成都 610065)

        0 引言

        校園一卡通的系統(tǒng)是數(shù)字化校園建設(shè)中必不可少的組成部分和基礎(chǔ)工程[1]。隨著計算機(jī)應(yīng)用技術(shù)和數(shù)據(jù)庫安全技術(shù)的發(fā)展,校園一卡通在各大、中、小學(xué)中都有廣泛的應(yīng)用。其中,大學(xué)生的校園一卡通的系統(tǒng)最為成熟,業(yè)務(wù)覆蓋范圍最廣,所涉及的業(yè)務(wù)包括就餐、消費(fèi)、門禁、交通、打印等,且呈現(xiàn)逐年增長的趨勢。一個大學(xué)在校人數(shù)一般為幾千甚至幾萬人,每天產(chǎn)生大量的一卡通數(shù)據(jù)[2]。而在這些龐大的數(shù)據(jù)記錄中就隱含著在校大學(xué)生的消費(fèi)水平、行為規(guī)律等[3]。校園一卡通所記錄的數(shù)據(jù)被越來越多的人關(guān)注,其重要的原因就是這些數(shù)據(jù)可以在一定程度上反映在校大學(xué)生的一些情況。因此,有很多研究人員對學(xué)生的消費(fèi)記錄做出分析,用來分析學(xué)生的消費(fèi)水平、為學(xué)校后勤部門提供決策依據(jù)。

        但是目前對一卡通數(shù)據(jù)的研究大部分都是通過一些統(tǒng)計的方法研究一卡通的某些類型的數(shù)據(jù),極少有研究人員結(jié)合可視化技術(shù)[4]交互手段對一卡通所記錄的信息進(jìn)行全面分析或展示的。本文中采用了可視化技術(shù)對一卡通數(shù)據(jù)進(jìn)行全面展示,以圖表的形式直觀地幫助用戶理解數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律[5],幫助用戶分析學(xué)生行為。

        1 可視化效果展示及分析

        本文對數(shù)據(jù)的展示與分析主要利用了三個視圖。整個界面如圖1所示,主要分為用螺旋視圖[6]表示的學(xué)生行為視圖,用圓圈表示的學(xué)生信息視圖和用堆疊條形圖表示的學(xué)生消費(fèi)視圖。

        圖1 總視圖

        1.1 學(xué)生行為視圖

        學(xué)生行為視圖展示的是學(xué)生在什么時間、什么地點(diǎn)發(fā)生了某些特定的行為,這些行為主要包括在食堂就餐、到超市購物、圖書館購物、教室消費(fèi)、寢室消費(fèi)、打印、乘車等。圖2(a)為螺旋視圖在“周模式”時的展示情況,用來顯示每個學(xué)期學(xué)生的一卡通數(shù)據(jù)記錄,每一圈表示的是一周的一卡通數(shù)據(jù)記錄,通過用戶交互可以選擇感興趣的記錄類型或模式。圖2(b)為“天模式”下的展示情況,用來顯示某連續(xù)9天的一卡通數(shù)據(jù)記錄,每一圈表示的是一天的一卡通數(shù)據(jù)記錄,和在“周模式”下有同樣的交互。兩種模式的不同之處在于“天模式”可以對所要展示的時期通過滑動條來選擇,每次展示的只是某個學(xué)期的部分?jǐn)?shù)據(jù),而且在數(shù)據(jù)映射上用圈的大小代表消費(fèi)金額的多少。

        圖2 不同模式下的學(xué)生行為

        1.2 學(xué)生消費(fèi)視圖

        如圖3(a)所示,展示的是用堆疊條形圖表示的學(xué)生消費(fèi)視圖,用來展示每個學(xué)期的消費(fèi)總金額以及各類消費(fèi)金額(顏色與螺旋視圖的映射方案一致)??梢钥吹矫總€學(xué)期的消費(fèi)以食堂消費(fèi)為主,其次是超市。二三學(xué)期的學(xué)費(fèi)總金額和各項消費(fèi)金額變化不大,都和第一學(xué)期的消費(fèi)有較大的差異。圖3(b)是用一個圓圈來展示一個學(xué)生信息,用來展示學(xué)生及成績相關(guān)信息,顏色不做任何映射。每個圓圈的大小表示該學(xué)生跟上學(xué)期相比成績變化的大小。當(dāng)鼠標(biāo)懸浮在某個圓圈上時,所有圓圈的顏色會發(fā)生變化,紅色的表示學(xué)生上學(xué)期排名上升,藍(lán)色表示該學(xué)生上學(xué)期排名下降。

        圖3 不同模式下的學(xué)生行為

        2 基于多元線性回歸算法的學(xué)生成績排名預(yù)測

        2.1 特征提取

        本文先以可視化的方式來展示一卡通數(shù)據(jù),通過交互操作發(fā)現(xiàn)學(xué)生去圖書館的次數(shù)、有無早起吃早飯的習(xí)慣、進(jìn)圖書館的次數(shù)以及借書的數(shù)量對學(xué)生成績有較大的影響。因此,本文選取了以上的幾個特征來對學(xué)生的相對排名做出預(yù)測。

        在第一次實(shí)驗(yàn)中,利用第一學(xué)期的相對排名和第二學(xué)期該學(xué)生去圖書館的次數(shù)、吃早飯的次數(shù)(十點(diǎn)之前有食堂刷卡記錄視為早飯記錄)、借書的數(shù)量這些變量為特征訓(xùn)練出一組參數(shù)。在利用這組參數(shù)和第二學(xué)期的排名、第三學(xué)期的同樣的特征預(yù)測第三學(xué)期的相對排名時,發(fā)現(xiàn)效果并不是很好。分析其原因,在利用可視化試圖分析學(xué)生行為時,是依據(jù)學(xué)生兩個學(xué)期行為的變化來預(yù)測學(xué)生成績的升降的。每個學(xué)生的學(xué)習(xí)行為本身就具有很大的差異性,所以根據(jù)學(xué)生單個學(xué)期的表現(xiàn)就判斷該學(xué)生成績的變化是沒有意義的,而依據(jù)學(xué)生在學(xué)習(xí)行為上的變化(在本文中主要是指和上學(xué)期相比產(chǎn)生的差異)來判斷學(xué)生成績的變化才是有意義的。根據(jù)以上分析,又重新選擇了特征,重新選擇的特征為上學(xué)期的相對排名、和上學(xué)期相比進(jìn)圖書館增加的次數(shù)、吃早飯增加的次數(shù)、借書增加的數(shù)量(表 1)。

        表1 特征表

        2.2 成績排名預(yù)測結(jié)果

        線性回歸是運(yùn)用統(tǒng)計學(xué)的方法,來分析自變量和因變量之間的依賴關(guān)系,并依據(jù)這種關(guān)系進(jìn)行建模的回歸分析。這種模型是目前應(yīng)用的非常廣泛的預(yù)測模型。在線性回歸模型中,自變量和因變量是一種線性關(guān)系。依據(jù)人們的經(jīng)驗(yàn),上學(xué)期的成績、本學(xué)期的行為表現(xiàn)和本學(xué)期的學(xué)習(xí)成績之間是一種線性關(guān)系。例如,去圖書館的次數(shù)少了,可能成績就有所下降,去圖書館的次數(shù)變得越少,成績可能就退步得越多。本文選取了四個特征及存在四個自變量,來預(yù)測學(xué)生相對排名。因?yàn)椋嬖趦蓚€以上的自變量,所以使用的回歸模型叫多元線性回歸模型。

        將提取的特征導(dǎo)入到IBM SPSS Statistics 20中,選擇線性回歸模型,選取因變量與相應(yīng)的自變量,得出了如表2的結(jié)果:

        表2 線性回歸參數(shù)表a

        a.因變量:rank2

        在非標(biāo)準(zhǔn)化系數(shù)下,就計算得到了需要的一組參數(shù)。即表明了預(yù)測模型對應(yīng)的公式為:

        從這組系數(shù)可以看出,上學(xué)期的成績排名(rank1)對這個學(xué)期(rank2)的影響最大,這個也符合人類的經(jīng)驗(yàn)。而進(jìn)圖書館的次數(shù)、借閱書籍的次數(shù)與吃早餐的次數(shù)這些對成績提高有幫助的因素都會導(dǎo)致相對排名的減小,即相對排名變小。標(biāo)準(zhǔn)化系數(shù)可以用來反映變量間相對重要性,但是不能反映在真實(shí)情況下對結(jié)果的具體影響,因此只是用來分析變量的重要性。

        t值是t檢驗(yàn)的結(jié)果,它的絕對值越大表明了該變量對結(jié)果的影響越顯著。例如,在上圖中可以看出上一學(xué)期的成績對應(yīng)的t值最大是33.297,那么該變量對結(jié)果的影響是最顯著的。sig也是用來反映變量對結(jié)果影響的顯著程度的,但是它的數(shù)值的含義是假設(shè)某個變量對結(jié)果是沒有影響的概率。因此,sig的越小表示該變量對結(jié)果的影響越大。我們默認(rèn)當(dāng)sig小于0.05時,它對結(jié)果的影響是顯著的,從上圖中我們可以看出只有早餐的次數(shù)是遠(yuǎn)大于0.05的,其他變量對結(jié)果的影響都是比較大的。因此,可以認(rèn)為得到公式是有效的。

        用以上工作所得到的預(yù)測公式對數(shù)據(jù)中第三學(xué)期的學(xué)生相對排名做出預(yù)測。預(yù)測出來的結(jié)果如表3所示:

        可以看到預(yù)測的結(jié)果不是整數(shù),且范圍不在1~538之間,即這些數(shù)字只是反映學(xué)生相對排名的一些指標(biāo),并不能代表學(xué)生的相對排名。所以,又依據(jù)這個數(shù)據(jù)從低到高對學(xué)生進(jìn)行排列,則排列之后的順序就代表了學(xué)生的名次,名次從1依次增大到538,這樣就得到了最后的結(jié)果。

        在預(yù)測出學(xué)生的相對排名之后,要對預(yù)測結(jié)果進(jìn)行評定。在本文中是通過衡量預(yù)測排名和實(shí)際排名的Spearman相關(guān)性,結(jié)果為[0,1]之間的數(shù)據(jù),數(shù)值越大表示相關(guān)性越大,即排名預(yù)測的越準(zhǔn)確。假如有n個學(xué)生的排名,學(xué)生i的實(shí)際排名為ri而該學(xué)生的預(yù)測排名為 pi,那么Spearman的計算方式如下:

        利用這個評價指標(biāo)對處理后的排名預(yù)測進(jìn)行評價,算出結(jié)果為0.901。這表明本文中提取的特征和找到的線性回歸模型對學(xué)生排名預(yù)測是有很好效果的,實(shí)際排名和預(yù)測排名差別不是很大。

        3 結(jié)語

        本文針對學(xué)生的一卡通數(shù)據(jù),對學(xué)生的行為進(jìn)行分析。利用可視化圖形與交互技術(shù)發(fā)現(xiàn)影響成績排名的可能因素。再使用SPSS軟件,利用多元線性回歸模型,結(jié)合可視化交互提取的影響成績變化的變量,對學(xué)生成績進(jìn)行預(yù)測。實(shí)驗(yàn)結(jié)果表明,可視化交互提取出的特征對成績排名的預(yù)測有很重要的作用。

        表3 初步預(yù)測結(jié)果

        參考文獻(xiàn):

        [1]張治斌,王艷萍.數(shù)據(jù)挖掘技術(shù)在數(shù)字化校園中的應(yīng)用[J].現(xiàn)代計算機(jī),2006(12):93-95.

        [2]陳建兵.利用校園一卡通數(shù)據(jù)優(yōu)化高校貧困生認(rèn)定系統(tǒng)[D].電子科技大學(xué),2012.

        [3]李珊娜.基于校園一卡通平臺的數(shù)據(jù)挖掘應(yīng)用研究[J].鐵路計算機(jī)應(yīng)用,2010,19(6):55-58.

        [4]陳為,張嵩,魯愛東.數(shù)據(jù)可視化的基本原理與方法[M].科學(xué)出版社,2013.

        [5]Chen M,Jaenicke H.An Information-Theoretic Framework for Visualization[J].IEEE Transactions on Visualization&Computer Graphics,2010,16(6):1206.

        [6]Weber M,Alexa M,Müller W.Visualizing Time-Series on Spirals.[C]Information Visualization,2001.INFOVIS 2001.IEEE Symposium on.IEEE,2001:7-13.

        猜你喜歡
        可視化學(xué)生
        自然資源可視化決策系統(tǒng)
        北京測繪(2022年6期)2022-08-01 09:19:06
        思維可視化
        師道·教研(2022年1期)2022-03-12 05:46:47
        基于Power BI的油田注水運(yùn)行動態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        自然資源可視化決策系統(tǒng)
        北京測繪(2021年7期)2021-07-28 07:01:18
        快把我哥帶走
        基于CGAL和OpenGL的海底地形三維可視化
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        《李學(xué)生》定檔8月28日
        電影(2018年9期)2018-11-14 06:57:21
        趕不走的學(xué)生
        學(xué)生寫話
        亚洲捆绑女优一区二区三区| 久久久久人妻一区精品| 国产精品欧美一区二区三区不卡| 欧美性猛交xxxx黑人| 日韩精品电影在线观看| 国产精品自拍首页在线观看| 中文字幕精品乱码一区| 日本午夜艺术一区二区| 欧美xxxxx在线观看| 亚洲乱码日产精品一二三| 亚洲色欲色欲综合网站| 亚洲首页一区任你躁xxxxx| 91热视频在线观看| 少妇人妻字幕一区二区| 国产av剧情一区二区三区| 国产女厕偷窥系列在线视频| 亚洲国产精品线路久久| 国产成人福利在线视频不卡| 日韩一级137片内射视频播放| 久久人人爽人人爽人人片av高请 | 成人免费xxxxx在线观看| 亚洲精品黑牛一区二区三区| 欧美亚洲日韩国产区| 美女爽好多水快进来视频| 福利视频在线一区二区三区| 国产一区二区三区在线视频观看| 天天噜日日噜狠狠噜免费| 亚洲福利视频一区| 国产中文久久精品| 国产成人久久精品二区三区| 国产精品国产三级国产a| 国产人与zoxxxx另类| 久久精品亚洲中文字幕无码网站 | 少妇高潮在线精品观看| 欧美精品人人做人人爱视频| 国产96在线 | 亚洲| 谁有在线观看av中文| 天天射综合网天天插天天干| 99久热在线精品视频观看| 中国丰满熟妇xxxx| 亚洲国产剧情在线精品视|