亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        相關(guān)分析法在大學(xué)生上網(wǎng)行為分析中的應(yīng)用

        2016-02-13 07:50:09弋改珍楊佳梅段妮歌徐勇
        現(xiàn)代計(jì)算機(jī) 2016年36期
        關(guān)鍵詞:咸陽(yáng)網(wǎng)址社交

        弋改珍,楊佳梅,段妮歌,徐勇

        (咸陽(yáng)師范學(xué)院計(jì)算機(jī)學(xué)院,咸陽(yáng) 712000)

        相關(guān)分析法在大學(xué)生上網(wǎng)行為分析中的應(yīng)用

        弋改珍,楊佳梅,段妮歌,徐勇

        (咸陽(yáng)師范學(xué)院計(jì)算機(jī)學(xué)院,咸陽(yáng) 712000)

        大數(shù)據(jù)的意義是由人類日益普及的網(wǎng)絡(luò)行為所伴生的,蘊(yùn)含數(shù)據(jù)生產(chǎn)者真實(shí)意圖、喜好的,非傳統(tǒng)結(jié)構(gòu)和意義的數(shù)據(jù)。以咸陽(yáng)師范學(xué)院大學(xué)生上網(wǎng)行為數(shù)據(jù)為數(shù)據(jù)源,研究數(shù)據(jù)分析技術(shù)中相關(guān)分析方法的原理和數(shù)據(jù)建模方法,借助SAS軟件中的數(shù)據(jù)庫(kù)和分析模塊,對(duì)數(shù)據(jù)源進(jìn)行采集、整理、清洗,并建立評(píng)價(jià)建立指標(biāo),對(duì)預(yù)處理后的數(shù)據(jù)從用戶量和網(wǎng)址類別兩個(gè)方面進(jìn)行分析。最終針對(duì)大學(xué)生上網(wǎng)情況提出合理的規(guī)劃與建議。

        大數(shù)據(jù);相關(guān)分析;大學(xué)生上網(wǎng)行為數(shù)據(jù)

        0 引言

        隨著互聯(lián)網(wǎng)和信息技術(shù)的快速發(fā)展,物聯(lián)網(wǎng)、移動(dòng)互聯(lián)、各種社交網(wǎng)絡(luò)從各個(gè)方面擴(kuò)展了互聯(lián)網(wǎng)的應(yīng)用領(lǐng)域。網(wǎng)絡(luò)對(duì)在校大學(xué)生的生活產(chǎn)生了深遠(yuǎn)的影響,學(xué)生的行為方式、思維方式、價(jià)值觀念發(fā)生了巨大變化。如何及時(shí)了解學(xué)生的行為和思想動(dòng)態(tài),把握學(xué)生管理的時(shí)機(jī),對(duì)教育管理部門提出了嚴(yán)峻的問(wèn)題和考驗(yàn)。

        本文利用統(tǒng)計(jì)學(xué)中的相關(guān)分析[1]方法,通過(guò)研究相關(guān)分析方法的原理和數(shù)據(jù)建模方法,以咸陽(yáng)師范學(xué)院大學(xué)生上網(wǎng)行為數(shù)據(jù)為數(shù)據(jù)源,借助SAS[2]軟件中的數(shù)據(jù)庫(kù)和分析模塊,對(duì)數(shù)據(jù)源進(jìn)行采集、整理、清洗并逐步分析。并針對(duì)大學(xué)生上網(wǎng)情況提出合理的規(guī)劃與建議,使處于信息時(shí)代的大學(xué)生們能夠正確、合理地運(yùn)用網(wǎng)絡(luò)資源,充分把握每一個(gè)信息的重要性。

        1 相關(guān)分析分析方法原理

        相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。相關(guān)關(guān)系是一種非確定性的關(guān)系[3]。

        線性相關(guān)分析指的是研究?jī)蓚€(gè)變量間線性關(guān)系的程度,用相關(guān)系數(shù)r來(lái)描述。設(shè)兩個(gè)變量為x,y,根據(jù)樣本數(shù)據(jù)計(jì)算,利用積差法來(lái)計(jì)算相關(guān)系數(shù),計(jì)算公式:

        其中,分子是兩變量的協(xié)方差,分母是兩變量的標(biāo)準(zhǔn)差,即:

        以上公式簡(jiǎn)化得:

        將公式展開,即:從以上公式可以看出,r的符號(hào)只決定于分子Lxy的值的符號(hào),即r的符號(hào)與Lxy的符號(hào)保持一致。相關(guān)系數(shù)r的符號(hào)反映相關(guān)關(guān)系的方向,其絕對(duì)值的大小則反映變量相關(guān)關(guān)系的密切程度。|r|的取值范圍為0到1之間。r=1表示變量完全正線性相關(guān);r>0表示變量正線性相關(guān);r=0表示變量不存在線性相關(guān);r<0表示變量負(fù)線性相關(guān)。本文運(yùn)用的是正線性相關(guān)[3]進(jìn)行分析,正相關(guān)系數(shù)判別:

        |r|>0.95表示變量之間存在顯著性相關(guān);

        |r|≥0.8表示變量之間高度相關(guān);

        0.5≤|r|<0.8表示變量之間中度相關(guān);

        0.3≤|r|<0.5表示變量之間低度相關(guān);

        |r|<0.3表示變量之間關(guān)系極弱,認(rèn)為不相關(guān)。

        2 數(shù)據(jù)預(yù)處理

        數(shù)據(jù)來(lái)源于咸陽(yáng)師范學(xué)院的學(xué)生上網(wǎng)數(shù)據(jù)。原始數(shù)據(jù)是學(xué)生上網(wǎng)的日志文件,不符合SAS進(jìn)行處理的數(shù)據(jù)格式。在進(jìn)行數(shù)據(jù)分析之前,要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理和標(biāo)準(zhǔn)化,然后倒入SAS,利用SAS中的相關(guān)分析過(guò)程進(jìn)行分析。

        我們選取2016年4月11號(hào)-4月16號(hào)這一個(gè)星期的上網(wǎng)數(shù)據(jù)。數(shù)據(jù)的觀測(cè)是按時(shí)間進(jìn)行排序的,其指標(biāo)有日期、學(xué)號(hào)、網(wǎng)址等。

        2.1 原始數(shù)據(jù)的處理

        數(shù)據(jù)的合并及導(dǎo)入:原始數(shù)據(jù)是每小時(shí)的數(shù)據(jù),要利用(copy*.log合并文件.txt)進(jìn)行每小時(shí)數(shù)據(jù)的合并,合并成為一天的數(shù)據(jù)。接下來(lái)在SAS中利用IMPORT過(guò)程將一天的數(shù)據(jù)導(dǎo)入。

        數(shù)據(jù)的整理:首先選取學(xué)生學(xué)號(hào)做指標(biāo),利用SQL過(guò)程查找有效學(xué)號(hào)信息過(guò)濾掉無(wú)效學(xué)號(hào)及缺省值,并留存篩選后的數(shù)據(jù)。然后以網(wǎng)址為指標(biāo)進(jìn)行篩選過(guò)濾掉無(wú)效網(wǎng)址及私有不可訪問(wèn)網(wǎng)址。并基于保護(hù)用戶私密信息,經(jīng)過(guò)數(shù)據(jù)清洗處理,保留下的數(shù)據(jù)集具有學(xué)號(hào)與網(wǎng)址兩個(gè)屬性值。

        數(shù)據(jù)二次清洗:對(duì)于學(xué)號(hào)與網(wǎng)址數(shù)據(jù)中不完整的數(shù)據(jù),錯(cuò)誤的數(shù)據(jù),重復(fù)的數(shù)據(jù)進(jìn)行清洗。

        2.2 基于學(xué)號(hào)網(wǎng)址的網(wǎng)址類別處理

        通過(guò)從360網(wǎng)址大全,百度網(wǎng)址大全,2345網(wǎng)址導(dǎo)航等網(wǎng)站的源碼中提取網(wǎng)址關(guān)鍵字,并對(duì)網(wǎng)址關(guān)鍵字進(jìn)行分類。

        通過(guò)模糊匹配法對(duì)網(wǎng)址進(jìn)行關(guān)鍵字的匹配,從工具、購(gòu)物、軍事、科技、旅游、其他、社交、體育、新聞、學(xué)習(xí)、音樂(lè)、影像、游戲等13個(gè)方面對(duì)網(wǎng)址進(jìn)行分類。

        (1)排序:按照類別排序,保證所有數(shù)據(jù)集的變量順序一致,以便分析。

        (2)計(jì)算頻數(shù):對(duì)每個(gè)類別求訪問(wèn)量及所占百分比。

        (3)轉(zhuǎn)置,追加:對(duì)所得表實(shí)現(xiàn)轉(zhuǎn)置并清洗其中無(wú)效信息以便追加數(shù)據(jù)集。對(duì)轉(zhuǎn)置后的表進(jìn)行豎向追加。

        (4)整理分析所用數(shù)據(jù):對(duì)一天的表求和并將七天的合并在一張表中。

        2.3 指標(biāo)的建立

        選取每一類網(wǎng)址(n)的每天作為樣本指標(biāo)(p),分別用符號(hào)X0,X1,X2,X3,X4,X5,X6,X7來(lái)表示。其表示矩陣為Mij(i=1,2,…,n;j=1,2,…,p)。通過(guò)相關(guān)分析的CORR過(guò)程分別統(tǒng)計(jì)一周內(nèi)各類網(wǎng)址的出現(xiàn)頻率,以及利用Pearson相關(guān)系數(shù)各類網(wǎng)址之間的關(guān)聯(lián)程度。

        3 相關(guān)分析結(jié)果

        把一個(gè)周的網(wǎng)址按小時(shí)劃分,把原始數(shù)據(jù)整理、清洗、處理后,把網(wǎng)址數(shù)據(jù)分為工具,購(gòu)物、軍事、旅游、社交、體育、新聞、學(xué)習(xí)、音樂(lè)、影像、游戲,其他13類,如圖1所示。由相關(guān)分析的corr過(guò)程,可以得出以下信息:N表示一共168個(gè)小時(shí),也就是一周的網(wǎng)址信息量,從均值來(lái)看訪問(wèn)社交、購(gòu)物、學(xué)習(xí)、影像、游戲等網(wǎng)址的比例較大,其中訪問(wèn)影像類網(wǎng)址的頻率最高。從標(biāo)準(zhǔn)差也可以看出學(xué)習(xí)與影像偏離均值較大,說(shuō)明這類網(wǎng)址數(shù)據(jù)波動(dòng)較大,反映出上學(xué)習(xí)與影像的網(wǎng)站具有時(shí)段性??v觀全表,同學(xué)們比較熱衷于上網(wǎng)購(gòu)物、社交、學(xué)習(xí)、看電影以及玩游戲,對(duì)于軍事、科技、新聞、體育、關(guān)注較少。通過(guò)Pearson相關(guān)系數(shù),可以分析各類網(wǎng)址的相關(guān)程度,在工具行中可以發(fā)現(xiàn)工具類與科技類,體育類之間關(guān)系極弱,認(rèn)為不相關(guān);工具類與學(xué)習(xí)類中度相關(guān),與其他各類呈高度相關(guān)和顯著性相關(guān)。

        圖2是對(duì)星期一這天的網(wǎng)址數(shù)據(jù)進(jìn)行相關(guān)分析:從均值水平可以得出這天訪問(wèn)影像類網(wǎng)站的最多,依次是影像、學(xué)習(xí)、社交、其他、工具等;標(biāo)準(zhǔn)差反應(yīng)數(shù)據(jù)的波動(dòng)性,可見工具,購(gòu)物、社交、學(xué)習(xí),影像,游戲類網(wǎng)站的波動(dòng)較大,具有時(shí)段性,也較符合日程時(shí)刻表。從總和來(lái)看訪問(wèn)工具、購(gòu)物、社交、學(xué)習(xí)、影像、游戲類網(wǎng)址遠(yuǎn)高于其他各類。工具、影像類網(wǎng)址的最大最小值顯著于其他各類,相比于科技,新聞和體育,同學(xué)們較少關(guān)注,也間接反映大學(xué)生們普遍的生活行為方式,忽視了健康與時(shí)事。

        圖1 學(xué)生訪問(wèn)的網(wǎng)址類別統(tǒng)計(jì)

        圖2 網(wǎng)址數(shù)據(jù)的相關(guān)分析結(jié)果

        圖3是星期一的晚高峰22時(shí)的數(shù)據(jù)。影像、學(xué)習(xí)、社交、購(gòu)物超過(guò)總網(wǎng)址的50%,影像類網(wǎng)址數(shù)量最多,科技類網(wǎng)址僅占1/1000,體育類網(wǎng)址占0.2%,軍事、旅游,新聞,體育類網(wǎng)址總和不及十分之一,側(cè)面反映出叫大多數(shù)同學(xué)的大學(xué)生活較單一,并且不熱愛(ài)體育運(yùn)動(dòng)。

        圖3 學(xué)生上網(wǎng)類別百分比

        4 結(jié)語(yǔ)

        正如引言所述事物之間有著兩種關(guān)系,函數(shù)關(guān)系和相關(guān)關(guān)系。函數(shù)關(guān)系能給我們確定性結(jié)果,相關(guān)分析則是反映事物之間關(guān)聯(lián)程度。使用相關(guān)分析方法分析大學(xué)生生上網(wǎng)數(shù)據(jù),我們得到了許多客觀有效的結(jié)論,許多大學(xué)生的上網(wǎng)方式不科學(xué),較少一部分同學(xué)沉溺于網(wǎng)絡(luò)游戲,在此我們提出建議,希望大學(xué)生能合理安排上網(wǎng)時(shí)間,正確對(duì)待網(wǎng)絡(luò)娛樂(lè)資源勞逸結(jié)合,寓教于樂(lè)是我們所提倡的健康的學(xué)習(xí)方式,適度娛樂(lè)能緩解學(xué)習(xí),生活中的壓力也為后續(xù)的學(xué)習(xí)和工作提供能量。過(guò)度沉溺于如網(wǎng)絡(luò)娛樂(lè),在線聊天等不僅浪費(fèi)時(shí)間而且影響學(xué)習(xí)。我們必須合理的安排上網(wǎng)時(shí)間,做到有效的使用網(wǎng)絡(luò)資源并使其真正的為學(xué)習(xí),生活帶來(lái)便利。

        [1]何曉群.現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2003.

        [2]胡小平,王長(zhǎng)發(fā).SAS基礎(chǔ)統(tǒng)計(jì)實(shí)例教程[M].西安:西安地圖出版社,2001.

        [3]謝龍漢,尚濤.SAS統(tǒng)計(jì)分析方法與數(shù)據(jù)挖掘[M].北京:電子工業(yè)出版社,2012.

        Application of the Correlation Analysis Method in Students'Online Behavior Data

        YI Gai-zhen,YANG Jia-mei,DUAN Ni-ge,XU Yong
        (School of Computer,Xianyang Normal University,Xianyang 712000)

        The significance of the big data is accompanied by the increasing popularity of the network behavior,and it contains the data producer's true intentions,preferences,non-traditional structure and significance of the data.Uses the students'online behavior data for data source in Xianyang Normal University,studies the principle of correlation analysis method of data analysis techniques and data modeling method, uses database and analysis module in SAS software,collects the data source,and sorted,cleans and sets up the index,and pre-processed data from users and the Web site.Analyzes the pre-processed data from the two accepts:the numbers and the kinds of Web site.Finally, puts forward the reasonable planning and suggestions for college students to surf the Internet.

        Big Data;Correlation Analysis;University Students'Online Behavior Data

        咸陽(yáng)師范學(xué)院(國(guó)家級(jí)/省級(jí)/校級(jí))大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃資助項(xiàng)目(No.201610722028)

        1007-1423(2016)36-0019-04

        10.3969/j.issn.1007-1423.2016.36.005

        弋改珍(1969-),女,陜西咸陽(yáng)人,碩士研究生,副教授,研究方向?yàn)闊o(wú)線網(wǎng)絡(luò)和網(wǎng)絡(luò)安全、大數(shù)據(jù)分析

        2016-11-08

        2016-12-10

        猜你喜歡
        咸陽(yáng)網(wǎng)址社交
        2023年6月全宅影音器材編輯推薦
        社交之城
        社交牛人癥該怎么治
        意林彩版(2022年2期)2022-05-03 10:25:08
        本刊網(wǎng)址變更通知
        咸陽(yáng)
        社交距離
        咸陽(yáng)醫(yī)院
        你回避社交,真不是因?yàn)閮?nèi)向
        文苑(2018年17期)2018-11-09 01:29:28
        沐猴而冠
        本刊網(wǎng)址變更通知
        一二三四在线观看韩国视频 | 精品视频999| 亚洲国产精品500在线观看| 国产高清在线91福利| 91色婷婷成人精品亚洲| 国产精品国产三级在线专区| 日本成人精品一区二区三区| 国产免费观看久久黄av麻豆| 一区二区三区视频免费观看在线| 女主播啪啪大秀免费观看| 男男亚洲av无一区二区三区久久| 人人超碰人人爱超碰国产| 色狠狠色噜噜av天堂一区| 免费无码一区二区三区蜜桃大| 国产va免费精品观看| 美女裸体无遮挡免费视频的网站| 久久久www成人免费无遮挡大片| 一区二区三区精品偷拍av| 国产视频一区2区三区| 国产一品二品三品精品在线| 亚洲性久久久影院| 亚洲日韩精品无码专区网站| 久久人妻AV无码一区二区| av熟女一区二区久久| 字幕网中文字幕精品一区| av在线观看免费天堂| 欧美四房播播| 国产精品视频二区不卡| 国产精品欧美久久久久老妞| 一区二区特别黄色大片| 在线观看亚洲av每日更新影片| 成人免费a级毛片无码片2022| 国模丽丽啪啪一区二区| 青青青国产精品一区二区| 综合无码一区二区三区四区五区| 久久亚洲av午夜福利精品西区| 久久夜色精品国产亚洲av动态图 | 一二三四在线观看免费视频| 最近日韩激情中文字幕| 精品一区二区三区在线视频观看| 久久国产精品美女厕所尿尿av|