亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SAS的校園一卡通數(shù)據(jù)分析

        2016-12-31 00:00:00仲曉芳張義龐勝楠韓士元王棟
        科技創(chuàng)新與應(yīng)用 2016年20期

        摘 要:基于SAS軟件,文章針對校園一卡通消費數(shù)據(jù)進行了數(shù)據(jù)挖掘。文章首先對于此問題的總體目標(biāo)及設(shè)計方案進行了統(tǒng)籌規(guī)劃;對于原始數(shù)據(jù)進行了初步處理;采用k均值算法對消費數(shù)據(jù)進行聚類分析,對學(xué)生消費情況進行分類,從而掌握學(xué)生消費情況,了解學(xué)生的消費趨勢。

        關(guān)鍵詞:數(shù)據(jù)挖掘;SAS;k均值算法;校園一卡通;消費分析

        數(shù)據(jù)挖掘使用一定的算法從實際應(yīng)用數(shù)據(jù)中挖掘出未知、有價值的模式或規(guī)律等知識,整個過程由數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、模式評估、結(jié)果分析和運用知識等步驟組成[1]。隨著信息化技術(shù)發(fā)展,校園一卡通系統(tǒng)中使用過程中產(chǎn)生了大量數(shù)據(jù),但系統(tǒng)缺少相應(yīng)的分析工具,無法從海量數(shù)據(jù)中獲取有用的知識。因此,使用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行分析,可以了解學(xué)生消費情況和消費行為,了解學(xué)生之間消費的差異性,為學(xué)校制定各種獎勵政策提供依據(jù)。

        1 目標(biāo)與設(shè)計方案

        1.1 設(shè)計目標(biāo)

        文章以山東某高校2014年4月校園一卡通消費數(shù)據(jù)為基礎(chǔ),利用SAS軟件,采用聚類分析,對學(xué)生消費情況進行分析。

        文章目標(biāo)為通過對消費數(shù)據(jù)的聚類分析,學(xué)習(xí)學(xué)生的月消費金額、消費次數(shù),掌握學(xué)生消費規(guī)律,了解學(xué)生之間消費的共性和差異性,總結(jié)學(xué)生的高、中、低消費情況,為學(xué)校制定各類政策提供依據(jù)。

        1.2 k均值算法

        根據(jù)給定的n個對象或者元組的數(shù)據(jù)集,構(gòu)建k個劃分聚類的方法。每個劃分即為一個聚簇。該方法將數(shù)據(jù)劃分為k個組,每個組至少包括一個對象,每個對象必須屬于且只屬于一個組[2]。

        k均值算法[2]如下:

        (1)將所有對象隨機分配到 k個非空的簇中。

        (2)計算每個簇的平均值,并用該平均值代表相應(yīng)的值。

        (3)根據(jù)每個對象與各個簇中心的距離,分配給最近的簇。

        (4)轉(zhuǎn)到2,重新計算每個簇的平均值。

        這個過程不斷重復(fù)直到滿足某個準(zhǔn)則函數(shù)或者終止條件。終止條件可以是以下任何一個:沒有(或者最小數(shù)目)數(shù)據(jù)點被重新分配給不同的聚類;沒有(或者最小數(shù)目)聚類中心再發(fā)生變化;誤差平方和(SSE)局部最小。

        1.3 方案設(shè)計

        文章設(shè)計方案分為數(shù)據(jù)處理、數(shù)據(jù)挖掘、結(jié)果分析三部分。其中數(shù)據(jù)處理包括數(shù)據(jù)獲取、數(shù)據(jù)探索、數(shù)據(jù)填缺。

        2 數(shù)據(jù)處理

        數(shù)據(jù)獲?。?/p>

        原始數(shù)據(jù)來自于校園一卡通2014年4月份數(shù)據(jù)。定義10:30之前為早餐時間,10:30-14:30為午餐時間,14:30以后為晚餐時間,在以上時間段內(nèi)的消費行為視為1次消費,文章共獲取35196條數(shù)據(jù)。數(shù)據(jù)屬性包括:姓名、性別、學(xué)生所在院系、月消費總額、月消費次數(shù)、月消費平均額度、早餐消費總額、早餐消費次數(shù)、早餐平均消費額、午餐消費總額、午餐消費次數(shù)、午餐平均消費額、晚餐消費總額、晚餐消費次數(shù)、晚餐平均消費額,如表1所示。

        3 數(shù)據(jù)探索

        文章中用于聚類分析的消費屬性包括:月消費總額、月消費次數(shù)、月消費平均額度、早餐消費總額、早餐消費次數(shù)、早餐平均消費額、午餐消費總額、午餐消費次數(shù)、午餐平均消費額、晚餐消費總額、晚餐消費次數(shù)、晚餐平均消費額,以上屬性均屬于連續(xù)變量。數(shù)據(jù)探索包括變量壓縮、數(shù)據(jù)標(biāo)準(zhǔn)化。變量壓縮是通過主成分分析法解決變量的共線性問題,數(shù)據(jù)標(biāo)準(zhǔn)化將花費等屬性進行標(biāo)準(zhǔn)化,從而保證聚類過程的準(zhǔn)確性。

        3.1 變量壓縮

        變量壓縮是通過主成分分析法解決變量的共線性問題,變量壓縮結(jié)果如圖1所示。

        經(jīng)過分析后,系統(tǒng)最終將變量分為5類,在每組中,我們使用1-R?鄢?鄢2Ration屬性最小的值所對應(yīng)的變量,所以最終決定使用午餐消費次數(shù)、午餐平均消費額、晚餐消費總額、早餐平均消費額、午餐平均消費額變量作為聚類屬性。

        3.2 數(shù)據(jù)標(biāo)準(zhǔn)化

        數(shù)據(jù)標(biāo)準(zhǔn)化是解決變量之間不同單位、不同變異程度的問題,在文章中午餐消費次數(shù)單位為次數(shù),午餐平均消費額、晚餐消費總額、早餐平均消費額、午餐平均消費額單位為元,所以在SAS軟件中采用極差方法對午餐消費次數(shù)、午餐平均消費額、晚餐消費總額、早餐平均消費額、午餐平均消費額進行標(biāo)準(zhǔn)化。

        4 聚類

        采用SAS中兩步聚類過程,首先采用快速聚類將數(shù)據(jù)聚類成50類,然后對50類進行聚類分析。根據(jù)業(yè)務(wù)分析,最終確定取聚類個數(shù)為5類。

        5 結(jié)果分析

        聚類結(jié)果后共將分為5類,圖2為聚類后的各項數(shù)據(jù)指標(biāo),包括各個聚類的人數(shù)、均值花費、最大花費、最小花費等。從聚類中分析,人員主要集中在兩類中,可以看到以下結(jié)論:

        第一類聚類包括18650人,早餐、午餐、晚餐平均消費16、22、22次,平均消費5-6元。此聚類中人數(shù)占總?cè)藬?shù)的53%,消費情況適中,此類人員多在校內(nèi)就餐,因此食堂在日常運營中保持目前的操作情況即可,另外可以推出5-6元套餐用來提高銷售額;

        第二類聚類包括512人,早餐、午餐、晚餐平均消費19、15、11次,平均消費7-8元。由于此類人員午餐晚餐消費次數(shù)較低,但平均消費額度較高,因此可以判斷此類人員多數(shù)在校外就餐,因此食堂在日常運營中可以推出7-8元的套餐,提高食物質(zhì)量,以吸引這部分學(xué)生;

        第三類聚類包括16029人,早餐、午餐、晚餐平均消費7、10、7次,平均消費6-7元。此聚類中人員占45.5%,由于此類人員午餐晚餐消費次數(shù)較低,但平均消費額度較高,因此可以判斷此類人員多數(shù)在校外就餐,因此食堂在日常運營中可以推出6-7元的套餐,提高食物質(zhì)量,以吸引這部分學(xué)生;

        第二、三類人員多在校外就餐,但第三類人數(shù)占有率較高,因此應(yīng)針對這部分學(xué)生制定相關(guān)策略,提高校園內(nèi)就餐率。

        通過聚類發(fā)現(xiàn)學(xué)生的平均消費額度在5-7元之間,消費低于此額度的學(xué)生可視為低消費人員,學(xué)校可以針對此情況制定補助政策。

        6 結(jié)束語

        通過對學(xué)生的月消費信息進行聚類分析,我們可以了解學(xué)生的消費習(xí)慣、消費行為以及學(xué)生之間的消費差異,商戶可以針對學(xué)生的消費額度制定相應(yīng)的消費策略,為學(xué)校制定各種政策提供相應(yīng)依據(jù)。

        參考文獻(xiàn)

        [1]張佳.數(shù)據(jù)挖掘技術(shù)在校園一卡通系統(tǒng)中的應(yīng)用研究[D].蘇州大學(xué),2013.

        [2]黃雯.數(shù)據(jù)挖掘算法及其應(yīng)用研究[D].南京郵電大學(xué),2013.

        [3]歐陽烽.基于SAS的Web使用日志用戶聚類分析[J].電腦知識與技術(shù),2013.

        [4]王哲.數(shù)據(jù)挖掘技術(shù)在高校圖書館個性化服務(wù)中的應(yīng)用研究[D].重慶大學(xué),2012.

        [5]烏文波.應(yīng)用Apriori關(guān)聯(lián)規(guī)則算法的數(shù)據(jù)挖掘技術(shù)挖掘電子商務(wù)潛在客戶[D].浙江工業(yè)大學(xué),2012.

        作者簡介:仲曉芳(1984-),女,山東省濟南市,山東女子學(xué)院,助教,碩士研究生,數(shù)據(jù)挖掘研究與應(yīng)用。

        張義(1983-),女,山東省淄博市,山東理工大學(xué),在校研究生,數(shù)據(jù)管理與數(shù)據(jù)安全。

        龐勝楠(1987-),女,山東省濟南市,山東女子學(xué)院,助教,碩士研究生,電視媒體與社交媒體互動研究。

        韓士元(1985-),男,山東省濟南市,濟南大學(xué),講師,博士研究生,智能計算理論與應(yīng)用。

        王棟(1983-),男,山東省濟南市,濟南大學(xué),講師,博士研究生,智能計算理論與應(yīng)用。

        无码gogo大胆啪啪艺术| 免费国产调教视频在线观看| 亚洲春色视频在线观看| 国产精品国产三级国产剧情| 亚洲人成网网址在线看| 久久久久亚洲av无码专区体验| 999久久66久6只有精品| 一区二区在线观看视频亚洲| 亚洲精品国产电影| 国产精品_国产精品_k频道w| 狼人国产精品亚洲| 丰满少妇高潮在线观看| 美女扒开腿露内裤免费看| 亚洲欧美日韩精品久久| 久久免费看少妇高潮v片特黄| 被暴雨淋湿爆乳少妇正在播放| 在线观看国产一区二区av| 欧美激情一区二区三区| 亚洲妓女综合网99| 国产一区二区内射最近人| 蜜桃视频在线观看网址| 成人午夜性a级毛片免费| 亚洲最新版无码AV| av大片网站在线观看| 中文无码人妻有码人妻中文字幕| 亚洲五月天综合| 亚洲VR永久无码一区| 成人一区二区三区激情视频| 日本做受120秒免费视频| 亚洲国产精品无码久久电影| 成在线人免费视频播放| 在线播放av不卡国产日韩| 特黄特色的大片观看免费视频| 亚洲A∨无码国产精品久久网| 91亚洲精品久久久中文字幕| 玩弄少妇人妻中文字幕| 成人做爰高潮尖叫声免费观看| 丝袜 亚洲 另类 欧美| 亚洲中文av中文字幕艳妇| 国产精品成人久久电影| 福利视频一二区|