李珊珊,焦寶臣,曲 申,張 瑋,楊 陽,張四海
(南開大學 信息化建設與管理辦公室,天津300071)
校園一卡通系統(tǒng)是智慧校園的重要組成部分[1-5],是學校信息化建設的重要基礎。目前,人們更多地集中在如何建設和運營一卡通系統(tǒng),而對于系統(tǒng)中沉淀的大量消費、行為數據,通常缺乏有效的分析、整理和利用。隨著一卡通應用的不斷擴展,校園一卡通已由最初的小額消費卡,變?yōu)閷W生證、借閱證、門禁卡、考勤卡、公交卡,甚至能夠應用于學籍注冊、自助文印、學費繳納、體育場館預定、體能測試等場景[6-8]??梢哉f,一卡通已成為數字化校園生活最重要的載體和最直觀的體現(xiàn)。
隨著時間的推移,一卡通系統(tǒng)里累積了大量消費和行為數據。對一卡通數據進行深度分析,特別是基于大數據理論,從大量復雜、無序的原始數據中提取有價值的信息,找出數據之間的關聯(lián),具有非常重要的意義[9-12]。
本文首先對南開大學一卡通系統(tǒng)進行了簡介,然后,以食堂交易流水數據為研究對象,采用抽樣的方法對師生的消費模式和行為規(guī)律進行研究。在對539376條交易流水數據分析后發(fā)現(xiàn),本科生的食堂就餐比例最高,在一層快餐和二層美食廣場的就餐比例分別高達68.57%和77.88%;教工的就餐比例最低,分別為5.33%和4.55%;師生在工作日和節(jié)假日的就餐習慣有較大差異,節(jié)假日食堂就餐人數顯著減少,時間更為分散,用餐高峰更為平緩;對于快餐和美食廣場這兩種不同業(yè)態(tài)的商戶,師生就餐規(guī)律有較大差異,分別對其進行詳細分析;最后探討了新校區(qū)搬遷對本部食堂的影響。研究發(fā)現(xiàn),搬遷前,食堂工作日午餐高峰時段人數偏多,F(xiàn)1、F2時段(11:00-12:00)的平均刷卡次數高達3706次,易發(fā)生擁擠現(xiàn)象;搬遷后,F(xiàn)1、F2時段平均刷卡次數減少為2373次。新校區(qū)搬遷有效緩解了食堂就餐擁擠的狀況。搬遷后,雖然師生總人數減少了一半,但高峰時段就餐人數只減少了約1/3,這表明改善食堂就餐環(huán)境會吸引更多師生在食堂就餐。對一卡通數據進行深入研究,有助于學校實時掌握師生的行為規(guī)律、給出有效的趨勢預測、優(yōu)化資源配置,對學校相關管理部門進行科學決策具有重要意義。
南開大學一卡通系統(tǒng)始建于2007年,系統(tǒng)經歷了多年的發(fā)展和不斷完善。圖1給出了南開大學一卡通系統(tǒng)的網絡拓撲圖。它是一個運行在一卡通專用網絡上、基于C/S架構的多應用集成系統(tǒng)。按照系統(tǒng)功能,可以劃分為數據層、平臺層、網絡層和應用層。數據層是一卡通系統(tǒng)的數據存儲中心。對內,它為一卡通系統(tǒng)提供基礎數據支持;對外它負責與全校統(tǒng)一數據中心進行交互和同步,并為教務、人事、學工等系統(tǒng)提供預留接口,從而實現(xiàn)未來與各個系統(tǒng)數據庫的對接。平臺層是一卡通系統(tǒng)的運營管理中心,它包括電子支付和身份認證兩大平臺。一卡通專網為系統(tǒng)數據的傳輸和交互提供專用通道。
圖1 南開大學一卡通系統(tǒng)網絡拓撲圖
應用層是一卡通系統(tǒng)中最復雜、最貼近用戶的一層,它為用戶提供各種應用服務。具體包括充值系統(tǒng)、消費支付系統(tǒng)、身份認證系統(tǒng)以及其他第三方應用系統(tǒng)。南開大學一卡通充值系統(tǒng)能夠為師生提供現(xiàn)金充值、銀行圈存轉賬、網絡、手機APP四種充值方式,方便廣大師生的使用。消費支付系統(tǒng)支持在食堂、超市、浴室等場所的刷卡消費,同時還支持圖書逾期的自動扣款,網費繳納以及自助文印扣款等應用。身份認證系統(tǒng)包括所有需要身份識別的場景,包括宿舍/學院的門禁系統(tǒng)、圖書館的通道機系統(tǒng)、考試、車輛管理等場景。其他應用系統(tǒng)指的是在物理上使用一卡通卡片進行操作,而實際產生的數據不回傳至一卡通數據庫的系統(tǒng)。這種系統(tǒng)通過弱耦合或不耦合的方式與一卡通系統(tǒng)連接,間接應用一卡通的卡片信息。這類應用包括學生成績單、在籍證明的自助打印、體能測試、體育館場地預定、自助洗衣等等。隨著10年來的建設和不斷完善,南開大學一卡通系統(tǒng)已經形成了以專用網絡為基礎,以一卡通平臺系統(tǒng)為核心,具有相當安全性、健壯性和擴展性的應用系統(tǒng)。
南開大學全校共有師生34771人,其中學生29830人,教職員工4941人。每天產生的消費交易流水數據在5萬條左右,一年的數據量有幾千萬條,數據文件在10Gb以上。我們采用抽樣的方法對一卡通食堂消費產生的交易流水數據進行詳細分析。南開大學本部共有三個學生食堂,其中第二學生食堂是規(guī)模最大、業(yè)態(tài)最全、產生交易流水數量最多的食堂。因此我們選取該食堂的數據進行分析。共提取了539,376條交易流水數據,其中包括2015年4月的317,662條和2016年4月的221,714條。
數據處理采用Matlab2015b和Origin9.0。首先對一卡通系統(tǒng)導出的數據文件進行預處理,將數據轉化為符合要求的CSV文件,采用Matlab編程進行數據清洗。包括格式化數據,檢查數據一致性,清除無用數據,去掉學生姓名、電話、身份證號等敏感信息等操作。方便對數據做進一步的統(tǒng)計分析。
為研究學生的消費習慣和規(guī)律,我們首先對時間進行離散化處理,每半小時為一個時段,一天24個小時共分為48個時段。因為食堂的營業(yè)時間是從早6:00至晚21:00,我們僅對這期間的30個時間段進行統(tǒng)計。為研究方便,我們用字母編號來代表每個時間段。表1給出了將食堂營業(yè)時間離散化后,字母編號和相應時間段的關系。
表1 食堂營業(yè)時間離散化——字母編號和各對應時段的關系
這樣,以每半個小時為一個時段,統(tǒng)計每個時段刷卡交易次數,制作次數分布表和次數分布圖,就可以對師生在食堂的消費情況進行詳細分析。
南開大學二食堂一層為普通快餐,二層為美食廣場,兩層的業(yè)態(tài)、經營模式和營業(yè)時間都有所不同。因此我們對兩層的數據分別進行統(tǒng)計分析。
圖2 不同身份群體在食堂刷卡消費所占比例
圖2給出了不同身份群體在食堂刷卡消費所占的比例??梢钥闯觯究粕谑程镁筒偷谋壤畲?,一層為68.57%,二層為77.88%。碩士和博士在食堂就餐的比例接近,且在一層就餐的比例更大。而教工在食堂就餐的比例最低。這主要是因為教工群體總人數較少,且很多住在學校附近的教工會選擇回家吃飯。表2給出了本科生、碩士、博士和教工在食堂的平均消費??梢钥闯觯谑程靡粚硬煌矸莸南M群體平均消費非常接近,在6.03元-6.43元之間。在二層美食廣場,本科生的平均消費最低,為9.35元;碩士和博士的平均消費接近,分別為10.32元和10.64元;教工的平均消費最高,為11.12元。
表2 不同身份群體在食堂的平均消費
前面我們已經將食堂交易流水信息按照發(fā)生時間進行離散化。統(tǒng)計不同時段食堂消費的刷卡次數,能夠讓我們清晰的看到食堂的就餐曲線圖,找到每日的就餐高峰,分析食堂資源配置是否合理。
圖3給出了食堂一層在不同時段刷卡的次數分布圖。其中橫坐標為時段,字母編號和時間段的對應關系如表1所示;縱坐標為在某一時間段內的平均刷卡次數,該值為2015年4月份30天刷卡的平均值??梢钥闯?,在中午和晚上分別出現(xiàn)兩個用餐高峰,中午為11:00-12:00(F1,F(xiàn)2 時段),晚上為 17:00-18:00(L1,L2 時段)。午餐的用餐高峰更加尖銳,說明中午師生用餐更加集中,更容易發(fā)生擁擠。交易次數最多的時段為11:00-11:30,共刷卡1327次。晚上的用餐高峰較為平緩,說明師生晚上就餐較為分散。刷卡次數最多的時段為17:00-17:30,共刷卡798次,遠少于中午高峰時段的刷卡次數。
圖3 食堂一層不同時段的刷卡次數分布圖
圖3同時也給出了每個時間段刷卡次數的標準差??梢钥吹?,在用餐高峰,刷卡次數的標準差非常大。說明師生每天的刷卡次數有較大差異。這主要是由于工作日和節(jié)假日用餐人數和用餐時間會有較大差別。因此有必要分別對工作日和節(jié)假日的消費數據進行討論。
圖4 食堂一層工作日和節(jié)假日的刷卡次數分布對比圖
圖4給出了食堂一層工作日和節(jié)假日的消費數據??梢钥闯?,兩條曲線發(fā)生顯著分裂,高峰時段刷卡次數數值有較大差異,且兩組數據的標準差顯著減少,這說明節(jié)假日和工作日的消費數據的確存在很大差距。由圖可知,節(jié)假日和工作日的刷卡次數分布具有相同的趨勢,在中午和晚上都同樣出現(xiàn)了兩個用餐高峰。中午刷卡次數最多的時段都為11:00-11:30,其中工作日平均刷卡次數為1567次;節(jié)假日平均刷卡次數為769次,約為工作日的一半。晚上刷卡次數最多的時段為17:00-17:30,其中工作日平均刷卡次數為912次;節(jié)假日平均刷卡次數為532次,同樣約為工作日的一半。因此節(jié)假日的用餐人數更少,用餐高峰更為平緩,不會出現(xiàn)人多擁擠的情況。食堂可以少準備一些食材,或關閉部分窗口,以提高資源利用率。
圖5 食堂二層美食廣場工作日和節(jié)假日的刷卡次數分布對比圖
對于二層美食廣場,我們同樣給出區(qū)分工作日和節(jié)假日的刷卡次數分布圖。如圖5所示,與一層快餐類似,二層美食廣場節(jié)假日和工作日不同時段的刷卡次數分布具有相同的趨勢,同樣在中午和晚上出現(xiàn)兩個用餐高峰。中午刷卡次數最多的時段為11:30-12:00,比一層晚半個小時,其中工作日平均刷卡次數為680次;節(jié)假日平均刷卡次數為423次,約為工作日的2/3。而在13點以后,節(jié)假日就餐人數略多于工作日。工作日晚上刷卡次數最多的時段為17:00-17:30,日均刷卡次數為535次;而節(jié)假日晚上用餐高峰較為平緩,在17:00-17:30,17:30-18:00,18:00-18:30三個時段的刷卡次數比較接近,分別為386,395和372次。這說明師生的晚餐時間更為分散,因此不會出現(xiàn)人多擁擠的情況。同樣,在18點以后,節(jié)假日就餐人數也要略多于工作日。總體來說二層美食廣場節(jié)假日的就餐人數只是略少于工作日,對商戶沒有顯著影響。
圖6 食堂一層和二層的刷卡次數分布對比圖
接下來討論師生在不同業(yè)態(tài)商戶的就餐規(guī)律。圖6給出了工作日二食堂一層快餐和二層美食廣場的刷卡次數對比圖。由圖可知,在用餐高峰,一層的刷卡次數遠大于二層美食廣場。一層的用餐高峰更加尖銳,說明一層用餐更加集中。二層用餐高峰相對平緩,這說明二層用餐時間相對分散。在午餐時間,一層刷卡次數峰值出現(xiàn)在11:00-11:30,超過12:30刷卡次數急劇減小。而二層美食廣場,在13:00-13:30平均刷卡次數仍然超過100次。這說明二層美食廣場采取單點現(xiàn)做的方式,延長營業(yè)時間,能夠為錯過用餐時間,或想錯峰就餐的師生更好的提供餐飲服務。這能夠有效的緩解就餐高峰壓力。晚間就餐情況也出現(xiàn)類似的趨勢,一層18:30以后就餐人數非常少,而二層美食廣場直到21點仍有人刷卡就餐。
最后,我們想討論校區(qū)搬遷對食堂就餐人數的影響。南開大學于2015年9月開始部分搬遷到新校區(qū)。搬遷師生的數量約為師生總數的一半。統(tǒng)計2015年4月和2016年4月食堂工作日每個時段的平均刷卡次數(包括一層和二層),如圖7所示。從圖中可以看出,雖然本部有約一半的師生搬遷到新校區(qū),但由于食堂就餐環(huán)境的改善,高峰時段就餐擁擠狀況的緩解,食堂的就餐人數并沒有減少為原來的一半。搬遷前,食堂午餐高峰時段F1,F(xiàn)2(11:00-12:00)的平均刷卡次數為 3706次;搬遷后,刷卡次數變?yōu)?373次,人數減少了約1/3。搬遷前,晚餐 L1、L2時段(17:00-18:00)的平均刷卡次數為2378次,搬遷后變?yōu)?481次,同樣減少了約1/3。這說明搬遷后,由于本部食堂環(huán)境改善,就餐擁擠情況得到了有效緩解,使得一部分之前在校外就餐的師生重新選擇在食堂就餐。
圖7 2015年4月和16年4月食堂刷卡次數對比
一卡通系統(tǒng)猶如一臺日夜不停的采礦機,采集的數據就好比大量粗礦石,等待我們去從中提煉金子。原始數據都是孤立和無序的,需要采用科學合理的算法構建數學模型,找到數據之間的關聯(lián)。在此基礎上,如果能進一步開發(fā)出一套有效的決策支撐系統(tǒng),將會為校領導和相關部門的科學決策提供非常有力的數據支撐。這些工作值得我們付出大量時間和精力去深入研究。
[1]許鑫.南京大學數字化校園建設架構[J].中國教育信息化,2002(8):44-45.
[2]徐為民,徐兵,朱顯靈.校園一卡通和數字化校園[J].中國教育信息化,2002(1):50-51.
[3]蘇文勝,馬千軍.基于數字化校園的校園一卡通構建[J].武漢理工大學學報(信息與管理工程版),2005,27(1):99-101.
[4]顧金娣,席琳琳.校園一卡通系統(tǒng)的應用與思考[J].上海第二工業(yè)大學學報,2005,22(3):71-76.
[5]張升平.數字化校園之校園一卡通的建設[J].重慶工商大學學報:自然科學版,2008,25(1):56-59.
[6]李淑娟,周偉強,宓泳.如何實現(xiàn)校園一卡通高效的運行管理探索[J].實驗技術與管理,2011,28(6):7-10.
[7]張九娟.校園“一卡通”在學校管理中的應用研究[J].高校后勤研究,2014(2).
[8]王彬,劉群.校園卡系統(tǒng)的現(xiàn)狀[J].才智,2015(31).
[9]李珊娜.基于校園一卡通平臺的數據挖掘應用研究[J].鐵路計算機應用,2010,19(6):55-58.
[10]張兵兵,王建,張建威.數據挖掘在校園一卡通系統(tǒng)中的應用初探[J].數理醫(yī)藥學雜志,2009,22(5):572-575.
[11]陳鋒.基于校園一卡通系統(tǒng)的高校用戶就餐消費行為分析與數據挖掘.中國教育信息化,2014(5):47-49.
[12]薛黎明,欒維新,李志淮.數據挖掘在校園一卡通消費數據分析中的應用[D].中國高等教育學會教育信息化分會第十二次學術年會論文集,F,2014.