龔曉婷,肖 錚,陳俊杰,黃國凡(廈門大學(xué)圖書館,福建廈門361005)
?
用戶數(shù)據(jù)統(tǒng)計挖掘與展示
——以廈門大學(xué)圖書館“圕·成長”項目為例
龔曉婷,肖 錚,陳俊杰,黃國凡
(廈門大學(xué)圖書館,福建廈門361005)
大數(shù)據(jù)時代到來,人們以新的技術(shù)和視角看待數(shù)據(jù)。圖書館如何應(yīng)用現(xiàn)有數(shù)據(jù),挖掘和提煉數(shù)據(jù)價值,已成為行業(yè)關(guān)注熱點。文章以廈門大學(xué)圖書館針對用戶數(shù)據(jù)進(jìn)行統(tǒng)計挖掘,通過可視化的方法進(jìn)行展現(xiàn)為例,介紹了廈門大學(xué)圖書館“圕·成長”項目的設(shè)計思路、實施過程和項目展望。
數(shù)據(jù)挖掘;數(shù)據(jù)可視化;創(chuàng)新服務(wù)
數(shù)據(jù)統(tǒng)計和數(shù)據(jù)挖掘技術(shù)已經(jīng)應(yīng)用在圖書館用戶需求分析[1]、個性化服務(wù)推薦[2]、讀者忠誠度提升[3]、期刊管理[4]等方面。近年來隨著大數(shù)據(jù)概念的普及,人們對于數(shù)據(jù)的價值以及數(shù)據(jù)的應(yīng)用都有了新的認(rèn)識。大數(shù)據(jù)給圖書館帶來了新的影響和挑戰(zhàn),同時也給圖書館的服務(wù)創(chuàng)新和發(fā)展提供了新的機(jī)遇[5]。如何喚醒沉睡在圖書館系統(tǒng)中的用戶數(shù)據(jù),提煉它們的價值,已成為行業(yè)關(guān)注的熱點。
互聯(lián)網(wǎng)公司對于用戶數(shù)據(jù)的挖掘分析與包裝營銷給予圖書館新的啟發(fā)[6]。上海圖書館2013年春節(jié)推出了個人年度閱讀賬單,是一份基于讀者上一年借閱記錄的回顧總結(jié)。廈門大學(xué)圖書館2013年畢業(yè)季,為畢業(yè)生送上了一份獨特的畢業(yè)禮物:“圕·時光”網(wǎng)站收集整理畢業(yè)生的借閱歷史、入館記錄、論文題目等個人數(shù)據(jù),用清新文藝的圖文講述畢業(yè)生的圖書館故事[7]。
大學(xué)生的校園生活,與圖書館有著密切的關(guān)系,他們在圖書館學(xué)習(xí)、娛樂、志愿服務(wù),在書香陪伴下成長。圖書館積累了大量的相關(guān)數(shù)據(jù),如學(xué)生的借閱記錄、到館記錄、座位使用記錄、自助文印記錄等等。廈門大學(xué)圖書館的“圕·成長”項目,對圖書館各系統(tǒng)中的用戶數(shù)據(jù)進(jìn)行了清理、關(guān)聯(lián)、統(tǒng)計、挖掘,進(jìn)行精心設(shè)計和包裝,以信息圖表的形式呈現(xiàn)給用戶,使之成為一份讀者的數(shù)字檔案,記錄他們成長的軌跡。
“圕·成長”以在校學(xué)生為受眾對象,在學(xué)年初發(fā)布,目的在于通過數(shù)據(jù)進(jìn)行總結(jié)和梳理,讓學(xué)生看到過去一年自己的到館次數(shù)、借閱冊次、自習(xí)時間以及其它服務(wù)的使用情況。通過數(shù)據(jù)讓學(xué)生更加了解自己,了解全校用戶的整體情況,更好地引導(dǎo)學(xué)生認(rèn)識到圖書館對個人的影響和作用,并通過相關(guān)數(shù)據(jù)分析,推薦圖書館的特色服務(wù),讓學(xué)生在未來更好地使用圖書館,幫助他們更好地成長。
1.用戶數(shù)據(jù)統(tǒng)計與展示
用戶個人數(shù)據(jù)來自圖書館自動化系統(tǒng)、門禁系統(tǒng)、座位管理系統(tǒng)、自助文印系統(tǒng),主要數(shù)據(jù)包括用戶上一學(xué)年的借閱總量、入館總數(shù)、自習(xí)時間、超期滯納金、自助文印使用量等;以個人數(shù)據(jù)為基礎(chǔ),按照專業(yè)、年級、學(xué)院的借閱平均數(shù),入館平均數(shù)、自習(xí)平均數(shù)進(jìn)行排名。
在圖表展示中,筆者將用戶個人數(shù)據(jù)與同專業(yè)、同年級中排名第一的用戶數(shù)據(jù)以及平均數(shù)據(jù)進(jìn)行橫向?qū)Ρ龋@樣用戶可以清楚地了解自己與第一名的差距,以及自己在同專業(yè)、同年級同學(xué)中所處的位置。排名靠前,是對學(xué)生過去一年努力的肯定。排名靠后,則是善意的提醒,激勵他們以年級平均和年級第一作為目標(biāo),在新學(xué)年能夠多來圖書館,多閱讀,在下一年的成長賬單中“刷”數(shù)據(jù)。
此外,筆者針對圖書館系統(tǒng)的歷史數(shù)據(jù)進(jìn)行了統(tǒng)計,生成熱門圖書列表。其中既有基于上一年度流通記錄統(tǒng)計的年度熱門圖書,也有基于全部歷史記錄統(tǒng)計出的按專業(yè)、按年級的熱門圖書。系統(tǒng)通過判別讀者專業(yè)年級信息,將其所借圖書與熱門圖書進(jìn)行比較,如果熱門圖書不在其借閱歷史記錄中,則將這些熱門圖書推薦給用戶;同時結(jié)合用戶數(shù)據(jù)分析,推薦圖書館的相關(guān)服務(wù)。比如對于超期滯納金較多的用戶,推薦圖書館的郵件、短信超期提醒服務(wù);對于預(yù)約圖書較多的用戶,推薦電子圖書的服務(wù);對于入館和自習(xí)較多的用戶,推薦圖書館的書包柜服務(wù)等等。
考慮到項目推出后,可能有大一、研一的新生帶著好奇心訪問,而此類用戶并無上一學(xué)年統(tǒng)計數(shù)據(jù),在登錄后,系統(tǒng)將為其推薦新生需要的各種攻略指南,比如如何使用廈門大學(xué)的學(xué)生郵箱、如何找書、座位系統(tǒng)的使用、二維碼在圖書館中的應(yīng)用等等。
2.排行榜單的設(shè)計
筆者在統(tǒng)計用戶個人數(shù)據(jù)時,分別對各項數(shù)據(jù)進(jìn)行了排序處理,由此得出各項數(shù)據(jù)的用戶排行,將最能反映用戶與圖書館親密程度的借閱量、入館次數(shù)、自習(xí)時間這三項數(shù)據(jù)生成榜單,前五名用戶分別賦予“書神”、“館主”、“學(xué)霸”稱號,既是對獲此名號的用戶的褒獎,也能激發(fā)其它用戶設(shè)立更高的目標(biāo)。除了個人排名,還以學(xué)院為單位進(jìn)行了數(shù)據(jù)統(tǒng)計,計算出各學(xué)院同學(xué)在借閱量、入館次數(shù)、自習(xí)時間三項指標(biāo)的平均值,由此生成學(xué)院PK榜——通過此榜單,可以看出全校哪個學(xué)院的學(xué)生最愛閱讀,哪個學(xué)院的學(xué)生最愛來圖書館,哪個學(xué)院的學(xué)生自習(xí)時間最長。
1.數(shù)據(jù)整理
從原始數(shù)據(jù)到項目可用的最終數(shù)據(jù),須經(jīng)過數(shù)據(jù)提取、數(shù)據(jù)清理、數(shù)據(jù)統(tǒng)計三階段。
(1)數(shù)據(jù)提取
原始數(shù)據(jù)散存于圖書館自動化系統(tǒng)、門禁系統(tǒng)、座位管理系統(tǒng)、自助文印系統(tǒng)的Oracle和SQL Server數(shù)據(jù)庫中。因項目反映的是學(xué)生用戶上一學(xué)年的數(shù)據(jù),所以筆者以學(xué)號作為用戶唯一身份標(biāo)識,以2013年9月1日到2014年8月30日作為時間區(qū)間,從各系統(tǒng)的相關(guān)表中抽取可用字段值,保存至臨時庫中。首先通過自動化系統(tǒng)的用戶表,將所有有效的在校生的信息抽取出來,再以此用戶數(shù)據(jù)為基礎(chǔ),抽取其它系統(tǒng)中的相關(guān)記錄。如從自動化系統(tǒng)中抽取出相關(guān)借閱歷史記錄,從門禁系統(tǒng)中抽取入館日志記錄,從座位系統(tǒng)中抽取選座離座記錄,從自助文印系統(tǒng)中抽取歷史使用記錄等。
(2)數(shù)據(jù)清理
數(shù)據(jù)清理主要以處理無效數(shù)據(jù)和重復(fù)數(shù)據(jù)為主,例如門禁系統(tǒng)中的記錄是以用戶單次入館記錄的,為了統(tǒng)計需要,我們需要將用戶同一天多次入館記錄合并成一條記錄。座位系統(tǒng)中以用戶選座和離座的時間點作為日志記錄,為了計算用戶在座時間,須將日志記錄中獨立的選座記錄和離座記錄對應(yīng),用離座時間減去選座時間,得出用戶單次在座時長。
(3)數(shù)據(jù)統(tǒng)計
數(shù)據(jù)統(tǒng)計的工作主要通過SQL的聚集函數(shù)和Excel的數(shù)據(jù)透視表功能,分別統(tǒng)計用戶的借閱總量、入館總數(shù)、自習(xí)時間、常用座位、常去的閱覽室、超期滯納金、自助文印使用量。按照學(xué)生類型、專業(yè)、年級、學(xué)院四個維度對用戶進(jìn)行分組,計算平均值,并得出每個分組中的借閱量、入館次數(shù)、自習(xí)時間的排行。
2.程序設(shè)計
程序設(shè)計由后端開發(fā)與前端實現(xiàn)兩部分組成。
(1)后端開發(fā)
因項目主要以數(shù)據(jù)展示為主,所以后端開發(fā)的主要工作是數(shù)據(jù)庫建表,裝載各類前期統(tǒng)計數(shù)據(jù)、頁面數(shù)據(jù)讀取。系統(tǒng)交互的程序主要是用戶登錄和用戶留言,在用戶登錄時生成一個隨機(jī)字符串作為分享時使用的URL參數(shù),也方便了后續(xù)的使用統(tǒng)計。
(2)前端開發(fā)
圖1 項目LOGO
圖2 借閱數(shù)據(jù)展示圖樣
前端開發(fā)的任務(wù)是數(shù)據(jù)的可視化展示及響應(yīng)式頁面的實現(xiàn)。結(jié)合項目特點,美工設(shè)計采用了清新簡約的風(fēng)格,使用四種色彩作為主要設(shè)計配色,代表了大學(xué)四年,亦代表項目中四項主題數(shù)據(jù):我愛閱讀、愛館如家、專屬領(lǐng)地、圕的推薦??紤]到用戶通過微博微信分享后的受眾主要使用移動終端瀏覽,因此項目采用響應(yīng)式頁面設(shè)計,保證移動端的訪問體驗。筆者選擇成熟流行的前端開發(fā)框架Bootstrap,配合頁面美工設(shè)計,實現(xiàn)基本的頁面布局和展示效果。項目的數(shù)據(jù)展示部分采用開源的前端數(shù)據(jù)可視化庫ECharts,根據(jù)展示內(nèi)容構(gòu)建相應(yīng)的圖形樣式,如借閱數(shù)據(jù)通過柱狀圖展示,自習(xí)時間曲線通過面積圖展示。圖樣如圖1至圖5。
圖3 門禁數(shù)據(jù)展示圖樣
圖4 座位系統(tǒng)數(shù)據(jù)展示圖樣
圖5 個性化推薦圖樣
1.宣傳推廣
項目完成后,通過多渠道跨平臺進(jìn)行宣傳推廣,充分利用圖書館的官方網(wǎng)站以及微博、微信平臺進(jìn)行營銷。筆者在微博開啟了“圕·成長”、“院系PK”相關(guān)話題,用戶可將自己的數(shù)據(jù)展示頁面分享,也可對院系PK榜單進(jìn)行評論。在不到十天的時間里,筆者通過微信平臺推送了六條圖文消息,閱讀量總計達(dá)10912次,而用戶在微信朋友圈的分享,亦吸引了大量相關(guān)用戶登錄。此外,為鼓勵用戶登錄與分享,筆者設(shè)計了獎勵幸運(yùn)用戶的活動,逢整百的登錄用戶將獲得一份珍貴的圖書館紀(jì)念禮品。通過以上營銷手段,有效地增加了系統(tǒng)使用率,擴(kuò)大了項目影響力。
2.效果評估
截止到2015年4月13日,已有4999位同學(xué)登錄查看過個人的“圕·成長”賬單,微博分享229次,相關(guān)話題閱讀量高達(dá)85.2萬;通過微博、微信分享鏈回的總訪問量17666次;總瀏覽量33526次,單用戶平均訪問次數(shù)為3.173次。新華網(wǎng)[8]和廈門晚報[9]就此項目專門采訪項目組成員及榜單達(dá)人,進(jìn)行了深度報道。
“圕·成長”項目嘗試使用數(shù)據(jù)統(tǒng)計、數(shù)據(jù)挖掘和數(shù)據(jù)可視化的方法,將讀者數(shù)據(jù)以全新形式呈現(xiàn)給讀者,使這份數(shù)據(jù)賬單成為讀者成長的印記,成為圖書館送給讀者的一份禮物。項目本身也拓展為一次圖書館服務(wù)的推廣營銷活動。未來,筆者將應(yīng)用新的技術(shù)手段,針對用戶數(shù)據(jù)進(jìn)行更全面深入的挖掘,如分析用戶的閱讀興趣、專業(yè)特長、學(xué)習(xí)周期等,并通過用戶每年數(shù)據(jù)的縱向?qū)Ρ?,更好地反映用戶的成長歷程,同時為圖書館的館藏采選策略、讀者服務(wù)模式、空間規(guī)劃設(shè)計等提供決策參考。
[1]李瑋平.基于數(shù)據(jù)挖掘的圖書館讀者需求分析[J].圖書館論壇,2004(3):86-88.
[2]顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書館個性化服務(wù)的探討[J].圖書館雜志,2013(8):63-65.
[3]姚婉燕.高校圖書館讀者忠誠度提升與數(shù)據(jù)挖掘的融合研究[J].情報科學(xué),2010(11):1646-1651.
[4]李繼宏.數(shù)據(jù)挖掘及其在高校圖書館期刊管理中的應(yīng)用[J].現(xiàn)代情報,2004(7):84-86.
[5]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.
[6]淘寶UED.設(shè)計提升品牌價值[EB/OL].[2015-05-21].http://ued.taobao.org/blog/wp-content/uploads/ 2012/12/1212淘寶時光機(jī)器(設(shè)計提升品牌價值)1.pdf.
[7]龔曉婷等.讀者數(shù)據(jù)的挖掘與創(chuàng)意呈現(xiàn):以“圕·時光”為例[J].大學(xué)圖書館學(xué)報,2013(6):92-96.
[8]新華網(wǎng).廈大曬出年度閱讀榜單:看“學(xué)霸”是如何煉成的?[EB/OL].[2015-05-21].http://news.xinhuanet. com/local/2014-12/20/c_1113716434.htm.
[9]廈門晚報.廈大圖書館發(fā)布年度排行榜,書神、館主、學(xué)霸紛出爐 [EB/OL].[2015-05-21].http://www. xmnn.cn/dzbk/xmwb/20141215/201412/t20141215 _4249713.htm.
(編輯:魯利瑞)
G25
A
1673-8454(2016)02-0072-03