劉方榮,童星玉,何斌穎
(云南經濟管理學院,云南·昆明 650106)
隨著大數(shù)據(jù)技術的快速發(fā)展,給人們的閱讀方式帶來了巨大改變,主動推送的閱讀書籍不僅與讀者的閱讀興趣吻合,而且極大的使圖書館的圖書資源得到有效利用。基于大數(shù)據(jù)的精準推送服務一方面可以方便讀者的生活,使讀者可以不受地域和時間的限制便能獲取到符合自己心儀的閱讀書籍;另一方面,可以使讀者節(jié)約大量的時間和精力以便獲取到更多的知識和智慧。
高校圖書館是一個龐大的“信息數(shù)據(jù)源”。數(shù)以百萬計的館藏能否為讀者充分利用是目前高校較為關注的問題之一,隨著大數(shù)據(jù)技術的快速發(fā)展和成熟,對海量數(shù)據(jù)的存儲和分析已不再是難題,但是大數(shù)據(jù)技術在商業(yè)、交通以及旅游行業(yè)應用較多,對高校高校圖書館綜合應用方面卻不多,為此,將這一技術與圖書館閱讀推送服務服務進行融合發(fā)展,不經能夠發(fā)揮大數(shù)據(jù)在教育行業(yè)的價值,同時也能夠讓靜態(tài)放置的書籍知識活躍起來。
隨著大數(shù)據(jù)技術的快速發(fā)展,人們的閱讀方式和閱讀習慣發(fā)生著巨大改變,從傳統(tǒng)的主動尋找自己喜好的書籍閱讀到大數(shù)據(jù)主動推送服務模式的轉變,由此可見,大數(shù)據(jù)閱讀推送服務可以基節(jié)約讀者尋找書籍的時間,更多的把時間運用在知識閱讀上,同時,能夠更高效的匹配到讀者感興趣的書籍,提高讀者的閱讀興趣,從而能夠更好的協(xié)助高校圖書館的發(fā)展,促進教育的發(fā)展,提高讀者的社會認知和理論水平。
基于大數(shù)據(jù)技術的高校圖書館閱讀推送服務主要利用大數(shù)據(jù)技術實現(xiàn)實現(xiàn)熱門書籍的實時推送、圖書館藏及圖書借閱情況等進行可視化展示,在圖書閱讀推廣過程中,使用大數(shù)據(jù)技術快速地獲取和分析讀者的信息,進而準確了解讀者的需求和閱讀規(guī)律,然后對讀者進行分類,并對不同的讀者推送不同的內容,例如低年級學生推送英語四六級書籍,而高年級學生則可推薦就業(yè)相關或者考研考公等書籍。
HADOOP 集群:Hadoop 是一個分布式計算平臺。主要解決海量數(shù)據(jù)的存儲和分析計算的問題。Hadoop由分布式文件系統(tǒng)HDFS、MapReduce和Yarn 組成,為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎架構。
Hive:基于Hadoop 的一個數(shù)據(jù)倉庫工具,能夠將結構化的數(shù)據(jù)文件映射為一張表,并提供類SQL 查詢功能。
Hbase:Hbase是一種分布式、可擴展和支持海量數(shù)據(jù)存儲的NoSQL數(shù)據(jù)庫。
spark:大數(shù)據(jù)處理集群計算框架,與hadoop緊密集成,能夠運行在Yarn 上,Spark 項目包括用于處理的MLIib、GraphX、Spark Streamimg 和Spark SQL等模塊。
大數(shù)據(jù)可視化:借助圖形化手段,清晰有效的將數(shù)據(jù)中所蘊含的有價值信息展示出來,為決策者提供依據(jù)和幫助。
數(shù)據(jù)獲?。菏紫全@取圖書館的書籍數(shù)據(jù)、圖書借閱與歸還數(shù)據(jù)、各二級學院圖書借閱情況等數(shù)據(jù);
數(shù)據(jù)清洗:與讀者個性化智慧服務決策相關性較大的諸如讀者個體特征、閱讀歷史行為、閱讀實時興趣、個體移動路徑、閱讀終端模式、讀者服務評價與滿意度反饋、系統(tǒng)未來服務資源總量與服務負載等數(shù)據(jù),才能在較小大數(shù)據(jù)清洗成本投入和降低清洗復雜度的前提下,大幅度提升圖書館大數(shù)據(jù)的價值密度與數(shù)據(jù)可用性。
數(shù)據(jù)存儲:將清洗后的數(shù)據(jù)存儲在HDFS 上,待數(shù)據(jù)分析時使用。
數(shù)據(jù)分析:使用Spaek SQL 或者Hive 分析函數(shù)等對數(shù)據(jù)進行分析處理。
數(shù)據(jù)可視化:有針對性的對目標數(shù)據(jù)進行可視化展示,可視化工具選擇Echarts、FineBI等。
推送內容:基于高校發(fā)展需要,集合大數(shù)據(jù)分析結果,將熱門書籍,借閱量排名靠前、專業(yè)書籍、新書等有針對性的推送給校園讀者,任課教師主要推送所任課程書籍,高年級學生推送考研、考公等考試數(shù)書籍,低年級學生推送專業(yè)課、英語四六級、計算機等書籍。
可視化的內容:立足于云南經過管理學院圖書館,根據(jù)圖書館的館藏資源,借閱數(shù)據(jù)等數(shù)據(jù),采用開源軟件FineBI 進行設計和制作,可視化內容由:log、標題、時間、4 個標簽卡(圖書總量/借閱量、今日借書/今日還書、本月借書/本月還書、本學期借書/本學期還書)、圖書借還統(tǒng)計、學院借閱排行、圖書大類借閱排行、專業(yè)借閱排行、圖書館藏可視化、借還率、新書推薦、圖書借閱排行和讀者借閱排行組成,充分利用高校圖書館的數(shù)據(jù)資源,借助圖形可視化的手段,有效地分析圖書館各方面數(shù)據(jù)變化情況進行可視化的呈現(xiàn)以達到更好的進行圖書館的管理和優(yōu)化師生的用戶體驗,從而促進大數(shù)據(jù)技術與圖書館綜合事宜的融合發(fā)展。
可視化效果
高校圖書館閱讀推送服務是在現(xiàn)有基礎上融合了大數(shù)據(jù)等先進技術,是高校圖書館新的發(fā)展方向和趨勢,在讀者閱讀服務及體驗方面能夠帶來全新的滿足感和體驗感?;诖髷?shù)據(jù)技術的高校圖書館閱讀推送服務需要滿足讀者的個性化和主動性服務需求,但同時要解決大數(shù)據(jù)環(huán)境下圖書館數(shù)字資源海量豐富特性帶來的挑戰(zhàn)。