王娟
【摘? 要】近年來,大數據的應用對高校圖書館工作產生了巨大的影響。論文運用調查法、文獻法等就大數據分析對圖書館的影響以及其在大學圖書館中的應用進行分析探究,以供參考。
【Abstract】In recent years, the application of big data has a huge impact on the work of university library. The paper uses survey method, literature method and other methods to analyze and explore the impact of big data analysis on library and its application in university library, for reference.
【關鍵詞】大數據分析;圖書館;應用路徑
【Keywords】big data analysis; library; application path
【中圖分類號】G250.7;G258.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號】1673-1069(2021)03-0188-02
1 引言
互聯網、計算機等現代化技術在一定程度上改變了高校圖書館讀者的閱讀方式與圖書館的用戶服務模式,高校圖書館數據開始逐漸呈現出多類型、高價值、快速處理以及海量激增等特征。在此情況下,傳統(tǒng)的數據處理方式已經不再適應當前工作,高校圖書館必須引進與應用更為先進的數據處理技術來提高數據利用率,提升圖書館服務水平。下文結合實際情況,就大數據分析在大學圖書館中的應用問題作具體分析。
2 大數據分析的特點與作用
對于什么是大數據,《社會消費網絡營銷》中提出:(大數據)包括企業(yè)信息化的用戶交易數據,社會化媒體中用戶的行為數據和關系數據,以及無線互聯網中的地理位置數據[1]。大數據的概念來自歐美國家,而對于大數據分析,我們可以將其理解為是一種數據工具。大數據分析包括數據收集與數據分析,通過收集與分析大量數據,獲得信息不對稱的優(yōu)勢,并據此對事物發(fā)展趨勢作出預測。
通過簡單調查與研究可知,高校圖書館數據總量正在快速增長,且在相關技術等的影響下數據的結構也更加復雜。數據結構的變化與數量的增長使得圖書館處理數據的難度加大,若不借助先進的技術手段,許多數據將可能被埋沒、遺失,無法發(fā)揮出作用,這無疑不利于圖書館服務水平的提高。鑒于此,高校應當將大數據分析應用于圖書館建設,借助有效的數據分析技術從海量數據以及復雜的數據環(huán)境中有效挖掘、獲取、理解大數據的價值,讓各項價值數據得到充分利用,讓圖書館的建設能力以及服務能力得到提升。
3 大數據分析在大學圖書館中的具體應用
3.1 利用大數據分析構建個性化集成服務系統(tǒng)
高校在開展圖書館建設以及推送個性化服務等工作時,可以將大數據分析作為基礎構建一個個性化的集成服務原型系統(tǒng),利用該系統(tǒng)來為讀者制定閱讀方案或者制定讀書推送計劃,讓圖書館的各項工作更具針對性與有效性。在構建該系統(tǒng)時,高校圖書館利用大數據分析技術對圖書館讀者的行為數據進行挖掘與分析,通過對海量數據的分析掌握讀者的閱讀需求、喜好以及習慣等,在此基礎上為讀者提供個性化的推送、檢索以及講解服務。
3.2 基于大數據分析制定個性化服務策略
在大數據時代,高校圖書館可將大數據分析技術作為基礎為讀者制定個性化服務策略,該個性化服務策略包含交互性、能動性、個性化、人性化、實時性這五大特征。圖書館可通過制定與使用以上策略來提升服務水平,讓圖書館讀者的多樣化閱讀需求與學習需求得到滿足。在數據挖掘與分析技術的支持下,高校圖書館可實現對讀者行為數據的實時收集與動態(tài)分析,能實現對用戶行為數據的深入挖掘與安全儲存,能夠基于數據了解不同讀者的不同特性,從而讓圖書館的各項服務更具個性化、人性化。
高校圖書館在制定以及使用個性化服務策略時,需利用大數據分析技術完成以下步驟:首先,獲取關聯數據。高校圖書館可借助大數據分析將各種異構化的學科知識庫聯合起來,構建起海量的語義網絡庫檢索平臺,使用戶能便捷、高效地完成各項檢索,讓用戶部分需求得到滿足。其次,進行信息挖掘分析。結合以往經驗可知,當我們對某用戶的行為數據進行頻繁且大量的采集時,這些數據就會在數據庫中產生過擬合的狀態(tài),從而導致我們無法準確分析出用戶的行為特征。因此,在使用大數據分析技術對高校圖書館用戶行為數據進行收集時,應當利用個性化的推薦模型對海量數據進行篩選,利用這一模型篩選出有效數據,從而使數據分析結果具備實際的參考價值。最后,推出用戶興趣。要想為圖書館用戶提供更加個性化與人性化的服務,高校圖書館還需借助大數據分析技術來獲得用戶情感指標。具體可通過分析用戶個人日志來明確用戶的隱性與顯性表達,最終得到用戶興趣結果,使圖書館的各項服務更加科學合理。
3.3 結合大數據分析編制個性化服務方案
在大數據時代,高校圖書館可充分利用大數據分析技術來為讀者編制個性化的服務方案。例如,為讀者構建用戶行為數據庫、用戶興趣與需求挖掘中心以及個性化服務平臺等。具體分析如下:
首先,高校圖書館可基于大數據分析技術為用戶構建用戶基本信息數據庫以及服務日志數據庫,利用這兩大數據庫對用戶日常行為數據進行管理與利用,并在平時借助用戶行為模型完成對數據庫的更新,讓圖書館的各項建設與服務工作擁有更多的參考信息。其次,高校圖書館可利用大數據分析技術對個人用戶的行為數據進行統(tǒng)計,對全體用戶的日志數據進行挖掘與分析,利用大數據分析技術將有關聯的數據進行提取整理獲得各種聚類結果。基于各種聚類結果就能對用戶群體的某項顯性或隱性特征有所把握。最后,在基于大數據分析初步掌握了用戶性質與需求后,圖書館就能為用戶制定以及提供更加個性化與人性化的服務。為了進一步優(yōu)化讀者閱讀體驗,提高讀者對圖書館服務的滿意度,高校圖書館還可在利用大數據分析結果的基礎上再參考圖書館原有的專利庫、書目庫、知識庫、論文庫等,將這些數據庫與用戶行為特征進行匹配與結合,在此基礎上形成更具個性化與針對性的閱讀服務方案。
4 大數據分析在大學圖書館中應用的策略
4.1 建設良好的物理環(huán)境
要想讓大數據分析技術在高校圖書館建設以及服務工作中充分發(fā)揮作用,高校就需要建設好相應的物理環(huán)境,如構建起高性能計算平臺等。目前,部分高校為大數據分析技術的運作建設了Hadoop平臺,該平臺功能相對豐富,能為數據挖掘、計算等提供支持。Hadoop平臺主要由兩個功能模塊組成:一是數據挖掘模塊;二是數據存儲模塊。在執(zhí)行數據挖掘任務時主要是通過Spark架構以及Map/Reduce數據對目標數據進行挖掘。而在對數據進行存儲時主要是通過分布式文件系統(tǒng)進行操作。
4.2 選擇與構建數據挖掘框架
要想提高大數據分析的質量以及效率,高校需要根據大數據分析的特征以及需求建設數據采集與挖掘框架。隨著科學技術的發(fā)展,當前能夠支持大數據挖掘與分析的框架也相對較多,但Map/Reduce和Spark框架可以說是最為適合高校圖書館工作的框架。該框架功能豐富,不僅包含線上的數據采集與應用模塊,而且還能為線下建模以及數據存儲工作的開展提供支持。具體來說,Map/Reduce和Spark框架線上部分的數據采集采用了HDFS和HBase等功能完成用戶行為數據的存儲和讀寫過程,使得數據采集過程非常靈活方便。而在線下進行建模時,Hadoop平臺的數據處理機制又能為建?;顒犹峁┖艽髱椭⑶以诮=Y束后,可基于該平臺采用回歸算法、聚類算法以及分類算法等數據挖掘方法對數據的內在含義以及隱藏價值進行分析,結束初步挖掘后再使用更高精度的基礎算法獲得價值更高的信息,從而讓圖書館各項工作更容易開展。
4.3 科學選擇基礎算法
在高?;诖髷祿治鰹橛脩籼峁﹤€性化服務時,必須結合實際情況合理選擇基礎算法,以此保證最終的服務效果。當前,可供選擇的基礎算法較多,為確?;A算法選擇的科學性與合理性,高校圖書館應綜合考慮以下因素:首先,基礎算法必須正確、準確。在選擇基礎算法時,相關人員需對用戶行為特征與用戶內容特征之間的比例進行分析,如果用戶行為特征的區(qū)分度較高,那么就可借助用戶行為特征的區(qū)分度完成推薦算法的計算;而當用戶內容特征的區(qū)分度較高時,就可借助用戶內容特征的區(qū)分度完成推薦算法計算。其次,算法要保證高效。當前有許多個性化的推薦系統(tǒng)采用的是離線計算模式,這種模式下的計算流程是:先完成對大量用戶行為數據與內容數據的采集,再將所有數據進行一次性挖掘,最后在離線狀態(tài)下計算出結果。這種計算方法雖有一定的可行性,但也存有許多不足,如計算效率低。因此,建議高校圖書館可適當改變算法,如采用增量挖掘的建模方法來提高計算效率與質量。
5 結語
綜上所述,大數據分析能為高校圖書館的建設及服務等工作的開展帶來很大幫助。因此,在當前背景下應進一步加強對大數據分析的研究以及推廣應用,讓大數據分析的作用價值得到充分發(fā)揮。
【參考文獻】
【1】楊偉超,鄒瑜,徐萍,等.基于大數據的圖書館資源分析系統(tǒng)研究[J].信息與電腦(理論版),2020,32(23):219-221.