李 榮,王慶石,李 雙,董崇文,宋 佳,王 琳
(東北財經(jīng)大學圖書館,遼寧 大連 116025)
筆者利用中國知網(wǎng)期刊文獻檢索平臺,以“讀者行為+圖書館”為主題詞進行檢索,截至2017年10月,共檢出250篇文獻。對“讀者行為”的相關(guān)研究文獻分析發(fā)現(xiàn):2000年之前研究者較注重“讀者行為”的理論研究,其研究方法主要采取調(diào)查問卷及人工統(tǒng)計的方法。具有代表性的成果有:陳剛、肖力給出了“讀者行為”的定義,認為在特定需求驅(qū)動下,讀者在圖書館物理場所內(nèi)產(chǎn)生的一系列活動方式就是讀者行為[1];盧榮遠認為探索和研究讀者的有規(guī)律的閱讀行為和檢索行為,可以指導圖書館有目的進行相關(guān)服務[2]。21世紀以后,研究者開始偏重于讀者行為的數(shù)據(jù)分析。例如:田稷依據(jù)聯(lián)機技術(shù)分析圖書館Web日志,可支持圖書館門戶網(wǎng)站建設(shè)、文獻采購決策及圖書館借閱服務等業(yè)務工作[3];王偉、張征芳、王海明等認為,通過對圖書館信息管理系統(tǒng)中的讀者借閱數(shù)據(jù)、檢索數(shù)據(jù)、文獻書目信息進行數(shù)據(jù)挖掘,可以揭示數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系,從而預知讀者信息需求[4];張文華通過研究聚類分析的挖掘技術(shù),可發(fā)現(xiàn)書籍與書籍、讀者與讀者之間的聯(lián)系[5];賴劍菲、江舟提出可通過收集讀者無線上網(wǎng)行為數(shù)據(jù)分析讀者上網(wǎng)喜好,為圖書館優(yōu)化服務內(nèi)容和服務方式提供合理決策[6]。
近幾年,圖書館界開始進行大數(shù)據(jù)的相關(guān)研究,越來越多的研究人員也認為圖書館具有了大數(shù)據(jù)的特點。在大數(shù)據(jù)環(huán)境下,圖書館所產(chǎn)生的數(shù)據(jù)和信息均與讀者行為有著千絲萬縷的關(guān)系。例如:陳臣認為圖書館應利用讀者行為大數(shù)據(jù)來建立圖書館智能化的服務體系[7];王玉林、曾詠梅指出圖書館的大數(shù)據(jù)有助于圖書館辨別讀者行為,并為讀者提供個性化服務具有重要參考價值[8];王芙蓉研究了在大數(shù)據(jù)環(huán)境下建立了基于讀者行為分析的模型,可有效提升文獻資源建設(shè)效率[9];吳蛟鵬認為在大數(shù)據(jù)環(huán)境下,為更好滿足讀者個性化需求,圖書館應積極利用和發(fā)現(xiàn)讀者行為的規(guī)律和特征,從而提供更加高效的服務[10]。目前,多數(shù)研究者結(jié)合圖書館自身業(yè)務,通過一個方面或一個側(cè)面研究讀者行為,缺乏對大數(shù)據(jù)環(huán)境下讀者行為的概念總結(jié)。本文在給出“讀者行為大數(shù)據(jù)”定義的基礎(chǔ)上,以東北財經(jīng)大學圖書館為例,總結(jié)了讀者行為大數(shù)據(jù)分析可為圖書館提供哪些精準服務和管理創(chuàng)新內(nèi)容。
2011年召開的“云計算與大數(shù)據(jù)”主題會議上,EMC World這樣定義大數(shù)據(jù):為保證及時向相關(guān)人員提供有用信息,必須通過分析和挖掘PB級數(shù)據(jù)量的潛藏價值[11]。麥肯錫全球研究所描述“大數(shù)據(jù)”是一種難以用傳統(tǒng)軟件或方法獲得、存放、分析和處理的大規(guī)模數(shù)據(jù)或信息總和[12]。簡單地說,大數(shù)據(jù)就是涉及大量相互連接的數(shù)據(jù),它們在一個大數(shù)據(jù)計算平臺,有相同的數(shù)據(jù)標準并能正確關(guān)聯(lián),通過大數(shù)據(jù)的相關(guān)處理技術(shù),對數(shù)據(jù)進行有效挖掘及整理,形成智能化的大數(shù)據(jù)產(chǎn)品或業(yè)務,從而指導人們的活動、工業(yè)制造、社會發(fā)展等。
根據(jù)圖書館自身特點,大數(shù)據(jù)主要來源包括OPAC數(shù)據(jù)、電子資源使用數(shù)據(jù)、自動化管理系統(tǒng)運行數(shù)據(jù)、網(wǎng)絡交互行為數(shù)據(jù)及科研數(shù)據(jù)等,上述來源數(shù)據(jù)均與讀者的行為有關(guān)。依據(jù)大數(shù)據(jù)的相關(guān)概念,筆者認為圖書館“讀者行為大數(shù)據(jù)”是指利用相關(guān)軟件、工具及方法對圖書館各業(yè)務系統(tǒng)或資源數(shù)據(jù)庫所能涉及大量相互關(guān)聯(lián)的讀者行為數(shù)據(jù),進行有效挖掘及整理,形成統(tǒng)計或分析結(jié)果,為加強文獻資源建設(shè)水平、優(yōu)化業(yè)務運行流程、推行精準化服務及提高管理創(chuàng)新能力提供決策指導。
讀者行為大數(shù)據(jù)分析目的是要實現(xiàn)為讀者提供精準化服務。因此,讀者行為大數(shù)據(jù)分析內(nèi)容的設(shè)定需要遵循以下幾條基本原則:(1)分析內(nèi)容的制定要與讀者需求相吻合,如果脫離讀者需求,分析的內(nèi)容就沒有意義,就不能為圖書館所用,也不能為讀者提供相應的服務。因此,圖書館應從資源、服務、業(yè)務三個方面出發(fā)考慮制定相關(guān)的大數(shù)據(jù)分析內(nèi)容,盡可能貼近讀者服務需求,從讀者的思維出發(fā)考慮設(shè)計大數(shù)據(jù)的分析內(nèi)容。(2)大數(shù)據(jù)分析內(nèi)容應要根據(jù)圖書館讀者服務工作的實際需求和變化,不斷完善分析指標體系。圖書館一般會定期開展許多讀者創(chuàng)新服務,而這些創(chuàng)新服務如果用定量的統(tǒng)計和分析卻不容易實現(xiàn)。因此,當現(xiàn)有的大數(shù)據(jù)分析內(nèi)容已不能滿足現(xiàn)有的服務需求時,數(shù)據(jù)分析內(nèi)容應有所調(diào)整,分析指標就應盡可能完善,這樣才能體現(xiàn)圖書館讀者服務創(chuàng)新的價值。(3)分析內(nèi)容的數(shù)據(jù)統(tǒng)計口徑和分析指標要保持一致。如果統(tǒng)計口徑和分析指標缺乏一致性,很可能造成分析結(jié)果的錯誤,產(chǎn)生較大誤差,這就無法為圖書館的服務和管理提供準確的指導和決策。(4)“教育部高校圖書館事實數(shù)據(jù)庫系統(tǒng)”是教育部高校圖工委用于組織各高校圖書館進行數(shù)據(jù)填報和匯總的平臺,每年各高校圖書館需要向該數(shù)據(jù)庫錄入相關(guān)信息。另外,《教育部高校圖書館事實數(shù)據(jù)庫》中的主要數(shù)據(jù)均被《年度高校圖書館發(fā)展報告》《中國圖書館年鑒》《中國圖書館事業(yè)發(fā)展報告(藍皮書)》所采用[13]。因此,圖書館讀者行為大數(shù)據(jù)的部分分析項目及指標應該參考《教育部高校圖書館事實數(shù)據(jù)庫》的標準。這樣圖書館在向上級部門上報數(shù)據(jù)時,既統(tǒng)一標準,也避免部分數(shù)據(jù)的重復收集工作。
圖書館讀者行為大數(shù)據(jù)分析內(nèi)容可分為入館行為、閱覽區(qū)座位使用行為、借閱行為、紙質(zhì)資源利用行為、電子資源利用行為、其他行為等6個一級類目,每個一級類目又包括多個二級類目,二級類目又包含多個三級類目。三級類目為讀者行為大數(shù)據(jù)分析的具體項目及重要指標。詳細內(nèi)容解析請參考表1(表中分析內(nèi)容均來源于東北財經(jīng)大學圖書館2016年大數(shù)據(jù)分析報告)。
表1 讀者行為大數(shù)據(jù)分析內(nèi)容
注:*表示數(shù)據(jù)暫時無法獲取。
館藏評估是對圖書館的館藏資源文獻利用情況進行的檢測和評估,為制定館藏發(fā)展政策,加強館藏質(zhì)量建設(shè)提供客觀依據(jù)[14]。通過讀者的文獻利用情況、文獻借閱比率等數(shù)據(jù)的采集和匯總,得到對圖書館館藏評價的數(shù)據(jù)基礎(chǔ),圖書館通過對這些數(shù)據(jù)的分析,不僅可以有效評估現(xiàn)有館藏結(jié)構(gòu)及文獻保障水平,同時為未來館藏的發(fā)展策略的制定提供了科學指導,如館藏文獻結(jié)構(gòu)的調(diào)整、文獻的剔舊工作等,從而實現(xiàn)館藏合理布局,盡可能地提高館藏文獻的利用率。
開展精準化信息服務必須掌握讀者在圖書館的行為,只有了解讀者行為特點,方能有的放矢地采取相應的服務策略。如在讀者入館量較高的時間段,安排資源培訓課程更能發(fā)揮圖書館數(shù)字資源宣傳的效益;根據(jù)閱覽室座位利用讀者的類型分析,開展圖書館資源定向推送服務,提高服務精準度;利用圖書館讀者借閱行為數(shù)據(jù)挖掘讀者的閱讀興趣與傾向、館藏圖書利用情況、讀者學科背景等,將有助于圖書館采取更加科學的文獻保障政策,并適時正向引導讀者的閱讀行為;利用讀者入館行為數(shù)據(jù)開展讀者流失預測、預警,重視圖書館與讀者的聯(lián)系和溝通。圖書館根據(jù)讀者行為大數(shù)據(jù)分析的結(jié)果,適時選擇電話、郵件、微信等方式給予讀者溫馨問候和關(guān)懷,了解讀者的學習生活情況,體現(xiàn)圖書館對讀者的人文關(guān)懷;利用大數(shù)據(jù)分析開展讀者個人數(shù)據(jù)報告展示服務,描繪讀者個人使用圖書館的記錄和趨勢,通過網(wǎng)頁、微信的方式展示給讀者,讓讀者了解自己利用圖書館的情況,時刻讓讀者感受到圖書館的關(guān)注和尊重。
圖書館在為讀者提供電子資源服務時,每年要向各大數(shù)據(jù)商支付高昂的訂購費用,這也為圖書館的資源建設(shè)帶來不小的壓力。圖書館依據(jù)什么來確定購買或不購買某種電子資源,都必須通過科學的數(shù)據(jù)分析來決定。如:哪些電子資源的使用率高,最受讀者的歡迎;用戶請求訪問的電子資源類型及學科種類信息都有哪些;電子資源的使用成本效益如何,哪些電子資源的使用效益好,使用成本低。這些必須通過讀者使用數(shù)據(jù)進行分析后才能明確。各個電子資源利用情況的統(tǒng)計數(shù)據(jù),能精確反映電子資源的利用狀況、讀者的使用規(guī)律和習慣、資源庫的使用成本等。這為圖書館進行資源推薦、讀者培訓課程設(shè)置以及幫助圖書館制定有關(guān)電子資源購買和管理提供了決策依據(jù)。
圖書館要實現(xiàn)精準化的讀者服務,必須解決和面對的問題是在整理、挖掘及分析讀者行為數(shù)據(jù)后,能夠精準預期和發(fā)現(xiàn)讀者的行為及需求。利用讀者行為大數(shù)據(jù)進行智能發(fā)現(xiàn)主要表現(xiàn)在:利用讀者行為數(shù)據(jù)從不同側(cè)面分析哪類服務是受讀者歡迎的,同時哪類讀者的個性需求沒有得到滿足;充分利用圖書館內(nèi)外部數(shù)據(jù)的連接關(guān)系,全方位了解讀者一系列相關(guān)行為間存在如何的聯(lián)系;通過對所有關(guān)聯(lián)數(shù)據(jù)的匯總分析,將雜亂無章的數(shù)據(jù)轉(zhuǎn)化為對圖書館讀者服務的決策支持,即實現(xiàn)讀者行為大數(shù)據(jù)分析數(shù)據(jù)向特定決策方法、讀者信息服務的轉(zhuǎn)化。圖書館在進行讀者大數(shù)據(jù)分析的過程中應始終遵循這樣一個標準:無論是讀者服務推廣、讀者服務創(chuàng)新,還是提升讀者體驗,通過行為數(shù)據(jù)間關(guān)聯(lián)關(guān)系,發(fā)掘在圖書館服務與讀者、讀者與讀者之間搭建的全新關(guān)系;依據(jù)對讀者接續(xù)性需求行為的預測,為讀者提供最適合、最精準的圖書館推廣服務,讓讀者及時感受到圖書館最人性化的服務體驗[15]。
圖書館數(shù)據(jù)統(tǒng)計涉及館藏文獻數(shù)據(jù)、流通數(shù)據(jù)、讀者行為數(shù)據(jù)、資源利用數(shù)據(jù)等。以往各業(yè)務部門的數(shù)據(jù)統(tǒng)計工作中往往存在數(shù)據(jù)統(tǒng)計需求不同、數(shù)據(jù)統(tǒng)計指標體系不完整、數(shù)據(jù)分散且采集難度大、數(shù)據(jù)獲取效率低等問題。圖書館讀者行為大數(shù)據(jù)分析及未來大數(shù)據(jù)平臺的建立將會克服數(shù)據(jù)統(tǒng)計和分析工作中的難題,為圖書館事實數(shù)據(jù)、資源利用數(shù)據(jù)、讀者行為數(shù)據(jù)的采集提供了統(tǒng)一的平臺。未來大數(shù)據(jù)分析將輔助圖書館各業(yè)務部門在線隨時提取所需數(shù)據(jù)或報告,減輕各類數(shù)據(jù)的采集和分析成本,促進圖書館對各項工作進行科學規(guī)范的管理及全面細致的評估,從中發(fā)現(xiàn)優(yōu)勢與不足,進而實現(xiàn)各項工作的不斷創(chuàng)新,提高圖書館各業(yè)務部門的決策效率。
大量的非結(jié)構(gòu)化數(shù)據(jù)如讀者與電子資源的交互數(shù)據(jù)(檢索行為、檢索習慣、檢索熱點)很難獲取。由于數(shù)據(jù)商不開放相應的數(shù)據(jù)訪問接口,加上缺乏專業(yè)的網(wǎng)絡分析工具、數(shù)據(jù)采集挖掘工具,圖書館無法全面掌握讀者在使用商用電子資源過程中與商用資源的各種交互行為,也就不可能分析讀者的研究熱點、關(guān)注的學科領(lǐng)域及學科研究趨勢等。
在數(shù)據(jù)分析中,統(tǒng)計口徑(時間范圍、讀者數(shù)量)選擇及分析指標的選取較為困難,如讀者借閱冊次分析、借閱時間段固定。有效注冊讀者時間的選擇不同,統(tǒng)計結(jié)果就會有差別。另外,圖書館許多服務如聯(lián)機檢索、光盤檢索、參考咨詢、閱讀推廣服務等,難以用客觀準確的標準加以定量化統(tǒng)計和分析。因此,要根據(jù)工作的實際需要有所變化,及時增加新的分析內(nèi)容,不斷完善統(tǒng)計分析指標。
開放與隱私如何平衡,亦是一大難題。為提升讀者對圖書館的信任程度,在對讀者入館行為、座位利用行為、借閱行為等個人敏感信息進行匯總、采集、處理時,必須保護讀者的個人隱私和相關(guān)數(shù)據(jù)[16]。另外,圖書館還應重點考慮讀者數(shù)據(jù)如何公開及開放共享的問題。如學校其他部門需要讀者的相關(guān)數(shù)據(jù)時,如何合理開放,共享標準是什么,也是圖書館必須重視的問題。
隨著圖書館業(yè)務的高度信息化和網(wǎng)絡化,圖書館的工作也從原來的以“資源”為中心向以“服務”為中心轉(zhuǎn)變。圖書館服務的轉(zhuǎn)型與提升,需要開展精準化、智能化的服務,以滿足現(xiàn)代讀者多樣化與個性化的需求。圖書館應積極開展讀者行為數(shù)據(jù)的分析和挖掘,同時加強與其他部門合作開發(fā),實現(xiàn)數(shù)據(jù)和技術(shù)的共享,以有效利用讀者行為數(shù)據(jù)的價值,讓圖書館服務更便捷、更具人性化,不斷提升圖書館運營水平。
[參考文獻]
[1]肖力,陳鋼.讀者行為論(下)[J].圖書與情報,1986(4):50-54.
[2]盧榮遠.讀者行為規(guī)律初探[J].圖書館理論與實踐,1988(1):15-19.
[3]田稷.基于OLAP的Web日志處理與讀者行為分析[J].情報雜志,2002(7):42-44.
[4]王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書館讀者行為分析[J].現(xiàn)代圖書情報技術(shù),2006(11):51-54.
[5]張文華.基于讀者行為特征的數(shù)據(jù)挖掘?qū)嵗齕J].圖書館雜志,2009,28(12):55-58.
[6]賴劍菲,江舟.基于WLAN的圖書館讀者行為采集分析平臺框架研究[J].圖書情報工作,2015,59(10):67-71.
[7]陳臣.圖書館個性化智慧服務體系的構(gòu)建[J].圖書館建設(shè),2014(11):37-40.
[8]王玉林,曾詠梅.圖書館大數(shù)據(jù)功能實現(xiàn)的障礙與對策研究[J].情報理論與實踐,2015,38(7):48-51.
[9]王芙蓉.大數(shù)據(jù)環(huán)境下基于讀者決策的圖書館文獻資源采購模型研究[J].圖書館學研究,2017(12):54-59.
[10]吳蛟鵬.大數(shù)據(jù)時代圖書館讀者行為分析及應用[J].圖書館研究,2017,47(2):108-111.
[11]張宏.我國高校圖書館大數(shù)據(jù)研究現(xiàn)狀分析[J].圖書館工作與研究,2016(7):46-50
[12]百度百科:大數(shù)據(jù)[EB/OL].[2017-01-09].http://baike.baidu.com/item/大數(shù)據(jù)/1356941
[13]徐璟,陳嘉懿.圖書館數(shù)據(jù)統(tǒng)計和分析的優(yōu)化解決方案研究[J].圖書館雜志,2014(6):54.
[14]尹秀波.基于館藏結(jié)構(gòu)分析和文獻利用統(tǒng)計的館藏文獻資源質(zhì)量評價研究[J].情報科學,2011(4):588-591.
[15]薛巖.美國圖書館用戶大數(shù)據(jù)項目實踐及思考[J].圖書館工作與研究,2017(1):54.
[16]陳臣.大數(shù)據(jù)時代一種基于用戶行為分析的圖書館個性化智慧服務模式[J].圖書館理論與實踐,2015(2):96-99.