圖書館是知識傳播的載體。經(jīng)過多年運(yùn)行,圖書館系統(tǒng)積累了大量原始數(shù)據(jù), 如圖書數(shù)據(jù)以及讀者數(shù)據(jù)等。在信息化時代,圖書館可以運(yùn)用大數(shù)據(jù)技術(shù)對現(xiàn)有數(shù)據(jù)進(jìn)行分析, 以掌握讀者的閱讀行為習(xí)慣和規(guī)律, 進(jìn)而改進(jìn)工作, 推動圖書館事業(yè)高質(zhì)量發(fā)展。
一、大數(shù)據(jù)技術(shù)應(yīng)用在圖書館建設(shè)和管理中的現(xiàn)實(shí)意義
在圖書館建設(shè)和管理過程中, 大數(shù)據(jù)技術(shù)可以對圖書館信息中一些隱藏信息進(jìn)行檢索、提取和應(yīng)用。這既能提升圖書館的管理質(zhì)量,又能針對讀者的借閱信息進(jìn)行系統(tǒng)分析。通過對讀者借閱情況的掌握與挖掘,可以精準(zhǔn)地預(yù)測讀者的閱讀需求,進(jìn)而為讀者提供個性化服務(wù)。
大數(shù)據(jù)技術(shù)在圖書館的廣泛應(yīng)用, 可在一定的程度上推動圖書館服務(wù)功能革新。圖書館每天都有大量的圖書被來回借閱和歸還, 生成的數(shù)據(jù)信息非常之多, 在管理工作中使用數(shù)據(jù)挖掘技術(shù)可以給館內(nèi)借閱工作帶來便利,提高工作效率。
當(dāng)然, 數(shù)據(jù)信息技術(shù)的應(yīng)用也需要滿足一些基本條件,如數(shù)據(jù)庫信息要真實(shí)、有效、全面,應(yīng)當(dāng)是讀者感興趣的信息,必須是有利用價值的信息等。
二、圖書館閱讀行為的類別
(一)讀者的到館行為
讀者為滿足自身的借閱需求, 主動到圖書館后發(fā)生的檢索、借閱等行為是讀者的到館行為。一般情況下,讀者會外借紙質(zhì)圖書,也會主動尋找自己所需圖書,還有的讀者會在圖書館上自習(xí)。部分讀者進(jìn)館是為享受圖書館優(yōu)良的硬件設(shè)施以及安靜的環(huán)境,接受文化熏陶?;谝陨献x者目的,圖書館應(yīng)創(chuàng)新手段吸引讀者主動走進(jìn)圖書館,如舉辦主題類活動、經(jīng)典音樂電影解讀等。除傳統(tǒng)圖書館以外,近些年來還興起了24 小時借閱館和汽車圖書館以及臨時圖書館等,這些館外圖書館也同樣具有借閱文獻(xiàn)的功能,能夠滿足人民群眾的需求。
本文選取某大型公共圖書館作為研究對象,收集一年內(nèi)的進(jìn)出館記錄、借閱記錄、電子資源使用記錄等。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、格式轉(zhuǎn)換和標(biāo)準(zhǔn)化等步驟。從讀者到館行為分析,主要有以下幾點(diǎn):
(1)到館時間分布:根據(jù)進(jìn)出館記錄,可以統(tǒng)計得出讀者每天、每周和每月的到館時間分布。結(jié)果顯示,工作日的高峰時段為18:00-21:00,周末的高峰時段為10:00-14:00 和16:00-20:00。這表明讀者在工作日下班后和周末的休閑時間更傾向于到訪圖書館。
(2)到館頻率分析:統(tǒng)計結(jié)果顯示,每月到訪圖書館1-3 次的讀者占比最大,為45%;其次是4-6次, 占比30%;7 次以上的高頻到訪者占比20%;而首次到訪的新讀者占比5%。
(3)到館目的分析:通過對讀者的借閱記錄和電子資源使用記錄進(jìn)行分析, 發(fā)現(xiàn)65%的讀者主要目的是借閱圖書;20%的讀者使用電子資源;10%的讀者參加圖書館活動;5%的讀者為自習(xí)或休閑。
(4)服務(wù)使用情況:數(shù)據(jù)顯示,自助借還書機(jī)的使用率為75%, 人工服務(wù)窗口的使用率為25%。此外,電子閱覽區(qū)的使用時長平均每人每次為2小時。
(二)讀者的數(shù)字閱讀行為
隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展, 圖書館的形態(tài)已經(jīng)由傳統(tǒng)的物理圖書館轉(zhuǎn)變?yōu)樘摂M圖書館。圖書館的服務(wù)也由傳統(tǒng)的看得見、摸得著的服務(wù)轉(zhuǎn)變?yōu)樘摂M性服務(wù)。讀者可以打破時間和空間限制,隨時隨地登錄圖書館網(wǎng)站, 在數(shù)字圖書館內(nèi)享受所有的數(shù)字資源。在這種模式下,圖書館可以通過數(shù)字系統(tǒng)更精準(zhǔn)掌握讀者的相關(guān)數(shù)據(jù),包括登錄數(shù)據(jù)、瀏覽數(shù)據(jù)、閱讀數(shù)據(jù)等,可以據(jù)此給讀者提供更具個性化的服務(wù)。比如可以根據(jù)讀者閱讀興趣,給讀者推送他們感興趣的書籍,從而提升讀者滿意度。
(三)讀者的交互行為
在信息技術(shù)和計算機(jī)技術(shù)發(fā)展加持下, 圖書館可以主動為讀者提供更個性化服務(wù)。讀者通過微信公眾號等公共平臺給圖書館提出建議, 圖書館對讀者建議歸納總結(jié),然后進(jìn)行響應(yīng)。這種有效交互行為能夠進(jìn)一步優(yōu)化館藏結(jié)構(gòu),進(jìn)而為讀者更好服務(wù)。讀者之間也可發(fā)生互動交往行為。比如,圖書館組織讀書話劇社或者小型閱讀沙龍, 將有相同興趣愛好的讀者組織起來,提供更好服務(wù)。
本文選取某大型公共圖書館作為研究對象,通過圖書館管理系統(tǒng)、社交媒體平臺等渠道收集一年內(nèi)的讀者交互數(shù)據(jù)。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、格式轉(zhuǎn)換和標(biāo)準(zhǔn)化等步驟。在交互行為分析中,主要包含以下幾點(diǎn)。
(1)互動頻率分析:根據(jù)圖書館管理系統(tǒng)記錄的數(shù)據(jù)顯示,讀者之間的互動頻率較高,平均每位讀者每月與其他讀者互動次數(shù)為15 次。其中,通過社交媒體平臺進(jìn)行的互動占比45%, 面對面交流占比55%。
(2)交流內(nèi)容分析:通過對社交媒體平臺上的交流內(nèi)容進(jìn)行分析, 發(fā)現(xiàn)讀者之間的交流主要涉及圖書推薦、閱讀心得分享、學(xué)術(shù)討論等方面。其中,圖書推薦占比最大,為35%,閱讀心得分享占比25%,學(xué)術(shù)討論占比20%,其他交流內(nèi)容占比20%。
(3)活動參與分析:圖書館經(jīng)常舉辦各類活動,如講座、研討會、讀書會等。數(shù)據(jù)顯示,平均每次活動的參與人數(shù)為80人,活動參與率為75%。參與活動的讀者中,有60%的讀者表示通過活動結(jié)識新朋友。
(4)影響因素分析:運(yùn)用回歸分析等方法,探討影響讀者交互行為的因素。結(jié)果表明,讀者的年齡、教育程度、興趣愛好等個人特征以及圖書館提供的社交環(huán)境和活動質(zhì)量對讀者的交互行為具有顯著影響。
三、大數(shù)據(jù)技術(shù)分析圖書館讀者借閱行為的方法
對館內(nèi)的讀者借閱行為進(jìn)行分析是指圖書館獲取多結(jié)構(gòu)的數(shù)據(jù)以后對數(shù)據(jù)信息進(jìn)行融合分析,在關(guān)聯(lián)數(shù)據(jù)模型的構(gòu)建下,分析讀者的借閱行為。圖書館可以從用戶的信息中發(fā)現(xiàn)用戶到訪規(guī)律, 然后對比讀者到館規(guī)律和館內(nèi)服務(wù)政策, 找準(zhǔn)服務(wù)中存在的問題,對服務(wù)方式進(jìn)行改進(jìn)。
在數(shù)據(jù)挖掘技術(shù)下分析讀者的借閱行為, 需要運(yùn)用語義分析技術(shù)、信息感知技術(shù)、圖文轉(zhuǎn)換技術(shù)以及GIS技術(shù),分三步對數(shù)據(jù)進(jìn)行處理,分別是數(shù)據(jù)采集、摸索規(guī)律、規(guī)律養(yǎng)成。圖書館完成相關(guān)分析后以公眾能夠接受的方式表達(dá)出來。
數(shù)據(jù)收集需要用到的工具主要有chukka、sci(be、flume 等,而對數(shù)據(jù)進(jìn)行挖掘需要運(yùn)用的算法主要有packager、art、K-ea, 再用互聯(lián)網(wǎng)統(tǒng)計工具對數(shù)據(jù)進(jìn)行處理。一般從數(shù)據(jù)預(yù)處理開始,經(jīng)過降噪數(shù)據(jù)、篩選數(shù)據(jù)、轉(zhuǎn)換數(shù)據(jù),直到合成數(shù)據(jù)。預(yù)處理數(shù)據(jù)和降噪數(shù)據(jù)既要挑選有價值的數(shù)據(jù), 也要對部分?jǐn)?shù)據(jù)進(jìn)行修補(bǔ)。篩選數(shù)據(jù)和轉(zhuǎn)換數(shù)據(jù)應(yīng)當(dāng)在相關(guān)規(guī)則下進(jìn)行,通過數(shù)據(jù)間的關(guān)系,將具有內(nèi)在聯(lián)系的數(shù)據(jù)組提取出來,從而挑選出有價值的信息。
四、圖書館應(yīng)用大數(shù)據(jù)技術(shù)為讀者提供服務(wù)的策略
數(shù)據(jù)挖掘技術(shù)能夠?qū)︷^內(nèi)讀者的借閱信息進(jìn)行分析和處理, 還能按照統(tǒng)計出來的借閱信息分析讀者的借閱需求以及圖書館館藏情況。
在具體操作上, 首先要對讀者的借閱信息進(jìn)行檢索,將檢索信息和現(xiàn)有讀者的閱讀數(shù)據(jù)進(jìn)行對比,過濾無用信息, 按照固定的時間段對讀者的閱讀行為進(jìn)行統(tǒng)計,然后再進(jìn)行具體分析。對閱讀信息顯示的圖書進(jìn)行分類處理。對圖書借閱分類的時候可使用統(tǒng)計的方法, 將T 類圖書按照二級類目進(jìn)行分類, 然后將非T 類圖書按照一級類目進(jìn)行分類,在分類結(jié)束以后, 數(shù)據(jù)挖掘技術(shù)可以自動地將不同類別的圖書借閱量和借閱圖書的比例統(tǒng)計出來, 還可將不同類別圖書借閱量和圖書館的館藏比例計算出來。
讀者數(shù)據(jù)采集完成后, 圖書館會對讀者的行為信息進(jìn)行存儲,然后在適當(dāng)?shù)臅r候進(jìn)行分析,進(jìn)而采取有效措施提高圖書館的服務(wù)質(zhì)量和效率。
首先, 圖書館在服務(wù)管理中可以有效運(yùn)用這些數(shù)據(jù)分析讀者閱讀行為,為其制定適合的閱讀清單,讀者自己就能實(shí)時掌握自己的借閱情況, 還可以了解自己的借閱偏好和借閱頻率等。此外,讀者還能及時接收圖書館推送的相關(guān)信息。圖書館將閱讀報告推送給讀者具有多種形式。除移動圖書館、讀者自由活動空間以外,還可以借助電子郵件。讀者也可以通過媒體來分享,比如微博號和微信公眾號等。每個季度和年度, 圖書館還可以給讀者推送總結(jié)性閱讀報告。該報告不僅能反映借閱圖書的頻率,還能反映出平均借閱率最高的圖書, 達(dá)到為讀者推薦好書的效果。此外,圖書館可以按照讀者年齡分度情況進(jìn)行系統(tǒng)統(tǒng)計,然后將其反映在閱讀清單上。
其次,要構(gòu)建專業(yè)的數(shù)據(jù)推送系統(tǒng)。圖書館應(yīng)當(dāng)對現(xiàn)有的推送系統(tǒng)進(jìn)行優(yōu)化, 通過數(shù)據(jù)挖掘技術(shù)對讀者群體進(jìn)行分析,將其分解為不同類型,標(biāo)記讀者興趣愛好、閱讀習(xí)慣以及相關(guān)需求等,從而為讀者提供有針對性服務(wù),提高讀者滿意度。
最后, 應(yīng)當(dāng)科學(xué)運(yùn)用數(shù)字顯示墻。信息化條件下,圖書館要努力提升自身競爭力,首先必須加強(qiáng)新興技術(shù)應(yīng)用, 近些年來, 數(shù)顯技術(shù)發(fā)展已經(jīng)逐漸成熟,LEF屏幕和各類的液晶顯示屏廣泛應(yīng)用。圖書館可以在內(nèi)部構(gòu)建數(shù)字顯示墻, 并和圖書館數(shù)據(jù)信息平臺進(jìn)行對接。此外,還可以和微博、微信等結(jié)合起來,這樣,到館人數(shù)、信息公告和新書推薦就能夠在第一時間推薦給讀者。此外,圖書館還可利用自身館建優(yōu)勢給讀者設(shè)置專門的個性化區(qū)域。圖書館可以對借閱歷史進(jìn)行分析,推算出讀者的閱讀模型,讀者通過刷卡在數(shù)據(jù)顯示墻上找尋自己想要的書籍,數(shù)字顯示墻會自動顯示書籍在架情況。這樣,圖書館的管理會更加有條理,讀者到館的體驗(yàn)度會得到提高。
綜上所述,在大數(shù)據(jù)的背景下,對讀者的閱讀行為進(jìn)行分析具有重要的現(xiàn)實(shí)意義。隨著時代的發(fā)展和科學(xué)技術(shù)的進(jìn)步,電子化是圖書館給人們提供文獻(xiàn)服務(wù)的未來趨勢。圖書館要將傳統(tǒng)圖書館中的特色保留下來, 然后給讀者提供更具個性化的服務(wù)。圖書館應(yīng)當(dāng)通過數(shù)據(jù)挖掘進(jìn)一步精準(zhǔn)掌握讀者需求,實(shí)現(xiàn)和讀者的良性互動,在互動中彼此成長,彼此進(jìn)步。
作者單位:甘肅省圖書館