高 蓉
(蘇州工業(yè)園區(qū)圖書館,江蘇 蘇州 215123)
隨著信息技術(shù)的高速發(fā)展,圖書館積累的數(shù)據(jù)急劇增長(zhǎng),如何透過“大數(shù)據(jù)”推動(dòng)服務(wù)創(chuàng)新,提高服務(wù)精準(zhǔn)度,提升館藏利用率成為當(dāng)務(wù)之急,借助新技術(shù),從大量的、復(fù)雜的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中人們事先不知道的、但又是潛在有價(jià)值的信息,建立有效、精準(zhǔn)的分析模型,建立圖書館大數(shù)據(jù)倉庫,實(shí)現(xiàn)圖書館數(shù)據(jù)的總樞紐,具有較強(qiáng)的擴(kuò)展能力,并以松散耦合方式運(yùn)行,建立圖書館知識(shí)服務(wù)與業(yè)務(wù)建設(shè)決策模型及評(píng)估體系、用戶行為價(jià)值挖掘、用戶信息數(shù)據(jù)中心、讀者信用體系模型、信息發(fā)布平臺(tái)等。為圖書采訪館員提供決策分析,為讀者提供個(gè)性化的閱讀推薦服務(wù),提升館藏利用率及讀者興趣度,吸引更多居民閱讀,實(shí)現(xiàn)“為書找讀者,為讀者找書”,提升服務(wù)效能。
大數(shù)據(jù)(Big data),是一個(gè)數(shù)據(jù)集,其特點(diǎn)為容量大、類型多且復(fù)雜、存取速度快、應(yīng)用價(jià)值高,傳統(tǒng)的數(shù)據(jù)處理應(yīng)用軟件完全不足以應(yīng)對(duì)。由于數(shù)據(jù)集非常龐大,所面臨的挑戰(zhàn)包括抓取、存儲(chǔ)、分析、數(shù)據(jù)管理、搜索、共享、傳輸、可視化、查詢、更新和信息隱私等等。大數(shù)據(jù)的價(jià)值在于可以進(jìn)一步用于參考預(yù)測(cè)分析,用戶行為分析,高級(jí)數(shù)據(jù)方法(包括人工智能),而不僅僅停留在數(shù)據(jù)集的大小本身[1]。
“數(shù)據(jù)”是一個(gè)相當(dāng)寬泛、豐富的概念了,不僅僅指?jìng)鹘y(tǒng)的結(jié)構(gòu)化數(shù)據(jù)(如數(shù)值型、數(shù)字型),更包括海量的非結(jié)構(gòu)化數(shù)據(jù)——文本、音頻、視頻,特別是由于傳感器、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等技術(shù)的發(fā)展,諸如人類的肢體動(dòng)作和社會(huì)行為、物體的狀態(tài)和運(yùn)動(dòng)軌跡等都可以作為“數(shù)據(jù)化內(nèi)容”的自動(dòng)化處理分析可以讓機(jī)器有智能、讓人類更智慧[2]。
“分眾閱讀”,是根據(jù)自身服務(wù)環(huán)境,用戶需求,通過數(shù)據(jù)統(tǒng)計(jì)、挖掘和分析,對(duì)目標(biāo)用戶進(jìn)行細(xì)分及分層,基于個(gè)人屬性、行為特征、社會(huì)屬性等,在數(shù)據(jù)庫中將用戶進(jìn)行分組,將圖書館的資源與用戶閱讀興趣進(jìn)行對(duì)比和匹配,為用戶及用戶組提供分眾化的閱讀 服務(wù)[3]。
最核心的目標(biāo),建立讀者細(xì)分的分眾閱讀體系,通過大數(shù)據(jù)挖掘技術(shù),對(duì)讀者閱讀行為進(jìn)行跟蹤及分析,為用戶及用戶群體提供精準(zhǔn)服務(wù)。
意義主要表現(xiàn)為三個(gè)方面,第一,基于大數(shù)據(jù)技術(shù)促進(jìn)圖書館的服務(wù)轉(zhuǎn)型,實(shí)現(xiàn)“分眾閱讀”的精準(zhǔn)服務(wù);第二,用大數(shù)據(jù)串聯(lián)資源與用戶,實(shí)現(xiàn)“為人找書,為書找人”;第三、大數(shù)據(jù)平臺(tái)作為核心,連接新技術(shù)應(yīng)用,包括時(shí)下最熱技術(shù):人工智能,開創(chuàng)智慧型 服務(wù)。
調(diào)研了國(guó)內(nèi)五家圖書館大數(shù)據(jù)實(shí)施現(xiàn)狀,大部分圖書以采購成熟產(chǎn)品來實(shí)現(xiàn)大數(shù)據(jù),成熟產(chǎn)品的利端是不需要再重新做頂層設(shè)計(jì)和建模,采購后直接實(shí)施并使用,不需要花人力再去做開發(fā)工作,但弊端也是明顯的,每個(gè)圖書館的特點(diǎn)和特色不一樣,導(dǎo)致有些需求并未被挖掘,挖掘深度及其效果不一定能體現(xiàn)其價(jià)值。國(guó)家圖書館及上海圖書館以自主開發(fā)為主的形式建設(shè)大數(shù)據(jù)平臺(tái),其中上海圖書館的創(chuàng)新型可視化數(shù)據(jù)服務(wù)與我館想要達(dá)到的效果最為相似,本文作者以上海圖書館為例,介紹上海圖書館的做法,學(xué)習(xí)并借鑒。
上海圖書館在2012年推出一系列創(chuàng)新型可視化數(shù)據(jù)服務(wù),平臺(tái)為自主研發(fā),共分四個(gè)方面:一是讀者年度個(gè)人閱讀帳單;二是年度閱讀報(bào)告;三是流通分析報(bào)告;四是實(shí)時(shí)數(shù)據(jù)展示的應(yīng)用[4]。
讀者年度個(gè)人閱讀帳單,主要側(cè)重“個(gè)性化”分析,以讀者為出發(fā)點(diǎn),來挖掘讀者的閱讀行為軌跡,形成個(gè)性化的內(nèi)容進(jìn)行發(fā)布,發(fā)布的同時(shí),還對(duì)界面進(jìn)行精心設(shè)計(jì),增加趣味性,設(shè)計(jì)與讀者的互動(dòng)環(huán)節(jié),加強(qiáng)用戶粘性。另外宣傳手段上,帳單也是作為一項(xiàng)激勵(lì),只發(fā)給那些借書冊(cè)數(shù)在中位數(shù)以上的讀者。
年度閱讀報(bào)告,通過對(duì)系統(tǒng)數(shù)據(jù)的整體分析,以全數(shù)據(jù)代替抽樣數(shù)據(jù),更全面的反映區(qū)域內(nèi)圖書館用戶的閱讀狀況。
流通分析報(bào)告,聚集圖書館不同的業(yè)務(wù),采用不同的數(shù)據(jù)集合,對(duì)資源建設(shè)情況、服務(wù)效能進(jìn)行總結(jié),為館藏發(fā)展、館藏分布、用戶服務(wù)策略、宣傳推廣提供參考。
實(shí)時(shí)數(shù)據(jù)展示的應(yīng)用,圖書流通量以小時(shí)為單位進(jìn)行分析,以創(chuàng)意展示的形式在展示屏上展示出來,通過給觀眾講故事的形式,吸引讀者。
綜上所述,上海圖書館從個(gè)人閱讀帳單到大屏數(shù)據(jù)展示,充分考慮到用戶粘度,從展示效果、頁面設(shè)計(jì)、宣傳策略、內(nèi)容的趣味性等方面著手,目的是吸引讀者,用數(shù)據(jù)講故事,讓閱讀成為有趣的事情,增加與讀者的互動(dòng)性,用戶的忠誠(chéng)度也越來越高。故在大數(shù)據(jù)閱讀平臺(tái)建設(shè)上,不僅是技術(shù)層面的開發(fā)與建設(shè),還需要考慮軟性服務(wù)因素,包含展示頁面的設(shè)計(jì),數(shù)據(jù)內(nèi)容的趣味性,宣傳策略,還要考慮讀者心理等,技術(shù)與軟性服務(wù)相結(jié)合,才能在大數(shù)據(jù)的服務(wù)效能上體現(xiàn)出價(jià)值。
圖1是根據(jù)館情和需求,設(shè)計(jì)用戶(讀者)閱讀分析平臺(tái)的架構(gòu)層次,分為五個(gè)層級(jí),分別為應(yīng)用層、技術(shù)層、業(yè)務(wù)層、數(shù)據(jù)層和基礎(chǔ)設(shè)施。應(yīng)用層是整個(gè)模型的最頂端,由館藏管理平臺(tái)、采訪驅(qū)動(dòng)平臺(tái)、數(shù)據(jù)發(fā)布系統(tǒng)和用戶系統(tǒng)組成。
圖1 平臺(tái)架構(gòu)(擬)
顧名思義是數(shù)據(jù)的來源,是提供分析所需要數(shù)據(jù)的原始信息,在數(shù)據(jù)源中存儲(chǔ)了所有建立數(shù)據(jù)庫連接的信息。數(shù)據(jù)源包括:用戶數(shù)據(jù)、館藏?cái)?shù)據(jù)、流通數(shù)據(jù)、采訪數(shù)據(jù)、設(shè)備數(shù)據(jù)、網(wǎng)站和移動(dòng)端數(shù)據(jù)、數(shù)字資源閱讀數(shù)據(jù)等。
大數(shù)據(jù)建模的過程不可能一次完成,隨著外部環(huán)境的不斷變化,用戶需求也隨之改變,建立長(zhǎng)期有效的反饋機(jī)制非常重要,及時(shí)預(yù)測(cè)變化,及時(shí)、快速做出調(diào)整對(duì)策。
圖2 建立分析模型流程圖
3.4.1 基于“分眾閱讀”的個(gè)性化服務(wù)推薦
借鑒上海圖書館個(gè)人閱讀帳單、亞馬遜書店消費(fèi)者評(píng)級(jí)分析法及亞馬遜書店的閱讀推薦(網(wǎng)站),采用三個(gè)分析維度來設(shè)計(jì)個(gè)性化服務(wù)推薦模型[5],如下表:
表1 個(gè)性化閱讀推薦分析維度
針對(duì)個(gè)人的閱讀行為來進(jìn)行推薦,實(shí)現(xiàn)同類型圖書推薦、該作者的其他圖書推薦、該出版社的同類型圖書推薦、新書推薦。
通過分析個(gè)人的閱讀行為數(shù)據(jù),與閱讀某類資源的用戶群做比對(duì),可以實(shí)現(xiàn)閱讀該本圖書的用戶還閱讀過的其他圖書的推薦方式。
閱讀推薦在圖書館“書香園區(qū)”APP或微信的“個(gè)人閱讀帳單”中體現(xiàn),未來還會(huì)設(shè)計(jì)并實(shí)現(xiàn)更多的推薦方式(例微信服務(wù)號(hào)推送、短信推送等)。由閱讀推薦可進(jìn)行外延,將圖書館的服務(wù)用相類似的方式把活動(dòng)、講座、展覽等信息推送給讀者。
3.4.2 基于“資源建設(shè)”的服務(wù)決策
圖3 基于大數(shù)據(jù)閱讀平臺(tái)的按需采訪模式
圖書館采訪工作是圖書館一項(xiàng)非常重要的基礎(chǔ)性業(yè)務(wù)工作,我館的采訪工作還停留在傳統(tǒng)的采訪模式上,國(guó)內(nèi)已出現(xiàn)少數(shù)圖書館開展 “你選書我買單”服務(wù),例內(nèi)蒙古圖書館、蘇州圖書館、順德圖書館等,把部分資源采訪的工作轉(zhuǎn)移至最前端(用戶)來完成,也就是需求驅(qū)動(dòng)采購模式,讓用戶在線下書店或線上進(jìn)行選書并完成借閱,圖書館進(jìn)行買單的方式,那么這種方式解決了圖書館與下游終端用戶之前的聯(lián)系,有效提高了館藏利用率。但與上游供應(yīng)商乃至出版發(fā)行機(jī)構(gòu)之間還是傳統(tǒng)的采購模式,采購質(zhì)量、采購預(yù)測(cè)、采購評(píng)估這些問題并未得到有效的解決,本文作者設(shè)計(jì)運(yùn)用大數(shù)據(jù)技術(shù)來有效提高圖書館資源采訪精準(zhǔn)問題。如圖3所示。
根據(jù)這個(gè)圖的內(nèi)容,闡述大數(shù)據(jù)閱讀平臺(tái)處在中間位置,采集各系統(tǒng)的數(shù)據(jù),還需要采集上游供應(yīng)商的出版信息,通過大數(shù)據(jù)平臺(tái)分析處理,為采訪館員提供采購依據(jù),采訪館員制訂采訪方案及策略,大數(shù)據(jù)平臺(tái)定時(shí)或非定時(shí),給采訪館員提供實(shí)時(shí)數(shù)據(jù)分析結(jié)果,根據(jù)用戶需求方向的變化,及時(shí)調(diào)整采訪策略。
從遠(yuǎn)景預(yù)判,大數(shù)據(jù)閱讀分析平臺(tái)不僅可提升采訪精準(zhǔn)度、為用戶提供個(gè)性化閱讀推薦,還可以為出版發(fā)行機(jī)構(gòu)提供用戶最真實(shí)的需求信息,為出版機(jī)構(gòu)出版發(fā)行輸出參考數(shù)據(jù)。建設(shè)大數(shù)據(jù)閱讀平臺(tái),串聯(lián)資源和用戶的同時(shí),還串聯(lián)圖書館與出版行業(yè),聯(lián)成一個(gè)體系運(yùn)作,最終實(shí)現(xiàn)用戶驅(qū)動(dòng)出版,產(chǎn)品為用戶服務(wù)。
3.4.3 基于“服務(wù)數(shù)據(jù)”為基礎(chǔ)的服務(wù)效能評(píng)估
基于大數(shù)據(jù)閱讀平臺(tái)的建設(shè),整合圖書館各類業(yè)務(wù),包括采編業(yè)務(wù)、讀者服務(wù)、參考咨詢、專業(yè)信息服務(wù)、活動(dòng)推廣、講座展覽等,整合圖書館各系統(tǒng),包括圖書管理系統(tǒng)、書香園區(qū)網(wǎng)借投遞平臺(tái)、分館業(yè)務(wù)平臺(tái)、數(shù)字資源(各數(shù)據(jù)庫)、網(wǎng)站、微信、APP等,通過接口調(diào)用數(shù)據(jù)方式,來實(shí)現(xiàn)數(shù)據(jù)采集、處理、挖掘和分析。
強(qiáng)化管理后臺(tái)設(shè)計(jì)與開發(fā),各業(yè)務(wù)模塊根據(jù)特定的格式出具各類業(yè)務(wù)報(bào)告,例館藏建設(shè)分析報(bào)告、流通服務(wù)數(shù)據(jù)報(bào)告,宣傳推廣服務(wù)成效報(bào)告、專業(yè)服務(wù)分析報(bào)告等。定期在網(wǎng)站、展示屏等展示服務(wù) 數(shù)據(jù)[6]。
系統(tǒng)自動(dòng)生成各類報(bào)告后,進(jìn)行二次分析,結(jié)合年度工作計(jì)劃、館藏發(fā)展政策、流通服務(wù)計(jì)劃等,還要結(jié)合熱點(diǎn)信息,為用戶制定個(gè)性化的服務(wù)推廣方案。
3.4.4 數(shù)據(jù)展示
數(shù)據(jù)展示分為兩塊,一塊為個(gè)人閱讀帳單,另一塊為大數(shù)據(jù)展示屏。閱讀帳單數(shù)據(jù)展示,我館已使用成熟產(chǎn)品,推出個(gè)人閱讀帳單,讓用戶了解自己的閱讀情況及閱讀水平。大數(shù)據(jù)展示屏,目前在園區(qū)圖書館已上線,主要展示實(shí)體館的各類數(shù)據(jù)、借閱情況分析數(shù)據(jù)、圖書推薦、活動(dòng)預(yù)告及活動(dòng)效果展示。
文化和旅游部越來越重視文化建設(shè),同時(shí)也越來越重視圖書館的服務(wù)成效,從第六次全國(guó)縣級(jí)以上公共圖書館評(píng)估指標(biāo),不難看出,對(duì)圖書館的服務(wù)效能和新技術(shù)的應(yīng)用越來越重視,這就說明,未來圖書館服務(wù)效能的提升,需要新技術(shù)做為支撐,包括物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等,借助新技術(shù)應(yīng)用,完善公共文化服務(wù)體系,做好頂層設(shè)計(jì),實(shí)現(xiàn)服務(wù)精準(zhǔn)、服務(wù)創(chuàng)新,建設(shè)標(biāo)準(zhǔn)體系,用數(shù)據(jù)說話,提升服務(wù)效能,促進(jìn)圖書館轉(zhuǎn)型發(fā)展。