魯黎
(中共湘西州委黨校,湖南吉首,416000)
大數(shù)據(jù)的顯著特點(diǎn)在于巨量的資料信息,將類(lèi)型復(fù)雜繁瑣、數(shù)量巨多的數(shù)據(jù)信息構(gòu)建成數(shù)據(jù)庫(kù),利用云計(jì)算等信息技術(shù)實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的精準(zhǔn)提煉、分析處理與實(shí)時(shí)共享,其核心作用價(jià)值在于數(shù)據(jù)信息的集成處理與數(shù)據(jù)增值,旨在為日常經(jīng)營(yíng)管理提供有價(jià)值的數(shù)據(jù)服務(wù)。對(duì)于圖書(shū)館而言,大數(shù)據(jù)信息化背景下圖書(shū)館呈現(xiàn)出系統(tǒng)化的發(fā)展特點(diǎn),隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,圖書(shū)館所涉及的巨量數(shù)據(jù)信息資源不斷崛起,引起圖書(shū)館服務(wù)模式的必然轉(zhuǎn)變。為進(jìn)一步推動(dòng)圖書(shū)館信息化服務(wù)的建設(shè)發(fā)展,大數(shù)據(jù)信息技術(shù)的有效應(yīng)用多圍繞“服務(wù)”這一主題來(lái)開(kāi)展,包括平臺(tái)服務(wù)方式、數(shù)據(jù)信息資料的分析處理以及服務(wù)對(duì)象的轉(zhuǎn)變等等,將讀者產(chǎn)生的閱讀行為習(xí)慣轉(zhuǎn)化為數(shù)據(jù)信息,從而不斷強(qiáng)化圖書(shū)館信息化服務(wù)工作,更好地適應(yīng)信息化時(shí)代發(fā)展的需要。
首先表現(xiàn)為數(shù)據(jù)信息的實(shí)時(shí)共享,圖書(shū)館管理終端可充分利用大數(shù)據(jù)信息技術(shù)來(lái)快速精準(zhǔn)的提取讀者的相關(guān)數(shù)據(jù)信息,實(shí)現(xiàn)對(duì)讀者行為習(xí)慣的準(zhǔn)確分析,從而更好地實(shí)施個(gè)性化服務(wù),讀者能夠獲取到所需的有效信息,從而提高數(shù)據(jù)信息的高效使用。同時(shí)利用大數(shù)據(jù)信息技術(shù)能夠不斷拓展圖書(shū)館圖書(shū)資源的采購(gòu)范圍,通過(guò)對(duì)讀者行為習(xí)慣、數(shù)據(jù)信息進(jìn)行分析整合之后來(lái)為讀者采購(gòu)更多所需的圖書(shū)資源,并為國(guó)家科教文化事業(yè)的建設(shè)發(fā)展提供相關(guān)的數(shù)據(jù)信息,借助大數(shù)據(jù)信息的實(shí)時(shí)共享特性來(lái)不斷提升圖書(shū)館信息化服務(wù)水平。
其次表現(xiàn)為數(shù)字化、信息化的資源存儲(chǔ)。利用大數(shù)據(jù)信息技術(shù)構(gòu)建數(shù)字化圖書(shū)館,形成數(shù)據(jù)信息服務(wù)鏈。一方面能夠?qū)⒁恍^藏時(shí)間較久,且借閱率、展覽率不高的文本資料借助信息化平臺(tái)來(lái)向讀者全面生動(dòng)的呈現(xiàn),有利于我國(guó)優(yōu)秀傳統(tǒng)文化的持續(xù)傳播,同時(shí)最大限度的保護(hù)了版權(quán)許可規(guī)定。另一方面對(duì)于日常大量的圖書(shū)資源信息能夠保證安全的、數(shù)字化資源存儲(chǔ),不僅方便信息的檢索提取,還為圖書(shū)館節(jié)省了一定的空間場(chǎng)所[1]。
再次表現(xiàn)為信息交流的交互性和隨意性。傳統(tǒng)圖書(shū)館服務(wù)模式下,圖書(shū)的借閱歸還、口頭咨詢(xún)等多采用面對(duì)面的服務(wù)模式,而大數(shù)據(jù)信息化技術(shù)能夠打破時(shí)間、空間的壁壘,讀者不受空間限制能夠進(jìn)行信息資料的隨時(shí)獲取或者進(jìn)行有關(guān)咨詢(xún),有效簡(jiǎn)化了圖書(shū)資源的借閱手續(xù),通過(guò)借助智能終端設(shè)備就能查閱相關(guān)數(shù)據(jù)資料。
為進(jìn)一步提升圖書(shū)館信息化服務(wù)水平,需要熟練掌握信息服務(wù)技術(shù)的有效應(yīng)用,在此主要介紹與數(shù)據(jù)信息挖掘相關(guān)的技術(shù),方便應(yīng)用于圖書(shū)語(yǔ)音識(shí)別、圖書(shū)采購(gòu)以及移動(dòng)借閱、數(shù)字圖書(shū)館的建設(shè)等方面。首先深度神經(jīng)網(wǎng)絡(luò)是近年來(lái)機(jī)器學(xué)習(xí)深度研究的一個(gè)重要方向,通過(guò)模擬人腦并進(jìn)行分析的形式來(lái)解釋圖像、聲音文本等相關(guān)數(shù)據(jù),利用深度神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)對(duì)圖書(shū)館相關(guān)的資源信息進(jìn)行逐層提取、自動(dòng)化提取,無(wú)需人工手動(dòng)干預(yù),大數(shù)據(jù)與深度神經(jīng)網(wǎng)絡(luò)技術(shù)的結(jié)合為數(shù)字圖書(shū)館的建設(shè)與智能化發(fā)展開(kāi)創(chuàng)了一個(gè)新的方向。利用深度神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)館內(nèi)可視化、音視頻文本等進(jìn)行語(yǔ)音識(shí)別,識(shí)別精讀能夠提升近30%,同時(shí)應(yīng)用于圖書(shū)圖像識(shí)別分類(lèi)能夠大大降低誤差率。除此之外還可應(yīng)用于圖書(shū)館內(nèi)大數(shù)據(jù)信息資源檢索系統(tǒng)以及各類(lèi)信息識(shí)別軟件中。為最大限度地實(shí)現(xiàn)數(shù)據(jù)信息的自動(dòng)過(guò)濾與逐層分類(lèi),需要重點(diǎn)借助信息過(guò)濾技術(shù),首先在于內(nèi)容的過(guò)濾與信息檢索,通過(guò)模擬構(gòu)建讀者感興趣的文本信息模型來(lái)實(shí)現(xiàn)信息檢索與過(guò)濾;其次在于協(xié)作過(guò)濾,憑借信息過(guò)濾技術(shù)能夠依據(jù)最近用戶(hù)感興趣的信息對(duì)其進(jìn)行分析判斷,從而將得出的結(jié)果信息推送給其他用戶(hù),協(xié)作過(guò)濾可充分應(yīng)用于一些較為復(fù)雜多變的概念。最后針對(duì)信息過(guò)濾技術(shù),可應(yīng)用移動(dòng)Agent信息過(guò)濾算法來(lái)智能分析讀者的閱讀喜好,建立相應(yīng)的用戶(hù)信息采集庫(kù),對(duì)于出現(xiàn)的高頻詞、關(guān)鍵詞進(jìn)行過(guò)濾,從而方便管理人員有針對(duì)性的向讀者推送個(gè)性化信息服務(wù)。如下圖通過(guò)數(shù)據(jù)挖掘來(lái)進(jìn)行信息過(guò)濾并構(gòu)建出讀者個(gè)性化模型,實(shí)現(xiàn)圖書(shū)服務(wù)的針對(duì)性、個(gè)性化推薦,極大的提高了圖書(shū)館數(shù)據(jù)信息服務(wù)水平。
圖1 個(gè)性化推薦模型
數(shù)據(jù)資源分析是提升圖書(shū)館信息化服務(wù)質(zhì)量的現(xiàn)實(shí)需求,利用大數(shù)據(jù)信心技術(shù)能夠促使讀物形式、業(yè)務(wù)功能更加多元化,數(shù)據(jù)資源的使用頻率也越來(lái)越高,同時(shí)更多圖書(shū)活動(dòng)也相繼開(kāi)展,這些表現(xiàn)對(duì)于數(shù)據(jù)信息的分析有著極高的要求。隨著館內(nèi)各項(xiàng)數(shù)據(jù)信息資源的擴(kuò)增,想要實(shí)現(xiàn)數(shù)據(jù)資源結(jié)構(gòu)化、半結(jié)構(gòu)化的整合形式相對(duì)困難,因而需要全面加強(qiáng)對(duì)數(shù)據(jù)分析的重視。一方面數(shù)據(jù)分析更符合線上線下讀者的個(gè)性化閱讀需求,通過(guò)手機(jī)終端、郵箱等來(lái)獲取所需的資源信息,避免了讀者從海量的資料中查找自己想要信息的情況。另一方面有助于推動(dòng)正確決策的制定與管理,借助數(shù)據(jù)聚類(lèi)分析挖掘、可視化分析技術(shù)以及數(shù)據(jù)集成等信息技術(shù)來(lái)挖掘并發(fā)現(xiàn)海量數(shù)據(jù)信息之間存在的關(guān)聯(lián),以關(guān)聯(lián)規(guī)律來(lái)分析判斷圖書(shū)館服務(wù)工作發(fā)展趨勢(shì),從而確保發(fā)展決策制定的可行性。如下圖是對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)的交叉同和,有利于運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行資源整合。
圖2 數(shù)據(jù)交叉融合
最主要的在于讀者借閱數(shù)據(jù)的分析,讀者是圖書(shū)館信息化服務(wù)的核心,通過(guò)對(duì)線上線下讀者的借閱數(shù)據(jù)、互聯(lián)網(wǎng)資源訪問(wèn)數(shù)據(jù)以及各項(xiàng)圖書(shū)資源檢索行為習(xí)慣進(jìn)行整合與分析,從而形成讀者特有的行為關(guān)聯(lián)規(guī)律以及興趣偏向,從而與圖書(shū)館服務(wù)改革創(chuàng)新方向結(jié)合,為讀者提供更加準(zhǔn)確的服務(wù)。一是需要從全局發(fā)展角度去看待讀者整體的借閱數(shù)據(jù),包括讀者人均借閱情況、季度借閱情況、借閱總量、借閱分類(lèi)以及讀者借還周期、借閱量的增長(zhǎng)情況等,將這些不同類(lèi)型的借閱指標(biāo)作為讀者借閱情況數(shù)據(jù)分析參數(shù),從各種角度去詳細(xì)看待圖書(shū)館讀者借閱的全部情況,從而有針對(duì)性的采取相應(yīng)的應(yīng)對(duì)措施。二是需要對(duì)圖書(shū)資源采購(gòu)相關(guān)數(shù)據(jù)進(jìn)行分析,當(dāng)前圖書(shū)館圖書(shū)采購(gòu)多以書(shū)商作為主要采購(gòu)渠道,在節(jié)省了采購(gòu)時(shí)間獲得一定便利的同時(shí)也面臨著相應(yīng)的問(wèn)題,圖圖書(shū)采購(gòu)質(zhì)量以及實(shí)際到書(shū)率、館內(nèi)圖書(shū)上架效率等較為欠缺,隨著圖書(shū)館采購(gòu)需要以及圖書(shū)市場(chǎng)的發(fā)展變化,圖書(shū)館圖書(shū)采購(gòu)需要從源頭上加強(qiáng)數(shù)據(jù)分析,從而合理選擇圖書(shū)采購(gòu)類(lèi)型以及采購(gòu)渠道、方式。首先將全國(guó)性新書(shū)目錄、書(shū)商征訂目錄的數(shù)據(jù)信息進(jìn)行比對(duì),有利于圖書(shū)館更準(zhǔn)確的了解采購(gòu)出版的新書(shū)比率,從而合理統(tǒng)計(jì)每年度需要訂購(gòu)的圖書(shū)種類(lèi)、冊(cè)數(shù)以及費(fèi)用比例等相關(guān)信息,同時(shí)圖書(shū)采購(gòu)人員可參考其他圖書(shū)館或者以往的圖書(shū)訂購(gòu)情況作出綜合評(píng)估。其次準(zhǔn)確統(tǒng)計(jì)不同書(shū)商的實(shí)際到書(shū)日期以及已到、未到書(shū)的數(shù)量和具體原因,對(duì)整體到書(shū)率進(jìn)行評(píng)估之后可考慮對(duì)未到書(shū)進(jìn)行催缺或者進(jìn)行換訂購(gòu)。最后對(duì)各書(shū)商相關(guān)信息進(jìn)行綜合評(píng)估,制定不同的評(píng)書(shū)級(jí)別,同時(shí)對(duì)館內(nèi)圖書(shū)從驗(yàn)收到上架的周期進(jìn)行評(píng)估。三是圖書(shū)館館藏?cái)?shù)據(jù)分析,主要指文獻(xiàn)資源、紙本圖書(shū)等資源,通過(guò)對(duì)館藏資源進(jìn)行調(diào)查統(tǒng)計(jì)和量化分析,從而進(jìn)一步提高圖書(shū)館館藏管理質(zhì)量和服務(wù)水平,并借助數(shù)據(jù)分析情況來(lái)優(yōu)化調(diào)整館藏資源結(jié)構(gòu),促進(jìn)紙本、文獻(xiàn)資源的優(yōu)化配置。首先結(jié)合資源的年代日期、語(yǔ)言種類(lèi)以及文獻(xiàn)類(lèi)型等多項(xiàng)指標(biāo)對(duì)館藏資源進(jìn)行調(diào)查統(tǒng)計(jì)與分析評(píng)估,為優(yōu)化館藏結(jié)構(gòu)打下堅(jiān)實(shí)的基礎(chǔ)。其次通過(guò)對(duì)館藏文獻(xiàn)資源年度、種類(lèi)等借閱情況進(jìn)行分析可判斷出館藏實(shí)際利用率,從而依據(jù)館藏發(fā)展趨勢(shì)來(lái)合理剔除部分館藏資料,計(jì)算出實(shí)際的館藏剔除率[4]。
建設(shè)數(shù)字化圖書(shū)館,做好館藏資源數(shù)字化開(kāi)發(fā)工作,理應(yīng)引進(jìn)Web開(kāi)發(fā)技術(shù)、數(shù)據(jù)挖掘技術(shù)和WEBGIS技術(shù)。Web開(kāi)發(fā)技術(shù)起源于1991年,該技術(shù)能準(zhǔn)確監(jiān)測(cè)和收集各種動(dòng)態(tài)信息,為圖書(shū)館搭建更完善的館藏資源開(kāi)發(fā)平臺(tái),同時(shí),也方便管理數(shù)字化書(shū)籍信息。在數(shù)據(jù)挖掘技術(shù)的支撐下,圖書(shū)館內(nèi)部大數(shù)據(jù)存儲(chǔ)平臺(tái)具有良好的兼容功能,因而能保存大量不同種類(lèi)、不同結(jié)構(gòu)的書(shū)籍文化數(shù)據(jù)信息,包括各學(xué)科的電子書(shū)、學(xué)術(shù)文獻(xiàn)、專(zhuān)利項(xiàng)目、圖書(shū)館發(fā)展史與相關(guān)檔案等。而且,大數(shù)據(jù)時(shí)代在實(shí)現(xiàn)信息開(kāi)放與共享的同時(shí)依然能做好隱私安全保護(hù)工作,避免讀者信息泄漏。WEBGIS技術(shù)用于搭建圖書(shū)檔案網(wǎng)絡(luò)管理平臺(tái),能準(zhǔn)確測(cè)繪和采集書(shū)籍資源相關(guān)信息,并對(duì)這些信息進(jìn)行提煉處理、準(zhǔn)確傳輸、分類(lèi)存儲(chǔ)、安全管理、查詢(xún)檢索、客觀分析和應(yīng)用,從而使圖書(shū)檔案管理工作更有效[5]。
其次為進(jìn)一步規(guī)范讀者借閱管理行為,提高精細(xì)化管理水平,有必要?jiǎng)?chuàng)建相應(yīng)的資源數(shù)知識(shí)庫(kù)。一方面對(duì)讀者的借閱行為進(jìn)行規(guī)范管理,最大程度地保證讀者的借閱規(guī)范性和借閱質(zhì)量。另一方面對(duì)借閱管理進(jìn)行精細(xì)劃分,以精細(xì)化管理模式來(lái)促進(jìn)圖書(shū)管理的系統(tǒng)化、規(guī)模化以及組織化,通過(guò)創(chuàng)建數(shù)據(jù)知識(shí)庫(kù)來(lái)加強(qiáng)圖書(shū)精細(xì)化管理的全面落實(shí),為其提供強(qiáng)大的數(shù)據(jù)支撐,包括對(duì)服務(wù)工作的管理目標(biāo)、方向、具體流程以及人員考核評(píng)價(jià)等進(jìn)行精細(xì)化管理,將涉及的所有數(shù)據(jù)信息保存到數(shù)據(jù)知識(shí)庫(kù)中,方便管理人員對(duì)以往相關(guān)數(shù)據(jù)信息進(jìn)行有效提取。
本文通過(guò)對(duì)大數(shù)據(jù)環(huán)境下圖書(shū)館信息化服務(wù)發(fā)展特征進(jìn)行重點(diǎn)分析探討,從而依據(jù)圖書(shū)館館藏管理、讀者服務(wù)以及圖書(shū)采購(gòu)借閱等需要,對(duì)大數(shù)據(jù)技術(shù)系統(tǒng)、數(shù)據(jù)庫(kù)平臺(tái)的搭建以及圖書(shū)館數(shù)據(jù)資源分析進(jìn)行了全方位的闡述說(shuō)明,充分發(fā)揮出大數(shù)據(jù)信息技術(shù)的作用和價(jià)值,在滿足讀者多元化閱讀需求的基礎(chǔ)上形成多元化與個(gè)性化相結(jié)合的服務(wù)模式。