郭 佳
(河南省少年兒童圖書館,河南 鄭州 450000)
現(xiàn)在的基本情況是,國內(nèi)外學(xué)術(shù)界沒有對大數(shù)據(jù)概念給出統(tǒng)一定義,社會(huì)各行各業(yè)基于自身發(fā)展需要,分別對大數(shù)據(jù)的內(nèi)涵做出了各自解釋。Gartner認(rèn)為大數(shù)據(jù)屬于一類大容量、多樣化的信息資源,需要使用新型處理方式來操作,由此去提升洞察力和決策力。維基百科對大數(shù)據(jù)做出了這樣的定義:大數(shù)據(jù)是指無法在一定時(shí)間內(nèi)利用傳統(tǒng)軟硬件工具、IT技術(shù)對內(nèi)容進(jìn)行獲取、搜集、處理、服務(wù)等的信息流。歸結(jié)來講,我們通常所說的大數(shù)據(jù)指的就是一種類型復(fù)雜的海量數(shù)據(jù)。
一般來說,大數(shù)據(jù)具備以下四項(xiàng)特征:
首先,數(shù)量大。處在大數(shù)據(jù)時(shí)代,數(shù)據(jù)量級(jí)由TB上升至PB和ZB,通過數(shù)次調(diào)查和分析可看出,現(xiàn)在國內(nèi)有>50%的企業(yè)每天生成的數(shù)據(jù)量超過1TB,有10%的企業(yè)每天生成的數(shù)據(jù)量均達(dá)到了10%以上,這其中便涵蓋了圖書館信息資源量。
其次,類型多。大數(shù)據(jù)包含了多元化的數(shù)據(jù)資源,不僅有傳統(tǒng)文本數(shù)據(jù),還囊括了音頻和視頻以及數(shù)據(jù)庫等多類信息資源。處在大數(shù)據(jù)時(shí)代中,可以是同一個(gè)知識(shí)存在于不同數(shù)據(jù)源中,也可以是同一個(gè)數(shù)據(jù)源分別支持一個(gè)以及多個(gè)的知識(shí)、智慧,如此就會(huì)讓大數(shù)據(jù)時(shí)代下數(shù)據(jù)信息分析結(jié)果具備交叉性特點(diǎn)。開發(fā)者在進(jìn)行決策時(shí),需要有意識(shí)的整合該類數(shù)據(jù)源,從而揭示出不同數(shù)據(jù)和不同信息之間的內(nèi)在關(guān)聯(lián)性。
再者,處理速度快。大數(shù)據(jù)的運(yùn)行環(huán)境較為開放,其一,非結(jié)構(gòu)化數(shù)據(jù)增加,數(shù)據(jù)分析處理難度不斷加大;其二,此類數(shù)據(jù)是隨機(jī)動(dòng)態(tài)產(chǎn)生的,同時(shí)也具備著實(shí)時(shí)變化的屬性,要求分析人員快速對其進(jìn)行處理,部分?jǐn)?shù)據(jù)處理時(shí),對實(shí)時(shí)性的要求更高。
最后,高價(jià)值。其實(shí),數(shù)據(jù)資源本身也屬于一種重要的社會(huì)資產(chǎn),通過科技手段進(jìn)行數(shù)據(jù)選擇、數(shù)據(jù)融合、數(shù)據(jù)分析,可從中挖掘到極具價(jià)值的知識(shí)與智慧,之后在此基礎(chǔ)上使之應(yīng)用在生產(chǎn)、生活等領(lǐng)域之中,由此獲取巨大成果以及創(chuàng)造出全新的價(jià)值。
第一,讀者管理。處在新時(shí)期,數(shù)字圖書館建設(shè)務(wù)必要順勢而為、跟緊形勢,借助新媒體技術(shù)去全面了解讀者閱讀需求,由之前的藏書為主的服務(wù)模式轉(zhuǎn)變?yōu)橐宰x者為中心的服務(wù)模式。通過使用大數(shù)據(jù)平臺(tái),圖書館可通過郵件、微博、微信公眾號(hào)等渠道,收集用戶的半結(jié)構(gòu)化數(shù)據(jù)信息,之后通過一系列的分析處理去掌握讀者閱讀需求及動(dòng)態(tài)。還有就是圖書館可通過聚類分析模式去將讀者分類,將讀者劃分為優(yōu)質(zhì)讀者和一般讀者、潛在讀者以及有流失傾向的讀者。譬如分析有流失傾向的讀者群體時(shí),圖書館可通過應(yīng)用大數(shù)據(jù)技術(shù)來收集該類用戶的投訴記錄和借閱情況等,如此一來便可準(zhǔn)確定位該類讀者的閱讀行為以及心理特征等,從而便于圖書館提前擬定挽留方案,更好地融洽館民關(guān)系。
第二,營銷管理。大數(shù)據(jù)時(shí)代背景下,圖書館通過使用大數(shù)據(jù)技術(shù),可以快速、全面的掌握讀者借閱情況和個(gè)人身份以及常用搜索方式等信息,之后通過宏觀分析和全面跟蹤等手段,對不同類型讀者予以歸類處理,這樣就會(huì)方便館員清晰了解不同類型讀者的閱讀習(xí)慣和知識(shí)結(jié)構(gòu)以及具體閱讀需求等,之后在此基礎(chǔ)上便可針對性的制定閱讀服務(wù)方案,突破被動(dòng)營銷、無差別服務(wù)的運(yùn)行困境。圖書館應(yīng)用大數(shù)據(jù)技術(shù)之后,其信息服務(wù)質(zhì)量得到了質(zhì)的提升,還可以在一定程度上提升用戶的滿意度,繼而也就促進(jìn)了圖書館的可持續(xù)發(fā)展。
第一,產(chǎn)品日趨多元。就數(shù)字圖書館來說,若想從根本上提升服務(wù)質(zhì)量和水平,最為行之有效的辦法就是充實(shí)數(shù)字圖書館資源。大數(shù)據(jù)時(shí)代背景下,傳統(tǒng)數(shù)字圖書館產(chǎn)品日趨多元化,不再拘泥于單一化的文獻(xiàn)服務(wù),而是按照廣大讀者的閱讀需求去提供豐富的產(chǎn)品,最為典型的便是教育資源和智能資源等。與此同時(shí),大數(shù)據(jù)分析技術(shù)和多媒體技術(shù)相融,可按照用戶日常閱讀習(xí)慣主動(dòng)為其提供多樣化的科普教育資源和智庫資源等,打造出了舒適化、人性化、智能化的閱讀服務(wù)格局,這對于提升數(shù)字圖書館的影響力和市場競爭力而言,有著巨大的現(xiàn)實(shí)意義。
第二,產(chǎn)品走向高端。大數(shù)據(jù)時(shí)代背景下,未來信息數(shù)據(jù)的處理過程較之前相比變得更為復(fù)雜和繁瑣,但這對于數(shù)字圖書館來說,不失為一種機(jī)遇。若圖書館可以精準(zhǔn)把握且深入挖掘此類特色型資源,掌握自身資源庫建設(shè)中的弊端,針對讀者閱讀習(xí)慣、閱讀現(xiàn)狀等信息予以針對性分析,有效分配現(xiàn)有資源,讓不同層次水平的讀者都能夠從中受益,以達(dá)到強(qiáng)化圖書館信息服務(wù)智能化水平的目標(biāo),創(chuàng)建高端化閱讀產(chǎn)品,讓數(shù)字圖書館和一般化的學(xué)術(shù)資源得到合理區(qū)分,那么圖書館便可得到廣大讀者的支持和認(rèn)可,并且也會(huì)給未來數(shù)字圖書館的發(fā)展帶來無限可能。
第三,服務(wù)智能化。應(yīng)用大數(shù)據(jù)技術(shù)后,未來數(shù)字化圖書館的產(chǎn)品日趨智能化。需要注意的是,處在傳統(tǒng)服務(wù)運(yùn)作模式下,數(shù)字圖書館為讀者提供的服務(wù)略顯僵硬和被動(dòng),讀者閱讀體驗(yàn)不佳。讀者面對著大量資源信息不知從何下手,所以就不能及時(shí)獲取自身所需資源。大數(shù)據(jù)時(shí)代中的數(shù)字圖書館,若是利用大數(shù)據(jù)技術(shù)去了解讀者閱讀習(xí)慣和閱讀行為等信息,為其提供特色化閱讀服務(wù),如此便可最大限度上滿足讀者的閱讀需求,還可為讀者帶來絕佳的閱讀體驗(yàn)。與此同時(shí),數(shù)字圖書館需要充分把握此機(jī)遇,不斷創(chuàng)新資源服務(wù)模式,融洽圖書館和讀者之間的關(guān)系,使人工智能回答和專家在線咨詢服務(wù)模式相融,為廣大讀者提供精細(xì)化、智能化、便捷化的閱讀服務(wù),如此便可在讀者心中建立良好口碑,夯實(shí)受眾群的同時(shí)也可吸引更多人參與閱讀。
第一,更加側(cè)重于數(shù)據(jù)分析。數(shù)字圖書館中保存了很多結(jié)構(gòu)化數(shù)據(jù)和標(biāo)準(zhǔn)化數(shù)據(jù)等資源,隨著網(wǎng)絡(luò)資源建設(shè)路徑的不斷拓寬,日漸滲透至移動(dòng)終端和社交網(wǎng)絡(luò)等媒介中,許多隱藏在用戶行為信息中的相關(guān)非結(jié)構(gòu)化數(shù)據(jù),其資源價(jià)值急需被挖掘。所以說圖書館一定要充分發(fā)揮本體優(yōu)勢,對可信度強(qiáng)、專業(yè)度高、科研借鑒價(jià)值十足的非結(jié)構(gòu)化數(shù)據(jù)予以優(yōu)質(zhì)整合、分析,使這些數(shù)據(jù)資源的經(jīng)濟(jì)性、可利用性不斷提升,之后在此基礎(chǔ)上實(shí)現(xiàn)推動(dòng)知識(shí)結(jié)構(gòu)體系橫向拓展的目標(biāo),由此去滿足廣大人民群眾不斷增長的文化需求。當(dāng)前時(shí)代是大數(shù)據(jù)時(shí)代,數(shù)字圖書館若想從根本上提升服務(wù)質(zhì)量以及資源建設(shè)水平,單純憑借數(shù)據(jù)更新和資源共享以及服務(wù)創(chuàng)新是難以達(dá)到目標(biāo)的,還要注重使用大數(shù)據(jù),對所收集到的讀者信息予以全面分析,挖掘隱含的知識(shí)規(guī)律以及潛在價(jià)值,最終按照分析結(jié)果去適時(shí)調(diào)整數(shù)字圖書館的對外服務(wù)模式。
第二,更加側(cè)重于數(shù)據(jù)挖掘。數(shù)據(jù)挖掘指的就是對已發(fā)現(xiàn)的知識(shí)予以優(yōu)質(zhì)組織和重構(gòu)的一種重要運(yùn)作模式,同時(shí)數(shù)據(jù)挖掘也是任何一種類型的信息分析機(jī)構(gòu)務(wù)必要面對的重大課題項(xiàng)目之一。當(dāng)前時(shí)期,傳統(tǒng)意義上的數(shù)字圖書館,其知識(shí)服務(wù)內(nèi)容依舊拘泥在信息檢索和信息收集以及信息分析等層面,只是簡單的利用數(shù)據(jù)資源信息。雖然說當(dāng)前很多數(shù)字圖書館都采用了云計(jì)算技術(shù),也在朝著人性化、個(gè)性化、結(jié)構(gòu)化的服務(wù)方向邁進(jìn),但也只能是按照讀者結(jié)構(gòu)化數(shù)據(jù)進(jìn)行表面的服務(wù)需求分析和行為習(xí)慣分析。數(shù)字圖書館既是大數(shù)據(jù)技術(shù)的開發(fā)者,同時(shí)也是大數(shù)據(jù)技術(shù)的提供者、使用者、受益者,當(dāng)務(wù)之急就是要積極主動(dòng)地深挖數(shù)據(jù)資源價(jià)值,還要做到從半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)中尋求更多信息,預(yù)測讀者的潛在需求,如此才能不斷創(chuàng)新服務(wù)模式,從容面對各種挑戰(zhàn)。
第三,急需專業(yè)化人才。大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)信息處理分析工作和傳統(tǒng)數(shù)據(jù)信息處理工作存在明顯的不同。傳統(tǒng)數(shù)字圖書館常用方式即為數(shù)據(jù)倉庫和智能分析技術(shù),但卻難以滿足現(xiàn)如今社會(huì)大數(shù)據(jù)技術(shù)的發(fā)展需求。就目前情況來看,因?yàn)榇髷?shù)據(jù)技術(shù)中囊括了人工智能和數(shù)據(jù)管理以及數(shù)學(xué)算法等多項(xiàng)先進(jìn)技術(shù),此時(shí)便對分析人員的綜合能力提出了更為嚴(yán)苛的要求,工作人員不僅要具備較強(qiáng)的業(yè)務(wù)理解能力以及高超的數(shù)據(jù)統(tǒng)計(jì)能力,還要擁有整理大數(shù)據(jù)、組織大數(shù)據(jù)等技能。大數(shù)據(jù)時(shí)代下,很多數(shù)據(jù)均具備著碎片化和非結(jié)構(gòu)化等特點(diǎn),沒有相對固定的模式,并且價(jià)值密度不高,但正因?yàn)榇祟惙墙Y(jié)構(gòu)化數(shù)據(jù)最能體現(xiàn)讀者用戶需求,所以說未來的數(shù)字圖書館建設(shè)中,一定要加強(qiáng)專業(yè)人才的培養(yǎng),全方位、多角度地去挖掘用戶隱性需求,將這些半結(jié)構(gòu)化數(shù)據(jù)和碎片化數(shù)據(jù)徹底轉(zhuǎn)變?yōu)橛杏玫臎Q策支持?jǐn)?shù)據(jù),之后循序漸進(jìn)地強(qiáng)化數(shù)字圖書館的服務(wù)能效。
注重信息資源建設(shè),加強(qiáng)資源儲(chǔ)備。為了能夠適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展需求,數(shù)字圖書館務(wù)必要不斷創(chuàng)新工作思維和理念,強(qiáng)化信息資源服務(wù)水平,要通過加強(qiáng)信息資源建設(shè),不斷豐富圖書館的信息數(shù)字資源儲(chǔ)備。一定要加強(qiáng)館藏文獻(xiàn)資源建設(shè),從而增加文獻(xiàn)資源儲(chǔ)備,還有就是要靈活應(yīng)用時(shí)下先進(jìn)的計(jì)算機(jī)技術(shù)和數(shù)字掃描技術(shù)等,從根本上強(qiáng)化圖書館信息資源的數(shù)字化水平。要打造精品數(shù)據(jù)庫,由此為圖書館查詢資源、利用資源提供便利。與此同時(shí),還應(yīng)該加強(qiáng)館際之間的互動(dòng),和其他圖書館之間緊密聯(lián)系、通力協(xié)作,繼而達(dá)成真正意義上的信息資源共享,助力圖書館不斷查漏補(bǔ)缺,改進(jìn)服務(wù)模式,為廣大讀者提供便捷化、高效化的閱讀服務(wù)。
創(chuàng)新信息集成服務(wù)模式,使信息服務(wù)范圍不斷拓展。為了順應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展需求,數(shù)字圖書館必須要走集成化之路,要按照某個(gè)學(xué)科領(lǐng)域的發(fā)展需求以及受眾閱讀需求,選擇特定信息源予以優(yōu)化整合,收集極具學(xué)術(shù)價(jià)值的圖書資源,為廣大讀者提供檢索服務(wù)和導(dǎo)航服務(wù)。需要注意的是,學(xué)科信息門戶多種多樣,既有主題信息門戶,又有專業(yè)信息門戶,還有跨學(xué)科信息門戶等,數(shù)字圖書館要通過整合此類信息資源,優(yōu)化信息集成服務(wù)模式,如此才能進(jìn)一步的滿足讀者的需求,為廣大人民群眾提供精細(xì)化的數(shù)字資源服務(wù)。
隨著互聯(lián)網(wǎng)信息技術(shù)的迅猛發(fā)展,學(xué)術(shù)資源網(wǎng)絡(luò)建設(shè)程度日漸加深,這就使得傳統(tǒng)數(shù)字圖書館優(yōu)勢得以削弱。處在新形勢背景下,圖書館若想實(shí)現(xiàn)真正意義上的可持續(xù)發(fā)展,當(dāng)務(wù)之急便是要樹立大數(shù)據(jù)思維,憑借現(xiàn)代化的科技優(yōu)勢,循序漸進(jìn)拓地寬本體資源范疇,加強(qiáng)服務(wù)品質(zhì)建設(shè),之后在此基礎(chǔ)上全面滿足讀者的需求,達(dá)到促進(jìn)社會(huì)綜合發(fā)展的終極目標(biāo)。