李玉瓏
【摘 要】在互聯(lián)網(wǎng)時代,圖書館信息資源快速增長,圖書館實現(xiàn)信息化管理成為必然趨勢。數(shù)據(jù)倉庫是一種能夠優(yōu)化圖書館信息資源的技術(shù),能夠為讀者提供更加個性化的服務(wù)。數(shù)據(jù)倉庫在圖書館信息資源中的關(guān)鍵技術(shù)包括聯(lián)機(jī)分析處理技術(shù)與大數(shù)據(jù)挖掘技術(shù),能夠從不同角度、不同層面。不同緯度來實現(xiàn)對圖書館信息資源的高效管理,為讀者提供更加理想的服務(wù)。
【關(guān)鍵詞】數(shù)據(jù)倉庫;圖書館;信息資源
【中圖分類號】G250.73 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1674-0688(2018)07-0154-02
圖書館要為讀者提供更加完善的服務(wù),就需要實現(xiàn)信息資源整合。圖書館信息資源整合是針對分散異構(gòu)信息資源體系,在新信息交換與共享平臺上開發(fā)新的應(yīng)用,從而實現(xiàn)信息資源利用的最大化。圖書館信息資源整合是將分散異構(gòu)的非結(jié)構(gòu)化數(shù)據(jù)、異構(gòu)的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行管理利用,將其集成為不同應(yīng)用系統(tǒng),為所有者提供更加高效的資源管理。而數(shù)據(jù)倉庫技術(shù)則可以為圖書館信息資源整合提供堅實的技術(shù)支持,為優(yōu)化圖書館服務(wù)質(zhì)量、提升圖書館資源利用率提供幫助。
1 數(shù)據(jù)倉庫與圖書館信息資源
1.1 數(shù)據(jù)倉庫
1991年,W.H.Inmon編著的《Building the Data Warehouse》中將數(shù)據(jù)倉庫進(jìn)行了以下定義:一個用于更好支持組織決策分析的,面對需求的、綜合的、穩(wěn)定的,伴隨時間不斷變化更新的數(shù)據(jù)集合,主要用于支持管理決策。數(shù)據(jù)倉庫的特點主要表現(xiàn)在以下幾個方面:第一,數(shù)據(jù)倉庫中的數(shù)據(jù)是有主題的,其是將數(shù)據(jù)在高層次上進(jìn)行歸類后進(jìn)行分析利用。數(shù)據(jù)被儲存在數(shù)據(jù)倉庫前需要進(jìn)行一定的加工處理,將原始數(shù)據(jù)根據(jù)主題來進(jìn)行轉(zhuǎn)變,以貼切主題需求。第二,集成性。數(shù)據(jù)倉庫中的數(shù)據(jù)將分散的不同系統(tǒng)中的數(shù)據(jù)進(jìn)行選擇、轉(zhuǎn)換后進(jìn)入數(shù)據(jù)倉庫,數(shù)據(jù)倉庫中的數(shù)據(jù)是源數(shù)據(jù)的綜合與統(tǒng)一。第三,更新性。數(shù)據(jù)倉庫會伴隨著時間段變化不斷更新數(shù)據(jù)和內(nèi)容,長時間不用數(shù)據(jù)也會被刪除。第四,相對穩(wěn)定性。數(shù)據(jù)倉庫雖然會伴隨著時間的推移更新數(shù)據(jù),但是其卻具有相對穩(wěn)定性。相對穩(wěn)定性主要是供數(shù)據(jù)倉庫決策人做出決策所使用。相關(guān)決策人員可以利用數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)查詢,通常不會對數(shù)據(jù)進(jìn)行修改。當(dāng)某類數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫后會被長時間保留,在一段時間后該數(shù)據(jù)會被相關(guān)規(guī)則轉(zhuǎn)變?yōu)闅v史數(shù)據(jù),從數(shù)據(jù)倉庫轉(zhuǎn)移到存儲設(shè)備中。
1.2 圖書館信息資源
圖書館信息資源整合主要作用體現(xiàn)在以下幾個方面:第一,提供決策支持。在經(jīng)過一系列的信息資源整合后,各類數(shù)據(jù)信息再也不是無邏輯的分散信息,而是通過系統(tǒng)的提取、歸類、轉(zhuǎn)化形成了網(wǎng)絡(luò)型關(guān)系信息。例如,通過綜合報表、定制信息等方式,為圖書館決策提供了全面而精準(zhǔn)的決策依據(jù)。第二,改善當(dāng)前信息系統(tǒng)效能。在經(jīng)過系統(tǒng)的信息資源整合后能夠?qū)崿F(xiàn)工作人員與應(yīng)用系統(tǒng)之間的協(xié)同工作,利用當(dāng)前信息資源,改善數(shù)據(jù)的利用率,為圖書館管理員個性化管理提供充足信息,從而提升了信息系統(tǒng)效能。
2 數(shù)據(jù)倉庫在圖書館信息資源中的運(yùn)用
2.1 圖書館信息資源整合與數(shù)據(jù)倉庫應(yīng)用的必要性
隨著互聯(lián)網(wǎng)時代的來臨及信息技術(shù)的廣泛應(yīng)用,圖書館中的各類信息資源類別在持續(xù)增加。不僅紙質(zhì)文件得到了快速的增加,磁帶、光盤、電子期刊、電子圖書、互聯(lián)網(wǎng)資源、網(wǎng)絡(luò)數(shù)據(jù)等各類媒介的圖書資源也在持續(xù)增加。同時,圖書館收藏的一些傳統(tǒng)文獻(xiàn)也添加了不同輔助信息為讀者提供該服務(wù)。例如,出版商在提供一般文獻(xiàn)的過程中還會適當(dāng)提供相關(guān)題庫信息,為讀者提供更加豐富的服務(wù)。在信息資源建設(shè)方面為了獲得更加顯著的競爭優(yōu)勢,有的圖書出版商推出了各類圖書資源特色服務(wù)項目,如新書推薦系統(tǒng)、教師選書系統(tǒng)等。這些圖書資源特色服務(wù)項目不僅大大提升了圖書館館藏建設(shè),還使得圖書館的電子資源更加豐富。但是在圖書館電子資源的實際應(yīng)用過程中,通常電子信息資源都處于相互獨立的狀態(tài),檢索系統(tǒng)也相對獨立,這給讀者檢索帶來了一定的困難。讀者對圖書館中的數(shù)據(jù)資源分類不熟悉,為了找到既定文獻(xiàn),讀者必須進(jìn)行多次重復(fù)搜索,大大降低了圖書館信息資源使用效率。
基于這一現(xiàn)象,為了使得圖書館更好地服務(wù)讀者,可以將異構(gòu)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行整合,對海量信息進(jìn)行深層次開發(fā),將信息資源進(jìn)行整合,進(jìn)一步強(qiáng)化信息資源組織處理能力。首先,可以利用數(shù)據(jù)倉庫技術(shù),通過多層次、多渠道來進(jìn)行數(shù)據(jù)的收集,將采購歷史數(shù)據(jù)、信息資源流通數(shù)據(jù)等進(jìn)行整理收集,通過計算機(jī)互聯(lián)網(wǎng)分析處理及數(shù)據(jù)挖掘等數(shù)據(jù)倉庫技術(shù),為圖書館信息資源的采購和整理提供更加高效的決策。其次,在數(shù)據(jù)倉庫技術(shù)的基礎(chǔ)上為讀者提供更加便捷、更加快速的檢索服務(wù)。對于讀者來說,圖書館所館藏的資源信息內(nèi)容繁雜、類型眾多,不僅涵蓋了大量的紙質(zhì)書籍,還涵蓋了互聯(lián)網(wǎng)中的海量信息。而數(shù)據(jù)倉庫運(yùn)用聯(lián)機(jī)分析處理技術(shù),直接面向主題,利用圖書館信息檢索服務(wù),根據(jù)用戶的需求直接提供與主題相關(guān)數(shù)據(jù),從而提高信息檢索服務(wù)效率。同時,利用數(shù)據(jù)倉庫技術(shù)還能夠為讀者提供個性化的服務(wù),可以針對讀者的瀏覽歷史記錄進(jìn)行分析,對讀者進(jìn)行類別甄別,為讀者推送感興趣的、潛在的數(shù)據(jù)資源,為讀者提供個性化的服務(wù)。
2.2 數(shù)據(jù)倉庫在圖書館信息資源中的關(guān)鍵技術(shù)
數(shù)據(jù)倉庫在圖書館信息資源中的運(yùn)用涉及多種類型的關(guān)鍵技術(shù),不同技術(shù)可以為圖書館信息資源整合提供不同的幫助。
2.2.1 聯(lián)機(jī)分析處理技術(shù)
聯(lián)機(jī)分析處理技術(shù)是一種軟件技術(shù),能夠使圖書館工作人員快速、多方面地獲取信息,從而達(dá)到深入理解數(shù)據(jù)的目的。獲得的信息數(shù)據(jù)都是從原始數(shù)據(jù)中處理得來的,以用戶最容易理解的形式來體現(xiàn)圖書館經(jīng)營的真實情況。聯(lián)機(jī)分析處理技術(shù)中的絕大多數(shù)策略就是將數(shù)據(jù)進(jìn)行多維存儲,以便進(jìn)行聯(lián)機(jī)分析處理。這類多維數(shù)據(jù)庫主要是沿著不同維度方向來進(jìn)行數(shù)據(jù)產(chǎn)出,能夠讓用戶按照事物發(fā)展的軸線有邏輯地對數(shù)據(jù)進(jìn)行分析。聯(lián)機(jī)分析處理技術(shù)是數(shù)據(jù)分析技術(shù)的一種,其功能特點主要表現(xiàn)在以下幾個方面:第一,快速。用戶對聯(lián)機(jī)分析處理技術(shù)的反應(yīng)速度有較高的需求,通常需要在很短時間內(nèi)做出反應(yīng),滿足用戶需求。第二,可分析性。聯(lián)機(jī)分析處理技術(shù)能夠快速處理與邏輯分析、統(tǒng)計分析相關(guān)的事物。在聯(lián)機(jī)分析處理分析中,用戶不需要進(jìn)行編程就可以重新計算,將其稱為分析的一部分,并以用戶的需求為準(zhǔn)給出相關(guān)報告。第三,多維性。聯(lián)機(jī)分析處理技術(shù)中的多維性十分關(guān)鍵,能夠提供數(shù)據(jù)分析后的多維視圖及相關(guān)分析,是圖書館利用聯(lián)機(jī)分析處理技術(shù)的核心。第四,信息性。不論數(shù)據(jù)量多么龐大,也不論數(shù)據(jù)存儲在什么地方,聯(lián)機(jī)分析處理技術(shù)都可以快速獲取信息進(jìn)行管理。在圖書館信息資源中,聯(lián)機(jī)分析處理技術(shù)的運(yùn)用方式主要包括3種,分別為切片、鉆取及旋轉(zhuǎn)。其中,切片即在多維數(shù)據(jù)結(jié)構(gòu)中根據(jù)用戶的需求進(jìn)行二維切片或三維切塊,以獲得相關(guān)數(shù)據(jù);鉆取即轉(zhuǎn)變數(shù)據(jù)報告方向,例如進(jìn)行行列交換來獲取數(shù)據(jù);旋轉(zhuǎn)就是轉(zhuǎn)變維度層次,通過上鉆取或下鉆取的方式來獲取數(shù)據(jù)。在圖書館信息資源應(yīng)用中可以從時間維度及讀者類型維度2個方向?qū)栝喠窟M(jìn)行切片;也可以從時間維度、讀者類型維度、借出數(shù)據(jù)維度來對借閱量進(jìn)行切塊。整體來說,聯(lián)機(jī)分析處理技術(shù)是數(shù)據(jù)倉庫應(yīng)用在圖書館信息資源中的關(guān)鍵技術(shù)之一,能夠?qū)崿F(xiàn)多維度訪問數(shù)據(jù),多角度分析數(shù)據(jù),往往在圖書館信息資源中與數(shù)據(jù)挖掘技術(shù)一同運(yùn)用。
2.2.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)即從海量數(shù)據(jù)中挖掘獲取有價值的信息,數(shù)據(jù)挖掘技術(shù)能夠?qū)A繑?shù)據(jù)進(jìn)行分析,從而獲取數(shù)據(jù)之間存在的隱藏聯(lián)系,為用戶決策提供依據(jù)。數(shù)據(jù)挖掘技術(shù)綜合運(yùn)用了統(tǒng)計學(xué)、計算機(jī)學(xué)、數(shù)學(xué)等技術(shù),可以通過一系列方法來實現(xiàn)。例如,傳統(tǒng)統(tǒng)計法運(yùn)用數(shù)據(jù)挖掘技術(shù)進(jìn)行抽樣分析,在用戶需求指導(dǎo)下進(jìn)行合理抽樣,在獲得抽樣數(shù)據(jù)后進(jìn)行多元統(tǒng)計分析或統(tǒng)計預(yù)測,利用因子分析、回歸分析、時間序列分析等方法進(jìn)行。對于圖書館來說,數(shù)據(jù)挖掘技術(shù)能夠提高圖書利用率的相關(guān)問題。在讀者所處環(huán)境及圖書價值始終保持不變的情況下,對讀者以往的借閱歷史進(jìn)行挖掘,以判斷讀者未來可能出現(xiàn)的借閱率,挖掘出各類讀者對不同類型圖書的需求,進(jìn)而利用最終挖掘得出的數(shù)據(jù)結(jié)果來引導(dǎo)讀者選擇合適的圖書資料。
3 結(jié)語
圖書館信息資源整合中的數(shù)據(jù)倉庫技術(shù)能夠充分實現(xiàn)信息的挖掘與利用,還能夠與其他應(yīng)用系統(tǒng)一同融合,實現(xiàn)圖書館數(shù)據(jù)庫的拓展。在未來的發(fā)展中,圖書館數(shù)據(jù)倉庫技術(shù)將會成為圖書館信息資源整合、自動信息化發(fā)展的必然趨勢。
參 考 文 獻(xiàn)
[1]韓璐.基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)在高校圖書館管理中的應(yīng)用[J].科學(xué)家,2016(15):77-78.
[2]公立.數(shù)據(jù)倉庫和數(shù)據(jù)聯(lián)邦技術(shù)在信用信息資源存儲和共享上的比較[J].科技創(chuàng)新與應(yīng)用,2017(5):97.
[3]呂欣.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在圖書館決策管理中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2017(6):89.
[責(zé)任編輯:陳澤琦]