黃新博
摘要:近年來,數(shù)字圖書館在逐漸發(fā)展中,且數(shù)字圖書館常常為人們提起。那么數(shù)字圖書館就是一個利用數(shù)據(jù)服務(wù)器為讀者提供全面有效信息的平臺。本文首先解釋了數(shù)字圖書館的概念,然后介紹了語義技術(shù)、數(shù)據(jù)聚類技術(shù)、信息分析技術(shù)和檢索技術(shù)在數(shù)字圖書館的應(yīng)用。
關(guān)鍵詞:數(shù)字圖書館;應(yīng)用;研究
一、數(shù)字圖書館的概念
數(shù)字圖書館是利用互聯(lián)網(wǎng)技術(shù),實現(xiàn)跨區(qū)域、跨國家的多個數(shù)字化圖書館之間的有效連接,使讀者在何時、何地都能通過統(tǒng)一的界面來獲取數(shù)字圖書館所提供的信息[1]。數(shù)據(jù)圖書館是應(yīng)用各種平臺的數(shù)據(jù)服務(wù)器,通過虛擬化技術(shù)對這些信息進行整合,并加快應(yīng)用速度,提高可靠性和安全性能。由此可知,數(shù)字圖書館不是單純意義上的一種新型圖書館,而是一個綜合的、全面的系統(tǒng)工程。
二、數(shù)字圖書館的應(yīng)用
信息時代,數(shù)字圖書館技術(shù)在數(shù)據(jù)處理上實現(xiàn)了一個質(zhì)的飛躍,數(shù)據(jù)處理對象從傳統(tǒng)的區(qū)域范圍變成了廣域處理。這些改變不僅對數(shù)字圖書館的開放性服務(wù)產(chǎn)生了極大影響,而且將對整個數(shù)字圖書館的結(jié)構(gòu)組成、知識范圍、應(yīng)用技術(shù)等造成變革。因此,如何在大數(shù)據(jù)時代將數(shù)字圖書館與大數(shù)據(jù)技術(shù)有效的互相融合,是數(shù)字圖書館發(fā)展過程中必須仔細考量的難點。
(一)語義技術(shù)
語義技術(shù)在大數(shù)據(jù)和網(wǎng)絡(luò)數(shù)字化環(huán)境中發(fā)揮著重要作用,該技術(shù)可實現(xiàn)全方位的信息整合將大量的復(fù)雜數(shù)據(jù)進行串聯(lián)。數(shù)字圖書館則要思考的關(guān)鍵是如何將數(shù)字文獻中相關(guān)信息與書本和詞典中的語義進行融合,能夠極大方便讀者理解文獻資料。利用人工處理這些繁雜的數(shù)據(jù)來實現(xiàn)釋義是不現(xiàn)實的,因此需要借助AI與語義分析等技術(shù)對數(shù)據(jù)間的語義關(guān)系進行自動的識別和處理,使其語義連貫完整。語義技術(shù)因其準確反映出所要表達信息的特性,可擴大所收錄資源的知識和來源,進而最大化的增加資源信息之間的共享。
(二)數(shù)據(jù)聚類技術(shù)
聚類是指根據(jù)數(shù)據(jù)的內(nèi)在性質(zhì)將數(shù)據(jù)分為一些類別,每一類別的數(shù)據(jù)盡可能具有相同特性,不同類別的差異盡可能大。聚類分析的目標就是減少研究對象的數(shù)目,分析不同數(shù)據(jù)之間的相似性和差異性,按一定的規(guī)律將數(shù)據(jù)進行合理歸類。
在數(shù)字圖書館中通過對該技術(shù)的運用,人們在圖書館中能夠更加便捷、快速的使用信息的分析和整理服務(wù)。聚類技術(shù)根據(jù)按照數(shù)據(jù)的相似程度劃分類別,因而使數(shù)據(jù)與數(shù)據(jù)之間分割得更加明確,使同一類數(shù)據(jù)的相同性達到最大化,使不同類數(shù)據(jù)的差異性達到最大化。大數(shù)據(jù)時代下充斥著各種各樣的信息,但是海量信息中的可利用數(shù)據(jù)少之又少。聚類分析技術(shù)可以有效的把些有效信息篩選和利用起來,將數(shù)據(jù)資源和信息進行聚類分析可以將其劃分成多個子數(shù)據(jù)集合,這些子數(shù)據(jù)集合即相互關(guān)聯(lián)又存在本質(zhì)區(qū)別,非常適合面向問題需求。方便用戶對所需信息的檢索、選擇和分析。
(三)信息分析技術(shù)
信息分析是通過對社會信息的收集、整理、鑒別、評價、分析、綜合等系列化的加工過程,形成一種新的的信息產(chǎn)品,最終成為一項為大眾人民服務(wù)的具有科研性質(zhì)的智能活動。信息分析技術(shù)應(yīng)該是大數(shù)據(jù)時代的數(shù)字圖書館建立的根本和技術(shù)基石[2]。
(四)檢索技術(shù)
信息檢索是指通過輸入關(guān)鍵詞在一個文檔集合中查閱用戶所需內(nèi)容的方式。目前大多數(shù)數(shù)字圖書館的檢索方式是基于分類主題和關(guān)鍵詞匹配兩種方式來進行用戶所需信息的查詢。信息檢索在數(shù)字圖書館的建設(shè)當(dāng)中已經(jīng)起到重要作用。
在信息檢索中只要輸入關(guān)鍵詞,則系統(tǒng)就可選定范圍內(nèi)進行檢索,并將檢索結(jié)果呈現(xiàn)給用戶。信息檢索技術(shù)能方便得運用于信息的管理中,可以提高管理效率,減輕管理人員的工作量。在石油開采、橋梁修建等大型項目中數(shù)據(jù)十分龐大,運用信息檢索技術(shù)能讓工程師或管理者方便、快捷地查找相關(guān)信息。
此外,考慮到數(shù)字圖書館在使用過程面對的對象,都是普通民眾,對于操作檢索的方式都是自助式檢索。為了達到通俗易懂,簡明扼要的目的,必須把檢索方式設(shè)置成便捷的、通用的的方式,更還要設(shè)置語言語義的模糊搜索,語義匹配搜索等方式,包括硬件上還要考慮到殘疾人、弱勢群體的使用便捷性。
結(jié)束語:
隨著大數(shù)據(jù)時代到來,數(shù)據(jù)逐漸成為這個時代最重要的組成部分。數(shù)字圖書館是以公共服務(wù)為目標的服務(wù)平臺,當(dāng)前數(shù)字圖書館的建設(shè)應(yīng)當(dāng)是以數(shù)字化、信息化為主要任務(wù)。本文首先介紹了數(shù)字圖書館的概念,然后分別介紹了在語義技術(shù)、數(shù)據(jù)聚類技術(shù)、信息分析技術(shù)和檢索技術(shù)四種數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中應(yīng)用。通過本文讓人們開始了解大數(shù)據(jù)時代數(shù)字圖書館的潛在的重要應(yīng)用價值,以改變?nèi)藗儗?shù)據(jù)的看法和認識。同時通過撰寫此篇論文讓我了解了大數(shù)據(jù)時代中數(shù)字圖書館的重要,以及其在數(shù)據(jù)挖掘中的相關(guān)應(yīng)用。
參考文獻:
[1]張興旺,李晨暉.數(shù)字圖書館大數(shù)據(jù)知識服務(wù)體系協(xié)同設(shè)計研究[J].圖書與情報,2015(03):61-70.
[2]陳傳夫,錢鷗,代鈺珠.大數(shù)據(jù)時代的數(shù)字圖書館建設(shè)研究[J].圖書情報工作,2014,58(07):40-45.