凌志
摘 要:如何科學(xué)規(guī)劃數(shù)字圖書館的建設(shè)與發(fā)展,實(shí)現(xiàn)技術(shù)、資源、服務(wù)三個數(shù)字圖書館重要因素的效益最大化。成為推動數(shù)字圖書館信息化的要素。通過分析當(dāng)前數(shù)字圖書館信息化的機(jī)遇與挑戰(zhàn),總結(jié)了高職學(xué)院數(shù)字圖書館的構(gòu)成,發(fā)展前景,數(shù)字圖書館的未來趨勢以及數(shù)字圖書館的探索與實(shí)踐。
關(guān)鍵詞:數(shù)字圖書館 信息技術(shù) 信息資源。
中圖分類號:G258.6 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2015)03(a)-0219-02
近年來,為了充分滿足讀者的需要。圖書館通過引入數(shù)字化信息及技術(shù),為讀者搭建一個能夠提供有效服務(wù)的數(shù)字化系統(tǒng)的“數(shù)字圖書館”成為發(fā)展的必然。
1 數(shù)字圖書館的特點(diǎn)及作用
討論數(shù)字圖書館的特點(diǎn)是為了更好地利用數(shù)字圖書館,當(dāng)前數(shù)字圖書館在網(wǎng)絡(luò)環(huán)境下呈現(xiàn)六大特征:信息資源數(shù)字化、信息類容動態(tài)化、信息組織智能化、信息服務(wù)網(wǎng)絡(luò)化、信息利用共享化、信息服務(wù)的知識化。
網(wǎng)絡(luò)化技術(shù)的發(fā)展為數(shù)字圖書館無縫服務(wù)提供了便捷,數(shù)字圖書館可以在任何時間、任何地點(diǎn)、為任何人提供所需要的服務(wù);信息利用共享化。在數(shù)字化和網(wǎng)絡(luò)化的基礎(chǔ)上數(shù)字圖書館的信息利用既體現(xiàn)出跨地域跨行業(yè)的資源無限與服務(wù)無限的特征又體現(xiàn)了跨地域、跨國界的資源共建的協(xié)作化與資源共享的便捷性;信息服務(wù)的知識化。知識服務(wù)是以互聯(lián)網(wǎng)信息進(jìn)行搜索查詢?yōu)榛A(chǔ),為用戶提供有用的信息和知識。
2 高職數(shù)字圖書館框架設(shè)計
階段目標(biāo)(如表1所示)。
3 數(shù)字資源
目前,國內(nèi)外有大大小小的數(shù)據(jù)庫數(shù)百種。數(shù)字圖書館建設(shè)最核心的應(yīng)該就是數(shù)字資源的建設(shè),這是基礎(chǔ)設(shè)施,然后才談得上平臺的應(yīng)用和管理。否則就是平臺再多,也只是空架子,沒有內(nèi)容的平臺是毫無意義的。依據(jù)本校圖書館現(xiàn)有資源構(gòu)建、學(xué)校專業(yè)設(shè)置以及安徽省數(shù)字資源共享平臺的產(chǎn)品結(jié)構(gòu),圖書館需要構(gòu)建以“物流,電子信息,會計,商貿(mào)”四大系為主,其他綜合性資源為輔的資源構(gòu)建?;诖?,數(shù)字圖書館為安徽糧食工程職業(yè)學(xué)院量身打造適合該校圖書館發(fā)展的資源類型。
4 平臺管理系統(tǒng)
門戶內(nèi)容管理平臺圖(如圖1所示)。
5 信息保障
高職數(shù)字圖書館作為開放的公眾文化服務(wù)系統(tǒng),其本身特點(diǎn)就決定了數(shù)據(jù)的城域網(wǎng)內(nèi)傳播是需要極大的安全防范的。隨著用戶的不斷增加,勢必會增大數(shù)據(jù)庫的存取壓力,如果收到病毒侵害,其后果將是非常糟糕的。因而,我們需要在此前就做好充分的信息保障措施,其中最核心的就是信息的使用規(guī)則,在此基礎(chǔ)上才會有安全級別、權(quán)限控制、存貯備份等設(shè)定,才會有搜集、存儲、處理、傳遞、試用、安全防范設(shè)施、網(wǎng)絡(luò)帶寬等相應(yīng)的軟硬件、網(wǎng)絡(luò)等保障。
既然時代賦予了高職數(shù)字圖書館開放式信息傳播的使命,館內(nèi)資源的“開放存取”(Open Access)就是不可避免的了,而且開放存取已經(jīng)逐步發(fā)展成為新形式的學(xué)術(shù)信息交流方式。比較典型的應(yīng)用就是作者之間的原文傳遞,這是P2P的單一方式,最常見的就是個人網(wǎng)站、Blog、郵件、百科等,這些我們無需設(shè)限,也無法設(shè)限。另外,當(dāng)然就是數(shù)字圖書館與版權(quán)所有人(機(jī)構(gòu)或個人)簽訂授權(quán)范圍內(nèi)的著作權(quán)使用協(xié)議,進(jìn)行整庫的共享,這是我們可控的上游資源,我們只要保證數(shù)據(jù)服務(wù)器能夠安全地提供服務(wù)即可。
此外,我們建立高職數(shù)字圖書館信息保障的難度在于,如何保障資源的科學(xué)整合,將無序變?yōu)橛行?,安?nèi)容、格式、時間、復(fù)分多元化信息,以及如何保障不同數(shù)據(jù)庫結(jié)構(gòu)下的資源互通關(guān)聯(lián)。為此,我們擬采用柵格信息技術(shù)保障(Information Assurance of Information Grid),為公眾提供可靠信息共享。當(dāng)然,在這方面的應(yīng)用還遠(yuǎn)遠(yuǎn)不止于此,我們將在行業(yè)數(shù)據(jù)庫檢索系統(tǒng)中提供更為廣闊的應(yīng)用。
所以,關(guān)于信息資源的保障無論從“安全層面”還是“服務(wù)層面”都需要我們擁有專業(yè)的團(tuán)隊來幫助實(shí)現(xiàn)。
6 數(shù)字圖書館工程總體構(gòu)架
數(shù)字圖書館系統(tǒng)總體構(gòu)架分為四層技術(shù)架構(gòu),分別為用戶層、業(yè)務(wù)應(yīng)用層、應(yīng)用支撐層和數(shù)據(jù)層。
(1)用戶層。用戶層主要負(fù)責(zé)與數(shù)字圖書館用戶以及商業(yè)伙伴之間的相互交互。
(2)業(yè)務(wù)應(yīng)用層。業(yè)務(wù)應(yīng)用層構(gòu)成數(shù)字圖書館各類業(yè)務(wù)子系統(tǒng)的基礎(chǔ)部分,應(yīng)用模塊主要包括資源采集與獲取、數(shù)字資源加工、數(shù)字資源組織與管理、信息發(fā)布與服務(wù)。
(3)應(yīng)用支撐層。該層是數(shù)字圖書館平臺體系架構(gòu)的核心層,包括數(shù)字圖書館應(yīng)用系統(tǒng)服務(wù)的整合、資源的整合等類容。
(4)數(shù)據(jù)層。該層主要負(fù)責(zé)數(shù)字資源管理和數(shù)字資源長期保存。
7 基于云計算的數(shù)字圖書館平臺開發(fā)
數(shù)字圖書館平臺框架設(shè)計:
數(shù)字圖書館平臺框架包括:自下往上每層都為上層提供透明的服務(wù),模型數(shù)據(jù)層是為云計算平臺提供相應(yīng)的應(yīng)用接口,表現(xiàn)應(yīng)用層是提供用戶界面和開放的應(yīng)用接口,用戶調(diào)用開放應(yīng)用接口,可以共享平臺的異構(gòu)數(shù)據(jù)集、調(diào)用平臺提供的相關(guān)算法,可便捷地將它們集成到用戶開發(fā)的應(yīng)用系統(tǒng)中去,體現(xiàn)出平臺的共享性與開放性。
(1)模型數(shù)據(jù)層設(shè)計。
模型數(shù)據(jù)層是把底層異構(gòu)數(shù)據(jù)庫中的異構(gòu)數(shù)據(jù)映射到數(shù)字圖書館平臺內(nèi)部功能邏輯調(diào)用的資源對象,提供異構(gòu)數(shù)據(jù)源的算法調(diào)用以及對異構(gòu)數(shù)據(jù)源的管理的開發(fā)應(yīng)用接口,模型數(shù)據(jù)層可作出以下細(xì)化。
①異構(gòu)數(shù)據(jù)庫。②關(guān)系數(shù)據(jù)庫對象映射。③對象集。
(2)控制算法層設(shè)計。
(3)表現(xiàn)應(yīng)用層設(shè)計。
8 數(shù)字圖書館服務(wù)支撐技術(shù)
8.1 網(wǎng)絡(luò)技術(shù)
充分利用網(wǎng)絡(luò)技術(shù)開展數(shù)字圖書館服務(wù),為用戶提供基于網(wǎng)絡(luò)化、信息化的服務(wù)。網(wǎng)絡(luò)技術(shù)是從20世紀(jì)90年代中期發(fā)展起來的新技術(shù),它把互聯(lián)網(wǎng)上分散的資源融為有機(jī)整體,實(shí)現(xiàn)資源的全面共享和有機(jī)協(xié)作,使人們能夠透明地使用資源的整體能力并按需獲取信息。
(1)電子郵件。
有了通達(dá)全球的INTERNET后,人們首先想到的是可以利用它來提供個人之間的通信,而且這種通信應(yīng)能兼具電話的速度和郵政的可靠性等優(yōu)點(diǎn)。這種思路生更發(fā)芽成長起來,最終得到的果實(shí)是E-mail。
(2)WWW。
World Wild Web(通常被稱為WWW)在中文里常被譯為“萬維網(wǎng)”,用戶借助于一個瀏覽器軟件,在地址欄里輸入所要查看的頁面地址(或域名),就可以連接到該地址所指向的WWW服務(wù)器,從中查到所需的圖文信息。
(3)文件傳輸(FTP)。
盡管電子郵件也能夠傳送文件,但它一般用于短信息傳遞。INTERNET提供了FTP(File Transfer Protocol)的文件傳輸應(yīng)用程序,使用戶能發(fā)送或接受非常大的數(shù)據(jù)文件:當(dāng)用戶發(fā)出FTP命令,連接到FTP服務(wù)器后,可以輸入命令顯示服務(wù)器存儲的文件目錄,或從某個目錄拷貝文件,通過網(wǎng)絡(luò)傳遞到自己的計算機(jī)中。
(4)遠(yuǎn)程登錄。
遠(yuǎn)程登錄允許用戶從一臺機(jī)器連接到遠(yuǎn)程的另一臺機(jī)器上,并建立一個交互的登錄連接。
(5)Usnet新聞組。
Usnet新聞是INTERNET上的討論小組或公告牌系統(tǒng)(BBS).Usenet在一套名為新聞組的標(biāo)題下組織討論,用戶可以閱讀別人發(fā)送的新聞或發(fā)表自己的文章。
(6)即時通信。
即時通信(Instant Messaging,簡稱IM)是一個終端服務(wù),允許兩人或多人使用網(wǎng)絡(luò)即時的傳遞文字信息、檔案、語音與視頻交流。
(7)Web2.0技術(shù)。
Web2.0技術(shù)主要包括:博客、RSS、百科全書(Wiki)、網(wǎng)摘、社會性網(wǎng)絡(luò)服務(wù)/社交網(wǎng)站(SNS)、P2P、即時信息(IM)、微博等。
8.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining)是指從大量的數(shù)據(jù)中提取出可信、新穎、有效并能被人們所理解的、潛在的模式規(guī)律或趨勢的高級處理過程它融合了數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)等多個領(lǐng)域的理論和技術(shù),在理論研究領(lǐng)域也被稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)。數(shù)據(jù)挖掘模式一般分為以下幾種類型。
(1)概念或類描述。
概念或類描述通過數(shù)據(jù)特征化及匯總所研究的數(shù)據(jù)、數(shù)據(jù)區(qū)分將目標(biāo)與一個或多個比較類比較、數(shù)據(jù)特征化和比較得到。
(2)關(guān)聯(lián)分析。
關(guān)聯(lián)分析的目的就是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。
(3)序列模式分析。
序列模式分析和關(guān)聯(lián)分析相似,其目的是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后序列關(guān)系。
(4)分類和預(yù)測分析。
假定記錄集合和一組標(biāo)記(TAG),所謂標(biāo)記是指一組具有不同特征的類別,分類分析首先為每個記錄賦予一個標(biāo)記,即按標(biāo)記分類紀(jì)錄,然后檢查這些標(biāo)記的記錄描述出這些記錄的特征。
(5)聚類分析。
與分類分析不同,聚類分析輸入的是一組為分類的記錄,并且這些記錄應(yīng)分成幾類事先也不知道。
(6)孤立點(diǎn)分析。
孤立點(diǎn)分析是一種發(fā)現(xiàn)異常數(shù)據(jù)的方法,數(shù)據(jù)庫中往往包含一些數(shù)據(jù)對象,它們與數(shù)據(jù)的一般行為或模型不一致,這一數(shù)據(jù)對象就是孤立點(diǎn)。
(7)演變分析。
演變分析描述行為隨時間變化的對象的規(guī)律或趨勢,包括時間序列數(shù)據(jù)分析、序列或周期模式匹配等。
9 數(shù)據(jù)倉庫與聯(lián)機(jī)分析處理
(1)數(shù)據(jù)倉庫。
數(shù)據(jù)倉庫就是一個用以更好地支持企業(yè)或組織的決策分析處理的、面向主題的、集成的、不可更新的隨時間不斷變化的數(shù)據(jù)集合。
(2)聯(lián)機(jī)分析處理。
聯(lián)機(jī)分析處理是一種用于組織大型數(shù)據(jù)庫和支持商務(wù)智能的技術(shù)。
參考文獻(xiàn)
[1] 魏大威.數(shù)字圖書館的科學(xué)規(guī)劃與發(fā)展探析——國家數(shù)字圖書館的探索與實(shí)踐[J].圖書館理論與實(shí)踐,2013(4):1-4,10.
[2] 李志堯,宋姝.數(shù)字圖書館推廣工程軟件
平臺構(gòu)建[J].國家圖書館學(xué)刊,2012(5):
33-39.
[3] 魏大威.數(shù)字圖書館理論與實(shí)務(wù)[M].北京:北京圖書館出版社,2012:360-362.
[4] 奉國和.數(shù)字圖書館[M].北京:北京大學(xué)出版社,2013:10-15.
[5] 魏大威.數(shù)字圖書館理論與實(shí)務(wù)[M].北京:北京圖書館出版社,2012:381-383.
[6] 奉國和.數(shù)字圖書館[M].北京:北京大學(xué)出版社,2013:148-153.