摘 要:隨著我國(guó)科技的不斷發(fā)展更新,異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)檢索在電子資源中的應(yīng)用也越來(lái)越普遍,隨著時(shí)代的發(fā)展,異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)檢索功能逐漸的成為了當(dāng)今電子資源進(jìn)行整合的主要技術(shù)。又因?yàn)榫W(wǎng)絡(luò)技術(shù)的飛速發(fā)展,很多信息者都通過(guò)Internet網(wǎng)絡(luò)技術(shù)向廣大用戶提供信息服務(wù),在其中有一部分信息服務(wù)是網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的資源。正因如此,對(duì)異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)檢索的研究是非常重要的,如果能夠?qū)@種熟練的掌握,對(duì)我國(guó)信息資源的檢索有著非常大的幫助。本文首先對(duì)分布數(shù)據(jù)環(huán)境之下的數(shù)據(jù)庫(kù)檢索的情況展開(kāi)了詳細(xì)的介紹,然后對(duì)國(guó)內(nèi)跨庫(kù)檢索技術(shù)和國(guó)外檢索技術(shù)做出了詳細(xì)的研究。
關(guān)鍵詞:異構(gòu)數(shù)據(jù)庫(kù);跨庫(kù)檢索;數(shù)據(jù)庫(kù)連接
中圖分類(lèi)號(hào):TP311.13
電子資源管理建設(shè)的時(shí)候,我國(guó)很多信息資源管理機(jī)構(gòu)已經(jīng)對(duì)電子資源檢索的管理工作逐漸開(kāi)始重視,對(duì)已有的資源進(jìn)行合理的調(diào)整,把不同類(lèi)型、不同結(jié)構(gòu)的資源進(jìn)行合理的分類(lèi),并且把這些資源都放入到統(tǒng)一的平臺(tái)之中,這樣就能夠讓用合理高效的對(duì)資源進(jìn)行檢索[1]。本文主要對(duì)異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)檢索的發(fā)展現(xiàn)狀進(jìn)行有效的研究。
1 分布數(shù)據(jù)環(huán)境之下的數(shù)據(jù)庫(kù)檢索現(xiàn)狀
隨著我國(guó)信息技術(shù)的不斷發(fā)展,在世界上很多信息資源管理中對(duì)信息管理是都采用互聯(lián)網(wǎng)為廣大的信息用戶提供一種網(wǎng)絡(luò)資源檢索的信息服務(wù)。又因?yàn)樘峁┥痰牟淮_定性和多方面性,從而使得數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和數(shù)據(jù)庫(kù)的結(jié)構(gòu)之間的差異越來(lái)越大,從而使得用戶在對(duì)信息進(jìn)行檢索的時(shí)候效率非常低,而且方便程度完全達(dá)不到用戶的需求,這種情況主要表現(xiàn)在以下幾個(gè)方面。
1.1 數(shù)據(jù)庫(kù)的資源不斷增多,導(dǎo)致用戶熟悉數(shù)據(jù)庫(kù)的時(shí)間有所增加。就目前來(lái)說(shuō),很多信息資源服務(wù)管理機(jī)構(gòu),為用戶提供的資源庫(kù)最少都有十多種,甚至有些地方達(dá)到一百多種,用戶在面對(duì)這么多資源庫(kù)的時(shí)候,分不清楚眾多資源庫(kù)的情況,找不到自己所需要的數(shù)據(jù)庫(kù),不知道那個(gè)數(shù)據(jù)庫(kù)是自己所需要的。又因?yàn)槊總€(gè)數(shù)據(jù)庫(kù)對(duì)資源的介紹不一樣,從而使得不同的數(shù)據(jù)庫(kù)有不同的檢索方式,而且有些不一樣的數(shù)據(jù)庫(kù)還有著檢索的入口不同的情況,這樣就使得廣大用戶使用起來(lái)非常麻煩,對(duì)一個(gè)不熟悉數(shù)據(jù)庫(kù)的新客戶來(lái)說(shuō),想要在數(shù)據(jù)庫(kù)中找到自己所需要的資源信息,就猶如大海撈針一樣,不停的重復(fù)的輸入相同的數(shù)據(jù)進(jìn)行檢索,非常的麻煩[2]。
1.2 數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)之間有重復(fù),增加用戶對(duì)信息資源的鑒別時(shí)間。目前很多數(shù)據(jù)庫(kù)的建設(shè)都沒(méi)有進(jìn)行統(tǒng)一的規(guī)劃,數(shù)據(jù)庫(kù)收集的內(nèi)容大部分時(shí)候在對(duì)資源信息進(jìn)行收集的時(shí)候都是由提供商所決定的,每個(gè)不同的數(shù)據(jù)提供商為了提高自己在市場(chǎng)上的影響程度,都采用各種各樣的手段把自身的數(shù)據(jù)庫(kù)做大、做全,從各個(gè)數(shù)據(jù)庫(kù)中引進(jìn)自己沒(méi)有的資源信息,這樣就在很大程度上增加了數(shù)據(jù)資源的重復(fù)率,讓眾多數(shù)據(jù)資源在各個(gè)數(shù)據(jù)庫(kù)之間不斷交叉,時(shí)間一久就很容易造成數(shù)據(jù)資源比較混亂,增加用戶尋找資源信息的難度。用戶在尋找資源信息的時(shí)候,因?yàn)槭艿劫Y源年限的影響,用戶想要找到自己所需要的資源,就必須要同時(shí)對(duì)多個(gè)數(shù)據(jù)庫(kù)進(jìn)行查找,但是因?yàn)閿?shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)之間存在交叉的關(guān)系,所以用在尋找的時(shí)候就一定要花大量的時(shí)間去排除,所以會(huì)增加用戶對(duì)信息資源的鑒別時(shí)間。
1.3 數(shù)據(jù)庫(kù)的知識(shí)之間關(guān)聯(lián)度比較低,使用戶在知識(shí)銜接的方面提高了難度。在當(dāng)前,人類(lèi)發(fā)現(xiàn)和研究出來(lái)的眾多知識(shí),從理論上說(shuō)是一個(gè)聯(lián)系比較緊密的整體,但是因?yàn)槟壳氨姸鄶?shù)據(jù)庫(kù)的獨(dú)立存在,沒(méi)有辦法對(duì)科學(xué)知識(shí)之間的聯(lián)系有效的體現(xiàn)出來(lái),這樣很大程度上為用戶制造了麻煩。如果用戶要想把自己尋找的知識(shí)進(jìn)行有效的鏈接,那么用戶就必須在不同的網(wǎng)絡(luò)資源庫(kù)中間進(jìn)行穿梭漫游,很大程度上增加了用戶檢索資料的成本和時(shí)間。
2 國(guó)內(nèi)跨庫(kù)檢索技術(shù)介紹
盡管對(duì)不同的數(shù)據(jù)庫(kù)的檢索的界面和檢索的方法都有所不一樣,但是這些數(shù)據(jù)庫(kù)還是存在聯(lián)系的,例如,每個(gè)不同的數(shù)據(jù)庫(kù)之中的檢索方式、文獻(xiàn)資料的顯示格式等這些基本的功能都具有一般的相似性,大部分情況下這些東西都能夠這些數(shù)據(jù)庫(kù)還是支持布爾檢索方式檢索的,如果把這些數(shù)據(jù)庫(kù)之間相似的東西制成一個(gè)比較統(tǒng)一的數(shù)據(jù)表格,然后再讓其構(gòu)成一個(gè)比較統(tǒng)一的檢索顯示界面,這樣就能夠在很大程度上提高檢索的效率,從而可以進(jìn)一步實(shí)現(xiàn)多個(gè)網(wǎng)絡(luò)資源庫(kù)的檢索技術(shù)共享[3]。這也就是我們常說(shuō)的異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)檢索的主要方式,而這種異構(gòu)數(shù)據(jù)跨庫(kù)檢索主要包括三個(gè)部分。(1)統(tǒng)一的檢索界面。界面的主要功能就是為用戶提供賬戶登錄,從而實(shí)現(xiàn)對(duì)用戶身份進(jìn)行認(rèn)證的功能,資源庫(kù)在接受用戶資源信息檢索要求的時(shí)候,就能夠自動(dòng)允許用戶查看用戶查詢的資料信息,而且用戶還可以根據(jù)自己需要的數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)進(jìn)行合理有效的選擇,比如,對(duì)數(shù)據(jù)的排序以及分類(lèi),用戶可以根據(jù)自己的需要隨意安排。這樣就能夠給用在操作方面提供更好優(yōu)勢(shì),能夠進(jìn)一步幫助用戶找到自身的所需要的信息,提高用戶使用方便度;(2)數(shù)據(jù)處理系統(tǒng)。數(shù)據(jù)處理系統(tǒng)的主要作用就是根據(jù)用戶檢索的要求,對(duì)用戶輸入的關(guān)鍵詞在數(shù)據(jù)庫(kù)內(nèi)進(jìn)行有效的搜索,從而為用戶找到與關(guān)鍵詞相關(guān)的文獻(xiàn)資料,通過(guò)中間件的形式為用戶進(jìn)一步處理,其中包括對(duì)檢索資源進(jìn)行合并、重新排列順序以對(duì)資源信息進(jìn)行取出重復(fù)處理,然后按照用戶的要求為其呈現(xiàn)資料信息;(3)中間件。中間件是一個(gè)構(gòu)建網(wǎng)站分布應(yīng)用系統(tǒng)的主要支持工具,其主要就是解決網(wǎng)絡(luò)分布計(jì)算機(jī)環(huán)境的資源互相共享問(wèn)題,從而是進(jìn)一步使得眾多資源庫(kù)的資源進(jìn)行有效的共享。中間件的主要作用就是根據(jù)讀者的輸入的關(guān)鍵詞,提供不同的數(shù)據(jù)檢索,然后為用戶對(duì)數(shù)據(jù)信息的格式進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換之后,對(duì)數(shù)據(jù)再做進(jìn)一步的處理,從而實(shí)現(xiàn)數(shù)據(jù)庫(kù)之間的鏈接。
3 國(guó)外跨庫(kù)檢索系統(tǒng)介紹
在國(guó)外已經(jīng)有很多公司和商業(yè)機(jī)構(gòu)對(duì)跨庫(kù)檢索的技術(shù)進(jìn)行研發(fā),比如,Webfeat公司的Webfea Prism、Endeavor公司的ENCompass以及清華同方的數(shù)字化圖書(shū)館知識(shí)網(wǎng)絡(luò)服務(wù)共享等等。這些公司在技術(shù)上都有幾個(gè)比較相似的特點(diǎn),而且也有他們獨(dú)具特色的核心技術(shù):(1)研究模塊。這個(gè)模塊可以在用戶搜索資源的時(shí)候?qū)缑孢M(jìn)行有效的統(tǒng)一,從而能夠讓用戶對(duì)資源信息檢索的時(shí)候根據(jù)已經(jīng)排好順序和分好類(lèi)的資源中進(jìn)行選擇。除此之外,用戶還可以對(duì)檢索的界面進(jìn)行合理的定制,用戶可以對(duì)自己需要的資源信息標(biāo)記顏色,并且還可以對(duì)數(shù)據(jù)庫(kù)進(jìn)行有效的介紹,還能夠進(jìn)一步為用戶提供一種幫助文件。從而進(jìn)一步對(duì)檢索的策略進(jìn)行有效的保存,并且為客戶提供定期發(fā)送的服務(wù),這樣能夠讓用戶非常方便的就能夠使用到自己檢索的資源信息;(2)用戶跟蹤模塊。用戶跟蹤模塊是指用戶在檢索完并且獲得了自己所需要的信息之后,信息資源管理中心能夠?qū)τ脩羲璧男畔⑦M(jìn)行有效的記錄,包括用戶登錄的次數(shù)或者推出的次數(shù)和時(shí)間,都能夠通過(guò)用戶跟蹤模塊進(jìn)行有效的跟蹤,如果需要也可以用word或者excel的形式表現(xiàn)出來(lái),這樣就能夠在很大程度上方便用戶認(rèn)證管理的合理使用,從而進(jìn)一步方便管理者對(duì)數(shù)據(jù)庫(kù)進(jìn)行有效的管理,還可以產(chǎn)生有效的數(shù)據(jù)庫(kù)使用詳細(xì)報(bào)告。
4 結(jié)束語(yǔ)
隨著科技信息的不斷發(fā)展,網(wǎng)絡(luò)技術(shù)也在很大程度上得到了更新,目前資源管理中心機(jī)構(gòu)對(duì)實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)信息檢索的研究興趣非常大,很多地方都成立了專(zhuān)門(mén)的跨庫(kù)信息檢索的小組,主要表現(xiàn)在國(guó)外眾多的圖書(shū)館中,甚至有些圖書(shū)館已經(jīng)實(shí)現(xiàn)了異構(gòu)數(shù)據(jù)庫(kù)的檢索功能。相對(duì)于國(guó)外來(lái)說(shuō),我國(guó)目前要想對(duì)異構(gòu)數(shù)據(jù)庫(kù)跨庫(kù)檢索進(jìn)行實(shí)現(xiàn),首先要解決國(guó)內(nèi)數(shù)據(jù)庫(kù)的兼容性問(wèn)題,然后通過(guò)對(duì)國(guó)外技術(shù)的借鑒,資源信息管理結(jié)構(gòu)從各個(gè)方面和IT行業(yè)進(jìn)行合作,這樣就有可能開(kāi)發(fā)出我國(guó)的跨庫(kù)信息檢索系統(tǒng),從而提高我國(guó)信息檢索的方便程度。
參考文獻(xiàn):
[1]李廣建,張志雄.國(guó)外跨庫(kù)檢索系統(tǒng)研究項(xiàng)目及其特點(diǎn)[J].情報(bào)理論與實(shí)踐,2010(04):444-447.
[2]馬文峰.基于知識(shí)組織理論之上的數(shù)字資源整合[J].情報(bào)資料工作,2011(01):26-28.
[3]姜愛(ài)蓉.分布異構(gòu)資源整合管理系統(tǒng)的技術(shù)特點(diǎn)和應(yīng)用趨勢(shì)[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2009(01):1-7.
作者簡(jiǎn)介:王衛(wèi)鋒(1978-),男,河南襄城人,碩士,主要研究方向:軟件工程、數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘。
作者單位:新鄉(xiāng)學(xué)院 計(jì)算機(jī)與信息工程學(xué)院,河南新鄉(xiāng) 453003