王 琳
(柳州鐵道職業(yè)技術學院,廣西 柳州 545616)
隨著我國計算機水平提升以及211工程落實,高校圖書館掀起了一股自動化檢索的熱潮[1]。隨著這種環(huán)境的推動,幾乎各大高校都進購了自動化檢索系統(tǒng)。但此類系統(tǒng)普遍涉及底層數據庫結構,即傳統(tǒng)關系型數據庫。常見的自動化軟件主要有國外的INNOPAC升級版Milllenium以及國內的MELINETS等。分析一個圖書館自動化軟件的價值,主要可以從以下幾個方面入手,即底層數據庫、系統(tǒng)結構、語言處理、檢索和機制等。
全文檢索數據庫是專業(yè)處理各類海量信息的數據庫管理系統(tǒng)。它的工作原理是以代碼形式對資料內容進行儲存,并與計算機結合進行后續(xù)的檢索查詢和信息處理工作。自改革開放以來,投入市場中運行的數據庫產品逐年增加,但占據市場份額超過90%的鳳毛麟角,大部分產品是關系型和對象關系型。與傳統(tǒng)的數據庫相比較而言,此種數據庫不需要工作人員進行大量的標引工作,而是可以根據用戶輸入的關鍵詞展開多角度的檢索,因此被稱為智能檢索。
與關系數據庫相比,非結構化數據庫檢索機制的優(yōu)勢在于靈活性高。簡單講就是關系數據庫能夠實現的簡單、字段以及組合等檢索形式,非結構化的數據庫也能夠實現。不僅如此,非結構化的數據庫還能實現中英文混合檢索、全文檢索等高級檢索方式,更傾向專業(yè)檢索軟件發(fā)展。當下經常使用的有詞索引和字索引2大類,從字面意思理解就是一類以詞為單位做原始數據進行索引,另一類是以字為原始數據展開索引。2類索引方式優(yōu)勢不同,詞索引的優(yōu)勢在于資料查詢準確,而字索引的優(yōu)勢在于獲得資料全面,同時也有容易產生誤查的缺點。
此外需要注意的是此種智能索引機制在索引前需要依靠分詞系統(tǒng),將整體的索引內容進行分割后才能完成各項內容的分別索引。
數字圖書館是數字資源的最終提供者,由此可見,數字圖書館會購買或開發(fā)多個數據庫資源,但相關的數據庫都不是商家提供的內容,因此,用戶在查詢數據時,需要重復登錄、輸入關鍵詞,造成的影響主要體現在效率低和浪費用戶精力等方面。為解決上述問題,市場上的數據商人,紛紛開發(fā)了異構統(tǒng)一的檢索平臺,即USP。這是一個智能化網絡數據庫檢索平臺,具體功能在于能夠在單一用戶界面上檢索多個異構網絡數據庫,還可以結合檢索結果智能去重,為用戶訪問數據庫提供了更加便利的條件。
為順應時代發(fā)展,大部分全文數據庫還支持普通檢索、高級檢索以及二次檢索等要求。以TPI為例,對比TPI和GOOGLE能夠發(fā)現,TPI在檢索范圍和最終結果兩方面有很強的市場競爭力。
再如TRS的Gateway關系數據庫網關,目前已經可以達到傳統(tǒng)關系型數據庫在全文檢索方面的拓展需求,不僅能自動監(jiān)控數據庫的實時更新狀態(tài),還可以維護系統(tǒng)中的索引信息。某圖書館使用該關系數據網關,其自動化系統(tǒng)當中的書目信息很快實現了整合和統(tǒng)一的檢索功能,且還利用此網關中的站點檢索功能實現了部分信息的本地檢索。
系統(tǒng)個性化特點方面,傳統(tǒng)的關系數據庫隨著各種現代化電子資源增加和網絡資源的不斷發(fā)展,已經形成了資源整合的自動化集成發(fā)展趨勢。簡單講就是能夠為不同級別的用戶提供使用界面,經過一段時間的發(fā)展,現在一次檢索能夠查看全部資源已經實現。例如:Millenium的MAP模塊,其中整合了全部類型的信息資源,且可以在網絡數據資源的基礎上全文檢索。用戶不論身在何處,都能夠應用該模塊檢索到自己需要的資料。
總之,一個軟件的功能和模塊開發(fā),與企業(yè)側重于對用戶需求的研究息息相關[2]。且系統(tǒng)的發(fā)展和優(yōu)化也要注意與圖書館相一致。
多年來數據庫建設的過程當中,隨著類型和數量的增加,數據庫之間關聯和數字資源整合工作的要求不斷復雜化,即便在統(tǒng)一軟件當中建立數據庫,也會由于底層數據結構差異,或數據庫字段名稱不同導致連接不通暢的問題產生。如:某科研成果庫使用的是“題名”,而另一論文庫使用的則是“標題”,在后續(xù)的跨庫連接過程中,就會導致方法步驟復雜化,甚至產生連接失敗的情況。面對此種情況,許多圖書館在建設數據庫的過程中。制定了對多種文獻資料相應的描述和規(guī)范。元數據檢索理念早在數據庫最初的建設過程中就有所提及。如:都柏林核心元數據就是當時提出的概念,其中指出,都柏林元數據集屬于一種跨領域和資料庫的信息資源描述準繩,在該理念當中,信息資源被以“任何具有表示的東西”來定義。
總而言之,不論是數據庫開發(fā)商普遍發(fā)行的單一數據庫,還是處理大型的數據庫,都需要技術人員從根本問題出發(fā),提升跨庫檢索和數據關聯之間的有效性,同時還要在發(fā)展過程中具有前瞻性,即分析未來該行業(yè)發(fā)展趨勢,力求實現真正意義上的資源無阻隔交換。