李深
【摘要】數(shù)據(jù)庫(kù)的建設(shè)是數(shù)字圖書館資源建設(shè)的重要內(nèi)容之一。數(shù)據(jù)庫(kù)(database)原本為計(jì)算機(jī)行業(yè)的專業(yè)用語(yǔ),其本質(zhì)就是數(shù)據(jù)的排列與集合,并且該排列與集合可以被查詢和調(diào)取。在數(shù)據(jù)庫(kù)建設(shè)的各種標(biāo)準(zhǔn)的制定中,著錄和標(biāo)引規(guī)則是重中之重,它直接影響圖書館數(shù)據(jù)庫(kù)的質(zhì)量。
【關(guān)鍵詞】圖書館;數(shù)據(jù)庫(kù);問(wèn)題
數(shù)據(jù)庫(kù)的建設(shè)不僅僅是將紙本文獻(xiàn)、音視頻文獻(xiàn)數(shù)字化的過(guò)程,而是要運(yùn)用現(xiàn)代信息技術(shù)對(duì)紙本資源、音視頻資源進(jìn)行加工、處理的過(guò)程,從而實(shí)現(xiàn)從篇名、作者、作者單位、分類、關(guān)鍵詞、日期等多途徑檢索。尤其是全文數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)的建設(shè),既有利于紙本文獻(xiàn)、珍貴圖片、聲音、影視等資料的保存和傳播,也有利于廣大讀者的學(xué)習(xí)與利用。但是目前學(xué)校圖書館自建數(shù)據(jù)庫(kù)的過(guò)程中存在一些不可忽視的問(wèn)題。
一、數(shù)據(jù)庫(kù)建設(shè)缺乏統(tǒng)一的規(guī)劃、分工與合作
學(xué)校圖書館數(shù)據(jù)庫(kù)建設(shè)是一項(xiàng)長(zhǎng)期的系統(tǒng)工程,周期長(zhǎng)、投入大、見(jiàn)效慢。長(zhǎng)期以來(lái),學(xué)校圖書館由于體制及隸屬關(guān)系的原因形成了管理體制上條塊分割,在客觀上為統(tǒng)一分工、合作建設(shè)數(shù)據(jù)庫(kù)增加了難度,再加之閉門造車、急于求成的現(xiàn)象十分嚴(yán)重,形成了各館單獨(dú)建設(shè)專題數(shù)據(jù)庫(kù),并普遍存在結(jié)構(gòu)單一、規(guī)模小、專業(yè)面過(guò)于狹窄、缺乏建庫(kù)規(guī)范和數(shù)據(jù)的錄入標(biāo)準(zhǔn)等問(wèn)題,影響了數(shù)據(jù)庫(kù)的使用效率,產(chǎn)品的市場(chǎng)化、商品化更是無(wú)從談起。
二、數(shù)據(jù)庫(kù)制作的規(guī)范和標(biāo)準(zhǔn)化程度低
標(biāo)引、分編、檢索點(diǎn)選取沒(méi)有嚴(yán)格的質(zhì)量控制,數(shù)據(jù)庫(kù)的建設(shè)各自為政,分別基于不同的系統(tǒng)。低水平的數(shù)據(jù)庫(kù)在本館或小范圍內(nèi)或許能夠使用,一旦上網(wǎng)聯(lián)機(jī)在全球范圍內(nèi)調(diào)用,它們的缺陷立即會(huì)顯露出來(lái),僅不同計(jì)算機(jī)系統(tǒng)的互聯(lián)和數(shù)據(jù)的統(tǒng)一規(guī)范就會(huì)出現(xiàn)很多麻煩,甚至?xí)?yán)重到無(wú)法上網(wǎng)交換成為廢庫(kù)。
三、數(shù)據(jù)庫(kù)在類型上比較單一
中文數(shù)據(jù)庫(kù)居多,外文數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)偏少。單一類型的數(shù)據(jù)庫(kù)只能給用戶檢索提供部分的幫助,不能滿足讀者從多渠道獲取文獻(xiàn)信息的需求,因此只有單一類型數(shù)據(jù)庫(kù)的圖書館是不能令用戶滿意的。
四、學(xué)校圖書館數(shù)據(jù)庫(kù)建設(shè)過(guò)程的方向把握不準(zhǔn)確
館藏文獻(xiàn)數(shù)字化要把數(shù)量如此龐大的印刷型文獻(xiàn)轉(zhuǎn)化為數(shù)字化,不僅任務(wù)十分艱巨,而且數(shù)字化還需要大量的技術(shù)、設(shè)備、人力、資金、文獻(xiàn)作保證。目前,同時(shí)具備上述條件的圖書館不多,中小圖書館就更是鳳毛麟角。因此,學(xué)校圖書館還沒(méi)有能力開(kāi)展大規(guī)模的數(shù)字化工作,只能根據(jù)現(xiàn)有的條件對(duì)部分文獻(xiàn)實(shí)現(xiàn)數(shù)字化,逐步推進(jìn)此項(xiàng)工作。然而,一些部門的決策人錯(cuò)誤地理解“發(fā)展”二字,片面追求數(shù)量,為了擴(kuò)大政績(jī),他們不顧有無(wú)技術(shù)基礎(chǔ)、設(shè)備條件、經(jīng)營(yíng)經(jīng)驗(yàn)與經(jīng)濟(jì)實(shí)力,盲目建庫(kù)。數(shù)量倒是增加了,但原本就相當(dāng)緊張的人力、物力和資金被不斷分散,不僅所建的數(shù)據(jù)庫(kù)質(zhì)量得不到保證,而且影響了學(xué)校圖書館日常工作的正常開(kāi)展,真是有百害而無(wú)一利。
五、重復(fù)采購(gòu),保障率低
學(xué)校圖書館為了克服訂購(gòu)書刊資金的不足,不得不采取??瘔簳?、保品種壓冊(cè)數(shù)、保中文壓外文的辦法,集中在核心期刊、常用書刊的訂購(gòu)上。這種自我滿足、實(shí)用化的原則便產(chǎn)生了你有我有、我無(wú)你無(wú)、重復(fù)率高、保障率低、學(xué)科覆蓋能力低、難以形成有特色的館藏文獻(xiàn)資源,依據(jù)這樣的館藏“文獻(xiàn)資源”所建成的數(shù)據(jù)庫(kù),其質(zhì)量就可想而知了。在網(wǎng)絡(luò)技術(shù)如此發(fā)達(dá)的今天,是完全應(yīng)該避免的。
六、檢索效果未盡如人意
一個(gè)可行的專題數(shù)據(jù)庫(kù)檢索系統(tǒng)應(yīng)是外部特征檢索、主題檢索、分類檢索、全文檢索的綜合應(yīng)用。目前,已經(jīng)建立的專題信息數(shù)據(jù)庫(kù)大多只有外部特征檢索和文本方式的全文檢索兩種檢索途徑。一般的用戶都能快速簡(jiǎn)便地從作者、標(biāo)題、日期、版次等外部特征入手查找資料,但前提是用戶已事先知道要查找的資料所在的日期及其他信息,否則,用戶要想擴(kuò)大或縮小檢索范圍,查全查準(zhǔn)資料,并非易事。數(shù)據(jù)庫(kù)缺乏科學(xué)的、輔助的檢索工具,影響了它的使用效果。
七、數(shù)據(jù)加工存儲(chǔ)的格式眾多
以文本方式存貯的全文檢索,具有占用存儲(chǔ)空間小、不需人工標(biāo)引加工、便于查找文章細(xì)節(jié)、檢索結(jié)果直接可靠、檢索詳盡徹底、使用簡(jiǎn)便易學(xué)等優(yōu)點(diǎn),但在不進(jìn)行任何控制的情況下,文章中的每一個(gè)字、詞均可成為檢索點(diǎn),無(wú)形中加重了檢索方面的負(fù)擔(dān),使每次檢索的文獻(xiàn)量偏多,篩選量過(guò)大,用戶檢索所需時(shí)間長(zhǎng),直接影響了查準(zhǔn)率,造成了檢索噪音。
以圖片方式存儲(chǔ)的全文檢索,必須進(jìn)行耗時(shí)、費(fèi)工的人工標(biāo)引和技術(shù)加工,其標(biāo)引難度很大,對(duì)“原文”內(nèi)容又不能直接地逐字、逐詞進(jìn)行檢索,由于“原文”采用鏈接方式,檢索速度相對(duì)較快,但占用存儲(chǔ)空間大,對(duì)古籍、檔案、照片和含有特殊公式、符號(hào)的科技文獻(xiàn)能進(jìn)行原貌保存。因此要提高查全率、查準(zhǔn)率,就必須提高文獻(xiàn)的標(biāo)引深度和數(shù)據(jù)的加工質(zhì)量。
八、人員素質(zhì)及其知識(shí)結(jié)構(gòu)影響數(shù)據(jù)庫(kù)的開(kāi)發(fā)
在實(shí)際工作中,往往是精通開(kāi)發(fā)數(shù)據(jù)庫(kù)的計(jì)算機(jī)技術(shù)人員一般都不了解數(shù)據(jù)所涵蓋專業(yè)知識(shí),因而造成對(duì)文獻(xiàn)分類標(biāo)引、主題標(biāo)引的質(zhì)量不高,不清楚自己制作的數(shù)據(jù)庫(kù)軟件是否科學(xué)、合理、易學(xué)、實(shí)用。同樣,從事文獻(xiàn)信息標(biāo)引的專業(yè)人員通常都不懂得計(jì)算機(jī)程序編寫及系統(tǒng)設(shè)計(jì)等知識(shí),或是只懂得一些計(jì)算機(jī)的基本操作。因此,常常由于雙方的溝通和知識(shí)結(jié)構(gòu)差異的問(wèn)題,都會(huì)不可避免地、或多或少地影響數(shù)據(jù)庫(kù)的開(kāi)發(fā)進(jìn)程。
【參考文獻(xiàn)】
[1]董焱,劉茲恒.圖書館館藏文獻(xiàn)數(shù)字化:虛擬圖書館信息資源建設(shè)的重要內(nèi)容.圖書情報(bào)工作,2000(7):52~55.