臧國全 牟佩 韓璟瑤
(鄭州大學(xué)信息管理系,河南 鄭州 450001)
CALIS認為,“學(xué)科導(dǎo)航是以學(xué)科為單元對因特網(wǎng)的相關(guān)學(xué)術(shù)資源進行搜集、評價、分類、組織和有序化整理,并對其進行簡要的內(nèi)容揭示,建立分類目錄式資源組織體系、動態(tài)鏈接、學(xué)科資源數(shù)據(jù)庫和檢索平臺,發(fā)布于網(wǎng)上,為用戶提供網(wǎng)絡(luò)學(xué)科信息資源導(dǎo)引和檢索線索的導(dǎo)航系統(tǒng)”[1]。由此可見,構(gòu)建“圖書情報學(xué)”學(xué)科導(dǎo)航的主要目的是將分散在因特網(wǎng)上圖書情報學(xué)科的學(xué)術(shù)信息資源加以集中,并進行有序化處理,方便本學(xué)科用戶快速全面地獲取所需信息資源,了解本學(xué)科研究前沿領(lǐng)域和發(fā)展動態(tài),實現(xiàn)信息共享。
國外方面,最早的圖書情報學(xué)科導(dǎo)航出現(xiàn)在1996年的歐洲D(zhuǎn)ESIRE一期工程中,該工程將“圖書情報學(xué)”作為選題之一,收集整理并集中展示歐盟范圍內(nèi)圖書情報教育培訓(xùn)機構(gòu)、有關(guān)該學(xué)科的學(xué)會協(xié)會以及各種學(xué)術(shù)會議。之后,有代表性的有四:①萬維網(wǎng)虛擬圖書館中的“Information and Libraries”選題[2],該選題是目前為止圖書情報學(xué)界影響最大、搜集網(wǎng)絡(luò)資源最全、用戶最多的導(dǎo)航型虛擬圖書館,但最大的缺憾是以外文信息(尤其是英文)為主體,中文信息資源甚少;②公共圖書館網(wǎng)站中的“圖書館”網(wǎng)絡(luò)導(dǎo)航,該類導(dǎo)航搜集的資源大多是各類圖書館的主頁、信息鏈接的列表以及公共領(lǐng)域的信息服務(wù)項目,甚至還包括有關(guān)圖書館使用的商業(yè)軟件、多媒體資料、電子期刊和圖書等,但這類導(dǎo)航的最大不足是收錄的學(xué)術(shù)信息資源太少;③高等學(xué)校圖書館網(wǎng)站中的學(xué)科導(dǎo)航,比如,華盛頓大學(xué)圖書館網(wǎng)站中“圖書情報學(xué)”學(xué)科導(dǎo)航[3]設(shè)有 Articles、Books、e -Journals、Dissertations等7個欄目,同時提供與圖書館員對話、評論等功能,但這類導(dǎo)航也僅有英文資源;④圖書情報學(xué)教育機構(gòu)網(wǎng)站中的學(xué)科數(shù)據(jù)庫鏈接入口,例如美國佛羅里達州立大學(xué)信息學(xué)院網(wǎng)站中設(shè)置的圖書情報學(xué)有關(guān)的數(shù)據(jù)庫鏈接(如books in print、ACM digital library 等鏈接),但這類鏈接要實現(xiàn)真正訪問數(shù)據(jù)庫,還必須通過注冊等方式。
國內(nèi)方面,學(xué)科導(dǎo)航的研制始于1999年,目前為止,學(xué)科導(dǎo)航的系統(tǒng)化建設(shè)集中在CALIS中心發(fā)起組織的、由眾多高校圖書館參加立項實施的各個學(xué)科領(lǐng)域。針對圖書情報學(xué)科導(dǎo)航,建設(shè)機構(gòu)有三:①高校圖書館,如北京大學(xué)圖書館的新學(xué)科導(dǎo)航數(shù)據(jù)庫中建立了“圖書檔案學(xué)”專題[4](包括圖書館學(xué)、情報學(xué)、檔案學(xué)、信息管理等二級學(xué)科),但收錄的僅為包含有該學(xué)科的數(shù)據(jù)庫入口,而北京大學(xué)圖書館原建的“圖書情報學(xué)網(wǎng)絡(luò)資源導(dǎo)航”已經(jīng)因缺乏維護導(dǎo)致多數(shù)鏈接失效,信息滯后;②高校的相關(guān)院系,如武漢大學(xué)信息管理學(xué)院的圖書情報學(xué)學(xué)科導(dǎo)航[5],該導(dǎo)航較為健全,但信息收錄不全面,有待完善;③公共圖書館,如國家圖書館的圖書館學(xué)信息門戶[6],該網(wǎng)站建設(shè)新穎,標(biāo)簽設(shè)置獨特,但資源建設(shè)有待豐富。
由上可知,目前國內(nèi)外“圖書情報學(xué)”學(xué)科導(dǎo)航建設(shè)的主力軍是圖書館等信息機構(gòu)和圖書情報教育機構(gòu),并且已經(jīng)初具規(guī)模,被廣大用戶使用。但是,也存在一些問題,主要表現(xiàn)在信息資源收錄不完整,要么是語種方面,要么是類型方面,要么僅為數(shù)據(jù)庫的鏈接。因此,從滿足用戶需求角度,探討建立一個比較完整的圖書情報學(xué)科導(dǎo)航是非常必要的。
圖書情報學(xué)科網(wǎng)絡(luò)資源的數(shù)量很難進行精確統(tǒng)計,筆者通過國內(nèi)外幾個常用的搜索引擎進行了調(diào)查(見表1)。雖然通過搜索引擎進行檢索調(diào)查還存在不足,調(diào)查可能不全面,但表1數(shù)據(jù)至少可以表明,圖書情報學(xué)網(wǎng)上信息資源已經(jīng)初具規(guī)模。因此,從信息資源保障角度,構(gòu)建圖書情報學(xué)科導(dǎo)航是完全可行的。
表1 因特網(wǎng)上圖書情報學(xué)信息資源檢索結(jié)果(檢索日期為2012年2月21日)
2.1.1 利用網(wǎng)站直接訪問
這種方式分為兩種:①網(wǎng)站直接訪問,通過平時收藏或者友情鏈接等訪問瀏覽特定網(wǎng)頁來獲得所需信息,例如在查找圖書情報專業(yè)電子期刊時,可以直接登錄中國知網(wǎng)(http://www.cnki.net/),進入“中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫_特刊”,點擊“文獻分類目錄”——“信息技術(shù)”——“圖書情報與數(shù)字圖書館”,就可以找到相關(guān)期刊。②通過圖書情報學(xué)專業(yè)網(wǎng)站訪問,屬于此類的網(wǎng)站主要有:e線圖情、中國圖情網(wǎng)、圖書情報學(xué)科信息門戶等。
利用網(wǎng)站直接訪問方式具有查找目的性突出、內(nèi)容針對性強、檢索結(jié)果準(zhǔn)確度高、質(zhì)量有保障等優(yōu)點。但這種方法的檢索范圍十分有限,覆蓋面小,難以實現(xiàn)學(xué)科導(dǎo)航建設(shè)所要求的“盡可能全面收集相關(guān)網(wǎng)絡(luò)信息”目標(biāo)。
2.1.2 通過搜索工具進行檢索
搜索工具的檢索方式有二:分類檢索和關(guān)鍵詞檢索。前者的一個示例是,在Yahoo的主題目錄下點擊“l(fā)ibrary and information science”類目,之后在這一類目下又細分為Education(42)、Events(4)等,其中每類后面括號注明的是站點數(shù)。后者的一個示例是,搜索引擎幾乎都提供關(guān)鍵詞檢索功能。
通過搜索工具進行檢索的方式操作簡單,運用多個檢索工具能達到較高的覆蓋率,有利于實現(xiàn)學(xué)科導(dǎo)航建設(shè)的目的。但是,這種方法的最大缺憾是檢索結(jié)果的信息質(zhì)量參差不齊,且一般命中文獻的數(shù)量非常龐大,給內(nèi)容篩選和甄別帶來很大困難。
鑒于上述兩種方法的優(yōu)缺點,在建立“圖書情報學(xué)“學(xué)科導(dǎo)航時,綜合采用了直接訪問和搜索工具兩種方式進行相關(guān)信息資源的收集。
2.2.1 信息篩選
信息的篩選是將搜集來的信息進行去重、質(zhì)量控制、URL的有效性甄別等操作,目的在于獲得高質(zhì)量的網(wǎng)絡(luò)信息資源。信息搜集來源于多個渠道,從不同渠道中獲得的信息資源勢必存在重復(fù)現(xiàn)象,根據(jù)我們的實踐,這種重復(fù)現(xiàn)象很嚴(yán)重,所以必須去掉重復(fù)的網(wǎng)頁網(wǎng)站。由于因特網(wǎng)上信息資源質(zhì)量參差不齊,在出版發(fā)布之前幾乎沒有一個類似傳統(tǒng)信息資源的質(zhì)量控制過程,所以,對于去重處理后的網(wǎng)頁網(wǎng)站必須進行人工質(zhì)量鑒定,去除質(zhì)量低下的,保留質(zhì)量高的。由于因特網(wǎng)是一個動態(tài)網(wǎng)絡(luò),網(wǎng)頁網(wǎng)站隨時都有可能更新和刪除,所以必須對收集的URL進行有效性鑒別,去除無效的URL,保留有效的URL。
2.2.2 信息著錄
信息的著錄是對收集的網(wǎng)絡(luò)信息資源進行內(nèi)容描述和格式描述。我們建立的學(xué)科導(dǎo)航對收集的每件信息資源的著錄項目包括:網(wǎng)頁網(wǎng)站的標(biāo)題、網(wǎng)址、內(nèi)容簡介、關(guān)鍵詞、國別及站點的類型。其中:
(1)標(biāo)題,是用戶選擇瀏覽網(wǎng)頁網(wǎng)站的主要判斷依據(jù)。
(2)網(wǎng)址,是用戶瀏覽原始網(wǎng)頁網(wǎng)站的鏈接入口,對于由于鏡像等原因?qū)е孪嗤W(wǎng)頁網(wǎng)站產(chǎn)生多于一個網(wǎng)址的,采取同時著錄方式,各網(wǎng)址間用一定的分隔符隔開,這樣可以方便用戶選擇。
(3)內(nèi)容簡介,也是用戶判斷是否需要進一步調(diào)出原始網(wǎng)頁網(wǎng)站進行詳細瀏覽的主要依據(jù)之一,本導(dǎo)航中的內(nèi)容簡介除指明其覆蓋面外,還指明了收錄材料的起始時間、更新周期等。
(4)關(guān)鍵詞,是學(xué)科導(dǎo)航實現(xiàn)詞匯控制的方法,也是向用戶提供關(guān)鍵詞檢索的前提,本導(dǎo)航采用人工關(guān)鍵詞標(biāo)引方式,保證標(biāo)引質(zhì)量,這也是檢索效率要遠遠高于一般搜索引擎的原因。
(5)國別及類型,是網(wǎng)頁網(wǎng)站的來源地區(qū)和類別,為用戶提供國別和類別的輔助選擇檢索之用。
2.2.3 信息組織
信息組織是依據(jù)導(dǎo)航所設(shè)計的分類表對收錄的網(wǎng)頁網(wǎng)站進行歸類的過程。本導(dǎo)航設(shè)計的分類表是一個主題分類表,簡單實用,具體包括下述7個一級類目,每個一級類目又劃分為若干個二級類目:
(1)網(wǎng)絡(luò)電子圖書。這是因特網(wǎng)上一種常見的學(xué)術(shù)信息資源。它具有出版發(fā)行周期短、“修訂”及時、內(nèi)容相對系統(tǒng)全面、成熟可靠等特點。網(wǎng)絡(luò)電子圖書的一般來源有三種:現(xiàn)有紙介質(zhì)圖書數(shù)字化后上網(wǎng)、原有的封裝型電子圖書上網(wǎng)和直接在網(wǎng)上出版發(fā)行的圖書。本類目收錄的圖書按照語種排列,分為中文、英文和其他語種三種,同語種的按照字母順序排列。
(2)網(wǎng)絡(luò)電子期刊。這也是因特網(wǎng)上一種常見的學(xué)術(shù)信息資源。網(wǎng)絡(luò)電子期刊出版周期短,報道速度快,刊載內(nèi)容多,因而成為因特網(wǎng)上學(xué)術(shù)信息的重要來源。網(wǎng)絡(luò)電子期刊大致可分為兩種:(a)傳統(tǒng)期刊的網(wǎng)絡(luò)版。目前世界上大多數(shù)比較著名的印刷型學(xué)術(shù)期刊也通過因特網(wǎng)出版其網(wǎng)絡(luò)版;(b)純網(wǎng)絡(luò)型期刊。因特網(wǎng)上出現(xiàn)了大量的專門在WWW上出版的電子期刊,由于它不出版印刷版,因此通過因特網(wǎng)獲得這類信息成為了唯一的途徑,比如《Digital Library Magazine》[7]。為了用戶瀏覽的方便,本導(dǎo)航將根據(jù)期刊提供內(nèi)容的詳略程度來劃分二級類目,包括提供題錄的期刊、提供文摘的期刊、提供全文的期刊。
(3)高校圖書情報學(xué)院系或?qū)I(yè)。本類目收錄國內(nèi)外所有設(shè)有圖書情報學(xué)專業(yè)的高校網(wǎng)址,并按國家分類。
(4)國際組織與地區(qū)組織。包括從事圖書情報領(lǐng)域的研究機構(gòu)、實驗室、學(xué)術(shù)團體(學(xué)會、協(xié)會等)、相關(guān)產(chǎn)品的推廣機構(gòu)等。本類目收錄的內(nèi)容劃分為國際組織和地區(qū)組織兩部分,其中國際組織按字母順序排列,地區(qū)組織首先按國家,然后按字母順序排列。
(5)圖書館與情報機構(gòu)。本類目收錄的圖書情報機構(gòu)按國家地區(qū)排列,不同國家地區(qū)的按照類型來排列。
(6)學(xué)術(shù)會議。本類目收錄的這類信息可分為兩類,一是學(xué)術(shù)會議通知(包括征文通知),二是學(xué)術(shù)會議論文集。學(xué)術(shù)會議通知的生命周期很短,一旦過期就失去了存在的價值,應(yīng)及時從虛擬圖書館中刪除。會議論文的學(xué)術(shù)性較強,內(nèi)容新穎,往往反映了某一學(xué)術(shù)領(lǐng)域國內(nèi)外的最新發(fā)展?fàn)顟B(tài),是研究人員了解和關(guān)注該領(lǐng)域?qū)W術(shù)研究水平和動向的重要信息來源。
(7)個人主頁。圖書情報學(xué)科已經(jīng)出現(xiàn)了不少著名學(xué)者,其中有些已在因特網(wǎng)上開設(shè)了自己的個人網(wǎng)站,記載聯(lián)系方式、主要的出版著作和論文、主要的研究領(lǐng)域、研究經(jīng)歷等個人簡介和在研項目及進展情況。本類目收錄的內(nèi)容按照國別排列。
本導(dǎo)航系統(tǒng)包含前臺展示頁面與后臺數(shù)據(jù)庫兩個部分。實現(xiàn)過程包括三個步驟:前臺展示頁面的設(shè)計、后臺數(shù)據(jù)庫的設(shè)計以及數(shù)據(jù)庫訪問接口程序的設(shè)計。其中前臺展示頁面截圖見圖1。
圖1 “圖書情報學(xué)”學(xué)科導(dǎo)航前臺展示頁面
本學(xué)科導(dǎo)航系統(tǒng)采用了目前應(yīng)用較為廣泛的ASP技術(shù),生成動態(tài)、高效、易于交互的web網(wǎng)頁和基于web的服務(wù)器應(yīng)用程序。展示頁面采用dreamwaver網(wǎng)頁制作工具,后臺數(shù)據(jù)庫采用SQL server,數(shù)據(jù)庫訪問接口程序包括前臺用戶信息瀏覽、檢索系統(tǒng)和后臺管理維護系統(tǒng)三個部分。前臺展示頁面整體上采用了框架技術(shù),將分類表類目與檢索結(jié)果分開展示,用戶瀏覽簡潔明了。分類表組織采用了層疊式導(dǎo)航方式。
該學(xué)科導(dǎo)航提供六大功能:
(1)提供圖書情報學(xué)網(wǎng)絡(luò)信息資源的整合功能。將分散無序的因特網(wǎng)上的圖書情報學(xué)科信息資源進行有序化組織,便于用戶查詢利用。
(2)提供分類檢索以及檢索結(jié)果分頁瀏覽功能。
(3)提供關(guān)鍵詞檢索與組合檢索,以及檢索結(jié)果分頁瀏覽功能。
(4)提供信息資源快速在線更新(追加、刪除、修改)功能。減少維護成本,提高系統(tǒng)中網(wǎng)絡(luò)信息資源更新的及時性。
(5)提供用戶交互功能。對錯誤的鏈接和“死鏈接”進行修改、編輯或刪除,增添新的網(wǎng)絡(luò)資源,為用戶與系統(tǒng)管理員提供一個交互接口,提高學(xué)科導(dǎo)航系統(tǒng)的質(zhì)量,增加收錄信息資源的完整性與準(zhǔn)確性。
(6)提供檢索結(jié)果的導(dǎo)出功能。對檢索結(jié)果,系統(tǒng)提供了以純文本和超文本兩種格式進行導(dǎo)出的功能,增加了信息內(nèi)容組織加工的靈活性。
無論采用何種搜索方式,想要完全搜集到因特網(wǎng)上所有圖書情報學(xué)信息資源是不可能的,不僅是因為任何一種搜索工具的網(wǎng)頁網(wǎng)站索引率目前都達不到100%(實際上,據(jù)報道,目前搜索工具中網(wǎng)頁網(wǎng)站的最高索引率也只有30%左右),更主要的還是因為目前的搜索工具無法搜索到因特網(wǎng)上的數(shù)據(jù)庫。實際上,因特網(wǎng)上存在大量的數(shù)據(jù)庫,并且絕大多數(shù)是商業(yè)化的(如DIALOG系統(tǒng)[8]包含的所有數(shù)據(jù)庫),這些數(shù)據(jù)庫包含的信息量非常大,甚至不少于網(wǎng)頁網(wǎng)站包含的信息量,學(xué)科導(dǎo)航中怎樣將這些數(shù)據(jù)庫的信息資源收錄進去,將是一個研究課題。
因特網(wǎng)的快速發(fā)展導(dǎo)致網(wǎng)上信息資源更新的速度也愈來愈快,在實現(xiàn)本導(dǎo)航中,我們就遇到了部分早期查找的資源鏈接已經(jīng)失效。因此,如何保證鏈接的有效性是衡量導(dǎo)航建設(shè)質(zhì)量的重要指標(biāo)之一??赡艿慕鉀Q辦法有兩種:一是編制一個程序?qū)崿F(xiàn)自動檢驗鏈接的有效性;二是通過管理人員進行人工周期性地檢查鏈接。
一方面是因為導(dǎo)航研制者使用和熟悉的語種限制,另外一方面可能是因特網(wǎng)的信息鴻溝(又稱數(shù)字鴻溝)所致。但是,只有盡可能全面地收錄各種語言出版或發(fā)布的圖書情報學(xué)科的網(wǎng)絡(luò)信息資源,本學(xué)科導(dǎo)航才有使用價值。這也是本導(dǎo)航建設(shè)重點關(guān)注的地方。
圖書情報學(xué)是一門綜合性學(xué)科,交叉了諸多學(xué)科,比如計算機、管理學(xué)、語言學(xué)、心理學(xué)等,因此,在信息資源收錄范圍方面,的確存在一些模糊之處。我們認為,導(dǎo)航是為用戶使用的,而不是搞學(xué)科范圍界定的,所以全面收錄一切相關(guān)信息資源,包括各類交叉研究的資源,是學(xué)科導(dǎo)航建設(shè)的一項基本規(guī)則。
雖然目前已有不少學(xué)科建立了導(dǎo)航,但到目前為止還沒有一個行業(yè)規(guī)范,包括最基本的收錄信息的類型、分類表的編制原則、著錄事項的選擇原則、元數(shù)據(jù)的配置類型、軟件的功能、界面模板設(shè)計與檢索性能等。規(guī)范的缺失可以使得不同學(xué)科導(dǎo)航建設(shè)各抒己見,各自發(fā)揮,這雖然實現(xiàn)了個性化的理念,但缺乏規(guī)范的建設(shè)質(zhì)量是無法得到保障的。因此,制定學(xué)科導(dǎo)航的建設(shè)規(guī)范應(yīng)該引起業(yè)界的重視。
[1] CALIS.CALIS重點學(xué)科導(dǎo)航庫建設(shè)之元數(shù)據(jù)規(guī)范.[2011 -11 -01].http://wenku.baidu.com/view/c634e36da98271fe910ef941.html.
[2] The www virtual library.Information and Libraries.[2011 -12 -20].http://vlib.org/InformationManagement.
[3] UW.University of Washington.[2012 -01 -09].http://www.washington.edu/.
[4] 北京大學(xué)圖書館.圖書檔案學(xué)學(xué)科導(dǎo)航.[2012-01 - 09].http://www.lib.pku.edu.cn/portal/portal/media-type/html/group/pkuguest/page/new_sub_nvgt_db.psml.
[5] 武漢大學(xué)信息管理學(xué)院.學(xué)科導(dǎo)航.[2012-03-01].http://sim.whu.edu.cn/xuekedaohang/xkdh.php.
[6] 國家圖書館.圖書館學(xué)信息門戶.[2012-01-01].http://navi.nlc.gov.cn/WEB_GT/.
[7] D -Lib magazine.[2012 -02 -19].http://www.dlib.org.
[8] DIALOG.Wlecome to DialogWeb.[2011 -12 -01].http://www. dialogweb. com/servlet/logon?Mode=1.