彭昕星
摘要:通過對數(shù)字圖書館元數(shù)據(jù)和對象數(shù)據(jù)的介紹,提出了856字段在其中所起的作用,對856字段的應用、實現(xiàn)方式作了詳細的介紹。
關鍵詞:數(shù)字圖書館 元數(shù)據(jù) 對象數(shù)據(jù) 856字段
一、傳統(tǒng)圖書館向數(shù)字圖書館的過渡
隨著計算機網(wǎng)絡技術及應用的發(fā)展和普及,讀者獲取信息和交流信息的方式發(fā)生了極大的變化。在數(shù)字化圖書館的構建中,數(shù)據(jù)資源應當包括兩個基本組成部分:元數(shù)據(jù)和對象數(shù)據(jù)。
元數(shù)據(jù)包包含的內容是對原始信息資源(即對象數(shù)據(jù))的描述,其作用是使用數(shù)據(jù)用戶能夠通過檢索對相關原始信息資源進行選擇和定位,并提供調取對象數(shù)據(jù)的手段,例如以ISO2709格式存放的各種文獻信息和非文獻信息。對象數(shù)據(jù)包括印刷文獻的數(shù)字化圖像、各種含有輸出格式控制信息的數(shù)字化文檔、其它圖像、聲音、錄像信息。
二、856字段在元數(shù)據(jù)中的應用
在數(shù)字圖書館中,如何把元數(shù)據(jù)與對象數(shù)據(jù)進行有機的結合呢?其結合點又在哪里呢?我們知道,數(shù)據(jù)格式的標準化是數(shù)據(jù)得以交流和共享的基礎,圖書館所積累的數(shù)據(jù)資源能否跨平臺遷移,關鍵要解決標準的問題,因此,擴充機讀目錄格式,增加856電子資源定位字段以連接元數(shù)據(jù)和對象數(shù)據(jù),就是解決這一問題的關鍵。
856字段,電子資源定位與檢索(Electronic Location and Access)包括定位與檢索電子資源所需要的信息。當文獻資源或其子集可以通過電子方式獲取時,可在書目記錄中啟用856字段。另外,該字段也可用于定位與檢索書目記錄中著錄的非電子資源的電子版或其相關的電子資源。856字段應當屬于元數(shù)據(jù),在CNMARC中,沒有關于此字段的定義,但我們可以根據(jù)UNIMARC進行擴充,以滿足對電子資源訪問的需要。
對于856字段,具體定義如下:
指示符1:用來定義電子資源的檢索方法。如果電子資源可以通過多種檢索方法獲取,那么該字段可以重復。
#無信息提供
指沒有提供關于檢索方法的信息。
0電子郵件 (Email)
指通過“郵件傳輸協(xié)議”(Mail Transfer Protocol,簡稱MAIL TP)檢索電子資源。
1文件傳輸協(xié)議 (FTP)
指通過“文件傳輸協(xié)議”(File Transfer Protocol,簡稱FTP)方式檢索電子資源。
2遠程登錄(Telnet)
指應用Telnet等遠程登錄方式檢索電子資源。
3撥號入網(wǎng)(Dial-up)
指通過傳統(tǒng)的電話撥號入網(wǎng)方式檢索電子資源。
4超文本傳輸協(xié)議(HTTP)
指通過超文本傳輸協(xié)議(Hypertext Transfer Protocol,簡稱HTTP)檢索電子資源。
5檢索方法在$y中說明
電子資源的檢索方法不是通過定義的指示符值來表示,而是通過記錄在子字段$2的標識性代碼識別。
指示符2:未定義,空位現(xiàn)就一些常用字段應用作以介紹。
$b檢索號碼 (有則必備,可重復)
包含與主機相關的檢索號碼。如果文獻是Internet資源,它指的是互聯(lián)網(wǎng)協(xié)議地址(Internet Protocol,簡稱IP);如果用電話撥號上網(wǎng),它指的可能是電話號碼。這一數(shù)據(jù)不是靜態(tài)地存儲在某一地方,而是經(jīng)常變化且可以由系統(tǒng)自動生成。
例 856 3#$alocis.loc.gov$b140.147.254.3$mlconline@loc.gov$t3270$tline mo
de (e.g.,vt100)$vM-F 06:00-21:30 USA EST, Sat. 08:30-17:00 USA EST, Sun.13:00-17:00 USA EST
注:本字段是利用電話撥號入網(wǎng)方式獲取電子資源的實例。包含主機域名($a)、IP地址($b)、用戶可以和資源提供者聯(lián)系的email地址($m)、仿真終端($t)和檢索時間($v)等信息。
$d路徑 (有則必備,可重復)
$d包含的路徑信息用于說明文件存儲位置的邏輯目錄與子目錄名稱的序列。
$f電子文件名稱 (有則必備,可重復)
$f包含存儲在子字段$d指定的目錄/子目錄下的電子文件名稱。
例856 1#$d/pub/EIS/vol*no*/adobe$f*.pdf$lanonymous$qapplication/pdf
注:$d記錄路徑,$f記錄文件名稱,$o記錄操作系統(tǒng),$i記錄登錄信息,此處為匿名登錄,$q記錄文件的格式類型。
三、856字段的實現(xiàn)方式
以MARC記錄格式為基礎,通過856字段描述網(wǎng)絡化電子資源的特性、連接方式和提取操作要求。MARC是圖書館描述、存儲、交換、處理以及檢索信息的基礎,經(jīng)過不斷發(fā)展已被圖書館用來描述和存取電子信息資源, 856字段可利用MARC記錄描述網(wǎng)絡化電子資源(包括網(wǎng)頁、電子期刊、telnet系統(tǒng)、FTP站點等)的特征、連接方式和提取要求。網(wǎng)絡用戶通過瀏覽器各種元數(shù)據(jù)輸出結果,都將采用動態(tài)頁面方式產(chǎn)生,傳送到用戶端的信息格式符合HTML語言的基本規(guī)范。為改善顯示效果而嵌入的特殊內容,可以采用三種方式:ASP、JAVA SCRIPT或ACTIVE X控件。
對于各種數(shù)字資源,目前比較成熟的技術解決辦法是:
數(shù)字視頻文件:各種視頻信息采集,并通過在頁面文件中嵌入ActiveMovie對象定義,實現(xiàn)以Web頁面方式實時傳輸,實時播放視頻流式文件。
數(shù)字音頻文件:各種音頻信息采集,并通過頁面文件中嵌入ActiveMovie對象定義,實現(xiàn)以Web頁面方式實時傳輸,實時播放音頻流式文件。
連續(xù)多幅圖像文件:各種圖像信息采集,并通過頁面文件中嵌入Java Script定義信息,以Web頁面方式分頁(幀)傳輸圖像,并可翻頁或查看指定頁(幀)。
電子圖書:利用快速掃描儀,將多頁圖書正文打包形成PDF文件。
通過這種處理,圖書館就能夠在原有元數(shù)據(jù)的基礎上,通過856字段這個切入點,把相關的對象數(shù)據(jù)(電子資源)連接起來,并且,在查找到相關的元數(shù)據(jù)信息(例如書目信息)之后,就可進入相關鏈接,訪問其數(shù)字資源,一步到位地滿足讀者的信息需求。
參考文獻:
[1]《中國機讀目錄格式使用手冊》,北京圖書館,華藝出版社.
[2]《丹誠數(shù)字圖書館解決方案》,丹誠軟件有限公司.