武 琳 紀舜麗
基于網(wǎng)絡的檔案開放目錄是指檔案網(wǎng)站提供的以館藏為檢索內容,以檔案信息為處理對象并以計算機網(wǎng)絡作為傳輸載體、以原文信息或著錄項信息作為檢索結果的網(wǎng)絡信息檢索系統(tǒng)。這是檔案利用工作從手工檢索過渡到計算機檢索的重要表現(xiàn)形式。利用者通過網(wǎng)絡對檔案館數(shù)據(jù)庫的檔案信息實現(xiàn)遠程檢索,從而達到在線利用檔案的目的。檔案開放目錄比較全面反映檔案館館藏信息,“不僅可以使用戶進行遠距離檢索,降低檢索成本,提高檢索效率,而且可以及時反映檔案信息的變化情況,不存在時間上的延遲”。
一、我國檔案開放目錄的發(fā)展現(xiàn)狀
目前,我國大部分檔案網(wǎng)站都推出了檔案開放目錄,有些還停留在原始的目錄瀏覽階段,為紙質版本的數(shù)字化,但多數(shù)已建立起具有查詢功能的檢索系統(tǒng)。國家級檔案館的在線數(shù)據(jù)庫尚未建立,從省、市、區(qū)(縣)三級檔案館網(wǎng)站的檔案開放目錄來看,各地建設水平參差不齊,部分系統(tǒng)有一定亮點,但整體質量不高。
(一)國內開放目錄典型調查
本文以北京、上海、遼寧、沈陽、紹興和青島等地的檔案開放目錄為典型案例,進行了調查統(tǒng)計,見表1。
(二)典型案例分析
除以上幾個網(wǎng)站外,對比全國多個開放目錄的內容及功能可知:
1、檔案種類
文書檔案是檔案開放檢索的主體,但提供全文使用的網(wǎng)站很少,部分網(wǎng)站對這些文書進行掃描,以圖片格式保存后提供線上利用,如北京市檔案館的全文閱覽系統(tǒng)。其次,照片、錄像開始加入到系統(tǒng)中,有些照片提供免費查看并可下載,視頻的可鏈接率較低,但可看出檔案館開始重視對多媒體信息的提供。
2、數(shù)據(jù)內容
目前幾乎所有的檔案館都提供革命歷史檔案、民國檔案及建國后檔案,政務色彩較濃,對特色檔案的開發(fā)不夠。北京與沈陽的勞模檔案、沈陽與上海的工商檔案、北京的訴訟檔案、大連的調配書、湖北的辛亥革命檔案以及福建省檔案館包括體育、地政、海關、禁毒、閩臺關系、名老中醫(yī)等多達59個專題檔案材料的提供給各級檔案館開了個好頭,但就全國范圍來講,專題檔案檢索依然任重而道遠。
3、著錄層次
很多系統(tǒng)都在檔案題名上建立了二次鏈接,但著錄項大多數(shù)為責任者、形成時間、發(fā)文單位、文件編號、檔號等幾項,缺乏其他描述。然而也有比較出色的,如上海檔案館網(wǎng)上檢索服務系統(tǒng)。對每個文件,系統(tǒng)都提供了詳細的文件著錄項目,并可鏈接查看所屬全宗、類別、案卷的詳細信息。
4、檢索功能
檔案檢索大體可分為案卷級和文件級兩種,案卷級在數(shù)量上比文件級占優(yōu)。系統(tǒng)的設置通常將這兩個類別分開,利用者需要在不同的數(shù)據(jù)庫進行檢索。上海的查詢系統(tǒng)給這些數(shù)據(jù)庫提供了統(tǒng)一的檢索入口,利用者可以選擇案卷級、文件級或者對所有檔案進行查詢,不受檔案著錄層次的限制。另外值得一提的是,上海開放目錄采用文件夾內層層瀏覽的形式,使利用者在直觀感受檔案組織層級的同時,隨時在每一層級內查詢所需檔案,既增強了靈活性,又可提高目標針對性。
5、檢索效率
雖然幾乎每個系統(tǒng)都提供了關鍵詞檢索,但目前所謂的“關鍵詞檢索”實質上只是對文件標題進行檢索,且加上著錄質量總體不高,特別是很多照片檔案都沒有詳細描述,在這種情況下,檢全率低成為各系統(tǒng)普遍存在的問題。
6、提供方法
由于庫藏量小,特別是數(shù)字化信息在系統(tǒng)中所占的比例還很小,很多開放目錄都無法提供高吸引力的檔案資源。紹興市檔案信息網(wǎng)通過開放目錄與網(wǎng)站欄目“視頻點播”的對接,實現(xiàn)“紹興新聞視頻庫”庫藏的在線觀看,與遼寧的“聲像檔案”出自同一原理,這種站點資源與目錄系統(tǒng)的整合值得注意。
7、資費標準
很多網(wǎng)站提供了部分檔案的免費查看或下載,但也有部分檔案館對檔案實行有償使用。如浙江省和青島市檔案館就對大多數(shù)館藏實行利用收費。以青島市檔案館為例,利用者在該檔案館網(wǎng)站進行注冊并以現(xiàn)金、查檔卡、郵局匯款或銀行匯款等方式交納查檔費后成為高級會員,可通過“留言板”或“在線提交查閱需求”要求查閱所有開放的檔案資料全文信息。這種行為目前受歡迎程度不大,但是否具有市場前景關鍵還在于檔案館能否提供高質量、高實用性的檔案材料。
二、構建我國檔案開放目錄的途徑
(一)內容選擇
1、把握利用需求,有選擇地數(shù)字化館藏
“根據(jù)了解,目前一般區(qū)(縣)檔案館館藏量在12-15萬卷,按每卷檔案50頁計算,大約共600-750萬頁。如將這些檔案全文數(shù)字化,按照目前市場價格(掃描和輸入0.25-0.4元/頁)計算,一個區(qū)(縣)級檔案館全文數(shù)字化將需投入150-200萬元?!比欢啊迤陂g,中央財政對縣級公共圖書館、文化館基礎設施共投入136.4億元,比‘九五期間增長約50%。而對比之下,同期中央財政對縣級國家綜合檔案館的投入則為零?!痹诖饲樾蜗?,對所有館藏檔案進行全文數(shù)字化顯然脫離實際。因此。檔案目錄數(shù)字化應成為檔案數(shù)據(jù)庫建設的首選環(huán)節(jié),然后逐步擴展到檔案原文的數(shù)字化。檔案館必須正確把握本館的利用需求,根據(jù)目前檔案利用的實際情況有選擇地進行數(shù)字化。強調突出館藏特色,把有限的資源用在最需要的地方。
2、整合檔案資源,增加民生檔案的比例
“民生檔案包括社會保險檔案、醫(yī)療保險、最低生活保障檔案、婚姻登記檔案、房地產(chǎn)檔案、拆遷安置檔案、人口計生檔案、藥品食品監(jiān)督檔案、環(huán)境檢測檔案、土地承包和林權改革檔案等百姓關注、涉民密切的20余個門類檔案?!痹谶^去很長一段時間內,檔案館與民眾的生活一直處于相對脫離的狀態(tài)。造成這種局面的原因之一便是檔案部門長期注重對政府機構文書的收集,缺少對社會變遷的記錄,另一原因是檔案部門缺乏服務意識。但隨著近年來群眾維權意識的提高,檔案意識也隨之增強,到檔案館查檔解決實際問題的趨勢越來越突出。據(jù)四川省檔案館查閱利用室的工作人員介紹,2007年“查閱社保養(yǎng)老、房屋產(chǎn)權、婚姻登記檔案的人員增長特別明顯……以成都市為例,2007年該市檔案利用人(次)增長幅度達到50%,金牛區(qū)、錦江區(qū)、青羊區(qū)甚至達到了60%以上。從生老病死到衣食住行,民生檔案與百姓生活漸行漸近?!?這種現(xiàn)象在全國其他地方檔案館也普遍存在,據(jù)張家港市檔案館利用情況的統(tǒng)計,“2005年和2006年的個人利用比例分別為87%和81%?!裆悪n案的查閱則在此期間從579卷次/年上升到5740卷次/年,增幅達十倍之巨,并且在‘十五期間一直高高占據(jù)檔案利用量榜首之位?!边@種個人與機構查檔比例大逆轉的出現(xiàn)反映了群眾對檔案利用需求的一種新趨勢,說明民生檔案正成為群眾關注的熱點。
3、多媒體檢索
檔案載體類型多種多樣,常見的包括紙張、縮微膠片、照相印刷品、實物、電影膠片、磁帶、聲音磁盤、錄像帶、視頻卷帶等。將載體類型作為其基本檢索途徑,利用
者可以選擇其所關心的一種或幾種載體類型限制檢索結果,專指度強,檢索效率高。目前,我國還很少將載體類型作為檢索途徑(上海很可能是全國惟一的一家),少數(shù)網(wǎng)站建立了獨立的照片檔案目錄,但收錄照片數(shù)量很少,且缺乏詳細著錄。在目前的技術背景下,文字是最主要的檢索手段,圖像檢索還未得到大范圍推廣,多媒體文件只有配合詳細的文字描述,才能取得用戶預期的查詢結果。因此,檔案館應加強多媒體檔案著錄,早日實現(xiàn)真正意義上的多媒體檢索。
(二)系統(tǒng)功能方面
1、完善系統(tǒng)使用指南
使用幫助工具的提供是國外網(wǎng)站優(yōu)于國內網(wǎng)站的一個明顯特征,這在專業(yè)檢索系統(tǒng)的使用中尤其重要。特別是在大眾較為生疏的檔案領域,一定的提示與引導將大大提高檢索的效率。從我國各檔案館網(wǎng)站提供的開放目錄來看,利用者明知所需檔案存于庫中卻難以檢出的情況非常普遍。因此,當利用者輸入關鍵詞但沒有得到理想結果時,系統(tǒng)需要有相應的自動響應,提示查詢者更換主題或提供相似檢索詞,以改善查詢結果,使利用者耐心在系統(tǒng)上停留。
2、編制索引輔助查詢
除檢索幫助及使用指南外,方便利用的最便捷方式是提供專題目錄,并編制各種索引。主題瀏覽和索引利用都是提高利用效率的方法,尤其對于不熟悉庫藏或不擅于編寫檢索式的利用者更是如此。開放目錄索引可以以全宗號或拼音、筆畫為序建立樹型連接,讓利用者對某一機構形成檔案或某一專題所有相關材料有一個總體把握,符合檔案的來源原則,既起到引導作用,又使部分利用者不至因檢索式編寫不當而導致漏檢。由于檢索系統(tǒng)建設還處于初期,所存條目少,這個問題目前在我國檔案開放目錄中表現(xiàn)不明顯,但隨著系統(tǒng)內容逐漸增加,索引的編制將越來越迫切。
3、實現(xiàn)系統(tǒng)無縫鏈接
自檔案館開始網(wǎng)站建設以來,“專題展覽”、“特色展廳”等欄目一直是各檔案館網(wǎng)站的亮點。但檔案開放目錄與網(wǎng)站其他內容處于完全分開的兩套系統(tǒng),目錄與網(wǎng)頁信息無法實現(xiàn)相互鏈接,使得很多存在于網(wǎng)絡的全文資料無法于庫內檢索時直接獲得,利用者需要兩邊同時搜索才可確定所需信息是否存在。因此,在檢索系統(tǒng)自身建設的基礎上,如何實現(xiàn)網(wǎng)上展覽材料與查詢系統(tǒng)的無縫鏈接是檔案開放目錄建設的一大課題。
4、采用標準兼容技術
目前提供檔案開放原文在線閱覽的網(wǎng)站不多,北京市檔案館的檔案全文檢索閱覽系統(tǒng)是其中較為典型的一個。雖然該系統(tǒng)目前只提供了北平市五個部門專題目錄數(shù)據(jù)庫近152萬頁的數(shù)字化檔案,但也可以看出開放目錄數(shù)據(jù)庫將提供全文利用的趨勢。惟一的不足是,在該系統(tǒng)上查看檔案無論是圖片還是文檔都要安裝原文瀏覽的Accex控件,而這些插件的安裝只有對IE瀏覽器重新設置才不至于被~dOW$拒絕。這是許多利用者較為反感的事情。因此,使用與瀏覽器標準兼容的技術,消除利用障礙,是檔案開放目錄檢索系統(tǒng)建設應注意的另一問題。
5、統(tǒng)一人口,跨庫檢索
清代檔案庫、民國檔案庫、革命歷史檔案庫及現(xiàn)行a公開文件目錄作為最常見的四個數(shù)據(jù)庫構成了我國檔案館網(wǎng)站的信息檢索系統(tǒng),而前三個數(shù)據(jù)庫一般是以檔案開放目錄的形式存在。各網(wǎng)站共同的特點是利用者在檢索時只能選取其中的一個數(shù)據(jù)庫進行查詢。如果利用者檢索的專題其時間連續(xù)性較強的話則需遍歷若干個數(shù)據(jù)庫才能得到完整的材料,這就給利用者帶來很大的不便。因此,提供統(tǒng)一的檢索入口,實現(xiàn)跨庫檢索是目前檔案信息檢索系統(tǒng)建設需要努力的方向。