林 強
(河北大學 河北 保定 071000)
由于計算機技術和互聯網技術的廣泛應用,突破億萬的用戶通過各種渠道和手段獲得或創(chuàng)造了各種各樣的信息,加之電子出版物時代的到來,數字資源的長期保存成為這種環(huán)境下用戶對社會及其相關部門所提出的要求。數字資源長期保存項目的存在是對人類智力資源、文化資源等一切文明的保存與延續(xù)。美國、澳大利亞、荷蘭等是開展數字資源長期保存項目較早的國家[1]。我國的數字資源長期保存活動也在逐步進行。此外,數字資源長期保存僅依靠圖書館是無法完成的,需要社會各界的通力合作。
開展數字資源長期保存工作,首先,需要建立有效的資源收集與處理機制;其次,針對數字資源存在與應用的特點運用各種技術對其進行處理和保存;再次,數字資源保存是長期項目,穩(wěn)定的資金與規(guī)范的組織是活動的前提與保障;最后,對項目的評估與完善是此項活動不可缺少的環(huán)節(jié),能夠為下一次數字資源保存提供理論與實踐依據。因此,建立良好的數字資源長期保存模式,井然有序地開展數字資源長期保存項目將使數字資源保存更加規(guī)范。從戰(zhàn)略角度出發(fā),應將數字資源的長期保存看作是可持續(xù)任務。
對2009—2010年數字資源長期保存項目進行收集與分析,從中選擇了若干項目探討如下。
AIMS (An Inter-Institutional Mode for Stewardship,機構間數據管理模型)是一個為期兩年(2009年10月—2011年10月)的數字檔案保存計劃,是弗吉尼亞大學圖書館聯合斯坦福大學、赫爾大學、耶魯大學在Andrew W Mellon基金會的組織下成立的,旨在建立一個完善的國內或者國際間的數字檔案框架,以保存?zhèn)€人或者組織的數字檔案信息。該計劃是合作式的團隊運行項目,在該項目里,每個合作者(團體)都有各自的領導與基礎設施,并且負責人之間可以相互聯系,對自己或者另一部門的工作進行評價與指導,從實際工作中吸取經驗。
ArchivePress項目是由英國倫敦大學電腦中心與英國國家圖書館數字信息保存部門合作,由JISC (Joint Information Systems Committee,聯合信息系統(tǒng)委員會)出資于2009年3月成立的。該項目重在解決博客內容(評論、嵌入式內容和元數據)歸檔的實際問題。ArchivePress是通過RSS和博客的API(Application Programming Interface,應用程序編程接口)獲取博客內容。歸檔后的內容將被項目所擁有的數據庫存儲和管理,并保持博客原始的數據結構和格式。該項目人員將這些信息匯集到Wordpress數據庫上,作為歸檔引擎進行保護與利用。目前,該項目已在Google上進行試用。
歐盟領導下的歐洲數字圖書館旨在為后代保存那些具有豐富歷史價值和文化價值的圖書、電影、雜志、地圖、照片、音樂等一系列的文化資源和科技資源。他們通過創(chuàng)建電子博物館、檔案館及與歐洲的各大成員國圖書館聯合,為用戶提供保存下來的各種信息,以滿足后代的生活、學習和娛樂的需求。該倡議看起來較為分散,但實際上是十分實用的項目,在由歐盟各個成員國組成的委員會的領導下開展各項工作。
2009年的歐洲數字圖書館倡議會議上,通過了針對孤兒和成員國文化遺產的數字化計劃;制定了關于運作歐洲數字圖書館與資源使用標準。這項倡議下的歐洲數字圖書館計劃可以帶動其他相關產業(yè)的發(fā)展,促進社會與經濟的進步,通過對文化產業(yè)數字化的保存推動其他行業(yè)的發(fā)展,如政府信息公開、電子商務、教育培訓、人們健康意識、通訊和廣播等都得到發(fā)展。
數字保護聯盟是為了保存英國的數字資源而建立的,并與其他國家聯合保護全球數字信息和知識。其保存數字資源的計劃為非營利會員組成的聯盟實現這一目標提供了良好的經營機制與先導,該聯盟的最終目標是推進數字化的保存與管理。從2009 —2011年間的戰(zhàn)略構想看,該聯盟是以中立、友好、協(xié)商的態(tài)度去達到滿足成員需求、維護良好數字資源、分享數字資源、發(fā)展數字保護標準的工作目標。
音像內容建檔項目從歐洲發(fā)起,是針對那些由于數字時代到來而在格式與形式上都面臨著改變的音像內容所采取的保護措施。由于數字化媒體的廣泛應用,原來的音像制品將會失去原有的存在環(huán)境,那么,就需要為這些音像制品建立檔案,并且為這些檔案提供良好的保存環(huán)境,提供必要的技術支持。用戶可以通過網上數字圖書館訪問歐洲范圍內的所有音像資料。該項目所進行的工作并不是把音像制品進行簡單的復制與儲存,而是將原有格式進行處理,使之變成當前環(huán)境下能訪問與應用的文件。在這個過程中要遵循與制訂相應的標準來規(guī)范保存格式的選擇、處理保存內容的技術及提供所保存信息檢索技術等過程,不管是對文件的描述還是儲存格式的要求,都要在一定范圍內按照一致的標準進行。
該項目聯合了歐洲一些大學的圖書館,在歐洲基金會、博物館、檔案館等一些重要合作伙伴的協(xié)助下,為工業(yè)(infustry)、企業(yè)(enterprise)市場需求提供服務。主要的組織者和項目經理組成委員會對該項目負責。
PARSE. Insight(Permanent Access to the Records of Science in Europe, 歐盟科學數據長期保存計劃)歷時兩年,在歐盟第7框架項目下聯合了英國、荷蘭、德國、法國、瑞士等國家參加,主要是集中研究歐盟提供的數字資源(主要是科學信息),并延長其壽命,改善數字資源的存在環(huán)境與利用狀況。這需要項目組織者下屬的相關技術部門建立數據庫來收集這些資源并且為收集資源提供必要的渠道,鼓勵和支持社會各界分享他們的數據,同時為這項研究提供技術、方針政策、基礎設施上的支持和引導。該項目中提到 “很多數字資源構成了當今歐洲眾多智力資源的基礎,新一代研究人員需要站在巨人的肩上才能達到事業(yè)頂端”。在這里提到的“巨人的肩上”無非就是這些數字資源。保存這些數字資源并且使其能夠長時間為人類使用,就能創(chuàng)造出更多的利益。越來越多的數字資源和先進的數字技術的應用縮短了這些資源的生命周期,如何保護好這些智力資本是PARSE. Insight項目所要考慮的問題,正如OAIS(Open Archival Information System,開放檔案信息系統(tǒng))和ISO (International Organization for Standards,國際標準化組織)14721里提到的“要對在短短幾年時間里發(fā)生變化的媒體和數據資源進行保護,在技術上應對這一不斷變化的現實?!?/p>
Inter PARES 3( The International Research on Permanent Authentic Records in Electronic Systems 3,文件真實永久保存電子系統(tǒng)國際合作研究第3階段)是一項大型的跨國合作研究項目,其目的是為制訂長期保管真實電子文件的國際、國家及機構政策、戰(zhàn)略和標準提供原則和依據,其項目資金由加拿大社會科學和人文研究理事會的社區(qū)大學研究聯盟贈款。目前已經進行到了第3階段,主要工作目標是將前兩期的豐碩研究成果付諸實踐并進一步檢驗與完善前期研究成果,幫助各級各類機構建立基于電子文件真實性保障的電子文件管理系統(tǒng)和相關的制度、指南、人員培訓模式。
項目的開展是在有資金投入的情況下進行的,沒有穩(wěn)定的資金,數字資源長期保存工作就沒有得以運行的基礎。從所調查的國外項目開展情況上看,資金可以從所屬委員會和參與并享有使用權的會員中獲得,也可以由公益性質的組織募得。以上只是該類項目在運行過程中獲得資金的部分方式,但是從這幾種形式中可以看出,資金的來源可以決定資源的使用和組織存在的性質。資金往往是作為啟動和開展數字資源長期保存活動的物質基礎,有時它還可以決定技術與資料的獲得程度。
數字資源長期保存項目的規(guī)模與參與者的數量、部門等方面相關。項目的規(guī)模在一定程度上決定項目的影響力。如果數字資源保存項目有權威部門的領導、廣泛的合作領域、豐富的資源、強大的合作團隊和知名企業(yè)或者大學的參與,那么便會吸引很多人去關注并加入到這項保存活動當中。
數字資源長期保存對象是整個項目中最關鍵的部分,只有明確保存對象才能展開一系列相應的工作。在明確保存對象的工作過程中,確定資源的呈現方式和獲取方式是進行數字資源保存的初始工作。要對保存對象進行徹底分析,弄清楚從什么地方、以什么方式獲得該資源,之后又以什么形式或者格式保護或保存經過技術處理的數字資源,同時,需要對經過技術處理前后的保存對象進行校審與評估,這對數字資源長期保存工作起到了十分重要的作用。
從國外數字資源長期保存項目來看,絕大多數的組織者都屬于計算機、檔案、圖書館、數據庫商等掌握有大量數字資源和先進技術的部門或某個行業(yè)及公益部門。由此可見,數字資源長期保存項目的開展是一項綜合且需求突出的活動。從組織者的角度去考慮,沒有需求就沒有開展這項活動的出發(fā)點,但從組織者的最終目的上看,對保存后的數字資源的使用可以分為商業(yè)性和非商業(yè)性,這與整個項目的構建與所要達到的目的是分不開的,同樣也是組織者的期望。
總之,一項具有歷史意義的保存項目如果沒有良好的運行模式,很難達到長期保存數字資源的目的。良好的運營模式可以在一定程度上起到推波助瀾的作用。
隨著計算機網、有線電視網和電信網三者聯合即三網融合的發(fā)展,我國傳播、出版和IT產業(yè)的格局有所改變,在用戶對資源的使用和數字資源的保存上需要革命性的變革。但是,對數字資源保存項目的構建不能脫離領導、組織、技術、評估與反饋的環(huán)節(jié)。
在一個完整的項目模式中,組織是整個項目模式的骨架。組織者是指揮和制訂計劃的“大腦”,其下面的每個部門各有分工、各盡所能,“組織”就是支撐起整個項目的基礎。
(1)主管機構 是整個項目的發(fā)起者、組織者、領導者,可以是個體、團體或組織,如項目委員會。委員會需要考慮整個項目的資金往來、資源獲取與呈現,對項目進行評估和工作安排。在整個項目的模式構建中,組織者是這個項目的負責人,也是“大腦”,起到管理與協(xié)調的作用。
(2)合作者 即愿意與他人共同為這個項目出資或開展必要工作的個體或組織。部門間的合作、企業(yè)間的合作、大學間的合作等一切有利于開展工作的合作形式都是可以存在的。但是在合作過程中要協(xié)調合作者之間的任務,分清合作的形式和性質。在商業(yè)前提下的合作需要組織者和合作方共同承擔相應的法律責任和義務,在資源的利用與開發(fā)上做到“按章辦事”。
資金是開展數字資源保存工作的前提與物質基礎。資金的獲取有兩方面考慮:第一,和資源的價值與保存工作的緊迫程度有關。有重要利用價值的資源需要采取積極的大量的人力、物力進行保存以為用戶提供服務;第二,和圖書館、檔案館、大學等機構的重視程度有關。圖書館、檔案館和大學等機構掌握著一些無法靠商業(yè)手段獲取的信息資源,他們的參與可以完善所要保存資源的內容,從而讓更多的用戶使用到這部分資源。所以,不管是從商業(yè)的角度進行考慮,還是源于對人類文明的繼承與分享的情懷,數字信息資源的長期保存都是不可避免的。
特別是在三網融合的環(huán)境下,數字資源的保存顯得尤為重要。三大部門的領導機構需要在這個共同目標下溝通和協(xié)調出現的問題,確保數字資源保存活動的正常開展。在三網融合后的一段時間里,應該有一個共同的領導組織去負責三網的相關事宜,在其領導下將數字資源保存工作長效開展下去是大勢所趨。
在技術方面,需要考慮到當前的技術是否適合原來的數字資源,應如何進行下一步的保存工作。在對保存對象的選擇環(huán)節(jié)上,應該充分考慮保存對象的文件格式、狀態(tài)、內容,并且要對保存項目進行預案分析,應該考慮保存該類數字資源的措施,即對處理過的數字資源再利用、再獲取的方式和設備等,也就是要充分考慮到原始數字資源的輸入與輸出格式與呈現方式。
在三網融合后的數字資源體現形式上,不僅僅是計算機網絡上的數字資源是需要保存的對象,那些存在于廣播、電視、電信等網絡上的數字資源也將會成為的保存對象。
維護與評估環(huán)節(jié)是必不可少的,因為在項目完成投入使用后的過程中所出現的問題應得到及時更正,并且形成數據記載下來,以對下一個項目的開展提供必要的經驗。對項目的評估可以使整個項目在宏觀與微觀兩個層面充分實現交合,確定在縝密的計劃下實施的各項工作是否取得了預期的效果,是否達成了一致的意見,但這都需要在另外一個平臺去對該項目實行客觀的評價。
總之,在三網融合的環(huán)境下,數字資源保存的力度和難度將會增加,但是這并不會使數字資源保存活動消失。數字資源保存將會依托先進的科學技術,實現三網資源的整合性保存,把同一類的不同體裁類型的數字資源進行保存。以“三網領導委員會”作為數字資源保存項目的最高領導機構,在其領導下可實現多層次、多形式的資源融合與保存。
通過對國外數字資源長期保存項目的分析與研究,筆者提出了數字資源長期保存項目應在可行的模式中進行,即要有明確的領導者(個人或團體),實行部門負責制,在每個部門都有負責人對本部門工作進行評價和指導,并且對其他部門的工作進行評估;另外要建立健全的資金運作保障機制,為長期保存工作提供堅實的物質基礎;與此同時,技術方面要充分考慮本項目對所用技術駕馭能力與用戶所處技術環(huán)境的匹配問題;最后,為了實現對信息資源長期保存工作的可持續(xù)發(fā)展,要對所有保存工作和結果進行評估,以為數字資源保存工作提供動力與支持。數字資源長期保存項目在健全的模式下進行,會處于一個長期而持久發(fā)展的狀態(tài)。作為組織者,建立健全一套行之有效的方針政策與作出正確的決策是其首當其沖的任務;實現與合作者之間的良好溝通與合作是開展保存項目的基礎;獲得或者募集資金是開展工作的物質基礎。在技術環(huán)節(jié)上,要充分考慮被保存資源的客觀狀態(tài),利用現有技術進行保存,并且要充分考慮到前后格式上的變化。在維護與評估上,積累經驗正確評估也是十分必要的。
以上3個方面是整個項目模式的基本要點,從組織者到技術與服務,再到后期維護與評估,這3個方面是不可分割的。在一個項目中這三者也不是獨立存在的,他們分別扮演著“領導者”、“執(zhí)行者”、“用戶”的角色。由于社會的發(fā)展速度不斷加快,對數字資源的長期保存會受到來自技術和資金上的阻礙:技術上的阻礙體現在現有技術與被保存信息是否能充分結合,并能夠在未來技術環(huán)境下為用戶提供穩(wěn)定而準確的服務;資金上的阻礙是針對投資和利益分配上的協(xié)調機制能否促進并長時間的投入到對信息資源的長期保存上來。所以對保存技術的選擇和解決資金運作問題顯得尤為重要。同時,對保存后的數字資源的使用需要限定在法律條例的范圍內,這樣才能保證人類的文明更持久地被保存。建立良好的內部協(xié)調機制和適當的技術支持是這個模式框架下的實質內容,而這樣的模式為數字資源保存工作的開展提供了空間與時間,并朝著簡單、多樣與實用的方向發(fā)展,實現社會效益與經濟效益的雙豐收。三網融合環(huán)境下,資源的多樣化和數量的激增將給數字資源保存帶來挑戰(zhàn)。新的環(huán)境對技術、人員、組織和管理的要求更高,各部門需要有機聯合,構建合理的法律、技術、人員與資金運營框架,秉持可持續(xù)發(fā)展的態(tài)度去實現我國數字資源的長期保存。
[1]張士男, 閆 昱. 國內外數字資源長期保存現狀研究及分析[J].圖書情報工作網刊, 2009(1):1-6.
[2]AIMS - Born Digital Collections: An Inter-Institutional Model for Stewardship [EB/OL]. [2010-08-05]. http://www2.lib.virginia.edu/aims/.
[3]Welcome to the Archive Press Website [EB/OL]. [2010-07-28]. http://archivepress.ulcc.ac.uk/.
[4]i2010: Digital Libraries Initiative [EB/O L].[2010-07-21].http://ec.europa.eu/information_society/activities/digital_libraries/index_en.htm.
[5]Digital Preservation Coalition [EB/OL].[2010-07-25] .http://www.dpconline.org/advice/dpc-reports.
[6]Presto PRIME [EB/OL].[2010-08-02]. http://www.prestoprime.eu/project/index.en.html.
[7]About PARSE Insight: Permanent Access to the Records of Science in Europe [EB/OL].[2010-08-01] .http://www.parse-insight.eu/.
[8]InterPARES Project [EB/OL].[2010-08-02]. http://www.interpares.org/.