吳申艷
摘 要:元數據與數字檔案資源長期保存具有密不可分的關系。通過分析元數據在數字檔案資源長期保存過程中對其真實性、完整性、安全性、可獲取性的維護及數字檔案資源長期保存對元數據的關鍵要求等內容,提出基于數字檔案資源長期保存的元數據建設策略。
關鍵詞:元數據; 數字檔案資源; 長期保存; 策略
Abstract:Meta-data and long-term preservation of digital archives resources has a close relationship. It is convenient to find the gap between meta-data research and digital resources long-term preservation of the construction project through introducing the function of meta-data in the long-term preservation of digital archives resources and how those program demand. Thus we put forward the value of meta-data description function, sensitive information and so on.
Keywords: meta-data digital archives resources long-term preservation
引言
數字檔案資源的長期保存既要求確保數字檔案資源的長期存儲,也要求保證數字檔案資源的永久獲取。元數據作為描述數據的數據,其本身以及與其相關的技術是數字檔案資源長期保存的關鍵,因此基于數字檔案資源長期保存的元數據研究就顯得尤為必要。為了更好地利用元數據滿足數字檔案資源的長期保存需求,相關學者提出了保存元數據這一概念并開展了以保存元數據為核心的項目研究,比如PREMIS和METS等,這些項目的開展可以推動元數據更好地解決數字資源長期保存過程中涉及的管理、技術問題等,為本文探討數字資源長期保存的元數據建設策略提供了借鑒。
1元數據在數字檔案資源長期保存中的作用
1.1維護數字檔案資源的真實性。檔案是真實的歷史記錄,因此維護數字檔案資源的真實可靠是數字檔案資源長期保存過程中的重中之重。元數據可以通過建立與數字檔案資源真實性相關的元數據結構來保證數字檔案資源的真實性[1],即在數字資源形成和使用階段描述與記錄數字資源及與之相關的責任者、業(yè)務過程、法規(guī)、時間、人員使用行為等信息,并在描述與記錄這些相關信息的同時通過數字簽名將其與數字檔案資源固化為一體,進行封裝保存,從而起到說明與保證數字檔案資源真實性的憑證作用。
1.2維護數字檔案資源的完整性。元數據對數字檔案資源的監(jiān)管貫穿了數字檔案資源的整個生命周期。因此,為了保證數字檔案資源的內容、結構和背景信息均沒有缺損,它可以持續(xù)動態(tài)地記錄和保存用戶對數字檔案資源的使用行為,包括對數字檔案資源的編輯、復制、刪除等[2]。形成的這些元數據記錄不可更改和刪除,與數字檔案資源綁定在一起,因此數字資源保管單位可以通過這些元數據記錄說明所收集、長期保存的數字對象完整性及其變化情況,特別是在接受保存、提供利用前后的完整性變化。
1.3維護數字檔案資源的安全性。元數據可以通過對權限、版權、使用過程等方面信息的保存和描述來限制和監(jiān)管相關人員對數字檔案資源的傳輸和使用行為,從而實現(xiàn)維護數字檔案資源安全性的目的。比如,通過權限的控制可以避免數字檔案資源內容的泄露和損壞、通過版權的控制可以促進數字檔案資源規(guī)范化的運轉、對與使用過程有關的信息的記錄和保存便于有效追責,形成對相關人員的約束等。
1.4維護數字檔案資源的可獲取性。為了維護數字檔案資源的可獲取性,一方面,元數據可以通過不斷完善元數據元素盡可能達到對數字檔案資源的全方位描述,保證數字檔案資源的準確性。比如,隨著社會維權意識的增強,與權利信息、技術信息有關的元數據元素被不斷加入到元數據保存框架中[3]。另一方面,通過建立元數據框架抽取數字檔案資源中有關于數字檔案資源標示符、創(chuàng)建日期、結構類型、復雜對象技術結構、文件描述、已知系統(tǒng)要求、安裝要求、存儲信息、查找搜尋工具和提取方法、存取類型等方面的元數據單元并將其封裝在一個數據包中,例如,OAIS就將數字資源對象和與它們相關的元數據納入到AIP之中,這些元數據不是直接和數據束縛在一起,就是和系統(tǒng)有邏輯聯(lián)系。通過類似于AIP這樣的封裝數據包,與數字資源有關的存放在存儲介質中的物理數字信息,數字資源的保存數字格式與處理信息,數字資源的生成處理、利用環(huán)境,數字資源的內容校驗、身份驗證、版本演變、知識產權管理機制等都能得到完整的保存及再現(xiàn),從而實現(xiàn)數字檔案資源的長期存取。
2 數字檔案資源長期保存對元數據的要求
2.1 標準化。統(tǒng)一規(guī)范和統(tǒng)一標準主要是指在數字檔案資源長期保存過程中,元數據元素的選取、元數據保存框架的建立等必須標準化、規(guī)范化。元數據標準化是數字檔案資源進行長期保存的必然要求,能夠保證數字檔案資源在環(huán)境頻繁變化的情況下保持其真實性、完整性、可用和安全。例如,檔案信息包唯一標識符的構成規(guī)則若是沒有規(guī)范的標準,那么與唯一標識符相關聯(lián)的檔號、題名、編碼、檔案信息包等要素就很難去定位、識別和解析,從而增加了數字檔案對象的長期保存的難度。因此,數字檔案資源對元數據的標準化要求很有必要。
2.2易于捕獲。易于捕獲是指元數據要便于獲取,即數字檔案資源長期保存所需要的元數據不依賴于人工添加,可以較大程度以自動捕獲的方式從系統(tǒng)、數字資源本身、其他描述記錄等目標對象獲取。這種自動生成的元數據一方面可以有效保證數字檔案資源的真實可靠,另一方面也可以提高數字檔案資源長期保存項目的效率水平。endprint