吳申艷
摘要:元數(shù)據(jù)與來源原則的變革擁有密不可分的關系。因此,進一步把握元數(shù)據(jù)與來源原則變革之間的聯(lián)系能夠?qū)碓丛瓌t的內(nèi)涵和實踐應用有更深刻的認識。本文從來源原則變革的產(chǎn)生、來源原則的發(fā)展、來源原則的成果三個方面探討元數(shù)據(jù)在其中的作用程度,提出元數(shù)據(jù)是來源原則變革的誘因、來源原則變革成果形成的助力者、來源原則變革成果與社會實踐的黏合劑。
關鍵詞:元數(shù)據(jù)來源原則變革
Abstract: Metadata has a close relationship with the change of the source principle. Therefore, fur? therunderstandingoftherelationshipbetween metadata and the change of the source principle can have a more profound understanding of the con? notation and practice of the source principle. This pa? per is doing research from three aspects: the princi? ple of change, the principle of development, the principle of source achievements to discuss the role of metadata in the metadata is proposed, the princi? ple of change adhesive inducement, source forma? tion, power source principle change source principle change and social practice.
Keywords: Metadata;Origin principle;Innovation
一、引言
來源原則從20世紀初起就被國際檔案界公認為檔案專業(yè)的基本原則,是當前各國公認的檔案整理理論。因此,來源原則的發(fā)展和變遷一直受到檔案學者的關注。不可否認的是,進入電子文件時代之后,來源原則出現(xiàn)了不適應性,傳統(tǒng)的“實體來源”概念受到了挑戰(zhàn)。為了讓來源原則在電子時代仍然具有生命力,檔案學者提出了“概念來源”,即電子時代檔案來源的概念不僅指文件的形成機關,而且還包括其形成目的、形成活動、過程、處理程序和職能范圍等。
但是“概念來源”的提出也帶來了新的難題——“概念來源”過于抽象并且難以現(xiàn)實操作。于是檔案學者將元數(shù)據(jù)引入了檔案領域,提出在電子文件生成、管理和利用的全過程中始終注重掌握元數(shù)據(jù),并將其與文件的內(nèi)容信息一同保留下來,從而成功地解決了“概念來源”如何施行的問題。
然而,筆者通過查閱來源原則變革的相關文獻發(fā)現(xiàn)檔案學者在論述來源原則的變革時,只是簡單提出元數(shù)據(jù)與來源原則的變革擁有密不可分的關系。但卻并沒有完整描述清楚元數(shù)據(jù)與這種變革到底有哪些深層次聯(lián)系,即元數(shù)據(jù)在來源原則變革的產(chǎn)生、來源原則的發(fā)展、來源原則變革成果及其應用等階段具體扮演著什么角色,以及在各個階段的作用程度如何。筆者認為,元數(shù)據(jù)與來源原則變革的深層次聯(lián)系的研究是非常必要的,不僅能夠促使檔案學界對來源原則變革過程和成果等方面有更深刻和清晰的認識,更能夠使檔案學者通過元數(shù)據(jù)概念更好地解釋“概念來源”的內(nèi)涵以及通過元數(shù)據(jù)技術更好地推進“概念來源”的實際操作,增強來源原則在電子時代的生命力。
二、元數(shù)據(jù)是來源原則變革的誘因
(一)元數(shù)據(jù)概念在檔案領域的引用
元數(shù)據(jù)是信息技術領域的名詞,其在檔案領域的引用緣于檔案學者試圖通過元數(shù)據(jù)來解決概念來源的現(xiàn)實施行,檔案學界對元數(shù)據(jù)的定義有三個發(fā)展階段:元數(shù)據(jù)[1]首先由電子文件專家戴維比爾曼引進電子文件研究領域,這一階段檔案學者將元數(shù)據(jù)在信息技術領域的定義直接移植到檔案領域,即將其定義為描述數(shù)據(jù)的數(shù)據(jù),即元數(shù)據(jù)的含義與計算機技術領域中的元數(shù)據(jù)的含義是一致的。第二階段檔案學者將其定義為著錄元數(shù)據(jù),這一階段元數(shù)據(jù)在檔案領域有其更為專指的性質(zhì)和含義,即元數(shù)據(jù)是關于單一電子文件和文件組合的背景及其相互關系的結(jié)構(gòu)化著錄數(shù)據(jù),這里的著錄元數(shù)據(jù)被檔案人員解釋為著錄信息。第三階段檔案學者將其定義為電子文件管理元數(shù)據(jù),認為元數(shù)據(jù)是自始至終地描述文件的背景、內(nèi)容、結(jié)構(gòu)及其管理的數(shù)據(jù)。
從元數(shù)據(jù)定義在檔案領域的三個發(fā)展階段可以看出:一方面元數(shù)據(jù)本身與電子文件的背景、內(nèi)容、結(jié)構(gòu)等方面有著密不可分的關系,包括電子文件的格式、題名、關鍵詞、作者、版權信息等數(shù)據(jù),這些涉及電子文件背景、內(nèi)容、結(jié)構(gòu)等信息的數(shù)據(jù)與文件的來源息息相關。另一方面,隨著元數(shù)據(jù)涵義在檔案領域的具體化和專指化,檔案學者對元數(shù)據(jù)的理解更加深刻、應用更加便利,從而滿足了來源原則需要很好地描述電子文件來源信息的要求。因此,筆者認為元數(shù)據(jù)在檔案領域的引用很好地促進了“實體來源”向“概念來源”的變革。
(二)元數(shù)據(jù)以電子文件為橋梁影響來源原則
電子文件時代,文件的來源聯(lián)系更為復雜,無法像紙質(zhì)文件一樣具體到某一實實在在的機構(gòu)、組織或個人。[2]大量的文件管理系統(tǒng)、各種各樣的文件載體以及多元的文件形成活動存在于眾多辦公點,分散在不同的地理空間,也跨越不同的時間、不再對應內(nèi)部的基層組織機構(gòu)。計算機和電信革命急劇加速了這種分散化和分離化,業(yè)務職能現(xiàn)已跨越所有形態(tài)的結(jié)構(gòu)或組織界限。因此,來源原則在電子時代發(fā)生變革成為必然,從而有了“概念來源”的出現(xiàn),既能使電子文件整理適合來源原則的“來源同一性”內(nèi)涵,又能解決電子文件來源分散的矛盾。
但筆者認為,電子文件的出現(xiàn)雖然是來源原則變革的最顯而易見的緣由,但究其根本還是元數(shù)據(jù)在起決定性作用。相對于紙質(zhì)文件,電子文件的形成與計算機密切相關,因此形成了數(shù)量龐大、內(nèi)容復雜依賴機讀的元數(shù)據(jù)記錄。通過這些元數(shù)據(jù)記錄我們并不能輕易地識別出不同電子文件的傳統(tǒng)意義上的“來源”聯(lián)系,從而對傳統(tǒng)意義上的“實體來源”造成了沖擊。因此,正因為電子文件比紙質(zhì)文件擁有復雜的背景、內(nèi)容、結(jié)構(gòu)及管理要求,“實體來源”才會顯得不適用,所以作為描述電子文件背景、內(nèi)容、結(jié)構(gòu)、管理要求等內(nèi)容的元數(shù)據(jù)才是來源原則出現(xiàn)變革的真正誘因,是來源原則變革的本質(zhì)所在。endprint
三、元數(shù)據(jù)是來源原則變革成果形成的助力者
(一)實體來源向概念來源的轉(zhuǎn)變需要利用元數(shù)據(jù)進行解釋
來源原則變革的一個顯著成果就是“實體來源”向“概念來源”的轉(zhuǎn)變?!案拍顏碓础笔菍Α皩嶓w來源”的繼承和發(fā)展。在保持“來源同一性”內(nèi)涵的前提下將“來源”的定義進行新的闡釋以適應電子文件整理的需要。[3]馮惠玲教授認為“這個來源就是指文件的形成過程及背景,即文件是由誰,在什么條件下,運用哪些數(shù)據(jù),為了什么目的,采用了何種結(jié)構(gòu)形式的等方面的情況”。通過馮惠玲教授對“概念來源”的論述可以發(fā)現(xiàn)[4]“概念來源”的實際操作需要檔案工作者獲取與電子文件生成、保管、利用相關的各種數(shù)據(jù),這也就是所謂的元數(shù)據(jù)。沒有元數(shù)據(jù)的出現(xiàn),檔案工作者無法細節(jié)性地描述電子文件的來源信息,所以,元數(shù)據(jù)的出現(xiàn)為我們解釋何謂“概念來源”提供了便利,成功地使“概念來源”更加具體化。
(二)“概念來源”的應用對元數(shù)據(jù)的依賴性
1.元數(shù)據(jù)貫穿于電子文件全程管理的各個階段。電子文件的全程管理思想就是指,對電子文件從產(chǎn)生到永久保存或銷毀的整個生命周期進行全程管理。[5]從縱向來看,電子文件的整個生命周期可以劃分為電子文件管理的系統(tǒng)設計、電子文件形成、電子文件運行、電子文件維護四個階段。在電子文件管理系統(tǒng)設計階段需要設計出元數(shù)據(jù)模型,從而對系統(tǒng)捕捉哪些方面的文件信息做出規(guī)定。在電子文件形成階段和電子文件運行階段,文件的產(chǎn)生以及流轉(zhuǎn)會按照事先規(guī)定好的元數(shù)據(jù)模型產(chǎn)生一個與之相對應的不斷補充的元數(shù)據(jù)表,通過該元數(shù)據(jù)表可以對解讀該文件的內(nèi)容、背景、結(jié)構(gòu)信息、操作過程等。電子文件的維護階段是指對電子文件的原始記錄性進行維護,而元數(shù)據(jù)則是必不可少的依據(jù),離開了元數(shù)據(jù),電子文件的原始記錄性無法得到保障。因此,我們可以發(fā)現(xiàn)從電子文件管理的系統(tǒng)設計到電子文件的最終維護都少不了元數(shù)據(jù)的參與,它貫穿于電子文件全程管理的各個階段。
2.元數(shù)據(jù)技術能夠?qū)崿F(xiàn)電子文件的全程管理。電子文件時代,適用于紙質(zhì)文件全程管理的方法和手段已經(jīng)無法有效解決電子文件這四個階段的全程管理,因此我們需要尋求創(chuàng)新和突破?;谠獢?shù)據(jù)在電子文件全程管理中扮演著至關重要的角色,所以能夠?qū)崿F(xiàn)電子文件全程管理的突破點就在于元數(shù)據(jù)技術的應用。
之所以說元數(shù)據(jù)技術是電子文件全程管理中的關鍵,是因為它能夠動態(tài)功能與靜態(tài)功能相結(jié)合全面監(jiān)管電子文件的形成過程。[6]靜態(tài)功能是指元數(shù)據(jù)的靜態(tài)映射。元數(shù)據(jù)中的數(shù)據(jù)記錄與電子文件中的信息內(nèi)容、背景、結(jié)構(gòu)信息構(gòu)成了一一對應的映射關系,因此,元數(shù)據(jù)就可以完整地記錄電子文件的原始狀態(tài)和生成環(huán)境。元數(shù)據(jù)的動態(tài)功能是指它可以動態(tài)地獲取電子文件管理的各項信息。[7]國際《都柏林核心研究項目》將元數(shù)據(jù)的研究作為解決網(wǎng)絡環(huán)境查找信息的重點,根據(jù)著錄信息的類型和范圍,將元數(shù)據(jù)分為三部分:與文件內(nèi)容有關的數(shù)據(jù)、對文件負有責任有關的數(shù)據(jù)以及對文件說明的有關數(shù)據(jù)。通過這樣科學的分類,可以達到對電子文件全方位的描述和著錄,從而動態(tài)地獲取電子文件管理的各項信息。因此,沒有元數(shù)據(jù)技術在電子文件全程管理中的應用,來源原則變革成果的應用也就成為了紙上談兵。不可否認,不具有任何可操作性的理論成果注定會被世界淘汰。所以,筆者認為,將元數(shù)據(jù)和元數(shù)據(jù)技術稱為來源原則成果形成的有力助手完全不為過。
四、元數(shù)據(jù)是來源原則變革成果與檔案工作實踐的黏合劑
(一)增強了來源原則在電子文件時代的生命力
電子文件時代,一方面我們無法依據(jù)“傳統(tǒng)來源”原則去掌握電子文件的來源聯(lián)系,[8]另一方面“概念來源”雖然能通過重新定義來源解決“傳統(tǒng)來源”概念無法解決的矛盾,但其內(nèi)涵又過于抽象和難以把握,電子文件之間的聯(lián)系更多是計算機之間的邏輯鏈接,因此“概念來源”在實際中的具體操作成為了難題。
而元數(shù)據(jù)的出現(xiàn)正好解決了這個難題。檔案界通過不斷努力推進檔案資料元數(shù)據(jù)的建設來獲取電子文件生成、保管、利用相關的數(shù)據(jù)。[9]例如,以權利元數(shù)據(jù)、重要屬性元數(shù)據(jù)、特殊類型數(shù)字資源等為代表的元數(shù)據(jù)元素的不斷擴展,為更全面地描述電子文件的來源及不同文件之間的聯(lián)系帶來了便利。再例如,元數(shù)據(jù)語義技術的發(fā)展能促進電子文件內(nèi)容信息的識別、語法的匹配等等,幫助元數(shù)據(jù)更好地識別出不同電子文件的來源信息。
總之,元數(shù)據(jù)建設的不斷進步,包括元數(shù)據(jù)標準的規(guī)范化、元數(shù)據(jù)元素的不斷充實、元數(shù)據(jù)技術的不斷進步等等都間接地為增強來源原則在電子文件時代的生命力作出了貢獻?!案拍顏碓础币栽獢?shù)據(jù)為媒介在堅持并發(fā)揚光大來源原則基本精神的同時更加靈活、巧妙地解釋來源概念。一方面能夠推動來源原則的理論發(fā)展,讓來源原則的內(nèi)涵能夠被人們所理解和把握。另一方面在社會實踐中,也使來源原則獲得了更廣泛的適用范圍和更廣闊的理論指導空間,很好地適應了電子文件的新特點,使來源原則在實踐中的操作性更強。
(二)拓寬了來源原則在檔案工作各個環(huán)節(jié)的適用性
傳統(tǒng)來源概念主要適用于檔案整理環(huán)節(jié),檔案工作者以文件的“來源”來對文件進行分類和組合。[10]而元數(shù)據(jù)支撐下的“概念來源”則不僅僅適用于檔案整理環(huán)節(jié),還擴充到鑒定、檢索、利用等環(huán)節(jié),甚至在這些環(huán)節(jié)的重要性已經(jīng)超越了檔案整理環(huán)節(jié)。
之所以來源原則在除檔案整理環(huán)節(jié)之外的其它環(huán)節(jié)也能有所適用,是因為為了完整描述電子文件之間的虛擬化來源聯(lián)系,伴隨著文件整個生命周期的元數(shù)據(jù)都會被保存,而這些元數(shù)據(jù)正是使得來源原則在檔案工作的其他環(huán)節(jié)也發(fā)揮重要作用的關鍵所在。例如,與文件相關的描述型元數(shù)據(jù)集,如目錄記錄、專門索引、用戶注解等元數(shù)據(jù)集就可以在檔案檢索環(huán)節(jié)發(fā)揮重要作用。檔案界可以通過大量的描述型元數(shù)據(jù)集在檔案管理系統(tǒng)中實現(xiàn)來源檢索,缺乏了元數(shù)據(jù),電子文件之間復雜的虛擬化聯(lián)系無法被描述,來源檢索也就沒法實現(xiàn)。除了檔案檢索環(huán)節(jié),魏雁飛學者認為現(xiàn)代職能鑒定理論要求將鑒定的著眼點放在文件形成者的職能、任務和活動上,也就是把鑒定視角“置于一種以文件前后關系為基礎,以來源為中心的框架之中,而不是置于以內(nèi)容為基礎的歷史文獻框架之中”,由上至下地判斷檔案的價值的這種思想實際是來源原則在檔案鑒定領域的應用。[11]在檔案利用環(huán)節(jié),以檔案元數(shù)據(jù)核心集,即對檔案自身形成過程中“歷史聯(lián)系”信息的完整描述信息為依托,建立基于來源的用戶個性化服務。檔案元數(shù)據(jù)核心集便于檔案資源組織、便于檔案資源身份驗證,能夠?qū)z索到的同一來源文件與目標用戶自身屬性相結(jié)合,從而滿足檔案用戶個性化需求。
五、結(jié)語
元數(shù)據(jù)作為伴隨文件整個生命周期的數(shù)據(jù)信息,是對文件形成過程的完整描述。在電子文件時代,它極大地方便了檔案工作者對文件,特別是電子文件來源聯(lián)系的把握。在來源原則到新來源觀的整個創(chuàng)變過程中發(fā)揮著不可替代的作用。它是來源原則變革的誘因、是來源原則變革成果形成的助力者、也是來源原則變革成果與社會實踐的黏合劑。自元數(shù)據(jù)引入檔案領域以來,檔案學者一直在積極探索檔案領域的元數(shù)據(jù)建設與發(fā)展,形成了眾多技術成果和理論成果,這些理論和成果為更好地解釋和在實踐中應用來源原則發(fā)揮了極大地作用。沒有了元數(shù)據(jù),來源原則的變革也就缺乏了動力,因此未來筆者也希望元數(shù)據(jù)能夠在檔案領域發(fā)揮著更為寶貴的作用,能夠推動檔案學走向更高的巔峰,成為檔案學科與其他學科融會貫通的典范。
注釋及參考文獻:
[1]于斌,周晶.淺析元數(shù)據(jù)概念在檔案領域中的發(fā)展[J].機電兵船檔案,2015(1):45-47.
[2]何嘉蓀,樓淑君.后保管時代基礎理論研究之三——新來源觀解析[J].浙江檔案,2013(3):9-14.
[3]于斌,周晶.淺析元數(shù)據(jù)概念在檔案領域中的發(fā)展[J].機電兵船檔案,2015(1):45-47
[4]特里·庫克,李音.對數(shù)字時代來源原則的反思[J].檔案學研究,2011(1):82-85.
[5]葉曉林.電子文件全程管理之思考[J].檔案學研究,2005(1):46-50.
[6]黃萃.基于元數(shù)據(jù)的電子文件全程管理[J].檔案管理,2003(4):16-18.
[7]徐維.元數(shù)據(jù):電子文件管理的關鍵所在[J].山西檔案,2000(4):11-14.
[8]祭鴻雁.“新來源觀”:實質(zhì)與意義探析[J].檔案學通訊,2003(1):21-25.
[9]劉建華,張智雄.保存元數(shù)據(jù)的發(fā)展趨勢研究[J].圖書館雜志,2016(6):10-16.
[10]魏雁飛.來源原則在電子信息化時代的傳承與創(chuàng)變[C]//2008年檔案工作者年會.2008.
[11]田偉,韓海濤.發(fā)揮檔案元數(shù)據(jù)核心集作用推進“互聯(lián)網(wǎng)+檔案”建設[J].檔案,2016(6):5-9.endprint