在不同的時代,檔案資源管理有著不同的主題??傮w來說,檔案資源管理的歷程可以分為三個階段,分別是傳統(tǒng)載體階段、數(shù)字化階段和數(shù)據(jù)化階段。
(一)傳統(tǒng)載體階段。在傳統(tǒng)的載體時代,檔案資源的管理還是依靠于實物,以至于各種檔案的調(diào)取以及使用都極其困難。當時的計算機還處于萌生階段,沒有計算機的協(xié)助,檔案資源的共享以及各方面都受到了嚴格的限制。
(二)數(shù)字化階段。隨著計算機的初步發(fā)展,檔案資源管理也步入了不一樣的階段——數(shù)字化階段。在數(shù)字化階段中,也有不同的定義,但是其核心都是可以計算機為載體去進行管理和共享,但是同樣存在不夠靈活的問題。在數(shù)字化的初級階段,是檔案著錄。美國率先進行檔案著錄,與傳統(tǒng)的檔案著錄不同,數(shù)字化中的檔案著錄是通過計算機來進行的。通過計算機對檔案進行分類,比如背景,類型,從而達到方便查找的目的。我們可以這樣認為,計算機著錄是檔案資源整合數(shù)據(jù)化的基礎,也是計算資源整合的關鍵環(huán)節(jié),直接關系到檔案資源管理今后的發(fā)展。
(三)數(shù)據(jù)化階段。計算機的快速發(fā)展帶動了信息技術的發(fā)展,從而也將檔案資源整合帶向了數(shù)據(jù)化的階段。數(shù)據(jù)化和數(shù)字化的根本區(qū)別就是數(shù)據(jù)化更加靈活有效,可以將在計算機中的文件進行精確的檢索和分析,以達到檔案資源管理智能化的目的。
檔案資源整合的數(shù)據(jù)化中最基本的功能就是實現(xiàn)全文數(shù)據(jù)庫。一方面,檔案資源的整體可以進行智能檢索。這個功能的實現(xiàn)大量減輕了人工檢索的工作強度,節(jié)約了大量的人力成本和時間成本。另一方面,數(shù)據(jù)庫中包含了全部的內(nèi)容,可以提供在線的全文閱讀。其中數(shù)據(jù)庫的構建,需要包括不同種類檔案資源的分類方式,檢索關鍵詞搜索等內(nèi)容。在實現(xiàn)了全文數(shù)據(jù)庫的前提下,目前的檔案資源整合正在向著檔案大數(shù)據(jù)平臺發(fā)展,這是檔案資源管理和整合的終極目標。通過大數(shù)據(jù)的分析作用,對各個部門檔案中的龐大數(shù)據(jù)進行管理,從而有效地提高工作的效率。
順應時代而生的數(shù)據(jù)化檔案資源整合,在新的時代背景之下又探尋了不一樣的路徑和方法。
(一)關聯(lián)數(shù)據(jù)和資源整合相結合。在新的背景之下,對檔案資源整合提出了更高的要求。傳統(tǒng)的檔案資源之間的關系是微弱的,甚至可以說彼此相互獨立。但是,隨著信息技術的發(fā)展,我們可以利用數(shù)據(jù)化時代的優(yōu)勢,對不同的檔案資源進行結合,從而擺脫傳統(tǒng)檔案數(shù)據(jù)之間相互獨立的局面。其中,數(shù)據(jù)之間得到關聯(lián),需要從三個維度下手。首先是打破封閉環(huán)境,數(shù)據(jù)化的檔案資源不同于傳統(tǒng)式的館藏資源,它可以通過互聯(lián)網(wǎng)平臺進行瀏覽和分享,所以這就為打破封閉環(huán)境提供了基礎。其次是減少數(shù)據(jù)的重復和冗余。由于信息的關聯(lián),檔案資源之間打破了孤立的環(huán)境,從而很自然地減少了數(shù)據(jù)冗余。再者,挖掘數(shù)據(jù)之間的關聯(lián)。不同的檔案資源之間存在的關聯(lián)關系需要依靠大數(shù)據(jù)的挖掘才能實現(xiàn),而通過挖掘數(shù)據(jù)之間的關聯(lián),可以形成有共同點的檔案資源之間的高度融合,甚至可以產(chǎn)生新的信息。
(二)內(nèi)容整合管理。內(nèi)容整合是數(shù)據(jù)化檔案資源整合區(qū)別于數(shù)字化的一個關鍵點所在。數(shù)字化時代的檔案資源整合是對內(nèi)容的共享化呈現(xiàn),而數(shù)據(jù)化的檔案資源整合是對內(nèi)容的深度整合。其本質在于通過對檔案資源中數(shù)據(jù)的采集以及信息管理等方式,對不同類型的檔案資源以及不同數(shù)字格式之間的檔案資源進行無障礙的整合。此外,內(nèi)容整合管理再加上相應的技術手段,從而實現(xiàn)檔案資源的全文檢索,關鍵詞檢索等。一方面是為用戶提供了更加便捷的資源查找方式,另一方面是在檔案資源的整合和協(xié)同上發(fā)揮重要的作用。
(三)數(shù)據(jù)挖掘。在大數(shù)據(jù)的背景之下,數(shù)據(jù)挖掘必不可少。在檔案資源整合中,由于檔案資源的龐雜性以及來源廣泛性,數(shù)據(jù)挖掘技術的深入成為了一個很大的挑戰(zhàn)。所謂數(shù)據(jù)挖掘,是對檔案信息資源進行情報檢索、捕捉隱藏的可用資源的有用途徑。所以,做好檔案資源整合的數(shù)據(jù)挖掘工作,可以促進資源整合的精細化,從而使得檔案資源整合工作的效率更高。
檔案資源整合的數(shù)據(jù)化發(fā)展是必然趨勢,尤其是處于當前這個信息技術高速發(fā)展的大背景之下。從傳統(tǒng)的檔案資源管理和整合,到數(shù)字化再到數(shù)據(jù)化的過程中,檔案數(shù)據(jù)資源整合變得更加智能、更加高效。