杜曉林
【摘要】大數(shù)據(jù)時代的到來,給檔案的管理工作帶來了新的難度與挑戰(zhàn)。本文從大數(shù)據(jù)時代檔案數(shù)據(jù)概念的轉(zhuǎn)變出發(fā),并從“點”“面”“空間”“時空”四個維度著眼,探究大數(shù)據(jù)時代檔案數(shù)據(jù)的四維結(jié)構(gòu)理論。
【關(guān)鍵詞】大數(shù)據(jù);檔案數(shù)據(jù);四維結(jié)構(gòu)理論
每一次科技革命都會對檔案工作產(chǎn)生巨大的影響。工業(yè)時代的高效率讓檔案數(shù)量激增,迫使檔案管理更為系統(tǒng)化、科學(xué)化;信息時代計算機的普遍應(yīng)用使電子文件的概念成為檔案管理工作必須面對的問題;而無論如何,2015年國務(wù)院下發(fā)的《國務(wù)院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》表明大數(shù)據(jù)時代已經(jīng)到來,在大數(shù)據(jù)浪潮席卷下的檔案概念有了全新的變化。
一、大數(shù)據(jù)時代的檔案數(shù)據(jù)
全球知名咨詢公司麥肯錫(Mc Kinsey)是最早提出“大數(shù)據(jù)時代”已經(jīng)到來的權(quán)威機構(gòu),該公司在2011年6月份的研究報告中明確指出大數(shù)據(jù)已經(jīng)開始滲透到各行各業(yè),逐漸成為各職能領(lǐng)域不可缺少的生產(chǎn)因素。不可否認的是,大數(shù)據(jù)時代的到來也對檔案學(xué)理論研究及檔案工作產(chǎn)生了很大的影響。就目前來說,我們一般所說的檔案,其通用的定義為:檔案是社會組織或個人在以往的實踐活動中直接形成的具有清晰、確定的原始記錄作用的固化信息。傳統(tǒng)的檔案管理方式采用了去粗取精的方法,將有用的、有價值的部分提取出來,而對于那些看似“無關(guān)緊要”的內(nèi)容被排除在外,這樣的方式在一定程度上節(jié)約了人力物力,提高了管理效率,但也造成了一部分檔案數(shù)據(jù)的損失。
在大數(shù)據(jù)時代,檔案具有來源的豐富性、數(shù)據(jù)的冗余性、載體的多樣性和內(nèi)容的混雜性等新的特征,數(shù)據(jù)與檔案間的概念區(qū)分越來越小,甚至可以寬泛地說:數(shù)據(jù)即檔案,可能單個數(shù)據(jù)沒有價值,但當它成為集合數(shù)據(jù)的一分子時,它的作用才能顯現(xiàn)出來,在此基礎(chǔ)上提取出的大量有價值的異構(gòu)數(shù)據(jù),成為我們所需的資源。因此,在大數(shù)據(jù)時代的引領(lǐng)下,檔案工作者亟須轉(zhuǎn)變思維,樹立起“數(shù)據(jù)即檔案”的大檔案觀,保證各類檔案數(shù)據(jù)的完整性與豐富性。
二、大數(shù)據(jù)時代檔案數(shù)據(jù)的四維結(jié)構(gòu)理解
(一)第一維——“點”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第一維是結(jié)構(gòu)中的“點”,其基本的構(gòu)成要素是檔案數(shù)據(jù)。這里面的數(shù)據(jù)并非元數(shù)據(jù),一般是指一個數(shù)字、一個名詞或是一張圖片等等。這是檔案數(shù)據(jù)的第一維,也是檔案數(shù)據(jù)的基礎(chǔ),以下各維的構(gòu)成都由檔案數(shù)據(jù)為基礎(chǔ)進行的。將檔案數(shù)據(jù)作為基本單位進行理解更具有靈活性,每個檔案數(shù)據(jù)都兼具兩種特點:一是作為信息主體,另一個則是信息背景。檔案數(shù)據(jù)的不斷累積,這些數(shù)據(jù)根據(jù)來源組合可以成為檔案信息。
(二)第二維——“面”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第二維是檔案中的“面”,其基本構(gòu)成要素是檔案信息。這里的檔案信息是由檔案數(shù)據(jù)與檔案背景組成的,數(shù)據(jù)轉(zhuǎn)化為信息被接受者接收的必要條件就是對背景的解讀。同一來源的檔案數(shù)據(jù)中必然存在可以互為背景的檔案數(shù)據(jù),通過對于背景的解讀,檔案數(shù)據(jù)就能成為具有利用價值的檔案信息。
(三)第三維——“空間”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第三維是檔案中的“空間”,其基本構(gòu)成要素是檔案知識。檔案知識是人類在實踐中認識客觀世界的成果。它包括事實、信息的描述或在教育和實踐中獲得的技能。它可以是關(guān)于理論的,也可以是關(guān)于實踐的。檔案知識是檔案信息在空間上的延展,統(tǒng)一來源具有一定相似性的檔案信息整合在一起。知識的傳輸過程是傳輸者將其知識轉(zhuǎn)換為數(shù)據(jù),數(shù)據(jù)通過一定的方式被利用者接受,然后對接收到的數(shù)據(jù)和背景重新整合成為信息,接受者根據(jù)自己的理解與推理能力重新加工成知識的過程。從這個傳輸過程中能看出接受者的能力在知識的接受過程中起決定性作用,經(jīng)過人的提煉推理信息才有可能成為知識,所以檔案知識是檔案信息加上利用者的個人經(jīng)驗組合而成的。
(四)第四維——“時空”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第四維是檔案中的“時空”,其基本構(gòu)成要素是數(shù)據(jù)化的檔案館。檔案數(shù)據(jù)的第四維已經(jīng)是檔案數(shù)據(jù)在時間與空間上的匯集了,此時的檔案數(shù)據(jù)已經(jīng)在時間與空間上進行延伸,是對于四方上下與古往今來分布的檔案信息進行整合推理的過程。而檔案數(shù)據(jù)在經(jīng)過四維結(jié)構(gòu)中的第四維整合后,為直接面向公眾服務(wù)提供了支持工具,服務(wù)方式也更為多樣化,使檔案工作向精品化、個性化、智能化的服務(wù)方向發(fā)展。
三、檔案數(shù)據(jù)四維結(jié)構(gòu)理論對檔案工作的指導(dǎo)意義
在大數(shù)據(jù)時代,檔案管理工作被賦予了新的形式與內(nèi)容,檔案數(shù)據(jù)的量化進程將大大加快,檔案數(shù)據(jù)四維結(jié)構(gòu)間的各個維度,即“點”“面”“空間”“時空”間的聯(lián)系將更加緊密與靈活,并且各個維度間的轉(zhuǎn)換速度得到有效提升,檔案信息流通程度變強,檔案利用效率變高,對檔案存儲系統(tǒng)也提出了更高的要求。但與此同時,檔案數(shù)據(jù)源的真實可靠性遭受質(zhì)疑,檔案數(shù)據(jù)的安全性、保密性受到嚴峻挑戰(zhàn),這也成為我們必須面對的問題。不過,毋庸置疑的是,大數(shù)據(jù)時代的發(fā)展必將引領(lǐng)檔案工作實現(xiàn)跨越式發(fā)展,更好地為需求者提供服務(wù)。
【參考文獻】
[1]馮惠玲,張輯哲.檔案學(xué)概論[M].北京:中國人民大學(xué)出版社,2006.