張偉
摘要:文章在分析大數(shù)據(jù)和大數(shù)據(jù)時代內(nèi)涵與特征的基礎(chǔ)上,探討了大數(shù)據(jù)時代下的檔案開發(fā)和利用新變化、新特征,在此基礎(chǔ)上,提出了大數(shù)據(jù)時代檔案的數(shù)據(jù)價值開發(fā)和利用建議。
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)時代;檔案價值;檔案開發(fā);檔案的數(shù)據(jù)價值
引言
當(dāng)前,大數(shù)據(jù)影響范圍十分廣泛,影響程度十分深遠(yuǎn),遠(yuǎn)遠(yuǎn)超出了人們對此的想象,各行各業(yè)在信息化快速推進(jìn)中進(jìn)入到了大數(shù)據(jù)時代。檔案在大數(shù)據(jù)時代也呈現(xiàn)出與以往不同的明顯特點,其價值體現(xiàn)方式和開發(fā)利用方式,都有很大轉(zhuǎn)變,通過何種手段不斷提升其開發(fā)利用效率,成為學(xué)術(shù)界和實踐中重點關(guān)注的問題。
一、大數(shù)據(jù)和大數(shù)據(jù)時代的內(nèi)涵與特征
(一)大數(shù)據(jù)的內(nèi)涵和特征
目前,國內(nèi)外學(xué)術(shù)界對大數(shù)據(jù)還沒有一個統(tǒng)一的內(nèi)涵界定。例如,維基百科認(rèn)為大數(shù)據(jù)所涉及的資料數(shù)量遠(yuǎn)遠(yuǎn)超過過去數(shù)據(jù)的總和,目前主流數(shù)據(jù)處理軟件在短時間內(nèi)很難獲取、管理、處理并整理,成為幫助組織經(jīng)營決策更積極目標(biāo)的各類資訊;學(xué)者 John Rauser 對大數(shù)據(jù)的定義是:“任何超過一臺計算機(jī)所處理能力的各類數(shù)據(jù)?!敝稍児钧?肯錫對其定義是:“很難在短時間內(nèi),通過傳統(tǒng)數(shù)據(jù)庫的軟件工具進(jìn)行抓取、管理和處理的各類數(shù)據(jù)的集合。” 根據(jù)各個學(xué)者對其內(nèi)涵的界定可以看出,由于其研究的角度不同,導(dǎo)致其研究內(nèi)容的不同,對其內(nèi)涵的界定也各不相同。如果從數(shù)據(jù)本身和數(shù)據(jù)處理技術(shù)兩個角度來對大數(shù)據(jù)進(jìn)行理解的話,大數(shù)據(jù)就有廣義和狹義之分。狹義上的大數(shù)據(jù)主要指數(shù)據(jù)的形式和規(guī)模,大數(shù)據(jù)的結(jié)構(gòu)形式不僅包含了結(jié)構(gòu)化的數(shù)據(jù),更多是指非結(jié)構(gòu)化的數(shù)據(jù)和半結(jié)構(gòu)化的數(shù)據(jù),大數(shù)據(jù)的結(jié)構(gòu)形式多種多樣;從大數(shù)據(jù)的規(guī)模來說,大數(shù)據(jù)等同于海量的數(shù)據(jù),其規(guī)模十分龐大。廣義上的大數(shù)據(jù),不僅包含結(jié)構(gòu)形式和規(guī)模,而且還包含了數(shù)據(jù)處理技術(shù)。大數(shù)據(jù)的處理技術(shù)是指可以從那些不斷增長的信息和轉(zhuǎn)瞬即逝的大數(shù)據(jù)中獲取有價值的信息的能力。無論是從狹義角度還是從廣義角度來看大數(shù)據(jù),其核心仍然是大數(shù)據(jù),是那些超越傳統(tǒng)數(shù)據(jù)系統(tǒng)處理能力、不借用網(wǎng)絡(luò),無法用主流軟件工具和技術(shù)進(jìn)行分析的復(fù)雜數(shù)據(jù)集合。 大數(shù)據(jù)具有以下幾個方面的基本特征:一是數(shù)據(jù)的規(guī)模十分龐大;二是數(shù)據(jù)的多樣性,包含了各類文本數(shù)據(jù)、音頻數(shù)據(jù)、圖片數(shù)據(jù)和視頻數(shù)據(jù)等結(jié)構(gòu)化、半結(jié) 構(gòu)化及非結(jié)構(gòu)化的數(shù)據(jù)資料;三是數(shù)據(jù)在處理時效方面的高速性。
(二)大數(shù)據(jù)時代的內(nèi)涵和特征
大數(shù)據(jù)時代是建立在物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等現(xiàn)代網(wǎng)絡(luò)渠道中的廣泛、大量的數(shù)據(jù) 資源收集和整理基礎(chǔ)上的數(shù)據(jù)存儲、價值提升、智能處理和信息展示的信息時代。在大數(shù)據(jù)時代,人們可以從大量的數(shù)據(jù)中獲取可以轉(zhuǎn)換為推動人們生活方式變化 的有價值的各類知識。 大數(shù)據(jù)時代,具有以下幾個方面的特征:
第一,社會性。大數(shù)據(jù)時代,互聯(lián)網(wǎng)領(lǐng)域主要是以數(shù)據(jù)流通來取代產(chǎn)品流通,從而把生產(chǎn)演變成為服務(wù),把人工勞動演變成為信息勞動。
第二,廣泛性。大數(shù)據(jù)時代的互聯(lián)網(wǎng)技術(shù)快速發(fā)展并普及,計算機(jī)技術(shù)深入到社會各個領(lǐng)域,融入人們生活之中。人們在各個領(lǐng)域產(chǎn)生和采集到的數(shù)據(jù)數(shù)量十分巨大,甚至達(dá)到了前所未有的龐大。
第三,公開性。大數(shù)據(jù)時代越來越多的數(shù)據(jù)都被開放,都可以通過網(wǎng)絡(luò)獲取,這種公開性取決于網(wǎng)絡(luò)開放平臺是否受到法律支持或社會公認(rèn)。
第四,動態(tài)性。借助于互聯(lián)網(wǎng)而進(jìn)入到了大數(shù)據(jù)時代,充分體現(xiàn)了基于互聯(lián) 網(wǎng)的及時動態(tài)數(shù)據(jù),不僅數(shù)據(jù)在收集的時候具有動態(tài)性,而且數(shù)據(jù)存儲和數(shù)據(jù)處理技術(shù)也在不斷地動態(tài)發(fā)展,數(shù)據(jù)處理工具具有很強(qiáng)的動態(tài)性。
二、大數(shù)據(jù)時代的檔案管理變化和檔案價值
(一)大數(shù)據(jù)時代的檔案價值變化
傳統(tǒng)檔案管理中, 對于檔案價值的判斷和分析都是停留在信息層面,無論是參考價值還是憑證價值,也都是通過滿足人們檔案查詢需求和檔案利用需求而實現(xiàn)自身價值的,這些都可以統(tǒng)一理解為檔案的信息價值。但是,在大數(shù)據(jù)時 代,對于檔案價值的分析,不僅是停留在信息價值的層面,而且還有數(shù)據(jù)價值的層面,即檔案的數(shù)據(jù)價值。檔案的數(shù)據(jù)價值是指在大數(shù)據(jù)時代中,檔案作為重要的數(shù)據(jù)資源,其價值是通過數(shù)據(jù)處理技術(shù)、數(shù)據(jù)挖掘和數(shù)據(jù)應(yīng)用而體現(xiàn)的。 與檔案的信息價值相比,檔案的數(shù)據(jù)價值具有時效性、宏觀性、關(guān)聯(lián)性和隱深性的特點。
(二)檔案數(shù)據(jù)的創(chuàng)新
大數(shù)據(jù)豐富了檔案價值觀,而且還可以使學(xué)術(shù)界從新的維度去研究檔案價值,有利于新的檔案價值觀的形成,可以對大數(shù)據(jù)時代的檔案價值內(nèi)在規(guī)律進(jìn)行更加準(zhǔn)確的認(rèn)識和把握,對大數(shù)據(jù)時代檔案價值的內(nèi)涵進(jìn)行全面深刻理解,從而把檔案價值研究引向一個新的高度。檔案數(shù)據(jù)價值拓展了檔案的外延從而使那些原 有的沒有保存價值的文檔材料,重新進(jìn)行了歸檔,使其變得更有價值。
(三)檔案數(shù)據(jù)的價值
檔案管理工作的創(chuàng)新。首先,隨著數(shù)據(jù)技術(shù)的發(fā)展和成熟,電子檔案成為檔案的主要保存形式,電子文件歸檔和管理成為檔案工作的主要內(nèi)容;其次,隨著檔案載體的數(shù)據(jù)化,采用云存儲技術(shù),對檔案價值進(jìn)行挖掘,采集檔案數(shù)據(jù)價值已經(jīng)刻不容緩;再次,大數(shù)據(jù)時代的檔案管理,如果采取逐份鑒定的方式,已經(jīng)很難適應(yīng)形式發(fā)展要求,以一個事件、活動、項目,甚至是某個機(jī)構(gòu)全部 數(shù)據(jù)為基礎(chǔ)的宏觀檔案鑒定方法將在大數(shù)據(jù)時代顯現(xiàn)其優(yōu)勢。
三、大數(shù)據(jù)時代下的檔案數(shù)據(jù)價值開發(fā)和利用
(一)創(chuàng)新檔案數(shù)據(jù)價值開發(fā)和利用理念
要適應(yīng)大數(shù)據(jù)時代的發(fā)展要求,在數(shù)據(jù)檔案價值開發(fā)利用中,不斷創(chuàng)新理念,牢固樹立大開放、大檔案和大服務(wù)理念。數(shù)據(jù)價值開發(fā)的大檔案理念,通過對檔案資源的有效整合,特別是要更加注重對檔案數(shù)據(jù)和信息的獲取、分析和挖掘,通過各種挖掘工具的使用,使檔案數(shù)據(jù)更加真實、全面和客觀,使檔案中所反映的信息更加真實、全面和客觀,更好地為社會提供檔案數(shù)據(jù)信息服務(wù)。
(二)牢固樹立檔案數(shù)據(jù)價值的大服務(wù)理念
在檔案數(shù)據(jù)價值開發(fā)過程中,以用戶需求為導(dǎo)向,提供適銷對路的檔案數(shù)據(jù)信息服務(wù)產(chǎn)品,為社會各界提供參考,使檔案數(shù)據(jù)價值開發(fā)和利用的范圍更為廣泛,層次不斷提升。
結(jié)束語
總之,在大數(shù)據(jù)時代,檔案管理的價值和開發(fā)利用價值越發(fā)顯得重要。要充分與大數(shù)據(jù)結(jié)合,使檔案管理發(fā)揮出最大價值,實現(xiàn)檔案管理更科學(xué)、更廣泛的發(fā)展。
參考文獻(xiàn):
[1]李麗芳.大數(shù)據(jù)時代檔案信息利用及效果探析[J].城建檔案,2016(11):111-114
[2]李小晨.大數(shù)據(jù)時代背景下的檔案管理探討[J].云南檔案,2013(6):48-50
[3]詹秀琴.淺談網(wǎng)絡(luò)檔案信息資源的收集保存策略[J].黑龍江科技信息,2016(17):14-18
[4]焦明江.論我國檔案信息立法的完善[J].蘭臺世界,2015(2):21-24
[5]李宏實.關(guān)于對檔案信息交流的分析[J].黑龍江史志,2015(8):6-9