和海金
【摘 要】本文綜合分析了大數(shù)據(jù)發(fā)展給檔案管理帶來(lái)的變革與機(jī)遇,以及對(duì)應(yīng)的風(fēng)險(xiǎn)和沖擊,提出應(yīng)當(dāng)順應(yīng)時(shí)代趨勢(shì),積極轉(zhuǎn)變思維,促進(jìn)大數(shù)據(jù)與檔案管理工作融合,同時(shí)給出了促進(jìn)融合發(fā)展的相關(guān)意見(jiàn)。
【關(guān)鍵詞】大數(shù)據(jù);檔案管理;融合發(fā)展
大數(shù)據(jù)一詞最初來(lái)源于ApacheOrg開(kāi)源組織的項(xiàng)目,那時(shí),它主要描述的是大量的數(shù)據(jù)集合,而現(xiàn)在大數(shù)據(jù)的意義變得愈加抽象,它可以指向任何一種數(shù)據(jù)類(lèi)型,無(wú)論這些數(shù)據(jù)是數(shù)字還是文字,是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的。在檔案管理這項(xiàng)時(shí)刻與數(shù)據(jù)和記錄打交道的領(lǐng)域,大數(shù)據(jù)時(shí)代的來(lái)臨,無(wú)疑會(huì)對(duì)傳統(tǒng)的檔案管理模式帶來(lái)巨大的沖擊,如何以新思維,新視角看待大數(shù)據(jù)對(duì)檔案管理這一領(lǐng)域的影響,是當(dāng)前亟待解決的重要問(wèn)題之一。
一、大數(shù)據(jù)發(fā)展給檔案管理帶來(lái)的變革與機(jī)遇
(一)檔案概念的泛化
大數(shù)據(jù)時(shí)代下,任何的信息可能產(chǎn)生價(jià)值,一條簡(jiǎn)單的購(gòu)物記錄,或者是一次去醫(yī)院看病的經(jīng)歷,甚至是旅游時(shí)一次不經(jīng)意地網(wǎng)絡(luò)照片分享。在大數(shù)據(jù)的背景下,這些信息都會(huì)被記錄下來(lái),逐漸累積,組成一個(gè)人的“檔案”,這樣一來(lái)檔案的概念就跳出了原來(lái)人們印象中的各類(lèi)表格和證明材料?!皺n案”的概念泛化了。
(二)數(shù)據(jù)挖掘與檔案管理
大數(shù)據(jù)挖掘,值得是通過(guò)數(shù)據(jù)的篩選、分析、整合,最終實(shí)現(xiàn)由數(shù)據(jù)向知識(shí)地轉(zhuǎn)變,充分發(fā)揮數(shù)據(jù)的效用。檔案館中大量的資料信息在大數(shù)據(jù)時(shí)代已經(jīng)變成了一筆重要的財(cái)富。有學(xué)者提出,未來(lái)檔案館的主要業(yè)務(wù)就是對(duì)大量數(shù)據(jù)的分析。檔案管理從原來(lái)單一的記錄和檢索,逐漸轉(zhuǎn)變?yōu)榱诵畔⑼诰蚝椭R(shí)獲取。
數(shù)據(jù)挖掘首先要對(duì)海量的數(shù)據(jù)進(jìn)行整理與分析,之后對(duì)數(shù)據(jù)進(jìn)行建模,找出數(shù)據(jù)之間的關(guān)聯(lián)性和規(guī)律性。此時(shí)檔案管理之中的信息就不僅僅來(lái)源于檔案本身,檔案的調(diào)取次數(shù),檔案的訪問(wèn)記錄,檔案的檢索路徑等一系列信息都會(huì)成為數(shù)據(jù),與檔案本身一起組成新的“檔案”,檔案中的數(shù)據(jù)來(lái)源和數(shù)據(jù)內(nèi)容都會(huì)得到極大的豐富。
(三)大數(shù)據(jù)與檔案管理的融合
要想實(shí)現(xiàn)檔案管理與大數(shù)據(jù)的融合發(fā)展,就必須完成三個(gè)方面的轉(zhuǎn)變。首先是由傳統(tǒng)管理模式向信息化管理模式的轉(zhuǎn)變,傳統(tǒng)的檔案以紙張為主,檢索和流通困難,已經(jīng)不適合大數(shù)據(jù)模式下檔案管理的要求,為此需要建立與紙質(zhì)檔案對(duì)應(yīng)的信息化的電子檔案,方便實(shí)現(xiàn)資源的共享。
其次是要由封閉向開(kāi)放轉(zhuǎn)變,過(guò)去的檔案管理,主要著眼于檔案資料的完整性和保密性,力求使檔案不受到外界的破壞和非法利用,而大數(shù)據(jù)時(shí)代的檔案管理,更加側(cè)重于服務(wù)性,檔案的開(kāi)放性要求提高。要求檔案部門(mén)及相關(guān)管理人員主動(dòng)向用戶(hù)提供信息抓取準(zhǔn)確的價(jià)值高價(jià)值知識(shí)服務(wù)。通過(guò)檔案的流通,使檔案得到了增值,發(fā)揮了其在靜滯狀態(tài)下無(wú)法發(fā)揮的作用。
第三是檔案的集中性和規(guī)范性,為了實(shí)現(xiàn)檔案的有效流通,同時(shí)方便對(duì)檔案進(jìn)行系統(tǒng)的建模,需要將原來(lái)分散的檔案統(tǒng)一整合起來(lái),通過(guò)資源的整合消除獨(dú)立的信息孤島,同時(shí)科學(xué)地劃分檔案類(lèi)型。這樣做不僅使檔案工作精細(xì)化,科學(xué)化,而且在對(duì)檔案的分析建模中也有很大的作用。
二、大數(shù)據(jù)對(duì)檔案管理帶來(lái)的風(fēng)險(xiǎn)和沖擊
數(shù)據(jù)共享化程度提高以及數(shù)據(jù)本身體量的增大,導(dǎo)致檔案的數(shù)據(jù)安全性受到了極大的沖擊。
(一)檔案系統(tǒng)自身安全風(fēng)險(xiǎn)
電子化的檔案存儲(chǔ)在服務(wù)器,個(gè)人電腦以及各類(lèi)存儲(chǔ)介質(zhì)中,同時(shí)由于信息的統(tǒng)一化,集中化程度提高。導(dǎo)致一旦關(guān)鍵硬件或軟件支持受到損害,往往會(huì)帶來(lái)比傳統(tǒng)檔案管理更大的危害和風(fēng)險(xiǎn)。人員誤操作,數(shù)據(jù)庫(kù)軟件故障,系統(tǒng)漏洞,這些都可能導(dǎo)致檔案數(shù)據(jù)的不可讀,不可寫(xiě)甚至完全損壞。而且隨著檔案系統(tǒng)結(jié)構(gòu)功能愈加復(fù)雜,其各類(lèi)軟硬件組成日益豐富,數(shù)據(jù)損壞和丟失的風(fēng)險(xiǎn)也隨之提高。
(二)外部惡意攻擊
由于大數(shù)據(jù)對(duì)流通性和開(kāi)放性的要求,導(dǎo)致信息的接口和終端激增,相比起傳統(tǒng)的檔案數(shù)據(jù)管理,大數(shù)據(jù)環(huán)境下檔案管理的外部風(fēng)險(xiǎn)十分巨大。同時(shí),檔案的系統(tǒng)化和精細(xì)化管理,使得別有用心之人檢索和獲取有價(jià)值檔案變得愈加容易。在這樣的環(huán)境下,檔案的流失和泄露輕則會(huì)侵犯?jìng)€(gè)人的隱私,使其人身、自由、財(cái)產(chǎn)等權(quán)利受到侵害。重則有可能造成國(guó)家機(jī)密的泄露,嚴(yán)重危害國(guó)家安全。
三、如何安全有效促進(jìn)檔案管理與大數(shù)據(jù)的融合
大數(shù)據(jù)是科學(xué)技術(shù)催生的新產(chǎn)物,在各國(guó)高速發(fā)展信息技術(shù),搶占信息領(lǐng)域高地的今天,為了方便文件的傳輸,備份、非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)以及檔案管理脫離舊模式實(shí)現(xiàn)從封閉管理向知識(shí)服務(wù)的轉(zhuǎn)變,這些都離不開(kāi)與大數(shù)據(jù)的融合。檔案管理人員應(yīng)當(dāng)拋棄故步自封,墨守成規(guī)的想法,積極促進(jìn)檔案管理與大數(shù)據(jù)的融合工作。但在融合的過(guò)程中還應(yīng)當(dāng)注意大數(shù)據(jù)給檔案管理帶來(lái)的安全風(fēng)險(xiǎn),采取科學(xué)有效手段,實(shí)現(xiàn)大數(shù)據(jù)與檔案管理的融合。
(一)構(gòu)建合理的檔案資源體系
豐富的檔案資源是檔案管理部門(mén)的重要優(yōu)勢(shì),是開(kāi)展檔案服務(wù)的資本和信息源頭。單純依靠紙質(zhì)的館藏檔案資源,形式過(guò)于單一。大數(shù)據(jù)時(shí)代,數(shù)據(jù)的來(lái)源呈爆炸增長(zhǎng),針對(duì)面向服務(wù)的檔案發(fā)展要求,應(yīng)當(dāng)針對(duì)不同的需求,對(duì)數(shù)據(jù)來(lái)源進(jìn)行遴選。同時(shí)為數(shù)據(jù)建立良好的索引結(jié)構(gòu),確保檔案資源可以高效精確地被提取和利用。
(二)積極發(fā)展高效數(shù)據(jù)采集及存儲(chǔ)技術(shù)
在建立好資源體系之后,下一個(gè)需要解決的問(wèn)題就是進(jìn)行高效的數(shù)據(jù)采集和存儲(chǔ),數(shù)據(jù)的獲取決定著系統(tǒng)能否得到有價(jià)值的信息輸入,數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)則直接影響著數(shù)據(jù)的后續(xù)處理、計(jì)算、交換以及系統(tǒng)的運(yùn)行速度。伴隨技術(shù)的發(fā)展,目前已經(jīng)出現(xiàn)了基于虛擬現(xiàn)實(shí)的檔案數(shù)據(jù)備份,基于云計(jì)算平臺(tái)的大數(shù)據(jù)智能存儲(chǔ)等存儲(chǔ)方式,技術(shù)人員應(yīng)當(dāng)著眼需求,積極在這方面進(jìn)行探索。
(三)努力建設(shè)精細(xì)的數(shù)據(jù)管理模式
當(dāng)數(shù)據(jù)獲取、存儲(chǔ)之后,由于各種數(shù)據(jù)來(lái)源渠道紛繁復(fù)雜,結(jié)構(gòu)各異,同時(shí)由于數(shù)據(jù)中非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)比例的增加,導(dǎo)致使用傳統(tǒng)的信息描述和索引方式已經(jīng)無(wú)法實(shí)現(xiàn)高效的數(shù)據(jù)挖掘。這也是制約檔案信息化建設(shè)的主要瓶頸之一,針對(duì)這一問(wèn)題,我國(guó)已經(jīng)發(fā)展了基于語(yǔ)義本體的檔案數(shù)據(jù)結(jié)構(gòu)和基于靜態(tài)離線排序策略的智能檔案檢索方式。同時(shí)積極進(jìn)行基于用戶(hù)的數(shù)據(jù)深度挖掘,使檔案管理服務(wù)更加智能。
(四)不斷加強(qiáng)檔案管理安全建設(shè)
檔案資源的安全問(wèn)題是檔案管理的核心問(wèn)題和頭等大事,在大數(shù)據(jù)發(fā)展愈加深入的今天,檔案安全形勢(shì)已經(jīng)出現(xiàn)變化,相比較傳統(tǒng)的檔案管理模式,其安全壓力大大增加,為此檔案建設(shè)的全程都需要將安全放在首位,從人員、設(shè)備、技術(shù)多個(gè)方面建設(shè)嚴(yán)密的檔案安全保護(hù)體系。
首先要推進(jìn)檔案保存場(chǎng)館的安全建設(shè),改善檔案保管條件,積極做好環(huán)境監(jiān)控,嚴(yán)防火災(zāi),盜竊。定時(shí)對(duì)安全設(shè)備進(jìn)行檢修維護(hù)排查安全隱患,檔案人員要牢固樹(shù)立安全意識(shí),建立嚴(yán)格人員管控和執(zhí)勤制度,積極培養(yǎng)專(zhuān)業(yè)技術(shù)過(guò)硬的大數(shù)據(jù)人才,成立檔案管理應(yīng)急小組。最后應(yīng)當(dāng)積極發(fā)展保密技術(shù),從硬件和軟件兩個(gè)角度出發(fā),不斷修復(fù)系統(tǒng)漏洞,為檔案保密提供良好的平臺(tái)環(huán)境。
【參考文獻(xiàn)】
[1]劉陽(yáng). 大數(shù)據(jù)時(shí)代檔案管理模式變化研究[D].湘潭大學(xué),2015.
[2]張文元,張倩.大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘[J].檔案管理,2016(02):33-35.
[3]閻曉峰.大數(shù)據(jù)與檔案資源開(kāi)發(fā)利用[J].中國(guó)檔案,2015(11):16-19.
[4]吳青霞.傳統(tǒng)檔案管理與“大數(shù)據(jù)-新媒體”融合途徑探索[J].山西檔案,2015(06):42-44.
[5]宋淑琴.大數(shù)據(jù)視野下檔案管理思維方式的轉(zhuǎn)變[J].檔案學(xué)研究, 2015 (03):36-39.