(北京市懷柔區(qū)職業(yè)學(xué)校,北京 101407)
隨著信息技術(shù)、計(jì)算機(jī)技術(shù)飛速發(fā)展,利用大數(shù)據(jù)來處理海量的數(shù)據(jù),可以為企業(yè)獲得高精度的數(shù)據(jù)支持。此外,大數(shù)據(jù)處理數(shù)據(jù)的速度也會(huì)呈幾何的增長。當(dāng)前利用大數(shù)據(jù)來分析數(shù)據(jù),已經(jīng)成了檔案管理的一個(gè)重要運(yùn)營模式。在大數(shù)據(jù)時(shí)代下,對(duì)于信息管理要求比較高,而且在檔案工作中,大多數(shù)的數(shù)據(jù)信息以電子化方式來存儲(chǔ),利用大數(shù)據(jù)會(huì)提高對(duì)數(shù)據(jù)的分析效率。
大數(shù)據(jù)是當(dāng)今時(shí)代的產(chǎn)物,檔案管理歷史比較悠久。在新時(shí)代下,大數(shù)據(jù)技術(shù)在各行各業(yè)都有較大的應(yīng)用和普及,但是大數(shù)據(jù)在檔案管理中,也凸顯了一定的問題。
大數(shù)據(jù)是當(dāng)前信息處理分析的一個(gè)重要工具,其主要的特點(diǎn)就是可以處理海量的數(shù)據(jù),而且處理效率較高,同時(shí),處理數(shù)據(jù)的精度比較準(zhǔn)確。在海量的信息處理中,使用傳統(tǒng)技術(shù)會(huì)耗費(fèi)大量的時(shí)間,然而用大數(shù)據(jù)可以深入挖掘數(shù)據(jù)的潛在價(jià)值。在海量的數(shù)據(jù)信息內(nèi)部,可以通過大數(shù)據(jù)技術(shù),來構(gòu)建數(shù)據(jù)模型。數(shù)據(jù)管理人員利用網(wǎng)絡(luò)來搜集數(shù)據(jù)信息,相比傳統(tǒng)的技術(shù)來講,使用網(wǎng)絡(luò)化的技術(shù)收集的數(shù)據(jù)質(zhì)量更高,而且收集的數(shù)據(jù)導(dǎo)向性更明顯。在檔案管理中,利用大數(shù)據(jù)來構(gòu)建搜集引擎,使搜索的精度達(dá)到相應(yīng)的標(biāo)準(zhǔn),也能夠使數(shù)據(jù)檢索人員節(jié)省大量的檢索時(shí)間,給數(shù)據(jù)監(jiān)測人員帶來較大的便捷。大數(shù)據(jù)應(yīng)用到檔案管理中,實(shí)現(xiàn)了數(shù)據(jù)分析精度的提升,也能夠使檔案管理工作變得更加重要[1]。
應(yīng)用大數(shù)據(jù)技術(shù)在處理數(shù)據(jù)時(shí),需要數(shù)據(jù)量較大,處理一些零散的信息不能夠稱之為大數(shù)據(jù)分析。檔案管理人員要準(zhǔn)備海量的數(shù)據(jù),才能夠使用大數(shù)據(jù)工具來分析,這樣才能夠展現(xiàn)出大數(shù)據(jù)分析的優(yōu)勢。在當(dāng)前數(shù)據(jù)時(shí)代下,檔案管理大多都會(huì)保存電子數(shù)據(jù),檔案電子數(shù)據(jù)量規(guī)模較大,與傳統(tǒng)檔案資料不是一個(gè)量級(jí)。當(dāng)檔案資料數(shù)據(jù)量逐步增加,也會(huì)促使檔案管理模式產(chǎn)生較大的變革,需要利用大數(shù)據(jù)工具來開展檔案資料的分析。
處理檔案數(shù)據(jù)信息是檔案管理工作中的重要環(huán)節(jié),此時(shí)在開展大數(shù)據(jù)分析中,大多數(shù)的數(shù)據(jù)都會(huì)存儲(chǔ)于計(jì)算機(jī)內(nèi)部,與以往的紙質(zhì)資料管理來比,使用計(jì)算機(jī)來存儲(chǔ)數(shù)據(jù),可以減少資料保存時(shí)的面積,節(jié)省大量的建筑空間,而且計(jì)算機(jī)保存數(shù)據(jù)不會(huì)丟失。很多計(jì)算機(jī)內(nèi)部通常會(huì)以文件的方式來存儲(chǔ)數(shù)據(jù),當(dāng)數(shù)據(jù)量形成一定的規(guī)模之后,就要利用大數(shù)據(jù)的工具來分析數(shù)據(jù)。在數(shù)據(jù)時(shí)代下,檔案管理部門可以使原有的檔案數(shù)據(jù)向數(shù)字化發(fā)展,然后將高價(jià)值的檔案數(shù)據(jù)資料用掃描機(jī)來獲取紙質(zhì)檔案資料中的數(shù)據(jù)信息。將數(shù)據(jù)信息上傳到計(jì)算機(jī)平臺(tái)上,實(shí)現(xiàn)對(duì)數(shù)據(jù)的存儲(chǔ)。在整理檔案資料期間,要對(duì)原有的數(shù)據(jù)進(jìn)行格式化,使數(shù)據(jù)格式統(tǒng)一,這樣才能夠利用后期的大數(shù)據(jù)工具來分析,避免由于數(shù)據(jù)格式不統(tǒng)一,而影響了數(shù)據(jù)分析的精度。
推動(dòng)檔案資料信息化、數(shù)字化的發(fā)展,不僅要將數(shù)據(jù)存儲(chǔ)在服務(wù)器內(nèi)部,存儲(chǔ)在數(shù)據(jù)庫中,還要根據(jù)檔案信息進(jìn)行分類。將紙質(zhì)的檔案文件資料中的數(shù)據(jù),以Word、TXT 等格式來保存。應(yīng)用專業(yè)的數(shù)據(jù)庫軟件來存儲(chǔ)數(shù)據(jù)資料,并結(jié)合檔案信息的具體特征,應(yīng)用樹狀的結(jié)構(gòu)鏈的方式,來對(duì)數(shù)據(jù)進(jìn)行處置,這樣才能夠幫助檔案管理人員在利用大數(shù)據(jù)分析技術(shù)時(shí),可以實(shí)現(xiàn)快速地查找數(shù)據(jù),應(yīng)用數(shù)據(jù)結(jié)構(gòu)來存儲(chǔ)資料,才能夠體現(xiàn)出資料信息保存的價(jià)值[2]。
在信息化時(shí)代下,檔案管理部門要給內(nèi)部的管理人員開展一系列的大數(shù)據(jù)技術(shù)、信息技術(shù)、計(jì)算機(jī)技術(shù)的培訓(xùn),來提高職工的專業(yè)化水平,可以讓職工掌握大數(shù)據(jù)挖掘分析的技能,給內(nèi)部的檔案管理人才開展培訓(xùn)活動(dòng),制定培訓(xùn)計(jì)劃。結(jié)合單位檔案數(shù)字化的發(fā)展規(guī)劃、計(jì)劃等內(nèi)容,來設(shè)計(jì)培訓(xùn)方案。單位也可以在社會(huì)上招聘高端的數(shù)字化信息化人才,才能夠推動(dòng)檔案數(shù)據(jù)化的快速發(fā)展,管理人員使用數(shù)據(jù)庫信息軟件,來實(shí)現(xiàn)檔案數(shù)據(jù)資料的保存,也可以與外部人員公司合作。利用軟件公司的力量,來在單位內(nèi)部搭建檔案數(shù)據(jù)庫。軟件公司要給內(nèi)部的檔案人員開展一系列的技術(shù)培訓(xùn),讓其能夠靈活地操作軟件系統(tǒng),給單位培養(yǎng)高端的軟件人才。讓檔案管理人員掌握系統(tǒng)的軟件操作技能和知識(shí),單位要讓內(nèi)部的檔案管理工作者充分地認(rèn)識(shí)到檔案數(shù)字化、信息化的發(fā)展,對(duì)于未來的運(yùn)營發(fā)展的重要作用。檔案管理部門要積極地配合高層領(lǐng)導(dǎo)人員制定檔案數(shù)字化發(fā)展規(guī)劃,積極地配合軟件開發(fā)公司來研制軟件。檔案管理數(shù)據(jù)系統(tǒng)會(huì)加快單位內(nèi)部檔案數(shù)字化、信息化的發(fā)展,單位也要給檔案的數(shù)字化發(fā)展,提供一定的資金支持,引入外部新型大數(shù)據(jù)技術(shù),來高效地分析數(shù)據(jù)、處理數(shù)據(jù)。
當(dāng)前國內(nèi)大數(shù)據(jù)技術(shù)成為了檔案管理中的一個(gè)新發(fā)展方向,也是信息分析的一個(gè)主要工具。大數(shù)據(jù)可以深入地挖掘檔案資料中的價(jià)值,然后提高資料檢索的效率,也能夠轉(zhuǎn)變檔案管理模式。隨著檔案數(shù)據(jù)信息量逐步增加,這就給當(dāng)前的檔案管理技術(shù)提出了更高的要求,使用先進(jìn)的大數(shù)據(jù)技術(shù),才能夠確保單位的管理工作效率提升,給查閱檔案資料的人員提供更多的便捷。