王春芳 蘭日晶 張雯 周可 袁方
摘 要:隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,當(dāng)前時(shí)代已經(jīng)進(jìn)入了大數(shù)據(jù)技術(shù)時(shí)代,大數(shù)據(jù)、云計(jì)算等網(wǎng)絡(luò)信息技術(shù)的應(yīng)用已經(jīng)逐漸滲透到了社會的各個(gè)領(lǐng)域,檔案信息管理模式也因受到了新技術(shù)的影響而面臨管理思維和方式的變革,推動傳統(tǒng)檔案信息管理工作的理念、目標(biāo)和執(zhí)行手段發(fā)生轉(zhuǎn)變,對檔案信息管理事業(yè)的現(xiàn)代化建設(shè)和長遠(yuǎn)發(fā)展具有重要意義。鑒于此,文章對大數(shù)據(jù)技術(shù)在檔案管理中的應(yīng)用進(jìn)行了研究,以供參考。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);檔案管理;應(yīng)用策略
1 大數(shù)據(jù)技術(shù)的內(nèi)涵
1.1 大數(shù)據(jù)技術(shù)的概念
大數(shù)據(jù)是一種大規(guī)模的數(shù)據(jù),是指在一定時(shí)間和空間內(nèi)利用一些工具和軟件采集的數(shù)據(jù),這種數(shù)據(jù)是一種資產(chǎn),利用大數(shù)據(jù)可以獲得足夠的信息,實(shí)現(xiàn)數(shù)據(jù)采集,有助于為決策提供科學(xué)的信息和依據(jù)。大數(shù)據(jù)就是海量的數(shù)據(jù),信息呈現(xiàn)快速增長的特點(diǎn),以計(jì)算機(jī)技術(shù)為基礎(chǔ),采用一些科學(xué)軟件進(jìn)行數(shù)據(jù)處理,對數(shù)據(jù)的分布、類型等進(jìn)行分析和處理。大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜,數(shù)據(jù)多元化明顯,數(shù)據(jù)庫的建立是一種主要的依托形式,通過計(jì)算機(jī)設(shè)備和網(wǎng)絡(luò)可以對大數(shù)據(jù)進(jìn)行存儲和分類,實(shí)現(xiàn)對未來的預(yù)測。
1.2 大數(shù)據(jù)技術(shù)的特點(diǎn)
大數(shù)據(jù)技術(shù)是一種非結(jié)構(gòu)性的數(shù)據(jù)處理技術(shù),可以提取有價(jià)值的信息,處理數(shù)據(jù)的規(guī)模較大。從人類文明產(chǎn)生之后印刷材料存儲量較小,個(gè)人計(jì)算機(jī)硬盤容量有所提高,互聯(lián)網(wǎng)企業(yè)或系統(tǒng)存儲容量更大,且數(shù)據(jù)處理能力較強(qiáng)。網(wǎng)絡(luò)存儲中的惡大數(shù)據(jù)資源十分豐富,類型較多,包括文字、圖片、音頻、視頻等資料。利用大數(shù)據(jù)技術(shù)可以對大規(guī)模的信息和數(shù)據(jù)進(jìn)行分析和提取,運(yùn)算效率較高,可以從海量數(shù)據(jù)中心選出所需的和有價(jià)值的信息和數(shù)據(jù)。大數(shù)據(jù)技術(shù)的計(jì)算和分析對象是大規(guī)模的網(wǎng)絡(luò)數(shù)據(jù),大數(shù)據(jù)的特點(diǎn)是十分鮮明的。
2 大數(shù)據(jù)技術(shù)應(yīng)用于檔案管理的重要性
2.1 有助于促進(jìn)智慧城市的發(fā)展
隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,社會信息化進(jìn)程逐漸加快,智慧城市這一概念應(yīng)運(yùn)而生,智慧城市建設(shè)體現(xiàn)在城市基礎(chǔ)設(shè)施建設(shè)上,包括交通建設(shè)、亮化美化工程,智慧城市建設(shè)也包括檔案館的建設(shè)和管理,智能檔案管理也是重要的工作之一。傳統(tǒng)紙質(zhì)檔案管理存在很多問題,包括容易丟失,存儲時(shí)間較短,查詢難度較大,耗時(shí)費(fèi)力,這樣電子檔案和數(shù)字化檔案管理就顯示出了更大的優(yōu)勢,因此,大數(shù)據(jù)技術(shù)應(yīng)用在檔案管理中對于智慧城市的發(fā)展具有顯著的作用。
2.2 有助于促進(jìn)檔案管理信息化
傳統(tǒng)檔案管理模式較為落后,比較依靠人工的形式,紙質(zhì)檔案資料較多,紙質(zhì)檔案容易受外界環(huán)境因素的影響,包括氣候、溫度、濕度、檔案室條件等等,紙質(zhì)檔案容易被腐蝕、容易發(fā)生風(fēng)化,且傳統(tǒng)檔案資料查詢提取難度大,大數(shù)據(jù)技術(shù)可以將檔案資料進(jìn)行分類,進(jìn)而做好編目、檢索的工作,大數(shù)據(jù)技術(shù)是一種可以滿足多元化檔案管理需要的技術(shù),另外,大數(shù)據(jù)技術(shù)的應(yīng)用可以促進(jìn)檔案管理的信息化和數(shù)字化。
2.3 有助于實(shí)現(xiàn)檔案存儲的數(shù)字化
檔案的存儲問題是至關(guān)重要的問題之一,現(xiàn)階段,檔案資料數(shù)量和規(guī)模不斷增加,檔案資料中的關(guān)鍵信息和數(shù)據(jù)也在不斷增加,結(jié)合檔案資料的實(shí)際情況,實(shí)現(xiàn)最檔案資料的存儲是具有較為現(xiàn)實(shí)意義的。大數(shù)據(jù)技術(shù)的應(yīng)用可以建立強(qiáng)大的數(shù)據(jù)庫和云端檔案庫,可以對檔案資料進(jìn)行線上存儲,實(shí)現(xiàn)檔案資料的傳遞和共享,還可以分析檔案資料背后隱藏的信息,可以挖掘更深入的數(shù)據(jù),可以提高檔案管理的效率,提高檔案的使用率。
3 大數(shù)據(jù)技術(shù)在檔案管理中的應(yīng)用
3.1 利用人工智能技術(shù)實(shí)現(xiàn)對檔案信息資源的快速整理
隨著人工智能技術(shù)的快速發(fā)展與應(yīng)用普及,檔案信息管理工作的智能化程度大幅提高,突破了傳統(tǒng)檔案信息管理工作中紙張和空間媒介載體的桎梏,通過結(jié)合現(xiàn)代計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)信息技術(shù),在數(shù)據(jù)網(wǎng)絡(luò)中輕松實(shí)現(xiàn)對于檔案信息資源的收集、分類、儲存、檢索和分析等一條龍業(yè)務(wù)完成檔案管理流水工作,比如通過人工智能的“文本挖掘”功能實(shí)現(xiàn)在復(fù)雜繁多的檔案資料中快速采集和獲取需要的有價(jià)值的信息資源,大大減輕了檔案管理人員的工作難度,同時(shí)也在一定程度上避免了人為產(chǎn)生的失誤,使檔案信息資源的整理更加快速和便捷,有效提高了檔案管理的現(xiàn)代信息化建設(shè)水平。
3.2 大數(shù)據(jù)技術(shù)時(shí)代加強(qiáng)檔案信息數(shù)據(jù)資源的共建與共享
在大數(shù)據(jù)技術(shù)時(shí)代,通過大數(shù)據(jù)、云計(jì)算等先進(jìn)的現(xiàn)代網(wǎng)絡(luò)信息技術(shù)將海量繁雜的檔案信息資源數(shù)字化儲存,并從其中提取有利用需求和價(jià)值的數(shù)據(jù),可以通過數(shù)據(jù)的網(wǎng)絡(luò)傳遞來實(shí)現(xiàn)各部門間和各社會群體間檔案信息資料的快速傳遞,并加強(qiáng)檔案資源互通分享的橫向聯(lián)系,真正實(shí)現(xiàn)“讓數(shù)據(jù)多跑路,群眾少跑腿”。通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)檔案信息資源的共建與共享,能夠使檔案信息管理工作更加公開透明,有助于各單位之間的互相監(jiān)督。同時(shí),還應(yīng)加強(qiáng)檔案信息數(shù)據(jù)傳遞過程中的網(wǎng)絡(luò)安全保障工作,并保證檔案管理所用相關(guān)設(shè)備的定期維護(hù),以充分支持現(xiàn)代檔案信息管理的信息化建設(shè)工作順利進(jìn)行,從而確保能夠爭取最大化實(shí)現(xiàn)檔案信息管理的社會價(jià)值。
3.3 利用數(shù)據(jù)挖掘技術(shù)以實(shí)現(xiàn)對檔案信息的充分開發(fā)與利用
現(xiàn)階段,我國檔案信息管理工作已實(shí)現(xiàn)基本的網(wǎng)絡(luò)化和自動化建設(shè),大部分檔案信息管理部門配備了專業(yè)計(jì)算機(jī)軟件和硬件,能夠通過建立對應(yīng)的檔案管理網(wǎng)絡(luò)信息操作系統(tǒng)或平臺來完成檔案信息數(shù)據(jù)的整理和分析,并實(shí)現(xiàn)針對有價(jià)值信息的“點(diǎn)對點(diǎn)”數(shù)據(jù)挖掘,為檔案管理業(yè)務(wù)工作的有效開展提供了大量具有重要參考意義的數(shù)據(jù)和信息資源,為我國檔案信息管理工作中檔案資源的優(yōu)化整合以及提高檔案管理服務(wù)質(zhì)量等方面提供了十分關(guān)鍵的大數(shù)據(jù)技術(shù)支持。為了進(jìn)一步優(yōu)化提升檔案管理中的數(shù)據(jù)挖掘技術(shù),對檔案數(shù)據(jù)進(jìn)行更深層次的處理與分析,相關(guān)計(jì)算機(jī)技術(shù)專業(yè)部門需要協(xié)助檔案管理部門設(shè)計(jì)和完善算法和模型,做好更具有導(dǎo)向性和針對性的特定數(shù)據(jù)的采集、分類、總結(jié)和分析,深度提升檔案信息資源的實(shí)際利用率和管理工作效率。檔案信息管理部門通過應(yīng)用最新類型的數(shù)據(jù)挖掘技術(shù),能夠突破受傳統(tǒng)管理模式限制的快速定向的檔案信息數(shù)據(jù)的開發(fā)和利用,進(jìn)從而一步提高現(xiàn)代檔案管理工作服務(wù)的主動性。
3.4 重視大數(shù)據(jù)挖掘技術(shù)在檔案信息化建設(shè)中的應(yīng)用
在當(dāng)前大數(shù)據(jù)環(huán)境下,檔案管理工作中數(shù)據(jù)挖掘和數(shù)據(jù)分析是最為核心的內(nèi)容,為了能夠使檔案數(shù)據(jù)挖掘與檔案用戶需求相適應(yīng),則需要重視大數(shù)據(jù)挖掘技術(shù)在檔案信息化建設(shè)中的應(yīng)用。具體針對用戶數(shù)據(jù)運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行深度挖掘,并對其進(jìn)行精準(zhǔn)分析,以便于為檔案用戶提供高質(zhì)量的服務(wù)。另外,在實(shí)際工作中,無論是深入挖掘檔案信息或是檔案用戶數(shù)據(jù),其所獲取的都是孤立的數(shù)據(jù),因此還要重視對數(shù)據(jù)相關(guān)性的分析,深入分析檔案信息與檔案用戶數(shù)據(jù)之間的關(guān)系,構(gòu)建一個(gè)較為完善的檔案數(shù)據(jù)關(guān)系網(wǎng),為檔案信息化建設(shè)工作的有序開展打下堅(jiān)實(shí)的基礎(chǔ)。
4 結(jié)語
綜上所述,大數(shù)據(jù)技術(shù)是網(wǎng)絡(luò)信息技術(shù)的一類,是針對海量數(shù)據(jù)的一種處理技術(shù),應(yīng)用于檔案管理中,主要作用在于對于檔案資料的分類、編目、存儲和提取等,提高這些過程的效率,促進(jìn)檔案傳統(tǒng)模式的變革,提高檔案資料的實(shí)際價(jià)值,為發(fā)揮檔案的作用搭建一種平臺,充分運(yùn)用現(xiàn)代技術(shù),實(shí)現(xiàn)精細(xì)化和規(guī)范化檔案管理方式的建立。
參考文獻(xiàn)
[1]陶水龍.大數(shù)據(jù)視野下檔案信息化建設(shè)的新思考[J].檔案學(xué)研究,2017(3):93-99.
[2]楊士春.大數(shù)據(jù)時(shí)代背景下的檔案管理[J].環(huán)球市場信息導(dǎo)報(bào),2016(47):103.
[3]王毅,趙淑梅.國有企業(yè)技術(shù)創(chuàng)新與檔案大數(shù)據(jù)管理安全戰(zhàn)略研究[J].檔案學(xué)通訊,2014(2):63-67.