文?毛雯
大數(shù)據(jù)時代檔案管理思路創(chuàng)新
文?毛雯
隨著云計算、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)等新興媒介的服務(wù)大眾化,人類社會的數(shù)據(jù)種類和規(guī)模正以前所未有的速度在提升,大數(shù)據(jù)(Big Data)時代正式到來。大數(shù)據(jù)是指傳統(tǒng)的數(shù)據(jù)庫軟件工具所不能夠獲得、存儲、管理和分析的數(shù)據(jù),比較有代表性的大數(shù)據(jù)的定義是3V定義,即認(rèn)為大數(shù)據(jù)需要滿足三個特點,規(guī)模性(volume)、多樣性(variety)和高速性(velocity)。檔案作為國家機(jī)構(gòu)、社會團(tuán)體組織以及個人從事政治、軍事、經(jīng)濟(jì)、科學(xué)、技術(shù)、文化、宗教等活動直接形成的具有保存價值的各種文字、圖表、聲像,應(yīng)遵循“統(tǒng)一領(lǐng)導(dǎo),分級管理;維護(hù)檔案文件的完整與安全;便于社會或組織的利用”三個原則進(jìn)行管理。
表面上看大數(shù)據(jù)的思路和檔案管理的基本原則似乎截然不同。檔案要求統(tǒng)一管理,要有精確細(xì)致的分類,要保證其完整性與安全性。而大數(shù)據(jù)思想則強(qiáng)調(diào)數(shù)據(jù)的多樣化,通過多樣化、廣渠道的數(shù)據(jù)分析避免單一數(shù)據(jù)源帶來的誤差。所以大數(shù)據(jù)相關(guān)技術(shù)的應(yīng)用要基于一個開放式的系統(tǒng),而檔案則要建立起一個相對封閉的管理系統(tǒng)。然而,盡管大數(shù)據(jù)的一些理念初看上去似乎與檔案管理的要求格格不入,但是從社會發(fā)展的整體趨勢上看,我們會發(fā)現(xiàn)正是由于大數(shù)據(jù)的產(chǎn)生,才有可能對延續(xù)至今的檔案管理工作傳統(tǒng)模式帶來創(chuàng)新和改變,促使檔案管理工作日趨完善、便捷。
透過檔案工作的發(fā)展歷史,可以發(fā)現(xiàn)檔案管理工作的思路幾乎沒有多少創(chuàng)新改變,所承擔(dān)的責(zé)任也一直都很具體明確,所謂的變化也只是技術(shù)進(jìn)步以后發(fā)生的信息載體的變化。而在大數(shù)據(jù)的思路下,檔案管理發(fā)生改變的將不僅僅是信息載體,還有檔案管理工作的業(yè)務(wù)重點和業(yè)務(wù)流程。
(一)大數(shù)據(jù)化檔案管理是信息社會的必然
自從計算機(jī)和信息技術(shù)蓬勃發(fā)展至今,人類所創(chuàng)造的信息量比之前兩千年產(chǎn)生的信息量的總和還要多,極其驚人的信息量不僅僅是創(chuàng)造財富的來源,也成為信息管理機(jī)構(gòu)必須要應(yīng)對的負(fù)擔(dān)。如果不對這些海量信息加以區(qū)分,數(shù)據(jù)存儲過少必然會導(dǎo)致有價值信息的流失,數(shù)據(jù)存儲的冗余和過多則會帶來高昂的成本,在技術(shù)上也不現(xiàn)實。
檔案文件所記錄的是整個社會最核心的一部分?jǐn)?shù)據(jù),其管理和組織工作必然也會水漲船高,隨著整個社會信息量的爆炸而大量增加。大數(shù)據(jù)技術(shù)的相關(guān)理論對于分析和確定信息的價值有非常重要的意義,在大數(shù)據(jù)的幫助下,檔案管理應(yīng)該成為這個信息社會的基石,擔(dān)負(fù)起記錄全社會最有價值信息的重?fù)?dān)。
(二)大數(shù)據(jù)成為完成多元化的信息管理的重要工具
以往檔案管理的變化只體現(xiàn)在信息載體發(fā)生改變帶來的被動變化,從結(jié)繩記事到甲骨文,再到竹簡和紙質(zhì)書籍,信息都是存在于不同媒介上面的可辨認(rèn)的字符。如今,信息體現(xiàn)為存儲在硬盤、光盤、網(wǎng)路、二維碼等電子媒介上面的數(shù)據(jù),這種新的數(shù)據(jù)存儲形態(tài)與以往的信息載體有著本質(zhì)的區(qū)別。新的信息形態(tài)的有著智能化的優(yōu)點,但是大量的信息數(shù)據(jù)中所存在的噪聲也會相應(yīng)增多,同時許多非結(jié)構(gòu)化的數(shù)據(jù)也為這些數(shù)據(jù)信息的管理帶來了較大困難[6]。
處理多元化的信息資料的來源,還需要大數(shù)據(jù)相關(guān)技術(shù)來解決。尤其是如今的數(shù)據(jù)存儲媒介好多可以實現(xiàn)智能化分類,之前主要靠人工完成的工作逐漸被智能化的算法所取代,紙質(zhì)的檔案文件也會逐漸被電子數(shù)據(jù)所代替。許多檔案館已經(jīng)進(jìn)行了信息化的改造,包括引入檔案管理系統(tǒng)、為紙質(zhì)檔案添加磁條等進(jìn)行區(qū)分和識別。這些已有的信息化投入對于大的檔案館來講還遠(yuǎn)遠(yuǎn)不夠,檔案管理機(jī)構(gòu)應(yīng)該充分做好準(zhǔn)備迎接數(shù)字化檔案信息的管理挑戰(zhàn)。
(三)大數(shù)據(jù)時代檔案管理工作的責(zé)任作用更加突顯
傳統(tǒng)的檔案管理職責(zé)非常明確,那就是維護(hù)好檔案文件的信息完整與準(zhǔn)確,盡可能發(fā)揮這部分信息的社會應(yīng)用價值。而大數(shù)據(jù)時代,檔案管理的作用不再限于這些,新算法的更新和智能處理方式會讓檔案文件信息發(fā)揮出新的價值。對未來檔案管理部門的新功能做出預(yù)測的文獻(xiàn)有很多,有的學(xué)者從智能化城市發(fā)展的視角,認(rèn)為檔案管理應(yīng)該作為城市基本信息的一個樞紐,做好不同部門間基礎(chǔ)信息的統(tǒng)一化和維護(hù)工作,保障智慧城市中的信息安全[4];有的學(xué)者分析了未來檔案文件數(shù)字化之后,認(rèn)為從原本的文件管理等基本工作向知識管理這種創(chuàng)新性工作的轉(zhuǎn)化,檔案管理的專業(yè)性和知識性要求會不斷提升[6]。
信息是一種重要的非常珍貴的資源,檔案是被識別出來應(yīng)該妥善保存的有價值的信息載體。檔案管理機(jī)構(gòu)作為一個知識庫和信息庫,在未來整個社會的信息化建設(shè)過程中,必然會承擔(dān)起越來越多的責(zé)任,大數(shù)據(jù)則是幫助我們?nèi)ソ庾x和利用這部分信息的一個有力工具。
(一)樹立明確的準(zhǔn)則和目標(biāo)
利用大數(shù)據(jù)改善、提升檔案管理工作的服務(wù)要求,需要有所側(cè)重,突出重點,否則會深陷海量數(shù)據(jù)當(dāng)中,受困于數(shù)據(jù)的規(guī)模,并因目標(biāo)不明確、準(zhǔn)則不具體而難以獲取有價值的信息,使得原本精確細(xì)致的檔案管理工作喪失本意。
樹立明確的目標(biāo)和準(zhǔn)則,意義就在于對檔案中的數(shù)據(jù)作用進(jìn)行定位,從而縮小數(shù)據(jù)的選擇范圍,在利用數(shù)據(jù)、提供服務(wù)時可以更加專業(yè),更加直接,達(dá)到事半功倍的效果[7]。
(二)注意規(guī)避潛在的風(fēng)險
數(shù)據(jù)和信息在社會中扮演的角色越來越重要,從而使數(shù)據(jù)的安全性也顯得原來越重要。所以,盡管檔案信息的價值毋庸置疑,而其涉及個人隱私或者工作機(jī)密的私密性也不可小覷。檔案數(shù)字化信息資源盡管查詢方便、占用空間小,但是其安全性問題如何保障仍然非常關(guān)鍵。電子數(shù)據(jù)文件常常存在著損壞等故障等風(fēng)險,一旦數(shù)據(jù)不可恢復(fù),所造成的損失是無法挽回的。此外,網(wǎng)絡(luò)黑客問題也是一個必須重視的問題。原先實體化的檔案安全問題,只要提高安全防范意識就能夠解決,而對于聯(lián)網(wǎng)電子數(shù)據(jù)的安全問題,則在很大程度上依賴技術(shù)上的防范和改善。因此,大數(shù)據(jù)的到來,對于檔案管理的工作來說既是機(jī)遇同時也是挑戰(zhàn),檔案管理機(jī)構(gòu)應(yīng)該積極擁抱這種新思想,挖掘數(shù)據(jù)和信息的價值是最有發(fā)展?jié)摿Φ氖聵I(yè),檔案管理將不再是信息資源的“倉庫”,而應(yīng)該借助大數(shù)據(jù)這個生產(chǎn)工具,成為信息資源產(chǎn)生價值的“生產(chǎn)工廠”。
·
[1]孟小峰,大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn),計算機(jī)研究與發(fā)展[J],2013,50(1):146-169
[2]王珊,王會舉,架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望,計算機(jī)學(xué)報[J],2011,34(10):1741-1752
[3]McKinsey,Big data The next frontier for innovation,competition,and productivity[M],2011
[4]李小晨,大數(shù)據(jù)時代背景下的檔案管理探討,云南檔案[J],2013,6:48-50
[5]陳智為,檔案管理學(xué)[M],北京:中國人民大學(xué)出版社,2008,9
[6]李國杰,程學(xué)旗,大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J],中國科學(xué)院院刊,2012,27,(6):648
[7]張健,檔案數(shù)據(jù)庫“脹庫”問題研究[J],檔案學(xué)通訊,2012(4):49
(作者單位:齊魯師范學(xué)院)