摘 要:人類社會已經(jīng)進(jìn)入了大數(shù)據(jù)時代,相伴而來的是大量的數(shù)據(jù)資源。大數(shù)據(jù)技術(shù)的發(fā)展,必然會對檔案管理工作帶來深遠(yuǎn)影響。如何做好大數(shù)據(jù)背景下的檔案管理工作,成為廣大檔案工作者必須面對的一個問題。本文基于大數(shù)據(jù)視角,從簡要分析新時代背景下的大數(shù)據(jù)的內(nèi)涵與特點入手,說明了加強(qiáng)大數(shù)據(jù)研究對進(jìn)一步深化檔案管理工作具有重要意義,進(jìn)一步指出了大數(shù)據(jù)背景下檔案管理工作改革需要重點關(guān)注三個方面,希望能對進(jìn)一步強(qiáng)化我國的檔案管理工作有所裨益。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;關(guān)注方向
由于數(shù)據(jù)經(jīng)濟(jì)的發(fā)展,人類社會將經(jīng)歷巨大的變革,數(shù)據(jù)將成為世界發(fā)展的驅(qū)動力,相伴而來的是大量的數(shù)據(jù)資源。檔案管理工作,無論在政策的制定上、方法的改進(jìn)上、技術(shù)的提升上,還是設(shè)備的配置上、人員的結(jié)構(gòu)適應(yīng)上,都或多或少地受到大數(shù)據(jù)的影響。如今的檔案使用者對信息的需求呈現(xiàn)出多樣化、個性化、高效化、異地化的特點,檔案管理工作者一邊要面對蜂擁而至的大量數(shù)據(jù),一邊又要精準(zhǔn)地為利用者提供需要的檔案資料信息。因此,在大數(shù)據(jù)時代背景下,我國的檔案管理工作需要在新的理念的指導(dǎo)下,以創(chuàng)新的模式不斷改革,更好地適應(yīng)時代的需求。
1 新時代背景下的大數(shù)據(jù)的內(nèi)涵與特點
1.1 大數(shù)據(jù)概念的淵源
自古以來,人類一直苦于處理各種各樣數(shù)量龐大而毫無規(guī)律的數(shù)據(jù)。人們?yōu)榱私鉀Q這些大數(shù)據(jù)所帶來的困擾可謂是想盡了辦法。19世紀(jì)末,美國著名的統(tǒng)計學(xué)家赫爾曼·霍爾瑞斯在處理1890年美國人口普查數(shù)據(jù)的過程中發(fā)明了能夠識別卡片的電動機(jī)器。這臺機(jī)器的發(fā)明使得原本需要8年才能夠完成的工作在1年的時間內(nèi)就被完成了??梢哉f,這一事件標(biāo)志著人類社會進(jìn)入到數(shù)據(jù)處理的新紀(jì)元[1]。后來,計算機(jī)的誕生和萬維網(wǎng)的建立,進(jìn)一步提高了人類處理信息的能力。隨著計算機(jī)技術(shù)的日新月異,電子存儲設(shè)備的功能越來越強(qiáng)大,體積變得越來越小,而加起來的存儲成本卻不到當(dāng)初的一億分之一,使較低成本地存儲海量數(shù)據(jù)成為可能[2]。1997年,美國的兩位研究員邁克爾·考克斯和大衛(wèi)·埃爾斯沃斯為了對超級計算機(jī)所產(chǎn)生的超過主存儲器所能存儲的,甚至遠(yuǎn)程磁盤都無法承載的信息和數(shù)據(jù)進(jìn)行描述,最早地提出了“大數(shù)據(jù)”這一概念[3]。
信息技術(shù)的發(fā)展,已經(jīng)深入到人類生活的方方面面。數(shù)據(jù)挖掘技術(shù)的出現(xiàn),奠定了大數(shù)據(jù)時代的技術(shù)基礎(chǔ)。與此同時,人們對于數(shù)據(jù)的分析和使用的技術(shù)也日趨成熟起來[4]。與傳統(tǒng)的數(shù)據(jù)搜集所不同的是,數(shù)據(jù)挖掘具有實時性。大數(shù)據(jù)技術(shù)出現(xiàn)以前的數(shù)據(jù)搜集需要人們先擬定出調(diào)查問卷,然后逐一發(fā)放問卷調(diào)查再回收的方式進(jìn)行采集,最后耗費大量人力對回收的調(diào)查問卷進(jìn)行分析,才能得出調(diào)查的結(jié)論。此時的結(jié)論是否科學(xué)合理,是否符合客觀實際是很難保證的。因為有兩個弊端無法完全避免,一是調(diào)查問卷設(shè)置的合理性和科學(xué)性,二是無法及時對所搜集到的信息進(jìn)行分析、處理。數(shù)據(jù)挖掘技術(shù)對應(yīng)了大數(shù)據(jù)具有“數(shù)量大、來源廣、實時性”這三大特點,很好地解決了這兩個弊端,因此越來越受到人們的歡迎,成為重要的分析預(yù)測工具。根據(jù)特定的算法,計算機(jī)可以對數(shù)量龐大的、毫無聯(lián)系的數(shù)據(jù)進(jìn)行自動分析,以揭示這些數(shù)據(jù)之間的聯(lián)系,從而判斷出其發(fā)展趨勢。也就是說,人們可以通過對大量的數(shù)據(jù)進(jìn)行分析,根據(jù)數(shù)據(jù)所體現(xiàn)出的規(guī)律和趨勢做出決策判斷[5]。
最初,大數(shù)據(jù)技術(shù)僅僅被應(yīng)用在國家安全領(lǐng)域,后來隨著超級計算機(jī)的發(fā)明以及存儲技術(shù)更新和算法的日趨成熟,越來越多的領(lǐng)域開始使用大數(shù)據(jù)[6]。近年來,我國在大數(shù)據(jù)技術(shù)領(lǐng)域發(fā)展得比較迅猛。2014年,大數(shù)據(jù)首次被寫進(jìn)我國的政府工作報告;2019年,李克強(qiáng)總理將發(fā)展大數(shù)據(jù)、人工智能和高端制造、新能源汽車等提到了同等地位,足見我國對大數(shù)據(jù)發(fā)展重要性的重視程度。
1.2 大數(shù)據(jù)概念的基本內(nèi)涵
《大數(shù)據(jù):創(chuàng)新、競爭力和生產(chǎn)力的下一個前沿》曾提出一個大數(shù)據(jù)的概念,得到業(yè)內(nèi)多數(shù)人員認(rèn)可:大數(shù)據(jù),通常指大小規(guī)格超越傳統(tǒng)數(shù)據(jù)庫軟件工具抓取、存儲、管理和分析能力的數(shù)據(jù)群[7]。
1.3 新時代背景下的大數(shù)據(jù)特點
1.3.1海量化。海量化指的是計算機(jī)需要收集并分析的數(shù)據(jù)量非常的大。僅僅是在過去的3年間,我們就產(chǎn)生出人類在4萬年時間里產(chǎn)生的信息量的總和還要多的信息量[8]。隨著數(shù)據(jù)量的不斷增大,TB、PB、EB這些計量單位將逐漸被人們所棄用,而以ZB為計量單位的時代正向我們走來。
1.3.2高速度。高速度指的是處理數(shù)據(jù)流的速度快。
1.3.3精確性。精確性指的是數(shù)據(jù)的準(zhǔn)確性?,F(xiàn)實生活中發(fā)生的一切都與大數(shù)據(jù)所能反映出來的內(nèi)容有著密切的關(guān)聯(lián)性。數(shù)據(jù)的真實性和完整性關(guān)系到?jīng)Q策的準(zhǔn)確性和科學(xué)性。數(shù)據(jù)的可信性、真?zhèn)涡?、來源和信譽、有效性、可審計性都是精確性的體現(xiàn)[9]。
1.3.4多樣化。多樣化指的是大數(shù)據(jù)的類型多樣。
1.3.5易變性。大數(shù)據(jù)的生成并不是一成不變的。易變性指的是數(shù)據(jù)流的變化率高。
1.3.6關(guān)聯(lián)性。關(guān)聯(lián)性指的是數(shù)據(jù)流之間的關(guān)聯(lián)性。相對于獨立的數(shù)據(jù),具有關(guān)聯(lián)性的數(shù)據(jù)有著更大的價值。與過去單一強(qiáng)調(diào)單個數(shù)據(jù)流價值所不同的是,大數(shù)據(jù)強(qiáng)調(diào)的是在相互關(guān)聯(lián)的數(shù)據(jù)流中發(fā)現(xiàn)它們之間的相關(guān)關(guān)系,而非因果關(guān)系[10]。
1.3.7價值大。人們在處理大數(shù)據(jù)的過程中雖然降低了數(shù)據(jù)的價值密度,但是數(shù)據(jù)整體價值因通過數(shù)據(jù)的交換、整合、分析,從而發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)性、獲得新的發(fā)現(xiàn)而有所提高。大數(shù)據(jù)對人類社會發(fā)展和人們?nèi)粘I钣兄苤匾挠绊?,在工業(yè)、政務(wù)、教育、健康等領(lǐng)域發(fā)揮的作用將會越來越大[11]。
2 加強(qiáng)大數(shù)據(jù)研究對進(jìn)一步深化檔案管理工作具有重要意義
加強(qiáng)大數(shù)據(jù)背景下的檔案管理工作研究,意義重大。第一,隨著大數(shù)據(jù)技術(shù)的進(jìn)一步發(fā)展,必將進(jìn)一步提高對各種類型的檔案文化資源的保護(hù)作用,保證檔案收集工作的完整性,檔案資源體系建設(shè)將得到進(jìn)一步強(qiáng)化。第二,大數(shù)據(jù)技術(shù)可以對檔案業(yè)務(wù)工作流程進(jìn)行優(yōu)化,使檔案業(yè)務(wù)管理工作能力得到提升。第三,通過對檔案數(shù)據(jù)的不斷挖掘,使它們得以增值,為社會和經(jīng)濟(jì)創(chuàng)造效益。第四,大數(shù)據(jù)技術(shù)將進(jìn)一步強(qiáng)化檔案管理機(jī)構(gòu)的職能職責(zé),構(gòu)建科學(xué)的檔案管理體系[12]。
3 大數(shù)據(jù)背景下檔案管理工作改革的重點方向
大數(shù)據(jù)環(huán)境下,信息技術(shù)成為社會發(fā)展的主要技術(shù)。大數(shù)據(jù)背景下的檔案管理仍然存在著一些問題[13]。但是,在大數(shù)據(jù)環(huán)境下,隨著整個社會對于信息共享需求的強(qiáng)烈,隨著大數(shù)據(jù)技術(shù)的進(jìn)步,檔案管理工作必然會迎來進(jìn)一步的改革。
3.1 利用信息技術(shù)實現(xiàn)檔案信息的綜合管理
大數(shù)據(jù)環(huán)境下要求檔案管理工作能夠有效的完成信息價值的開發(fā),同時,現(xiàn)代社會的發(fā)展同樣也要求檔案管理工作能夠更多的應(yīng)用現(xiàn)代信息技術(shù),提高檔案管理效率,保證檔案管理的客觀性。所以說,在未來檔案管理工作的發(fā)展中,自然會越來越多的應(yīng)用現(xiàn)代信息技術(shù),而應(yīng)用的方向也將逐漸豐富,也就是說,信息技術(shù)將會滲入到檔案管理的方方面面[14]。
3.2 合理利用檔案信息的大數(shù)據(jù)價值
通過上面對大數(shù)據(jù)的基本理論的分析我們可以發(fā)現(xiàn),大數(shù)據(jù)最大的優(yōu)勢就在于將散碎的、頻繁的信息固定下來,形成相對有價值的信息,并能夠科學(xué)的運用信息的價值,而檔案管理本身就是對已有信息載體的管理,所以自然涉及大量的流動信息。在大數(shù)據(jù)環(huán)境下,行業(yè)的競爭就在于對掌握信息的整合。從這個角度而言,檔案管理具有先天的優(yōu)勢,所以在大數(shù)據(jù)環(huán)境下,檔案管理將實現(xiàn)合理利用檔案信息的大數(shù)據(jù)價值。一方面,檔案管理工作更多地應(yīng)用現(xiàn)代信息技術(shù),那么就可以在云存儲中留下一定量的檔案信息[15];另一方面,在固定的信息庫中,檔案管理工作人員可以通過科學(xué)的現(xiàn)代手段對信息進(jìn)行分析,進(jìn)而獲得有價值的內(nèi)容,比如在企業(yè)檔案中,可以根據(jù)企業(yè)內(nèi)部財務(wù)檔案的動態(tài)信息流分析出企業(yè)的財務(wù)走向,在人員檔案中可以分析出企業(yè)內(nèi)部人才的基本組成,特別是對于對企業(yè)貢獻(xiàn)大的員工,可以分析其共性,進(jìn)而在企業(yè)之后的招聘中進(jìn)而針對性的人員引入,為企業(yè)節(jié)約時間和成本,這同時也合理的利用了檔案信息的大數(shù)據(jù)價值[16]。綜上,合理利用檔案信息的大數(shù)據(jù)價值是大數(shù)據(jù)背景下檔案管理的一個重要發(fā)展方向和發(fā)展目標(biāo)[17]。
3.3 實現(xiàn)檔案管理與其它社會工作的融合
我們不斷強(qiáng)調(diào)大數(shù)據(jù)環(huán)境下信息的潛在價值,所以能夠有信息聚集的地方,自然就有現(xiàn)代社會的應(yīng)用價值,而檔案管理本身是對信息的管理,一旦能夠?qū)崿F(xiàn)利用現(xiàn)代信息技術(shù)手段管理檔案工作,實現(xiàn)檔案管理的智能化管理,那么在檔案管理工作中,就會獲得更多的信息。在這樣的情況下,檔案管理工作就會與其它社會工作融合,共同合理利用已有的信息價值,實現(xiàn)社會價值的再創(chuàng)造[18]。實現(xiàn)檔案管理工作與其它社會工作的融合,也將是大數(shù)據(jù)環(huán)境下檔案管理工作的一個發(fā)展方向[19]。
結(jié)語
檔案管理工作在人類社會已經(jīng)進(jìn)入了大數(shù)據(jù)時代的今天,必須盡快與時俱進(jìn),適應(yīng)時代發(fā)展要求[20]。即使是最為保守的檔案工作者也必然已經(jīng)發(fā)現(xiàn)了一個驚人的現(xiàn)象在越來越深刻地影響著檔案管理事業(yè)的發(fā)展,那就是大數(shù)據(jù)技術(shù)的發(fā)展[21]。筆者結(jié)合多年檔案工作經(jīng)驗,以大數(shù)據(jù)為視角,提醒我們的檔案工作者必須要從大數(shù)據(jù)的內(nèi)涵與特點入手,進(jìn)一步加強(qiáng)對大數(shù)據(jù)研究,檔案管理工作在大數(shù)據(jù)背景下要重點關(guān)注三個方面,一是利用信息技術(shù)實現(xiàn)檔案信息的綜合管理,二是合理利用檔案信息的大數(shù)據(jù)價值,三是實現(xiàn)檔案管理與其它社會工作的融合。
參考文獻(xiàn)
[1]馮惠玲,連志英,曲春梅,周文泓,潘未梅,徐辛酉,李孟秋,王寧.回顧與前瞻:“十三五”檔案學(xué)科發(fā)展調(diào)查和“十四五”檔案學(xué)重點研究領(lǐng)域展望[J].檔案學(xué)通訊,2021(01):4-15.DOI:10.16113/j.cnki.daxtx.2021.01.001.
[2]金波,楊鵬.大數(shù)據(jù)時代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(04):29-37.DOI:10.16065/j.cnki.issn1002-1620.2020.04.004.
[3]張斌,楊文.中國檔案學(xué)研究熱點與前沿問題探討[J].圖書情報知識,2020(03):28-40+62.DOI:10.13366/j.dik.2020.03.028.
[4]徐擁軍,熊文景.檔案治理現(xiàn)代化:理論內(nèi)涵、價值追求和實踐路徑[J].檔案學(xué)研究,2019(06):12-18.DOI:10.16065/j.cnki.issn1002-1620.2019.06.002.
[5]趙躍.大數(shù)據(jù)時代檔案數(shù)據(jù)化的前景展望:意義與困境[J].檔案學(xué)研究,2019(05):52-60.DOI:10.16065/j.cnki.issn1002-1620.2019.05.009.
[6]牛力,劉慧琳,曾靜怡,韓小汀.數(shù)字時代檔案資源開發(fā)利用的重新審視[J].檔案學(xué)研究,2019(05):67-71.DOI:10.16065/j.cnki.issn1002-1620.2019.05.011.
[7]金波,晏秦.從檔案管理走向檔案治理[J].檔案學(xué)研究,2019(01):46-55.DOI:10.16065/j.cnki.issn1002-1620.2019.01.008.
[8]張麗娜,夏慶利.高校人力資源管理的現(xiàn)實困境與對策——基于大數(shù)據(jù)思維下高校人事檔案信息化建設(shè)的探討[J].學(xué)術(shù)論壇,2016,39(04):157-161.DOI:10.16524/j.45-1002.2016.04.032.
[9]陳永生,蘇煥寧,楊茜茜,侯衡.電子政務(wù)系統(tǒng)中的檔案管理:安全保障[J].檔案學(xué)研究,2015(04):29-40.DOI:10.16065/j.cnki.issn1002-1620.2015.04.006.
[10]楊智勇,周楓.試析智慧檔案館的興起與未來發(fā)展[J].檔案學(xué)通訊,2015(04):45-50.DOI:10.16113/j.cnki.daxtx.2015.04.011.
[11]周耀林,朱倩.大數(shù)據(jù)時代我國數(shù)字檔案館的建設(shè)與發(fā)展[J].信息資源管理學(xué)報,2015,5(02):108-113.DOI:10.13365/j.jirm.2015.02.108.
[12]于英香.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學(xué)通訊,2015(02):4-8.DOI:10.16113/j.cnki.daxtx.2015.02.002.
[13]崔海莉.“大數(shù)據(jù)”時代檔案信息安全管理新思考[J].檔案學(xué)研究,2015(01):93-96.DOI:10.16065/j.cnki.issn1002-1620.2015.01.018.
[14]陳之常.應(yīng)用大數(shù)據(jù)推進(jìn)政府治理能力現(xiàn)代化——以北京市東城區(qū)為例[J].中國行政管理,2015(02):38-42.
[15]李小晨.大數(shù)據(jù)時代背景下的檔案管理探討[J].云南檔案,2013(06):48-50.DOI:10.14074/j.cnki.yunnan.archives.2013.06.018.
[16][英]邁爾·舍恩伯格,庫克耶著,盛楊燕,周濤譯.大數(shù)據(jù)時代(生活工作與思維的大變革)[J].浙江人民出版社,2013:23-26.
[17]崔小屹,韓青.用數(shù)據(jù)說話:大數(shù)據(jù)時代的管理實踐[M].北京:北京大學(xué)出版社,2013.
[18]周子晴.大數(shù)據(jù)時代檔案數(shù)據(jù)化生存與發(fā)展初探[J].浙江檔案,2022(05):45-48.DOI:10.16033/j.cnki.33-1055/g2.2022.05.012.
[19]謝群.大數(shù)據(jù)時代背景下檔案利用服務(wù)的挑戰(zhàn)與提升路徑[J].教育文化論壇,2022,14(03):121-124.DOI:10.15958/j.cnki.jywhlt.2022.03.019.
[20]李偉.大數(shù)據(jù)時代背景下醫(yī)院檔案管理的改進(jìn)策略[J].大陸橋視野,2022(05):109-110.
[21]李晶.大數(shù)據(jù)時代背景下高校檔案管理模式的優(yōu)化策略[J].蘭臺內(nèi)外,2022(14):10-12.
作者簡介:逯晶,本科學(xué)歷,吉林省通榆縣職業(yè)技術(shù)學(xué)校副研究館員。