摘 要:隨著經濟、政治、文化的發(fā)展,互聯(lián)網技術的不斷進步和普及,大數(shù)據(jù)時代對于檔案工作產生了一定影響,本文歸納總結了當前檔案工作的基本現(xiàn)狀和大數(shù)據(jù)時代對檔案工作的影響,并指出了未來檔案工作的開展路徑。
關鍵詞:大數(shù)據(jù);檔案;檔案工作
隨著社會經濟的發(fā)展與人類文明的演進,人們的生活水平逐漸提高,思想文化素質也在不斷提高,人們不僅追求物質生活的完善,也會傾向于思想文化領域的追求及精神文明層面的提高?;ヂ?lián)網技術的進步與革新給社會帶來了很多的新名詞,如“云計算”“大數(shù)據(jù)”等。檔案工作在信息技術迅猛發(fā)展的時代也發(fā)生了很大變化,受到了新技術和新手段的影響,本篇文章將通過對當前檔案工作的基本現(xiàn)狀、大數(shù)據(jù)時代對檔案工作的影響以及發(fā)展建議等方面展開研究。
一、概述
1.相關研究綜述
筆者以“大數(shù)據(jù)”并列“檔案”作為關鍵詞在“中國期刊全文數(shù)據(jù)庫”以“篇名”作為檢索項進行高級檢索(檢索時間:2022年5月28日),共檢索出3225篇相關的中文文獻。從檢索出的學術文獻發(fā)表時間來看,我國專門針對“大數(shù)據(jù)”與“檔案”的文獻最早發(fā)表于2012年,主要探討了大數(shù)據(jù)背景下檔案的利用服務,這對于2012年來說是一個非常新穎并且非常具有前瞻性的課題。我國關于“大數(shù)據(jù)”與“檔案”方面的研究從2013開始逐年增長,呈現(xiàn)出迅猛的發(fā)展態(tài)勢,并在近三年屢創(chuàng)高峰。筆者認為,科研者對于該領域的研究在未來很長一段時間內會持續(xù)充滿熱情,未來該領域也會有很好的發(fā)展前景,值得學者們的持續(xù)關注和研究。
2. 大數(shù)據(jù)的概念與特點
大數(shù)據(jù)是一種非具體性的概念,目前,公眾對于大數(shù)據(jù)達成共識的概念是:大數(shù)據(jù)是指無法在可承受的時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合。而大數(shù)據(jù)環(huán)境就是指現(xiàn)在處于互聯(lián)網大數(shù)據(jù)的廣泛應用之中。第一,大數(shù)據(jù)具有Volume,即海量。大數(shù)據(jù)具有海量的數(shù)據(jù),并且它的數(shù)據(jù)庫基本是以GB、TB、PB為基礎單位,不同于傳統(tǒng)數(shù)據(jù)庫以MB為基礎單位;第二,大數(shù)據(jù)具有Variety,即種類繁多。大數(shù)據(jù)可以為我們提供各種各樣的數(shù)據(jù),數(shù)據(jù)來源、類型復雜,主要包括結構化數(shù)據(jù)、半結構化數(shù)據(jù)、未加工的結構化數(shù)據(jù)和非結構化數(shù)據(jù);第三,大數(shù)據(jù)還具有Velocity,即速度快。大數(shù)據(jù)所處理的是十分龐雜的海量數(shù)據(jù),要為客戶提供準確及時的信息服務就要求大數(shù)據(jù)具有非常強大的數(shù)據(jù)處理能力,并且大數(shù)據(jù)的數(shù)據(jù)流動速度也是非常快的;第四,大數(shù)據(jù)還具有Value,即價值性。眾所周知,信息是21世紀最為珍貴的財富,但也不完全都是有用的信息,在海量數(shù)據(jù)中有用信息比率極低,更多信息都是冗長重復的,那么對于大數(shù)據(jù)而言,想要從中找到有用的信息十分困難,數(shù)據(jù)分析也有一定難度,所以它的價值密度很低。
二、當前我國檔案工作的基本現(xiàn)狀
1.檔案信息的安全性較低
在大數(shù)據(jù)時代,必須要關注信息安全問題。隨著辦公自動化普及,大量電子文件應運而生,很多紙質檔案在進行數(shù)字化轉換,很多數(shù)字檔案館也在建設中,這就與傳統(tǒng)檔案有著很大差異,需要更多考慮處于大數(shù)據(jù)環(huán)境和網絡環(huán)境下的檔案信息安全問題。目前,我國檔案信息安全性保障存在著一定的困難。以人事檔案為例,我國關于人事檔案安全的法律法規(guī)還處于不太完善階段,只出臺了《電子文件管理暫行辦法》《保密法》等法律法規(guī)來對人事檔案進行保護,還沒有一部專門針對該方面的立法,特別是有關處于大數(shù)據(jù)環(huán)境下人事檔案安全的立法,并且,現(xiàn)有法律法規(guī)中的保護范圍比較有限,重視程度也比較有限,更加注重事后處罰,而非事前預防,法律效力較低。
2.檔案人才缺失
目前,我國檔案工作人員學歷、業(yè)務水平在發(fā)達地區(qū)、欠發(fā)達地區(qū)、事業(yè)單位、國有大型企業(yè)和小型企業(yè)之間差距越來越大,如果不加以重視,這種差距的擴大只會愈演愈烈。隨著互聯(lián)網和信息技術的發(fā)展,檔案類型已經不局限于傳統(tǒng)類型的紙質檔案,更多傾向于數(shù)據(jù)類型的檔案。因此,檔案工作人員不能只采取傳統(tǒng)的檔案管理工作辦法來管理新類型檔案,需要檔案工作人員系統(tǒng)性地學習檔案專業(yè)知識和具備現(xiàn)代信息技術知識。
3.檔案服務方式單一
目前,我國提供的檔案服務類型比較單一,更多是“被動”服務。我國提供檔案服務方式主要是線下進行,僅有少數(shù)是可以線上進行,也不是十分完善,并且,檔案館編研的作品受眾面較小,沒有考慮廣大讀者的閱讀興趣、閱讀習慣和需求。有些檔案館開設了微信公眾號、微博等社交媒體與利用者進行交流,分享檔案故事,普及檔案法律知識,起到了一定的宣傳作用。在發(fā)達國家,檔案館會作為休閑場所,但目前我國檔案館還達不達“休閑”的程度,檔案工作人員服務意識稍顯薄弱。
三、大數(shù)據(jù)時代對檔案工作的影響
1.加快檔案數(shù)字化進程
大數(shù)據(jù)時代可以加快檔案數(shù)字化進程。很多單位、部門在對電子文件進行歸檔的同時也在積極對傳統(tǒng)的紙質檔案進行數(shù)字化,但一些欠發(fā)達地區(qū)的檔案數(shù)字化程度偏低,并且在思想上對檔案數(shù)字化重視程度不夠,沒有投入更多資金、設備和人才用于支持檔案數(shù)字化,從而給檔案開發(fā)與利用造成了一定困難。但在大數(shù)據(jù)時代,大數(shù)據(jù)、云計算、區(qū)塊鏈等新技術的開發(fā)與應用,為檔案數(shù)字化提供了便利,數(shù)字化成本也要比傳統(tǒng)的技術和設備低,同時便于保存和開發(fā)。
2.提高檔案管理效率
大數(shù)據(jù)時代可以提高檔案管理效率。由于檔案的分布范圍非常廣泛,隨著技術的發(fā)展,檔案類型也變得越來越多種多樣,如視頻、音頻、圖片、科技圖紙、定位信息等。在大數(shù)據(jù)時代,可以輕松對這些檔案進行收集、保管、查找、開發(fā)、利用等。大數(shù)據(jù)技術可以按照利用者的需求對海量檔案數(shù)據(jù)進行精準處理,處理的時間、速度和精準程度是人工所不及的。各地區(qū)、各行業(yè)的檔案管理標準有所不同,歸檔標準也隨著時代而更新,這些都會導致檔案管理效率不低。但在大數(shù)據(jù)時代,新技術可以根據(jù)標準對設定的歸檔范圍實行自動歸檔,自動檢測現(xiàn)有保存的檔案數(shù)據(jù)庫中有無重復檔案,或者根據(jù)歸檔范圍有無遺漏的未歸檔文件。還可以便于利用者進行遠程訪問和在線查檔,既節(jié)省了利用者時間也有利于對紙質檔案的保護,并且可以將檔案信息資源進行充分的數(shù)據(jù)挖掘、數(shù)據(jù)分析等,但在現(xiàn)實生活中,這類技術和軟件的普及率不高,掌握這種技術知識的檔案工作人員也非常少,從而影響了檔案信息資源的利用。在現(xiàn)在生活中各單位機構往往更加重視對檔案信息資源的收集工作,而忽視其開發(fā)利用工作,從而導致利用率不高的現(xiàn)象產生。
3.轉變檔案工作思維方式
在傳統(tǒng)的檔案工作思維方式中大多是以“管”為主,以館藏檔案的數(shù)量作為檔案館或者檔案部門業(yè)績的評判標準,但檔案工作不僅是對檔案保存,還要對檔案價值進行挖掘,對檔案開發(fā)、編研,舉辦相關檔案展覽、檔案主題活動、檔案知識法律競賽,還要積極響應檔案利用者的利用需求等。在大數(shù)據(jù)時代,檔案工作者要充分把握信息技術發(fā)展時機,充分學習和利用信息新技術,主動跟上時代發(fā)展的步伐,加快轉變檔案工作思維方式,將提供利用服務的方式從被動轉向主動,從“實體檔案”工作思維方式轉變?yōu)椤熬€上檔案”工作思維方式,只有學習新技術和新知識才能更好地為人民服務,從而增加檔案利用渠道,提高檔案利用率。
四、大數(shù)據(jù)視閾下檔案工作的建議
1.創(chuàng)新檔案服務方式
一是在互聯(lián)網技術飛速發(fā)展的時代,要善于利用新技術和新手段,轉變思維,將傳統(tǒng)的“被動服務”模式轉變?yōu)椤爸鲃臃铡蹦J?,主動發(fā)布或編研一些符合利用者需求的成果作品,吸引潛在的檔案利用者。二是將大數(shù)據(jù)、云計算等新技術熟練運用到檔案服務中,利用新技術深入挖掘檔案價值,將傳統(tǒng)的提供檔案本體的利用方式轉變?yōu)榫€上查檔和為利用提供對應的知識,而不是檔案本體,并且按照現(xiàn)在的發(fā)展趨勢來看,數(shù)據(jù)型檔案會更多;三是善于使用微信公眾號、微博等新媒體與檔案利用者交流,發(fā)布符合檔案利用者閱讀習慣的碎片式文字;四是為檔案利用者提供個性化、智能化的服務模式,利用數(shù)據(jù)采集技術收集利用者的瀏覽、閱讀興趣等,為其推薦合適的檔案知識信息;五是有些檔案館可以開展特色服務,如有的檔案館占據(jù)地理優(yōu)勢,具有紅色抗戰(zhàn)文化色彩、江南水鄉(xiāng)文化色彩、少數(shù)民族文化色彩等,這些都可以成為檔案館開展特色服務的因素,能夠成為檔案館的標志,提高檔案館的知名度,打造獨特的品牌。
2.加大對檔案的利用
管理檔案的最終目的就是利用。紙質檔案會隨著時間推移而老化,不達標的庫房溫濕度也會加快老化速度,調檔查閱次數(shù)越多,紙質檔案老化速度就會越快,并且,在調檔查閱過程中可能導致紙質檔案污損和丟失,但又不能因此而不進行正常的調檔查閱和開發(fā)利用。有些紙質檔案距今已經年代久遠,難免會有破損,要定期對其進行檢查、修復,以保證檔案完好。同時,檔案庫房也要注意防蟲防蛀、防潮、防火等,盡量將可能對檔案造成破壞又可通過人為干預避免的因素降到最低。綜上所述,要加快開展檔案數(shù)字化進程,這樣有利于保護紙質檔案,有利于對其進行更好地開發(fā)利用,有利于更加方便地在大數(shù)據(jù)環(huán)境下深度開發(fā)和利用檔案信息,如在合法合規(guī)的條件下對檔案信息進行采集整理,可以最大限度地分析和預判,為國家和本單位決策和人員的優(yōu)化配置提供建議。檔案館要對館藏檔案中符合國家規(guī)定、可對社會公眾開放的檔案進行深層次開發(fā),可以與博物館、紀念館、抗聯(lián)遺址、圖書館和高校等進行跨界聯(lián)動,展開深層互動,雙方甚至多方可以就檔案的開發(fā)問題成立專項組,所謂術業(yè)有專攻,這樣做可以彌補檔案館專業(yè)優(yōu)秀人才不足的劣勢,也可以形成資源整合和交流,充分實現(xiàn)檔案價值,發(fā)揮人才資源優(yōu)勢。還可以對檔案開發(fā)運用新技術,利用新媒體平臺進行宣傳傳播?,F(xiàn)在,人們的生活節(jié)奏很快,空閑時刻的碎片化閱讀方式已經逐步取代了傳統(tǒng)的書本閱讀方式。
因此,檔案館要跟隨人們新興的閱讀方式,建立檔案館的公眾號、微博等新媒體賬號、開發(fā)App和微信小程序等,并設立專題檔案模塊專區(qū),使人們可以便捷地了解相關檔案。檔案館還可以舉行紀念活動,舉辦展覽,制作文創(chuàng)產品,如相關的書簽、文具、模型等,還可以利用VR(虛擬現(xiàn)實)技術還原檔案記錄中的真實場景。
3.完善保護檔案信息安全的法律法規(guī)
首先,要遵循現(xiàn)有法律來保護檔案信息的安全,并不斷完善和制定專門針對檔案信息安全的法律,并且必須要明確執(zhí)法部門的工作范圍和原則,對其職責和義務必須要有明確了解,與時俱進。其次,要從思想上引起高度的重視,出臺法律法規(guī)后一定要確切落實。法律部門也要注重將事后懲罰和提前預防并重,提高懲罰力度,并加大宣傳,把安全隱患防范在源頭、消除在萌芽狀態(tài)。檔案管理部門必須明確其工作范圍和工作原則,嚴格根據(jù)檔案管理標準來進行管理,并對其職責和義務必須要有明確了解,與時俱進,完善相關制度,更好地推動檔案管理發(fā)展,推動檔案信息互通化和標準化,提高檔案管理科學性和統(tǒng)籌性,更好地提供服務并確保檔案信息的安全。
因此,要求檔案管理部門加強對管理技術和工作職責的組織學習。作為一名合格的檔案管理人員應該時刻提醒自己,不應該因為個人利益而違反法律法規(guī)、社會行為規(guī)范和檔案職業(yè)道德,要做好分內工作,為努力保護公民的信息安全、營造安全的檔案管理氛圍和保護公民的基本權益作出貢獻。
4.對檔案信息采取先進安全技術
檔案信息保存時要對網絡安全引起足夠重視,并采取先進的計算機安全技術,提升網絡安全性能,增強網絡安全。要采取加密管理軟件進行加密和管理,綜合采用各種先進的保密技術,對電子檔案進行多層加密處理,可以采用人臉識別和指紋識別。對檔案管理網站運行的服務器進行加密設置,對于查閱利用等情況必須兩個及以上管理者的授權并且通過預設密碼方可查詢利用,禁止未獲授權的機器或個人查閱檔案信息。還可以采用平臺操作日志,實時記錄使用者、查詢的內容以及時間,為未來可能發(fā)生的泄露事件提供可查考依據(jù)。
五、結語
綜上所述,目前,大數(shù)據(jù)已經走進了人們生活的方方面面,將在人類社會和歷史中扮演著重要角色。檔案工作要順應信息技術發(fā)展潮流,及時更新知識儲備,對管理辦法、服務方式和設備等進行不斷更新,對該方面的研究還要繼續(xù)深入下去,從而提高檔案管理效率和利用率。
參考文獻:
[1]任文璐.大數(shù)據(jù)時代背景下的個人信息保護——兼評《民法典(草案)》人格權編關于個人信息保護的規(guī)定[J].市場周刊,2020
[2]秦芳彧,張 江.大數(shù)據(jù)背景下檔案信息化研究熱點及演進脈絡分析——基于生命周期理論視角[J].遼寧大學學報(哲學社會科學版),2020
[3]朱紅茹.大數(shù)據(jù)視域下高職院校檔案信息化管理研究——以南京交通職業(yè)技術學院學生技能大賽為例[J].檔案與建設,2019
[4]施曉峰.基于分布式NoSQL數(shù)據(jù)庫的檔案大數(shù)據(jù)存儲與檢索方案研究[J].計算機應用與軟件,2019
[5]蔡盈芳,李子林.大數(shù)據(jù)環(huán)境下政務檔案信息共享與利用研究:框架設計[J].浙江檔案,2019
[6]王 寧,李晶偉.大數(shù)據(jù)影響下的我國檔案學研究發(fā)展芻議——基于實踐需求環(huán)境的分析[J].檔案與建設,2018
[7]梁 凱.多維度視角下大數(shù)據(jù)與檔案關系的思考——以杭州市大數(shù)據(jù)管理為背景[J].中國檔案,2018
[8]能 超.“江蘇佛教+大數(shù)據(jù)”系列之七大數(shù)據(jù)時代江蘇佛教檔案管理新模式以“JSFJ智慧檔案”系統(tǒng)建設為例[J].中國宗教,2018
(作者單位:黑龍江大學)
作者簡介:李思思(1998—),女,漢族,黑龍江哈爾濱人,研究生在讀,研究方向:檔案學理論與實踐。