李英
摘 要: 大數(shù)據(jù)時代的來臨必然對檔案工作帶來機遇和挑戰(zhàn),筆者分析了檔案與大數(shù)據(jù)的關系,對大數(shù)據(jù)時代檔案工作的變化進行了展望,同時分析了大數(shù)據(jù)時代對檔案工作者的新要求。
關鍵詞: 檔案;互聯(lián)網(wǎng);大數(shù)據(jù);變化
2012年美國率先發(fā)出 “大數(shù)據(jù)”時代已經(jīng)來臨的驚嘆。大數(shù)據(jù)技術能夠通過海量、動態(tài)數(shù)據(jù)的有效集成,推動社會治理的精細化和科學化進程,并有效節(jié)約社會治理的成本。大數(shù)據(jù)時代對各行各業(yè)都產(chǎn)生了深刻的影響。
1.檔案數(shù)據(jù)與大數(shù)據(jù)的關系分析
檔案是指過去和現(xiàn)在的國家機構、社會組織以及個人從事政治、軍事、經(jīng)濟、科學、技術、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。從檔案的定義來看,不同載體形式的檔案記錄的信息都可稱之為數(shù)據(jù)。從檔案的特征來分析,檔案具有社會性、歷史性、確定性及原始記錄性。而大數(shù)據(jù)也具有類似的特征,大數(shù)據(jù)也是人類社會活動的原始記錄,其內(nèi)容也具有確定性,且其記錄的內(nèi)容只反映事物已經(jīng)完成的狀態(tài),但不一定是原始記錄。因此,檔案符合大數(shù)據(jù)的特征,具有鮮明檔案特性的數(shù)據(jù)集合即是大數(shù)據(jù)。
2. 大數(shù)據(jù)時代檔案工作會出現(xiàn)新的變化,主要表現(xiàn)在以下兩個方面:
2.1. 數(shù)字檔案館建設將得到極大促進
大數(shù)據(jù)并非是一個確切概念,單從字面上來講,表示數(shù)據(jù)量的龐大,維基百科對大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。還有的學者用大數(shù)據(jù)的特征來闡釋定義,比較有代表性的是3V觀點,即大數(shù)據(jù)是具有規(guī)模性(volume)、多樣性(variety)以及高速性(velocity)的數(shù)據(jù)。作者傾向于認同大數(shù)據(jù)是反映人類社會活動的、具有規(guī)模效應的信息數(shù)據(jù)的集合,大數(shù)據(jù)技術中包含了各種同構、異構的數(shù)據(jù)。檔案信息作為一種傳統(tǒng)且重要的數(shù)據(jù)信息在大數(shù)據(jù)中的重要地位是無可取代的,因此大數(shù)據(jù)時代,檔案數(shù)字化和數(shù)字檔案館工作將得到極大加強。
2.2. 圖書情報檔案 “一體化”迅速發(fā)展
圖書情報檔案一體化的概念產(chǎn)生與上世紀80-90年代,但一直缺乏促使其轉化為實踐的動力和環(huán)境。近年來,隨著網(wǎng)絡技術的迅猛發(fā)展,特別是“大數(shù)據(jù)”時代的到來,這種一體化的過程已悄然發(fā)生。
無論是圖書、情報信息,還是檔案,都是知識的載體,都是以信息的形式體現(xiàn)出來,都屬于文獻信息資源的范疇,具有同質性。在客觀上,都有著內(nèi)在的本質的必然的聯(lián)系,都遵循信息管理的方法和原則。其學科都是研究信息的存儲、開發(fā)、利用。圖書情報檔案信息資源傳統(tǒng)的利用方式較為落后,都局限在各自的范疇,在計算機和互聯(lián)網(wǎng)技術的廣泛應用的社會環(huán)境下,文獻信息工作更加注重滿足利用者的需求,不同種類的信息資源相互滲透和融合,形成利用者需求的資源,這個文獻信息資源的數(shù)字化和網(wǎng)絡化的過程,使檔案、情報和圖書文獻信息利用組織趨于統(tǒng)一,使其服務一體化成為可能,逐步形成融合的跨界的學科體系。信息技術為一體化服務奠定了技術基礎,而經(jīng)濟社會發(fā)展對文獻信息資源的需求則是一體化發(fā)生的內(nèi)在動力。
2.3. 以檔案館為核心的區(qū)域性大數(shù)據(jù)中心迅速發(fā)展
大數(shù)據(jù)環(huán)境下,檔案部門的業(yè)務將不再僅僅局限于檔案,而會擴展至整個文獻信息范疇,以檔案館為核心的國家、地方、行業(yè)大數(shù)據(jù)中心將出現(xiàn):
利用者關心的是獲取數(shù)據(jù)信息的便捷性與數(shù)據(jù)有用性,對于是否是原始記錄、是或保管期限并不挑剔。大數(shù)據(jù)時代使利用者能夠一次性獲取更全面的數(shù)據(jù),無需輾轉于各個不同的數(shù)據(jù)系統(tǒng)反復查詢,這也正是數(shù)據(jù)共享與大數(shù)據(jù)的意義所在。傳統(tǒng)的檔案館乃至數(shù)字檔案館只能為利用者提供檔案數(shù)據(jù),這與大數(shù)據(jù)的精神是不符的,而國家、地方、行業(yè)在建設大數(shù)據(jù)中心時依托的是那些數(shù)據(jù)保存量大、具有數(shù)據(jù)建設經(jīng)驗、對信息工作熟悉的部門,符合這些條件的主要是各級各類檔案管理部門,檔案部門依托現(xiàn)有技術與計算機網(wǎng)絡資源,通過拓展網(wǎng)絡、整合相關數(shù)據(jù)的方式建設大數(shù)據(jù)中心,屆時檔案館服務的范圍將從傳統(tǒng)的檔案服務擴展到以檔案數(shù)據(jù)為核心、同時囊括行業(yè)相關的各種同構、異構數(shù)據(jù)的“大數(shù)據(jù)”中心,呈現(xiàn)在利用者面前的數(shù)據(jù)將由“檔案”逐步變化為“信息”與“大數(shù)據(jù)”。
2.4. “大檔案”概念逐漸成型并得到初步實踐
檔案是一個單位、一個行業(yè),乃至一個地區(qū)的記憶,其數(shù)據(jù)對行業(yè)和地區(qū)的發(fā)展有著無可替代的價值。大數(shù)據(jù)時代的數(shù)字城市、數(shù)字流域、數(shù)字國家等等數(shù)字化不斷發(fā)展的成果,其主要的數(shù)據(jù)來源是檔案信息。同時海量檔案信息與海量電子文件歸檔存儲需要大型的云數(shù)據(jù)中心支持。兩者既有必要也有可能進行合并建設,這既是數(shù)字中心對檔案數(shù)據(jù)依賴所決定的,又便于數(shù)據(jù)的共享和集約化管理、避免重復建設。把電子政務、數(shù)字化城市(或流域)云計算中心的機房建到檔案館,最終構成“大檔案”的基礎設施框架。
大數(shù)據(jù)環(huán)境下檔案情報圖書一體化進程使具有同質性的文獻信息資源相互滲透、融合發(fā)展,構成了“大檔案”的內(nèi)容。
“大檔案”信息資源的推送呈現(xiàn)多樣化。
新媒體是基于網(wǎng)絡和大數(shù)據(jù)出現(xiàn)的新型互動方式,因其區(qū)別于傳統(tǒng)的基于紙質媒介而得名,傳統(tǒng)網(wǎng)站信息更像是傳統(tǒng)紙質媒介的“數(shù)字化版本”,而新媒體較之于網(wǎng)站信息更具互動性和個性化,這類媒體主要通過移動客戶端呈現(xiàn),可以在網(wǎng)絡技術的幫助下,主動捕獲閱受眾的閱讀傾向,而主動推送個性化的內(nèi)容,這也是新媒體和網(wǎng)站信息的本質不同,目前新媒體以被許多檔案部門使用,檔案信息資源與新媒體靈活、個性、互動良好的特質相結合,將使檔案信息資源的開發(fā)利用如虎添翼,使檔案工作展現(xiàn)出多彩的生命力,這正是“大檔案”時代的特點之一。
3. 大數(shù)據(jù)時代對檔案工作的要求
3.1. 為適應大數(shù)據(jù)時代的檔案工作,檔案人員應主動轉變觀念,
長久以來,提起檔案行業(yè),經(jīng)常與“重藏輕用、被動服務”等詞匯劃等號。在網(wǎng)絡環(huán)境下,如果不突破這些障礙,很難適應大數(shù)據(jù)時代個性十足、互動頻繁、形式多樣的特點,轉變觀念迫在眉睫,制定符合信息化時代的檔案管理和工作的制度、流程,首先是轉變固有的檔案觀念,主動學習網(wǎng)絡和數(shù)據(jù)庫知識、數(shù)字化知識、數(shù)字檔案館知識,了解大數(shù)據(jù)時代的本質,從自身做起促成檔案工作模式的改變。
3.2. 加大數(shù)字檔案館建設的力度,為大數(shù)據(jù)時代檔案工作打好基礎;
各級檔案部門應抓住機遇,將數(shù)字檔案館建設納入檔案工作中長期規(guī)劃。當前,在辦公網(wǎng)絡化的基礎上,制定明確的目標,在網(wǎng)絡和數(shù)據(jù)庫基礎上,實施“存量數(shù)字化、增量電子化”的信息化戰(zhàn)略,數(shù)字檔案館建設將突飛猛進。
大數(shù)據(jù)時代在時刻不停地發(fā)展,對檔案工作的影響也日益深刻。以上是作者結合自身工作對大數(shù)據(jù)時代檔案工作的管見,一定存在許多不足,正是在與相關行業(yè)不斷地交融、滲透中,才促進了檔案事業(yè)的不斷向前發(fā)展,作為檔案工作者也只有不斷加強自身素質的養(yǎng)成,加強知識獲取和更新能力,才能跟上時代發(fā)展的步伐,為檔案工作做出貢獻。
參考文獻
[1]周美蘭.大數(shù)據(jù)時代高校檔案資源體系建設的思考[J].山西檔案,2015,(01):68-71.
[2]石峻峰,周俐霞,樊澤恒,王麗.大數(shù)據(jù)時代高校數(shù)字檔案資源管理研究[J].現(xiàn)代教育技術,2015,25(01):19-24.
[3]張欣.解讀大數(shù)據(jù)時代下檔案管理的價值提升[J].理論觀察,2014,(01):108-109.
[4]李小晨.大數(shù)據(jù)時代背景下的檔案管理探討[J].云南檔案,2013,(06):48-50.