任力
摘 要:該文從當(dāng)前新技術(shù)時(shí)代的特征出發(fā),概述數(shù)據(jù)處理、人工智能、網(wǎng)絡(luò)技術(shù)等時(shí)代背景下,大數(shù)據(jù)對(duì)傳統(tǒng)檔案信息管理的沖擊。分析了大數(shù)據(jù)技術(shù)時(shí)代,檔案信息管理在管理思維與管理方法等方面的變化與變革。思維方面,從注重保存到檔案保存與開(kāi)發(fā)并重;方法方面,從平面單機(jī)檔案數(shù)據(jù)管理到智能化、可實(shí)現(xiàn)大數(shù)據(jù)分析與處理的立體網(wǎng)絡(luò)化檔案管理新方式;最后,提出應(yīng)對(duì)大數(shù)據(jù)技術(shù)時(shí)代檔案信息管理新要求的對(duì)策。
關(guān)鍵詞:大數(shù)據(jù)技術(shù) 檔案管理 理念 思維 方法 變革
中圖分類(lèi)號(hào):G270.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2016)11(b)-0023-02
在這個(gè)科技飛速發(fā)展的年代,新技術(shù)的不斷涌現(xiàn)成為推動(dòng)整個(gè)社會(huì)前行的發(fā)動(dòng)機(jī)。大數(shù)據(jù)、云計(jì)算、人工智能等每一次技術(shù)的進(jìn)步和革新,都滲透到社會(huì)的各個(gè)行業(yè)和領(lǐng)域,在引領(lǐng)社會(huì)變革的同時(shí),使之快步走入信息化時(shí)代。在檔案界,新技術(shù)的應(yīng)用和管理正成為不斷深入研究的課題,檔案工作的發(fā)展理念、工作目標(biāo)和實(shí)施路徑發(fā)生了深刻的改變,檔案事業(yè)的發(fā)展正邁向更廣闊的未來(lái)。
1 大數(shù)據(jù)時(shí)代檔案管理所涉新技術(shù)的發(fā)展特征
1.1 數(shù)據(jù)處理技術(shù)
當(dāng)今的檔案數(shù)據(jù)正在向電子化過(guò)渡,檔案信息已經(jīng)成為存儲(chǔ)在某種介質(zhì)上能被相應(yīng)電子設(shè)備識(shí)別的物理符號(hào)。與紙質(zhì)數(shù)據(jù)相比,它是對(duì)一定事實(shí)、概念或指令的一種全新的表達(dá)形式。隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)信息的處理更加高效和便捷。面對(duì)海量、無(wú)序的數(shù)據(jù),應(yīng)用計(jì)算機(jī)軟件程序,人們能夠?qū)?shù)據(jù)進(jìn)行快速的采集、存儲(chǔ)、檢索、加工、變換和傳輸,并通過(guò)各種數(shù)據(jù)處理的應(yīng)用軟件包,將數(shù)據(jù)提取并演算出有價(jià)值和意義的信息。數(shù)據(jù)處理技術(shù)是檔案管理的重要環(huán)節(jié),隨著新技術(shù)的不斷發(fā)展和創(chuàng)新,檔案工作才得以向系統(tǒng)化和自動(dòng)化發(fā)展。當(dāng)前檔案數(shù)據(jù)處理工作主要依靠計(jì)算機(jī)和網(wǎng)絡(luò)來(lái)支撐,依據(jù)不同電子處理設(shè)備的結(jié)構(gòu)、工作方式或時(shí)空分布,對(duì)各種原始數(shù)據(jù)的分析、整理、計(jì)算、編輯等的加工和處理,由相應(yīng)的軟硬件來(lái)共同完成。
1.2 人工智能技術(shù)
人工智能被稱(chēng)為世界三大頂尖技術(shù)之一,其目的是讓機(jī)器來(lái)替代人類(lèi)智慧才能完成的復(fù)雜工作。作為計(jì)算機(jī)科學(xué)的一個(gè)分支,通過(guò)了解和掌握智能的實(shí)質(zhì),以此設(shè)計(jì)和生產(chǎn)出近似或高于人類(lèi)智能的儀器和設(shè)備,讓機(jī)器來(lái)完成人類(lèi)的智能工作。該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專(zhuān)家系統(tǒng)等。2016年3月基于人工智能的圍棋程序阿爾法狗戰(zhàn)勝了世界冠軍李世石,標(biāo)志著人工智能已經(jīng)向?qū)嵺`應(yīng)用領(lǐng)域取得了突破性的進(jìn)展。面對(duì)多元化的檔案信息資源,檔案數(shù)據(jù)規(guī)模的幾何式增長(zhǎng),檔案社會(huì)化程度的不斷提升,檔案管理工作也應(yīng)更加智慧和智能,而人工智能技術(shù)也終將成為檔案信息化建設(shè)的技術(shù)引擎。
1.3 計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)
計(jì)算機(jī)網(wǎng)絡(luò)將處于不同地理位置的計(jì)算機(jī)相連接,以實(shí)現(xiàn)信息檢索、網(wǎng)絡(luò)通信、辦公自動(dòng)化、電子商務(wù)和遠(yuǎn)程教育等功能。當(dāng)今世界已進(jìn)入全球化、高速和智能的網(wǎng)絡(luò)時(shí)代,一個(gè)巨型的“虛擬世界”在逐步形成,人們可以足不出戶(hù)的實(shí)現(xiàn)互動(dòng)和交流,現(xiàn)實(shí)生活向數(shù)字化發(fā)展。計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)也為檔案管理工作插上了翅膀,每一項(xiàng)網(wǎng)絡(luò)新技術(shù)的出現(xiàn)都極大的促進(jìn)了檔案管理工作效率和水平的提高,在當(dāng)前的檔案信息化建設(shè)中,云計(jì)算、數(shù)據(jù)挖掘和物聯(lián)網(wǎng)技術(shù)的不斷成熟和完善,解決了傳統(tǒng)檔案受時(shí)間和空間的限制,實(shí)現(xiàn)了檔案信息的高效檢索和利用,真正實(shí)現(xiàn)了其在人類(lèi)記憶、信息服務(wù)和文化傳承等方面的社會(huì)功能。
2 大數(shù)據(jù)技術(shù)時(shí)代檔案信息管理面臨的挑戰(zhàn)與變革
2.1 大數(shù)據(jù)技術(shù)時(shí)代檔案管理思維的變化
從何種角度、層次、方式去管理、開(kāi)發(fā)和利用檔案,取決于每個(gè)檔案管理者的思維方式。隨著科學(xué)技術(shù)的發(fā)展,傳統(tǒng)的分類(lèi)、比較、歸納和演繹的檔案學(xué)邏輯思維方式,往往將檔案管理局限在文字館藏的管理上,面對(duì)檔案資源范疇和信息形式的變化,以及互聯(lián)網(wǎng)、移動(dòng)終端和個(gè)人電腦等產(chǎn)生的電子檔案數(shù)據(jù),以傳統(tǒng)的鑒定和整理思維加以處理,很難從檔案中挖掘出高價(jià)值的有效信息。因此面對(duì)大數(shù)據(jù)時(shí)代的來(lái)臨,檔案工作者應(yīng)當(dāng)采用擴(kuò)散型和橫向型的思維,關(guān)注檔案事業(yè)發(fā)展的整體性和多維性,從信息科學(xué)汲取養(yǎng)分,改變單純的以保存、檢索等為主要的檔案信息服務(wù)理念,將網(wǎng)絡(luò)化、智能化的檔案數(shù)據(jù)挖掘和分析工作當(dāng)成未來(lái)檔案服務(wù)的主要方式,真正體現(xiàn)檔案信息的價(jià)值,滿(mǎn)足檔案工作的社會(huì)化需求。
2.2 大數(shù)據(jù)技術(shù)時(shí)代檔案管理方法的變革
檔案管理工作肩負(fù)著對(duì)檔案信息采集、整理、鑒定、存儲(chǔ)和檢索等任務(wù),具有社會(huì)記憶、信息服務(wù)和文化傳承等社會(huì)職責(zé)。在傳統(tǒng)的檔案管理方式下,對(duì)檔案數(shù)據(jù)往往是孤立、扁平和簡(jiǎn)單化的處理模式,對(duì)海量數(shù)據(jù)缺乏一種立體和智能化的技術(shù)手段,大量死檔案和低價(jià)值數(shù)據(jù)是各檔案管理部門(mén)普遍存在的通病。而在大數(shù)據(jù)時(shí)代下,云計(jì)算、大數(shù)據(jù)分析、人工智能等技術(shù)的出現(xiàn),使主動(dòng)利用檔案成為可能,不同的檔案管理部門(mén),可以針對(duì)自身檔案數(shù)據(jù)的特點(diǎn)和屬性,利用基于不同數(shù)據(jù)模型而開(kāi)發(fā)的軟硬件系統(tǒng),對(duì)本單位的海量數(shù)據(jù)進(jìn)行相關(guān)性分析,從而滿(mǎn)足檔案管理者和使用者的需求,使檔案更加價(jià)值和意義。
3 應(yīng)對(duì)大數(shù)據(jù)技術(shù)時(shí)代要求的檔案信息管理策略
3.1 利用人工智能技術(shù),對(duì)檔案資源進(jìn)行采集、分類(lèi)和管理
人工智能技術(shù)的飛速發(fā)展使檔案智能管理的實(shí)現(xiàn)成為可能,檔案信息擺脫了傳統(tǒng)載體的限制,在計(jì)算機(jī)網(wǎng)絡(luò)中,應(yīng)用基于自然語(yǔ)言搜索、云計(jì)算和數(shù)據(jù)挖掘等技術(shù),在各種軟硬件的相互配合下,能夠完成從檔案資源的采集、分類(lèi)、存儲(chǔ)、鑒定、安全、分析、檢索等一系列的檔案管理業(yè)務(wù),有效提升檔案信息化建設(shè)水平。以檔案數(shù)據(jù)收集為例:文本挖掘是人工智能中最早實(shí)現(xiàn)的技術(shù)之一,面對(duì)浩如煙海的檔案信息資料,想要收集滿(mǎn)足自身需要的有價(jià)值數(shù)據(jù),憑借人力是根本不可能實(shí)現(xiàn)的。而應(yīng)用基于人工智能技術(shù)的數(shù)據(jù)挖掘產(chǎn)品智能Agent,通過(guò)關(guān)鍵詞檢索和智能分析系統(tǒng),能夠在海量信息中搜索和提取到網(wǎng)絡(luò)資源中幾乎全部的數(shù)字化成果,使檔案的檢索和利用更加的方便和快捷。
3.2 基于大數(shù)據(jù)技術(shù)下的檔案信息資源的共建與共享
“運(yùn)用互聯(lián)網(wǎng)和大數(shù)據(jù)加強(qiáng)橫向聯(lián)系,讓數(shù)據(jù)多跑路,群眾少跑腿”是近期國(guó)務(wù)院對(duì)滿(mǎn)足百姓信息需求的新倡導(dǎo)。對(duì)檔案管理工作而言,也就是利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)檔案信息資源的共建和共享。大數(shù)據(jù)本身的物性是經(jīng)過(guò)數(shù)字化后被存儲(chǔ)的可被識(shí)別的物理代碼,其真正意義在于能夠從這些海量的信息中提取和利用有價(jià)值的部分。也就是利用互聯(lián)網(wǎng)和大數(shù)據(jù)的相關(guān)技術(shù),使數(shù)據(jù)更加公開(kāi)和透明,實(shí)現(xiàn)不同部門(mén)間、不同社會(huì)群體間的信息傳導(dǎo)和利用,為檔案管理者和服務(wù)對(duì)象提供數(shù)據(jù)支撐,充分體現(xiàn)檔案管理工作的社會(huì)價(jià)值。應(yīng)在檔案信息共建共享的原則、技術(shù)和設(shè)備、實(shí)施路徑、安全性等方面制定詳細(xì)和可行的規(guī)劃,從而確保檔案管理的社會(huì)價(jià)值最大化實(shí)現(xiàn)。
3.3 應(yīng)用數(shù)據(jù)挖掘技術(shù),對(duì)檔案信息進(jìn)行開(kāi)發(fā)和利用
當(dāng)前我國(guó)檔案管理的自動(dòng)化、網(wǎng)絡(luò)化工作已經(jīng)基本實(shí)現(xiàn),很多檔案管理部門(mén)都能利用計(jì)算機(jī)軟件或網(wǎng)絡(luò)平臺(tái),對(duì)檔案工作所產(chǎn)生的海量數(shù)據(jù)信息進(jìn)行記錄、整理和分析,并從中挖掘有價(jià)值的信息,為檔案業(yè)務(wù)信息的管理提供可以參考的決策信息,為檔案數(shù)據(jù)資源的優(yōu)化和整合,檔案服務(wù)的便捷和高效提供了一定的技術(shù)支撐。但在檔案數(shù)據(jù)的深層次處理方面,由于分析方法和技術(shù)上的缺失,在對(duì)大規(guī)模數(shù)據(jù)處理上仍顯不足。而隨著數(shù)據(jù)挖掘技術(shù)的日趨成熟,人們可以通過(guò)特定的算法和模型,對(duì)數(shù)據(jù)進(jìn)行總結(jié)、分類(lèi)發(fā)現(xiàn)、聚類(lèi)和關(guān)聯(lián),對(duì)檔案數(shù)據(jù)進(jìn)行更高層次的抽象,提高檔案資源的實(shí)際利用率。檔案管理部門(mén)應(yīng)積極應(yīng)用最新的數(shù)據(jù)挖掘技術(shù),將傳統(tǒng)的數(shù)據(jù)保管模式向數(shù)據(jù)開(kāi)發(fā)和利用模式轉(zhuǎn)變,將檔案服務(wù)從被動(dòng)向信息的主動(dòng)提供者轉(zhuǎn)型。
參考文獻(xiàn)
[1]周林興,周振國(guó).高校檔案館、博物館數(shù)字資源整合研究[J].檔案管理,2014(5):10-14.
[2]張芳霖,唐霜.大數(shù)據(jù)影響下檔案學(xué)發(fā)展趨勢(shì)的思考[J].北京檔案,2014(9):9-13.
[3]楊來(lái)青,徐明君,鄒杰.檔案館未來(lái)發(fā)展的新前景:智慧檔案館[J].中國(guó)檔案,2013(2):68-70.