郭雪萍
摘要:本文在概述大數(shù)據(jù)的特點(diǎn)、原理與流程的基礎(chǔ)上,分析了大數(shù)據(jù)給檔案管理帶來(lái)的機(jī)遇與挑戰(zhàn),重點(diǎn)提出了大數(shù)據(jù)時(shí)代檔案管理的應(yīng)對(duì)策略。
Abstract: On the basis of summarizing the characteristics, principles and processes of big data, this article analyzes the opportunities and challenges brought by big data to archive management, and puts forward the strategies for archive management in the era of big data.
關(guān)鍵詞:大數(shù)據(jù);檔案管理;機(jī)遇;挑戰(zhàn)
1 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)的特點(diǎn)
大數(shù)據(jù)主要有四個(gè)方面特點(diǎn):一是數(shù)據(jù)量巨大,二是數(shù)據(jù)的種類繁多,三是價(jià)值密度相對(duì)低,四是處理速度特別的快。概括起來(lái)即為四個(gè)“V”:大量(Volume)、多樣(Variety)、價(jià)值(Value)、高速(Velocity)。
1.2 大數(shù)據(jù)的原理與流程
大數(shù)據(jù)的原理是運(yùn)用云計(jì)算處理和其數(shù)據(jù)庫(kù)、云存儲(chǔ)、虛擬化的主要技術(shù)手段,對(duì)海量數(shù)據(jù)開(kāi)展數(shù)據(jù)挖掘,從而快速獲得有價(jià)值的信息。其核心價(jià)值在于對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析。
大數(shù)據(jù)涉及的流程包括:
①數(shù)據(jù)采集:采用多個(gè)數(shù)據(jù)庫(kù)來(lái)接收來(lái)自數(shù)據(jù)采集終端的數(shù)據(jù)。
②導(dǎo)入處理:將數(shù)據(jù)采集終端的數(shù)據(jù)導(dǎo)入到一個(gè)集中的大型分布式數(shù)據(jù)庫(kù)或者分布式存儲(chǔ)集群,每秒導(dǎo)入量一般達(dá)百兆甚至千兆以上。
③統(tǒng)計(jì)分析:用分布式數(shù)據(jù)庫(kù),或分布式集群對(duì)存儲(chǔ)其內(nèi)的海量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后進(jìn)行分類匯總。
④數(shù)據(jù)挖掘:是通過(guò)在數(shù)據(jù)中進(jìn)行不同算法的計(jì)算,從而獲得新的信息,可以實(shí)現(xiàn)特定功能與定義的數(shù)據(jù)分析。
2? 大數(shù)據(jù)下檔案管理的機(jī)遇與挑戰(zhàn)
海量數(shù)據(jù)歸檔,使檔案工作從實(shí)體管理上升到知識(shí)管理;同時(shí),檔案數(shù)據(jù)庫(kù)的使用極大地提高了檔案利用效率,可有效解決常規(guī)檔案管理極易出現(xiàn)的“脹庫(kù)”現(xiàn)狀,利用大數(shù)據(jù)技術(shù)可構(gòu)建檔案館的新型知識(shí)服務(wù)引擎。這給檔案工作提供了良好的發(fā)展機(jī)遇,同時(shí)也給檔案工作帶來(lái)了巨大挑戰(zhàn)。
2.1 機(jī)遇
大數(shù)據(jù)改變了檔案管理思維,如今,檔案大都以全電子時(shí)代的載體形式來(lái)存儲(chǔ)和利用,紙質(zhì)和其他實(shí)體檔案越來(lái)越少,海量的電子檔案來(lái)源于大數(shù)據(jù),大數(shù)據(jù)平臺(tái)推動(dòng)了檔案管理。從海量數(shù)據(jù)中發(fā)掘出價(jià)值信息,并能夠?qū)n案資源轉(zhuǎn)化為知識(shí)資源,成了檔案工作者的新任務(wù)。而基于大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)又是帶領(lǐng)檔案正式步入大數(shù)據(jù)時(shí)代的基石。將檔案工作原本的“默默無(wú)聞”推向了“業(yè)務(wù)先鋒”的新角色,這些都為檔案工作帶來(lái)了新的發(fā)展機(jī)遇。
2.2 挑戰(zhàn)
第一,檔案資源管理的挑戰(zhàn)。從實(shí)體檔案到檔案數(shù)字化、數(shù)據(jù)化,檔案信息資源呈指數(shù)型增長(zhǎng),管理手段和工具已經(jīng)難以滿足大數(shù)據(jù)時(shí)代檔案信息資源管理的需求。當(dāng)下,歸檔內(nèi)容龐大、檔案信息泛濫,這種環(huán)境下實(shí)現(xiàn)檔案數(shù)據(jù)的真實(shí)性、完整性、可用性和安全性,并在海量數(shù)據(jù)中實(shí)現(xiàn)對(duì)檔案信息的挖掘分析,從而提供有價(jià)值的信息,是檔案管理面臨的新挑戰(zhàn)。
第二,檔案安全的挑戰(zhàn)。檔案涉及大量的黨和國(guó)家秘密、企業(yè)商業(yè)秘密和個(gè)人隱私。隨著檔案信息化程度的越來(lái)越高,致使檔案更容易受到網(wǎng)絡(luò)病毒、黑客的攻擊,很難保證檔案的保密性。在檔案的提取利用中,容易被非法盜取、復(fù)制、修改或者偽造等,影響檔案的真實(shí)性、合法性。
第三,檔案管理技術(shù)的挑戰(zhàn)。檔案管理技術(shù)無(wú)法滿足云計(jì)算下大數(shù)據(jù)應(yīng)用的要求。檔案管理軟件的開(kāi)發(fā)沒(méi)有統(tǒng)一的共性與標(biāo)準(zhǔn),各系統(tǒng)之間無(wú)法進(jìn)行數(shù)據(jù)的轉(zhuǎn)換,很難用同一個(gè)軟件進(jìn)行檔案的統(tǒng)一管理。再是檔案管理體系較分散,管理體制與方式的統(tǒng)一很難實(shí)現(xiàn)。
3? 應(yīng)對(duì)策略
3.1 強(qiáng)化檔案管理職能,提升人員素質(zhì)
實(shí)現(xiàn)海量檔案資源數(shù)據(jù)和檔案應(yīng)用系統(tǒng)的整合,開(kāi)展檔案信息資源的有效配置,不斷發(fā)揮檔案集合效應(yīng),從而適應(yīng)檔案資源利用共享的需要??v向加強(qiáng)監(jiān)督指導(dǎo),打破“壁壘”,加強(qiáng)與其他職能部門(mén)溝通協(xié)調(diào),尋求工作上相互支持配合,加強(qiáng)業(yè)務(wù)之間的聯(lián)合,實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),充分開(kāi)發(fā)利用,明確檔案信息資源整合的主體。
數(shù)據(jù)價(jià)值的關(guān)鍵是無(wú)限的再利用,發(fā)揮其潛在價(jià)值,這從技術(shù)層面對(duì)人才提出了較高要求,加強(qiáng)對(duì)檔案人員的能力培訓(xùn),使其具備信息化專業(yè)能力、專業(yè)知識(shí)分析能力及綜合管理素質(zhì)等,才能使大數(shù)據(jù)下的檔案管理發(fā)揮最大效能。加強(qiáng)人才培訓(xùn),除了提高專業(yè)技能外,還應(yīng)加強(qiáng)對(duì)人才的管理激勵(lì),才能不斷吸納優(yōu)秀的管理團(tuán)隊(duì)。一應(yīng)注重專業(yè)崗位的動(dòng)態(tài)管理,讓人才和崗位匹配;二要?jiǎng)?chuàng)建人才服務(wù)平臺(tái),為吸收引進(jìn)優(yōu)秀專業(yè)人才創(chuàng)造條件。
3.2 理順檔案工作體制,統(tǒng)一檔案標(biāo)準(zhǔn)規(guī)范
在遵循“統(tǒng)一領(lǐng)導(dǎo),分級(jí)管理”的原則下,切實(shí)履行檔案事業(yè)行政管理部門(mén)的行政職能,以加強(qiáng)檔案館/室建設(shè)為基礎(chǔ),突出檔案館在我國(guó)檔案事業(yè)發(fā)展中的基礎(chǔ)地位,制定和完善檔案管理標(biāo)準(zhǔn)制度。
企業(yè)應(yīng)以《中華人民共和國(guó)檔案法》、十號(hào)令等相關(guān)法律法規(guī)為基礎(chǔ),加強(qiáng)對(duì)檔案管理制度的完善和強(qiáng)化,保證檔案管理制度能夠符合國(guó)家相關(guān)要求,確保檔案管理制度能夠達(dá)到國(guó)家標(biāo)準(zhǔn)。在我國(guó),檔案工作的內(nèi)容、手段和水平日趨完善,這對(duì)促進(jìn)國(guó)家經(jīng)濟(jì)社會(huì)的發(fā)展做出了重要貢獻(xiàn)。盡管如此,檔案服務(wù)工作規(guī)范制度的缺失,讓各檔案館及檔案管理者更多的是憑著工作責(zé)任感,加上自身對(duì)業(yè)務(wù)的理解,經(jīng)驗(yàn)性地開(kāi)展檔案服務(wù)工作。統(tǒng)一管理規(guī)范的缺失,使檔案管理工作缺乏科學(xué)的引導(dǎo)與規(guī)范,阻礙了當(dāng)前環(huán)境需求下檔案館管理水平的進(jìn)一步提升,因此,在新時(shí)期制定統(tǒng)一的檔案管理服務(wù)規(guī)范對(duì)于全面提升檔案機(jī)構(gòu)服務(wù)能力具有積極的作用。檔案管理制度應(yīng)由企業(yè)內(nèi)部對(duì)其制定有效的、科學(xué)的企業(yè)檔案管理制度,比如針對(duì)企業(yè)在生產(chǎn)以及服務(wù)方而的要求不同,與企業(yè)的各個(gè)部門(mén)的責(zé)任人以及企業(yè)的檔案資料管理人員對(duì)企業(yè)檔案管理的相關(guān)制度與注意事項(xiàng)進(jìn)行相應(yīng)的討論,形成企業(yè)檔案管理辦法,并通過(guò)試用與針對(duì)性改進(jìn)逐步進(jìn)行完善。通過(guò)這些措施,滿足企業(yè)的發(fā)展任務(wù)的需求,讓檔案管理工作符合企業(yè)的發(fā)展需求。
3.3 升級(jí)檔案管理系統(tǒng),加強(qiáng)電子文件歸檔
現(xiàn)有檔案管理系統(tǒng)多數(shù)是基于單機(jī)或局域網(wǎng)建立的,為適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展趨勢(shì),需要對(duì)現(xiàn)有檔案管理系統(tǒng)進(jìn)行升級(jí),以實(shí)現(xiàn)基于云計(jì)算的大數(shù)據(jù)檔案管理。而隨著大數(shù)據(jù)的來(lái)臨,大數(shù)據(jù)檔案管理平臺(tái)也順勢(shì)而生,其依托各行業(yè)不同網(wǎng)絡(luò)環(huán)境下構(gòu)建的海量存儲(chǔ),進(jìn)行計(jì)算和管理,并能夠自動(dòng)調(diào)取利用,具備多樣性、可擴(kuò)展性、經(jīng)濟(jì)性、可定制性等特點(diǎn),加大對(duì)中小微企業(yè)在檔案管理工作中的服務(wù),也可以構(gòu)建方便靈活的具有大容量的智能數(shù)據(jù)平臺(tái),滿足個(gè)人服務(wù)。
在大數(shù)據(jù)時(shí)代下,電子文件來(lái)源日益復(fù)雜,種類繁多,企業(yè)產(chǎn)出的電子文件越來(lái)越多,電子文件歸檔與保存的具體要求,直接影響了文件的歸檔過(guò)程。隨著計(jì)算機(jī)系統(tǒng)不斷更新?lián)Q代,技術(shù)的不斷革新,電子文件的歸檔常需要更改載體且需頻繁更改,保證電子文件的長(zhǎng)久保存與利用,有著技術(shù)和標(biāo)準(zhǔn)運(yùn)用上難題,尤其是對(duì)于專業(yè)軟件形成的特殊文件。當(dāng)前環(huán)境下,因?yàn)楦鳈C(jī)構(gòu)、組織存在不同程度的電子文件管理方法不科學(xué)、歸檔方法不恰當(dāng)、管理系統(tǒng)功能不完善、管理制度不健全等問(wèn)題,直接影響著信息資源的整合與利用,威脅著電子文件檔案信息的長(zhǎng)期留存、有效收集,給歸檔管理電子文件帶來(lái)了嚴(yán)重隱患和風(fēng)險(xiǎn)。因此,應(yīng)使電子文件歸檔的各個(gè)環(huán)節(jié)加強(qiáng),從而保證電子檔案信息的有效性、準(zhǔn)確性、可利用性、可靠性等。
3.4 優(yōu)化檔案館藏結(jié)構(gòu),實(shí)行資源整合
檔案管理的綜合能力,主要體現(xiàn)在以下幾個(gè)方面:一是在對(duì)檔案資料的占有程度上;二是確立檔案工作的主體地位上,能否對(duì)各級(jí)各部門(mén)的檔案信息能夠?qū)嵭杏行У恼{(diào)配和管理;三是在系統(tǒng)性檔案資料的研究開(kāi)發(fā)方法手段和前沿水平上。為適應(yīng)大數(shù)據(jù)時(shí)代檔案管理發(fā)展趨勢(shì),有必要進(jìn)行檔案資源的整合,將各級(jí)各部門(mén)的有保存價(jià)值的檔案信息做到由分散到集中、由無(wú)序到有序,為適應(yīng)新形勢(shì)下各級(jí)各部門(mén)對(duì)檔案館服務(wù)功能的要求,通過(guò)對(duì)檔案資源的整理、組合和合理分工,使檔案機(jī)構(gòu)和檔案資源結(jié)構(gòu)合理、配置優(yōu)化,進(jìn)而提升服務(wù)功能、形成服務(wù)體系。一方面按照能夠最大限度地對(duì)全員開(kāi)放和提供優(yōu)質(zhì)服務(wù)的要求進(jìn)行檔案資源的優(yōu)化配備和整理加工,另一方面要完善各級(jí)檔案館實(shí)現(xiàn)基本功能的基礎(chǔ)條件,將分散在各個(gè)部門(mén)檔案資源進(jìn)行集中。通過(guò)對(duì)檔案資源的有效整合,才能真正的把檔案館及檔案機(jī)構(gòu)建成能夠向各級(jí)各部門(mén)提供及時(shí)、有效的信息利用中心和檔案資源服務(wù)中心。
3.5 深化檔案加工處理,開(kāi)展檔案知識(shí)服務(wù)
在大數(shù)據(jù)時(shí)代,檔案管理部門(mén)除了傳統(tǒng)的檔案接收、整理與發(fā)放等被動(dòng)職能外,還應(yīng)進(jìn)行大量的檔案加工處理,開(kāi)展檔案知識(shí)服務(wù)等主動(dòng)管理服務(wù)。檔案管理部門(mén)在收集到海量檔案數(shù)據(jù)后,可通過(guò)開(kāi)展對(duì)檔案借閱者的深入了解,開(kāi)展利用需求分析,建立相關(guān)數(shù)據(jù)模型,提高檔案價(jià)值,進(jìn)而對(duì)海量數(shù)據(jù)進(jìn)行項(xiàng)目分類、相關(guān)性分析,從而推算出數(shù)據(jù)之間的關(guān)系,將積累的檔案變成有用的信息情報(bào),讓“檔案數(shù)據(jù)庫(kù)”變成“戰(zhàn)略論證庫(kù)”,為檔案利用者提供有價(jià)值的知識(shí)服務(wù),為科學(xué)決策提供參考。
3.6 實(shí)施檔案風(fēng)險(xiǎn)管理,確保安全的檔案信息
大數(shù)據(jù)應(yīng)用的最大風(fēng)險(xiǎn),是檔案數(shù)據(jù)安全管理問(wèn)題。海量數(shù)據(jù)盡管集中存儲(chǔ),方便了數(shù)據(jù)分析和處理,但這種環(huán)境下,數(shù)據(jù)的安全管理、數(shù)據(jù)的管理備份不當(dāng)?shù)?,很容易造成?shù)據(jù)的永久丟失和損壞,這一風(fēng)險(xiǎn)對(duì)檔案來(lái)說(shuō),將是毀滅性的災(zāi)難。大數(shù)據(jù)時(shí)代的檔案風(fēng)險(xiǎn)管理需要做好以下幾個(gè)方面:
一是數(shù)據(jù)保護(hù)。由于大數(shù)據(jù)采用云計(jì)算的方式進(jìn)行,這種服務(wù)方式使用戶失去了對(duì)物理資源的直接控制,從而導(dǎo)致檔案數(shù)據(jù)在不知情的情況下可能被竊,因此,在建立大數(shù)據(jù)檔案管理的同時(shí),需要建立有效的安全機(jī)制,盡量減少數(shù)據(jù)失竊的幾率。
二是數(shù)據(jù)備份。建立合理有效的數(shù)據(jù)備份與歸檔機(jī)制,確保檔案數(shù)據(jù)在安全機(jī)制失效導(dǎo)致數(shù)據(jù)丟失或損壞的情況下,可通過(guò)備份或歸檔的數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)恢復(fù),避免大數(shù)據(jù)檔案發(fā)生毀滅性的災(zāi)難。
4? 結(jié)束語(yǔ)
大數(shù)據(jù)技術(shù)對(duì)檔案資源開(kāi)發(fā)利用將會(huì)產(chǎn)生巨大的貢獻(xiàn)與影響,促使檔案管理系統(tǒng)功能的強(qiáng)化與完善,可對(duì)企業(yè)各類信息資源和知識(shí)資產(chǎn)進(jìn)行管理,充分實(shí)現(xiàn)檔案的知識(shí)價(jià)值,實(shí)現(xiàn)大數(shù)據(jù)時(shí)代到知識(shí)管理的跨越,可大大提升企業(yè)的核心競(jìng)爭(zhēng)力,也可以提高檔案工作的地位與作用。
參考文獻(xiàn):
[1]徐擁軍.企業(yè)檔案知識(shí)管理模式——基于雙向視角的研究[J].檔案學(xué)通訊,2007(5):50-53.
[2]劉艷英.試談檔案信息化管理[J].蘭臺(tái)內(nèi)外,2013(3):55-55.
[3]陳傳義.檔案信息網(wǎng)站構(gòu)建基礎(chǔ)與實(shí)例[J].檔案學(xué)通訊,2012(4):49-50.
[4]蘭祝剛,惠英,李剛.大數(shù)據(jù)時(shí)代下的檔案工作[J].中國(guó)檔案,2013(9):74-75.
[5]王爽,王彤.關(guān)于檔案信息資源整合的思考[J].蘭臺(tái)內(nèi)外,2013(2):40.
[6]馮惠玲.電子文件的雙重鑒定:《擁有新記憶———電子文件管理研究》摘要之三[J].檔案學(xué)通訊,1998(3):32-35.