劉雙玢
【摘要】大數(shù)據(jù)背景下海量數(shù)據(jù)的出現(xiàn)沖擊著原有的傳統(tǒng)檔案編研的模式。大數(shù)據(jù)時(shí)代使得我們尋找新的檔案編研策略,促進(jìn)檔案“大編研”。本文概述了傳統(tǒng)檔案編研管理現(xiàn)狀,分析了大數(shù)據(jù)背景下檔案編研工作的整體趨向,并給出了檔案編研工作的開(kāi)展策略。
【關(guān)鍵詞】大數(shù)據(jù);檔案編研;新趨向
傳統(tǒng)的檔案編研工作以紙質(zhì)材料為基礎(chǔ),進(jìn)行人工分析后傳播利用。隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),數(shù)據(jù)量爆炸式增長(zhǎng),傳統(tǒng)的檔案編研方式明顯不能應(yīng)對(duì)社會(huì)多元化的信息需求。檔案工作者要借助大數(shù)據(jù)技術(shù)重新完善檔案編研體系,促進(jìn)檔案“大編研”的發(fā)展。
一、傳統(tǒng)檔案編研管理的現(xiàn)狀
(一)傳統(tǒng)檔案編研的具體做法。檔案編研是以館藏資源為基礎(chǔ),進(jìn)行整合與開(kāi)發(fā),形成印刷型、音像型、數(shù)字型成果的一項(xiàng)工作。編研工作主要包括兩個(gè)方面:編纂和研究。目前檔案部門(mén)的重依然停留在檔案的收集、整理、歸檔和普通利用服務(wù)的環(huán)節(jié)過(guò)程中。檔案編研工作主要包括兩個(gè)方面:一是檔案的整理和匯編。檔案部門(mén)先收集檔案資料,然后根據(jù)檔案的工作重心對(duì)有價(jià)值的信息進(jìn)行匯編整合。二是分析和研究。根據(jù)編研主題,工作人員將根據(jù)自己的經(jīng)驗(yàn)和觀(guān)點(diǎn)對(duì)檔案信息進(jìn)行分析挖掘,形成較為精煉和概括性專(zhuān)題分析材料,供利用者查閱使用。
(二)傳統(tǒng)編研方法存在的問(wèn)題。目前各個(gè)省級(jí)檔案館已開(kāi)通自己的檔案信息網(wǎng)站,但是信息網(wǎng)站中有關(guān)檔案編研的問(wèn)題卻還是存在各個(gè)方面。首先,從檔案編研的名稱(chēng)來(lái)看,各個(gè)省級(jí)檔案館信息網(wǎng)站關(guān)于檔案編研的詞條名稱(chēng)大同小異,如
“檔案編研”“編研成果”“編研出版”等等。其次,編研質(zhì)量方面,各個(gè)網(wǎng)站也是呈現(xiàn)不同的水平。有的省級(jí)檔案信息網(wǎng)站內(nèi)容豐富新穎,上海檔案信息網(wǎng)的“檔案博覽”中有各種歷史檔案故事匯編,如“老撾王室子弟中國(guó)留學(xué)記”“重訪(fǎng),鄧小平的上海足跡”等等,有珍貴的歷史考察價(jià)值,但是像廣西檔案信息網(wǎng)中卻找不到專(zhuān)門(mén)歸類(lèi)的檔案編研詞條與內(nèi)容。最后,從編研內(nèi)容來(lái)看,多以“歷史記錄”“全宗介紹”“大事記”為主,和群眾生活密切相關(guān)的內(nèi)容相對(duì)較少。綜合來(lái)看,檔案信息網(wǎng)站主要存在以下問(wèn)題:第一,檔案編研選題較少拓展館藏資源以外的內(nèi)容。第二,檔案編研人員素質(zhì)和技術(shù)手段較為落后。第三,檔案信息的開(kāi)發(fā)利用主要依靠工作人員手工操作,檔案工作“編多研少”。第四,檔案編研主要是工作人員內(nèi)部進(jìn)行,與大眾生活脫節(jié)。
二、大數(shù)據(jù)背景下檔案編研工作的發(fā)展趨勢(shì)
傳統(tǒng)的檔案編研是檔案館、檔案室將以書(shū)刊為載體的檔案進(jìn)行匯編然后予以公布的過(guò)程?,F(xiàn)在出現(xiàn)的“大編研”具體體現(xiàn)在編纂者不局限于是檔案館、檔案室,可以是企事業(yè)單位、科研部門(mén)、學(xué)術(shù)機(jī)構(gòu)等等。國(guó)家檔案局在《全國(guó)檔案事業(yè)發(fā)展的“十二五”規(guī)劃》中提出的任務(wù)之一是加強(qiáng)檔案編研工作,挖掘檔案信息資源,把“死檔案”變成“活資料”,努力把檔案館建成“思想庫(kù)”。大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)中心的運(yùn)維工作和之前有了很大不同?,F(xiàn)在更多考慮如何根據(jù)數(shù)據(jù)預(yù)測(cè)并避免問(wèn)題發(fā)生,以及大數(shù)據(jù)時(shí)代大量虛擬化設(shè)備對(duì)于數(shù)據(jù)分析難度和中心的轉(zhuǎn)變。綜合分析大數(shù)據(jù)背景下檔案編研工作的發(fā)展趨勢(shì)有以下幾點(diǎn):
(一)數(shù)據(jù)挖掘觀(guān)念增強(qiáng)使得檔案編研工作獲得更廣闊的發(fā)展空間。大數(shù)據(jù)時(shí)代檔案信息急速增長(zhǎng),由于檔案本身具有原始記錄性的作用,那么檔案信息的整合就顯得迫在眉睫。大數(shù)據(jù)時(shí)代引導(dǎo)檔案編研工作者對(duì)檔案信息進(jìn)行再加工,運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)和思維對(duì)海量數(shù)據(jù)進(jìn)行整合,匯編成有價(jià)值的信息,促進(jìn)編研工作發(fā)展空間擴(kuò)大。
(二)海量數(shù)據(jù)的增長(zhǎng)為檔案編研工作提供了更豐富的信息資源。大數(shù)據(jù)時(shí)代檔案規(guī)模的增長(zhǎng)速度的加快極大地豐富了可編研的館藏資源。另外,大數(shù)據(jù)技術(shù)的出現(xiàn)使得檔案編研形式變得更加多樣化,除了文本,還可以視頻、音頻、圖片等多種方式進(jìn)行編研,這樣的編研成果更具有吸引力,也滿(mǎn)足了社會(huì)需求。
(三)大數(shù)據(jù)技術(shù)的提升使得檔案編研工作有了技術(shù)保障。大數(shù)據(jù)背景下處理檔案信息更加注重效率。如果精細(xì)化處理,將會(huì)錯(cuò)過(guò)很多有用的信息,也會(huì)失去信息的時(shí)效性。數(shù)字處理技術(shù)變得逐漸發(fā)達(dá),目前可以實(shí)現(xiàn)信息反復(fù)輸出,編排方式靈活,進(jìn)行迅速檢索,提升工作效率。在數(shù)據(jù)處理技術(shù)的支持下,編研工作勞動(dòng)量降低,檔案信息編排結(jié)果更加清晰,表現(xiàn)形式更多樣化。
三、大數(shù)據(jù)背景下檔案編研工作的發(fā)展策略
(一)檔案管理觀(guān)念轉(zhuǎn)變成數(shù)據(jù)管理觀(guān)念。大數(shù)據(jù)時(shí)代,檔案編研展現(xiàn)出了現(xiàn)代化、信息化、服務(wù)化。各個(gè)檔案館的電子檔案仍屬于稀缺狀態(tài)。大數(shù)據(jù)時(shí)代要求檔案館跟進(jìn)時(shí)代腳步,及時(shí)轉(zhuǎn)變成數(shù)據(jù)管理思想,并進(jìn)行信息挖掘。不管是“小編研”還是 “大編研”,都要摒棄“重保管輕利用”“只編不研”的思想,加強(qiáng)數(shù)據(jù)管理理念,借助現(xiàn)代科技手段,高效完成各類(lèi)檔案工作編研。
(二)應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行電子編研。大數(shù)據(jù)技術(shù)是指從各種類(lèi)型、未經(jīng)加工的海量數(shù)據(jù)中分析挖掘出有價(jià)值信息的過(guò)程。大數(shù)據(jù)處理的關(guān)鍵技術(shù)有:大數(shù)據(jù)采集、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲(chǔ)及管理、大數(shù)據(jù)分析及挖掘、大數(shù)據(jù)的展現(xiàn)及應(yīng)用。檔案編研在大數(shù)據(jù)時(shí)代的發(fā)展需要依托互聯(lián)網(wǎng)平臺(tái),進(jìn)行社會(huì)化存取和集約化處理。首先,分析檔案信息內(nèi)容和用戶(hù)信息需求。分析檔案信息要利用數(shù)據(jù)挖掘技術(shù)剔除多余信息,最終產(chǎn)生智能、精品化檔案信息結(jié)果。而用戶(hù)信息需求數(shù)據(jù)的挖掘可以借助谷歌大數(shù)據(jù)技術(shù)以及在其基礎(chǔ)上發(fā)展起來(lái)的Hadoop技術(shù)。其次,建立電子編研系統(tǒng)。前期數(shù)據(jù)挖掘工作完成后,要及時(shí)將用戶(hù)信息和檔案匯編信息進(jìn)行整理和數(shù)字化入庫(kù),將信息進(jìn)行專(zhuān)題化分類(lèi),在分類(lèi)后形成知識(shí)性、系統(tǒng)性的二次、三次電子編研信息資源,并建立電子編研信息資源庫(kù)。
(三)突破界限,開(kāi)展跨領(lǐng)域合作。大數(shù)據(jù)時(shí)代的檔案編研呈現(xiàn)科技化、專(zhuān)業(yè)化,利用到各種較為復(fù)雜的數(shù)據(jù)分析技術(shù)。短時(shí)間內(nèi)若想依靠檔案人員解決技術(shù)問(wèn)題并不現(xiàn)實(shí),為了節(jié)約成本,提高工作效率,檔案部門(mén)可以與其他精通技術(shù)行業(yè)的人進(jìn)行跨領(lǐng)域合作,合力完成檔案編研工作。跨領(lǐng)域合作不僅僅可以高效解決技術(shù)問(wèn)題,還可以從專(zhuān)業(yè)的角度挖掘數(shù)據(jù)信息所呈現(xiàn)出的社會(huì)需求,對(duì)檔案編研提出具有現(xiàn)實(shí)意義的指導(dǎo)。
(四)運(yùn)用互聯(lián)網(wǎng)技術(shù)加快檔案編研成果的傳播。互聯(lián)網(wǎng)技術(shù)推動(dòng)檔案編研成果的快速傳播,影響范圍擴(kuò)大,能夠?yàn)闄n案編研成果的使用者提供更加便利的環(huán)境。互聯(lián)網(wǎng)使得檔案編研的成果接近社會(huì)需求,拉近了與社會(huì)大眾之間的距離,使得檔案編研成果能夠得以在各個(gè)層次和專(zhuān)業(yè)的人群中傳播,最大限度地發(fā)揮了檔案的價(jià)值。
(五)構(gòu)建滿(mǎn)足社會(huì)需求的檔案編研內(nèi)容。檔案館的編研工作歸根究底還是服務(wù)于社會(huì)大眾,檔案編研成果不能偏離群眾生活太多,內(nèi)容要引起大眾的興趣。因此,檔案編研產(chǎn)品要做好前期需求分析,根據(jù)不同層次和專(zhuān)業(yè)的人群需求做出合適的、圖文并茂的內(nèi)容。首先,拓展選題視野。比如寧夏檔案局、寧夏檔案館主編的《紀(jì)念世界反法西斯戰(zhàn)爭(zhēng)暨中國(guó)人民抗日戰(zhàn)爭(zhēng)勝利70周年檔案文獻(xiàn)匯編》是在2015年9月紀(jì)念反法西斯戰(zhàn)爭(zhēng)70周年紀(jì)念之際面世的,通過(guò)豐富的圖文回顧展示光輝歷程。其次,拓展選材空間。要將選材范圍擴(kuò)大到社會(huì)群體,和其他文化教育部門(mén)進(jìn)行合作編研。比如:蘇州大學(xué)檔案館、蘇州大學(xué)校史研究室聯(lián)合編輯的《東吳大學(xué)史料選輯(歷程)》,內(nèi)容來(lái)自多所文化教育單位,顯示了豐富選材的重要性。最后,實(shí)現(xiàn)編者和利用者的互動(dòng)化。
四、結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代的到來(lái)給檔案編研工作帶來(lái)了發(fā)展機(jī)遇。檔案工作者應(yīng)當(dāng)抓住機(jī)遇,學(xué)會(huì)運(yùn)用數(shù)據(jù)挖掘技術(shù),提升檔案編研水平,充分且全方位地發(fā)揮檔案的社會(huì)價(jià)值,開(kāi)展全新的檔案信息資源開(kāi)發(fā)格局,為社會(huì)提供更有價(jià)值的檔案編研成果。
【參考文獻(xiàn)】
[1]吉星昇.對(duì)綜合檔案館檔案編研工作"編"多"研"少的新認(rèn)識(shí)[J].檔案與建設(shè),2017(07):24-26.
[2]王永梅,張穎.應(yīng)用大數(shù)據(jù)技術(shù)開(kāi)展編研工作[J].檔案與建設(shè),2015(12):73-76.
[3]張雋軒,張文利,黃毅.數(shù)據(jù)中心運(yùn)維系統(tǒng)應(yīng)用ITIL管理體系分析[J].智能建筑與城市信息,2015(03):77-78.
[4]李莉.試析信息時(shí)代檔案編研工作發(fā)展趨勢(shì)[J].檔案學(xué)研究,2017(S2):24-27.
[5]周燾.大數(shù)據(jù)時(shí)代的檔案大編研[J].陜西檔案,2014(02):24-25.