趙彥昌+段雪茹
摘要:本文運用SWOT分析法,分析了檔案部門在大數(shù)據(jù)時代開展檔案信息資源整合自身的優(yōu)勢、劣勢,以及面臨的外部機遇和挑戰(zhàn),以便運用大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術來推進檔案信息資源整合的進程。
關鍵詞:大數(shù)據(jù)檔案信息資源SWOT分析
Abstract: This article will use the SWOT analysis method to analysis the advantages ,disadvantages op? portunities and challenges of archives information re? sources integration in the time of big data, which ex? pect to use the data mining technology to promote the progress of archives information resources inte? gration.
Keywords:Big data; Archives information resourc? es; SWOT analysis method
一、引言
大數(shù)據(jù)時代的到來給檔案事業(yè)帶來了深遠的影響。大數(shù)據(jù)是以容量大、類型多、存取速度快、應用價值高為主要特征的數(shù)據(jù)集合,對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進行采集、存儲和關聯(lián)分析,從中發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的新一代信息技術和服務業(yè)態(tài)。[1]但是事物都有兩面性,一方面,大數(shù)據(jù)能夠給人們帶來便捷,比如幫助人們獲取海量的信息資源;另一方面,也為人們的檢索帶來難題,比如如何快捷、高效地在海量信息資源中挖掘出滿足自己需求的信息。從這個角度而言,檔案部門應立足于檔案信息資源整合的現(xiàn)狀,結合大數(shù)據(jù)的時代背景,充分應用大數(shù)據(jù)時代的信息挖掘技術,采取有效的措施應對大數(shù)據(jù)時代帶來的挑戰(zhàn),最終實現(xiàn)檔案信息資源的整合。基于此,我們采用SWOT分析法對大數(shù)據(jù)環(huán)境下檔案部門開展檔案信息資源整合自身的優(yōu)勢、劣勢、面臨的外部機遇和挑戰(zhàn)進行分析,以便檔案部門在進行檔案信息資源整合時認清形勢,揚長避短,抓住機遇,制定符合大數(shù)據(jù)時代的檔案信息資源整合措施。具體如圖1所示。
二、優(yōu)勢分析
首先,我們從技術優(yōu)勢、保管條件優(yōu)勢、檔案館數(shù)字化現(xiàn)代管理系統(tǒng)三個方面來分析大數(shù)據(jù)時代現(xiàn)有檔案信息資源整合的優(yōu)勢。
(一)檔案館的技術優(yōu)勢
1.目前現(xiàn)有的信息交換技術在檔案信息資源整合中的應用。部分檔案信息資源的內(nèi)容是不公開的,涉密性較高。因此,在整合檔案信息資源時,既要滿足其共享性的要求,又要保障檔案信息資源的安全性。第一,傳統(tǒng)以紙質(zhì)檔案為主的檔案信息資源可以通過用戶到檔案館借閱瀏覽實現(xiàn)信息交換。而數(shù)字化的檔案資源則可以通過檔案網(wǎng)站、檔案數(shù)據(jù)庫等“一站式跨庫檢索”實現(xiàn)共享。第二,為了保障信息交換的安全,引入“用戶身份認證技術”。不同的用戶具有不同的訪問權限,通過這種方式在一定程度上約束用戶行為,保障檔案信息資源的安全性。
2.大數(shù)據(jù)時代檔案信息資源的利用技術優(yōu)勢。傳統(tǒng)檔案載體信息資源的利用主要是通過檔案館閱覽室借閱、檔案復制本、館內(nèi)現(xiàn)場人員咨詢服務等方式實現(xiàn)的。在大數(shù)據(jù)時代,還出現(xiàn)了電子檔案閱覽室、檔案云平臺網(wǎng)絡在線咨詢等自主利用方式。例如,遼寧省檔案館網(wǎng)站就有新聞發(fā)布室、文化大觀園、走進展廳、檔案云平臺、業(yè)務系統(tǒng)專區(qū)等模塊。在“檔案云平臺”模塊,用戶可以通過鍵入檔號、題名等信息,自主查閱政府信息公開文件、檔案信息資源、綜合檔案館館藏等。
(二)檔案館的保管條件優(yōu)勢
2014年8月,中共中央辦公廳、國務院辦公廳聯(lián)合印發(fā)的《關于加強和改進新形勢下檔案工作的意見》中明確要求:“檔案機構要建立健全人防、物防、技防三位一體的檔案安全防范體系,確保檔案安全?!痹诖艘庖姷耐苿酉?,部分省市檔案館(室)已經(jīng)基本建成智慧館庫,即以物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等技術為支撐,對檔案館庫房進行智能一體化設計,從而實現(xiàn)對檔案的集中統(tǒng)一保管,達到檔案安全保管工作的網(wǎng)絡化、智能化、人性化、科學化。[2]
(三)檔案館數(shù)字化現(xiàn)代管理系統(tǒng)的發(fā)展
在大數(shù)據(jù)時代,檔案館建立了數(shù)字化現(xiàn)代管理系統(tǒng)。數(shù)字化現(xiàn)代管理系統(tǒng)一般分為日常業(yè)務管理系統(tǒng)、檔案數(shù)字化采集系統(tǒng)和數(shù)字化檔案查閱系統(tǒng)三大板塊。除此以外,該系統(tǒng)還包括系統(tǒng)維護、Web瀏覽查詢等功能。各個模塊相互協(xié)調(diào)配合,不僅能夠滿足檔案館工作人員日常辦公的需求,而且能夠縮短用戶的檢索時間,提升檢索效率和服務效能,最終促使檔案信息資源數(shù)字化的順利開展。以蘇州數(shù)字化現(xiàn)代檔案管理系統(tǒng)的建設為例,蘇州市數(shù)字檔案館項目已經(jīng)完成,能夠通過網(wǎng)絡處理檔案館所有業(yè)務,而各機關事業(yè)單位信息化建設也已見成效。[3]
三、劣勢分析
(一)理念與實踐進度不匹配
為了推進檔案信息資源的整合,檔案工作者提出了“大檔案”的理念?!按髾n案”理念由來已久,但是檔案部門只是把“大檔案”理念落實到檔案館的建設中,并沒有較好地應用在檔案信息資源的建設中。因此,我們不僅要提出與時代發(fā)展相匹配的管理理念,而且要使理念落實到檔案信息資源整合的實踐中去。在大數(shù)據(jù)時代,檔案信息資源整合需要各個環(huán)節(jié)的配合和各個部門協(xié)調(diào)一致的工作才能完成,各部門、各環(huán)節(jié)的協(xié)調(diào)都需要強大的信息系統(tǒng)來組織、協(xié)調(diào)和實現(xiàn)信息資源共享,使其得到最優(yōu)化的利用。簡言之,檔案部門要充分發(fā)揮意識的能動作用,讓大數(shù)據(jù)時代的“大檔案”理念更好地指導檔案信息資源整合的實踐工作。
(二)缺乏統(tǒng)一的技術整合規(guī)范標準
當前在檔案信息資源整合中,檔案部門缺乏一套統(tǒng)一的技術整合標準體系,制約了檔案信息資源整合更好的發(fā)展,因此應該高度重視?!皹藴驶菍n案信息資源各方面建設具有總攬性的前提與基礎,也是最亟待解決的實際問題,否則檔案信息資源共建共享就無法實現(xiàn)。”[4]可見,只有建立一套檔案信息資源整合的標準體系,各地區(qū)檔案館在開展檔案信息資源整合時才能有據(jù)可依。
(三)檔案信息資源質(zhì)量的難把關
一方面,紙質(zhì)檔案信息資源質(zhì)量鑒定困難。檔案館為了豐富館藏,改變原本單一的館藏結構,會不斷地在整合工作中更加廣泛地收集檔案,由于檔案種類繁多,類目繁雜,短時間內(nèi)僅僅依靠檔案館工作人員很難選取大量優(yōu)質(zhì)的檔案信息資源。此外,檔案部門不僅要關注檔案信息資源內(nèi)容的優(yōu)質(zhì)性,還要關注其檔案載體質(zhì)量的好壞,二者兼顧才能更好地為檔案信息資源質(zhì)量進行把關。另一方面,數(shù)字檔案信息資源質(zhì)量的控制與鑒定也比較復雜。既要控制好數(shù)字檔案信息資源采集環(huán)節(jié)的質(zhì)量,又要控制好錄入、組織與開發(fā)環(huán)節(jié)的質(zhì)量。因此,在進行檔案信息資源整合時,如何收集質(zhì)量優(yōu)、價值高的檔案資源也將是我們面臨的問題之一。
四、機遇分析
只有抓住機遇才能更好地發(fā)展自己,大數(shù)據(jù)環(huán)境下檔案部門開展檔案信息資源整合也面臨著一些機遇,抓住這些機遇,有利于檔案事業(yè)更好的發(fā)展。
(一)國家政策的支持
“十二五”規(guī)劃期間,《全國檔案事業(yè)發(fā)展“十二五”規(guī)劃》中提到要實施公共檔案信息資源共享服務工程項目,打造“一站式”檔案信息資源共享和服務平臺,為社會提供全方位的檔案信息服務。[5]“十三五”規(guī)劃期間,國家檔案局印發(fā)的《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中也制定了相關政策支持檔案信息資源整合的發(fā)展。其中,有一項發(fā)展目標就是“實現(xiàn)檔案資源多樣化。依法管理檔案資源,各級國家機關、團體、企業(yè)事業(yè)單位檔案實現(xiàn)應歸盡歸、應收盡收;檔案資源更加齊全完整、豐富多元,覆蓋人民群眾的檔案資源體系更加完善。”[6]
(二)大數(shù)據(jù)環(huán)境下信息挖掘技術的進步
隨著互聯(lián)網(wǎng)技術的發(fā)展,越來越多的信息以非結構化或半結構化的形式進行存儲,如超級文本標記語言(HTML)文檔。目前,對這類文檔數(shù)據(jù)訪問主要是基于瀏覽和信息檢索技術,而已知瀏覽器和搜索引擎檢索信息的能力是非常有限的。[7]通過Web文本挖掘技術,一方面,可以提升檔案信息資源的檢索效率。首先,Web2.0通過對信息的聚類處理,把碎片化的信息整合到一起,發(fā)揮其最大的利用價值。其次,Web2.0通過對用戶的檢索痕跡進行分析,使分析結果一目了然,然后通過對分析結果進行分組和標注,使提供的檢索內(nèi)容更加精確,從而優(yōu)化了用戶的檢索效果,提升了檢索效率。另一方面,極大地提升了服務效能。在搜索信息或者問題時,搜索引擎就會自動推送用戶可能感興趣的信息供用戶參考。檔案館可以通過分析用戶瀏覽不同類型信息資源的頻率,從而分析關注用戶的喜好,這樣有利于升級完善更加人性化的推薦、定制等多樣化的服務。
(三)信息化建設為檔案信息資源整合提供了有利的平臺
我國開展的信息化建設為檔案信息資源的整合提供了有利的平臺?!笆濉币?guī)劃期間,我國的檔案信息化建設已經(jīng)取得了一些成果,如檔案信息化建設初具規(guī)模。初步建成以局域網(wǎng)、政務網(wǎng)、因特網(wǎng)為平臺,以檔案信息管理系統(tǒng)為支撐,以檔案目錄中心、基礎數(shù)據(jù)庫、檔案利用平臺、檔案網(wǎng)站信息發(fā)布為基礎的檔案信息化體系。[8]“十三五”規(guī)劃期間,《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中也提到了要加快檔案管理信息化進程的目標。它要求各檔案部門、檔案網(wǎng)站等主體加快提升電子檔案管理水平。[9]
五、挑戰(zhàn)分析
知己知彼,方能百戰(zhàn)不殆。檔案部門既要抓住機遇,促進檔案信息資源整合的開展,也要了解外部面臨的挑戰(zhàn)和威脅,以便提出相應的解決對策。
(一)信息實時精準管控難
大數(shù)據(jù)時代,動態(tài)性與交互性并存,使得數(shù)據(jù)實時精準管控難?;ヂ?lián)網(wǎng)信息是檔案信息資源的重要組成部分,而互聯(lián)網(wǎng)信息的動態(tài)性是顯而易見的,具有較大的自由度和隨意性。除此以外,在大數(shù)據(jù)時代,網(wǎng)絡構筑起了檔案館和用戶之間的互動橋梁,檔案館可以通過檔案網(wǎng)站向用戶輸送信息,公眾可以參與互動,實現(xiàn)信息的雙向流動。從這個角度而言,檔案部門對紛繁復雜、動態(tài)性強,互動性緊密的數(shù)字檔案信息資源實時精準控制的難度越來越大。
(二)對數(shù)據(jù)分析帶來的挑戰(zhàn)
大數(shù)據(jù)時代是一個海量數(shù)據(jù)和信息爆炸式增長的時代。隨著檔案部門信息化建設工作的開展,檔案信息資源的收集渠道也日趨多元化,數(shù)據(jù)類型不僅包括結構化數(shù)據(jù),而且包括非結構化數(shù)據(jù)等。由于大數(shù)據(jù)時代信息類型的多樣性發(fā)展,使得傳統(tǒng)封閉式的檔案數(shù)據(jù)挖掘與分析技術不再適應半結構化數(shù)據(jù)等的分析處理。“要獲得大數(shù)據(jù)分析的價值,就應關注檔案數(shù)字資源中的數(shù)據(jù)關系和語義表征,實現(xiàn)信息整合與知識整合。但目前檔案數(shù)字資源整合還處于數(shù)據(jù)整合階段,偏重于實現(xiàn)異質(zhì)異構數(shù)據(jù)在物理或邏輯上的集中和互聯(lián)互通,僅能為用戶提供信息檢索服務,這與大數(shù)據(jù)時代的要求相去甚遠?!盵10]
(三)安全技術存在的漏洞
大數(shù)據(jù)時代的到來為檔案信息資源整合帶來了較多機遇,但是大數(shù)據(jù)時代也容易出現(xiàn)信息泄密的現(xiàn)象。一方面,在大數(shù)據(jù)時代,信息種類繁多,檔案部門要學會識別哪些檔案信息資源能開放,哪些檔案信息資源又屬于加密的。另一方面,雖然檔案館有采取“用戶身份認證技術”來約束用戶行為的措施,但是遠遠不夠。目前,互聯(lián)網(wǎng)的開放性對檔案信息的安全構成了一定威脅,比如黑客非法入侵、計算機病毒植入等都能對檔案網(wǎng)站信息資源的安全構成挑戰(zhàn)。除此以外,在云環(huán)境下,云安全也存在著一定的風險。比如云計算的隱私保護問題集中在訪問控制方面,上傳到云端的敏感數(shù)據(jù)能否被非授權訪問,用戶訪問時個人身份信息會被保留多久。[11]因此,檔案部門要培養(yǎng)掌握計算機技術和檔案專業(yè)技能的綜合素質(zhì)人才,健全檔案信息安全技術等確保檔案信息資源整合的安全。
綜上,在大數(shù)據(jù)時代,檔案部門開展檔案信息資源整合有利于推動我國檔案事業(yè)的發(fā)展,有利于實現(xiàn)檔案信息資源的共享、開發(fā)和利用。通過上述分析,檔案部門在進行檔案信息資源整合時要依托自身內(nèi)部的優(yōu)勢,抓住外部機遇,努力改變內(nèi)部的劣勢,積極應對外部的挑戰(zhàn),制定出符合大數(shù)據(jù)時代的檔案信息資源整合策略,使其更好地為用戶服務,實現(xiàn)檔案信息資源應有的價值。
*本文為2016年國家社科基金項目“非結構化電子文件管理研究”(項目編號:16BTQ089)的階段性研究成果。
注釋及參考文獻:
[1]國務院.促進大數(shù)據(jù)發(fā)展行動綱要[M].北京:人民出版社,2015:2.
[2]吳慧芳,郭慶琳,余武南.檔案館智慧館庫建設研究[J].北京檔案,2016(5):27-28.
[3]肖芃,林忠華,卜鑒民.構建區(qū)域性大檔案格局[J].中國檔案,2011(3):22.
[4]劉玉波.檔案信息資源共建共享機制建設問題芻議[J].黑龍江檔案,2015(1):92.
[5]國家檔案局.全國檔案事業(yè)發(fā)展“十二五”規(guī)劃(摘要)[J].機電兵船檔案,2011(2):4.
[6][8][9]國家檔案局.全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要[J].中國檔案,2016(5):14-16.
[7][11]李智勇,李蒙,周悅.大數(shù)據(jù)時代的云安全[M].北京:化學工業(yè)出版社,2016(3):47-119.
[10]孟歆.大數(shù)據(jù)時代檔案數(shù)字資源整合的難點及對策分析[J].山西檔案,2015(1):79.