林周佳
(中國第二歷史檔案館,江蘇南京,210016)
2010年末,時任中共中央書記處書記、中央辦公廳主任令計劃在出席全國檔案工作座談會時強(qiáng)調(diào),各級檔案部門和廣大檔案工作者要適應(yīng)當(dāng)今時代的新發(fā)展、適應(yīng)黨和國家的新要求、適應(yīng)人民群眾的新期待,大力推進(jìn)檔案事業(yè)改革創(chuàng)新,努力實(shí)現(xiàn)檔案工作科學(xué)發(fā)展,為服務(wù)黨和國家工作大局作出更大貢獻(xiàn)。這一指示為檔案事業(yè)的發(fā)展指明了前進(jìn)的方向,全國各級檔案部門認(rèn)真思考,積極探索檔案事業(yè)改革與創(chuàng)新之路。當(dāng)今,是信息化時代,隨著信息技術(shù)的不斷發(fā)展,各行業(yè)對它的依賴程度也越來越高,信息化程度在一定意義上體現(xiàn)了一個行業(yè)綜合實(shí)力的高低。所以檔案事業(yè)的改革與創(chuàng)新必須以信息技術(shù)為基礎(chǔ)、為依托,筆者試就民國檔案管理為例從以下三個方面闡述信息技術(shù)與檔案館的基礎(chǔ)工作相結(jié)合,實(shí)現(xiàn)檔案館原先工作模式的改革與創(chuàng)新。
物聯(lián)網(wǎng)是新一代信息技術(shù)的重要組成部分,其英文名稱是“The Internet of things”。由此,顧名思義,“物聯(lián)網(wǎng)就是物物相連的互聯(lián)網(wǎng)”。它有兩層含義:第一,物聯(lián)網(wǎng)的核心和基礎(chǔ)仍然是互聯(lián)網(wǎng),是在互聯(lián)網(wǎng)基礎(chǔ)上的延伸和擴(kuò)展的網(wǎng)絡(luò);第二,其用戶端延伸和擴(kuò)展到了任何物品與物品之間,進(jìn)行信息交換和通信。物聯(lián)網(wǎng)通過智能感知、識別技術(shù)與普適計算、泛在網(wǎng)絡(luò)的融合應(yīng)用,被稱為繼計算機(jī)、互聯(lián)網(wǎng)之后世界信息產(chǎn)業(yè)發(fā)展的第三次浪潮。物聯(lián)網(wǎng)是互聯(lián)網(wǎng)的應(yīng)用拓展,與其說物聯(lián)網(wǎng)是網(wǎng)絡(luò),不如說物聯(lián)網(wǎng)是業(yè)務(wù)和應(yīng)用。
國際電信聯(lián)盟(ITU)發(fā)布的ITU互聯(lián)網(wǎng)報告,對物聯(lián)網(wǎng)做了如下定義:通過二維碼識讀設(shè)備、射頻識別(RFID)裝置、紅外感應(yīng)器、全球定位系統(tǒng)和激光掃描器等信息傳感設(shè)備,按約定的協(xié)議,把任何物品與互聯(lián)網(wǎng)相連接,進(jìn)行信息交換和通信,以實(shí)現(xiàn)智能化識別、定位、跟蹤、監(jiān)控和管理的一種網(wǎng)絡(luò)。在物聯(lián)網(wǎng)環(huán)境下,沒有生命的物體植入各種微型感應(yīng)芯片后,借助網(wǎng)絡(luò)就能實(shí)現(xiàn)互相通信,人與物體可以“對話”。
目前,國內(nèi)雖有一小部分檔案館(室)已經(jīng)開始借助數(shù)據(jù)庫與互聯(lián)網(wǎng)輔助人工進(jìn)行檔案保管,但由于技術(shù)力量薄弱、資金缺乏、保管條件受限、規(guī)章制度不完善等多方面原因,此項(xiàng)工作進(jìn)度緩慢、利用面窄。而大部分國家級、省市級檔案館均未開展物聯(lián)網(wǎng)技術(shù)應(yīng)用于檔案保管這項(xiàng)工作。美國權(quán)威咨詢機(jī)構(gòu)Forrester Research公司預(yù)測:到2020年,世界上物與物互聯(lián)的業(yè)務(wù)相比于人與人通信的業(yè)務(wù)將達(dá)到30:1,因此,物聯(lián)網(wǎng)被稱為下一個萬億級的通信業(yè)務(wù)。物聯(lián)網(wǎng)作為按約定的協(xié)議,把任何物品與互聯(lián)網(wǎng)連接起來,進(jìn)行信息交換和通信,以實(shí)現(xiàn)智能化識別、定位、跟蹤、監(jiān)控和管理的一種網(wǎng)絡(luò)。無疑,在檔案保管這一領(lǐng)域擁有廣闊的應(yīng)用前景。
物聯(lián)網(wǎng)的關(guān)鍵技術(shù)是RFID(Radio Frequency Identification射頻識別)和WSN(wireless sensor network無線傳感器網(wǎng)絡(luò))。利用RFID和WSN技術(shù),在檔案庫房和特藏室等實(shí)體檔案保管部門安裝各種感應(yīng)芯片,并在芯片中存儲設(shè)定信息,包括溫度、濕度、酸堿度等。由處在自然環(huán)境中的芯片自動搜集檔案保管環(huán)境的信息,并傳遞給中心服務(wù)器,可以避免人為干預(yù)環(huán)境參數(shù)測量所產(chǎn)生的誤差,測量過程更為安全,數(shù)據(jù)結(jié)果更加準(zhǔn)確。同時,給每件實(shí)體檔案植入RFID標(biāo)簽,并在標(biāo)簽中存儲該件檔案存放地點(diǎn)、來源、內(nèi)容等要素,這樣檔案保管員通過讀取電子標(biāo)簽輕易即可獲知該實(shí)物檔案的目前存放的位置,確認(rèn)它是否在原位,還是被移動,被調(diào)閱。保管員可以實(shí)時跟蹤每件檔案的入庫、出庫、經(jīng)手和使用情況,檔案的實(shí)時動態(tài)數(shù)據(jù)將被傳到中心服務(wù)器,所有被貼上電子標(biāo)簽的檔案,其每刻“行蹤”都可以通過中心服務(wù)器查詢。物聯(lián)網(wǎng)及其相關(guān)技術(shù)的應(yīng)用給實(shí)物檔案保管帶來了前所未有的機(jī)遇,它賦予了實(shí)物檔案更高的“智能”,物聯(lián)網(wǎng)智能化識別、定位、跟蹤、監(jiān)控和管理的功能不僅最大程度上保障了實(shí)體檔案的安全,更從根本上解決了檔案保管員清點(diǎn)和保管海量檔案的難題。
檔案數(shù)字化工作是一項(xiàng)順應(yīng)潮流、適應(yīng)時代發(fā)展的新工作。它把傳統(tǒng)載體的檔案經(jīng)過檔案整理等前處理工作和檔案數(shù)字化加工工作形成數(shù)字檔案,通過局域網(wǎng)、政務(wù)網(wǎng)、互聯(lián)網(wǎng)進(jìn)行計算機(jī)檢索和電子檔案查閱,為信息化時代的檔案利用提供了新的服務(wù)模式,增強(qiáng)了檔案業(yè)務(wù)部門的服務(wù)水平和工作效率。
筆者供職的中國第二歷史檔案館正在進(jìn)行的館藏檔案數(shù)字化工程主要分為歷史檔案整理和數(shù)字化加工兩個組。歷史檔案整理劃分為:承接登記、檔案入庫、拆分編號、檔案鑒定、托裱修補(bǔ)、填寫卷皮、裝訂還原、質(zhì)量檢查、移交入庫等9個工序;數(shù)字化加工劃分為:掃描、掃描質(zhì)檢、圖像處理、圖像質(zhì)檢、著錄、著錄質(zhì)檢、制作目錄、批量掛接、數(shù)據(jù)檢查驗(yàn)收(總質(zhì)檢)、數(shù)據(jù)備份、成果管理等11個工序。
同時,借助數(shù)字化加工軟件和檔案著錄掛接軟件實(shí)現(xiàn)將紙質(zhì)載體中記錄的傳統(tǒng)檔案信息轉(zhuǎn)化成可以被計算機(jī)識別和處理的數(shù)字信息。
數(shù)字化加工軟件能提供專業(yè)的圖像獲取、處理和管理技術(shù),將檔案的數(shù)字化加工從掃描、圖像處理、圖像質(zhì)檢、統(tǒng)計監(jiān)控等進(jìn)行全程的管理和控制,各種自動化技術(shù)(自動圖像傾斜校正、批量圖像清理)能夠保證圖像標(biāo)準(zhǔn)、規(guī)范、整潔。
檔案著錄掛接軟件符合檔案著錄規(guī)范要求,并且能夠進(jìn)行著錄擴(kuò)展。軟件具有自動生成序號、繼承著錄、檔號自動生成等快速著錄設(shè)置,并能夠進(jìn)行重復(fù)性、一致性、唯一性、必填性等多種校驗(yàn)方式,能夠準(zhǔn)確、快捷的完成檔案條目的錄入,并確保質(zhì)量;掛接功能能夠自動實(shí)現(xiàn)著錄條目和掃描的圖像之間的匹配關(guān)系,并保證100%的正確率。
檔案數(shù)字化與傳統(tǒng)的檔案管理模式相比,具有不可替代的優(yōu)越性:
第一,增強(qiáng)了對歷史檔案原件的保護(hù)。歷史檔案經(jīng)過數(shù)字化之后,查檔過程中可以減少對檔案原件的使用,甚至可以封存原件,對一般的利用者用電子檔案替代原件使用。
第二,提高了查檔的工作效率。數(shù)字化后的檔案被導(dǎo)入中心數(shù)據(jù)庫,與目錄掛接。查檔過程中可通過對數(shù)據(jù)庫檢索實(shí)現(xiàn)利用,與人工翻閱紙質(zhì)檔案相比,大大提高了查詢效率。
檔案整理具體流程
第三,為未來互聯(lián)網(wǎng)上的檔案利用提供數(shù)據(jù)保障。
云計算是分布式處理(Distributed Computing)、并行處理(Parallel Computing)和網(wǎng)格計算(Grid Computing)的發(fā)展,是這些計算機(jī)科學(xué)概念的商業(yè)實(shí)現(xiàn)。從本質(zhì)上講,云計算是指用戶終端通過遠(yuǎn)程連接,獲取存儲、計算、數(shù)據(jù)庫等計算資源,云計算在資源分布上包括“云”和“云終端”。
圖書館行業(yè)對云計算的發(fā)展給予了高度重視,對其技術(shù)進(jìn)行了較多的論述與嘗試,并在部分單位進(jìn)行了試點(diǎn)。與圖書館界相比,由于檔案工作涉及安全性、保密性等諸多問題,檔案界對云計算的應(yīng)用尚處于理論研究層面。國家檔案局提出“大檔案、大服務(wù)、大安全”的觀念,這對檔案利用服務(wù),提出了全新的要求,如何改變原有獨(dú)立且分隔的民國檔案信息資源存儲、利用及服務(wù)模式,如何有效整合民國檔案分布式資源,消除單個民國檔案信息孤島問題,實(shí)現(xiàn)保存在各省、市、縣檔案館的民國檔案信息的資源體系整合共享,將是未來民國檔案管理的重點(diǎn)工作。
構(gòu)建全國民國檔案云服務(wù)平臺,有利于整合全國范圍內(nèi)民國檔案資源,加快民國檔案資源體系、利用體系和檔案安全體系建設(shè),推進(jìn)檔案工作自身的科學(xué)發(fā)展、提高檔案工作的服務(wù)效能。因此,檔案界應(yīng)直面新技術(shù)帶來的挑戰(zhàn),在充分把握、理解各種云計算服務(wù)特性的基礎(chǔ)上,綜合考慮當(dāng)前云計算模式與民國檔案云服務(wù)平臺管理間存在的觀念差異,密切結(jié)合民國檔案云服務(wù)平臺自身的戰(zhàn)略定位與業(yè)務(wù)實(shí)際、創(chuàng)新服務(wù)理念,研究分析在云計算時代檔案數(shù)字化建設(shè)中的全新管理與服務(wù)模式。
數(shù)字化加工流程
目前全國各級檔案館都在緊鑼密鼓地進(jìn)行檔案數(shù)字化工作,這一契機(jī)為民國檔案全文檢索創(chuàng)造了有利條件。中國第二歷史檔案館以全國檔案館資源整合建設(shè)實(shí)踐為基礎(chǔ),結(jié)合云計算基礎(chǔ)設(shè)施即服務(wù)(IaaS),平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)的服務(wù)理念,在國家檔案局“三大戰(zhàn)略、三個體系”的建設(shè)要求指導(dǎo)下,以數(shù)據(jù)整合、統(tǒng)一服務(wù)為基本目標(biāo),研究探索全國范圍內(nèi)民國檔案資源管理和利用建設(shè)思路,明確先進(jìn)可行的數(shù)據(jù)存儲模式、協(xié)同工作模式、應(yīng)用服務(wù)模式、信息共享模式,擬探索建設(shè)全國民國檔案云服務(wù)平臺,為國內(nèi)其他檔案館的云平臺建設(shè)提供一種參考思路與方法。
云服務(wù)平臺主要是由云上的各檔案館管理應(yīng)用程序數(shù)字管理節(jié)點(diǎn)、計算機(jī)專用網(wǎng)絡(luò)及安全防火墻、各檔案館的硬件設(shè)施等構(gòu)成。云服務(wù)平臺上的檔案信息是分布式的,以數(shù)據(jù)流的形式分布存儲在各個數(shù)字檔案管理節(jié)點(diǎn)上。在基于云的檔案管理系統(tǒng)里面,核心的還是數(shù)字檔案信息的組織形式,也是基于云計算下的一個基本的組織模式。其架構(gòu)如下:
參與云的各檔案館將其民國檔案數(shù)據(jù)上傳至云服務(wù)器,用戶通過在云平臺上的檢索即可查找到其所需的分布在全國各地的民國檔案信息。對于全國民國檔案管理來說,基礎(chǔ)設(shè)施、基礎(chǔ)服務(wù)的統(tǒng)一管理可以節(jié)約信息化成本,避免重復(fù)建設(shè),重復(fù)投資,最大限度發(fā)揮國家財政的作用;對于各家檔案館來說,能夠減少對硬件設(shè)備的投入,減少對傳統(tǒng)管理模式的投入,通過對不同設(shè)備、不同地域的數(shù)據(jù)和應(yīng)用的共享為查檔者提供更加便捷、高效、全面的服務(wù);對于用戶來說可以避免為了查詢某個檔案信息跑遍全國所有相關(guān)檔案館逐家查檔的窘境,可以充分享受云平臺上分布式計算帶來的高效,不必再擔(dān)心某一時段客戶端上超負(fù)載帶來的困擾。
美國專門從事信息技術(shù)研究和咨詢的Gartner公司,在2008年發(fā)布的《云計算安全風(fēng)險評估》中總結(jié)了目前云計算技術(shù)存在的7個安全風(fēng)險:特權(quán)用戶訪問風(fēng)險;法規(guī)遵守風(fēng)險;數(shù)據(jù)位置不確定風(fēng)險;共享存儲數(shù)據(jù)風(fēng)險;數(shù)據(jù)恢復(fù)風(fēng)險;調(diào)查支持(數(shù)據(jù)跟蹤功能)風(fēng)險;長期發(fā)展風(fēng)險。
大致可歸結(jié)為三個層面的安全問題:云計算用戶的數(shù)據(jù)安全和應(yīng)用安全;提供云計算服務(wù)的平臺自身的安全和服務(wù)的持續(xù)性;云計算資源的安全?;跈n案信息的敏感性,為確保檔案信息不因偶然的或者惡意的原因遭到破壞、更改、泄露,保證云環(huán)境下檔案服務(wù)平臺能夠持續(xù)、可靠、正常地運(yùn)行,法律法規(guī)的制定、技術(shù)人員的配備、軟硬件的保障、服務(wù)商的選擇都顯得尤為重要。
按照《數(shù)字檔案館建設(shè)指南》中的定義,數(shù)字檔案館是指各級各類檔案館為適應(yīng)信息社會日益增長的對檔案信息資源管理、利用需求,運(yùn)用現(xiàn)代信息技術(shù)對數(shù)字檔案信息進(jìn)行采集、加工、存儲、管理,并通過各種網(wǎng)絡(luò)平臺提供公共檔案信息服務(wù)和共享利用的檔案信息集成管理系統(tǒng)。數(shù)字檔案館作為傳統(tǒng)檔案館利用計算機(jī)軟件、存儲及網(wǎng)絡(luò)技術(shù)形成的全新的展現(xiàn)方式,是當(dāng)今知識經(jīng)濟(jì)時代基礎(chǔ)信息資源不可替代的部分,能夠?yàn)閺V大用戶提供科學(xué)研究、知識普及及智能化服務(wù)的全新途徑。物聯(lián)網(wǎng)、檔案數(shù)字化、云計算作為多種計算技術(shù)和服務(wù)理念的合成,將對數(shù)字檔案館資源建設(shè)與服務(wù)運(yùn)作方式、經(jīng)營成本、創(chuàng)新方式、支持服務(wù)系統(tǒng)等方面產(chǎn)生積極影響,給新時代的數(shù)字檔案館的管理與服務(wù)發(fā)展帶來了巨大的機(jī)遇。
當(dāng)然,信息化技術(shù)的應(yīng)用是一把雙刃劍,它給我們檔案管理帶來便捷、高效的同時,也使更多的檔案信息存儲在計算機(jī)硬件上,暴露在開放的網(wǎng)絡(luò)環(huán)境中,于是計算機(jī)安全、網(wǎng)絡(luò)失泄密又成為我們不得不深入探討的另一個課題。
[1]令計劃出席全國檔案工作座談會:大力推進(jìn)檔案事業(yè)改革創(chuàng)新努力實(shí)現(xiàn)檔案工作科學(xué)發(fā)展,中國檔案,2011(1).
[2]馬建.物聯(lián)網(wǎng)技術(shù)概論.機(jī)械工業(yè)出版社,2011:1-12.
[3]崔海莉,張惠達(dá).云計算環(huán)境下檔案信息管理系統(tǒng)風(fēng)險分析,檔案學(xué)研究,2013(1).
[4]國家檔案局.數(shù)字檔案館建設(shè)指南,2010.