摘 要:從傳統(tǒng)的信息化時(shí)代跨越到大數(shù)據(jù)時(shí)代,人類(lèi)經(jīng)歷的是翻天覆地的巨大變革。在檔案學(xué)領(lǐng)域,為了順應(yīng)時(shí)代發(fā)展的必然需要,大數(shù)據(jù)背景下的檔案也逐漸由數(shù)字化管理轉(zhuǎn)向數(shù)據(jù)化管理。大數(shù)據(jù)背景下的檔案有來(lái)源廣、數(shù)量大、格式雜等特點(diǎn),使得原有的檔案管理模式發(fā)生了轉(zhuǎn)變。本文根據(jù)大數(shù)據(jù)背景下檔案的特點(diǎn),從收集、整理、保存三個(gè)方面對(duì)檔案管理模式的轉(zhuǎn)變進(jìn)行了闡述。
關(guān)鍵詞:大數(shù)據(jù);檔案數(shù)據(jù)化;檔案管理模式
1 大數(shù)據(jù)背景下的檔案由數(shù)字化管理轉(zhuǎn)向數(shù)據(jù)化管理
1.1 從政策方向上來(lái)看,大數(shù)據(jù)背景下的檔案由數(shù)字化管理轉(zhuǎn)向數(shù)據(jù)化管理
大數(shù)據(jù)時(shí)代的來(lái)臨給我們的生活帶來(lái)了方方面面的變化,海量數(shù)據(jù)的產(chǎn)生讓我們面臨著更加紛繁復(fù)雜的外部環(huán)境,而大數(shù)據(jù)技術(shù)的運(yùn)用又在無(wú)形之中解決了很多我們?cè)葻o(wú)法解決的難題。為了順應(yīng)大數(shù)據(jù)時(shí)代發(fā)展的整體趨勢(shì),國(guó)家檔案局在檔案信息化“十三五”發(fā)展研討中提及了檔案數(shù)據(jù)安全、檔案數(shù)據(jù)內(nèi)容、檔案數(shù)據(jù)挖掘、檔案的數(shù)據(jù)建設(shè)與共享、數(shù)字化成果數(shù)據(jù)化等概念 [1]。《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中提出要“采用大數(shù)據(jù)、智慧管理等技術(shù),探索電子檔案與大數(shù)據(jù)行動(dòng)的融合[2]”?!丁笆奈濉比珖?guó)檔案事業(yè)發(fā)展規(guī)劃》中提出要“推動(dòng)檔案全面納入國(guó)家大數(shù)據(jù)戰(zhàn)略”這一大方向,并提到了“數(shù)據(jù)治理” “完善政務(wù)服務(wù)數(shù)據(jù)歸檔機(jī)制”“大力推動(dòng)科學(xué)數(shù)據(jù)與科研檔案協(xié)同管理”等實(shí)施舉措[3]。
1.2 大數(shù)據(jù)時(shí)代,從數(shù)字化管理到數(shù)據(jù)化管理是各項(xiàng)管理工作變化的整體趨勢(shì)
在檔案學(xué)領(lǐng)域,于英香認(rèn)為“檔案數(shù)字化不能代替檔案數(shù)據(jù)化,建設(shè)應(yīng)以著錄標(biāo)引等標(biāo)準(zhǔn)化和規(guī)范化工作為基礎(chǔ),以推動(dòng)檔案數(shù)據(jù)化,進(jìn)而創(chuàng)新檔案服務(wù)模式[4]”。劉永等針對(duì)數(shù)據(jù)時(shí)代檔案管理面臨的數(shù)字化和數(shù)據(jù)化認(rèn)知問(wèn)題和服務(wù)問(wèn)題基于鏈?zhǔn)焦芾砝碚摵头椒ㄌ岢隽藱n案原生數(shù)據(jù)源全鏈?zhǔn)焦芾淼臄?shù)據(jù)化管理思路[5]。錢(qián)毅通過(guò)總結(jié)檔案信息形成的技術(shù)環(huán)境的發(fā)展歷程,提出了檔案對(duì)象管理的概念,闡述了不同技術(shù)環(huán)境所對(duì)應(yīng)的模擬態(tài)、數(shù)字態(tài)、數(shù)據(jù)態(tài)三種形態(tài),深入理解了數(shù)字化到數(shù)據(jù)化轉(zhuǎn)型的趨勢(shì)[6]。從數(shù)字化管理到數(shù)據(jù)化管理,檔案管理的模式也發(fā)生了相應(yīng)的改變。
大數(shù)據(jù)背景下,很多新的名詞應(yīng)運(yùn)而生,例如檔案大數(shù)據(jù)等,而對(duì)于已有的名詞,像檔案數(shù)據(jù),其在大數(shù)據(jù)時(shí)代的內(nèi)涵與外延均發(fā)生了變化。大數(shù)據(jù)時(shí)代的檔案管理,可以借鑒數(shù)據(jù)管理理論,運(yùn)用大數(shù)據(jù)技術(shù),進(jìn)行檔案管理與數(shù)據(jù)管理的融合。我們不僅需要考慮數(shù)據(jù)管理的方式方法,還需立足于檔案學(xué)本身,把握住檔案數(shù)字化到檔案數(shù)據(jù)化的趨勢(shì),對(duì)檔案管理模式的改變進(jìn)行整體性把握。
2 檔案收集模式的轉(zhuǎn)變
2.1 檔案收集對(duì)象的轉(zhuǎn)變
大數(shù)據(jù)背景下的檔案收集對(duì)象由電子文件轉(zhuǎn)向了更細(xì)致的檔案數(shù)據(jù)。檔案數(shù)據(jù)來(lái)源廣泛,檔案數(shù)據(jù)的提供主體涉及國(guó)家級(jí)、省市級(jí)檔案館、檔案數(shù)據(jù)產(chǎn)生的業(yè)務(wù)部門(mén)等不同的機(jī)構(gòu)。涉及主體的增多使得檔案數(shù)據(jù)容量加大,分布廣泛。除此以外,來(lái)源于不同機(jī)構(gòu)、不同平臺(tái)的數(shù)據(jù)格式往往不會(huì)相同,圖片、音頻、視頻等各種未經(jīng)處理、不同形式的數(shù)據(jù)混雜在一起。數(shù)量巨大而又紛繁復(fù)雜的檔案數(shù)據(jù)使得傳統(tǒng)的人工形式的收集方式難以運(yùn)用到檔案數(shù)據(jù)的采集中,因此需要借助大數(shù)據(jù)技術(shù)來(lái)完成收集模式的轉(zhuǎn)變。
2.2 從人工收集到自動(dòng)采集的轉(zhuǎn)變
大數(shù)據(jù)背景下的檔案數(shù)據(jù)收集可以以ETL數(shù)據(jù)倉(cāng)庫(kù)技術(shù)為支撐。ETL(Extract-Transform-Load)是用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過(guò)抽?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過(guò)程,是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)中的第一步,也是最重要的一步。數(shù)據(jù)采集過(guò)程中的ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的不同種類(lèi)和結(jié)構(gòu)的數(shù)據(jù)如文本數(shù)據(jù)、關(guān)系數(shù)據(jù)以及圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù)等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、分類(lèi)、集成,最后加載到對(duì)應(yīng)的數(shù)據(jù)存儲(chǔ)系統(tǒng)如數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)[7]。數(shù)據(jù)抽?。╡xtract)階段,即從不同渠道,抽取出不同格式的傳統(tǒng)檔案數(shù)據(jù)和新型檔案數(shù)據(jù),同時(shí)定義數(shù)據(jù)抽取的方式,對(duì)相關(guān)數(shù)據(jù)進(jìn)行定時(shí)或?qū)崟r(shí)抽取。數(shù)據(jù)轉(zhuǎn)換、清洗(transform)階段,即針對(duì)上一階段抽取到的文本文件、圖片文件、音頻文件、超鏈接等不同格式、不同類(lèi)型的檔案數(shù)據(jù)進(jìn)行合并、聚合、格式轉(zhuǎn)換等,確保轉(zhuǎn)換后的數(shù)據(jù)一致性。然后對(duì)轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行清洗,去除冗余和錯(cuò)誤的數(shù)值,保證數(shù)據(jù)的準(zhǔn)確性。數(shù)據(jù)加載(load)階段,把轉(zhuǎn)換、清洗過(guò)的準(zhǔn)確一致的檔案數(shù)據(jù)放入檔案數(shù)據(jù)倉(cāng)庫(kù)中,完成初步的存儲(chǔ)工作。ETL技術(shù)可以解決檔案數(shù)據(jù)多元異構(gòu)帶來(lái)的收集困境,通過(guò)抽取階段對(duì)來(lái)源廣泛的檔案數(shù)據(jù)進(jìn)行實(shí)時(shí)自動(dòng)收集,并且在轉(zhuǎn)換、清洗階段過(guò)濾掉冗余錯(cuò)誤的數(shù)據(jù),保證了檔案數(shù)據(jù)格式的一致性。目前,ETL技術(shù)發(fā)展較快,針對(duì)傳統(tǒng)ETL橫向擴(kuò)展產(chǎn)生了分布式ETL,加快了數(shù)據(jù)處理的速度,商業(yè)類(lèi)ETL工具和開(kāi)源類(lèi)ETL工具兩大類(lèi)別使得ETL工具的選擇面較關(guān)。因此,運(yùn)用ETL技術(shù)可以較為便捷地實(shí)現(xiàn)檔案數(shù)據(jù)的自動(dòng)采集。
除了ETL數(shù)據(jù)倉(cāng)庫(kù)技術(shù),大數(shù)據(jù)背景下的其他技術(shù)例如智能Agent技術(shù)、網(wǎng)絡(luò)爬蟲(chóng)技術(shù)等也可以輔助檔案數(shù)據(jù)的收集。智能Agent技術(shù)是一種處于一定環(huán)境下包裝的計(jì)算機(jī)系統(tǒng),為實(shí)現(xiàn)設(shè)計(jì)目的,能在該環(huán)境下靈活自主地活動(dòng) [8]。依據(jù)檔案管理員制定的收集規(guī)則,運(yùn)用智能Agent技術(shù)可以自動(dòng)地抓取電子文件并轉(zhuǎn)換成統(tǒng)一的格式。網(wǎng)絡(luò)爬蟲(chóng)是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序, 它為搜索引擎從Web上下載網(wǎng)頁(yè),是搜索引擎的重要組成部分[9],其種類(lèi)多樣。運(yùn)用不同的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)相結(jié)合的方式可以很好地實(shí)現(xiàn)容量大、離散型高的檔案數(shù)據(jù)收集。
3 檔案整理模式的轉(zhuǎn)變
3.1 大數(shù)據(jù)背景下檔案整理理念變化
在檔案整理漫長(zhǎng)的歷史長(zhǎng)河中,一般遵循“歷史聯(lián)系”和“邏輯聯(lián)系”兩大基本聯(lián)系,兩者相互碰撞融合,構(gòu)成了檔案整理理念的主體。歷史聯(lián)系也被稱(chēng)為“有機(jī)聯(lián)系”“內(nèi)在聯(lián)系”,主要包含檔案文件之間的來(lái)源、內(nèi)容、時(shí)間、形式等的聯(lián)系[10]。而“所謂邏輯聯(lián)系用在文件管理中主要指依據(jù)邏輯思維規(guī)律推演形成的文件間的聯(lián)系。用于文件分類(lèi),則指的是按形式邏輯進(jìn)行劃分。并且往往特指對(duì)文件按事由內(nèi)容主題進(jìn)行的分類(lèi)[11]”。紙質(zhì)檔案整理工作更多考慮的是文件間的歷史聯(lián)系,代表著歷史聯(lián)系的來(lái)源原則在與代表著邏輯聯(lián)系的事由原則的碰撞中一直處于壓倒性的地位中。而電子文件的產(chǎn)生,則讓人們不得不重視起文件間的邏輯聯(lián)系,“新來(lái)源觀”的產(chǎn)生就是來(lái)源原則與事由原則的有機(jī)結(jié)合,就是歷史聯(lián)系與邏輯聯(lián)系的兼顧考慮。大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)的載體、格式等維護(hù)著檔案的歷史聯(lián)系,通過(guò)大數(shù)據(jù)思維與技術(shù)挖掘出的檔案數(shù)據(jù)價(jià)值維護(hù)著檔案的邏輯聯(lián)系。檔案數(shù)據(jù)作為檔案,需要考慮檔案間的歷史聯(lián)系;檔案數(shù)據(jù)作為數(shù)據(jù),需要挖掘數(shù)據(jù)間的邏輯聯(lián)系。因此,對(duì)于檔案數(shù)據(jù)的整理還是需要秉持歷史聯(lián)系與邏輯聯(lián)系統(tǒng)一的理念。
3.2 大數(shù)據(jù)背景下檔案整理尺度變化
傳統(tǒng)的檔案整理工作主要包括了全宗內(nèi)檔案的分類(lèi)、立卷、案卷的排列和目錄編制等。立卷改革之后,又提出“卷”改“件”的概念,傳統(tǒng)檔案整理的尺度從“卷”到“件”,逐步細(xì)化。大數(shù)據(jù)時(shí)代,檔案內(nèi)容從檔案載體中抽離出來(lái),檔案數(shù)據(jù)碎片化、非結(jié)構(gòu)化等的特點(diǎn)使得“卷”和“件”難以成為整理的衡量尺度,我們只能以一條條獨(dú)立的檔案數(shù)據(jù)為單位,進(jìn)行數(shù)據(jù)信息的挖掘整理。檔案數(shù)據(jù)整理尺度的縮小使得“卷”“件”等組織形式難以適用,甚至連全宗這一概念也受到了大數(shù)據(jù)的沖擊。全宗的本質(zhì)是維護(hù)檔案間的歷史聯(lián)系,而大數(shù)據(jù)時(shí)代基于數(shù)據(jù)挖掘技術(shù),則對(duì)檔案間的邏輯聯(lián)系提出了更高的要求。全宗的分類(lèi)模式是一種自上而下的單線型分類(lèi)模式,“除個(gè)別情況外,同一全宗的檔案不能分散,不同全宗的檔案不能混雜[12]”,這一特性使得其對(duì)于大數(shù)據(jù)背景下的多元對(duì)應(yīng)關(guān)系難以適應(yīng)。大數(shù)據(jù)時(shí)代大量的數(shù)據(jù)呈現(xiàn)出半結(jié)構(gòu)化、非結(jié)構(gòu)化的特點(diǎn),檔案數(shù)據(jù)在整理時(shí)對(duì)組織形式的要求越來(lái)越低,全宗這一嚴(yán)謹(jǐn)系統(tǒng)的文件組織形式反而不利于數(shù)據(jù)關(guān)系的挖掘。因此,大數(shù)據(jù)背景下的檔案整理需要重新確立檔案整理理念,改變檔案組織形式,構(gòu)建新的檔案整理模式。新的檔案整理模式是歷史聯(lián)系與邏輯聯(lián)系的兼顧,也是檔案管理與數(shù)據(jù)管理的接洽。
4 檔案保存模式的轉(zhuǎn)變
大數(shù)據(jù)背景下,時(shí)間跨度大、來(lái)源廣泛的海量檔案數(shù)據(jù)對(duì)傳統(tǒng)的檔案保存方式發(fā)起了挑戰(zhàn)。首先,檔案數(shù)據(jù)的容量大,龐大的體積對(duì)存儲(chǔ)空間提出了要求??紤]到載體損壞、技術(shù)過(guò)時(shí)等問(wèn)題,我們需要對(duì)檔案載體、存儲(chǔ)介質(zhì)等進(jìn)行重新選擇。同時(shí),檔案數(shù)據(jù)不斷積累,對(duì)有些需要長(zhǎng)期保存的檔案數(shù)據(jù)如何實(shí)現(xiàn)數(shù)據(jù)的原位更新、保證數(shù)據(jù)的長(zhǎng)期有效性也是需要攻克的技術(shù)難題。其次,檔案數(shù)據(jù)具有多元異構(gòu)的特點(diǎn)。來(lái)自不同部門(mén)、不同渠道、不同平臺(tái)的數(shù)據(jù)結(jié)構(gòu)復(fù)雜,數(shù)據(jù)格式不一樣,處理方式不同,可能存在不兼容的情況。大量非結(jié)構(gòu)化、分布式的檔案數(shù)據(jù)同樣對(duì)存儲(chǔ)空間有很大的要求,同時(shí)如何將這些雜亂無(wú)章的數(shù)據(jù)進(jìn)行統(tǒng)一的存儲(chǔ)管理也需要相關(guān)技術(shù)的支持。最后,檔案數(shù)據(jù)存儲(chǔ)的安全性問(wèn)題也需要考慮。面對(duì)海量的檔案數(shù)據(jù),在存儲(chǔ)時(shí)可能存在系統(tǒng)崩潰,數(shù)據(jù)丟失等問(wèn)題。如何保障檔案數(shù)據(jù)的安全存儲(chǔ),在數(shù)據(jù)丟失之后是否有辦法恢復(fù)等,這些問(wèn)題都對(duì)技術(shù)的應(yīng)用和改進(jìn)提出了要求。
4.1 從本地存儲(chǔ)到云存儲(chǔ)
檔案數(shù)據(jù)來(lái)源廣泛、數(shù)量龐大,依照原有的U盤(pán)、光盤(pán)、硬盤(pán)等介質(zhì)進(jìn)行存儲(chǔ)的方式無(wú)法進(jìn)行海量存儲(chǔ),對(duì)不同格式的檔案數(shù)據(jù)也難以實(shí)現(xiàn)統(tǒng)一的存儲(chǔ)。同時(shí),面對(duì)海量的檔案數(shù)據(jù),空間和基礎(chǔ)設(shè)備的限制也使得本地存儲(chǔ)變得非常困難。因此大數(shù)據(jù)背景下的檔案數(shù)據(jù)存儲(chǔ)應(yīng)該由本地存儲(chǔ)向著云存儲(chǔ)轉(zhuǎn)變。云存儲(chǔ)可以通過(guò)無(wú)限地?cái)U(kuò)容,解決存儲(chǔ)空間不足的問(wèn)題。在云存儲(chǔ)環(huán)境下,如果存儲(chǔ)容量不足,服務(wù)商可以通過(guò)購(gòu)買(mǎi)新服務(wù)器的方式實(shí)現(xiàn)容量的擴(kuò)充。同時(shí),基于虛擬化技術(shù),用戶本人也可以對(duì)存儲(chǔ)空間進(jìn)行自主調(diào)整。云存儲(chǔ)技術(shù)通過(guò)虛擬化技術(shù)可以實(shí)現(xiàn)存儲(chǔ)空間的隨意擴(kuò)充,其成本控制在初期投入上而不需要進(jìn)行持續(xù)性的投入,節(jié)約存儲(chǔ)成本。除此以外,云存儲(chǔ)不具有對(duì)基礎(chǔ)設(shè)備的依賴性,云存儲(chǔ)通過(guò)大量的、對(duì)等的分布式節(jié)點(diǎn)來(lái)滿足海量數(shù)據(jù)的存儲(chǔ)需求,如果一個(gè)節(jié)點(diǎn)出現(xiàn)故障也不會(huì)影響整個(gè)系統(tǒng)的使用,當(dāng)故障節(jié)點(diǎn)恢復(fù)后,又可以繼續(xù)擴(kuò)展成新的節(jié)點(diǎn)使用。因此,云存儲(chǔ)的引入可以解決本地存儲(chǔ)空間不足、需要耗費(fèi)大量的人力物力維護(hù)存儲(chǔ)設(shè)備等問(wèn)題。
4.2 從可信數(shù)字倉(cāng)儲(chǔ)建設(shè)到可信區(qū)塊鏈建設(shè)
電子文件的產(chǎn)生使得原有的紙質(zhì)文件保存方式不能滿足數(shù)字時(shí)代的需求,海量的檔案信息促成了數(shù)字倉(cāng)儲(chǔ)的出現(xiàn)?!皵?shù)字倉(cāng)儲(chǔ)是在網(wǎng)絡(luò)環(huán)境下提供對(duì)數(shù)字對(duì)象保存、訪問(wèn)和管理的系統(tǒng)[13]”,它可以存放大量的數(shù)字檔案資源。而檔案的真實(shí)可信性一直是檔案保存中一個(gè)重要的議題,只有將數(shù)字倉(cāng)儲(chǔ)轉(zhuǎn)換為可信數(shù)字倉(cāng)儲(chǔ),才能保證數(shù)字檔案資源存儲(chǔ)的安全性。數(shù)字倉(cāng)儲(chǔ)需要通過(guò)認(rèn)證的方式來(lái)贏得信任,“既要贏得數(shù)字資源提供方的信任,以便贏得存放數(shù)字資源的機(jī)會(huì);又要贏得使用者對(duì)倉(cāng)儲(chǔ)的信任,從而讓倉(cāng)儲(chǔ)內(nèi)保存的數(shù)字資源被認(rèn)可[14]”。這就對(duì)相關(guān)認(rèn)證標(biāo)準(zhǔn)的建立和第三方認(rèn)證機(jī)構(gòu)的選擇有很高的要求。而大數(shù)據(jù)背景下,借助區(qū)塊鏈技術(shù),可以在檔案數(shù)據(jù)的真實(shí)可信性維護(hù)方面實(shí)現(xiàn)新的突破。區(qū)塊鏈?zhǔn)恰袄脡K鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)來(lái)驗(yàn)證與存儲(chǔ)數(shù)據(jù)、利用分布式節(jié)點(diǎn)共識(shí)算法來(lái)生成和更新數(shù)據(jù)、利用密碼學(xué)的方式保證數(shù)據(jù)傳輸和訪問(wèn)的安全、利用由自動(dòng)化腳木代碼組成的智能合約來(lái)編程和操作數(shù)據(jù)的一種全新的分布式基礎(chǔ)架構(gòu)與計(jì)算范式[15]”。區(qū)塊鏈具有去中心化的特點(diǎn),區(qū)塊鏈中的各個(gè)節(jié)點(diǎn)都是對(duì)等的,任何數(shù)據(jù)的修改、存儲(chǔ)都需要經(jīng)過(guò)其他節(jié)點(diǎn)的認(rèn)證,整個(gè)系統(tǒng)中不存在中心處理節(jié)點(diǎn),任何一個(gè)節(jié)點(diǎn)的損壞也不影響整個(gè)系統(tǒng)的運(yùn)行。這一特點(diǎn)實(shí)現(xiàn)了信任機(jī)制的突破,使得檔案數(shù)據(jù)的真實(shí)可信性驗(yàn)證不再需要依靠第三方機(jī)構(gòu)認(rèn)證的方式,而可以直接由區(qū)塊鏈技術(shù)來(lái)實(shí)現(xiàn)。目前將區(qū)塊鏈運(yùn)用于檔案數(shù)據(jù)真實(shí)可信性維護(hù)方面已有部分實(shí)例。例如,英國(guó)的ARCHANGEL項(xiàng)目通過(guò)構(gòu)建對(duì)等網(wǎng)絡(luò),建立共識(shí)機(jī)制,應(yīng)用非對(duì)稱(chēng)加密,來(lái)創(chuàng)建一個(gè)用于保障公共檔案館數(shù)字文件完整性的分布式架構(gòu)[16];中國(guó)石化通過(guò)檔案系統(tǒng)與區(qū)塊鏈平臺(tái)的集成來(lái)實(shí)現(xiàn)電子檔案的真實(shí)性驗(yàn)證[17]。
大數(shù)據(jù)背景下檔案數(shù)據(jù)容量大、格式雜等特點(diǎn)使得原有的存儲(chǔ)方式難以滿足檔案數(shù)據(jù)的存儲(chǔ)。因此,在大數(shù)據(jù)技術(shù)的支持下,檔案保存模式要從本地存儲(chǔ)向著云存儲(chǔ)轉(zhuǎn)變,從可信數(shù)字倉(cāng)儲(chǔ)建設(shè)向著可信區(qū)塊鏈建設(shè)轉(zhuǎn)變。
參考文獻(xiàn)
[1]胡小明.從政府信息公開(kāi)到政府?dāng)?shù)據(jù)開(kāi)放[J].電子政務(wù),2015(1):67-72.
[2]國(guó)家檔案局.國(guó)家檔案局印發(fā)《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》[EB/OL].(2016-04-07)[2019-12-20].http://www.saac.gov.cn/daj/xxgk/201604/4596bddd364641129d7c878a80d0f800.shtml.
[3]國(guó)家檔案局.中辦國(guó)辦印發(fā)《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].(2021-06-09)[2023-1-30].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.
[4]于英香.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學(xué)通訊,2015(02):4-8.
[5]劉永,龐宇飛.檔案數(shù)據(jù)化之原生數(shù)據(jù)源全鏈?zhǔn)焦芾矸治鯷J].檔案管理,2018(05):11-18.
[6]錢(qián)毅.技術(shù)變遷環(huán)境下檔案對(duì)象管理空間演化初探[J].檔案學(xué)通訊,2018(02):10-14.
[7]趙勇,林輝,沈寓實(shí).大數(shù)據(jù)革命——理論、模式與技術(shù)創(chuàng)新[M].北京:電子工業(yè)出版社,2014:92
[8]劉珂.人工智能在檔案管理中的應(yīng)用探析[J].蘭臺(tái)世界,2019(02):19-23+12.
[9]劉金紅,陸余良.主題網(wǎng)絡(luò)爬蟲(chóng)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2007(10):26-29+47.
[10]唐霜.信息化環(huán)境下檔案整理理論研究[D].南昌:南昌大學(xué),2015:31.
[11]崔杰,王福亮.新技術(shù)下檔案整理歷史原則的發(fā)展[J].浙江檔案,2008(5).
[12]陳兆,和寶榮,王英瑋.檔案管理學(xué)基礎(chǔ)[M].北京:中國(guó)人民大學(xué)出版社,2005:100.
[13]董秋生,黃文.數(shù)字倉(cāng)儲(chǔ)及其應(yīng)用[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2008(03):60-63.
[14]楊璐.可信數(shù)字倉(cāng)儲(chǔ)認(rèn)證:必要性、標(biāo)準(zhǔn)與主體[J].北京檔案,2014(05):19-22.
[15]劉越男.區(qū)塊鏈技術(shù)在文件檔案管理中的應(yīng)用初探[J].浙江檔案,2018(05):7-11.
[16]楊茜茜.基于區(qū)塊鏈技術(shù)的電子檔案信任管理模式探析:英國(guó)ARCHANGEL項(xiàng)目的啟示[J].檔案學(xué)研究,2019(3):135-140.
[17]檔案那些事兒.中國(guó)石化如何基于區(qū)塊鏈技術(shù)實(shí)現(xiàn)電子檔案的真實(shí)性驗(yàn)證[EB/OL].(2019-07-22)[2020-3-20].https://www.sohu.com/a/328429168_734807.
作者簡(jiǎn)介:顧睿涵,上海市疾病預(yù)防控制中心助理館員。