文/郭慧霞
區(qū)塊鏈作為新興的信息技術(shù)之一,在檔案管理中的應(yīng)用不僅是新時代發(fā)展檔案事業(yè)的需要,也是滿足社會和公眾日益多元的檔案利用的需求,是實現(xiàn)檔案管理信息化、高質(zhì)量發(fā)展的大勢所趨,以其去中心化、開放性、自治性、不可篡改性的特點給檔案管理帶來新思路。目前,區(qū)塊鏈應(yīng)用于檔案管理尚處于起步階段,還面臨著應(yīng)用成本高、信息安全等問題。對此,分別從檔案收集與歸檔、流轉(zhuǎn)與管理、利用與服務(wù)三大階段提出區(qū)塊鏈在檔案管理中的應(yīng)用路徑,為實現(xiàn)區(qū)塊鏈技術(shù)與檔案管理的深度融合與發(fā)展提供參考
近年來,全國檔案信息化建設(shè)不斷推進(jìn),檔案管理與利用的方式呈現(xiàn)出明顯的數(shù)字化、網(wǎng)絡(luò)化和自動化趨勢。在理想情況下,區(qū)塊鏈技術(shù)以其去中心化、開放性、自治性、不可篡改性和匿名性的特點給檔案管理帶來新思路,它能夠集成大量的電子檔案,大大提高檔案管理的效率,同時也提供了便捷、安全和快速的訪問服務(wù),有利于檔案資源的共享與利用。2016年,美國、英國、日本等發(fā)達(dá)國家相繼將區(qū)塊鏈技術(shù)上升至國家戰(zhàn)略層面,成立了區(qū)塊鏈發(fā)展聯(lián)盟?!丁笆奈濉眹倚畔⒒?guī)劃》中講到,我國目前已經(jīng)成為區(qū)塊鏈、人工智能等領(lǐng)域?qū)@暾埩咳虻谝?,這也有利于其在檔案領(lǐng)域中的廣泛應(yīng)用[1]?;诖耍瑱n案工作者應(yīng)積極探索檔案管理中區(qū)塊鏈應(yīng)用的領(lǐng)域和技術(shù)特征,探尋其應(yīng)用的方法措施,以更好地推動檔案管理高質(zhì)量發(fā)展。
目前,區(qū)塊鏈在世界范圍內(nèi)的應(yīng)用已步入3.0時代,即區(qū)塊鏈已經(jīng)由數(shù)字貨幣加密技術(shù)推廣到對互聯(lián)網(wǎng)中數(shù)據(jù)價值的識別、認(rèn)定、分配和存儲,這也使得“數(shù)據(jù)”背后所代表的資產(chǎn)能夠在區(qū)塊鏈內(nèi)被交易或者控制。[2]
狹義上講,區(qū)塊鏈的本質(zhì)是一種特殊的數(shù)據(jù)結(jié)構(gòu),其核心特征在于去中心化、開放性、不可篡改性、自治性。
第一,區(qū)塊鏈的核心——分布式算法和存儲不依賴于中心化的硬件或管理機(jī)構(gòu),在區(qū)塊鏈中的所有節(jié)點的權(quán)限和義務(wù)都是對等的,同時每個結(jié)果也能夠參與到數(shù)據(jù)的記錄和維護(hù),這就區(qū)別于傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)中對“中心”的依賴,從而實現(xiàn)點對點的數(shù)據(jù)傳輸和實時的數(shù)據(jù)記錄,其效率更高、速度更快。同時,傳統(tǒng)硬件體系和數(shù)據(jù)結(jié)構(gòu)中如果“中心”的網(wǎng)絡(luò)或硬件遭受攻擊(無論是鏈路層或是物理層),都將直接影響整個系統(tǒng)的正常運轉(zhuǎn),特別是對于檔案管理來說,一旦遭受到攻擊,那么所有檔案數(shù)據(jù)都面臨著損壞或者丟失的風(fēng)險,這種系統(tǒng)性癱瘓所帶來的損失是不可估量的。而借助區(qū)塊鏈的分布式算法,單一節(jié)點的失效并不會影響到其他節(jié)點,這就在提升工作效率的同時保障了檔案安全。
第二,區(qū)塊鏈擁有較傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)更加開放的工作環(huán)境。在區(qū)塊鏈最初應(yīng)用的領(lǐng)域數(shù)字加密貨幣中,區(qū)塊鏈的核心技術(shù)之一就是公開且透明的交易信息。一般情況下,在區(qū)塊鏈內(nèi)產(chǎn)生、流轉(zhuǎn)和存儲的信息是對所有節(jié)點用戶開放的,其高度的透明化也使得區(qū)塊內(nèi)的所有人都能夠查看數(shù)據(jù)的所有相關(guān)信息同時使用其應(yīng)用。因此,區(qū)塊鏈技術(shù)在信息共享與數(shù)據(jù)交換領(lǐng)域具有天然優(yōu)勢。
第三,去中心化和開放性會帶來新的信息安全問題。而區(qū)塊鏈的非對稱加密、工作量識別等技術(shù)則可以較好地解決該風(fēng)險。相較于傳統(tǒng)數(shù)據(jù)存儲模式,區(qū)塊鏈的數(shù)據(jù)通常都是永久保存的,其增減刪改等操作不能只通過某一節(jié)點進(jìn)行,而是需要超過50%節(jié)點的共同授權(quán)才能完成,因此區(qū)塊鏈具有極佳的穩(wěn)定性和容錯率。
第四,區(qū)塊鏈的自治性實際上是智能合約技術(shù)的體現(xiàn)。區(qū)塊鏈3.0的技術(shù)優(yōu)勢還體現(xiàn)在“智能合約”。智能合約的優(yōu)勢在于能夠在節(jié)點通過統(tǒng)一的規(guī)范或者協(xié)議,對信息的產(chǎn)生、存儲和交易行為進(jìn)行約束,從而創(chuàng)造出一個公信力強(qiáng)的系統(tǒng)環(huán)節(jié),讓所有參與節(jié)點都能夠自由地在其中交換和共享數(shù)據(jù),這有利于區(qū)塊鏈技術(shù)應(yīng)用于更廣闊的領(lǐng)域。[3]
目前,隨著數(shù)字檔案建設(shè)的持續(xù)推進(jìn),檔案管理部門也面臨著巨大的存儲壓力,特別是對于高分辨率的圖片和視頻,中心化的存儲方式匯集了所有檔案資源,導(dǎo)致存儲成本居高不下。借助區(qū)塊鏈的分布式賬本,檔案管理部門能夠構(gòu)建起多主體參與、信息對稱的檔案治理格局,檔案的產(chǎn)生者同時也成為檔案的記錄者,不僅有利于檔案的直接利用,同時也能夠有效提高信息查詢與檢索效率。如麻省理工學(xué)院Azaria等開發(fā)了一個名為MedRec的系統(tǒng),解決數(shù)據(jù)的互操作性和權(quán)限管理問題,用于管理醫(yī)療檔案,其中應(yīng)用到的主要技術(shù)就是分布式賬本和智能合約。
新技術(shù)的應(yīng)用使得電子檔案的內(nèi)容生產(chǎn)與管理環(huán)境、歸檔材料的完整性(包括元數(shù)據(jù)在內(nèi))以及知識產(chǎn)權(quán)面臨的安全威脅更加多樣。而區(qū)塊鏈具有的時間戳和非對稱加密技術(shù)則能夠有效提升檔案的安全性。其中,時間戳能夠完整記錄檔案的任何操作,包括移動、刪減和查詢,正如上文所說,區(qū)塊鏈?zhǔn)且粋€開放且透明的系統(tǒng),運用時間戳后我們得以看到檔案流轉(zhuǎn)的全部明細(xì),能夠有效防止檔案歸檔與管理過程中因人工失誤所導(dǎo)致的信息安全風(fēng)險。非對稱加密能夠有效提高用戶端的信息安全水平,它需要兩個密鑰來進(jìn)行加密和解密,無需同步密鑰且算法強(qiáng)度復(fù)雜,大大提高檔案服務(wù)與利用過程中的安全性。
去中心化的存儲模式,檔案收集與管理、檔案管理與利用需要多主體、多部門的共同參與,這也給檔案部門的管理能力提出更高要求。傳統(tǒng)管理模式下,對工作量的監(jiān)控是十分低效的,同時也難以實現(xiàn)實時對檔案規(guī)范和標(biāo)準(zhǔn)進(jìn)行監(jiān)管。借助共識機(jī)制,我們可以完成各個節(jié)點之間的互信,實現(xiàn)數(shù)據(jù)等方面的交互,節(jié)點可以基于某種信任達(dá)成協(xié)作,更好地開展檔案管理。
在檔案收集與歸檔階段,區(qū)塊鏈的主要作用是借助智能合約和非對稱加密技術(shù)捕獲真實且完整的檔案數(shù)據(jù)。首先,根據(jù)鏈內(nèi)形成的統(tǒng)一智能合約和檔案數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范盡可能多地收集元數(shù)據(jù)信息,并進(jìn)行自動化的初步鑒定,排除重復(fù)和無價值的檔案內(nèi)容;其次,對于有價值的信息,由相應(yīng)部門應(yīng)用非對稱加密技術(shù)獲得公鑰并進(jìn)行加密,并提出存儲需求;最后,將整合好的檔案數(shù)據(jù)借助共識機(jī)制保存到區(qū)塊中,這便是一次完整的數(shù)據(jù)采集流程。采集時,要確保所有的檔案數(shù)據(jù)都通過區(qū)塊鏈完成,以實現(xiàn)每個節(jié)點都能夠完整的記錄和查閱采集過程。在這一階段,檔案管理部門應(yīng)參考檔案管理與利用需求多元化的趨勢,充分整合原生電子檔案和傳統(tǒng)檔案的數(shù)字化產(chǎn)品。檔案管理部門應(yīng)事先編制好檔案的收集范圍與標(biāo)準(zhǔn),考慮到區(qū)塊鏈的技術(shù)特征,在多節(jié)點共同參與記錄時提供同一模板和標(biāo)準(zhǔn),強(qiáng)調(diào)數(shù)據(jù)的標(biāo)準(zhǔn)化、規(guī)范化。此外,還要進(jìn)一步探索區(qū)塊鏈的應(yīng)用前景,不斷探索其與檔案管理領(lǐng)域的契合點,遵循差異化、層次化的原則,同時也要考慮到信息技術(shù)更新迭代可能帶來的新的問題,采用量化評價的方式對區(qū)塊鏈的應(yīng)用及成效進(jìn)行預(yù)測,為后續(xù)新技術(shù)的部署和應(yīng)用提供參考。
檔案流轉(zhuǎn)與管理階段的關(guān)鍵在于保障檔案的安全性,這一階段涉及到的主要技術(shù)是數(shù)字簽名和加密算法。檔案管理部分一方面要做好檔案基礎(chǔ)信息安全保障,主要針對區(qū)塊鏈環(huán)境下線上操作系統(tǒng)中的檔案編輯工作站、元數(shù)據(jù)數(shù)據(jù)庫、密鑰數(shù)據(jù)庫、規(guī)則數(shù)據(jù)庫和高分辨率電子檔案存儲等核心環(huán)節(jié)進(jìn)行防護(hù),其工作重點包括兩個方面:一是防止數(shù)據(jù)的丟失和損毀,針對此類問題主要采用數(shù)據(jù)備份技術(shù)。對電子檔案的數(shù)據(jù)備份應(yīng)采用異地備份方式,當(dāng)下較為主流的是采用云存儲,確保數(shù)據(jù)的永久保存;二是防止數(shù)據(jù)被竊取。在上述的風(fēng)險識別與應(yīng)對中,除一般的檔案編輯工作站其余所有數(shù)據(jù)庫中的數(shù)據(jù)都處于加密狀態(tài)。因此對電子檔案編輯工作應(yīng)采用全面的數(shù)據(jù)標(biāo)記,確保數(shù)據(jù)在可控范圍內(nèi)。與此同時,檔案管理部門還應(yīng)進(jìn)一步完善權(quán)限機(jī)制,根據(jù)檔案價值的大小、利用需求和使用場所將訪問用戶分為系統(tǒng)管理員、檔案管理員、一般用戶和禁止訪問等幾類,并根據(jù)用戶的調(diào)用、查閱、流轉(zhuǎn)等操作進(jìn)行權(quán)限匹配。除此之外,檔案數(shù)據(jù)的流轉(zhuǎn)還應(yīng)推動各類數(shù)據(jù)與管理平臺的共享共建,進(jìn)一步完善檔案資源易地備份模式,對相關(guān)存儲標(biāo)準(zhǔn)進(jìn)行新華,共同構(gòu)建區(qū)塊鏈應(yīng)用的長效機(jī)制。
檔案利用與服務(wù)階段應(yīng)基于區(qū)塊鏈的技術(shù)特征創(chuàng)新檔案利用服務(wù)方式。第一,可借助區(qū)塊鏈的多節(jié)點 工作模式實現(xiàn)節(jié)點間的配合與數(shù)據(jù)挖掘。在多鏈配合的基礎(chǔ)上,應(yīng)用智能合約和工作量識別機(jī)制,整合全渠道的信息資源,構(gòu)建面向區(qū)塊鏈的檔案信息資源平臺。平臺中除了集成檔案資源外,還應(yīng)提供檔案的過程信息,如版本號、時間、操作管理員等,借助共識機(jī)制實現(xiàn)集中管理、集中開發(fā),形成完備的數(shù)據(jù)庫,集成檢索服務(wù),構(gòu)建一站式的服務(wù)平臺。第二,借助區(qū)塊鏈去中心化的特點構(gòu)建個性化的檔案服務(wù)方式。具體而言,提供模塊化的服務(wù)功能,用戶可根據(jù)個人需求在區(qū)塊鏈上的各個服務(wù)節(jié)點查詢和獲取信息,這就改變了傳統(tǒng)檔案的中心服務(wù)模式,用戶與檔案資源直接的距離進(jìn)一步縮短,點對點的利用方式也有助于提高檔案利用率,化解傳統(tǒng)模式下的信息孤單難題,構(gòu)建出多主體參與的協(xié)同服務(wù)模式。