文·劉虎 張學干 李文姣
區(qū)塊鏈技術是分布式的網絡數據管理技術,利用密碼學技術和分布式共識協議保證網絡傳輸與訪問安全,實現數據多方維護、交叉驗證、全網一致、不易篡改。區(qū)塊鏈技術開創(chuàng)了一種在不可信的競爭環(huán)境中低成本建立信任的新型計算模式和協作模式,具有防篡改、可追溯、去中心化等特性,能夠解決在沒有第三方中介情況下的多方信任問題。目前,全社會都開始加深對區(qū)塊鏈技術的研究,該技術已廣泛用于金融、供應鏈、政務服務等領域。本文將從區(qū)塊鏈技術出發(fā),探討如何在檔案工作應用區(qū)塊鏈技術。
自從2008年中本聰發(fā)布《比特幣:一種點對點式的電子現金系統》以來,區(qū)塊鏈經歷了從1.0、2.0向3.0發(fā)展的階段。區(qū)塊鏈1.0階段,主要探索的是區(qū)塊鏈本身的技術應用,研究的重點是其作為安全貨幣和分布式賬本的作用,其代表是比特幣;到了2.0階段,區(qū)塊鏈的發(fā)展趨勢與重點變?yōu)槿绾胃玫嘏c日常生活相結合,實實在在地解決一些日常生活中的需求,其中包括我們熟悉的物流網絡、物聯網、萬物互聯等這些相互關聯、形成一個綜合網絡的互聯互通技術,其代表是以太坊;而到了3.0階段,區(qū)塊鏈將與大數據、人工智能技術融合,實現新的模式創(chuàng)新。區(qū)塊鏈3.0與區(qū)塊鏈1.0、2.0最重要的一個區(qū)別,就是這種技術的使用方式與領域,而非其底層技術的變化,主要表現在通過區(qū)塊鏈技術實現個人全部信息的綜合傳遞和安全存儲,如果實現了這一點,將會給整個社會帶來巨大的變化。
根據不同的應用場景和用戶需求,區(qū)塊鏈可以分為公有鏈、聯盟鏈和私有鏈三類。其中,公有鏈是對所有人開放,任何人都可以參與區(qū)塊鏈數據的維護和讀取,數據完全公開透明,其典型案例就是比特幣、以太坊系統等;聯盟鏈通常在多個已知身份的組織之間構建,如銀行之間的支付結算、政府部門間的數據共享,多個企業(yè)之間的供應鏈管理等;私有鏈僅僅在組織內部使用,只對單獨的個體或實體開放,適用于政府、企業(yè)部門內部的管理。這三類區(qū)塊鏈特性對比如下表所示:
?
通過上表可以看出,在現有檔案管理背景和技術條件下,公有鏈不適合應用于電子檔案管理工作,主要是在公有鏈中任何人都可以參與到區(qū)塊鏈中,在鏈上傳輸和存儲的數據都是公開的,由于很多檔案具有保密性、隱私性,將檔案上鏈,不符合檔案的安全保密需求。私有鏈或聯盟鏈安全性、效率比公有鏈高,有相應的權限管理體系,尤其是聯盟鏈能夠將不同的區(qū)塊鏈連接起來,可以應用在明確的機構之間,更契合檔案管理實際情況。
區(qū)塊鏈是一種數據的記錄格式,就像Excel表格一樣,是按照一定的格式數據存儲在計算機中。但與傳統方式不同,區(qū)塊鏈是將數據按照一定的時間間隔,分成一個個的數據塊記錄,然后再根據數據塊的先后關系串聯起來,就組成了區(qū)塊鏈。其基本的技術組合主要包含以下五個方面,如圖所示:
就是區(qū)塊鏈數據,邏輯機構是“區(qū)塊+鏈”。所謂的區(qū)塊就是指數據塊,數據塊之間通過某個標志連接起來,從而形成一條鏈。
如圖所示,每個區(qū)塊分為區(qū)塊頭和區(qū)塊體。區(qū)塊和區(qū)塊之間通過區(qū)塊頭哈希值(區(qū)塊頭哈希值就是一個區(qū)塊的身份證號)串聯起來,形成了區(qū)塊鏈。這種鏈條格式最大的特點就是一環(huán)扣一環(huán),后面區(qū)塊中包含前面所有區(qū)塊數據的特征值,從而保證了數據很難被破壞。
由于區(qū)塊鏈是去中心化的設計,系統中每個節(jié)點都可以保存全部的數據,因此,一個節(jié)點產生的數據或者更改的數據都要發(fā)送到網絡中的其他節(jié)點接受驗證,而其他節(jié)點是不會驗證通過一個被篡改的數據。因此,這種特殊的鏈式結構+去中心化的存儲方式構成了區(qū)塊鏈數據不可篡改的一個重要的技術設計。
所謂共識,就是指大家都達成一致的意思。由于區(qū)塊鏈是一個去中心化的結構,在這個結構中沒有哪個節(jié)點是“老大”,一切都要商量著來,而這個商量出來的解決方案就是制定共識算法。
共識算法其實就是一個規(guī)則,每個節(jié)點都按照這個規(guī)則去確認各自的數據。常用的共識算法主要有PoW(Proof of Work,工作量證明)、PoS(Proof of Stake,權益證明)、DPoS(Delegate Proof of Stake,委托權益人證明)、PBFT(Practical Byzantine Fault Tolerance,實用拜占庭容錯算法)等。傳統的比特幣、以太坊幣等采用的PoW共識算法,需要通過“挖礦”達成共識,造成極大的能源消耗,一直以來廣受詬病。聯盟鏈中的各個節(jié)點都是經過審批加入的,有嚴格的身份認證和權限管理,處于可信的執(zhí)行環(huán)境中,可以很大程度上消除惡意節(jié)點的不規(guī)范或惡意操作。所以,在檔案區(qū)塊鏈中,可以采用DPoS共識算法,不需通過“挖礦”這類耗費資源的辦法就能快速達成共識,并將事務按順序打包進入區(qū)塊鏈,保證系統中各節(jié)點賬本的一致性。
3)小麥生長中后期強降雨伴隨大風天氣往往造成倒伏[8]。 2017年 4月 8~9日,襄陽市襄州區(qū)降雨量達到45 mm以上,并伴有大風,最大風力達到12.8 m/s。強降雨伴隨大風天氣是造成此次小麥嚴重倒伏的主要外部因素。
密碼算法是區(qū)塊鏈數據不可篡改的一個重要保證,在區(qū)塊鏈系統中應用很多。這里主要介紹兩個關鍵應用。
第一個是區(qū)塊之間的連接。在區(qū)塊鏈中,是一種叫作哈希值的數據來進行的連接。所謂哈希值,就是通過密碼算法中的哈希算法對區(qū)塊鏈中的事務數據計算得出的一段摘要字符串。而這個摘要字符串與原始數據是唯一對應的,原始數據出現任何微小的變動,計算出來的哈希值都會發(fā)生完全的變化。區(qū)塊鏈賬本對每個區(qū)塊都會計算出一個哈希值,稱為區(qū)塊哈希,通過區(qū)塊哈希來串聯區(qū)塊。這種結構的優(yōu)點是,任何一個區(qū)塊發(fā)生變動,它的區(qū)塊哈希就變了,也就指不到后面正確的區(qū)塊了。
第二個是梅克爾樹結構。在區(qū)塊鏈中,除了整個區(qū)塊會被計算哈希值外,區(qū)塊中包含的每一筆事務數據也會被計算出一個哈希值,稱為“事務哈希”。將區(qū)塊中所有事務哈希進行加工處理,最終會得出一棵哈希樹的數據結構。哈希樹的頂部稱為“梅克爾根”。只要區(qū)塊中的事務有任何改變,梅克爾根就會發(fā)生變化,利用這一點,可以確保區(qū)塊數據的完整性。
腳本系統決定了區(qū)塊鏈系統之所以能形成一個有價值的網絡。所謂腳本,就是指一組程序規(guī)則。在區(qū)塊鏈系統中,有些系統中的程序規(guī)則是固定的,比如在比特幣系統中;而有些系統是允許用戶通過編寫腳本擴展區(qū)塊鏈系統的功能的,比如以太坊就是智能合約功能。在區(qū)塊鏈3.0階段,腳本系統能使區(qū)塊鏈實現更多的功能。
區(qū)塊鏈系統是一個去中心化的、分布式的網絡,網絡中的節(jié)點進行連接通信依靠的就是網絡路由。在區(qū)塊鏈系統中,不存在一個指定的服務器,大家沒法通過一個服務器來直接交換彼此的身份信息,就只能依靠彼此聯系并傳播信息。在區(qū)塊鏈系統中,這個功能一般會定義成一種協議,稱為“節(jié)點發(fā)現協議”。
除了發(fā)現節(jié)點外,另一個功能重要功能是同步數據。節(jié)點要保持自己的賬本數據是最新的,就必須要時時更新自己的數據。怎么更新?就是通過網絡路由進行更新。
網絡路由可以說是區(qū)塊鏈系統中的觸角,通過大量的觸角將每個節(jié)點連入網絡,從而形成一個功能強大的區(qū)塊鏈共識網絡。
總體來說,區(qū)塊鏈技術并不是單一信息技術,而是依托于現有技術,加以獨創(chuàng)性的組合及創(chuàng)新,從而實現以前未實現功能的技術。
隨著電子檔案單套制的加速推進,將區(qū)塊鏈技術應用于電子檔案管理工作,推進電子檔案與區(qū)塊鏈技術的深度融合是檔案工作者的一個重點研究方向。國家檔案局近幾年的科技項目立項選題指南中就均設有區(qū)塊鏈技術相關內容,中國石化已經使用區(qū)塊鏈技術對檔案進行存證和驗證進行了嘗試。下面,筆者按照自身的理解,嘗試展望一下區(qū)塊鏈技術在檔案工作中的應用。
首先說明,使用區(qū)塊鏈技術,并不是要把所有應用都使用區(qū)塊鏈技術,而是要仔細分析各種業(yè)務場景實際情況,在充分發(fā)揮區(qū)塊鏈技術優(yōu)勢的基礎上,有選擇地應用區(qū)塊鏈技術。區(qū)塊鏈技術的應用優(yōu)勢,是解決非信任環(huán)境中的信任問題和價值傳遞。因此,使用區(qū)塊鏈技術,應重點考慮在多方參與的復雜應用場景中使用。為充分發(fā)揮區(qū)塊鏈核心作用——存證、自動化協作和價值轉移,結合工作實際,檔案區(qū)塊鏈可以分兩步建設以實現以下功能。
第一步,搭建檔案區(qū)塊鏈,將檔案數據的哈希值和業(yè)務移交辦理信息上鏈,實現檔案移交進館業(yè)務的上鏈辦理。
在政務云平臺上建立由檔案館牽頭、各進館單位通過授權加入的檔案區(qū)塊鏈。按照電子檔案進館要求,明確各方的權利和義務。在電子檔案移交進館,即電子檔案的權屬發(fā)生轉移時,移交方首先將電子檔案進行哈希運算,然后將電子檔案及其哈希值一起移交給接收方。當接收方收到電子檔案后,可提取電子檔案哈希值與接收到的哈希值進行驗證,如果一致,說明接收方收到的電子檔案確實是發(fā)送方發(fā)送的且內容沒有被修改過。接收方確認無誤后接收電子檔案及其哈希值,然后將哈希值和接收信息上鏈存證,各參與節(jié)點根據共識機制同步確認并保存該哈希值和移交信息到區(qū)塊鏈賬本。按照這種機制,上鏈存儲的并不是電子檔案的全文內容而只是哈希值,因此不會導致電子檔案內容的泄露,從而保證了電子檔案信息的安全。
第二步,隨著安全技術的進步,有計劃的將檔案數據上鏈,實現檔案管理和利用業(yè)務的上鏈辦理。同時與其它區(qū)塊鏈系統建立信息交換機制,實現電子檔案信息在不同鏈之間的數據互通、價值流動,充分發(fā)揮區(qū)塊鏈價值傳遞的優(yōu)勢,為社會提供更便利、價值更高的檔案信息服務。
通過政務網平臺,將檔案區(qū)塊鏈與其它區(qū)塊鏈連通,建成多種信息互通的聯盟鏈。按照聯盟鏈模式建立更加完備的權限控制功能,使用跨鏈技術,搭建鏈與鏈之間可信交互渠道。在使用傳統安全技術如數據加密、權限控制之外,引入零知識證明、同態(tài)加密等新型安全技術,實現檔案數據上鏈管理的同時達到數據“可用不可見”的更高安全級別。
在這種應用場景下,檔案區(qū)塊鏈可實現以下功能:
在檔案移交進館環(huán)節(jié)中,利用區(qū)塊鏈智能合約的透明可信、自動執(zhí)行、強制履約的特點,將各單位的文件材料歸檔范圍、檔案保管期限、檔案元數據與全文,以及開放鑒定等要求寫入智能合約,實現到期檔案的自動檢查和移交進館,在規(guī)范檔案移交進館工作、提高檔案數據質量的同時,達到檔案移交進館的自動化處理,極大減輕移交進館環(huán)節(jié)工作人員的工作量。
在檔案管理環(huán)節(jié),利用區(qū)塊鏈技術去中心化、防篡改的特點,建立多個存儲全部數據的共識節(jié)點,實現檔案數據存儲、備份的一體化管理,在極大提高數據安全性的同時,充分借用區(qū)塊鏈分布式存儲特性降低檔案館工作人員的日常維護難度和成本。
在檔案利用環(huán)節(jié),利用與其它區(qū)塊鏈連通形成的聯盟鏈,實現檔案信息與其它信息的可信交互和綜合利用,打通“鏈級孤島”,實現更大范圍和規(guī)模的數據共享和多方協作,建立可容納各行各業(yè)檔案信息和其它信息的服務平臺,為更好的服務民生、為政府治理水平和治理能力的提升,提供更強大的信息支撐。
目前,許多檔案工作者開展了區(qū)塊鏈技術在電子檔案共享利用、真實性保障、安全管理等方面廣泛性研究,并取得一定的成果。但總體來說,區(qū)塊鏈技術在電子檔案管理中的應用尚處于探索階段,隨著區(qū)塊鏈技術的逐漸成熟,可以肯定,區(qū)塊鏈技術與電子檔案相結合,必然會產生重大影響,檔案工作者應緊跟時代步伐,充分利用區(qū)塊鏈技術的優(yōu)勢,推動檔案工作提質增效。