郭子賢 左敏 張青川
摘要:近年來,放射源輻射安全監(jiān)管范圍不斷擴(kuò)大,監(jiān)管要求不斷完善,任務(wù)不斷增加。導(dǎo)致我國核技術(shù)利用輻射安全監(jiān)管系統(tǒng)的數(shù)據(jù)成為了海量數(shù)據(jù),進(jìn)而放射源溯源安全監(jiān)管人員難以快捷的掌握放射源流轉(zhuǎn)的動(dòng)態(tài)信息,難以有效和安全地監(jiān)測(cè)放射源。區(qū)塊鏈技術(shù)是完全去中心化、匿名參與的不可控網(wǎng)絡(luò),網(wǎng)絡(luò)中的所有節(jié)點(diǎn)都參與數(shù)據(jù)的記錄。但在放射源溯源信息中,由于記錄放射源溯源的數(shù)據(jù)是海量數(shù)據(jù),在傳統(tǒng)的區(qū)塊鏈技術(shù)下,網(wǎng)絡(luò)中單節(jié)點(diǎn)的性能較低、同時(shí)數(shù)據(jù)存儲(chǔ)采用鏈?zhǔn)奖镜卮鎯?chǔ)導(dǎo)致無法平行擴(kuò)展的問題。本文將結(jié)合放射源流轉(zhuǎn)數(shù)據(jù)的特點(diǎn),研究分層多鏈的切分存儲(chǔ)方式,提高節(jié)點(diǎn)處理放射源流轉(zhuǎn)數(shù)據(jù)存儲(chǔ)的性能。
關(guān)鍵詞:區(qū)塊鏈;存儲(chǔ);溯源系統(tǒng);區(qū)塊鏈溯源模型;分片存儲(chǔ)
中圖分類號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A
Research on Radioactive Source Logistics Traceability Data Storage Algorithms Based on Block Chain Technology
Zi Xian-guo1,2,3,4,Zuo Min1,3,4,Zhang Qing-chuan1,3,4
(1. School of Computer and Information Engineering,Beijing Technology and Business University
2. nuclear and radiation safety center
3.National Engineering Laboratory for Agri-product Quality Traceability
4. Beijing Key Laboratory of Big Data Technology for Food Safety Beijing,100048)
ABSTRACT:In recent years,the scope of radiation safety supervision of radioactive sources has been expanding,regulatory requirements have been refined and tasks have been aggravated. As a result,the data of radiation safety supervision system used by nuclear technology in our country has become a mass of data. Therefore,it is difficult for radioactive source traceability safety supervisors to quickly grasp the dynamic information of radiation source flow and to effectively monitor the safety of radioactive sources. Block chain technology is a completely decentralized and anonymous uncontrollable network in which all nodes participate in data recording. However,in radioactive source traceability information,because the data recorded from radioactive source traceability are massive data,the performance of single node in the network is low under the traditional block chain technology,and the use of chain local storage for data storage leads to the problem that parallel expansion cannot be achieved. Based on the characteristics of the radioactive source flow data,this paper will study the hierarchical multi-chain segmented storage method to improve the performance of the node processing the radioactive source flow data.
KEYWORDS:Block Chain;Storage;Traceability System;Block Chain Traceability Model;Piecewise Storage
1 引言
隨著放射源應(yīng)用企業(yè)不斷增多,放射源流轉(zhuǎn)數(shù)據(jù)信息也隨著成為了海量的數(shù)據(jù)。當(dāng)前中國放射源的流轉(zhuǎn)溯源管理研究處于探索階段,溯源系統(tǒng)的更新?lián)Q代較為頻繁,海量數(shù)據(jù)等待篩選、分析,為傳統(tǒng)數(shù)據(jù)存儲(chǔ)系統(tǒng)造成了前所未有的挑戰(zhàn)。今天的放射源可追溯信息與以前完全不同:一方面,這些溯源數(shù)據(jù)信息來源涉及到的相關(guān)企業(yè)過于龐雜;另一方面,放射源的數(shù)據(jù)結(jié)構(gòu)差異較大,數(shù)據(jù)中包含放射源基本信息、流轉(zhuǎn)信息、回收信息等。而區(qū)塊鏈技術(shù)恰好適用于對(duì)復(fù)雜數(shù)據(jù)進(jìn)行溯源分析處理,放射源溯源技術(shù)技術(shù)被認(rèn)為是繼大數(shù)據(jù)、云計(jì)算之后的顛覆式創(chuàng)新,各行業(yè)均對(duì)此予以高度關(guān)注,區(qū)塊鏈技術(shù)的發(fā)展已成為不可逆轉(zhuǎn)的趨勢(shì)。
2 放射源在區(qū)塊鏈技術(shù)下的溯源存儲(chǔ)模型
在放射源溯源數(shù)據(jù)存儲(chǔ)區(qū)塊鏈中,放射源監(jiān)管部門針對(duì)放射源在流轉(zhuǎn)網(wǎng)絡(luò)中的生產(chǎn),轉(zhuǎn)讓,異地使用,回收,收貯等數(shù)據(jù)信息進(jìn)行實(shí)時(shí)的采集監(jiān)控,了解放射源的流轉(zhuǎn)狀況,從而防止放射源事故的發(fā)生,加強(qiáng)對(duì)放射源的監(jiān)督。
放射源溯源數(shù)據(jù)存儲(chǔ)鏈?zhǔn)墙⒃诜派湓幢O(jiān)管部門的監(jiān)管系統(tǒng)中的,在放射源溯源鏈中有一個(gè)重要的數(shù)據(jù)保障過程——共識(shí)過程,監(jiān)管部門中的監(jiān)管體系有權(quán)控制共識(shí)流程并競(jìng)爭(zhēng)編寫數(shù)據(jù)的資格,進(jìn)而獲得獎(jiǎng)勵(lì)。
放射源區(qū)塊鏈溯源存儲(chǔ)模型(以下稱簡(jiǎn)稱BCSM)包括以下成分:
1)放射源溯源區(qū)塊鏈中的節(jié)點(diǎn)區(qū)塊。BCSM中,所有的放射源溯源數(shù)據(jù)都將被監(jiān)管部門審核,再存儲(chǔ)到區(qū)塊節(jié)點(diǎn)中,從而將數(shù)據(jù)在區(qū)塊網(wǎng)絡(luò)中傳播,由于區(qū)塊節(jié)點(diǎn)的運(yùn)算以及存儲(chǔ)能力有限,所以本文中節(jié)點(diǎn)無需直接獨(dú)自存儲(chǔ)全部數(shù)據(jù),而是將一條完整的數(shù)據(jù)切分存儲(chǔ)到一個(gè)由若干區(qū)塊節(jié)點(diǎn)構(gòu)成的一個(gè)節(jié)點(diǎn)組中進(jìn)行存儲(chǔ)。區(qū)塊中的存儲(chǔ)內(nèi)容主要包含以下三部分:放射源流轉(zhuǎn)行為信息和前一個(gè)區(qū)塊節(jié)點(diǎn)形成的哈希散列、隨機(jī)數(shù)。放射源流轉(zhuǎn)行為信息是區(qū)塊節(jié)點(diǎn)需要記錄的任務(wù)數(shù)據(jù),具體包括每次放射源作出流轉(zhuǎn)行為時(shí)企業(yè)雙方的私鑰、放射源的數(shù)量、放射源交易雙方信息等;前一個(gè)區(qū)塊形成的哈希散列用來將區(qū)塊節(jié)點(diǎn)連接起來,實(shí)現(xiàn)過往交易的順序排列(圖1)。
2)智能合約。在 BCSM中的節(jié)點(diǎn)區(qū)塊的職責(zé)是存放放射源溯源數(shù)據(jù),與歷史數(shù)據(jù)庫中的數(shù)據(jù),并且在一個(gè)區(qū)塊組中的區(qū)塊之間進(jìn)行數(shù)據(jù)傳輸即溯源數(shù)據(jù)共享,而在區(qū)塊之間傳輸數(shù)據(jù)的過程中節(jié)點(diǎn)區(qū)塊通過智能合約建立不同區(qū)塊之間的信任機(jī)制,從而來保證數(shù)據(jù)的一致性。從根本上說,智能合約是一組以數(shù)字形式定義的承諾,也可以理解為可以在不同區(qū)塊之間發(fā)生的承諾協(xié)議。智能合約系統(tǒng)的主體是進(jìn)入智能合約的數(shù)據(jù)流轉(zhuǎn)事件,經(jīng)過智能合約處理后,出來的也是應(yīng)該是數(shù)據(jù)流轉(zhuǎn)事件。
3)工作量證明機(jī)制(Proof-of-Work,PoW)。通常只能從BCSM中不同區(qū)塊之間的應(yīng)用的最終效果來證明,因?yàn)闄z測(cè)其工作過程通常是繁瑣且低效的。工作量證明顧名思義,就是一份證明,用來證明你做過一定的工作。在BCSM中的工作量證明機(jī)制類似于比特幣,新的放射源溯源數(shù)據(jù)加入?yún)^(qū)塊鏈之前,BCSM在某個(gè)時(shí)間段內(nèi)溯源數(shù)據(jù)的記賬權(quán)(即數(shù)據(jù)錄入的權(quán)利)需要在預(yù)選的區(qū)塊組之間進(jìn)行競(jìng)爭(zhēng)記錄。即每個(gè)區(qū)塊組相互競(jìng)爭(zhēng)尋找有效的Nonce最快找到有效Nonce的區(qū)塊組將獲得一定的獎(jiǎng)勵(lì),負(fù)責(zé)記錄放射源溯源數(shù)據(jù),并將數(shù)據(jù)切分存儲(chǔ)使其成為新的數(shù)據(jù)節(jié)點(diǎn)區(qū)塊,從而融入獲得獎(jiǎng)勵(lì)的區(qū)塊組內(nèi)。
3放射源溯源數(shù)據(jù)存儲(chǔ)鏈切分存儲(chǔ)算法的比較與選取
記錄放射源溯源信息的數(shù)據(jù)是海量數(shù)據(jù),在現(xiàn)有區(qū)塊鏈技術(shù)下,網(wǎng)絡(luò)中單節(jié)點(diǎn)的性能較低、同時(shí)數(shù)據(jù)存儲(chǔ)采用鏈?zhǔn)奖镜卮鎯?chǔ)導(dǎo)致無法平行擴(kuò)展。放射源從生產(chǎn)到回收后安全信息不再更改。因此,本文結(jié)合放射源流轉(zhuǎn)數(shù)據(jù)的特點(diǎn),研究分層多鏈的切分存儲(chǔ)方式,提高節(jié)點(diǎn)處理放射源流轉(zhuǎn)相關(guān)數(shù)據(jù)的性能。
3.1 切分存儲(chǔ)算法種類
分層多鏈:通過放射源監(jiān)管部門即數(shù)據(jù)存儲(chǔ)器將整個(gè)監(jiān)測(cè)區(qū)域按照省,市,縣等級(jí)去劃分。
切分存儲(chǔ):數(shù)據(jù)切分是分布式數(shù)據(jù)庫系統(tǒng)的最基本功能。切分?jǐn)?shù)據(jù)的方法有很多種,通常由具體的應(yīng)用程序特征決定。根據(jù)實(shí)際應(yīng)用中常用的數(shù)據(jù)切分方法,數(shù)據(jù)切分算法可分為范圍分割算法,枚舉分割算法,簡(jiǎn)單散列分割算法,一致性散列算法和組合算法。其中,組合算法是各種基本算法的組合。
范圍切分算法:范圍分割算法基于分割字段的范圍來分割數(shù)據(jù)。通常,拆分字段是實(shí)數(shù)類型,例如整數(shù),浮點(diǎn)數(shù)等。它可以進(jìn)一步擴(kuò)展到可以比較的所有類型的數(shù)據(jù),例如日期。當(dāng)分段數(shù)據(jù)被均勻地劃分為多個(gè)范圍間隔時(shí),性能最佳。
枚舉切分算法:枚舉切分算法根據(jù)數(shù)據(jù)分割字段的枚舉值對(duì)數(shù)據(jù)進(jìn)行劃分。這種類型的分段特別適用于用戶分布廣泛的應(yīng)用程序,因此可以按區(qū)域?qū)?shù)據(jù)進(jìn)行分段。當(dāng)數(shù)據(jù)可以被枚舉值均分時(shí),性能最好,但這種情況比較少見,而且對(duì)應(yīng)不同枚舉值的數(shù)據(jù)甚至很寬。因此,這種類型的算法通常需要與其他算法結(jié)合使用。
簡(jiǎn)單哈希算法:數(shù)據(jù)通常能夠更均勻地分段。如果從負(fù)載平衡的角度考慮,該算法是性能最佳的分割算法。但是它同時(shí)也存在一個(gè)巨大的缺陷:遷移成本太高。一旦數(shù)據(jù)節(jié)點(diǎn)數(shù)量發(fā)生變化,每個(gè)節(jié)點(diǎn)都需要進(jìn)行數(shù)據(jù)遷移。如果數(shù)據(jù)節(jié)點(diǎn)保持穩(wěn)定,則算法仍然是首選算法。
一致性哈希算法:該算法既可以解決"熱點(diǎn)"問題(系統(tǒng)讀寫集中在新創(chuàng)建的節(jié)點(diǎn)上,負(fù)載不平衡),又降低了數(shù)據(jù)擴(kuò)容的成本,因此在數(shù)據(jù)切分領(lǐng)域應(yīng)用廣泛。
3.2切分算法的比較分析
分布式系統(tǒng)的兩個(gè)最重要的指標(biāo)是負(fù)載平衡和可伸縮性。范圍分割和枚舉分割之間存在負(fù)載平衡問題,新添加的數(shù)據(jù)節(jié)點(diǎn)負(fù)擔(dān)過重;簡(jiǎn)單的哈希算法解決了這個(gè)問題,但是存在遷移成本高,可擴(kuò)展性差的問題。一致的哈希算法在這兩個(gè)方面更加平衡,這就是它可以被廣泛使用的原因。但是,一致性哈希算法仍然存在一些缺點(diǎn)。因?yàn)楣:瘮?shù)用于處理數(shù)據(jù),所以它不具有控制數(shù)據(jù)大小的靈活性,如范圍分段和枚舉分段。雖然數(shù)據(jù)遷移成本降低,但仍然需要遷移某些數(shù)據(jù),特別是當(dāng)數(shù)據(jù)總量很大時(shí),遷移成本仍然相對(duì)較大。
3.3切分算法的選取
通過深入分析各種算法的優(yōu)缺點(diǎn),本文擬采用一種新的組合算法:分組哈希分區(qū)算法。該算法結(jié)合了范圍分割算法,簡(jiǎn)單哈希算法和數(shù)據(jù)庫分區(qū),并集成了兩種算法的優(yōu)點(diǎn)。
分組哈希分區(qū)算法首先對(duì)分組執(zhí)行范圍分割算法,以使系統(tǒng)獲得更好的可擴(kuò)展性;然后在組內(nèi)執(zhí)行簡(jiǎn)單哈希算法,使數(shù)據(jù)均勻分布于組內(nèi)節(jié)點(diǎn)上,以避免負(fù)載不均勻。全局上,數(shù)據(jù)按增量間隔進(jìn)行分段,分段的段不分布在一個(gè)數(shù)據(jù)節(jié)點(diǎn)中,而是分布在一個(gè)節(jié)點(diǎn)組中;在本地,即在節(jié)點(diǎn)組內(nèi),片段以簡(jiǎn)單的散列方式均勻地分布到組中的每個(gè)數(shù)據(jù)節(jié)點(diǎn)。
5 結(jié)論與展望
本文圍繞放射源溯源數(shù)據(jù)在區(qū)塊鏈中的存儲(chǔ)問題,做了兩方面的工作。一是提出了一個(gè)基于聯(lián)盟區(qū)塊鏈的安全存儲(chǔ)(BCSM)模型,該模型借助于區(qū)塊鏈“去中心化”的性質(zhì)。二是分析了各種切分算法的優(yōu)缺點(diǎn),并提出了一種在性能和可擴(kuò)展性上均表現(xiàn)良好的沮合算法,彌補(bǔ)了現(xiàn)有算法的不足。在未來的研究中我們將根據(jù)不同的需求來評(píng)估和改進(jìn)我們放射源溯源模型。
參考文獻(xiàn)
[1]肖潔.網(wǎng)絡(luò)數(shù)據(jù)安全存儲(chǔ)優(yōu)化管理研究[J].計(jì)算機(jī)仿真,2016,33(12):436-439.
[2]Jin S,Zhang Y,Xu Y. Amount of information and the willingness of consumers to pay for food traceability in China[J]. Food Control,2017,77:163-170.
[3]Kim Y G,Woo E. Consumer acceptance of a quick response(QR)code for the food traceability system:Application of an extendedtechnology acceptance model(TAM)[J]. Food Research International,2016,85:266-272.
[4]繆祎晟,吳華瑞,朱華吉,黃鋒.城市食品安全體系智能溯源終端設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(03):641-646.
[5]王志遷.基于物聯(lián)網(wǎng)標(biāo)識(shí)服務(wù)的溯源技術(shù)研究與應(yīng)用[D].重慶郵電大學(xué),2017.
[6]姚迎樂,張志華.面向大數(shù)據(jù)的并行數(shù)據(jù)分布式備份存儲(chǔ)仿真[J].計(jì)算機(jī)仿真,2018,35(08):401-404+409.
[7]涂俊英,張學(xué)敏.云計(jì)算中數(shù)據(jù)信息加密安全存儲(chǔ)仿真研究[J].計(jì)算機(jī)仿真,2017,34(12):431-434.
[8]孫志國,李秀峰,王文生,冀智強(qiáng).區(qū)塊鏈技術(shù)在食品安全領(lǐng)域的應(yīng)用展望[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2016(12):30-31.
[9]趙闊,邢永恒.區(qū)塊鏈技術(shù)驅(qū)動(dòng)下的物聯(lián)網(wǎng)安全研究綜述[J].信息網(wǎng)絡(luò)安全,2017(05):1-6.
[10]Tse,D.,Zhang,B.,Yang,Y.,Cheng,C.,Mu,H.:Blockchain application in food supply information security. In:IEEE International Conference on Industrial Engineering and Engineering Management(IEEM),ISSN:2157-362X,pp. 1357–1361(2018)
[11]Feng Tian,"A supply chain traceability system for food safety based on HACCP,blockchain & Internet of things," 2017 International Conference on Service Systems and Service Management,Dalian,2017,pp. 1-6.
[12]林延昌. 基于區(qū)塊鏈的食品安全追溯技術(shù)研究與實(shí)現(xiàn)[D].廣西大學(xué),2017.
[13]汪登,曾小珊,白倩蘭,孫耀杰.基于區(qū)塊鏈的食品安全溯源技術(shù)[J/OL].食品科學(xué):1-9[2018-06-24].
作者簡(jiǎn)介:郭子賢(1994-),男(漢族)河北省廊坊市人,碩士研究生,主要研究領(lǐng)域?yàn)橹腔畚锪?,人工智能?/p>
左敏(1973-),男(漢族),北京市海淀區(qū)人,教授,碩士研究生導(dǎo)師,主要研究領(lǐng)域智能管理和人工智能。
張青川(1982-),男(漢族),北京市海淀區(qū)人,博士研究生,講師,主要研究領(lǐng)域?yàn)橹悄苘浖植际接?jì)算和人工智能
基金項(xiàng)目:國家重點(diǎn)研發(fā)計(jì)劃(2016YFD0401205)
(作者單位:1.北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院;
2. 環(huán)境保護(hù)部核與輻射安全中心;
3.農(nóng)產(chǎn)品食品安全追溯技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室;
4.食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室)