亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于區(qū)塊鏈的個(gè)人科學(xué)數(shù)據(jù)共享模式研究

        2021-12-21 13:58:19支鳳穩(wěn)云仲倫張閃閃
        現(xiàn)代情報(bào) 2021年12期
        關(guān)鍵詞:數(shù)據(jù)庫(kù)科學(xué)

        支鳳穩(wěn) 云仲倫 張閃閃

        DOI.10.3969/j.issn.1008-0821.2021.12.007

        [中圖分類號(hào)]G203 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821(2021)12-0069-10

        科學(xué)數(shù)據(jù)是大數(shù)據(jù)時(shí)代最基本、最活躍的科技資源,也是科研活動(dòng)的重要輸入和產(chǎn)出,更是科技創(chuàng)新的基礎(chǔ)性戰(zhàn)略資源和核心驅(qū)動(dòng)要素。只有開放共享、廣泛傳播才能使其價(jià)值最大化,可見,開放共享是實(shí)現(xiàn)科學(xué)數(shù)據(jù)自身潛在價(jià)值的根本途徑,也是順應(yīng)科研范式轉(zhuǎn)變的必然要求。大數(shù)據(jù)時(shí)代,數(shù)據(jù)驅(qū)動(dòng)研究成為一種趨勢(shì),科學(xué)研究越來越依賴大量、系統(tǒng)、高可信度的數(shù)據(jù),進(jìn)而發(fā)展出第4種科研范式——數(shù)據(jù)密集型范式。由于大數(shù)據(jù)集很難獨(dú)立生成,將科學(xué)研究過程中產(chǎn)生的科學(xué)數(shù)據(jù)進(jìn)行開放共享,符合所有供資機(jī)構(gòu)、科學(xué)機(jī)構(gòu)和研究界各方的利益。決策者、出版機(jī)構(gòu)和資助機(jī)構(gòu)也強(qiáng)烈認(rèn)為,共享數(shù)據(jù)對(duì)科研人員非常重要,有利于科學(xué)的發(fā)展。個(gè)體科研人員在科學(xué)數(shù)據(jù)開放共享中起到關(guān)鍵作用,他們既是科研數(shù)據(jù)產(chǎn)出的重要力量,又是其使用者和受益者,異質(zhì)科研群體間多源異構(gòu)數(shù)據(jù)聚合將有效釋放科學(xué)數(shù)據(jù)的潛在價(jià)值,打破數(shù)據(jù)壁壘,連接數(shù)據(jù)孤島,實(shí)現(xiàn)協(xié)同效應(yīng)。我國(guó)《科學(xué)數(shù)據(jù)管理辦法》明確提出,支持科研人員整理發(fā)表產(chǎn)權(quán)清晰、準(zhǔn)確完整、共享價(jià)值高的科學(xué)數(shù)據(jù)。美國(guó)國(guó)家科學(xué)基金會(huì)也要求研究人員,在合理時(shí)間向公眾分享研究中產(chǎn)生的科學(xué)數(shù)據(jù),并鼓勵(lì)和促進(jìn)此類共享。

        個(gè)人科學(xué)數(shù)據(jù)是指?jìng)€(gè)體科研人員或個(gè)體科研團(tuán)隊(duì)在自身科學(xué)研究活動(dòng)產(chǎn)生的,并用于科學(xué)研究活動(dòng)的研究數(shù)據(jù)及與之相關(guān)聯(lián)的個(gè)人身份數(shù)據(jù)。其關(guān)鍵在于數(shù)據(jù)主體的可識(shí)別性,也就是說,可以據(jù)此判斷數(shù)據(jù)的來源與歸屬,明確數(shù)據(jù)主體的相對(duì)數(shù)據(jù)所有權(quán)和使用權(quán)。然而,不是所有個(gè)人身份數(shù)據(jù)都屬于個(gè)人科學(xué)數(shù)據(jù),需要根據(jù)其產(chǎn)生過程及使用目的加以判斷,如征信、醫(yī)療等領(lǐng)域通常存有大量原始身份數(shù)據(jù),若其用于科學(xué)研究活動(dòng)并與研究數(shù)據(jù)相關(guān),則可作為個(gè)人科學(xué)數(shù)據(jù)支撐研究成果。個(gè)人科學(xué)數(shù)據(jù)共享是指?jìng)€(gè)體科研人員(團(tuán)隊(duì))作為數(shù)據(jù)主體,將自身占有的具有科學(xué)價(jià)值和使用價(jià)值的原始數(shù)據(jù)及其衍生數(shù)據(jù),賦權(quán)給對(duì)此成果有所需求的其他個(gè)體科研人員(團(tuán)隊(duì))瀏覽、使用的行為。與組織機(jī)構(gòu)問的科學(xué)數(shù)據(jù)共享不同,個(gè)人科學(xué)數(shù)據(jù)共享更強(qiáng)調(diào)個(gè)體問的行為交互,共享的科學(xué)數(shù)據(jù)類型多種多樣,質(zhì)量高低不一,共享次數(shù)更為頻繁,動(dòng)態(tài)伸縮性更強(qiáng),更依賴于高可信度的共享環(huán)境。然而,目前還存在數(shù)據(jù)易用性差、數(shù)據(jù)安全性低、用戶隱私被泄露等問題,數(shù)據(jù)共享的風(fēng)險(xiǎn)遠(yuǎn)遠(yuǎn)高于預(yù)期收益,信任體系無法建立,導(dǎo)致數(shù)據(jù)貢獻(xiàn)者共享意愿降低、共享效率低下等后果。

        區(qū)塊鏈技術(shù)的發(fā)展給個(gè)人科學(xué)數(shù)據(jù)共享提供了新的選擇。2019年10月24日,習(xí)近平總書記指出,要發(fā)揮區(qū)塊鏈技術(shù)在促進(jìn)數(shù)據(jù)共享、優(yōu)化業(yè)務(wù)流程、提升協(xié)同效率、構(gòu)建可信體系等方面的作用,探索利用區(qū)塊鏈技術(shù)的數(shù)據(jù)共享模式,實(shí)現(xiàn)數(shù)據(jù)跨部門、跨區(qū)域共同維護(hù)和利用。區(qū)塊鏈作為一種確保透明度、可追溯性和安全性的分布式數(shù)字賬本技術(shù),所有區(qū)塊節(jié)點(diǎn)共享相同的數(shù)據(jù),保證了數(shù)據(jù)有效性和安全性,為個(gè)體或組織創(chuàng)造一個(gè)可信的空間,解決了科學(xué)數(shù)據(jù)可信問題,有助于構(gòu)建一個(gè)完善的共享數(shù)據(jù)信任體系。

        在此背景下,本研究以區(qū)塊鏈技術(shù)為視角,憑借其具有的不可篡改性、可追溯性、去中心化等特點(diǎn),探索構(gòu)建基于區(qū)塊鏈技術(shù)的個(gè)人科學(xué)數(shù)據(jù)共享新模式,以實(shí)現(xiàn)區(qū)塊鏈技術(shù)賦能與個(gè)人科學(xué)數(shù)據(jù)共享的結(jié)合,引入SQL數(shù)據(jù)庫(kù),解決科學(xué)數(shù)據(jù)存儲(chǔ)問題:應(yīng)用智能合約和共識(shí)機(jī)制,解決個(gè)體間信任基礎(chǔ)薄弱問題:利用萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表技術(shù),解決數(shù)據(jù)可用和孤島問題:通過加密算法和授權(quán)共識(shí)技術(shù),解決數(shù)據(jù)安全及隱私保護(hù)問題。希望本研究能為實(shí)現(xiàn)科學(xué)數(shù)據(jù)共享中各主體的高效互動(dòng)、促進(jìn)個(gè)人科學(xué)數(shù)據(jù)共享利用提供新的思考,同時(shí)為后續(xù)學(xué)者進(jìn)行更深入研究提供理論參考。

        1相關(guān)研究述評(píng)

        1.1個(gè)人科學(xué)數(shù)據(jù)共享的相關(guān)研究

        個(gè)人科學(xué)數(shù)據(jù)共享屬于科學(xué)數(shù)據(jù)共享的子領(lǐng)域,雖然鮮有學(xué)者專門對(duì)此進(jìn)行探討,但不少有關(guān)個(gè)人數(shù)據(jù)與科學(xué)數(shù)據(jù)共享的研究,均已涉及相關(guān)論述。①在個(gè)人數(shù)據(jù)概念與類型方面,黃國(guó)彬等認(rèn)為,個(gè)人數(shù)據(jù)的核心在于數(shù)據(jù)的主體識(shí)別性、構(gòu)成內(nèi)容的豐富性及個(gè)人數(shù)據(jù)產(chǎn)生與應(yīng)用的場(chǎng)景性,并歸納出14種個(gè)人數(shù)據(jù)的基本類型;Zliobaite Ⅰ等認(rèn)為,個(gè)人數(shù)據(jù)為識(shí)別型數(shù)據(jù),指已識(shí)別或可識(shí)別的數(shù)據(jù)主體相關(guān)的任何信息。②在個(gè)人數(shù)據(jù)管理與共享方面,Anciaux N等提出個(gè)人數(shù)據(jù)管理系統(tǒng)應(yīng)考慮功能和安全要求的結(jié)合,明確權(quán)責(zé)分擔(dān)與權(quán)益維護(hù):針對(duì)集中數(shù)據(jù)存儲(chǔ)和管理更容易喪失個(gè)人數(shù)據(jù)所有權(quán)和濫用個(gè)人資料問題,PattanaikⅤ等提出基于Web瀏覽器的對(duì)等數(shù)據(jù)共享框架。③在科學(xué)數(shù)據(jù)共享方面,鄔金鳴等對(duì)人口健康科學(xué)數(shù)據(jù)中個(gè)人敏感信息做出范圍界定;傅天珍等發(fā)現(xiàn),影響個(gè)體科研人員共享科學(xué)數(shù)據(jù)的因素一般有個(gè)人利益權(quán)衡、開放獲取的壓力、技術(shù)與標(biāo)準(zhǔn)問題、文化與法律因素、利他心理因素;盛小平等通過分析GDPR相關(guān)規(guī)定,為我國(guó)科學(xué)數(shù)據(jù)共享過程中個(gè)人數(shù)據(jù)保護(hù)提供了參考。

        1.2區(qū)塊鏈應(yīng)用于科學(xué)數(shù)據(jù)共享的相關(guān)研究

        已有學(xué)者關(guān)注到區(qū)塊鏈技術(shù)在科學(xué)數(shù)據(jù)共享實(shí)踐中的應(yīng)用。①在科研方面,郝世博等從主體、客體、功能3個(gè)角度說明區(qū)塊鏈應(yīng)用于科學(xué)數(shù)據(jù)共享的適用性,并嘗試從技術(shù)維度改善參與者的信任危機(jī)與共享障礙:王倩等基于區(qū)塊鏈技術(shù)和演化博弈理論,分析科技服務(wù)機(jī)構(gòu)數(shù)據(jù)共享的策略,在此基礎(chǔ)上構(gòu)建了面向共享策略的智能合約激勵(lì)機(jī)制。②在醫(yī)療領(lǐng)域,黃茂漢基于區(qū)塊鏈技術(shù)構(gòu)建一個(gè)疫情防控情報(bào)系統(tǒng)模型,旨在對(duì)疫情實(shí)時(shí)情況、疫苗研發(fā)進(jìn)展、患者信息等進(jìn)行數(shù)據(jù)共享;Kuo TT等開發(fā)了3種基于區(qū)塊鏈的分布式方法,可供相關(guān)機(jī)構(gòu)共享基因一藥物相互作用的患者記錄:Balistri E等提出了BlockHealth解決方案,以實(shí)現(xiàn)不同公司間個(gè)人健康數(shù)據(jù)的共享。③針對(duì)數(shù)據(jù)安全,王繼業(yè)等提出基于區(qū)塊鏈技術(shù)作為動(dòng)力支持的數(shù)據(jù)安全共享網(wǎng)絡(luò)體系,改善互信環(huán)境:張利華等設(shè)計(jì)一種基于區(qū)塊鏈的微電網(wǎng)數(shù)據(jù)安全共享方案,在保護(hù)用戶用電隱私的同時(shí),促進(jìn)了用戶數(shù)據(jù)的安全共享。

        1.3研究評(píng)論

        通過文獻(xiàn)梳理發(fā)現(xiàn),相關(guān)研究成果在不斷積累,為本研究提供了重要的理論基礎(chǔ)與實(shí)踐證據(jù)。從研究?jī)?nèi)容來看:在個(gè)人科學(xué)數(shù)據(jù)共享研究中,學(xué)者們?cè)絹碓街匾晜€(gè)體用戶在數(shù)據(jù)共享中的作用,研究聚焦于數(shù)據(jù)分類、治理形態(tài)、共享意愿影響因素、共享路徑等:在基于區(qū)塊鏈的科學(xué)數(shù)據(jù)共享研究中,學(xué)者們主要在數(shù)據(jù)溯源、數(shù)據(jù)存證、數(shù)據(jù)共享模型、數(shù)據(jù)隱私保護(hù)等領(lǐng)域不斷探索。從研究邏輯來看:現(xiàn)有研究主要是基于科學(xué)數(shù)據(jù)共享現(xiàn)存問題及區(qū)塊鏈優(yōu)勢(shì),搭建基于區(qū)塊鏈技術(shù)的科學(xué)數(shù)據(jù)互信共享模式、數(shù)據(jù)安全共享平臺(tái)等;也有不少研究是根據(jù)近年來政府發(fā)文及出臺(tái)的相關(guān)政策,提出區(qū)塊鏈技術(shù)的相應(yīng)對(duì)策方案。然而,區(qū)塊鏈在科學(xué)數(shù)據(jù)共享領(lǐng)域應(yīng)用的研究起步不久,學(xué)術(shù)界對(duì)其在子領(lǐng)域個(gè)人科學(xué)數(shù)據(jù)共享中應(yīng)用的探討更少,現(xiàn)有研究大多關(guān)注到了區(qū)塊鏈的優(yōu)勢(shì),而對(duì)以區(qū)塊鏈用作數(shù)據(jù)存儲(chǔ)帶來的系統(tǒng)吞吐率降低、處理響應(yīng)延遲高、共享周期長(zhǎng)等問題的考慮不足,這也再次確認(rèn)本研究的必要性。

        2現(xiàn)有科學(xué)數(shù)據(jù)共享模式問題分析

        現(xiàn)有研究更多以中心化共享模式為視角,科學(xué)數(shù)據(jù)中心成為促進(jìn)科學(xué)數(shù)據(jù)開放共享的重要載體,通過對(duì)有意愿參與科學(xué)數(shù)據(jù)共享個(gè)人主體的數(shù)據(jù)采集,將采集數(shù)據(jù)集中存儲(chǔ)管理并進(jìn)行共享,主要存在數(shù)據(jù)確權(quán)、數(shù)據(jù)安全、隱私保護(hù)、基礎(chǔ)設(shè)施不匹配、數(shù)據(jù)近似化和激勵(lì)機(jī)制等問題。

        2.1數(shù)據(jù)確權(quán)問題

        科學(xué)數(shù)據(jù)作為基礎(chǔ)生產(chǎn)資料和個(gè)人最重要的知識(shí)資產(chǎn),具有相對(duì)稀缺性,其重要性愈加顯現(xiàn)。顯然,科研人員不可能輕易共享其核心科學(xué)數(shù)據(jù)使用權(quán)與所有權(quán),如果需要現(xiàn)有數(shù)據(jù)成果以支撐研究觀點(diǎn)或推進(jìn)研究進(jìn)程,但限于時(shí)間、能力、環(huán)境條件等多重因素?zé)o法及時(shí)獲取,就有可能將個(gè)人的部分科學(xué)數(shù)據(jù)進(jìn)行開放共享,以交換所需科學(xué)數(shù)據(jù)。科學(xué)數(shù)據(jù)本身具有可復(fù)制性,在共享中易被竊取,可能造成數(shù)據(jù)貢獻(xiàn)者自身產(chǎn)權(quán)受侵犯??茖W(xué)數(shù)據(jù)共享的核心問題歸根到底是數(shù)據(jù)所有權(quán)和使用權(quán)的分離,在集中式開放平臺(tái)規(guī)則下,確權(quán)成本過高,主客體數(shù)據(jù)權(quán)利劃分困難,導(dǎo)致數(shù)據(jù)歸屬未在理論上形成統(tǒng)一認(rèn)識(shí),且數(shù)據(jù)權(quán)屬相關(guān)法規(guī)界定模糊。數(shù)據(jù)所有權(quán)的難以界定會(huì)給數(shù)據(jù)共享參與主體帶來誤會(huì)及糾紛,長(zhǎng)此惡性循環(huán),阻礙科學(xué)數(shù)據(jù)的共享流通。

        2.2數(shù)據(jù)安全問題

        中心化管理賦予平臺(tái)運(yùn)營(yíng)者過多權(quán)力,使之可以通過私下串通數(shù)據(jù)貢獻(xiàn)者或數(shù)據(jù)使用者中一方,操作超出用戶最初授權(quán)范圍,以套取另一方利益。中心化設(shè)置權(quán)限的數(shù)據(jù)共享模式將海量科學(xué)數(shù)據(jù)進(jìn)行大規(guī)模整合并存儲(chǔ),很容易造成集中攻破、數(shù)據(jù)篡改、后臺(tái)操縱等問題,威脅共享生態(tài),而平臺(tái)管理規(guī)范的紕漏導(dǎo)致數(shù)據(jù)使用邊界模糊,增加了數(shù)據(jù)誤用、數(shù)據(jù)濫用等多重風(fēng)險(xiǎn)?,F(xiàn)有大部分共享平臺(tái)可追溯性差,在數(shù)據(jù)泄露后,參與用戶也很難追究。不同于分布式系統(tǒng)架構(gòu),集中式系統(tǒng)更容易導(dǎo)致單點(diǎn)故障,使數(shù)據(jù)被竊。再加上不規(guī)范的管制,在網(wǎng)絡(luò)環(huán)境中各種應(yīng)用系統(tǒng)易發(fā)生撞庫(kù),上傳的科學(xué)數(shù)據(jù)將面臨泄露的風(fēng)險(xiǎn)。出于數(shù)據(jù)安全的顧慮,更多的個(gè)體科研人員反而不愿意將科學(xué)數(shù)據(jù)進(jìn)行共享。

        2.3隱私保護(hù)問題

        科學(xué)數(shù)據(jù)共享與隱私保護(hù)尚未實(shí)現(xiàn)協(xié)同,科學(xué)數(shù)據(jù)共享常伴有用戶信息收集與傳輸,一旦缺乏相應(yīng)管制,傳輸失控導(dǎo)致數(shù)據(jù)外流,將造成大量隱私泄露。諸如在醫(yī)療、征信等領(lǐng)域,存有海量未經(jīng)修飾的原始敏感數(shù)據(jù)??茖W(xué)數(shù)據(jù)共享雖可進(jìn)行匿名分享,但若在共享過程中因操作不當(dāng)或被蓄意攻擊致使個(gè)人用戶信息數(shù)據(jù)泄露,則個(gè)人隱私權(quán)就會(huì)遭受嚴(yán)重侵害。此外,隨著大數(shù)據(jù)與云計(jì)算的高速發(fā)展,共享平臺(tái)信息資源自動(dòng)化獲取程度不斷提高,多源用戶信息的交叉比對(duì)、整合連接次數(shù)日益增長(zhǎng),洞察用戶行為從而構(gòu)建用戶畫像,以此識(shí)別出相關(guān)的個(gè)人隱私數(shù)據(jù),加重了隱私泄露風(fēng)險(xiǎn)。

        2.4基礎(chǔ)設(shè)施不匹配問題

        在數(shù)據(jù)驅(qū)動(dòng)研究背景下,核心數(shù)據(jù)需要通過多種途徑和來源獲取,隨著同一數(shù)據(jù)集中平臺(tái)的數(shù)據(jù)貢獻(xiàn)者和使用者人數(shù)的上升,集中平臺(tái)的數(shù)據(jù)也在隨之增長(zhǎng),但由于每個(gè)貢獻(xiàn)者都有一套自己的數(shù)據(jù)標(biāo)準(zhǔn),且在技術(shù)水平、算法工具上也存在差距,導(dǎo)致使用者在提取來自不同貢獻(xiàn)者的數(shù)據(jù)時(shí)存在數(shù)據(jù)偏差,從而產(chǎn)生大量成本。在傳統(tǒng)數(shù)據(jù)共享中,若想解決數(shù)據(jù)偏差問題,需要在共享過程中投入大量資源對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行改造、對(duì)接,加大了數(shù)據(jù)共享的難度,使共享周期延長(zhǎng)。

        2.5數(shù)據(jù)近似化問題

        個(gè)體科研人員處理數(shù)據(jù)時(shí),會(huì)依照個(gè)人需求、問題難易程度、繁瑣程度等對(duì)數(shù)據(jù)進(jìn)行過濾和選擇,以保持個(gè)人集中的注意力和問題的基本解決。但由于傳統(tǒng)數(shù)據(jù)共享模式中數(shù)據(jù)確權(quán)、數(shù)據(jù)安全、隱私保護(hù)等問題的存在,手握核心數(shù)據(jù)的數(shù)據(jù)所有者不愿意進(jìn)行數(shù)據(jù)共享,核心的、高價(jià)值含量的數(shù)據(jù)得不到及時(shí)公開,用戶共享的科學(xué)數(shù)據(jù)隨著時(shí)間的推移趨于近似,徒增巨大成本,且拖慢該領(lǐng)域的整體科研進(jìn)度,久而久之導(dǎo)致領(lǐng)域內(nèi)共享數(shù)據(jù)單一化、繭房化。而在數(shù)據(jù)共享平臺(tái)之間,也會(huì)因所共享的科學(xué)數(shù)據(jù)質(zhì)量水平、實(shí)質(zhì)內(nèi)容不同逐漸“巴爾干化”,遏制了科學(xué)數(shù)據(jù)流通、共享效率。

        2.6激勵(lì)機(jī)制問題

        在信息不對(duì)稱情況下,大多數(shù)傳統(tǒng)科學(xué)數(shù)據(jù)共享模式未將科學(xué)數(shù)據(jù)質(zhì)量等指標(biāo)納入評(píng)價(jià)機(jī)制,科學(xué)數(shù)據(jù)集缺少數(shù)據(jù)引用等量化指標(biāo),激勵(lì)政策未落實(shí),難以衡量每個(gè)數(shù)據(jù)貢獻(xiàn)者的實(shí)際貢獻(xiàn)所占比例,出現(xiàn)參與數(shù)據(jù)共享的貢獻(xiàn)者提供的科學(xué)數(shù)據(jù)無論質(zhì)量好壞、內(nèi)容多少,所得到的收益都大體相同的情況,使那些原本共享了高質(zhì)量、高稀缺性數(shù)據(jù)的貢獻(xiàn)者感到心理不平衡,最終很可能導(dǎo)致越來越多的數(shù)據(jù)貢獻(xiàn)者分享較少或者直接不分享核心科學(xué)數(shù)據(jù),使科學(xué)數(shù)據(jù)共享行為失去意義。

        3基于區(qū)塊鏈的個(gè)人科學(xué)數(shù)據(jù)共享模式構(gòu)建

        區(qū)塊鏈?zhǔn)且环N基于加密技術(shù)和分布式共識(shí)機(jī)制的新興交互模式,通過鏈?zhǔn)浇Y(jié)構(gòu)實(shí)現(xiàn)區(qū)塊數(shù)據(jù)存儲(chǔ)、加密算法保障數(shù)據(jù)安全、智能合約部署以及區(qū)塊讀取。它不僅能為特定用戶群提供信任服務(wù)的基礎(chǔ)設(shè)施,還可通過加密算法優(yōu)化數(shù)據(jù)公開透明實(shí)現(xiàn)路徑,它象征了與先前不同的數(shù)據(jù)歸屬權(quán),可以很好地改善傳統(tǒng)數(shù)據(jù)共享模式的問題,天然適用于個(gè)人科學(xué)數(shù)據(jù)共享領(lǐng)域。本部分將構(gòu)建基于區(qū)塊鏈的個(gè)人科學(xué)數(shù)據(jù)共享模式,并分析其流程與特點(diǎn)。

        3.1模式架構(gòu)模型

        為實(shí)現(xiàn)數(shù)據(jù)完整、來源可追溯,建立信任體系,防止數(shù)據(jù)隱私泄露,最終促進(jìn)大數(shù)據(jù)環(huán)境下個(gè)人科學(xué)數(shù)據(jù)安全共享。本研究借助SQL Sever數(shù)據(jù)庫(kù)(以下簡(jiǎn)稱“SQL數(shù)據(jù)庫(kù)”)和萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表理論,嘗試構(gòu)建了基于區(qū)塊鏈的個(gè)人數(shù)據(jù)共享模式架構(gòu)模型,如圖1所示。

        該模型共涉及6部分:區(qū)塊鏈、SQL數(shù)據(jù)庫(kù)、智能合約、用戶本地?cái)?shù)據(jù)終端、點(diǎn)對(duì)點(diǎn)數(shù)據(jù)傳輸網(wǎng)絡(luò)以及用戶實(shí)體。其中,用戶實(shí)體包括數(shù)據(jù)貢獻(xiàn)者和數(shù)據(jù)使用者,數(shù)據(jù)貢獻(xiàn)者是指科研數(shù)據(jù)的供給側(cè),可以是元數(shù)據(jù)生產(chǎn)者,也可以是和生產(chǎn)者達(dá)成某種協(xié)議后準(zhǔn)允再分享的數(shù)據(jù)擁有者;對(duì)科學(xué)數(shù)據(jù)具有使用意愿的需求側(cè)稱為數(shù)據(jù)使用者;在同一共享過程中的所有用戶稱為共享參與者。該模型結(jié)合了區(qū)塊鏈、智能合約和點(diǎn)對(duì)點(diǎn)傳輸網(wǎng)絡(luò),并通過加密算法實(shí)現(xiàn)保護(hù)共享科學(xué)數(shù)據(jù)隱私,以大數(shù)據(jù)視角下科研人員個(gè)人科學(xué)數(shù)據(jù)共享為應(yīng)用場(chǎng)景,構(gòu)建Fabric環(huán)境,引入SQL數(shù)據(jù)庫(kù)實(shí)現(xiàn)分布式存儲(chǔ),基于萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表數(shù)據(jù)庫(kù)理論,其中原始科學(xué)數(shù)據(jù)存儲(chǔ)在用戶個(gè)人數(shù)據(jù)終端中,所需共享的科學(xué)數(shù)據(jù)經(jīng)萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表規(guī)范數(shù)據(jù)標(biāo)準(zhǔn)化后加密處理,存儲(chǔ)至SQL數(shù)據(jù)庫(kù)中,其存儲(chǔ)日志、地址等元數(shù)據(jù)記錄在Fabric上,以達(dá)到數(shù)據(jù)脫鏈存儲(chǔ)的目的,解決了區(qū)塊鏈存儲(chǔ)容量有限帶來的交易處理速度緩慢、共識(shí)效率低等問題,有利于科學(xué)數(shù)據(jù)的可用性開發(fā)和重復(fù)應(yīng)用。個(gè)體科研人員以此方式進(jìn)行科學(xué)數(shù)據(jù)共享,相應(yīng)數(shù)據(jù)經(jīng)智能合約處理后返回,共享其處理后的數(shù)據(jù)結(jié)果,原始數(shù)據(jù)不對(duì)外公開,實(shí)現(xiàn)了數(shù)據(jù)的可用不可見,避免數(shù)據(jù)資產(chǎn)泄露的同時(shí)保證了共享的安全性,以建立起信任體系,推動(dòng)科學(xué)數(shù)據(jù)有效聚合,挖掘科學(xué)數(shù)據(jù)的潛在價(jià)值。

        3.2模式具體流程

        模型中所涉及的具體操作流程如下:

        1)生成節(jié)點(diǎn),完成身份匿名,數(shù)據(jù)使用者上傳數(shù)據(jù)需求至智能合約,由智能合約發(fā)布需求信息,同時(shí)索引數(shù)據(jù)庫(kù)中已存儲(chǔ)數(shù)據(jù)信息,進(jìn)行對(duì)應(yīng)需求匹配。

        2)匹配成功后反饋配對(duì)信息至參與者,數(shù)據(jù)使用者向數(shù)據(jù)貢獻(xiàn)者申請(qǐng)所需科學(xué)數(shù)據(jù)信息,由數(shù)據(jù)貢獻(xiàn)者按其需求上傳數(shù)據(jù),經(jīng)自適應(yīng)萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表對(duì)上傳數(shù)據(jù)標(biāo)準(zhǔn)化后,進(jìn)行加密算法處理形成數(shù)據(jù)密文,通過哈希算法得到概要。

        3)待數(shù)據(jù)使用者確認(rèn)概要信息即所需,數(shù)據(jù)密文上傳智能合約,處理后自動(dòng)上傳至SQL數(shù)據(jù)庫(kù)并返回哈希值,智能合約頒發(fā)密鑰和哈希值給數(shù)據(jù)貢獻(xiàn)者,同時(shí)記錄操作日志到數(shù)據(jù)貢獻(xiàn)者個(gè)人數(shù)據(jù)終端,存儲(chǔ)信息、概要、哈希值等相關(guān)信息記錄做上鏈留痕處理。

        4)數(shù)據(jù)貢獻(xiàn)者授權(quán)數(shù)據(jù)使用者,驗(yàn)證數(shù)據(jù)使用者身份后調(diào)用智能合約,告知數(shù)據(jù)使用者共享數(shù)據(jù)存儲(chǔ)地址,滿足共享?xiàng)l件后數(shù)據(jù)使用者獲取密鑰通過驗(yàn)證并觸發(fā)智能合約,同時(shí)更新個(gè)人數(shù)據(jù)終端相關(guān)數(shù)據(jù)屬性,并再次上鏈留痕。

        5)數(shù)據(jù)使用者利用密鑰獲得共享科學(xué)數(shù)據(jù)處理結(jié)果,針對(duì)此次交互過程進(jìn)行反饋并達(dá)成共識(shí),完成共享后生成交易日志操作記錄于鏈上,更新個(gè)人科學(xué)數(shù)據(jù)集引用量信息,對(duì)應(yīng)用戶成為區(qū)塊鏈上的節(jié)點(diǎn)并建立連接。

        綜上,科學(xué)數(shù)據(jù)共享全程由共享參與者直接參與,每一環(huán)節(jié)均具自主權(quán),整體流程公開透明,數(shù)據(jù)記錄可追溯,不可篡改。

        3.3模式特點(diǎn)分析

        相比傳統(tǒng)的中心化科學(xué)數(shù)據(jù)共享模式,本研究構(gòu)建的基于區(qū)塊鏈的個(gè)人數(shù)據(jù)共享模式,具有共享參與者自主性,共享科學(xué)數(shù)據(jù)的完整性、標(biāo)準(zhǔn)化、可追溯性與安全性更強(qiáng)的特點(diǎn),具體如下:

        3.3.1自主性

        本研究構(gòu)建的去中心化的共享模式中,每個(gè)用戶均有機(jī)會(huì)參與記賬,充分保障了每個(gè)用戶的權(quán)益,最大限度地避免由中心化體系所帶來的主導(dǎo)權(quán)問題。在多個(gè)個(gè)體用戶共同搭建的數(shù)據(jù)共享平臺(tái)中,共享成功率和用戶數(shù)量大多成反比關(guān)系,該平臺(tái)的主導(dǎo)權(quán)往往會(huì)隨著個(gè)體用戶數(shù)量的增加而越難界定。個(gè)體用戶問的關(guān)系大多數(shù)呈對(duì)等關(guān)系,任何一方在數(shù)據(jù)共享過程中進(jìn)行主導(dǎo)都會(huì)引起其他參與者的爭(zhēng)議或不滿。而分布式數(shù)據(jù)存儲(chǔ)使原來中心化角色權(quán)力分散化,任何一個(gè)用戶個(gè)體無法控制整體科學(xué)數(shù)據(jù)共享進(jìn)程走向,權(quán)限變更需要每一個(gè)參與者共同表態(tài)來決定最終結(jié)果。通過調(diào)動(dòng)每個(gè)參與者的參與度來提升平臺(tái)的可信賴性,實(shí)現(xiàn)個(gè)體用戶間點(diǎn)對(duì)點(diǎn)交互,也有利于提升參與者問數(shù)據(jù)共享成功率。

        3.3.2數(shù)據(jù)完整性

        傳統(tǒng)科學(xué)數(shù)據(jù)共享模式無法保證科學(xué)數(shù)據(jù)確權(quán)以及其完整性,導(dǎo)致參與者問不斷出現(xiàn)信任危機(jī),信任成本不斷上升,從而導(dǎo)致科學(xué)數(shù)據(jù)的低流通性和低共享性。而區(qū)塊鏈技術(shù)可以給科學(xué)數(shù)據(jù)貼上“防偽標(biāo)識(shí)”,強(qiáng)化技術(shù)保護(hù),保證科學(xué)數(shù)據(jù)在共享過程中不可篡改,以確定科學(xué)數(shù)據(jù)的準(zhǔn)確來源和可靠性。參與者雙方或多方需嚴(yán)格遵守操作規(guī)程,若在共享過程中途發(fā)生科學(xué)數(shù)據(jù)內(nèi)容的增減、修改,經(jīng)過參與者協(xié)商和表決后,獲得大多數(shù)甚至全部參與者的一致認(rèn)可,即完成“共識(shí)過程”,才可執(zhí)行后續(xù)操作。

        3.3.3數(shù)據(jù)標(biāo)準(zhǔn)化

        該模式采用萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表存儲(chǔ)數(shù)據(jù),因此所有數(shù)據(jù)結(jié)構(gòu)保證了高度一致性。運(yùn)用簡(jiǎn)單的技術(shù)實(shí)現(xiàn)結(jié)構(gòu)化大數(shù)據(jù)的高效處理,從根本上解決了數(shù)據(jù)異構(gòu)問題,通過對(duì)數(shù)據(jù)和數(shù)據(jù)結(jié)構(gòu)的優(yōu)化而大幅提高結(jié)構(gòu)化數(shù)據(jù)的處理性能。進(jìn)一步規(guī)范了科學(xué)數(shù)據(jù)共享規(guī)則,有助于實(shí)現(xiàn)數(shù)據(jù)的互聯(lián)共通,保證所需數(shù)據(jù)的真實(shí)性與可用性,解決個(gè)體用戶數(shù)據(jù)挖掘困難的問題,減少或避免了歧義產(chǎn)生。

        3.3.4可追溯性

        整個(gè)共享過程中,參與者的身份信息呈匿名狀態(tài),使用者無法知道是誰(shuí)共享了科學(xué)數(shù)據(jù),共享者也無法知道是誰(shuí)對(duì)這些科學(xué)數(shù)據(jù)有哪些特定需求。但共享行為是任何人都可以看到的,且無法修改刪除,每一次共享過程都是可追溯的,科學(xué)數(shù)據(jù)發(fā)生多少次交互共享,都應(yīng)具備明確的記錄,以明確數(shù)據(jù)源,即數(shù)據(jù)生產(chǎn)者的身份,保證參與者權(quán)益的同時(shí)也減少了科學(xué)數(shù)據(jù)的丟失率。參與者間達(dá)成共識(shí)后,通過特定算法產(chǎn)生的密鑰實(shí)現(xiàn)科學(xué)數(shù)據(jù)的共享傳遞。

        3.3.5安全性

        模型綜合使用加密算法、智能合約、點(diǎn)對(duì)點(diǎn)傳輸網(wǎng)絡(luò)等以保證安全性。共享科學(xué)數(shù)據(jù)經(jīng)加密處理后存儲(chǔ)數(shù)據(jù)密文,在未經(jīng)授權(quán)情況下無法解碼,防止數(shù)據(jù)隱私泄露。參與者使用獨(dú)特的身份編碼序列進(jìn)行匿名廣播,保證個(gè)人隱私安全。數(shù)據(jù)使用者在滿足共享?xiàng)l件并驗(yàn)證身份后,向數(shù)據(jù)共享者申請(qǐng)才可獲授權(quán),獲取處理結(jié)果而不對(duì)外公開原始密文,使用戶在共享過程中得到了全方位的保護(hù),數(shù)據(jù)加密篩選、加密計(jì)算,以及可用不可見也使得攻擊者無法從共享的過程中獲取任何規(guī)定外的信息。這樣不僅可以保護(hù)數(shù)據(jù)貢獻(xiàn)者的知識(shí)產(chǎn)權(quán),其他參與者的數(shù)據(jù)安全性和隱私問題也能夠得到解決。

        4基于區(qū)塊鏈的個(gè)人科學(xué)數(shù)據(jù)共享模式實(shí)現(xiàn)

        根據(jù)上述模型,將針對(duì)數(shù)據(jù)存儲(chǔ)、智能合約、數(shù)據(jù)標(biāo)準(zhǔn)化、共識(shí)機(jī)制以及數(shù)據(jù)加密5個(gè)技術(shù)進(jìn)行逐一介紹。

        4.1區(qū)塊鏈與SQL數(shù)據(jù)庫(kù)結(jié)合實(shí)現(xiàn)分布式數(shù)據(jù)存儲(chǔ)

        將區(qū)塊鏈當(dāng)成數(shù)據(jù)庫(kù)使用,就會(huì)發(fā)現(xiàn)區(qū)塊鏈只有創(chuàng)建和讀取功能,沒有修改和刪除功能,所要求的日志完整化、不可篡改性以提供信任、安全的前提,并不是說其數(shù)據(jù)不可改動(dòng)。隨著區(qū)塊鏈中數(shù)據(jù)存儲(chǔ)容量的遞增,區(qū)塊中交易處理速度變慢、網(wǎng)絡(luò)阻塞、共識(shí)效率低、匹配遲緩等問題涌現(xiàn),雖然可以采取輕節(jié)點(diǎn)方案、異同步技術(shù)等措施解決上述問題,但忽視了區(qū)塊鏈的可運(yùn)維性和實(shí)用性。按照既定規(guī)則執(zhí)行的那些可留痕、可追溯、可復(fù)核等正常或應(yīng)急操作,其最終操作結(jié)果應(yīng)寫在真正的數(shù)據(jù)庫(kù)中,并非區(qū)塊鏈。區(qū)塊鏈應(yīng)作為數(shù)據(jù)庫(kù)的高可靠性的前置。區(qū)塊鏈的設(shè)計(jì)首要目的是安全,數(shù)據(jù)庫(kù)的首要目的是效率,區(qū)塊鏈技術(shù)與數(shù)據(jù)庫(kù)相結(jié)合即可形成優(yōu)勢(shì)互補(bǔ)。區(qū)塊鏈和數(shù)據(jù)庫(kù)有兩種契合方式,其一是把區(qū)塊鏈作為引擎接人到數(shù)據(jù)庫(kù)中,相當(dāng)于從底層改造存儲(chǔ)引擎實(shí)現(xiàn)去中心化的數(shù)據(jù)庫(kù):其二是以區(qū)塊鏈為主體,借鑒數(shù)據(jù)庫(kù)算法,將其翻譯為智能合約代碼,以提升易用性。就目前已有研究分析,除去如用戶資產(chǎn)概況、智能合約等較為重要的信息,其余數(shù)據(jù)均采取分布式存儲(chǔ)的措施,不做上鏈處理。

        此外,區(qū)塊鏈作為鏈?zhǔn)浇Y(jié)構(gòu),每個(gè)節(jié)點(diǎn)獨(dú)立存在且高度自治,但節(jié)點(diǎn)問仍存在直接或間接影響,通過網(wǎng)絡(luò)呈非線性因果關(guān)系。在遇到問題需要對(duì)數(shù)據(jù)進(jìn)行溯源或沖正時(shí),利用改進(jìn)Chain SQL技術(shù),將SQL數(shù)據(jù)庫(kù)的操作記錄各個(gè)節(jié)點(diǎn)共識(shí)之后,記錄到區(qū)塊鏈上,如果共識(shí)執(zhí)行失敗或不通過,SQL數(shù)據(jù)庫(kù)執(zhí)行回滾操作,定位該問題在區(qū)塊鏈上的特定位置,在此進(jìn)行重演;若需對(duì)數(shù)據(jù)進(jìn)行沖正,在區(qū)塊鏈上增加一條或若干條指令即可處理問題,這樣不僅使數(shù)據(jù)庫(kù)的高可用架構(gòu)大大簡(jiǎn)化,還可將此數(shù)據(jù)修正處理進(jìn)行留痕記錄。區(qū)塊鏈與SQL數(shù)據(jù)庫(kù)的結(jié)合,通過多點(diǎn)架設(shè)、提供冗余等,提供高效的調(diào)取架構(gòu)設(shè)置,以提高業(yè)務(wù)吞吐量以及數(shù)據(jù)存儲(chǔ)量,實(shí)現(xiàn)分布式存儲(chǔ)。基于此,解決了由于區(qū)塊鏈的冗余特性限制了數(shù)據(jù)儲(chǔ)存的問題,以及傳統(tǒng)數(shù)據(jù)共享模式無法建立信任體系、去中心化的難題。

        4.2基于SQL的智能合約激勵(lì)共享參與主體

        區(qū)塊鏈技術(shù)可有效解決主體間互信問題,并通過智能合約自動(dòng)執(zhí)行激勵(lì)過程,保證數(shù)據(jù)共享過程的有效性和安全性。在個(gè)人科學(xué)數(shù)據(jù)共享過程中,不同科學(xué)領(lǐng)域下的科研人員對(duì)共享科學(xué)數(shù)據(jù)處理的邏輯不同,可通過算法編輯不同的智能合約以實(shí)現(xiàn)不同的需求。智能合約可以完成共享參與用戶個(gè)人身份加密、發(fā)布需求信息、交易流轉(zhuǎn)等所有關(guān)鍵節(jié)點(diǎn)需求,其優(yōu)勢(shì)如下:第一,高透明性,智能合約允許合約中相關(guān)條款與要求對(duì)所有關(guān)聯(lián)方具有完全可見性與可訪問性,且條款內(nèi)容無法更改。第二,高安全性,智能合約采用高級(jí)別的數(shù)據(jù)加密算法,節(jié)點(diǎn)在建立連接過程中生成臨時(shí)會(huì)話密鑰,保證數(shù)據(jù)傳輸安全性的同時(shí)也防止了數(shù)據(jù)源泄漏。第三,存儲(chǔ)備份,區(qū)塊鏈環(huán)境的不可改變性,保證了任何用戶都無法修改已批準(zhǔn)的溯源記錄,共享過程中的所有重要細(xì)節(jié)都會(huì)被智能合約以日志的形式記錄下來,具有可溯源性。第四,永久性,智能合約一旦運(yùn)行,鏈上的所有節(jié)點(diǎn)須共同維護(hù),保證鏈在合約在,具有相對(duì)永久運(yùn)行性。

        同時(shí),智能合約支持SQL,利用SQL語(yǔ)句實(shí)現(xiàn)信息匹配與數(shù)據(jù)索引功能,當(dāng)數(shù)據(jù)使用者在特定情況下需要某些特定的科學(xué)數(shù)據(jù)以滿足需求時(shí),使用邏輯表達(dá)式或函數(shù)將需求表達(dá)出來,并提醒智能合約發(fā)布需求信息,根據(jù)SQL數(shù)據(jù)庫(kù)中已登記存儲(chǔ)的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)篩選,逐一匹配:若數(shù)據(jù)庫(kù)中未存在所需數(shù)據(jù)時(shí),則對(duì)外公布需求信息,同時(shí)反饋至數(shù)據(jù)使用者進(jìn)行需求信息完善。實(shí)現(xiàn)數(shù)據(jù)使用者對(duì)需求科學(xué)數(shù)據(jù)概要的在線查詢,幫助鏈上對(duì)數(shù)據(jù)庫(kù)中存儲(chǔ)信息的索引調(diào)用,加速與目標(biāo)科學(xué)數(shù)據(jù)貢獻(xiàn)者的匹配進(jìn)度,使得共享過程更具效率。

        4.3萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化

        萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表不僅作為一種表,同時(shí)也作為一門新興理論——獨(dú)立數(shù)據(jù)庫(kù)理論,在關(guān)系數(shù)據(jù)庫(kù)理論基礎(chǔ)上進(jìn)行革新,使存儲(chǔ)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)完全相同,且保證了數(shù)據(jù)完整性。目前可采用關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)ORACAL、DB2、SQL Server、Access等來實(shí)現(xiàn)“萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表”。區(qū)別于關(guān)系數(shù)據(jù)庫(kù),獨(dú)立數(shù)據(jù)庫(kù)中的數(shù)據(jù)要求可以獨(dú)立地、完整地表達(dá)其含義。下面以征信、醫(yī)療領(lǐng)域產(chǎn)生并用于科學(xué)研究活動(dòng)的個(gè)人身份數(shù)據(jù)為例來說明,如表1所示,以縱向表N(或N+M)項(xiàng)記錄存儲(chǔ)一個(gè)事件的數(shù)據(jù)信息,無須借助數(shù)據(jù)庫(kù)、App或其他任何事物,保證數(shù)據(jù)特征屬性一致。其中各字段代表含義,ID為各項(xiàng)記錄獨(dú)有編號(hào):事物代號(hào)為一個(gè)獨(dú)立事件獨(dú)有編碼,數(shù)據(jù)庫(kù)中完整數(shù)據(jù)為記錄,性質(zhì)名稱表述完整數(shù)據(jù)為事件,一個(gè)事件的信息由若干條擁有相同事物代號(hào)的記錄組成:事物屬性即事物的特征:事物屬性值、超長(zhǎng)屬性值為事物的特征值:?jiǎn)挝淮硎挛飳傩灾档膯挝唬焊郊脕泶娣艌D象、附件等不適合轉(zhuǎn)換為字符型數(shù)據(jù)的數(shù)據(jù):時(shí)間為每一個(gè)事物的特征寫入數(shù)據(jù)庫(kù)時(shí)的時(shí)間,由系統(tǒng)自動(dòng)生成。

        獨(dú)立數(shù)據(jù)庫(kù)相當(dāng)于一種數(shù)據(jù)優(yōu)化技術(shù),以關(guān)系數(shù)據(jù)庫(kù)理論為基礎(chǔ),在關(guān)系數(shù)據(jù)庫(kù)中亦可實(shí)現(xiàn),只需在關(guān)系數(shù)據(jù)庫(kù)中建立一張或多張結(jié)構(gòu)相同的萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表即可。不可避免地,為保證數(shù)據(jù)的完整性與標(biāo)準(zhǔn)化,其占用空間內(nèi)存相對(duì)較大,僅僅運(yùn)用區(qū)塊鏈技術(shù)無法實(shí)現(xiàn),因此將區(qū)塊鏈技術(shù)與SQL數(shù)據(jù)庫(kù)相結(jié)合也是對(duì)此的絕佳選擇。

        4.4加密算法實(shí)現(xiàn)數(shù)據(jù)“可用不可見”

        區(qū)塊鏈技術(shù)可實(shí)現(xiàn)數(shù)據(jù)安全共享流通,做到數(shù)據(jù)的“可用不可見”。數(shù)據(jù)使用者上傳至區(qū)塊鏈中的數(shù)據(jù)篩選條件一般較為簡(jiǎn)單,直接上傳該條件很容易造成數(shù)據(jù)參與者雙方的隱私泄露。如攻擊者獲取了這些條件的內(nèi)容,很容易就可以推斷出使用者的數(shù)據(jù)需求,從而可能推斷出使用者經(jīng)常出沒的領(lǐng)域范圍,一旦發(fā)生數(shù)據(jù)共享,那么雙方的數(shù)據(jù)很可能會(huì)遭受劫持。因此,為了保證共享參與者的隱私和利益,還應(yīng)在模型中對(duì)篩選條件進(jìn)行函數(shù)加密,且同時(shí)進(jìn)行需求匹配?;诠_\(yùn)算與非對(duì)稱性同態(tài)加密算法,上傳數(shù)據(jù)以密文發(fā)送至SQL數(shù)據(jù)庫(kù)存儲(chǔ)日志記錄添加到智能合約中,同步記錄源至區(qū)塊鏈,智能合約將數(shù)據(jù)密文自動(dòng)上傳至SQL數(shù)據(jù)庫(kù)并反饋對(duì)應(yīng)數(shù)據(jù)密文檔案哈希值生成Token,在區(qū)塊鏈進(jìn)行留痕記錄。隨后,數(shù)據(jù)使用者需使用數(shù)據(jù)貢獻(xiàn)者頒發(fā)的Token,用其作為授權(quán)令牌在SQL數(shù)據(jù)庫(kù)中獲取對(duì)應(yīng)科學(xué)數(shù)據(jù)密文,對(duì)該部分?jǐn)?shù)據(jù)進(jìn)行解碼,獲取所需科學(xué)數(shù)據(jù)信息處理結(jié)果,實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)傳輸。

        上述情境在傳統(tǒng)共享模式中很難實(shí)現(xiàn),其自身機(jī)制導(dǎo)致數(shù)據(jù)“可用必可見”。通過區(qū)塊鏈技術(shù)中的隱私算法,分布式執(zhí)行既定邏輯運(yùn)算,使數(shù)據(jù)可在“密室”中進(jìn)行共享,但也存在存量數(shù)據(jù)利用率低、更加偏于云計(jì)算、很難支持系統(tǒng)數(shù)據(jù)訓(xùn)練學(xué)習(xí)等問題。個(gè)體用戶問數(shù)據(jù)共享時(shí),更多使用的是個(gè)人終端,增強(qiáng)了個(gè)人終端安全性,以避免數(shù)據(jù)泄露,進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)的不可見性。科學(xué)數(shù)據(jù)經(jīng)過加密算法和數(shù)據(jù)變形在一定程度上完成了脫敏,最大限度保證個(gè)人數(shù)據(jù)隱私安全,實(shí)現(xiàn)數(shù)據(jù)“可用不可見”。

        4.5共識(shí)機(jī)制控制數(shù)據(jù)調(diào)用規(guī)模

        共識(shí)機(jī)制作為區(qū)塊鏈去中心化的關(guān)鍵,無論是在公有鏈、聯(lián)盟鏈還是私有鏈中,都承擔(dān)著重要角色。當(dāng)前,數(shù)據(jù)共享環(huán)境需要具有更高數(shù)據(jù)吞吐量的可伸縮框架,以滿足對(duì)用戶應(yīng)用系統(tǒng)和流數(shù)據(jù)的處理?;趨^(qū)塊鏈的共享模式利用智能合約協(xié)定可執(zhí)行程序后,按照參與者協(xié)議中制定的條件進(jìn)行狀態(tài)轉(zhuǎn)換,在一定時(shí)間內(nèi)每個(gè)參與者按照協(xié)議狀態(tài)達(dá)成一致性。當(dāng)協(xié)議中條件發(fā)生變化時(shí),通過共識(shí)算法在全體參與者問進(jìn)行共識(shí)過程,記錄結(jié)果并重新擬定協(xié)議狀態(tài),如共享過程中僅存在兩位參與者時(shí),數(shù)據(jù)貢獻(xiàn)者具有最高話語(yǔ)權(quán)。數(shù)據(jù)貢獻(xiàn)者可通過智能合約擁有數(shù)據(jù)共享程度選擇權(quán),設(shè)置共享科學(xué)數(shù)據(jù)使用授權(quán),因此,在特定時(shí)間段內(nèi)進(jìn)行核心數(shù)據(jù)共享時(shí),數(shù)據(jù)貢獻(xiàn)者不需全盤托出,待數(shù)據(jù)使用者滿足合約中約定的使用要求后,將數(shù)據(jù)使用者所需要的部分?jǐn)?shù)據(jù)處理結(jié)果共享即可。該過程亦被稱為數(shù)據(jù)篩選,數(shù)據(jù)使用者可以將自己的科學(xué)數(shù)據(jù)需求整理成一個(gè)邏輯表達(dá)或是函數(shù)存放到區(qū)塊鏈中,以供數(shù)據(jù)參與者對(duì)號(hào)完成交互過程。因科學(xué)數(shù)據(jù)在未成規(guī)模時(shí)不具有價(jià)值性,而在有協(xié)作需要時(shí),經(jīng)過雙方或多方協(xié)商調(diào)取所需數(shù)據(jù)進(jìn)行共享,既能滿足數(shù)據(jù)使用者需求,又保證了數(shù)據(jù)貢獻(xiàn)者的數(shù)據(jù)隱私安全與個(gè)人權(quán)益,從而提高協(xié)同效率。

        5總結(jié)和展望

        大數(shù)據(jù)時(shí)代,快捷有效的大數(shù)據(jù)挖掘與交叉識(shí)別技術(shù)可以在個(gè)人科學(xué)數(shù)據(jù)共享過程中抓取大量的個(gè)人隱私數(shù)據(jù)。然而,大多共享參與主體缺乏隱私保護(hù)自覺,對(duì)共享平臺(tái)的傳播性質(zhì)缺乏正確的認(rèn)知,如何在保證個(gè)人隱私與數(shù)據(jù)安全的同時(shí),有效促進(jìn)科學(xué)數(shù)據(jù)共享是一個(gè)值得研究但頗具挑戰(zhàn)性的問題。針對(duì)傳統(tǒng)中心化科學(xué)數(shù)據(jù)共享模式存在的問題,本研究借助區(qū)塊鏈技術(shù)、sQL數(shù)據(jù)庫(kù)和萬(wàn)能數(shù)據(jù)結(jié)構(gòu)表,構(gòu)建基于區(qū)塊鏈的個(gè)人科學(xué)數(shù)據(jù)共享模式架構(gòu)模型,介紹該模式的流程與特點(diǎn),并對(duì)其實(shí)現(xiàn)的關(guān)鍵技術(shù)與機(jī)制進(jìn)行了具體深入的論述,對(duì)于促進(jìn)個(gè)人科學(xué)數(shù)據(jù)共享實(shí)踐與后續(xù)深入研究具有一定的參考意義。

        當(dāng)前,個(gè)人科學(xué)數(shù)據(jù)共享備受推崇,也飽受爭(zhēng)議。盡管鼓勵(lì)性或強(qiáng)制性數(shù)據(jù)共享政策相繼出臺(tái),但生產(chǎn)或擁有數(shù)據(jù)的個(gè)體科研人員(團(tuán)隊(duì))的認(rèn)知、意愿和行為依然是共享科學(xué)數(shù)據(jù)的關(guān)鍵所在??蒲腥藛T需要認(rèn)識(shí)到科學(xué)數(shù)據(jù)共享的重要價(jià)值,在高自由性數(shù)據(jù)生態(tài)鏈下,明確界定自身需求,盡量降低共享成本,提高共享效率,從而更好地享受數(shù)據(jù)共享帶來的“紅利”。同時(shí),區(qū)塊鏈一旦交易,其記錄不可撤銷,訪問控制權(quán)限更新延遲,還應(yīng)熟知模式平臺(tái)下操縱實(shí)現(xiàn)功能,界定自身持有的敏感數(shù)據(jù),簽訂權(quán)責(zé)明晰的合同,以保護(hù)數(shù)據(jù)安全和主體權(quán)益。最后,日志公開性易產(chǎn)生安全風(fēng)險(xiǎn),應(yīng)加強(qiáng)防范意識(shí),保持良好的自我感知,維護(hù)本地?cái)?shù)據(jù)終端,警惕網(wǎng)絡(luò)挾持與駭客攻擊。

        相比中心化科學(xué)數(shù)據(jù)共享模式,本研究提出的分布式科學(xué)數(shù)據(jù)共享模式具備更強(qiáng)的隱私保護(hù)能力和數(shù)據(jù)流通能力,具有巨大的研究前景和發(fā)展前景。但本研究模型僅利用區(qū)塊鏈技術(shù)進(jìn)行初步搭建架構(gòu),具體技術(shù)實(shí)現(xiàn)及共享科學(xué)數(shù)據(jù)的隱私分級(jí)、總體與個(gè)人數(shù)據(jù)的結(jié)合、潛在關(guān)聯(lián)數(shù)據(jù)的發(fā)現(xiàn),需要未來研究攻關(guān)突破。本研究仍處于理論探索階段,個(gè)人科學(xué)數(shù)據(jù)共享還需要結(jié)合具體學(xué)科領(lǐng)域、數(shù)據(jù)內(nèi)容與類型、元數(shù)據(jù)標(biāo)準(zhǔn)、個(gè)人共享意愿等,模式是否真正適合,有待于后續(xù)研究進(jìn)行仿真或未來實(shí)踐檢驗(yàn)。此外,未來研究可積極深入探索區(qū)塊鏈技術(shù)在個(gè)人科學(xué)數(shù)據(jù)共享中的可應(yīng)用場(chǎng)景,精確把握用戶數(shù)據(jù)需求,以實(shí)現(xiàn)區(qū)塊鏈技術(shù)與實(shí)踐的最佳結(jié)合。

        (責(zé)任編輯:孫國(guó)雷)

        猜你喜歡
        數(shù)據(jù)庫(kù)科學(xué)
        點(diǎn)擊科學(xué)
        點(diǎn)擊科學(xué)
        科學(xué)大爆炸
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        科學(xué)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        科學(xué)拔牙
        免费视频无打码一区二区三区| 国产精品对白刺激久久久| 成熟丰满熟妇高潮xxxxx| 国产在线高清视频| 久久久诱惑一区二区三区| 97激情在线视频五月天视频| 青青草高中生在线视频| 亚洲色欲色欲www在线观看| 国产精品密播放国产免费看| 亚洲国产精品亚洲高清| 国产成人高清在线观看视频| 国产乱了真实在线观看| 97精品依人久久久大香线蕉97| 日韩久久久黄色一级av| 亚洲av影片一区二区三区| 久久综合亚洲鲁鲁五月天| 熟女无套高潮内谢吼叫免费| 人人妻人人澡人人爽人人精品97| 午夜一级在线| 久久亚洲一级av一片| 国产精品一区av在线| 蜜桃日本免费看mv免费版 | 老男人久久青草AV高清| 天天澡天天揉揉AV无码人妻斩| 琪琪av一区二区三区| 久久精品国产亚洲av高清三区| 国产区精品一区二区不卡中文| 激情 人妻 制服 丝袜| 动漫av纯肉无码av在线播放| 精品国产一区二区三区香| 99久久精品午夜一区二区| 国产精品欧美日韩在线一区| 欧美在线Aⅴ性色| 国产一区资源在线播放| 国产女人好紧好爽| 精品一区二区三区无码免费视频| 日韩久久久黄色一级av| av在线不卡免费中文网| 久久久亚洲av波多野结衣| 香港日本三级亚洲三级| 日韩精品一区二区三区四区|