亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        醫(yī)學(xué)大數(shù)據(jù)長期保存系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

        2020-01-06 08:01:10
        關(guān)鍵詞:對(duì)象醫(yī)學(xué)數(shù)字

        在數(shù)據(jù)驅(qū)動(dòng)科研的范式下,醫(yī)學(xué)大數(shù)據(jù)作為一種戰(zhàn)略性資源,對(duì)于醫(yī)學(xué)科技創(chuàng)新具有重要的支撐作用。醫(yī)學(xué)大數(shù)據(jù)包括生物醫(yī)學(xué)科技文獻(xiàn)數(shù)據(jù)、醫(yī)療保險(xiǎn)數(shù)據(jù)、臨床電子病歷以及醫(yī)療論壇數(shù)據(jù)等。醫(yī)學(xué)科研與實(shí)踐活動(dòng)以及各項(xiàng)應(yīng)用平臺(tái)建設(shè)產(chǎn)出的大量醫(yī)學(xué)科研數(shù)據(jù),在產(chǎn)生經(jīng)濟(jì)和社會(huì)效益的同時(shí),涉及主題極為廣泛,具有深度分析、挖掘和再利用的大數(shù)據(jù)研究價(jià)值。然而,隨著信息技術(shù)的飛速發(fā)展以及新型媒介和載體的快速革新,如何長期保存這些具有再利用價(jià)值的數(shù)據(jù),面臨著數(shù)據(jù)真實(shí)性、完整性、可獲得性以及長期可解釋性的挑戰(zhàn)[1-5]。

        醫(yī)學(xué)大數(shù)據(jù)除表現(xiàn)在數(shù)量龐大、類型多樣、增長快速以及具有挖掘價(jià)值的大數(shù)據(jù)特征[6]外,還表現(xiàn)出特有的復(fù)雜性[7-10]。首先,鑒于數(shù)據(jù)的敏感性和共享機(jī)制的缺乏,醫(yī)學(xué)數(shù)據(jù)難以獲??;其次,由于儀器設(shè)備專業(yè)化和精細(xì)度等因素,醫(yī)學(xué)數(shù)據(jù)的獲取代價(jià)可能較為昂貴;第三,基于學(xué)科的嚴(yán)謹(jǐn)性,在數(shù)據(jù)分析和結(jié)果解釋時(shí),醫(yī)學(xué)領(lǐng)域知識(shí)一般占據(jù)主導(dǎo)地位。此外,醫(yī)學(xué)數(shù)據(jù)還表現(xiàn)出一定程度上的不可再現(xiàn)性特征。

        面對(duì)大規(guī)模、多樣化和動(dòng)態(tài)變化的醫(yī)學(xué)大數(shù)據(jù),如何最大限度地保證數(shù)據(jù)的真實(shí)性、完整性、可靠性以及長期可解釋性,建立可持續(xù)發(fā)展的醫(yī)學(xué)大數(shù)據(jù)長期保存系統(tǒng)平臺(tái),是當(dāng)前數(shù)字資源保障體系建設(shè)中面臨的重要課題。

        1 長期保存

        開放存檔信息系統(tǒng)參考模型[11](Reference model for an open archival information system,OAIS)為長期保存提供了基礎(chǔ)性框架。其中“開放”一詞表示該模型的相關(guān)建議書和標(biāo)準(zhǔn)的形成具有開放性,并非表示對(duì)存檔內(nèi)容的訪問不受限制,保存的信息通常采用“暗保存(Dark Archival)”模式[12-13],即只有當(dāng)特定的事件觸發(fā)時(shí),才啟用對(duì)存檔信息的訪問。該模型最早由美國國家航空和航天局(National Aeronautics and Space Administration,NASA)和美國空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì)(Consultative Committee for Space Data Systems,CCSDS)于1999年提出,經(jīng)過不斷的發(fā)展與完善,已經(jīng)成為數(shù)字保存系統(tǒng)建設(shè)普遍遵循的重要標(biāo)準(zhǔn)——ISO 14721:2012。

        根據(jù)OAIS的定義,長期保存是一項(xiàng)對(duì)保存內(nèi)容進(jìn)行長期管理和維護(hù)的行為,旨在確保保存內(nèi)容可以被特定社區(qū)所理解,并提供支持其真實(shí)性證據(jù),即在足夠長時(shí)間內(nèi),技術(shù)的變革、新的媒體和數(shù)據(jù)格式,以及特定用戶社區(qū)的變化等都有可能對(duì)保存的信息產(chǎn)生一定的影響。因此,長期保存不僅意味著是用于安全管理備份數(shù)據(jù),而更強(qiáng)調(diào)對(duì)數(shù)字內(nèi)容的生命周期維護(hù),包括數(shù)據(jù)審核、數(shù)據(jù)關(guān)聯(lián)以及數(shù)據(jù)監(jiān)控等行為。其中對(duì)數(shù)據(jù)進(jìn)行審核是為了確保其完整性,與適當(dāng)?shù)脑獢?shù)據(jù)關(guān)聯(lián)是為了確保其可發(fā)現(xiàn)性,對(duì)保存內(nèi)容進(jìn)行訪問控制監(jiān)控是為了滿足相關(guān)的隱私許可以及知識(shí)產(chǎn)權(quán)限制等要求。

        本文基于醫(yī)學(xué)領(lǐng)域資源建設(shè)和信息服務(wù)的發(fā)展需求,結(jié)合大數(shù)據(jù)時(shí)代資源保存對(duì)象由傳統(tǒng)紙質(zhì)文獻(xiàn)資源向多類型數(shù)據(jù)資源轉(zhuǎn)移的新形勢(shì),以健全醫(yī)學(xué)信息保障及服務(wù)能力為宗旨,圍繞數(shù)字資源保存的概念化、創(chuàng)建/接收數(shù)據(jù)、評(píng)估和選擇、攝入、保存、存儲(chǔ)、訪問利用/重用以及轉(zhuǎn)換各生命周期階段,建設(shè)醫(yī)學(xué)大數(shù)據(jù)長期保存系統(tǒng)(Long-term PREServation System for Medical big data,MedPRES),以保證醫(yī)學(xué)數(shù)據(jù)的真實(shí)性、完整性、可獲得性及長期可解釋性,為重要醫(yī)學(xué)資源的長期保存和利用提供有力保障。

        2 保存方案

        2.1 數(shù)據(jù)流程

        在長期保存系統(tǒng)中,保存內(nèi)容以信息包的形式進(jìn)行交互,包括提交信息包(Submission Information Package,SIP)、存檔信息包(Archival Information Package,AIP)和分發(fā)信息包(Dissemination Information Package,DIP)。保存信息在長期保存過程中的數(shù)據(jù)流向見圖1。

        圖1 長期保存系統(tǒng)中的數(shù)據(jù)流向

        圖1中,數(shù)據(jù)提交者向長期保存系統(tǒng)提交將要保存的內(nèi)容,SIP需要包含數(shù)據(jù)及內(nèi)容信息,以確保保存系統(tǒng)可以維護(hù)保存內(nèi)容,數(shù)據(jù)使用者可以通過保存系統(tǒng)訪問、理解和使用保存內(nèi)容。

        保存系統(tǒng)接收來自數(shù)據(jù)提交者的SIP,通過數(shù)據(jù)攝入功能實(shí)體將SIP轉(zhuǎn)換為適合于數(shù)據(jù)存檔和數(shù)據(jù)管理所需的一組AIP,并對(duì)接收的信息對(duì)象進(jìn)行分類,確定每個(gè)對(duì)象的所屬集合,完成AIP存檔后創(chuàng)建消息以更新集合描述。

        數(shù)據(jù)存檔功能實(shí)體接收攝入流程生成的AIP,并將其添加到永久保存庫。數(shù)據(jù)管理功能實(shí)體采用數(shù)據(jù)攝入階段生成的包描述,并擴(kuò)展現(xiàn)有的集合描述。數(shù)據(jù)在存檔和管理過程中需要進(jìn)行媒介更新、糾錯(cuò)以及數(shù)據(jù)庫維護(hù)等操作,以防技術(shù)、媒介、數(shù)據(jù)格式和用戶群體等隨著時(shí)間推移所產(chǎn)生的變化而導(dǎo)致信息丟失。

        數(shù)據(jù)訪問功能實(shí)體根據(jù)數(shù)據(jù)使用者的數(shù)據(jù)訪問請(qǐng)求,與數(shù)據(jù)存檔和數(shù)據(jù)管理相互作用,交互DIP所對(duì)應(yīng)的AIP及其相關(guān)信息包描述。數(shù)據(jù)存檔和數(shù)據(jù)管理在臨時(shí)存儲(chǔ)中創(chuàng)建請(qǐng)求對(duì)象的副本,數(shù)據(jù)訪問將該組AIP和關(guān)聯(lián)的包描述轉(zhuǎn)換為一組DIP,并將其存儲(chǔ)于物理分發(fā)媒介,以在數(shù)據(jù)分發(fā)會(huì)話中交付給數(shù)據(jù)使用者。

        2.2 信息模型

        長期保存的主要目標(biāo)是在不確定的時(shí)間內(nèi)保存特定信息。為了保存該信息對(duì)象,長期保存系統(tǒng)必須充分理解數(shù)據(jù)對(duì)象及其關(guān)聯(lián)的呈現(xiàn)信息。OAIS參考模型強(qiáng)調(diào)對(duì)信息內(nèi)容的保存,信息模型是長期保存的關(guān)鍵。根據(jù)OAIS,存檔信息包的數(shù)據(jù)模型[11]如圖2 所示。

        圖2 存檔信息包數(shù)據(jù)模型

        信息包包含內(nèi)容信息和保存描述信息。內(nèi)容信息是保存的目標(biāo)信息,由內(nèi)容數(shù)據(jù)對(duì)象及其相關(guān)的呈現(xiàn)信息組成,以使內(nèi)容數(shù)據(jù)對(duì)象可被指定團(tuán)體理解;保存描述信息有指引信息、起源信息、環(huán)境信息、不變性信息以及訪問權(quán)限信息5種類型。其中,指引信息提供標(biāo)識(shí)符,以標(biāo)識(shí)內(nèi)容信息;起源信息描述內(nèi)容信息的來源,提供對(duì)內(nèi)容信息的審核跟蹤,為內(nèi)容信息的真實(shí)性和可靠性提供依據(jù);環(huán)境信息記錄創(chuàng)建內(nèi)容信息的原因及其與環(huán)境中的其他內(nèi)容信息對(duì)象之間的關(guān)系;不變性信息提供對(duì)數(shù)據(jù)完整性的檢查與驗(yàn)證,用于追溯內(nèi)容信息對(duì)象的更改記錄;訪問權(quán)限信息提供對(duì)保存、分發(fā)和使用內(nèi)容信息的權(quán)限許可范圍。

        2.3 關(guān)聯(lián)整合

        對(duì)多源異構(gòu)數(shù)字對(duì)象進(jìn)行關(guān)聯(lián)整合的框架如圖3所示。由于采集接收的數(shù)據(jù)信息沒有呈現(xiàn)信息和保存描述信息,因此在攝入階段必須對(duì)SIP進(jìn)行處理,以確保收集到保存數(shù)據(jù)對(duì)象的長期可訪問性和可用性信息。提取與數(shù)據(jù)對(duì)象相關(guān)的元數(shù)據(jù),并將所有內(nèi)容封裝于AIP中進(jìn)行存檔;基于捕獲的數(shù)據(jù)對(duì)象元數(shù)據(jù)表示,將其編碼為RDF三元組并存儲(chǔ)于索引中;以面向應(yīng)用的方式對(duì)保存知識(shí)和特定領(lǐng)域的對(duì)象格式和概念進(jìn)行建模,實(shí)現(xiàn)對(duì)多來源數(shù)字對(duì)象元數(shù)據(jù)的高效管理;保存數(shù)據(jù)對(duì)象以DIP的形式提供訪問與利用服務(wù),并通過圖形數(shù)據(jù)庫存儲(chǔ),為知識(shí)推理與挖掘以及圖數(shù)據(jù)復(fù)雜查詢提供支撐。

        圖3 關(guān)聯(lián)整合框架

        3 系統(tǒng)設(shè)計(jì)

        3.1 總體架構(gòu)

        為實(shí)現(xiàn)醫(yī)學(xué)大數(shù)據(jù)的長期保存,MedPRES按照目前國際公認(rèn)的標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì)。MedPRES模型的定義遵循ISO 14721:2012——開放存檔信息系統(tǒng)[14],數(shù)字倉儲(chǔ)的可信認(rèn)證遵循ISO 16363:2012——可信賴的數(shù)字倉儲(chǔ)審計(jì)與認(rèn)證標(biāo)準(zhǔn)(Audit and Certification of Trustworthy Digital Repositories)[15]。MedPRES總體架構(gòu)如圖4所示,自底向上包括基礎(chǔ)設(shè)施層、數(shù)據(jù)層、存儲(chǔ)層、應(yīng)用層以及服務(wù)層。

        基礎(chǔ)設(shè)施層:采用虛擬化技術(shù)合理利用與分配各類計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)等資源,提高資源的利用率和應(yīng)用的可靠性;通過云平臺(tái)與底層虛擬化平臺(tái)協(xié)同工作,實(shí)現(xiàn)計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)基礎(chǔ)架構(gòu)服務(wù)的抽象化、池化和自動(dòng)化。

        數(shù)據(jù)層:甄選具有長期保存價(jià)值的醫(yī)學(xué)科學(xué)數(shù)據(jù)、專業(yè)數(shù)據(jù)庫以及網(wǎng)頁數(shù)據(jù)等,根據(jù)不同的數(shù)據(jù)類型確定合適的資源獲取與采集方式,實(shí)現(xiàn)多來源異構(gòu)海量醫(yī)學(xué)數(shù)據(jù)的全面采集與分類處理。

        存儲(chǔ)層:基于分布式存儲(chǔ)實(shí)現(xiàn)對(duì)醫(yī)學(xué)大數(shù)據(jù)的保存,包括對(duì)元數(shù)據(jù)存儲(chǔ)、業(yè)務(wù)數(shù)據(jù)存儲(chǔ)和文件存儲(chǔ)。其中,元數(shù)據(jù)存儲(chǔ)至Fedora,數(shù)據(jù)索引存儲(chǔ)至ElasticSearch,業(yè)務(wù)數(shù)據(jù)支持關(guān)系數(shù)據(jù)庫存儲(chǔ)。

        應(yīng)用層:MedPRES的采集、接收、攝入、管理等各個(gè)業(yè)務(wù)模塊基于微服務(wù)理念進(jìn)行設(shè)計(jì),并實(shí)現(xiàn)對(duì)MD5碼檢測(cè)、解壓縮測(cè)試、病毒檢查、數(shù)量檢查、格式檢查和數(shù)據(jù)備份等的插件化管理。

        服務(wù)層:系統(tǒng)基于B/S模式開發(fā),提供標(biāo)準(zhǔn)的數(shù)據(jù)訪問與交互接口,為數(shù)據(jù)集成和服務(wù)提供支持。

        圖4 MedPRES總體架構(gòu)

        3.2 關(guān)鍵技術(shù)

        3.2.1 工作流

        長期保存包括采集、接收、攝入、存儲(chǔ)、管理、訪問等環(huán)節(jié),每個(gè)功能環(huán)節(jié)又包含一系列的具體處理流程,如信息包的生成與檢查、病毒檢測(cè)、完整性檢查等。

        工作流技術(shù)為醫(yī)學(xué)大數(shù)據(jù)長期保存的復(fù)雜流程管理提供了自動(dòng)化解決方案。長期保存需要確保保存資源在時(shí)間、環(huán)境、技術(shù)、法律法規(guī)等因素變化下的長期可用性。通過工作流管理工具,可根據(jù)保存生命周期和保存規(guī)劃,預(yù)先將保存過程中的各項(xiàng)任務(wù)配置為相應(yīng)的工作流,并通過對(duì)保存系統(tǒng)內(nèi)外部事件的實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)變化發(fā)生時(shí)的流程重配置。

        鑒于在數(shù)據(jù)持久化、流程設(shè)計(jì)、原生支持和數(shù)據(jù)存取效率等方面的優(yōu)勢(shì),MedPRES基于開源引擎Activiti實(shí)現(xiàn)對(duì)長期保存各個(gè)環(huán)節(jié)工作流程的靈活配置,通過工作流與任務(wù)調(diào)度機(jī)制相結(jié)合,提供對(duì)海量數(shù)據(jù)分布式任務(wù)的高效處理。

        3.2.2 數(shù)字倉儲(chǔ)

        MedPRES底層元數(shù)據(jù)倉儲(chǔ)結(jié)構(gòu)如圖5所示?;贏ctiviti定義的工作流實(shí)現(xiàn)對(duì)提交信息包SIP的檢查和處理,數(shù)據(jù)最終存儲(chǔ)于Fedora和ElasticSearch中。其中,F(xiàn)edora作為靈活的可擴(kuò)展數(shù)字對(duì)象倉儲(chǔ)架構(gòu),可提供元數(shù)據(jù)多版本管理策略;采用的網(wǎng)絡(luò)資源描述框架(Resource Description Framework,RDF)管理數(shù)字資源,既可實(shí)現(xiàn)關(guān)聯(lián)發(fā)現(xiàn)和語義檢索服務(wù)又支持原始文件存儲(chǔ);并可根據(jù)不同業(yè)務(wù)需求封裝為長期保存系統(tǒng)所需的存檔信息包AIP;ElasticSearch基于元數(shù)據(jù)提供索引服務(wù),支持分布式部署和多種檢索策略配置,滿足保存管理和公共服務(wù)中的多種檢索需求。

        圖5 MedPRES數(shù)字倉儲(chǔ)

        3.2.3 微服務(wù)

        基于對(duì)資源和應(yīng)用快速靈活部署模式的考慮,MedPRES采用微服務(wù)管理支持快速解耦和集成,在不對(duì)現(xiàn)有服務(wù)造成影響的條件下,支持分布式部署和動(dòng)態(tài)容量擴(kuò)展。

        為了滿足各種應(yīng)用場景,MedPRES提供的微服務(wù)包括應(yīng)用微服務(wù)、集成微服務(wù)和數(shù)據(jù)微服務(wù)。其中,應(yīng)用微服務(wù)以已構(gòu)建的系統(tǒng)為基準(zhǔn),實(shí)現(xiàn)應(yīng)用系統(tǒng)/模塊微服務(wù)化,單個(gè)系統(tǒng)或模塊可獨(dú)立運(yùn)行,也支持系統(tǒng)和模塊間數(shù)據(jù)通信;集成微服務(wù)實(shí)現(xiàn)系統(tǒng)之間的集成,包括內(nèi)部系統(tǒng)和外部系統(tǒng),集成框架可提供組件同步、異步通信所需要的基礎(chǔ)能力,系統(tǒng)之間的交互只需遵循約定的REST接口和消息定義;數(shù)據(jù)微服務(wù)提供數(shù)據(jù)檢索與瀏覽接口、數(shù)據(jù)分面匯總接口和數(shù)據(jù)統(tǒng)計(jì)分析匯總接口,支持權(quán)限分配與控制,同時(shí)支持?jǐn)?shù)據(jù)傳輸加密需求,為數(shù)據(jù)的安全性提供保障。

        3.2.4 云存儲(chǔ)

        長期保存面臨的一個(gè)重要挑戰(zhàn)是成本代價(jià)高,通過利用云計(jì)算和虛擬化技術(shù),可提供經(jīng)濟(jì)上可行的長期保存解決方案。此外,云存儲(chǔ)還具有靈活性和動(dòng)態(tài)可擴(kuò)展性,可為大數(shù)據(jù)環(huán)境下的數(shù)字資源長期保存提供海量存儲(chǔ)、協(xié)同保存、高效備份和實(shí)時(shí)遷移等解決方案。

        MedPRES采用基于云的保存感知存儲(chǔ)服務(wù)。其優(yōu)勢(shì)在于:通過將與保存相關(guān)的功能卸載到存儲(chǔ)系統(tǒng),可降低數(shù)據(jù)損壞或丟失的可能性,從而使數(shù)字保存系統(tǒng)更為健壯;基于云的長期保存方案支持對(duì)資源的邏輯保存,從而使云中對(duì)象物理位置的變化不會(huì)影響用戶對(duì)數(shù)據(jù)的訪問;通過基于云的虛擬設(shè)備保存數(shù)據(jù)內(nèi)容和呈現(xiàn)數(shù)據(jù)所需的特定軟件,還可增強(qiáng)保存內(nèi)容在未來的可理解性。

        單個(gè)云存儲(chǔ)模式具有一定的應(yīng)用局限性并存在安全隱患。隨著云技術(shù)的發(fā)展,多云存儲(chǔ)可為大數(shù)據(jù)環(huán)境下各種應(yīng)用提供新的服務(wù)模式。醫(yī)學(xué)大數(shù)據(jù)長期保存可同時(shí)利用具有不同功能的多個(gè)云實(shí)現(xiàn)資源在更大范圍的動(dòng)態(tài)分配、靈活調(diào)度和跨域共享,提高資源的整體利用率。此外,通過對(duì)數(shù)據(jù)管理功能的靈活配置,基于多云存儲(chǔ)模式還可應(yīng)對(duì)多類型數(shù)字資源隨時(shí)間推移不同階段的長期保存需求。

        4 實(shí)現(xiàn)效果

        面向大數(shù)據(jù)時(shí)代的醫(yī)學(xué)資源建設(shè)和信息服務(wù)的發(fā)展需求,MedPRES圍繞數(shù)字資源保存生命周期,提供從數(shù)據(jù)采集、接收、攝入到保存管理、審計(jì)以及服務(wù)的一整套解決方案?;趯?duì)醫(yī)學(xué)大數(shù)據(jù)長期保存基礎(chǔ)設(shè)施條件的建設(shè),MedPRES支持PB級(jí)數(shù)據(jù)的長期保存服務(wù)。系統(tǒng)界面如圖6所示。

        針對(duì)已獲取長期保存權(quán)的Karger和Wiley 2種回溯電子圖書,系統(tǒng)可實(shí)現(xiàn)對(duì)醫(yī)學(xué)電子出版物的長期保存,其中Karger電子書1 827本,Wiley電子書2 239本。此外,MedPRES支持對(duì)軟件系統(tǒng)類資源的保存。在長期的醫(yī)學(xué)科研和實(shí)踐活動(dòng)中,建設(shè)了各類醫(yī)療健康相關(guān)的信息系統(tǒng)和業(yè)務(wù)平臺(tái),隨著時(shí)間的推移給操作系統(tǒng)的兼容性帶來了挑戰(zhàn),系統(tǒng)級(jí)長期保存不僅需要保存系統(tǒng)本身以及系統(tǒng)中的數(shù)據(jù),還需要系統(tǒng)所基于的操作系統(tǒng)。完整地保存這些系統(tǒng)平臺(tái)及其數(shù)據(jù)對(duì)長期利用這些數(shù)據(jù)具有重要的戰(zhàn)略意義。例如西太平洋地區(qū)醫(yī)學(xué)索引(Western Pacific Region Index Medicus,WPRIM)系統(tǒng)目前已收集來自世界衛(wèi)生組織西太平洋區(qū)域13個(gè)成員國的750 651條生物醫(yī)學(xué)題錄數(shù)據(jù),通過在MedPRES中上載操作系統(tǒng)、系統(tǒng)運(yùn)行所需要的軟件,對(duì)WPRIM所需要的環(huán)境進(jìn)行配置以及所需的數(shù)據(jù)與軟件的關(guān)聯(lián)關(guān)系的配置,實(shí)現(xiàn)了對(duì)WPRIM的保存服務(wù)。采用暗存檔模式,MedPRES中保存的系統(tǒng)獨(dú)立于現(xiàn)有業(yè)務(wù)系統(tǒng),僅在觸發(fā)事件發(fā)生時(shí)啟用,因此該服務(wù)不占用過多的計(jì)算和存儲(chǔ)資源。系統(tǒng)在研發(fā)過程中產(chǎn)生了一系列軟件工具,如內(nèi)容檢查工具、AIP數(shù)據(jù)包生成工具、上載工具等,MedPRES已實(shí)現(xiàn)對(duì)這些軟件工具的長期保存。

        圖6 MedPRES系統(tǒng)界面

        MedPRES系統(tǒng)支持工作流的靈活配置和調(diào)用。信息包的核心處理工具以組件形式提供服務(wù),以便于各保存機(jī)構(gòu)根據(jù)切身實(shí)際情況靈活組配所需的工作流。如根據(jù)可信賴的數(shù)字倉儲(chǔ)審計(jì)與認(rèn)證標(biāo)準(zhǔn)ISO 16363:2012,在AIP創(chuàng)建的初期需要對(duì)其完整性和正確性進(jìn)行驗(yàn)證,并且保證AIP內(nèi)容信息的可理解性。圖7為數(shù)據(jù)攝入的一條記錄詳情。通過定義數(shù)據(jù)攝入工作流,可實(shí)現(xiàn)從數(shù)據(jù)備份、解壓縮、數(shù)據(jù)檢查、格式檢查、內(nèi)容檢查、SIP規(guī)范化檢查到AIP生成、上載以及創(chuàng)建索引的一整套流程的自動(dòng)化處理。

        5 結(jié)語

        醫(yī)學(xué)大數(shù)據(jù)長期保存是一項(xiàng)重要而又艱巨的任務(wù)。本文根據(jù)國際公認(rèn)的開放存檔信息系統(tǒng)OAIS參考模型,綜合利用工作流、數(shù)字倉儲(chǔ)、微服務(wù)及云存儲(chǔ)等關(guān)鍵技術(shù),設(shè)計(jì)與實(shí)現(xiàn)了醫(yī)學(xué)大數(shù)據(jù)長期保存系統(tǒng)MedPRES。該系統(tǒng)提供從數(shù)據(jù)采集、接收、攝入到保存管理、審計(jì)及服務(wù)的一整套解決方案,支持PB級(jí)醫(yī)學(xué)數(shù)據(jù)的長期保存服務(wù),可促進(jìn)重要醫(yī)學(xué)數(shù)據(jù)的長期保存與利用。隨著醫(yī)學(xué)大數(shù)據(jù)長期保存實(shí)踐活動(dòng)的開展,將注重對(duì)數(shù)據(jù)資源長期保存權(quán)益的獲取,并通過推進(jìn)合作保存,共同促進(jìn)數(shù)據(jù)的長期可用。

        圖7工作流實(shí)現(xiàn)效果

        猜你喜歡
        對(duì)象醫(yī)學(xué)數(shù)字
        神秘來電
        睿士(2023年2期)2023-03-02 02:01:09
        醫(yī)學(xué)的進(jìn)步
        預(yù)防新型冠狀病毒, 你必須知道的事
        祝您健康(2020年4期)2020-05-20 15:04:20
        答數(shù)字
        攻略對(duì)象的心思好難猜
        意林(2018年3期)2018-03-02 15:17:24
        基于熵的快速掃描法的FNEA初始對(duì)象的生成方法
        數(shù)字看G20
        區(qū)間對(duì)象族的可鎮(zhèn)定性分析
        醫(yī)學(xué)
        新校長(2016年5期)2016-02-26 09:29:01
        醫(yī)學(xué)、生命科學(xué)類
        人禽交 欧美 网站| 国产成av人在线观看| 被灌醉的日本人妻中文字幕| 又紧又大又爽精品一区二区| 亚洲精品久久激情国产片| 国产精品无码aⅴ嫩草| 护士奶头又白又大又好摸视频| 国产国拍亚洲精品永久69| 亚洲精品中文字幕乱码3| 风韵丰满熟妇啪啪区老老熟妇| 国产av无码专区亚洲awww| 亚洲AV日韩AV无码A一区| 国产成人精品自拍在线观看| 亚洲色图三级在线观看| 国产三区在线成人av| 国产91成人精品亚洲精品| 亚洲国产精一区二区三区性色| 国产免费观看久久黄av麻豆| 免费观看a级毛片| 午夜成人无码福利免费视频| 中文字幕巨乱亚洲| 最新日本久久中文字幕| 亚洲第一网站免费视频| 蜜桃日本免费看mv免费版| 日韩无码无播放器视频| 免费国产在线精品三区| 风韵人妻丰满熟妇老熟女视频| 亚欧美日韩香蕉在线播放视频| 水蜜桃久久| 日韩精品免费一区二区中文字幕| 一区二区三区人妻少妇| 极品新婚夜少妇真紧| 久久水蜜桃亚洲av无码精品麻豆 | 白色白在线观看免费2| 丰满少妇按摩被扣逼高潮| 婷婷五月六月综合缴情| 亚洲AV成人无码久久精品四虎| 伊人影院成人在线观看| 人与人性恔配视频免费| 真人二十三式性视频(动)| 国产精品亚洲av网站|