亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        醫(yī)療健康大數(shù)據(jù):概念、特點、平臺及數(shù)據(jù)集成問題研究

        2018-12-06 09:27:16邢丹姚俊明
        物聯(lián)網(wǎng)技術 2018年8期
        關鍵詞:數(shù)據(jù)集成大數(shù)據(jù)平臺分布式計算

        邢丹 姚俊明

        摘 要:從狹義和廣義角度定義了醫(yī)療健康大數(shù)據(jù),分析并總結(jié)了醫(yī)療健康大數(shù)據(jù)區(qū)別于傳統(tǒng)大數(shù)據(jù)的海量性、復雜性、精確性、安全性、異構(gòu)性及封閉性的特點。同時探討了構(gòu)建醫(yī)療健康大數(shù)據(jù)平臺的相關問題,架構(gòu)技術及其關鍵問題、平臺構(gòu)建的兼容問題及其技術路線問題,最后分析了醫(yī)療大數(shù)據(jù)的數(shù)據(jù)集成所考慮的問題、難點及現(xiàn)有的集成方法。

        關鍵詞:醫(yī)療健康;大數(shù)據(jù);大數(shù)據(jù)平臺;數(shù)據(jù)集成;分布式計算

        中圖分類號:TP274 文獻標識碼:A 文章編號:2095-1302(2018)08-0-03

        0 引 言

        目前,我國雖已具有多年醫(yī)療信息化建設的歷史,但是這些數(shù)據(jù)庫信息孤立、分散、多元、異構(gòu)、類型、標準不一,大多應用于單獨醫(yī)院或較小范圍內(nèi)的醫(yī)院,沒有形成大范圍多學科、多標準、多類型、多模式的協(xié)同系統(tǒng)。與此同時,近年來國家提出打造以醫(yī)院、社區(qū)、平臺為主的“三位一體、相互協(xié)同”的綜合服務新模式,醫(yī)療數(shù)據(jù)的產(chǎn)生,從醫(yī)院管理系統(tǒng)的關系型數(shù)據(jù)轉(zhuǎn)變?yōu)橛蒖FID及無線傳感組成的半結(jié)構(gòu)化、非結(jié)構(gòu)化大數(shù)據(jù)。如何完成多數(shù)據(jù)源醫(yī)療健康大數(shù)據(jù)的無縫集成和融合,構(gòu)建全國范圍內(nèi)的醫(yī)療協(xié)同系統(tǒng),是未來面向醫(yī)療行業(yè)所采取的必經(jīng)之路。

        這項工作需在充分掌握醫(yī)療健康大數(shù)據(jù)特點的基礎上,通過構(gòu)建醫(yī)療健康大數(shù)據(jù)平臺,從數(shù)據(jù)集成問題著手,本文從不同角度探討了醫(yī)療大數(shù)據(jù)相關問題。

        1 醫(yī)療健康大數(shù)據(jù)概念及其特點

        1.1 醫(yī)療健康大數(shù)據(jù)概念

        狹義上的醫(yī)療健康大數(shù)據(jù)指的是醫(yī)院的醫(yī)療機構(gòu)產(chǎn)生的大數(shù)據(jù),這是最主要的醫(yī)療健康大數(shù)據(jù),產(chǎn)生于醫(yī)院常規(guī)臨床診治、科研和管理過程,包括各種門急診記錄、住院記錄、影像記錄、實驗室記錄、用藥記錄、手術記錄、隨訪記錄和醫(yī)保數(shù)據(jù)等[1]。

        廣義上的醫(yī)療健康大數(shù)據(jù)涵蓋來自于區(qū)域衛(wèi)生服務平臺大數(shù)據(jù)、醫(yī)學研究或疾病監(jiān)測大數(shù)據(jù)、自我量化大數(shù)據(jù)、互聯(lián)網(wǎng)上與醫(yī)學相關的網(wǎng)絡大數(shù)據(jù)、生物標本和基因測序的生物信息大數(shù)據(jù)。

        1.2 醫(yī)療大數(shù)據(jù)的特點

        醫(yī)療健康大數(shù)據(jù)除了具有傳統(tǒng)大數(shù)據(jù)的大量性、多樣性、快速性[1]之外,由于醫(yī)療行業(yè)的特殊性,使其還具有海量性、復雜性、精確性及安全性,同時由于醫(yī)療信息化建設的歷史導致了異構(gòu)性和封閉性。

        (1)海量性。2011年,美國的醫(yī)療健康系統(tǒng)數(shù)據(jù)量就達到了150 EB。醫(yī)療衛(wèi)生機構(gòu)除了傳統(tǒng)臨床和檢驗中產(chǎn)生的數(shù)據(jù)之外,隨著物聯(lián)網(wǎng)技術的發(fā)展,能夠?qū)崿F(xiàn)所有物物相連,比如便攜式醫(yī)療設備上二維碼標簽所產(chǎn)生的數(shù)據(jù),這些物品的數(shù)據(jù)相比傳統(tǒng)的數(shù)據(jù)量要大的多。加之各種健身、健康可穿戴設備的出現(xiàn),使得血壓、心率、體重、血糖、心電圖(EKG)等的監(jiān)測都變?yōu)楝F(xiàn)實和可能,信息獲取和分析的速度已從原來的按“天”計算,發(fā)展到按“小時”,按“秒”計算。此外,基因數(shù)據(jù)也是龐大的存在,一次全面的基因測序,產(chǎn)生的個人數(shù)據(jù)達到300 GB。平臺數(shù)據(jù)量巨大,通常要包含1 000萬以上個人用戶的各種醫(yī)療健康數(shù)據(jù)。

        (2)復雜性。一方面醫(yī)療領域包含了大量的醫(yī)學專業(yè)用語,僅疾病名稱就包括3萬多種,另外還有數(shù)以萬計的診斷、手術和藥物名稱,以及大量影像、醫(yī)囑等非結(jié)構(gòu)化數(shù)據(jù)[2]。由于醫(yī)療數(shù)據(jù)是不同臨床診療服務過程中的產(chǎn)物,因此數(shù)據(jù)之間關系復雜,且易受到不同因素的影響,致使某些數(shù)據(jù)帶有偏倚性。醫(yī)院之間也存在諸多差別,如病人的個體特性和疾病程度、醫(yī)院的診斷和治療水平、醫(yī)療數(shù)據(jù)的記錄和編碼水平等。即使是同一個描述形式,其語法和語義上也不盡相同,更加導致了數(shù)據(jù)的復雜性。

        (3)精確性。醫(yī)療行業(yè)數(shù)據(jù)與人的健康、疾病和生命息息相關,任何失誤都可能導致錯誤結(jié)論,并進一步誤導臨床診治工作,對臨床實踐造成巨大損害。因此在數(shù)據(jù)處理時必須保證數(shù)據(jù)完整性和約束完整性。數(shù)據(jù)完整性指數(shù)據(jù)的正確性、一致性和相容性;約束完整性指數(shù)據(jù)與數(shù)據(jù)之間的關聯(lián)關系,是表征數(shù)據(jù)間邏輯的唯一特征。保證約束完整性是數(shù)據(jù)發(fā)布和數(shù)據(jù)交換的前提,可方便數(shù)據(jù)處理過程,提高效率。

        (4)安全性。醫(yī)療數(shù)據(jù)除了包含病人隱私信息,也包含了大量關于醫(yī)院運轉(zhuǎn)、診療方法、藥物療效等信息。這些信息一般都較敏感,某些可能會涉及商業(yè)利益,因此目前存在的問題主要是醫(yī)療機構(gòu)不愿意公開數(shù)據(jù),而某些可進行數(shù)據(jù)處理的部門沒有數(shù)據(jù)。

        (5)異構(gòu)性(多樣性)。由異構(gòu)問題導致了數(shù)據(jù)的多樣。主要包括數(shù)據(jù)源的異構(gòu)、管理系統(tǒng)的異構(gòu)及所采用標準的異構(gòu)。綜合健康服務平臺數(shù)據(jù)來源廣泛,包括醫(yī)院、獨立體檢機構(gòu)、社區(qū)衛(wèi)生服務機構(gòu)、區(qū)域醫(yī)療信息平臺、第三方檢測機構(gòu)、新農(nóng)合、醫(yī)保社保、個人用戶和網(wǎng)絡等,且主要產(chǎn)生自制藥企業(yè)/生命科學,臨床醫(yī)療/實驗室數(shù)據(jù),費用報銷/利用率,健康管理/社交網(wǎng)絡中;平臺數(shù)據(jù)內(nèi)容多樣,包括病史、體格檢查、理化檢查、居民基本健康檔案、各類個人信息和網(wǎng)頁等,涉及到的數(shù)據(jù)源的類型多樣,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);管理系統(tǒng)的異構(gòu)既有管理系統(tǒng)所運行的操作系統(tǒng)、采取的數(shù)據(jù)庫的不同,還有不同的管理系統(tǒng)采用不同技術實現(xiàn)的異構(gòu);所采用的標準目前主要有CDA,HL7,DCOM接口等。

        (6)封閉性。由各獨立的自治系統(tǒng)導致了信息孤島,進而所產(chǎn)生出的數(shù)據(jù)只適合在該系統(tǒng)內(nèi)部,每個不同的醫(yī)療機構(gòu)都自成一個體系,是一個獨立運行的實體,導致數(shù)據(jù)無法共享。今后的工作需要制定統(tǒng)一的數(shù)據(jù)表示方式或是采用某種統(tǒng)一的方法對其進行封裝,才能實現(xiàn)統(tǒng)一的處理,最終實現(xiàn)全國范圍內(nèi)系統(tǒng)之間的互聯(lián)互通。所有這些特性使得醫(yī)療大數(shù)據(jù)工作者在具體實踐中面臨巨大的挑戰(zhàn)。

        2 構(gòu)建醫(yī)療大數(shù)據(jù)平臺相關問題分析

        2.1 醫(yī)療大數(shù)據(jù)平臺架構(gòu)的技術及其關鍵問題

        未來將建立一個“以人為中心”的綜合健康服務生態(tài)系統(tǒng),系統(tǒng)與區(qū)域醫(yī)療信息平臺、醫(yī)療保險機構(gòu)、體檢中心、第三方檢驗/影像、主動醫(yī)療服務以及醫(yī)保新農(nóng)合等已有醫(yī)療服務資源進行規(guī)范化、標準化地整合與協(xié)同。其技術支撐層中完成對大數(shù)據(jù)的集成、存儲、處理等功能,該層對大數(shù)據(jù)的處理選用開源的分布式計算平臺,目前醫(yī)療健康大數(shù)據(jù)平臺一般基于Hadoop框架來構(gòu)建。該平臺的技術體系理論上能夠處理醫(yī)療綜合健康服務生態(tài)系統(tǒng)中各種類型的數(shù)據(jù)存儲和海量信息處理。而Hadoop能夠為用戶提供系統(tǒng)底層細節(jié)透明的分布式基礎架構(gòu),并且以可靠、高效、可伸縮的方式處理海量數(shù)據(jù)的分布式軟件架構(gòu),采用該技術必將節(jié)省平臺整合的時間和金錢上的效率。

        現(xiàn)有Hadoop與行業(yè)應用還存在一定差距。對于醫(yī)療應用而言主要是兩個方面:其一缺乏面向醫(yī)療領域的分析和挖掘算法庫、模型庫;其二缺乏醫(yī)療知識庫支撐。在臨床決策支持等基于醫(yī)療健康大數(shù)據(jù)的應用中,需要基于對醫(yī)生輸入數(shù)據(jù)內(nèi)容的理解,才能做出必要的決策支持。對于數(shù)據(jù)內(nèi)容的語義處理,必須基于醫(yī)療健康知識庫[3]。

        醫(yī)療大數(shù)據(jù)平臺需解決的關鍵技術:醫(yī)療健康語義知識庫構(gòu)建、非結(jié)構(gòu)化數(shù)據(jù)的語義處理及傳統(tǒng)分析和挖掘技術的并行化。

        2.2 醫(yī)療大數(shù)據(jù)平臺構(gòu)建的兼容性及其技術路線問題

        醫(yī)療大數(shù)據(jù)平臺的構(gòu)建需要考慮如何利用現(xiàn)有數(shù)據(jù)及需要收集哪些數(shù)據(jù)[4-5]。同時要考慮原有的關系型數(shù)據(jù)和Hadoop [6]中非關系型數(shù)據(jù)的存儲,還有兼容業(yè)務數(shù)據(jù)和外部數(shù)據(jù)。

        在技術路線上,首先研究醫(yī)療大數(shù)據(jù)應用需求;其次研究面向醫(yī)療的大數(shù)據(jù)整合與融合技術、數(shù)據(jù)語義化處理技術和大數(shù)據(jù)分析和挖掘并行化處理技術等關鍵技術;以醫(yī)療健康業(yè)務數(shù)據(jù)為核心,融合互聯(lián)網(wǎng)數(shù)據(jù)、政府相關行業(yè)數(shù)據(jù)、第三方健康數(shù)據(jù)(PHR)、個體基因數(shù)據(jù)以及生物樣本數(shù)據(jù),完成醫(yī)療大數(shù)據(jù)中心建設;在此基礎上,構(gòu)建醫(yī)療大數(shù)據(jù)平臺,開展醫(yī)療研究分析,實現(xiàn)基于大數(shù)據(jù)的健康服務應用。

        如此龐大的系統(tǒng)工程中,可采取先以某個業(yè)務為試點突破(如醫(yī)院),逐步完善方法,并以面向醫(yī)療健康領域的分析和挖掘算法庫、模型庫和缺乏醫(yī)療健康知識庫支撐作為技術突破口。

        3 醫(yī)療大數(shù)據(jù)的數(shù)據(jù)集成問題分析

        3.1 醫(yī)療大數(shù)據(jù)集成需考慮的問題

        醫(yī)療大數(shù)據(jù)平臺構(gòu)建問題中的技術難點之一是首先要實現(xiàn)醫(yī)療大數(shù)據(jù)系統(tǒng)集成[7-8]問題,筆者認為主要有以下幾個方面的問題。

        (1)醫(yī)療大數(shù)據(jù)系統(tǒng)集成的范圍問題。系統(tǒng)的集成首要解決所覆蓋的范圍,是以醫(yī)院為單位、以城市為中心的區(qū)域醫(yī)療[9]還是全國范圍內(nèi)的醫(yī)療衛(wèi)生領域[10]的集成,這個問題決定了分布式計算中的問題規(guī)模、需要采取的技術及標準化的建設問題,同時也決定了未來我國衛(wèi)生信息化建設的水平。根據(jù)國務院“互聯(lián)網(wǎng)+”行動的指導意見,未來在“十三五”期間鼓勵健康服務機構(gòu)利用云計算、大數(shù)據(jù)等技術搭建公共信息平臺,提供長期跟蹤、預測預警的個性化健康管理服務的目標,構(gòu)建的醫(yī)療大數(shù)據(jù)系統(tǒng)集成應是著眼于全國范圍的醫(yī)療衛(wèi)生領域,這就區(qū)別于以往單純的全院級的系統(tǒng)集成和區(qū)域性的集成。

        (2)醫(yī)療大數(shù)據(jù)系統(tǒng)集成的架構(gòu)設計問題。系統(tǒng)的架構(gòu)應充分利用原有的基礎設施,通過建立虛擬的集成系統(tǒng),采取標準化和可實現(xiàn)互操作的技術來完成大范圍內(nèi)的信息交換和共享。

        (3)醫(yī)療大數(shù)據(jù)的系統(tǒng)集成問題實質(zhì)上是一個在原有的醫(yī)療衛(wèi)生行業(yè)信息化基礎設施上搭建的一個大規(guī)模的分布式計算平臺。該分布式平臺的計算模式針對不同的醫(yī)療業(yè)務部門和機構(gòu)所采用的計算模式也不盡相同,應包括解決醫(yī)療大規(guī)模數(shù)據(jù)的批量處理能力,也是我們?nèi)粘?shù)據(jù)分析工作中常見的一類數(shù)據(jù)處理需求[11];具備處理在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據(jù)集合體,即流數(shù)據(jù),該類數(shù)據(jù)必須采用實時計算的方式給出秒級響應;此外,還應具有針對公共衛(wèi)生領域的傳染病途徑的處理之類的圖計算模式。該分布式計算平臺中應能夠海量數(shù)據(jù)的高效存儲問題,如采用HDFS,Hbase,NewSQL,云數(shù)據(jù)庫等技術。

        3.2 數(shù)據(jù)集成的難點

        數(shù)據(jù)集成的難點可歸納為異構(gòu)性、分布性和自治性?,F(xiàn)有構(gòu)建數(shù)據(jù)集成系統(tǒng)的方法有多層體系結(jié)構(gòu)和基于其中間層的實現(xiàn)方法。數(shù)據(jù)集成系統(tǒng)可劃分為兩類,即物化(Materialized)集成系統(tǒng)和虛擬(Virtual)集成系統(tǒng)。不斷提高數(shù)據(jù)集成系統(tǒng)的性能、可伸縮性、靈活性和適應性,將是數(shù)據(jù)集成系統(tǒng)健壯發(fā)展的總趨勢。而融入了數(shù)據(jù)倉庫技術、移動 Agent技術、XML 技術、語義 Web 技術和 AI 技術的虛擬數(shù)據(jù)集成方案,將重新煥發(fā)生命力,并向具有分布式體系結(jié)構(gòu)、形式語義的智能知識型軟件方向發(fā)展。

        3.3 數(shù)據(jù)集成

        目前已有的幾種典型數(shù)據(jù)集成方法有模式集成方法、數(shù)據(jù)復制方法及在這兩種方法基礎上的綜合方法[12]。數(shù)據(jù)集成的數(shù)據(jù)源異構(gòu)性問題,是數(shù)據(jù)集成問題的難點,異構(gòu)性的難點主要表現(xiàn)在語法異構(gòu)和語義異構(gòu)上。

        為構(gòu)建具有全國范圍內(nèi)的大數(shù)據(jù)醫(yī)療系統(tǒng),需采用該兩種方法基礎上的綜合方法,想辦法采用“云計算”中的虛擬化方法,提高基于中間件系統(tǒng)的性能,同時能夠?qū)?shù)據(jù)源間常用的數(shù)據(jù)進行復制。

        4 結(jié) 語

        醫(yī)療大數(shù)據(jù)平臺的建設事關國計民生,需要醫(yī)療衛(wèi)生機構(gòu)、政府、科研人員通力合作,針對醫(yī)療行業(yè)的特點解決標準、數(shù)據(jù)來源、數(shù)據(jù)處理的關鍵技術問題,才能真正發(fā)揮醫(yī)療健康大數(shù)據(jù)的價值。

        參考文獻

        [1] JAVIER A P. Big data for health. IEEE Journal of biomedical and health informatics,2015,19(4):1193-1194.

        [2]俞國培,包小源,黃新霆,等.醫(yī)療健康大數(shù)據(jù)的種類、性質(zhì)及有關問題[J].醫(yī)學信息學雜志,2014,35(6):10-12.

        [3]馮東雷.醫(yī)療健康大數(shù)據(jù)技術路線和方法論初探[J].中國信息

        界,2014(6):44-45.

        [4] MEZGHANI E,EXPOSITO E,DRIRA K,et al. A semantic big data platform for integrating heterogeneous wearable data in healthcare[J]. Med syst,2015,39(2):182-183.

        [5] SANGWHAN C,ASHRAF A,SYED S A. Towards a ‘Big health data analytics platform[C]. Washington,DC,USA:IEEE computer society,2015. 233-234.

        [6] SARA D R,VICTORIA L,JOS? M B,et al. A mapreduce approach to address big data classification problems based on the fusion of linguistic fuzzy rules[J]. International journal of computational intelligence systems,2015,8(3):422-437.

        [7] SRIVIDYA K,BANSAL,SEBASTIAN K. Integrating big data:A semantic extract-transform-load framework[J]. Computer,2015,48(3):44-45.

        [8] XIN L D,DIVESH S. Big data integration[J]. Synthesis lectures on data management,2015,6(11):198-199.

        [9] DASWIN D S,F(xiàn)RADA B,HERBERT F J,et al. Addressing the complexities of big data analytics in healthcare:The diabetes screening case[J]. Australasian journal of information systems,2015,19:102-104.

        [10] CHRIS A. Translational research 2.0:a framework for accelerating collaborative discovery[J]. Personalized medicine,2014,11(3):351-353.

        [11] LAURENT S,MARC V B. Structured data fusion[J]. IEEE Journal of selected topics in signal processing,2015,9(4):586-600.

        [12]陳躍國,王京春. 數(shù)據(jù)集成綜述[J].計算機科學,2004,31(5):48-50.

        猜你喜歡
        數(shù)據(jù)集成大數(shù)據(jù)平臺分布式計算
        基于大數(shù)據(jù)的智能停車場管理系統(tǒng)設計
        淺談電力大數(shù)據(jù)平臺關鍵技術研究與應用
        基于云計算的移動學習平臺設計與實現(xiàn)
        軟件導刊(2016年11期)2016-12-22 21:47:07
        基于大數(shù)據(jù)分析的智慧倉儲運營支撐平臺設計
        云計算中MapReduce分布式并行處理框架的研究與搭建
        襪業(yè)行業(yè)大數(shù)據(jù)平臺的應用研究
        成本與制造數(shù)據(jù)集成分析
        基于Biztalk的異構(gòu)醫(yī)療信息系統(tǒng)數(shù)據(jù)集成研究
        面向異構(gòu)分布式計算環(huán)境的并行任務調(diào)度優(yōu)化方法
        信息系統(tǒng)集成與數(shù)據(jù)集成策略研究
        中文字幕第八页| 国产精品久久久久久福利| 久久久精品国产sm调教网站| 亚洲中文字幕无码中字| 亚洲乱精品中文字字幕| 久久亚洲网站中文字幕| √天堂中文官网在线| 久久久久亚洲av无码专区| 亚洲精品乱码久久久久99| 国产精品亚洲二区在线| 久久99国产精品久久| 国产乱人伦av在线无码| 亚洲精品国产二区三区在线| 亚洲美女主播内射在线| 成年站免费网站看v片在线| 美女大量吞精在线观看456| 亚洲大尺度动作在线观看一区 | 区无码字幕中文色| 少妇又骚又多水的视频| 国产在线精品一区二区三区直播| 亚洲人成人影院在线观看| 人妻少妇精品一区二区三区| 国产激情视频在线观看大全| 亚洲精品无码久久久影院相关影片 | 国产一区二区三区免费主播| 亚洲日本精品国产一区二区三区| 无码人妻久久一区二区三区app| 免费AV一区二区三区无码| 国产成人久久精品二区三区| 邻居少妇张开腿让我爽了一夜| 国产成人精品av| 国产三级视频在线观看视主播| 日本最新视频一区二区| 久久久无码精品亚洲日韩按摩| 国产欧美日韩午夜在线观看 | 国产人成亚洲第一网站在线播放| 日韩一区二区中文天堂| 成人在线免费电影| 亚洲无毛片| 国产精品亚洲av无人区一区蜜桃| 亚洲 日韩 激情 无码 中出|