王淑平 梁穎
【摘要】隨著大數(shù)據(jù)技術的不斷發(fā)展,大數(shù)據(jù)技術在醫(yī)療衛(wèi)生行業(yè)的應用日益廣泛,通過醫(yī)療大數(shù)據(jù)技術可以有效地處理醫(yī)療衛(wèi)生行業(yè)不斷增長的醫(yī)療數(shù)據(jù),提高醫(yī)療數(shù)據(jù)利用率。在分析醫(yī)療大數(shù)據(jù)基本特征的基礎上,闡述了醫(yī)療大數(shù)據(jù)應用體系架構,包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)交換共享、數(shù)據(jù)應用五個層次以及標準規(guī)范、數(shù)據(jù)治理、運維管理和信息安全四個體系,探討了醫(yī)療大數(shù)據(jù)的具體應用場景,從機制標準、關鍵技術、數(shù)據(jù)質量、安全隱私和復合性人才五個方面討論了目前大數(shù)據(jù)技術在醫(yī)療衛(wèi)生行業(yè)應用中面臨的挑戰(zhàn)。
【關鍵詞】大數(shù)據(jù);體系架構;醫(yī)療衛(wèi)生
1引言
隨著“互聯(lián)網(wǎng)”+、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等新興技術的不斷發(fā)展和應用,醫(yī)療衛(wèi)生領域的信息化程度和水平不斷提升,隨之產(chǎn)生的相關醫(yī)療數(shù)據(jù)也呈現(xiàn)爆炸式增長。醫(yī)療行業(yè)作為國家和社會發(fā)展的基礎行業(yè),其醫(yī)療數(shù)據(jù)蘊含著著巨大的價值。通過大數(shù)據(jù)技術可以有效地處理醫(yī)療衛(wèi)生行業(yè)日益增長的各種數(shù)據(jù),為整個醫(yī)療衛(wèi)生行業(yè)的發(fā)展提供有效地決策支持。
2醫(yī)療大數(shù)據(jù)概述
2.1醫(yī)療大數(shù)據(jù)的概念。大數(shù)據(jù)(BigData),通常是指多源異構、跨域關聯(lián)的海量數(shù)據(jù)集合,其數(shù)據(jù)量特別大、數(shù)據(jù)形態(tài)眾多、數(shù)據(jù)結構復雜,使用傳統(tǒng)的軟硬件及算法難以進行數(shù)據(jù)的存儲、處理和分析。醫(yī)療大數(shù)據(jù)是傳統(tǒng)大數(shù)據(jù)的衍生,指在醫(yī)療行業(yè)所產(chǎn)生的海量數(shù)據(jù),包括患者就醫(yī)、醫(yī)療服務、衛(wèi)生管理和醫(yī)學研究過程中產(chǎn)生的以患者為中心的眾多數(shù)據(jù)[1]。
2.2醫(yī)療大數(shù)據(jù)的特征。醫(yī)療大數(shù)據(jù)不僅具有傳統(tǒng)大數(shù)據(jù)的5V特征,即Vol-ume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性),還具有以下六點特有的特征:(1)醫(yī)學術語的復雜性。在醫(yī)學領域中,醫(yī)學術語涉及國外和國內(nèi)醫(yī)學術語以及外文與中文表達表述方式,存在術語標準不統(tǒng)一不精確、更新速度快等問題,使得醫(yī)學術語和醫(yī)療數(shù)據(jù)在文字表達和語義方面復雜繁瑣,尤其體現(xiàn)在我國的中醫(yī)藥領域的醫(yī)學術語的復雜性。(2)醫(yī)療數(shù)據(jù)的多維性?;颊咴卺t(yī)院就醫(yī)過程中,圍繞著患者為中心,醫(yī)療數(shù)據(jù)會從多個維度產(chǎn)生,如醫(yī)生從診斷治療維度產(chǎn)生數(shù)據(jù)、醫(yī)技從檢查檢驗維度產(chǎn)生數(shù)據(jù)、護士從護理維度產(chǎn)生數(shù)據(jù),數(shù)據(jù)的產(chǎn)生格式和要求不同,使得同一醫(yī)療行為存在多重維度的數(shù)據(jù)展示。(3)醫(yī)療數(shù)據(jù)不完整性。不管是手工記錄還在借助于電子化方式記錄醫(yī)療數(shù)據(jù),均會由于各種原因導致數(shù)據(jù)記錄不全或記錄中出現(xiàn)紕漏缺失的情況存在,使得醫(yī)療數(shù)據(jù)不完整。(4)醫(yī)療數(shù)據(jù)的時序性?;颊叩木驮\和治療行為往往是多次的,不同的時間產(chǎn)生的不同醫(yī)療數(shù)據(jù)具有一定的時序性。此外,患者的檢查數(shù)據(jù)如心電圖數(shù)據(jù)等也都與時間有關。(5)醫(yī)療數(shù)據(jù)的隱私性。醫(yī)療數(shù)據(jù)中往往包括患者的隱私,如基本信息、健康狀況等,這些隱私數(shù)據(jù)分布或隱藏在不同的地方,醫(yī)療大數(shù)據(jù)通過數(shù)據(jù)分析和挖掘,可能獲得比較完整的患者隱私情況,使得醫(yī)療數(shù)據(jù)的隱私性呈現(xiàn)暴露化狀態(tài)。(6)醫(yī)療數(shù)據(jù)的冗余性。醫(yī)院在信息化建設過程中,由于廠家的不同、上線時間各異,信息孤島普遍存在,同一患者在不同的信息系統(tǒng)中會產(chǎn)生重復的數(shù)據(jù),這些數(shù)據(jù)分散存儲在不同的系統(tǒng)中,使得醫(yī)療數(shù)據(jù)具有冗余性。
3醫(yī)療大數(shù)據(jù)應用體系架構
大數(shù)據(jù)技術已經(jīng)應用在很多行業(yè)和領域中,通過分析和借鑒其他行業(yè)的大數(shù)據(jù)應用情況認為,醫(yī)療大數(shù)據(jù)應用體系架構應主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)交換共享和數(shù)據(jù)應用五個層次,以及標準規(guī)范體系、數(shù)據(jù)治理體系、運維管理體系和信息安全體系四個體系。醫(yī)療大數(shù)據(jù)應用體系架構如圖1所示。
3.1體系架構的五個層次。
3.1.1數(shù)據(jù)采集。數(shù)據(jù)采集的目的是采集醫(yī)療衛(wèi)生機構所產(chǎn)生的數(shù)據(jù),主要從各級醫(yī)療機構、公共衛(wèi)生機構、醫(yī)療保險機構、全員人口信息庫、居民健康檔案、電子病歷信息庫和其他數(shù)據(jù)來源處采集醫(yī)療數(shù)據(jù)。醫(yī)療大數(shù)據(jù)的采集通常分為集中式采集和分布式采集,其中最關鍵的就是數(shù)據(jù)的采集、清洗、轉換、裝載,獲取高質量符合需求的數(shù)據(jù)。
3.1.2數(shù)據(jù)存儲。數(shù)據(jù)存儲是大數(shù)據(jù)技術的重要環(huán)節(jié),醫(yī)療大數(shù)據(jù)量級別通常為TB至PB級別,存儲方式包括結構化存儲方式、非機構化存儲方式以及分布式文件存儲方式,其中結構化數(shù)據(jù)通常存儲在關系型數(shù)據(jù)庫(RDBMS)中,常見的關系型數(shù)據(jù)庫包括ORACLE、SQLSERVER、DB2等,非機構化存儲方式需要用到NoSQL等技術,分布式文件存儲方式可以通過Hadoop等技術實現(xiàn)。在醫(yī)療領域,PACS數(shù)據(jù)、電子病歷、隨訪數(shù)據(jù)等主要以圖像或文本形式存在。
3.1.3數(shù)據(jù)分析。數(shù)據(jù)的分析方法是大數(shù)據(jù)技術的關鍵核心,主要包括三種方式:一是以分類、聚類、特征分析、關聯(lián)規(guī)則、多維分析、回歸分析為主的傳統(tǒng)分析方法,二是以機器學習、數(shù)據(jù)挖掘、語義搜索、自然語言處理的智能分析方法,三是以自定義分析為主的分析方法。大數(shù)據(jù)分析由于數(shù)據(jù)海量,傳統(tǒng)的分析方式效率低下,因此智能分析方式是目前的主流數(shù)據(jù)分析方法。在醫(yī)療領域針對電子病歷的自然語言處理技術和面向PACS圖像的語義分析技術日益成熟。
3.1.4數(shù)據(jù)交換共享。數(shù)據(jù)交換共享不僅要滿足數(shù)據(jù)共享集成功能,實現(xiàn)數(shù)據(jù)的集中采集、分揀下推等,還需要很好的支持面向分布式的SOA架構,支持基于WebService、文檔、DB等多種模式的更具有廣泛意義的數(shù)據(jù)交換。實現(xiàn)業(yè)務內(nèi)部的緊耦合、業(yè)務之間的松耦合,支持各種標準和接口規(guī)范,實現(xiàn)核心基礎服務平臺、各應用系統(tǒng)的集成和數(shù)據(jù)交換共享。
3.1.5數(shù)據(jù)應用。數(shù)據(jù)的應用主要包括政府部門應用、醫(yī)療機構應用、社會公眾應用和行業(yè)企業(yè)應用四個方面的應用。政府部門應用主要包括智能監(jiān)管、決策支持、輿情監(jiān)控等,醫(yī)療機構應用主要包括輔助診療、精準醫(yī)療、臨床科研,社會公眾應用主要包括個性化診療、慢病助治,行業(yè)企業(yè)應用主要包括藥品研發(fā)和健康保險等。
3.2體系架構的四個體系。
3.2.1標準規(guī)范體系。醫(yī)療大數(shù)據(jù)應用體系架構的設計以數(shù)據(jù)處理為核心,在國家標準、行業(yè)標準、管理規(guī)范、技術標準和信息標準的基礎上制定并完數(shù)據(jù)接口標準規(guī)范、數(shù)據(jù)交換標準、元數(shù)據(jù)信息標準、數(shù)據(jù)采集規(guī)范、數(shù)據(jù)管理制度、數(shù)據(jù)質量規(guī)范等,建立醫(yī)療大數(shù)據(jù)應用體系的標準規(guī)范集。
3.2.2數(shù)據(jù)治理體系。數(shù)據(jù)治理是對數(shù)據(jù)的全生命周期管理,主要包括兩個方面:一個是數(shù)據(jù)質量核心領域,二是數(shù)據(jù)質量保障機制。其中,數(shù)據(jù)質量核心領域的內(nèi)容包括數(shù)據(jù)服務、數(shù)據(jù)質量、主數(shù)據(jù)、元數(shù)據(jù)、數(shù)據(jù)全生命周期、數(shù)據(jù)模型、數(shù)據(jù)標準和數(shù)據(jù)安全等,數(shù)據(jù)質量保障機制包括章程制度、組織、流程和IT技術應用等。
3.2.3運維管理體系。運維管理體系是保障整個應用持續(xù)正常運行的基礎,主要包括管理對象、組織結構、服務流程、服務內(nèi)容、響應措施和制度規(guī)范等。針對網(wǎng)絡、主機、存儲、數(shù)據(jù)庫系統(tǒng)、中間件、終端外設運維等多個方面,建立持續(xù)改進的運維管理體系。
3.2.4信息安全體系。信息安全管理體系涵蓋安全策略、訪問控制、信息安全組織、物理和環(huán)境安全、通信和操作安全、信息安全事件管理和業(yè)務連續(xù)性管理等,從規(guī)章管理制度和信息安全技術等方面構建全面的信息安全體系。
4醫(yī)療大數(shù)據(jù)的應用場景
4.1政府部門應用。在決策支持方面,傳統(tǒng)的決策支持容易受主觀因素影響,醫(yī)療大數(shù)據(jù)技術以數(shù)據(jù)為基礎,以挖掘和分析為手段,能夠客觀全面地綜合決策。政府部門主導的各級醫(yī)療大數(shù)據(jù)中心的建設匯集了海量的醫(yī)療數(shù)據(jù),通過大數(shù)據(jù)技術宏觀調控,調整各地醫(yī)療資源分配,同時為政府部門制定有關政策提供客觀的依據(jù)。在智能監(jiān)管方面,通過事前數(shù)據(jù)提示控制、事中數(shù)據(jù)監(jiān)控管理、事后數(shù)據(jù)分析評價,全流程智能監(jiān)管整個醫(yī)療行為的各個環(huán)節(jié),對各醫(yī)療機構進行宏觀評價和智能監(jiān)管。在輿情監(jiān)控方面,通過大數(shù)據(jù)技術自動采集和分析相關醫(yī)療數(shù)據(jù),通過自動分類聚類以及提前預警,為合理處理醫(yī)患關系,引導正確輿論提供支持。
4.2醫(yī)療機構應用。在輔助診療方面,通過醫(yī)療大數(shù)據(jù)技術全面收集病人的在院體征、影像、隨訪等數(shù)據(jù),綜合多學科數(shù)據(jù)輔助診斷和治療,建立臨床大數(shù)據(jù)知識庫,輔助臨床工作者診斷、治療和用藥。在精準醫(yī)療方面,大數(shù)據(jù)技術在精準診斷、精準治療、精準用藥、精準預防環(huán)節(jié)中,通過基因測序精確存在問題的基因片段,使用靶向用藥精準治療,實現(xiàn)最佳診療方式。在臨床科研方面,臨床科研工作者常常面臨數(shù)據(jù)獲取難、數(shù)據(jù)量小、數(shù)據(jù)不全的問題,通過醫(yī)療大數(shù)據(jù)技術使用大數(shù)據(jù)搜索引擎可以一站式獲取相關數(shù)據(jù),利用大數(shù)據(jù)的分析方法和計算能力,探索新的醫(yī)療科研領域。
4.3社會公眾應用。在個性化診療方面,醫(yī)療大數(shù)據(jù)技術與移動互聯(lián)網(wǎng)技術相結合,通過手機應用程序和可接入網(wǎng)絡的可穿戴移動設備等,可以實時獲取個體的各項體征數(shù)據(jù)和指標,使用大數(shù)據(jù)統(tǒng)計和分析技術給個體予以提醒和指導,使個體實時了解自己的健康狀況,及時就醫(yī)診療。在慢病助治方面,尤其針對腫瘤患者、高血壓患者、糖尿病患者等受眾診療和用藥周期長,需要長時間監(jiān)控各項指標,利用醫(yī)療大數(shù)據(jù)技術可以從歷史數(shù)據(jù)、實時監(jiān)控和預測數(shù)據(jù)等多個方面輔助慢性病治療。
4.4行業(yè)企業(yè)應用。在藥品研發(fā)方面,通過醫(yī)療大數(shù)據(jù)技術在藥品研發(fā)前期可以通過對受眾進行大數(shù)據(jù)的需求調研、指標采集等以決定研發(fā)方向和投入,在藥品研發(fā)過程中可以通過大樣本和大量數(shù)據(jù)臨床試驗數(shù)據(jù)以確定藥品的效果,在藥品臨床使用階段可以通過臨床大量患者的使用反饋效果不斷改進藥品,在藥品上市階段可以通過大數(shù)據(jù)技術做好市場規(guī)劃和預測。在健康保險方面,通過醫(yī)療大數(shù)據(jù)統(tǒng)計和分析可以獲取特定疾病的總體情況以及患者對于各類保險的需求,有針對地開展健康保險業(yè)務。
5醫(yī)療大數(shù)據(jù)應用面臨的挑戰(zhàn)
目前,醫(yī)療大數(shù)據(jù)的應用仍然處于初級起步階段,面臨很多問題和挑戰(zhàn),主要包括:(1)機制和標準不完善,國家關于大數(shù)據(jù)已經(jīng)出臺了很多指導性意見,但是涉及到具體的建設標準和技術規(guī)范還需要進一步細化完善,此外由于信息化建設過程中廠家各異,標準規(guī)范也各不相同;(2)關鍵技術需要突破,一是大數(shù)據(jù)的整合技術,尤其是針對醫(yī)療行業(yè)中的大量非結構化數(shù)據(jù),二是大數(shù)據(jù)的存儲技術,主要是分布式存儲架構的建設,三是大數(shù)據(jù)的分析技術,對文本、圖像等醫(yī)療數(shù)據(jù)的分析方法和能力需要創(chuàng)新;(3)數(shù)據(jù)的整體質量不高,由于我國的信息化建設的逐步進行的,在實際的建設過程中,基礎數(shù)據(jù)缺失、數(shù)據(jù)錯誤等問題廣泛存在,利用大數(shù)據(jù)技術采集匯總后的整體數(shù)據(jù)質量不高;(4)數(shù)據(jù)安全和隱私有待加強,醫(yī)療數(shù)據(jù)具有很強的隱私屬性,是一類比較特殊的數(shù)據(jù),如何從管理和技術層面保障大數(shù)據(jù)的安全隱私是現(xiàn)實面臨的問題之一;(5)復合型人才的缺失,醫(yī)療大數(shù)據(jù)的建設和應用,不僅僅需要計算機與信息領域的專業(yè)人才,還需要對衛(wèi)生管理、臨床醫(yī)療、統(tǒng)計分析等方面有深入的了解,復合型人才的培養(yǎng)是大數(shù)據(jù)技術在醫(yī)療衛(wèi)生行業(yè)應用過程中重要的環(huán)節(jié)。
6結束語
大數(shù)據(jù)技術在醫(yī)療衛(wèi)生行業(yè)的應用日益廣泛,本文在分析醫(yī)療大數(shù)據(jù)特征的基礎上,構建了醫(yī)療大數(shù)據(jù)應用體系架構,從數(shù)據(jù)的采集、存儲、分析、交換共享和應用五個層次詳細闡述了大數(shù)據(jù)技術在醫(yī)療衛(wèi)生行業(yè)應用的體系架構。醫(yī)療大數(shù)據(jù)通過在政府部門、醫(yī)療機構、社會公眾和行業(yè)企業(yè)等方面的應用可以發(fā)揮醫(yī)療大數(shù)據(jù)的巨大價值。大數(shù)據(jù)技術提高了醫(yī)療衛(wèi)生行業(yè)數(shù)據(jù)利用,為醫(yī)療衛(wèi)生行業(yè)的發(fā)展帶來了新的方向,具有重要的研究意義。
參考文獻:
[1]孫愛婷,張海平.大數(shù)據(jù)技術在醫(yī)療領域應用的發(fā)展前景[J].中國管理信息化,2017,20(19):193-195.
[2]周雪晴,羅亞玲.信息化建設中醫(yī)療大數(shù)據(jù)現(xiàn)狀[J].中華醫(yī)學圖書情報雜志,2015,24(11):48-51.
[3]黃竹青,陳敏.健康醫(yī)療大數(shù)據(jù)應用體系架構及推廣建議[J].醫(yī)學信息學雜志,2018,39(8):13-18.
[4]龍虎,邱航,吳滄浪,等.四川省健康醫(yī)療大數(shù)據(jù)中心構建探討[J].中國衛(wèi)生信息管理雜志,2017,14(1):15-18,23.
[5]路杰,姚進文,閆宣辰,等.省級健康醫(yī)療大數(shù)據(jù)平臺設計與應用實踐[J].醫(yī)學信息學雜志,2018,39(8):7-12.
[6]李志勇,郭一通.大數(shù)據(jù)背景下電力行業(yè)數(shù)據(jù)應用研究[J].自動化技術與應用,2018,37(9):156-158.
[7]鄧韌,丁智剛,胡娟,等.省級健康醫(yī)療大數(shù)據(jù)平臺設計與實現(xiàn)[J].中國衛(wèi)生信息管理雜志,2017,14(1):31-34,58.
[8]代濤.健康醫(yī)療大數(shù)據(jù)發(fā)展應用的思考[J].醫(yī)學信息學雜志,2016,37(2):2-8.
[9]孟琳,馬金剛,劉靜,等.醫(yī)療大數(shù)據(jù)的應用與挑戰(zhàn)[J].醫(yī)療衛(wèi)生裝備,2018,39(10):71-74,88.