谷靜怡+程建峰
一、檢+療+管理+反饋為一體的慢病管理模式
國內(nèi)慢病管理的領(lǐng)域內(nèi)教新的一種慢病管理模式即為慢病管理生態(tài)圈的構(gòu)建,其具有:互動、大數(shù)據(jù)、人工智能、移動檢測、社群管理、公共服務(wù)、公益、資源共享等鮮明的特點(diǎn),基于這些特色功能,使得慢病可防可控成為可能。在國家慢病防控體系的基礎(chǔ)上,將以各級綜合醫(yī)院、社區(qū)醫(yī)院為主,體檢機(jī)構(gòu)、移動醫(yī)療廠商為輔的“檢+療+管理+反饋”的慢病服務(wù)體系。結(jié)合云服務(wù)綜合整理分析各環(huán)節(jié)醫(yī)療數(shù)據(jù),與各環(huán)節(jié)共同構(gòu)建可持續(xù)的慢病管理生態(tài)網(wǎng)。本模式的第一特色是“寓樂于醫(yī)”的設(shè)計理念,旨在讓患者在輕松愉快的狀態(tài)下進(jìn)行自身的健康管理。第二特色是全面系統(tǒng)的健康管理,我們通過對合作醫(yī)院方提供的大數(shù)據(jù)進(jìn)行縝密分析并且結(jié)合專家團(tuán)隊(duì)的意見,制定了針對不同的年齡層健康管理方案,主要包括針對年輕用戶的習(xí)慣養(yǎng)成方案和針對中老年用戶的健康管理方案。第三特色是認(rèn)知計算的切入點(diǎn),本團(tuán)隊(duì)通過終端平臺收集精準(zhǔn)的人體數(shù)據(jù),通過選取準(zhǔn)確的數(shù)據(jù)挖掘工具和數(shù)據(jù)分析方法,對用戶的體征和行為習(xí)慣進(jìn)行分析,并為之匹配相應(yīng)的服務(wù)。本項(xiàng)目的終端目標(biāo)是打造多種資源聚合,多重服務(wù)融合的app:疾病相關(guān)資訊+慢病管理+第三方硬件病情監(jiān)測+醫(yī)院干預(yù)+公益服務(wù)。
二、慢病醫(yī)療數(shù)據(jù)的處理
海量醫(yī)療數(shù)據(jù)服務(wù)中存在大量的數(shù)據(jù)統(tǒng)計以及基于數(shù)據(jù)統(tǒng)計構(gòu)建的功能服務(wù),隨著服務(wù)需求的不斷提高,對統(tǒng)計的查詢響應(yīng)時間提出了較高要求。同時,醫(yī)療數(shù)據(jù)數(shù)據(jù)量大、關(guān)聯(lián)性強(qiáng)、不同用戶對相同數(shù)據(jù)的請求不盡相同,這些都對存儲模型提出了很大的挑戰(zhàn)。本文提出了一種基于統(tǒng)計樹的海量醫(yī)療數(shù)據(jù)的快速統(tǒng)計方法,優(yōu)化存儲模型,提升計算效率,高效的支持多樣化的醫(yī)療數(shù)據(jù)服務(wù)。
海量醫(yī)療數(shù)據(jù)挖掘平臺具有以下三個特點(diǎn):第一,靈活性?;颊叩牟v檔案中新增檢測項(xiàng),或增加新的醫(yī)療服務(wù)需求,無需大規(guī)模變動原有業(yè)務(wù),造成系統(tǒng)重構(gòu)。第二,可擴(kuò)展性。平臺基于云計算架構(gòu),彈性存儲,綠色節(jié)能,具有較強(qiáng)的存儲可擴(kuò)展性;同時,該架構(gòu)靈活性強(qiáng),層與層之間相對獨(dú)立,增強(qiáng)了其計算的可擴(kuò)展性。第三,重用性。該架構(gòu)將實(shí)時數(shù)據(jù)處理與批量數(shù)據(jù)處理有機(jī)結(jié)合,不僅適用于海量醫(yī)療數(shù)據(jù)的挖掘處理,同時可用于海量交通數(shù)據(jù)處理、海量物流數(shù)據(jù)處理等行業(yè)。
行政數(shù)據(jù),主要包括從醫(yī)療支付方(醫(yī)療保險機(jī)構(gòu))或者醫(yī)療機(jī)構(gòu)獲得的理賠信息等,通常涉及病人所使用的醫(yī)療服務(wù)、相關(guān)診斷信息、提供服務(wù)的醫(yī)療機(jī)構(gòu)及時間地點(diǎn)、以及費(fèi)用明細(xì)與支付情況。
臨床數(shù)據(jù),包括從醫(yī)療機(jī)構(gòu)獲得的電子病歷(EMR)、醫(yī)療影像數(shù)據(jù)、處方信息等。
體征數(shù)據(jù),例如由檢測儀器測量所得的體重、血壓、血糖水平等信,以及飲食、運(yùn)動、睡眠等自我跟蹤信息。隨著可穿戴設(shè)備及相關(guān)手機(jī)軟件的廣泛應(yīng)用,此類數(shù)據(jù)量越來越大也越來越多元化。
個人及偏好數(shù)據(jù),例如性別、年齡、職業(yè)等基本信息以及個人偏好、對產(chǎn)品和服務(wù)滿意度等主觀信息。
由于數(shù)據(jù)量大、種類繁雜,不同類型的數(shù)據(jù)之間會有交叉或者交集。例如處方數(shù)據(jù),既可以從醫(yī)療機(jī)構(gòu)的信息系統(tǒng)中獲得——即臨床數(shù)據(jù)的一種,也可以從醫(yī)療保險機(jī)構(gòu)的理賠數(shù)據(jù)庫中找到——即理賠信息的一部分;又如血壓等信息既可以從隨身攜帶的便攜血壓計測量得到(體征數(shù)據(jù)),也可以在醫(yī)療機(jī)構(gòu)的電子病歷中發(fā)現(xiàn)(臨床數(shù)據(jù))。
綜合所構(gòu)建的海量醫(yī)療數(shù)據(jù)挖掘平臺的層次模型、平臺系統(tǒng)的服務(wù)特點(diǎn)、數(shù)據(jù)存儲策略、數(shù)據(jù)處理流程各部分的設(shè)計原則,繪制出海量醫(yī)療數(shù)據(jù)挖掘平臺的設(shè)計框架如上圖所示。
業(yè)務(wù)層:業(yè)務(wù)層位于最上層。通過調(diào)用功能層單一服務(wù)接口,或多種服務(wù)接口組合,形成針對于患者、醫(yī)生、醫(yī)療機(jī)構(gòu)、管理部門等不同對象的多樣化服務(wù)。其包括但不限于報表統(tǒng)計、實(shí)時在線查詢、臨床決策、疾控預(yù)警、患者行為分析等服務(wù)。
功能層:功能層位于服務(wù)層下面。其主要作用是作為服務(wù)接口層,平臺層通過多種處理方式計算所得的結(jié)果形成多樣化的服務(wù)接口,供業(yè)務(wù)層進(jìn)行調(diào)用。其主要包括機(jī)器學(xué)習(xí)、深度挖掘、分析統(tǒng)計、實(shí)時查詢等功能。
平臺層:平臺層位于功能層之下,基礎(chǔ)層之上。主要功能是計算處理各種醫(yī)療和健康數(shù)據(jù)。包括原有系統(tǒng)數(shù)據(jù)的導(dǎo)入,實(shí)時數(shù)據(jù)流處理,批量數(shù)據(jù)處理系統(tǒng)以及用于數(shù)據(jù)挖掘的算法庫。能夠高效支撐實(shí)時離線多種數(shù)據(jù)處理需求。
基礎(chǔ)層:基礎(chǔ)層是平臺的最底層,提供海量醫(yī)療數(shù)據(jù)挖掘平臺運(yùn)行的支撐平臺。其采用云計算架構(gòu),彈性存儲,靈活可擴(kuò)展,便于對海量異構(gòu)的醫(yī)療數(shù)據(jù)進(jìn)行分布式存儲。在云平臺上部署有分布式文件系統(tǒng)HDFS,NoSQL 數(shù)據(jù)庫HBase以及MySQL數(shù)據(jù)庫等多種類型數(shù)據(jù)庫,保證復(fù)雜多樣的醫(yī)療數(shù)據(jù)存儲。基礎(chǔ)層的主要工作是管理和維護(hù)基礎(chǔ)硬件設(shè)備及數(shù)據(jù)存儲,保證平臺的高性能、高可用和高擴(kuò)展。
異構(gòu)復(fù)雜的海量醫(yī)療數(shù)據(jù),實(shí)時接入Storm流數(shù)據(jù)處理系統(tǒng),結(jié)合基于統(tǒng)計樹及增量計算的動態(tài)統(tǒng)計策略,實(shí)現(xiàn)數(shù)據(jù)融合并匯入基于云計算搭建的海量醫(yī)療數(shù)據(jù)挖掘平臺得到整合信息,通過深度學(xué)習(xí)、貝葉斯網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘算法將信息轉(zhuǎn)化為知識,進(jìn)而為不同對象提供實(shí)時精準(zhǔn)的個性化數(shù)據(jù)服務(wù)。
實(shí)時數(shù)據(jù)的存儲和處理過程運(yùn)用了統(tǒng)計樹的方法,使得后續(xù)基于統(tǒng)計的數(shù)據(jù)挖掘變得更為高效。
經(jīng)存儲、處理后的數(shù)據(jù)形成了便于挖掘的整合信息,根據(jù)不同的醫(yī)療數(shù)據(jù)服務(wù)需求,選取適當(dāng)?shù)臄?shù)據(jù)挖掘算法,本文選取了貝葉斯網(wǎng)絡(luò)及關(guān)聯(lián)規(guī)則算法分別實(shí)現(xiàn)了疾病與檢測參數(shù)的關(guān)聯(lián)性挖掘、疾病與疾病之間的關(guān)聯(lián)性挖掘。