王閏,劉秋美,張圓
(牡丹江醫(yī)學(xué)院附屬紅旗醫(yī)院,黑龍江 牡丹江 157011)
腦卒中表現(xiàn)為高發(fā)病率、高致殘率、高病死率,嚴重的影響了患者的生活,成為社會發(fā)展的負擔。當前,我國醫(yī)療資源分布不均,對腦卒中的預(yù)防、康復(fù)、護理的全民參與存在一定的困難。心腦血管疾病80%是可預(yù)防的,積極控制危險因素和個體化治療是降低其發(fā)生的根本途徑[1]。通過預(yù)防、康復(fù)、護理等慢病管理模式和策略,降低發(fā)病率、病死率、病殘率是醫(yī)療健康發(fā)展的規(guī)劃目標。近些年來,大數(shù)據(jù)、人工智能、精準醫(yī)療等醫(yī)工結(jié)合技術(shù)快速發(fā)展,在衛(wèi)生醫(yī)療領(lǐng)域發(fā)揮的作用越來越大。一些研究運用大數(shù)據(jù)技術(shù)于慢性高危疾病的評估及個體化干預(yù)、隨訪。國家衛(wèi)生部于2009年起動了“國家腦卒中防治工程”并建立“中國卒中數(shù)據(jù)中心”[2]。在此基礎(chǔ)上,該中心建立涵蓋社區(qū)、鄉(xiāng)鎮(zhèn)、醫(yī)院門診與住院的多個數(shù)據(jù)庫,存儲500萬個篩查對象和高危人群的信息資料,為腦卒中的預(yù)防、康復(fù)、護理提供信息服務(wù),充分利用大數(shù)據(jù)技術(shù),為新醫(yī)療發(fā)揮作用。云計算技術(shù)是一種新興的計算模型,基于公開的標準和服務(wù)為基礎(chǔ),以互聯(lián)網(wǎng)為中心,提供安全、快速、便捷的數(shù)據(jù)存儲與網(wǎng)絡(luò)計算服務(wù)[3]。在腦卒中智慧醫(yī)療服務(wù)中,基于分布式、并行處理、網(wǎng)格計算云端技術(shù),應(yīng)用腦卒中檢測方法與模式,連接臨床數(shù)據(jù)庫,開展腦卒中疾病的預(yù)防、康復(fù)、護理的干預(yù),對于提高腦卒中患者的生活質(zhì)量,降低腦卒中的病死率、發(fā)病率有重大的意義。
本文探討基于云計算的腦卒中大數(shù)據(jù)平臺的構(gòu)建,為智慧醫(yī)療體系提供借鑒。
腦卒中數(shù)據(jù)來源于參與的醫(yī)院,數(shù)據(jù)采集須標準化與規(guī)范化。在采集過程中,須保證數(shù)據(jù)采集的自動化水平,即數(shù)據(jù)采集、交換、處理自動化,覆蓋完全化、數(shù)據(jù)大規(guī)?;⑿畔r值最大化[5-7]。因此,在腦卒中數(shù)據(jù)管理中,必須要制定嚴格的腦卒中數(shù)據(jù)標準,確保數(shù)據(jù)存儲過程中安全、穩(wěn)定,為后續(xù)的腦卒中預(yù)防、康復(fù)、護理提供數(shù)據(jù)支持。腦卒中大數(shù)據(jù)分析要圍繞臨床質(zhì)控、科研支撐、公共服務(wù)等目標。
腦卒中大數(shù)據(jù)平臺中的數(shù)據(jù)要具備一定的特征參量的提取能力,腦卒中的大數(shù)據(jù)來源多元化,包括患者影像數(shù)據(jù)、患者基本信息數(shù)據(jù)、家庭、社區(qū)等。數(shù)據(jù)既有結(jié)構(gòu)化的也有非結(jié)構(gòu)化、半結(jié)構(gòu)化的,數(shù)據(jù)復(fù)雜;數(shù)據(jù)的使用需求既有決策使用、分析使用、開發(fā)使用等不同需求;數(shù)據(jù)類型也包括患者病史、用藥、各種體檢等信息數(shù)據(jù)。因此,數(shù)據(jù)必須進行清洗等處理,是按腦卒中大數(shù)據(jù)的特征參量化、結(jié)構(gòu)化,使之能夠作為數(shù)據(jù)分析的目標。
基于云計算的腦卒中預(yù)防、康復(fù)、護理醫(yī)療服務(wù)大數(shù)據(jù)平臺使面向腦卒中個體化信息服務(wù)的系統(tǒng),用戶主要是患者(家屬)、醫(yī)療機構(gòu)、平臺管理員?;颊哂脩粼谑褂么髷?shù)據(jù)應(yīng)用平臺中獲取康復(fù)過程中的幫助信息,更好的為身體康復(fù)服務(wù);醫(yī)療機構(gòu)人員在使用大數(shù)據(jù)平臺過程中,實現(xiàn)智能診斷服務(wù),精準醫(yī)療服務(wù)[4];系統(tǒng)管理員是維護系統(tǒng)正常運作的工作人員,系統(tǒng)管理員可對系統(tǒng)的使用權(quán)限予以設(shè)定、對系統(tǒng)的平穩(wěn)運行實施技術(shù)維護。
每天各個醫(yī)院、社區(qū)、家庭、個人都會產(chǎn)生海量醫(yī)療信息數(shù)據(jù),為保障腦卒中大數(shù)據(jù)平臺的數(shù)據(jù)共享與協(xié)同訪問,對腦卒中大數(shù)據(jù)平臺有嚴格的技術(shù)要求:并發(fā)處理能力、并發(fā)訪問能力。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫無法滿足大規(guī)模、高頻率的數(shù)據(jù)存儲與訪問,基于腦卒中大數(shù)據(jù)分析的海量數(shù)據(jù)存儲與處理要求,本系統(tǒng)架構(gòu)采用Hadoop分布式框架,以HBase數(shù)據(jù)庫作為腦卒中大數(shù)據(jù)存儲系統(tǒng),本系統(tǒng)架構(gòu)如圖1所示。
圖1 系統(tǒng)架構(gòu)圖
傳統(tǒng)的關(guān)系型數(shù)據(jù)庫無法滿足大規(guī)模、海量數(shù)據(jù)的存儲處理要求,采用HBase數(shù)據(jù)庫可解決海量數(shù)據(jù)的讀取、存儲瓶頸問題。利用基于Hadoop云計算的分布式系統(tǒng)集群優(yōu)勢實現(xiàn)大數(shù)據(jù)的并行計算[5-8]。數(shù)據(jù)庫需要高效的存儲讀寫策略,存儲管理技術(shù)中涉及數(shù)據(jù)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的集成統(tǒng)一管理。
數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)模型采用衛(wèi)生部《城鄉(xiāng)居民健康檔案基本數(shù)據(jù)集》規(guī)定的數(shù)據(jù)元素。應(yīng)用規(guī)范化、一致性的數(shù)據(jù)劃分原則,實現(xiàn)完善的個人健康數(shù)據(jù)中心,合理的為醫(yī)院、社區(qū)、家庭、個人數(shù)據(jù)交換、共享和深入數(shù)據(jù)挖掘提供基礎(chǔ)服務(wù)。根據(jù)衛(wèi)生部《城鄉(xiāng)居民健康檔案基本數(shù)據(jù)集》的信息,確立數(shù)據(jù)元模型,如表1所示。
表1 數(shù)據(jù)元模型
由于數(shù)據(jù)來源于不同醫(yī)療機構(gòu)、家庭、個人,不同機構(gòu)的數(shù)據(jù)庫采用的表結(jié)構(gòu)不同,因此,為便于數(shù)據(jù)庫的可擴展性、數(shù)據(jù)庫之間異構(gòu)差異透明傳輸,本大數(shù)據(jù)平臺采用SOAP訪問協(xié)議,采用SOAP Web Service技術(shù)實現(xiàn)同步傳輸。接口設(shè)計需著眼于數(shù)據(jù)傳輸?shù)耐叫詫崿F(xiàn)。用戶可用的業(yè)務(wù)邏輯接口需要實現(xiàn)從醫(yī)療機構(gòu)-大數(shù)據(jù)平臺的數(shù)據(jù)同步傳輸。腦卒中數(shù)據(jù)挖掘過程需要平臺使用者與平臺
腦卒中患者的數(shù)據(jù)信息海量存儲、交換、分析,為腦卒中預(yù)防、康復(fù)、護理等醫(yī)療服務(wù)提供決策支持,系統(tǒng)平臺的數(shù)據(jù)分析處理技術(shù)主要包括大數(shù)據(jù)的預(yù)處理、數(shù)據(jù)挖掘算法、數(shù)據(jù)分析接口等技術(shù)。
腦卒中數(shù)據(jù)來源多元化,數(shù)據(jù)結(jié)構(gòu)復(fù)雜化、多樣化,既有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù),也有半結(jié)構(gòu)化數(shù)據(jù),此外,數(shù)據(jù)還具有多樣性、動態(tài)性等參量特征。腦卒中的數(shù)據(jù)挖掘分析需要對腦卒中的大數(shù)據(jù)進行清洗、去除空缺、去除噪聲數(shù)據(jù),完成數(shù)據(jù)文本、數(shù)值與預(yù)定義的掩碼相一致。
腦卒中數(shù)據(jù)挖掘算法即數(shù)據(jù)的分類算法涉及聚類、分類等技術(shù),應(yīng)用數(shù)據(jù)挖掘技術(shù)實現(xiàn)腦卒中的數(shù)據(jù)聚合與分類[6-10]?;谀X卒中數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的分析過程,構(gòu)建數(shù)據(jù)篩查、腦卒中患者的治療模型,圍繞特定的目標人群和醫(yī)院、個體化的康復(fù)、預(yù)防與護理服務(wù)。應(yīng)用統(tǒng)計學(xué)分析中的關(guān)聯(lián)、回歸、神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)等算法技術(shù),尋找腦卒中數(shù)據(jù)中的參量特征相關(guān)性、關(guān)聯(lián)性,應(yīng)用異常檢測、預(yù)測、關(guān)聯(lián)分析,實現(xiàn)多維度、組間數(shù)據(jù)中的關(guān)系,為腦卒中患者的預(yù)防、康復(fù)、護理提供智能決策診斷服務(wù)。
本文對應(yīng)用數(shù)據(jù)挖掘技術(shù)的腦卒中預(yù)防、康復(fù)、護理醫(yī)療服務(wù)大數(shù)據(jù)平臺構(gòu)建研究,研究中初步研究了系統(tǒng)需求、系統(tǒng)架構(gòu)、關(guān)鍵技術(shù)[11-13]?;谠朴嬎愕哪X卒中預(yù)防、康復(fù)護理醫(yī)療大數(shù)據(jù)平臺的實現(xiàn),最終可為腦卒中的醫(yī)療服務(wù)提供幫助。
隨著我國人口老齡化的進程加快,腦卒中發(fā)病率越來越高,如何利用現(xiàn)代化智慧醫(yī)療技術(shù),提高腦卒中患者的智能化診療水平,控制腦卒中患者的發(fā)病機會和提高康復(fù)水平,是我國醫(yī)療服務(wù)的重要研究方向?;谠朴嬎愕哪X卒中預(yù)防、康復(fù)、護理醫(yī)療大數(shù)據(jù)服務(wù)平臺,在優(yōu)化醫(yī)療服務(wù)、促進我國健康信息服務(wù)和智能化水平發(fā)揮重要的作用。