桂小柯張麗杰陳禹保 周家蓬▲ 王麗娟劉潔琳溫紹君劉 康
1 北京市計算中心,北京 100094;2 首都醫(yī)科大學附屬北京安貞醫(yī)院,北京 100029;3 北京中醫(yī)藥大學東方學院,河北 廊坊 065001▲通訊作者:周家蓬 Email:zhoujp@bcc.ac.cn
基金項目:北科院海外人才項目(OTP-2011-011,OTP-2012-011),北自然重大項目(7120001),北京市計算中心萌芽計劃項目
論著
高血壓早期預警和健康管理平臺的構建
桂小柯1張麗杰1陳禹保1周家蓬1▲王麗娟2劉潔琳2溫紹君2劉 康3
1 北京市計算中心,北京 100094;2 首都醫(yī)科大學附屬北京安貞醫(yī)院,北京 100029;3 北京中醫(yī)藥大學東方學院,河北 廊坊 065001▲通訊作者:周家蓬 Email:zhoujp@bcc.ac.cn
基金項目:北科院海外人才項目(OTP-2011-011,OTP-2012-011),北自然重大項目(7120001),北京市計算中心萌芽計劃項目
為了控制和降低高血壓的病死率、致殘率,提高患者知曉率、治療率,減輕高血壓以及其他慢性疾病對個人和社會造成的負擔,我們開發(fā)了高血壓早期預警和健康管理平臺。該平臺基于云計算和大數(shù)據(jù)挖掘技術,包括數(shù)據(jù)收集與檔案的建立、風險評估與重點人群分類、健康指導、效果評價等四個部分,平臺界面簡潔、使用簡便,可面向普通個人用戶,也可本地化到社區(qū)使用。
高血壓;健康管理;早期預警
高血壓是中風、心肌梗塞、心衰及外周動脈疾病的一個主要危險因素。隨著我國國民經(jīng)濟的快速發(fā)展,人民生活水平的日益提高,生活節(jié)奏的加快,工作壓力的增大,肥胖、吸煙、缺少運動、攝鹽量過多等危險因素的增多,高血壓患病率有升高的趨勢,因此提高患者的知曉率、治療率,構建高血壓早期預警系統(tǒng)具有重要的現(xiàn)實意義。
與高血壓早期預警類似,健康管理是在更大范圍內(nèi)對一般性人群的健康風險因素進行全面管理的過程,其宗旨是調(diào)動個人及集體的積極性,有效利用有限資源來達到最佳的健康效果,充分體現(xiàn)未病先防的健康理念。
收集已有的高血壓的病例對照數(shù)據(jù),利用數(shù)據(jù)挖掘的方法,構建出高血壓早期預警的模型,然后將此模型應用到平臺新的數(shù)據(jù)上進行高血壓早期預警。健康管理平臺通過多種途徑收集數(shù)據(jù),如圖1所示,把不同醫(yī)院體檢單位和終端采集儀器獲得的健康數(shù)據(jù),進行統(tǒng)一標準、統(tǒng)一格式,存放到北京市計算中心的數(shù)據(jù)庫內(nèi)。為每個用戶創(chuàng)建健康檔案,并對用戶的歷史數(shù)據(jù)進行可視化展示,同時結合用戶的健康指標信息和預警模型,對用戶的健康風險作出評估,并提出改善的指導建議。此平臺基于web以B/S結構的網(wǎng)絡形式提供服務。
圖1 業(yè)務系統(tǒng)流程
2.1 基于常規(guī)體檢數(shù)據(jù)的模型
參考已有的研究[1],與北京市安貞醫(yī)院合作,獲取1048例常規(guī)體檢數(shù)據(jù),其中病例高血壓773例,正常對照275例,年齡介于16~86歲之間。數(shù)據(jù)涵蓋了性別,年齡,家族史數(shù)字,血脂異常,吸煙數(shù)字,飲酒數(shù)字,收縮壓,舒張壓,高鹽飲食,BMI,心率,ALT,BUN,CRE,UA,CHO,LDL,HDL等生理生化指標信息。采用多元線性回歸的方法,分別以收縮壓和舒張壓作為依變量進行回歸分析,多元線性回歸結果顯示性別、年齡、吸煙、飲酒、BMI、心率、CRE以及UA對血壓值存在顯著影響(P<0.05)。由于醫(yī)院和體檢中心常采用是否患高血壓來記錄病人檔案,同時為了避免健康管理用戶血壓值測量不準確引進誤差,因此本研究將血壓值轉(zhuǎn)化為是否患病的離散變量,對其進行l(wèi)ogistic回歸分析[2],構建出在不同風險因素下高血壓患病風險的模型。
2.2 基于基因數(shù)據(jù)的模型
根據(jù)各年齡段血壓的正常值[3],基因?qū)ρ獕褐档挠绊懀?],生活習慣、環(huán)境因素等對血壓的影響模擬了16847例樣本數(shù)據(jù),樣本數(shù)據(jù)考慮了基因、年齡、性別、體質(zhì)指數(shù)、攝鹽量、攝油量、抽煙、飲酒、孤獨感、壓力等十個風險因素,我們對該數(shù)據(jù)集進行風險因素相關性分析,并使用最小近鄰法(KNN)對各種風險因素缺失的情況下預測準確性進行評估,發(fā)現(xiàn)基因信息是模型準確預測的關鍵,見表1。
表1 風險因素和預測效果
由表1不難發(fā)現(xiàn),作為內(nèi)在遺傳因素的基因所扮演的角色似乎是無可替代的,而其他若干外界環(huán)境因素的缺失對整體預測效果影響并不大,這是由于外界因素彼此間的相關度較高(彼此可以彌補缺失信息)。除了KNN法,另外三種常用的機器學習方法也在本研究中加以運用:人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVM)和隨機森林(Random forest),預測效果基本一致。
3.1 數(shù)據(jù)采集和存儲模塊
健康數(shù)據(jù)的采集主要通過以下三種方式:(1)用戶在網(wǎng)站個人中心頁面上填寫健康信息并提交;(2)上傳電子病歷或者體檢報告;(3)自動采集,通過特定的便攜式終端采集系統(tǒng)自動上傳。便攜式終端自動采集系統(tǒng)包括電子血壓血糖儀、心電檢測儀等,用戶建檔以后,可以通過刷身份證實現(xiàn)快捷登錄,能夠?qū)崟r上傳健康數(shù)據(jù),并對數(shù)據(jù)進行實時展示。
存儲方面,使用開源的MySQL作為數(shù)據(jù)庫管理系統(tǒng),一個表存放一類健康數(shù)據(jù),以用戶為中心建立多表之間的一一對應關系,確保數(shù)據(jù)的正確性和完整性。對于不同類型的用戶設置不同的權限級別,防止對數(shù)據(jù)的非法操作。通過搭建高可用性的MySQL集群,根據(jù)負載在不同數(shù)據(jù)庫節(jié)點間分擔訪問壓力,保證服務的高可用性。
3.2 健康風險分析模塊
健康風險分析模塊主要針對不同人群和個體:(1)根據(jù)年齡、性別以及健康狀態(tài)等特點對人群進行分類。我們將人群分為18歲以下、18~30歲、30~40歲、40~50歲等亞組,并根據(jù)對方多項健康指標劃歸為健康組、亞健康組、低危組、高危組等。通過組內(nèi)及組間健康狀態(tài)及風險因素的綜合比較,篩選出顯著發(fā)病風險因素。(2)由于個體存在遺傳上的差異,通過群體水平的數(shù)據(jù)構建出的健康模型,應用到不同個體時會有偏差,因此平臺可結合用戶累積上傳的數(shù)據(jù)(多個時間點)構建個體化預測模型,這體現(xiàn)了個體化醫(yī)療的思想。
3.3 健康指導模塊
健康指導模塊主要包括專家建議系統(tǒng)、個人健康實時管理等,具體形式包括手機短息通知本人或親友,以及通過網(wǎng)絡健康知識庫等互動形式提高用戶的積極性,使其主動了解和關注自己的健康狀況。(1)通知本人:依據(jù)各種影響健康的因素如氣溫突變等,系統(tǒng)適時通過短信或者電郵等方式,提醒客戶注意健康保健和及時體檢,以達到隨時隨地為客戶健康服務的目的;(2)親友提醒:提醒對象除了用戶本人以外,還可以綁定到親友家人的手機或者電郵;(3)健康知識庫:整合完備的健康信息知識庫,讓用戶主動去了解健康相關知識,自主地關注自己的健康。
3.4 健康管理效果評價模塊
本模塊的功能旨在幫助長期使用本平臺的客戶對個人的健康管理效果進行科學公正的評估,并及時有效地改善原分析模型,以使結果更加精準。本模塊核心算法采用一系列機器學習的方法,包括KNN、ANN、SVM、隨機森林等,旨在實現(xiàn)真正的個體化預測。
本平臺發(fā)布系統(tǒng)采用LAMP技術開發(fā)[5]。采用Linux系統(tǒng)環(huán)境,以Apache組件作為網(wǎng)絡服務器軟件,使用PHP編寫動態(tài)網(wǎng)頁,用MySQL作為服務器端數(shù)據(jù)庫開發(fā)環(huán)境,采用B/S服務模式,通過域名(http://he.biocloud.org.cn)為互聯(lián)網(wǎng)為用戶提供一種直觀高效,簡單易用的圖形界面。使用用戶在任何一個地方通過能連接互聯(lián)網(wǎng)的設備上的瀏覽器,就可以注冊登錄,進行健康管理。
由于利用一系列機器學習的數(shù)學模型進行健康風險評估需要大量的運算,因此本平臺主要采用分布式計算框架對任務進行調(diào)度;同時也初步采用云計算技術中針對大數(shù)據(jù)、特別是非結構化大數(shù)據(jù)的Hadoop平臺[6],結合Rhadoop等方法,將部分計算任務和結果存取任務分解到多臺Hadoop計算節(jié)點上,確保及時響應大數(shù)據(jù)用戶的查詢請求。
據(jù)報道,80%的醫(yī)療支出用在了那些可以預防的疾病上。因此最根本的任務是防疾病于未然,將疾病消滅在萌芽狀態(tài),這就是健康風險評估的內(nèi)容,包括了高血壓等慢性疾病的預測。健康管理在西方發(fā)達國家已經(jīng)有多年的實踐[7],我國起步較晚,但現(xiàn)在也已經(jīng)呈現(xiàn)蓬勃發(fā)展的態(tài)勢,健康管理服務公司如雨后春筍般涌現(xiàn),但絕大多數(shù)僅停留概念炒作,或者售賣檢測設備的原始階段,并沒有真正將用戶健康資源進行計劃、組織、加工利用。
伴隨著我國老齡化社會的到來,健康管理和疾病預警將會是極其有意義的事業(yè)。因此,我們采用完全免費的系統(tǒng)及軟件,構建了該高血壓早期預警及健康管理平臺的測試版,供廣大醫(yī)療健康管理工作者及相關的科研工作者參考。
[1]Echouffo-Tcheugui JB,Batty GD,Kivim?ki M,Kengne AP.Risk models to predict hypertension.A Systematic Review. PloS one.2013;8(7):e67370.
[2]倪延延,盧錦榮,張晉昕.二分類反應變量多水平模型及其軟件實現(xiàn).中國衛(wèi)生信息管理雜志,2013(1):75-80.
[3]Shimada K, Fujita T,Ito S, Naritomi H, Ogihara T,Shimamoto K, Tanaka H,Yoshiike N.The importance of home blood pressure measurement for preventing stroke and cardiovascular disease in hypertensive patients:a subanalysis of the Japan Hypertension Evaluation with Angiotensin II Antagonist Losartan Therapy (J-HEALTH) study. a prospective nationwide observational study.Hypertension Research.2008;31(10):1903-11.
[4]Kim YJ,Go MJ,Hu C,Hong CB,Kim YK.Large-scale genome-wide association studies in East Asians identify new genetic loci influencing metabolic traits.Nature genetics.2011;43(10):990-5.
[5]余立強.LAMP架構搭建與網(wǎng)站運行實例.網(wǎng)絡與信息,2011,25(8):50-2.
[6]White T.Hadoop:the definitive guide.O'Reilly.2012.
[7]張士靖,周志超,杜建,等.國內(nèi)外健康管理研究熱點對比分析.醫(yī)學信息學雜志,2010(4):6-10.
Construction of Hypertension Early Warning and Health Management Platform
GUI Xiaoke1ZHANG Lijie1CHEN Yubao1ZHOU Jiapeng1WANG Lijuan2LIU Jielin2WEN Shaojun2LIU Kang3
1 Beijing Computing Center,Beijing 100094,China;2 Beijing An Zhen Hospital,Beijing 100029,China;3 Beijing University of Chinese Medicine Dongfang College,Langfang Hebei 065001,China
A hypertension early warning and health management platform was built,in order to control the mortality and morbidity of hypertension via improving patients' awareness,and to reduce the economic burden for individuals and the society.The platform is based on cloud computing and big data mining techniques,and is composed of four parts:data collection and archives risk assessment and classification for populations of different health grades health guidance and evaluation of effects of risk factors.
Hypertension,Health management,Early warning
R473.2
B
1674-9316(2014)21-0001-03
10.3969/J.ISSN.1674-9316.2014.21.001