張冬+錢君+闕挺
摘 要 目的:研究如何應(yīng)用大數(shù)據(jù)將體檢結(jié)果進行發(fā)掘和分析,提高針對企業(yè)團體的體檢服務(wù)質(zhì)量。方法:以上海郵電醫(yī)院2011—2016年體檢數(shù)據(jù)為基礎(chǔ),進行大數(shù)據(jù)分析并應(yīng)用到體檢服務(wù)中。結(jié)果:企業(yè)員工獲取體檢報告時間縮短了80%,報告的制作效率提高了50%,醫(yī)院通過體檢大數(shù)據(jù)分析進行客戶隨訪,客戶滿意率和預(yù)約就診人數(shù)上升。結(jié)論:企業(yè)團體的體檢大數(shù)據(jù),在檢后流程中對個人、企業(yè)、醫(yī)院都有很高的應(yīng)用價值和發(fā)展前景。
關(guān)鍵詞 體檢 大數(shù)據(jù) 企業(yè)團體
中圖分類號:R194.3 文獻標識碼:B 文章編號:1006-1533(2017)23-0061-03
Application of big data from collective medical examination of enterprise in the following process*
ZHANG Dong, QIAN Jun, QUE Ting
(Information Centre, Shanghai Postal and Telecommunication Hospital, Shanghai 200040, China)
ABSTRACT Objective: To study how to dig out and analyze the result of medical examination through big data calculation so as to improve the quality of medical examination service for enterprise group. Methods: The big data from medical examination performed from 2011 into 2016 in our hospital were analyzed and the results were applied to the medical examination service. Results: The time for the employees to get medical report was shortened by 80%, the efficiency for making enterprise report increased by 50%, and patient satisfaction rate and the number of visiting doctor by appointments were increased by analysis of these data and then the follow-up. Conclusion: The analysis of big data from medical examination possesses high application value and prospect to individuals, enterprises and hospitals.
KEY WORDS medical examination; big data; enterprise group
上海郵電醫(yī)院作為一家由企業(yè)創(chuàng)辦的二級甲等醫(yī)院,每年為超過5萬人次企業(yè)職工提供體檢服務(wù),為了不斷提高體檢服務(wù)質(zhì)量,醫(yī)院希望結(jié)合互聯(lián)網(wǎng)和移動應(yīng)用技術(shù),為企業(yè)和職工提供更全面的企業(yè)整體和個人的體檢數(shù)據(jù)和評估分析,并能幫助醫(yī)療人員更快、更精準地發(fā)現(xiàn)有健康問題的企業(yè)職工[1]。目前,醫(yī)院的體檢業(yè)務(wù)已基本實現(xiàn)信息化操作,但沒有更深層次的數(shù)據(jù)發(fā)掘,為此,我們將研究如何通過大數(shù)據(jù)計算將體檢結(jié)果數(shù)據(jù)進行發(fā)掘和分析,生成針對企業(yè)、個人、醫(yī)生三種不同角色的體檢分析數(shù)據(jù),并將最終數(shù)據(jù)通過互聯(lián)網(wǎng)安全地發(fā)送數(shù)據(jù)到不同的用戶終端。
1 研究方法
此次我們研究的重點是大數(shù)據(jù)技術(shù)在體檢后的應(yīng)用模式和效果分析,同時對所涉數(shù)據(jù)庫和軟件開發(fā)技術(shù)做必要說明,主要分析實際運行效率。
根據(jù)目前上海郵電醫(yī)院體檢系統(tǒng)的環(huán)境,我們將任務(wù)分解成以下步驟,并逐一研究其中涉及的互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù):①建立索引。建立體檢個人、團隊的唯一索引,為數(shù)據(jù)計算和分析提供基礎(chǔ)。②抽取數(shù)據(jù)。抽取體檢數(shù)據(jù)中檢查、檢驗等數(shù)據(jù)性指標以及診斷、評估、建議等描述性結(jié)果,按標準化數(shù)據(jù)格式進行轉(zhuǎn)化。③設(shè)計模型。建立個人健康評分和疾病統(tǒng)計分析計算模型,對格式化體檢數(shù)據(jù)進行計算得到結(jié)果。④信息傳送。為個人、企業(yè)、醫(yī)生等不同使用對象設(shè)計不同的軟件界面和功能,通過互聯(lián)網(wǎng)將所需查詢的體檢指數(shù)安全地傳輸?shù)接嬎銠C、平板電腦、手機等網(wǎng)絡(luò)終端上(圖1)。
1.1 建立索引
首先,要建立一個不基于任何特定體檢系統(tǒng)的具有相對統(tǒng)一規(guī)范的專用數(shù)據(jù)庫,簡稱為“eHealth”數(shù)據(jù)庫,再通過與不同體檢系統(tǒng)的數(shù)據(jù)接口程序?qū)Ⅲw檢數(shù)據(jù)按統(tǒng)一格式進行轉(zhuǎn)換和存儲。數(shù)據(jù)傳送完成后,需要在“eHealth”庫中進行體檢人員和企業(yè)主索引重建和關(guān)聯(lián)的工作。
根據(jù)醫(yī)療健康信息傳輸與交換標準HL7[2]消息的患者表示信息段(PID)的定義,一般體檢系統(tǒng)中基本能獲取的患者標識信息主要包括患者ID、姓名、出生日期、性別、地址、電話、聯(lián)系人、婚姻狀況、社保卡號和身份證號等多個元素,按特定權(quán)重計算相似度系數(shù),根據(jù)不同體檢系統(tǒng)人員信息錄入完整性設(shè)置特定相似度系數(shù)進行二次索引(表1,表2)。
用相似度系數(shù)50對2012—2016年的27萬人次體檢數(shù)據(jù)進行主索引生成作業(yè),運行時長25 min,屬于可接受的范圍,作業(yè)完成后形成7萬條左右主索引數(shù)據(jù),體檢次數(shù)超過3次的人數(shù)為5萬人,與實際情況符合。
1.2 抽取數(shù)據(jù)[3]
體檢過程中會生成大量不同類型的數(shù)據(jù),有可量化的數(shù)值型,有文字描述的文本型,有直觀表述的影像型。在數(shù)據(jù)抽取時只選取可進行分析計算的數(shù)值型和文本型數(shù)據(jù),存放到“eHealth”庫中。抽取數(shù)據(jù)后按數(shù)據(jù)的類型和功能性進行格式轉(zhuǎn)換和存儲(表3)。
在數(shù)據(jù)表設(shè)計方面,以主要的體檢結(jié)果數(shù)據(jù)表T_ EXAM_RESULT為例,說明整體數(shù)據(jù)存放結(jié)構(gòu)(表4)。
通過數(shù)據(jù)轉(zhuǎn)換接口,主要體檢結(jié)果將按統(tǒng)一格式存放到此表中,從多維度觀察數(shù)據(jù)分析結(jié)果,通過對企業(yè)、個人信息的單個或多個元素進行分類匯總計算,分析人群和年齡分段的各項數(shù)據(jù)。
1.3 設(shè)計模型
建立個人健康評分和疾病統(tǒng)計分析計算模型,對格式化體檢數(shù)據(jù)進行計算得到結(jié)果。根據(jù)臨床需求,設(shè)置不同查詢統(tǒng)計模型,生成精準個人和群體數(shù)據(jù),分別為體檢后隨訪、臨床科研和企業(yè)客戶統(tǒng)計分析提供數(shù)據(jù)支持。本次研究中對疾病統(tǒng)計分析有兩種方式。
1)基于醫(yī)生診斷模式。統(tǒng)計分析的疾病依據(jù)將以醫(yī)生判斷為準,同時根據(jù)不同疾病的要求抽取該疾病的相關(guān)化驗、檢查指標,按人群進行分類統(tǒng)計分析。
醫(yī)生診斷模式的疾病分析主表為T_EXAM_ HEALTH,對應(yīng)源數(shù)據(jù)庫TJ_TJJBK表,主要包含體檢疾病數(shù)據(jù)。優(yōu)點:基于已有疾病庫統(tǒng)計,結(jié)論相對于精確,數(shù)據(jù)偏離較小,可追溯到疾病診斷醫(yī)生,準確性基于體檢醫(yī)生和評估醫(yī)生的專業(yè)能力,一般專業(yè)體檢機構(gòu)出錯概率較小,可以把統(tǒng)計分析結(jié)果直接運用于企業(yè)總體健康報告和個人健康報告。
缺點:無法充分發(fā)揮大數(shù)據(jù)計算優(yōu)勢,過于依賴人為判斷,容易忽視無明顯單一指標特征的健康隱患,無法從歷史數(shù)據(jù)角度進行疾病趨勢分析。
2)基于系統(tǒng)計算模式。發(fā)揮大數(shù)據(jù)優(yōu)勢,事先不參考醫(yī)生疾病診斷庫,在化驗、檢查、既往史和家族史等各項信息中抽取各種疾病相關(guān)指標和關(guān)鍵字,綜合歷史體檢數(shù)據(jù)由系統(tǒng)自動計算體檢客戶的各項疾病風險和變化趨勢(表5)。
優(yōu)點:充分使用大數(shù)據(jù)在數(shù)據(jù)廣度和時間維度的優(yōu)勢,發(fā)掘容易被人工診斷遺漏的信息,減少人為判斷失誤和錄入錯誤等因素;疾病風險可追溯到具體致病指標和因素,便于進一步診斷和治療;可預(yù)留數(shù)據(jù)接口不斷增加和優(yōu)化健康分析模型,豐富疾病分析的種類和適應(yīng)新的疾病診斷。
缺點:對疾病分析模型的確立要求較高,需大量參考臨床專家經(jīng)驗和醫(yī)學(xué)知識庫進行綜合設(shè)計;某些主觀經(jīng)驗診斷疾病的統(tǒng)計分析精準度不如基于醫(yī)生診斷模式;對網(wǎng)絡(luò)系統(tǒng)計算能力要求較高,需優(yōu)化數(shù)據(jù)提取方式和計算模型。
1.4 信息傳送
當數(shù)據(jù)產(chǎn)生后需要將相應(yīng)的信息傳送給相應(yīng)的使用對象,一般體檢信息結(jié)果有3個傳遞方向:個人、企業(yè)、醫(yī)生。
1)個人
個人數(shù)據(jù)的傳輸需要做到完整性、便捷性和安全性。
完整性能使體檢客戶直接查詢到個人本次和歷次的完整報告,并能有疾病風險、健康處方、就醫(yī)指南等提示信息,有歷年報告的可實現(xiàn)歷史報告調(diào)閱、趨勢分析等擴展功能。
為體現(xiàn)便捷性,系統(tǒng)自動獲取客戶體檢報告中的異常信息,第一時間主動發(fā)送到用戶手機,最快速度告知客戶自身健康狀況,通過醫(yī)院官網(wǎng)、微信公眾號(圖2)等形式用戶可以自助查詢到體檢報告和相關(guān)信息,這些形式往往比紙質(zhì)報告速度更快(表6),信息更全面[4]。
以用戶主要使用報告方式“紙質(zhì)報告”和“網(wǎng)站、微信”取得報告平均時間計算,等待時間減少了80%。
在數(shù)據(jù)安全性方面,需通知企業(yè)將體檢職工手機信息統(tǒng)一發(fā)送給體檢中心,職工體檢前確認個人手機號碼,在網(wǎng)上查詢個人體檢信息時通過短信和密碼雙重驗證,在數(shù)據(jù)傳輸時需用加密傳輸協(xié)議,以免網(wǎng)絡(luò)數(shù)據(jù)包被截取使體檢人員信息泄漏[5]。
2)企業(yè)
企業(yè)關(guān)心的是員工整體的健康狀況,通過體檢大數(shù)據(jù)分析可以生產(chǎn)統(tǒng)一格式化的員工健康分析數(shù)據(jù),包括疾病分析、人群健康分析、健康趨勢分析[6]。
通過應(yīng)用體檢大數(shù)據(jù)進行企業(yè)員工健康分析后,健康分析報告的制作效率和數(shù)據(jù)的準確性,比原先人工分析大幅度提高。報告的內(nèi)容可以根據(jù)企業(yè)類型的不同進行個性化數(shù)據(jù)定制,以便為不同類型企業(yè)制作適應(yīng)行業(yè)要求的健康報告。
在使用企業(yè)體檢大數(shù)據(jù)分析之前,生成一家企業(yè)體檢統(tǒng)計數(shù)據(jù)需專業(yè)人員花費約2 h,使用新方法后,一般操作人員只需約1 h就能完成。
3)醫(yī)生
體檢大數(shù)據(jù)應(yīng)用對醫(yī)生在體檢后的工作也具有相當重要的幫助。一方面,對體檢數(shù)據(jù)的深度發(fā)掘是臨床科研的寶貴數(shù)據(jù)來源,尤其是隨著“健康管理”和“治未病”理念的不斷深入,體檢數(shù)據(jù)可以反應(yīng)特定人群的健康狀況和趨勢,進行跟蹤對比,可以對某些疾病的誘發(fā)因素進行分析研究,具有很高的科研價值。另一方面,對體檢數(shù)據(jù)中的亞健康人群的主動檢后隨訪,可以讓參加體檢的人對自身健康狀況有更清晰的認識,及時進行相應(yīng)的預(yù)防保健或臨床治療。
在實際應(yīng)用中,客戶的隱私非常重要,要注意體檢大數(shù)據(jù)的使用權(quán)限,在作為科研分析的應(yīng)用中數(shù)據(jù)不能包含客戶的個人資料;在檢后隨訪的應(yīng)用中,需要控制獲取客戶信息的途徑和權(quán)限,記錄每次獲取客戶信息的操作日志,做到可以追溯,如客戶明確不愿意參與隨訪,系統(tǒng)將明確標識,阻止其他人員對該客戶的信息獲取。
2 結(jié)論
企業(yè)團體的體檢大數(shù)據(jù),在檢后流程中對個人、企業(yè)、醫(yī)院都有很高的應(yīng)用價值和發(fā)展前景,同時還有許多方面需要進一步研究探索。
參考文獻
[1] 劉鋒, 曾凡, 黃昊. 數(shù)字化體檢信息管理系統(tǒng)的設(shè)計與應(yīng)用[J]. 中國數(shù)字醫(yī)學(xué), 2011, 6(5): 78-80.
[2] 蔣巍巍, 王海舜, 汪齊舜. 面向健康體檢信息共享的HL7接口引擎設(shè)計[J]. 醫(yī)學(xué)信息, 2009, 22(9): 1701-1703.
[3] 阮宜才, 丁啟文. 基于關(guān)聯(lián)規(guī)則的醫(yī)院體檢數(shù)據(jù)挖掘[J].醫(yī)學(xué)信息, 2011, 24(3): 1484-1486.
[4] 陶鑫, 杜春煒, 蓋小榮. 短信服務(wù)平臺在健康體檢中的應(yīng)用效果[J]. 中華現(xiàn)代護理雜志, 2012, 18(4): 444-445.
[5] 賈瑞珍, 杜兵. 健康體檢的深層價值探討(附1300例體檢結(jié)果分析)[J]. 中國全科醫(yī)學(xué), 2007, 10(1): 58-59.
[6] 馬詩詩, 于廣軍, 崔文彬. 互聯(lián)網(wǎng)醫(yī)療的隱私保護與信息安全[J]. 上海醫(yī)藥, 2017, 38(9): 14-16.