周 英 魏玉瓊 施 宇 張 曼 帥 文 何 萍
(同濟(jì)大學(xué)附屬第一婦嬰保健院 上海 201204) (萬達(dá)信息股份有限公司上海 201112) (同濟(jì)大學(xué)附屬第一婦嬰保健院 上海 201204) (上海申康醫(yī)院發(fā)展中心 上海 200041)
大數(shù)據(jù)時(shí)代各行各業(yè)產(chǎn)生并積累大量數(shù)據(jù)。醫(yī)院數(shù)據(jù)來源多樣、標(biāo)準(zhǔn)化程度低、質(zhì)量不一,且分析挖掘技術(shù)水平較低,對(duì)醫(yī)療大數(shù)據(jù)利用有較大影響。為解決婦嬰各業(yè)務(wù)系統(tǒng)之間數(shù)據(jù)交換與分析難題,建立面向患者全程管理的婦嬰數(shù)據(jù)中臺(tái),利用統(tǒng)一接口將醫(yī)院海量數(shù)據(jù)接入,分類處理后對(duì)標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行存儲(chǔ),形成大數(shù)據(jù)資產(chǎn)。利用智能算法集中分析數(shù)據(jù),將數(shù)據(jù)模型按照應(yīng)用要求進(jìn)行服務(wù)封裝,最終高效、快捷地輸出給醫(yī)院。本文基于數(shù)據(jù)中臺(tái)分析總結(jié)上海市第一婦嬰保健院分時(shí)段預(yù)約診療服務(wù)及應(yīng)用效果,得出分時(shí)段預(yù)約診療服務(wù)改善門診就診環(huán)境,縮短患者候診時(shí)間,取得顯著應(yīng)用成效。
圖1 數(shù)據(jù)中臺(tái)架構(gòu)
2.1.1 基礎(chǔ)設(shè)施層 數(shù)據(jù)中臺(tái)的基礎(chǔ)支撐,提供構(gòu)建平臺(tái)所需的軟硬件設(shè)備,包括防火墻、交換機(jī)、存儲(chǔ)器、服務(wù)器等。
2.1.2 數(shù)據(jù)層 包含醫(yī)院多種系統(tǒng)數(shù)據(jù)源,采用數(shù)據(jù)同步、結(jié)構(gòu)化、清洗等多個(gè)步驟對(duì)多源數(shù)據(jù)進(jìn)行規(guī)范化。
2.1.3 數(shù)據(jù)匯聚層 對(duì)指標(biāo)定義、業(yè)務(wù)口徑、技術(shù)口徑、指標(biāo)計(jì)算進(jìn)行嚴(yán)格規(guī)范,保證數(shù)據(jù)指標(biāo)準(zhǔn)確性,對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,最終使用Hadoop、HDFS、Redis等大數(shù)據(jù)存儲(chǔ)和計(jì)算工具對(duì)多源數(shù)據(jù)進(jìn)行匯聚。
2.1.4 數(shù)據(jù)服務(wù)層 用于不同主題和場(chǎng)景的數(shù)據(jù)應(yīng)用服務(wù)搭建,為實(shí)現(xiàn)數(shù)據(jù)中臺(tái)各類應(yīng)用服務(wù)的智能化集成與管理,采用面向服務(wù)架構(gòu)(Service Oriented Architecture,SOA)的企業(yè)服務(wù)總線(Enterprise Services Bus,ESB)集成架構(gòu)[5],以接口形式對(duì)外服務(wù),將計(jì)算好的數(shù)據(jù)根據(jù)需要封裝成接口服務(wù)于數(shù)據(jù)產(chǎn)品以及各個(gè)產(chǎn)品線使用,其中計(jì)算層通過統(tǒng)計(jì)分析和算法模型對(duì)數(shù)據(jù)進(jìn)行深入挖掘分析,為數(shù)據(jù)服務(wù)層產(chǎn)生有價(jià)值的中間計(jì)算結(jié)果。最終在ESB應(yīng)用集成基礎(chǔ)平臺(tái)上經(jīng)過數(shù)據(jù)應(yīng)用服務(wù)包裝,實(shí)時(shí)展現(xiàn)各項(xiàng)大數(shù)據(jù)分析指標(biāo)結(jié)果,為各部門臨床應(yīng)用、運(yùn)營(yíng)管理、輔助決策提供參考意見。
在數(shù)據(jù)中臺(tái)建設(shè)過程中,按照原國家衛(wèi)計(jì)委《醫(yī)院信息系統(tǒng)基本功能規(guī)范》相關(guān)規(guī)定,嚴(yán)格遵守國標(biāo)、行業(yè)標(biāo)準(zhǔn)及部標(biāo)數(shù)據(jù)標(biāo)準(zhǔn),補(bǔ)充各項(xiàng)業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn),強(qiáng)化數(shù)據(jù)標(biāo)準(zhǔn)化管理制度,保證數(shù)據(jù)交換共享的規(guī)范性、完整性和可靠性,通過采用本體映射和自然語言處理(Natural Language Processing,NLP)等方式對(duì)疾病診斷、實(shí)驗(yàn)室檢查、癥狀體征、病歷形態(tài)學(xué)、手術(shù)與操作、體格檢查、給藥途徑與頻次、單位、藥品名稱等實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化和結(jié)構(gòu)化。詞法分析能識(shí)別出文本串中的基本詞匯(分詞),對(duì)這些詞匯進(jìn)行重組、標(biāo)注組合后詞匯詞性,進(jìn)一步識(shí)別出命名實(shí)體;依存句法分析利用句子中詞與詞之間的依存關(guān)系來表示詞語句法結(jié)構(gòu)信息,用樹狀結(jié)構(gòu)來表示整句結(jié)構(gòu);詞向量表示可查詢?cè)~匯詞向量,實(shí)現(xiàn)文本的可計(jì)算;詞義與短文本相似度是判斷兩個(gè)給定詞語或文本的語義相似度。
2.3.1 概述 數(shù)據(jù)資產(chǎn)化的本質(zhì)是要有足夠的顆粒度和維度,直接用于業(yè)務(wù)場(chǎng)景,如患者、醫(yī)院、設(shè)備畫像。通過業(yè)務(wù)反推和基于患者信息聚合衍生的方式,形成疾病數(shù)據(jù)模型和運(yùn)營(yíng)模型?;诨颊咝畔⒕酆涎苌?,包括疾病診斷、實(shí)驗(yàn)室檢查、癥狀體征、病歷形態(tài)學(xué)、手術(shù)與操作、體格檢查、給藥途徑與頻次、藥品名稱等。
2.3.2 醫(yī)院業(yè)務(wù)需求 輔助決策支持,基于疾病數(shù)據(jù)的診療推薦;臨床質(zhì)量管理,通過患者分類和疾病數(shù)據(jù)的統(tǒng)計(jì)分析;病歷質(zhì)控/病案首頁,通過患者分類評(píng)價(jià)疾病數(shù)據(jù)的全面性和合理性;科研項(xiàng)目,基于疾病數(shù)據(jù)的展示與搜索;精細(xì)化運(yùn)行,根據(jù)疾病數(shù)據(jù)和醫(yī)院運(yùn)營(yíng)數(shù)據(jù)進(jìn)行描述與分析。
2.3.3 關(guān)鍵數(shù)據(jù)模型 疾病數(shù)據(jù)模型(專科維度的患者數(shù)據(jù)及其衍生數(shù)據(jù);與疾病關(guān)聯(lián)的組學(xué)數(shù)據(jù)等);疾病推理數(shù)據(jù)模型(患者分類;重要事件,如不良反應(yīng)、并發(fā)癥、結(jié)局等;表型等);醫(yī)院基本信息(地區(qū)、等級(jí)、床位數(shù)、科室、醫(yī)生數(shù)量等);醫(yī)院運(yùn)營(yíng)數(shù)據(jù)模型(預(yù)約、門診、住院人次及手術(shù)、費(fèi)用數(shù)量等)。
2.4.1 知識(shí)庫 包括3部分。一是通用知識(shí),包括常見的藥品知識(shí)檢驗(yàn)、檢查知識(shí);二是模塊化疾病知識(shí),包括篩查診斷手術(shù)和操作指引知識(shí);三是疾病知識(shí),包括疾病指南和專家共識(shí)。以國際SNOMED、LOINC等為典范,以臨床需求為基礎(chǔ),以專病為粒度,推進(jìn)術(shù)語庫建設(shè)與使用。
2.4.2 指標(biāo)標(biāo)準(zhǔn)管理體系 包括5部分。一是流行病學(xué)數(shù)據(jù),建立篩查、并發(fā)癥、不良反應(yīng)、預(yù)后指標(biāo);二是臨床路徑和指南,設(shè)定病種診療流程指標(biāo);三是醫(yī)院和科室質(zhì)量標(biāo)準(zhǔn),醫(yī)院對(duì)不同病種設(shè)立臨床質(zhì)量管理要求;四是國家對(duì)重大疾病的要求,國家根據(jù)國民健康要求,設(shè)定重大疾病管理要求;五是績(jī)效管理與按疾病診斷相關(guān)分組(Diagnosis Related Group System,DRGs),設(shè)定醫(yī)院運(yùn)營(yíng)指標(biāo)。
2.5.1 基本概念 開放應(yīng)用程序接口(Application Program Interface,API)是通過對(duì)API網(wǎng)關(guān)的訪問來獲取服務(wù)響應(yīng)結(jié)果,即通過API網(wǎng)關(guān)代理轉(zhuǎn)發(fā)請(qǐng)求到后端服務(wù)。與傳統(tǒng)的服務(wù)請(qǐng)求相比,增加新的網(wǎng)關(guān)層用于安全校驗(yàn)、流量控制、應(yīng)用鑒權(quán)等公共服務(wù)。
2.5.2 優(yōu)點(diǎn) 一是簡(jiǎn)化管理,對(duì)接、排錯(cuò)更簡(jiǎn)單、快速,減少數(shù)據(jù)治理工作量;二是數(shù)據(jù)安全,只需提供業(yè)務(wù)所需最小級(jí),減少不必要的數(shù)據(jù)暴露,進(jìn)行統(tǒng)一脫敏轉(zhuǎn)化,從而更好地保護(hù)患者隱私和醫(yī)院數(shù)據(jù)資產(chǎn)。開放API與傳統(tǒng)服務(wù)請(qǐng)求相比,可以避免對(duì)后端服務(wù)的惡意攻擊。
3.1.1 實(shí)驗(yàn)描述 未實(shí)行分時(shí)段預(yù)約時(shí),門診大廳擠滿患者,候診時(shí)間較長(zhǎng)[6-7]。上海市第一婦嬰保健院于2018年4月實(shí)施門診分時(shí)段預(yù)約診療服務(wù),覆蓋專家門診、普通門診和部分醫(yī)技科室,患者根據(jù)自身需求選擇不同時(shí)間段來院錯(cuò)峰就診。以專家門診、產(chǎn)前復(fù)診、婦科門診、B超檢查為例,現(xiàn)基于數(shù)據(jù)中臺(tái),利用醫(yī)院業(yè)務(wù)數(shù)據(jù)對(duì)比分析其分時(shí)段預(yù)約實(shí)施前后的患者候診時(shí)間。時(shí)間取自每日8-17點(diǎn),分為8個(gè)預(yù)約區(qū)間。分時(shí)段預(yù)約實(shí)施前的時(shí)間范圍取2017年5月1日-10月31日,樣本數(shù)量172 858個(gè);實(shí)施后的時(shí)間范圍取2018年5月1日-10月31日,樣本數(shù)量176 279個(gè)。
3.1.2 結(jié)果 實(shí)施前后患者候診時(shí)間實(shí)驗(yàn)對(duì)比結(jié)果,見表1。可以看出原本候診時(shí)間很長(zhǎng)的產(chǎn)前復(fù)診在分時(shí)段預(yù)約實(shí)施后候診時(shí)間大幅減少,改善患者就醫(yī)體驗(yàn)。其他3個(gè)科室類別候診時(shí)間也有較大幅度減少,成效顯著。
表1 實(shí)施前后患者候診時(shí)間變化(分鐘)
實(shí)施分時(shí)段預(yù)約以來,各預(yù)約區(qū)間患者候診時(shí)間顯著減少,患者可根據(jù)自身需求有計(jì)劃地安排就醫(yī)時(shí)間,錯(cuò)峰就診,極大改善就醫(yī)體驗(yàn),同時(shí)為醫(yī)院分流患者,解決門診擁擠問題,構(gòu)建有序的就醫(yī)環(huán)境[8-9]。
數(shù)據(jù)中臺(tái)基本理念是將所有數(shù)據(jù)匯聚到數(shù)據(jù)中臺(tái),每個(gè)應(yīng)用(包括指標(biāo)、分析、畫像、大數(shù)據(jù)類)均從數(shù)據(jù)中臺(tái)獲取數(shù)據(jù)。強(qiáng)調(diào)數(shù)據(jù)全面性以及數(shù)據(jù)中臺(tái)組織、應(yīng)用組織之間的協(xié)作關(guān)系。相較于數(shù)據(jù)倉庫,其具有以下優(yōu)勢(shì):整體規(guī)劃、統(tǒng)一建設(shè);不做重復(fù)性數(shù)據(jù)工作,所有數(shù)據(jù)在一個(gè)整體模型操作;綜合收益最大化,數(shù)據(jù)應(yīng)用開發(fā)效率更高。在數(shù)據(jù)中臺(tái)逐步擴(kuò)大數(shù)據(jù)應(yīng)用過程中還需要完善方法論與工具支撐、業(yè)務(wù)認(rèn)同、管理支撐。
大數(shù)據(jù)生態(tài)的核心是大數(shù)據(jù),大數(shù)據(jù)的核心是數(shù)據(jù)共享。數(shù)據(jù)共享可以提供各類數(shù)據(jù)服務(wù),實(shí)現(xiàn)數(shù)據(jù)高效調(diào)用。數(shù)據(jù)中臺(tái)整合醫(yī)院系統(tǒng)和業(yè)務(wù)數(shù)據(jù),統(tǒng)一數(shù)據(jù)質(zhì)量和口徑,開放API服務(wù)數(shù)據(jù)中臺(tái),提高數(shù)據(jù)挖掘、更新、使用效率。
通過松耦合的數(shù)據(jù)服務(wù)使業(yè)務(wù)復(fù)用。數(shù)據(jù)中臺(tái)通過重新編排、組合算法可以滿足服務(wù)接口響應(yīng)業(yè)務(wù)的基本需求,可以較低成本投入來構(gòu)建新的前端業(yè)務(wù),支持快速試錯(cuò)。
基于數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)整合、算法模型、數(shù)據(jù)應(yīng)用服務(wù)等核心要素構(gòu)建的數(shù)據(jù)中臺(tái),打破各業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)壁壘,有效整合和利用醫(yī)院業(yè)務(wù)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)共享。本文對(duì)基于數(shù)據(jù)中臺(tái)的分時(shí)段預(yù)約診療服務(wù)進(jìn)行分析,結(jié)果顯示分時(shí)段預(yù)約診療服務(wù)有較好的應(yīng)用成效,改善患者就診環(huán)境。未來將繼續(xù)利用數(shù)據(jù)中臺(tái)優(yōu)勢(shì),創(chuàng)新更多服務(wù)于患者的數(shù)據(jù)應(yīng)用,使患者獲得更好的就醫(yī)體驗(yàn)。