黃永生,孟 飛,付曉璇,江夢婷
(上海理工大學(xué)管理學(xué)院,上海 200093)
健康醫(yī)療大數(shù)據(jù)是指在疾病防治、健康管理等過程中產(chǎn)生的與健康醫(yī)療相關(guān)的數(shù)據(jù),包括自然人從出生到死亡的完整生命過程中產(chǎn)生的與健康活動有關(guān)的全部數(shù)據(jù),涉及患者診療信息、病歷記錄或者心理健康狀況等個人健康生理信息[1,2]。在2018 年國家衛(wèi)生健康委員會發(fā)布的《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》中,重點強調(diào)了要充分發(fā)揮健康醫(yī)療大數(shù)據(jù)作為國家重要基礎(chǔ)性戰(zhàn)略資源的作用。區(qū)域健康醫(yī)療大數(shù)據(jù)在推進(jìn)跨區(qū)域、跨機構(gòu)、跨部門的健康醫(yī)療數(shù)據(jù)共享、政府醫(yī)療監(jiān)管、臨床大數(shù)據(jù)應(yīng)用、科研大數(shù)據(jù)應(yīng)用、公共衛(wèi)生大數(shù)據(jù)應(yīng)用、醫(yī)療產(chǎn)品與服務(wù)個性化應(yīng)用等方面發(fā)揮重要作用[3-6]。而區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量的相關(guān)研究主要集中在數(shù)據(jù)質(zhì)量評價維度和指標(biāo)體系研究方面[7-10],少有從用戶需求角度對醫(yī)療數(shù)據(jù)質(zhì)量進(jìn)行評價研究[11-14]。目前的研究工作雖然在評價體系和評價方法方面取得了一系列的研究成果,卻存在難以滿足個性化用戶需求的問題。針對以上問題,本文提出了面向用戶需求的區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價框架,并通過應(yīng)用實例檢測所提方法的有效性,旨在為區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價工作提供新的研究思路和設(shè)計方法。
當(dāng)前,全國已建成多個省級和市級醫(yī)療數(shù)據(jù)中心,集成了居民健康檔案、電子病歷、疾病控制、疾病管理、醫(yī)學(xué)數(shù)字影像等業(yè)務(wù)相關(guān)數(shù)據(jù)集[15]。經(jīng)過處理的數(shù)據(jù)在醫(yī)療數(shù)據(jù)共享、政府醫(yī)療監(jiān)管、臨床大數(shù)據(jù)應(yīng)用、科研大數(shù)據(jù)應(yīng)用、公共衛(wèi)生大數(shù)據(jù)應(yīng)用、醫(yī)療產(chǎn)品與服務(wù)個性化等需求場景下發(fā)揮重要價值。但用戶難以判斷當(dāng)前使用的數(shù)據(jù)質(zhì)量是否滿足要求,另外針對特定需求場景,不同的數(shù)據(jù)集具有不同的質(zhì)量需求,有些數(shù)據(jù)集質(zhì)量較低但并不影響當(dāng)前業(yè)務(wù),但有些數(shù)據(jù)集質(zhì)量低下則不可接受[16,17]。例如,某些科研場景下只需要電子病歷和居民健康檔案業(yè)務(wù)相關(guān)數(shù)據(jù)集,而并不關(guān)心疾病控制和疾病管理業(yè)務(wù)數(shù)據(jù)集的數(shù)據(jù)質(zhì)量,另外不同的科研任務(wù)對所使用的數(shù)據(jù)集也存在需求重要程度不同的情況。因此,需要明確不同應(yīng)用場景所涉及的數(shù)據(jù)集范圍以及對數(shù)據(jù)集分配需求重要度權(quán)重。本文基于對多個項目情況的調(diào)研,得出如表1 所示的數(shù)據(jù)集需求矩陣。
表1 數(shù)據(jù)集需求矩陣
2.1 數(shù)據(jù)質(zhì)量評價流程 面向用戶需求的數(shù)據(jù)質(zhì)量評價流程共分為3 個階段,首先基于需求場景計算指標(biāo)權(quán)重,其次進(jìn)行單數(shù)據(jù)集數(shù)據(jù)質(zhì)量綜合評價,最后面向用戶需求進(jìn)行多數(shù)據(jù)集數(shù)據(jù)質(zhì)量綜合評價。各階段主要工作說明如下。
2.1.1 指標(biāo)權(quán)重計算 不同的數(shù)據(jù)應(yīng)用場景需求的數(shù)據(jù)集來源和結(jié)構(gòu)存在差異,從而導(dǎo)致在數(shù)據(jù)質(zhì)量評價指標(biāo)的權(quán)重設(shè)計上也需要以應(yīng)用場景為單位進(jìn)行設(shè)計,以保證指標(biāo)權(quán)重的設(shè)置更加符合當(dāng)前應(yīng)用場景的需求。
2.1.2 單數(shù)據(jù)集綜合評價 單數(shù)據(jù)集綜合評價是以特定場景下計算好的指標(biāo)權(quán)重結(jié)合模糊綜合評價模型進(jìn)行數(shù)據(jù)質(zhì)量綜合評價,最終評價結(jié)果是單數(shù)據(jù)集對評語集的綜合評價向量。如果評價向量中最大元素小于要求則需進(jìn)行技術(shù)處理,以消除低質(zhì)量數(shù)據(jù)直到滿足要求。
2.1.3 多數(shù)據(jù)集綜合評價 面向特定需求場景涉及的數(shù)據(jù)集,用戶可根據(jù)自身需求設(shè)定每個數(shù)據(jù)集的權(quán)重,從而形成個性化的數(shù)據(jù)集需求權(quán)重向量。然后與單數(shù)據(jù)集綜合評價形成的評價矩陣進(jìn)行矩陣運算,得出最終評價結(jié)果,評價流程見圖1。
圖1 面向用戶需求的數(shù)據(jù)質(zhì)量評價流程
2.2 數(shù)據(jù)質(zhì)量評價指標(biāo)體系 本文參考《信息技術(shù)數(shù)據(jù)質(zhì)量評價指標(biāo)(GB/T 36344-2018)》標(biāo)準(zhǔn)對數(shù)據(jù)質(zhì)量評價的要求構(gòu)建了區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價指標(biāo)體系,包括4 個指標(biāo)維度共10 個指標(biāo)。數(shù)據(jù)質(zhì)量評價指標(biāo)體系見表2。
表2 區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價指標(biāo)體系
表2(續(xù))
2.3 數(shù)據(jù)質(zhì)量綜合評價模型 采用模糊綜合評價法對特定需求場景下區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量進(jìn)行評價[18]。模型實現(xiàn)步驟包括設(shè)計評語集及隸屬函數(shù)、計算指標(biāo)權(quán)重、確定數(shù)據(jù)集及數(shù)據(jù)集權(quán)重、構(gòu)建單數(shù)據(jù)集評價矩陣和多數(shù)據(jù)集綜合評價。
2.3.1 評語集及隸屬函數(shù) 評語集指評價者對評價對象做出的所有評價結(jié)果的集合,用V 表示。本文選取3 個評價等級來建立評語集合,即V={正常,注意,異常},其中0.98 為正常、0.96 為注意、0.90為異常。
指標(biāo)的值由系統(tǒng)自動根據(jù)質(zhì)量校驗規(guī)則進(jìn)行計算,以本文采用梯形分布函數(shù),建立指標(biāo)隸屬度函數(shù),值越接近1 代表其質(zhì)量滿足度越高。指標(biāo)對應(yīng)評語集3 種狀態(tài)的隸屬度函數(shù)如下:
2.3.2 指標(biāo)集及指標(biāo)權(quán)重 CRITIC 分析法是一種適用于確定指標(biāo)客觀權(quán)重的方法,這個方法通過指標(biāo)內(nèi)變化的大小和指標(biāo)之間的沖突來全面確定指標(biāo)的客觀權(quán)重[19]。本文選擇的10 個二級指標(biāo)均可收集到客觀指標(biāo)值,且指標(biāo)之間具有一定的波動性和相關(guān)性,因此選擇CRITIC 法對指標(biāo)計算權(quán)重,并通過如下幾個步驟計算特定場景下指標(biāo)權(quán)重。
步驟1:基于指標(biāo)之間的相關(guān)系數(shù)構(gòu)建表征沖突的定量表達(dá)式來表示指標(biāo)之間的沖突性。通過標(biāo)準(zhǔn)矩陣X' 可獲得每個指標(biāo)的標(biāo)準(zhǔn)差σi和指標(biāo)之間的相關(guān)系數(shù)ρij。式中xˉ 'i 表示第i 個指標(biāo)的均值,表示標(biāo)準(zhǔn)矩陣X'第i 行和第j 行的協(xié)方差。
綜合步驟1、2、3 計算得出指標(biāo)權(quán)重向量為W=(w1w2… w10)。
2.3.3 數(shù)據(jù)集及數(shù)據(jù)集權(quán)重 不同需求場景涉及的數(shù)據(jù)集不同,用戶可根據(jù)自身需求設(shè)定每個數(shù)據(jù)集的權(quán)重從而形成個性化的數(shù)據(jù)集需求權(quán)重向量。假設(shè)某場景下共涉及k 個數(shù)據(jù)集,每個數(shù)據(jù)集的權(quán)重為αi,則數(shù)據(jù)集權(quán)重向量A=(α1α2… α10)。
2.3.4 單數(shù)據(jù)集綜合評價 對單數(shù)據(jù)集進(jìn)行模糊綜合評價,分別計算它們對于評語集V 中不同等級的隸屬度rij,由此可得出第個數(shù)據(jù)集的評價矩陣Ri=(ri1,ri2,ri3),可得當(dāng)前場景下所有數(shù)據(jù)集的綜合評價矩陣:
2.3.5 多數(shù)據(jù)集綜合評價 在單數(shù)據(jù)集綜合評價的基礎(chǔ)上,結(jié)合數(shù)據(jù)集的權(quán)重向量,綜合得出多數(shù)據(jù)集綜合評價結(jié)果,即當(dāng)前場景的所有數(shù)據(jù)集對評語集的隸屬度向量M,其計算公式如下。
根據(jù)上述構(gòu)建的面向用戶需求的數(shù)據(jù)質(zhì)量評價框架,本文選取某區(qū)域醫(yī)療科研場景進(jìn)行實例分析,首先選取60 d 的科研場景涉及的6 個數(shù)據(jù)集(住院病案首頁、入院記錄、入院病程記錄、檢查檢驗記錄、住院醫(yī)囑、手術(shù)治療記錄)的數(shù)據(jù)質(zhì)量校驗指標(biāo)計算結(jié)果數(shù)據(jù)進(jìn)行指標(biāo)權(quán)重計算,其次選取某日待評價數(shù)據(jù)且對這6 個數(shù)據(jù)集進(jìn)行單數(shù)據(jù)集綜合評價,然后對多數(shù)據(jù)集進(jìn)行綜合評價得出科研場景下所有數(shù)據(jù)集對評語集的隸屬度矩陣,最后根據(jù)最大隸屬原則判定此日數(shù)據(jù)質(zhì)量評價結(jié)果。
3.1 科研場景指標(biāo)權(quán)重計算 在選取60 d 的數(shù)據(jù)中所有指標(biāo)的計算結(jié)果數(shù)據(jù)后,由于指標(biāo)量綱不同,需要對指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,得到結(jié)果見表3?;谔囟▓鼍跋轮笜?biāo)權(quán)重計算步驟得出科研場景下指標(biāo)權(quán)重系數(shù)見表4。
表3 標(biāo)準(zhǔn)化后科研場景指標(biāo)計算結(jié)果
表4 科研場景下數(shù)據(jù)質(zhì)量指標(biāo)權(quán)重系數(shù)
3.2 科研場景模糊綜合評價 通過收集到的某日指標(biāo)計算結(jié)果結(jié)合隸屬度函數(shù)分別對6 個數(shù)據(jù)集進(jìn)行單數(shù)據(jù)集模糊綜合評價,得出單數(shù)據(jù)集對評語集隸屬度矩陣如下。
在單數(shù)據(jù)集綜合評價的基礎(chǔ)上,結(jié)合數(shù)據(jù)集的權(quán)重向量計算科研場景的所有數(shù)據(jù)集對評語集的隸屬度向量M。本實例中數(shù)據(jù)集權(quán)重向量為用戶指定為A=(0.35 0.2 0.15 0.15 0.1 0.05),用式(6)計算科研場景所有數(shù)據(jù)集對評語集的隸屬矩陣過程如下。
經(jīng)過計算得到M=(0.104 0.101 0.678),根據(jù)以上評價等級的隸屬度范圍,本實例科研場景下數(shù)據(jù)質(zhì)量評價結(jié)果處于“異?!彼?。
本文將用戶需求貫穿于區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價的全過程,明確了面向用戶需求的數(shù)據(jù)質(zhì)量評價框架。首先,基于用戶的數(shù)據(jù)需求設(shè)計了數(shù)據(jù)質(zhì)量評價流程,構(gòu)建了數(shù)據(jù)質(zhì)量評價指標(biāo)體系。其次,建立了數(shù)據(jù)質(zhì)量綜合評價模型,利用CRITIC 分析法確定了指標(biāo)權(quán)重,同時確立了單數(shù)據(jù)集和多數(shù)據(jù)集綜合評價矩陣。最后,通過某區(qū)域科研場景對數(shù)據(jù)質(zhì)量進(jìn)行了綜合評價,其評價結(jié)果總體上為“異?!彼?。總體來看,本文構(gòu)建的采用面向用戶需求的區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價框架既能夠根據(jù)用戶需求靈活地進(jìn)行數(shù)據(jù)質(zhì)量評價,也能夠及時根據(jù)用戶需求及反饋信息中隱含的規(guī)律動態(tài)完善評價指標(biāo)權(quán)重。根據(jù)這一研究結(jié)論,提出如下建議:①在區(qū)域醫(yī)療數(shù)據(jù)評價和管理過程中應(yīng)多關(guān)注和了解用戶的真實需求,結(jié)合用戶需求來決定對哪些數(shù)據(jù)集進(jìn)行評價以及動態(tài)調(diào)整評價指標(biāo)的權(quán)重等;②在對數(shù)據(jù)質(zhì)量進(jìn)行評價時,可以考慮讓用戶參與進(jìn)來,根據(jù)自身需求對數(shù)據(jù)集的重要程度進(jìn)行辨識和賦權(quán),使評價結(jié)果更貼近用戶需求。未來研究可對數(shù)據(jù)質(zhì)量評估框架的測度及實現(xiàn)方法進(jìn)行細(xì)化,同時探索納入用戶對數(shù)據(jù)質(zhì)量定性評價指標(biāo),如用戶的質(zhì)量感知性評價,另外需將本文所構(gòu)建的面向用戶需求的區(qū)域醫(yī)療數(shù)據(jù)質(zhì)量評價框架下沉到實踐應(yīng)用中去,在實踐中不斷完善框架的適用性。