□ 陳立雪CHEN Li-xue 王媛媛WANG Yuan-yuan 郝永秀HAO Yong-xiu 吳紅萍WU Hong-ping 李蓉LI Rong 遲洪濱CHI Hong-bin
隨著醫(yī)院信息化建設(shè)的快速發(fā)展,應(yīng)用于醫(yī)療衛(wèi)生領(lǐng)域的信息系統(tǒng)及大數(shù)據(jù)平臺(tái)不斷涌現(xiàn)[1],這些信息系統(tǒng)和數(shù)據(jù)平臺(tái)在獲取臨床診療信息和醫(yī)療衛(wèi)生管理數(shù)據(jù)方面發(fā)揮著重要作用[2]。以輔助生殖技術(shù)(assisted reproductive technology,ART)為例,美國(guó)疾病預(yù)防控制中心自1995年起使用國(guó)家輔助生殖技術(shù)監(jiān)測(cè)系統(tǒng)(national ART surveillance system,NASS)收集ART 數(shù)據(jù),并實(shí)現(xiàn)與其他人口與健康監(jiān)管系統(tǒng)進(jìn)行數(shù)據(jù)匹配共享,從而對(duì)輔助生殖技術(shù)以及使用該技術(shù)生育的后代情況進(jìn)行有效的監(jiān)測(cè)和管理[3]。相比而言,我國(guó)相關(guān)領(lǐng)域的信息化建設(shè)亟需有效的技術(shù)手段支持,以實(shí)現(xiàn)生殖健康及重大出生缺陷防控信息化產(chǎn)品的快速發(fā)展[4]。
我國(guó)是出生缺陷高發(fā)國(guó)家,科技部從“七五”開(kāi)始就一直對(duì)出生缺陷病因探討、臨床防治技術(shù)研發(fā),以及部分防控出生缺陷的干預(yù)技術(shù)臨床轉(zhuǎn)化和應(yīng)用相關(guān)研究提供了諸多專項(xiàng)資助[5]。為了整合覆蓋孕前、產(chǎn)前到出生后的全生命周期的出生缺陷數(shù)據(jù)集,國(guó)家衛(wèi)生健康委統(tǒng)計(jì)信息中心牽頭,通過(guò)分布式架構(gòu)的云平臺(tái)[6],建立集臨床數(shù)據(jù)庫(kù)、生物數(shù)據(jù)庫(kù)、基因數(shù)據(jù)庫(kù)等于一體的多維度出生缺陷數(shù)據(jù)庫(kù)集群。從而建立生殖健康及重大出生缺陷信息檔案[7],為我國(guó)出生缺陷防治提供科學(xué)依據(jù)和手段,推動(dòng)出生缺陷防控工作統(tǒng)籌規(guī)劃。本研究以“生殖健康及重大出生缺陷防控研究”的大數(shù)據(jù)平臺(tái)建設(shè)為切入點(diǎn),探討建立相對(duì)統(tǒng)一的大數(shù)據(jù)交互平臺(tái)質(zhì)控管理方案,在不斷改善數(shù)據(jù)質(zhì)量的同時(shí),實(shí)現(xiàn)生殖健康數(shù)據(jù)共享。
重大出生缺陷大數(shù)據(jù)云平臺(tái)的應(yīng)用研發(fā)是基于微服務(wù)的研發(fā)架構(gòu),通過(guò)定制化的數(shù)據(jù)對(duì)接和采集接口,實(shí)現(xiàn)高度解耦的功能設(shè)計(jì)、模塊建設(shè)和服務(wù)調(diào)用[6]。鑒于不同數(shù)據(jù)庫(kù)的數(shù)據(jù)格式、數(shù)據(jù)類型及數(shù)據(jù)維度上的差異,云平臺(tái)的智能接口系統(tǒng)通過(guò)高度自由的可配置界面,支持不同終端、不同渠道、不同規(guī)模的數(shù)據(jù)采集,結(jié)合區(qū)塊鏈技術(shù)實(shí)現(xiàn)上報(bào)數(shù)據(jù)的安全存儲(chǔ)、不可篡改與追蹤溯源。同時(shí)通過(guò)多樣式應(yīng)用程序界面(API,Application Program Interface)的提供,實(shí)現(xiàn)不同數(shù)據(jù)庫(kù)間數(shù)據(jù)的協(xié)作與調(diào)用?;谝陨舷到y(tǒng)技術(shù)構(gòu)架,結(jié)合數(shù)據(jù)中心管理者和系統(tǒng)終端用戶的需求,建立一體化的質(zhì)控管理方案。
遵循由美國(guó)著名統(tǒng)計(jì)學(xué)家沃特·阿曼德·休哈特(Walter A. Shewhart)提出,統(tǒng)計(jì)學(xué)家威廉·愛(ài)德華茲·戴明(William Edwards Deming)進(jìn)一步完善的“策劃-實(shí)施-檢查-處置”循環(huán)(“Plan-Do-Check-Act”cycle,PDCA cycle),以及ISO9001 質(zhì)量管理體系要求的過(guò)程、方法,建立醫(yī)療大數(shù)據(jù)交互平臺(tái)及切實(shí)可行、較為全面的質(zhì)量檢查規(guī)則。
1.數(shù)據(jù)收集方案(Plan)。搭建一套穩(wěn)定的大數(shù)據(jù)交互平臺(tái),首先需要明確數(shù)據(jù)用途與需要采集的數(shù)據(jù)內(nèi)容。針對(duì)涉及多學(xué)科、多病種的綜合數(shù)據(jù)平臺(tái),設(shè)計(jì)樣本唯一、且可用于信息交互的樣本編碼。具體數(shù)據(jù)格式規(guī)范根據(jù)數(shù)據(jù)內(nèi)容及特點(diǎn)設(shè)置為符號(hào)、語(yǔ)言文字、指令代碼等形式,盡量保證數(shù)據(jù)以友好的形式展示給使用者。為了保證平臺(tái)數(shù)據(jù)的自動(dòng)識(shí)別和一致性,課題組提前準(zhǔn)備好相關(guān)的培訓(xùn)方案,以保證使用者能夠清楚了解數(shù)據(jù)信息含義,面對(duì)同一個(gè)事實(shí),不會(huì)出現(xiàn)不同版本的數(shù)據(jù)。
1.1 數(shù)據(jù)準(zhǔn)備方案。依照數(shù)據(jù)來(lái)源,以規(guī)范“數(shù)據(jù)上傳方”與“數(shù)據(jù)接收方”雙方數(shù)據(jù)及傳輸標(biāo)準(zhǔn)為基礎(chǔ),按照數(shù)據(jù)產(chǎn)出和流轉(zhuǎn)的過(guò)程制定質(zhì)量控制策略,詳見(jiàn)表1。
1.2 風(fēng)險(xiǎn)防范。(1)鏈接多學(xué)科或多病種數(shù)據(jù)的統(tǒng)一化處理方案。按照建設(shè)進(jìn)度分類,交互平臺(tái)涉及的數(shù)據(jù)庫(kù)主要包括建設(shè)中的數(shù)據(jù)庫(kù)和已建成的數(shù)據(jù)庫(kù)。PDCA 循環(huán)可以處理平臺(tái)交互可能的風(fēng)險(xiǎn)。P 為數(shù)據(jù)庫(kù)規(guī)劃方案,對(duì)于未搭建數(shù)據(jù)平臺(tái)的學(xué)科或病種可直接以本質(zhì)控方案為建設(shè)基礎(chǔ),設(shè)計(jì)統(tǒng)一編碼、搭建數(shù)據(jù)平臺(tái);對(duì)于已建成的數(shù)據(jù)平臺(tái)的,尤其是已經(jīng)有一定數(shù)據(jù)存量的數(shù)據(jù)平臺(tái),應(yīng)該準(zhǔn)確選擇諸如證件號(hào)、出生日期、姓名等多項(xiàng)備選編碼,為統(tǒng)一做準(zhǔn)備。D 為不同數(shù)據(jù)庫(kù)的交互合并;需要注意平臺(tái)交互是需要使用唯一編碼,但是不能是僅一項(xiàng)編碼;只有多項(xiàng)聯(lián)合驗(yàn)證與模糊匹配詳解和的方式,才能保證合并后數(shù)據(jù)庫(kù)的準(zhǔn)確性并減少因無(wú)法合并造成的數(shù)據(jù)損失。C 為交互后的邏輯校驗(yàn),使用醫(yī)療檢查或者建病歷等日期類標(biāo)識(shí),加上年齡、性別、證件號(hào)碼提取信息等進(jìn)行邏輯校正,檢查交互結(jié)果的準(zhǔn)確性和可靠性。A 為交互結(jié)果報(bào)告與處理意見(jiàn),對(duì)于可匹配的,由系統(tǒng)自動(dòng)生成交互表(內(nèi)含各數(shù)據(jù)平臺(tái)的唯一編碼及對(duì)應(yīng)關(guān)系);不可匹配的給出原因,并將結(jié)果反饋至各學(xué)科或病種數(shù)據(jù)庫(kù)建設(shè)者,對(duì)系統(tǒng)進(jìn)行漏洞修復(fù)或平臺(tái)升級(jí);所有結(jié)果應(yīng)編制生成統(tǒng)計(jì)報(bào)告,作為后續(xù)平臺(tái)使用和數(shù)據(jù)分析的基礎(chǔ)。(2)風(fēng)險(xiǎn)評(píng)估。首先,從隱私數(shù)據(jù)安全性、軟件運(yùn)行環(huán)境安全性、漏洞修復(fù)機(jī)制和硬件維護(hù)4 方面進(jìn)行數(shù)據(jù)收集體系的安全性評(píng)估。其次,為避免平臺(tái)正式運(yùn)行后,因即時(shí)或長(zhǎng)期的數(shù)據(jù)量限制引發(fā)的異常情況發(fā)生,制訂數(shù)據(jù)量極限值。再次,考慮到大數(shù)據(jù)平臺(tái)實(shí)際運(yùn)行中各個(gè)環(huán)節(jié)可能出現(xiàn)的信息偏倚或錯(cuò)誤,正式啟動(dòng)實(shí)施之前,應(yīng)對(duì)軟件中涉及的重點(diǎn)數(shù)據(jù)項(xiàng)容錯(cuò)率進(jìn)行合理的評(píng)估,并應(yīng)用于后續(xù)的數(shù)據(jù)質(zhì)控之中。(3)數(shù)據(jù)測(cè)試。在正式數(shù)據(jù)上傳之前各方應(yīng)協(xié)商數(shù)據(jù)上傳測(cè)試方案;制定災(zāi)難數(shù)據(jù)方案,至少2 輪的數(shù)據(jù)測(cè)試與溝通后可開(kāi)始正式的數(shù)據(jù)上傳。進(jìn)而評(píng)價(jià)已建立的軟件構(gòu)架是否符合設(shè)計(jì)方案和實(shí)際預(yù)期。此外,標(biāo)記數(shù)據(jù)風(fēng)險(xiǎn)點(diǎn)作為主要的質(zhì)控內(nèi)容在后續(xù)數(shù)據(jù)監(jiān)測(cè)中使用。
表1 接收方與上傳方的數(shù)據(jù)準(zhǔn)備方案
2.具體實(shí)施(Do)。數(shù)據(jù)平臺(tái)設(shè)計(jì)中必須涵蓋的數(shù)據(jù)結(jié)構(gòu)包括:樣本的唯一編碼,數(shù)據(jù)采集時(shí)間點(diǎn),計(jì)劃采集的數(shù)據(jù)項(xiàng)及結(jié)果;以及根據(jù)平臺(tái)的設(shè)計(jì)特點(diǎn),重要指標(biāo)應(yīng)按照統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行歸類。數(shù)據(jù)采集與傳遞過(guò)程中,應(yīng)確定數(shù)據(jù)平臺(tái)統(tǒng)一的樣本納入排除標(biāo)準(zhǔn);所有負(fù)責(zé)數(shù)據(jù)采集傳遞的相關(guān)人員,經(jīng)過(guò)均質(zhì)化的培訓(xùn)后,對(duì)數(shù)據(jù)標(biāo)準(zhǔn)的理解一致。之后按照計(jì)劃的數(shù)據(jù)上傳或接收模式進(jìn)行真實(shí)樣本數(shù)據(jù)的上傳與接收;同時(shí)定期匯總數(shù)據(jù)采集情況,并反饋。
3.數(shù)據(jù)質(zhì)控(Check)
3.1 完整性檢查。根據(jù)不同數(shù)據(jù)平臺(tái)的建設(shè)需要,明確設(shè)置每個(gè)樣本必填的數(shù)據(jù)項(xiàng)。必填數(shù)據(jù)項(xiàng)的完整性檢查,可優(yōu)先通過(guò)軟件系統(tǒng)設(shè)置智能的質(zhì)控檢查。系統(tǒng)自查時(shí),發(fā)現(xiàn)存在必填項(xiàng)缺失的樣本,應(yīng)賦予質(zhì)控不合格的標(biāo)志。若軟件系統(tǒng)不具備自動(dòng)糾錯(cuò)的功能,則需通過(guò)人工檢索的方式進(jìn)行完整性檢查。無(wú)論用系統(tǒng)自查還是人工糾錯(cuò),凡是發(fā)現(xiàn)必填項(xiàng)有缺失的樣本,質(zhì)控結(jié)果均為“不合格”。選填數(shù)據(jù)項(xiàng)可通過(guò)計(jì)算數(shù)據(jù)項(xiàng)完成率進(jìn)行完整性檢查。計(jì)算時(shí)注意剔除因樣本自身限制而無(wú)法填寫的缺失數(shù)據(jù)。
3.2 邏輯性檢查。邏輯性檢查指相關(guān)聯(lián)的數(shù)據(jù)項(xiàng)中所填信息的邏輯關(guān)系是否正確。針對(duì)數(shù)據(jù)平臺(tái)中各數(shù)據(jù)項(xiàng)類型的不同(是否結(jié)構(gòu)化),需使用不同方法進(jìn)行邏輯檢查。結(jié)構(gòu)化數(shù)據(jù)的邏輯檢查方法主要包括:軟件系統(tǒng)邏輯自查、邏輯互查和人工合理性糾錯(cuò)三方面。
非結(jié)構(gòu)化數(shù)據(jù)通常是數(shù)據(jù)質(zhì)控的難點(diǎn)。針對(duì)這部分?jǐn)?shù)據(jù),應(yīng)通過(guò)語(yǔ)言處理技術(shù),對(duì)文本數(shù)據(jù)后結(jié)構(gòu)化。根據(jù)提取到的重要信息生成新變量,之后再對(duì)所有數(shù)據(jù)項(xiàng)進(jìn)行邏輯性檢查。不符合邏輯的數(shù)據(jù)條目再次核查,并爭(zhēng)取追溯原始數(shù)據(jù)。需要注意,邏輯性檢查中,可能由于邏輯規(guī)則設(shè)定欠完善,發(fā)現(xiàn)一些“假陽(yáng)性”的錯(cuò)誤。因此,有些檢查出的邏輯問(wèn)題不能直接認(rèn)定為數(shù)據(jù)錯(cuò)誤或質(zhì)控不合格,而是標(biāo)記為“建議再次核查”。
3.3 準(zhǔn)確性檢查。數(shù)據(jù)上傳方、數(shù)據(jù)接收方和平臺(tái)交互方需要做三方查驗(yàn),通常按照不低于5%的比例對(duì)數(shù)據(jù)樣本進(jìn)行抽查。重點(diǎn)核對(duì)數(shù)據(jù)項(xiàng)定義內(nèi)容是否有偏差、樣本的醫(yī)療邏輯是否合理。三方根據(jù)數(shù)據(jù)核查結(jié)果改進(jìn)數(shù)據(jù)質(zhì)控方式,校正數(shù)據(jù)庫(kù)或定義等相關(guān)內(nèi)容。上傳方、接收方和交互方每年至少有1 次的溝通交流形式,交流數(shù)據(jù)相關(guān)內(nèi)容,以期改進(jìn)。
3.4 交互結(jié)果統(tǒng)計(jì)與數(shù)據(jù)導(dǎo)出。在完成數(shù)據(jù)質(zhì)控檢查的同時(shí),數(shù)據(jù)庫(kù)交互軟件本身的穩(wěn)定性也需要質(zhì)控。數(shù)據(jù)導(dǎo)出是把平臺(tái)中的數(shù)據(jù)導(dǎo)出成可供進(jìn)一步分析使用的文件格式(excel 等)。軟件應(yīng)該提供數(shù)據(jù)導(dǎo)出功能。當(dāng)大數(shù)據(jù)云平臺(tái)有一定量的數(shù)據(jù)積累后,應(yīng)定期通過(guò)導(dǎo)出的功能核查導(dǎo)出階段是否有數(shù)據(jù)損失。若發(fā)現(xiàn)異常,需聯(lián)系軟件公司處理漏洞。
4.云數(shù)據(jù)處置(Act)
4.1 數(shù)據(jù)清洗?;诓煌瑪?shù)據(jù)平臺(tái)建設(shè)用途的不同,有的樣本數(shù)據(jù)來(lái)源是可溯源或重新核查的,而有的即使發(fā)現(xiàn)問(wèn)題也難以重新核對(duì)原始數(shù)據(jù)。因此,數(shù)據(jù)質(zhì)控后,需要根據(jù)數(shù)據(jù)情況和質(zhì)控結(jié)果的不同分別進(jìn)行數(shù)據(jù)清洗,包括:對(duì)缺失值和異常值的溯源填補(bǔ);關(guān)鍵變量的邏輯校正;采用統(tǒng)計(jì)學(xué)方法根據(jù)數(shù)據(jù)缺失的機(jī)制和比例進(jìn)行填補(bǔ)等。
4.2 交互結(jié)果處理。多數(shù)據(jù)庫(kù)平臺(tái)交互后交互成功并通過(guò)質(zhì)控檢查的歸為可用數(shù)據(jù);交互成功但是質(zhì)控檢查未通過(guò)的歸為待查數(shù)據(jù),交由平臺(tái)交互方進(jìn)行二次人工核查;交互失敗的歸為不可用數(shù)據(jù),交由數(shù)據(jù)接收方負(fù)責(zé)安排與上傳方核查原始資料并更正問(wèn)題數(shù)據(jù)。
1.數(shù)據(jù)質(zhì)量管理。經(jīng)過(guò)一輪的“策劃—實(shí)施—檢查—處置”PDCA 循環(huán),應(yīng)該對(duì)數(shù)據(jù)平臺(tái)整體進(jìn)行綜合的質(zhì)量分析和評(píng)價(jià),具體質(zhì)控點(diǎn)見(jiàn)表2。
表2 數(shù)據(jù)質(zhì)量管理評(píng)價(jià)節(jié)點(diǎn)
從微觀的角度,針對(duì)云平臺(tái)中的某一個(gè)數(shù)據(jù)樣本的質(zhì)控評(píng)價(jià),可以得出質(zhì)控合格率。質(zhì)控合格的,歸為可用數(shù)據(jù);質(zhì)控不合格的,返回?cái)?shù)據(jù)收集和整理部門,確定是否重新采集。從宏觀的角度,每一次循環(huán)都能發(fā)現(xiàn)整個(gè)質(zhì)控體系可能存在的一些問(wèn)題,或提出更高效的質(zhì)控流程,從而對(duì)數(shù)據(jù)庫(kù)以及質(zhì)控方案整體進(jìn)行新一輪的優(yōu)化和提升(見(jiàn)圖1)。
圖1 數(shù)據(jù)庫(kù)質(zhì)量?jī)?yōu)化過(guò)程解析
2.組織與制度。基于PDCA 形成的各項(xiàng)組織與制度的建立,能夠有效的保障數(shù)據(jù)平臺(tái)平穩(wěn)運(yùn)行,制度列表見(jiàn)表3。
表3 組織與制度清單
3.規(guī)范與技術(shù)。醫(yī)療大數(shù)據(jù)平臺(tái)的建立與運(yùn)行,應(yīng)該嚴(yán)格遵循各醫(yī)療學(xué)科或病種的技術(shù)規(guī)范,設(shè)計(jì)唯一的交互編碼(或交互編碼組)與交互規(guī)則。這樣才能保證數(shù)據(jù)庫(kù)的真實(shí)性和可利用性。例如在數(shù)據(jù)平臺(tái)設(shè)計(jì)或數(shù)據(jù)質(zhì)控處理時(shí),可通過(guò)國(guó)際通用的ICD-10 編碼對(duì)疾病的種類或診斷進(jìn)行區(qū)分或結(jié)構(gòu)化處理。數(shù)據(jù)平臺(tái)中的關(guān)鍵內(nèi)容應(yīng)該做到有章可循,有規(guī)范可依。
此外,醫(yī)療領(lǐng)域尤其注重患者信息安全與隱私保護(hù)。一方面,數(shù)據(jù)平臺(tái)軟件的設(shè)計(jì)應(yīng)按照各項(xiàng)醫(yī)療技術(shù)的信息安全要求和患者因素保護(hù)制度,通過(guò)加密算法或個(gè)人數(shù)據(jù)的匿名化,對(duì)隱私數(shù)據(jù)進(jìn)行加密處理;另一方面,質(zhì)量控制過(guò)程中涉及到的諸多環(huán)節(jié)的操作,也應(yīng)該遵循隱私保護(hù)的原則,建立合理的安全驗(yàn)證和信息流轉(zhuǎn)制度。
1.統(tǒng)一的交互編碼規(guī)則是大數(shù)據(jù)交互平臺(tái)質(zhì)控的關(guān)鍵。目前我國(guó)包括“出生醫(yī)學(xué)證明”等國(guó)家級(jí)出生缺陷監(jiān)測(cè)數(shù)據(jù)庫(kù)在內(nèi)的諸多研究型醫(yī)療數(shù)據(jù)庫(kù),均較為分散且來(lái)源不同[8],在數(shù)據(jù)信息項(xiàng)和格式、疾病判斷標(biāo)準(zhǔn)及依據(jù)、觀察期限及觀察節(jié)點(diǎn)、數(shù)據(jù)采集和上報(bào)方法、每個(gè)數(shù)據(jù)庫(kù)各自的質(zhì)控方案等均各不相同。因此,本研究基于重大出生缺陷防控大數(shù)據(jù)云平臺(tái)包括先天性心臟病、神經(jīng)管缺陷疾病、唇腭裂等多個(gè)數(shù)據(jù)庫(kù)的建設(shè),通過(guò)確定統(tǒng)一交互編碼(或交互編碼組)和交互規(guī)則,制定大數(shù)據(jù)交互平臺(tái)質(zhì)量控制方案,為實(shí)現(xiàn)各類醫(yī)療大數(shù)據(jù)平臺(tái)中數(shù)據(jù)的可靠性提供有效保障。
2. PDCA 循環(huán)可持續(xù)改進(jìn)醫(yī)療大數(shù)據(jù)交互平臺(tái)的質(zhì)量。隨著信息化技術(shù)在各領(lǐng)域的廣泛應(yīng)用,已有研究將PDCA 循環(huán)運(yùn)用到信息化技術(shù)中[9],但尚無(wú)針對(duì)醫(yī)療大數(shù)據(jù)交互平臺(tái)的詳盡的質(zhì)控方案研究。本研究以PDCA 循環(huán)和ISO9001 質(zhì)量管理體系方法論為理論基礎(chǔ),形成包括數(shù)據(jù)質(zhì)量管理體系、組織與制度、規(guī)范與技術(shù)三位一體的大數(shù)據(jù)質(zhì)控體系,確保數(shù)據(jù)的規(guī)范性、完整性、準(zhǔn)確性和一致性。
數(shù)據(jù)平臺(tái)質(zhì)量控制的很多步驟都涉及數(shù)據(jù)庫(kù)的維護(hù)與管理。在數(shù)據(jù)庫(kù)的使用過(guò)程中,使用者通常需要循環(huán)往復(fù)的補(bǔ)充和更新數(shù)據(jù),修正錯(cuò)誤數(shù)據(jù),刪改過(guò)時(shí)或失效的數(shù)據(jù)等。因此,這種基于PDCA 循環(huán)的醫(yī)療數(shù)據(jù)庫(kù)管理不是一朝一夕所能完成的。只有按照一定的質(zhì)量控制規(guī)則和標(biāo)準(zhǔn),采取適當(dāng)而有效的質(zhì)量控制措施,才能構(gòu)建起嚴(yán)密的質(zhì)量控制體系,進(jìn)而不斷優(yōu)化數(shù)據(jù)質(zhì)量、逐步建成高質(zhì)量的大數(shù)據(jù)庫(kù),持續(xù)提高醫(yī)療大數(shù)據(jù)交互平臺(tái)的數(shù)據(jù)質(zhì)量與使用效率。
3.PDCA 循環(huán)是醫(yī)療信息及時(shí)共享的基礎(chǔ)與保障。醫(yī)療數(shù)據(jù)庫(kù)體量巨大且具有多樣性和可變性[10],PDCA 循環(huán)可以相對(duì)及時(shí)的發(fā)現(xiàn)數(shù)據(jù)庫(kù)中可能存在的問(wèn)題,并及時(shí)對(duì)數(shù)據(jù)庫(kù)的質(zhì)量或可用的數(shù)據(jù)集給出指示或判斷。已有研究提出,多方位的臨床大數(shù)據(jù)研究對(duì)于構(gòu)建重大疾病的分析模型,以及解決臨床醫(yī)療和科研業(yè)務(wù)之間的矛盾有著重要的意義[11]。但是,如果想整合不同學(xué)科、臨床或科研等不同來(lái)源的醫(yī)療數(shù)據(jù)到同一個(gè)數(shù)據(jù)平臺(tái)上,幾乎是不可能的。若改換思路,以質(zhì)量控制為抓手,建立相對(duì)統(tǒng)一的交互編碼體系與質(zhì)控標(biāo)準(zhǔn),不斷優(yōu)化和統(tǒng)一質(zhì)控要求,進(jìn)而可以為實(shí)現(xiàn)多種類多來(lái)源的大數(shù)據(jù)共享提供可能。