王韶鋒 趙善斌 楊 靜
山西省腫瘤醫(yī)院 山西太原 030013
在大數(shù)據(jù)的時(shí)代,數(shù)據(jù)已經(jīng)成為一種重要的資產(chǎn)。資產(chǎn)是一種經(jīng)濟(jì)資源,能以貨幣衡量,并預(yù)期未來能提供效益[1]。醫(yī)院在長(zhǎng)期運(yùn)營(yíng)過程中,積累了海量數(shù)據(jù)資產(chǎn),這些數(shù)據(jù)資產(chǎn)很難體現(xiàn)在賬面上,無法清晰定義在資產(chǎn)負(fù)債表中,屬于“隱形資產(chǎn)”,卻可以幫助醫(yī)院更精細(xì)化地運(yùn)營(yíng),幫助醫(yī)生更精準(zhǔn)地治療、科研。
但事實(shí)上許多醫(yī)院在數(shù)據(jù)資產(chǎn)的利用上不盡如人意,甚至沒有把數(shù)據(jù)當(dāng)做資產(chǎn)。如臨床醫(yī)生做科研還是使用國(guó)外醫(yī)療機(jī)構(gòu)公開的數(shù)據(jù)集,如MIMIC-Ⅲ數(shù)據(jù)庫[2-4],而使用國(guó)內(nèi)醫(yī)院自己建立的數(shù)據(jù)倉庫比較少[5]。造成這種現(xiàn)象的一個(gè)重要原因是忽視了數(shù)據(jù)倉庫中的數(shù)據(jù)質(zhì)量,在系統(tǒng)中存在許多不完整、不規(guī)范或重復(fù)的數(shù)據(jù),即臟數(shù)據(jù)[6],必須經(jīng)過數(shù)據(jù)清洗和整理才能加以利用。
對(duì)數(shù)據(jù)質(zhì)量的輕視帶來了兩個(gè)后果,一方面是每年花在數(shù)據(jù)整理和清洗上的費(fèi)用支出巨大,極大地增加了醫(yī)院管理者的工作量,降低了工作效率[7-8],給數(shù)據(jù)資產(chǎn)的利用增加了困難。另一方面,數(shù)據(jù)質(zhì)量限制了各類信息系統(tǒng)如集成平臺(tái)的效能發(fā)揮,沒有質(zhì)量保證的基礎(chǔ)數(shù)據(jù),根據(jù)信息管理理論,只能是“垃圾進(jìn)垃圾出”,各種統(tǒng)計(jì)分析和指標(biāo)結(jié)果就無法反映真實(shí)情況,以數(shù)據(jù)驅(qū)動(dòng)的管理模式當(dāng)然也無從談起。
在講精細(xì)化管理[9-10]的今天,沒有質(zhì)量的數(shù)據(jù)就像包含著金子的垃圾堆,挖掘起來非常困難,甚至?xí)頉Q策偏差和損失。醫(yī)院亟需推進(jìn)全院范圍內(nèi)的數(shù)據(jù)資產(chǎn)管理思維模式轉(zhuǎn)型,應(yīng)該深刻認(rèn)識(shí)到數(shù)據(jù)是醫(yī)院資產(chǎn)的重要組成部分,而且可以帶來豐厚的經(jīng)濟(jì)效益,值得上升到戰(zhàn)略高度給予重視。為了推進(jìn)數(shù)據(jù)治理,我們對(duì)數(shù)據(jù)質(zhì)量的問題、成因及對(duì)策進(jìn)行了分析研究。
2019年我院上線IT運(yùn)維管理平臺(tái),通過對(duì)IT運(yùn)維管理平臺(tái)收集的數(shù)據(jù)質(zhì)量問題進(jìn)行統(tǒng)計(jì)分析,結(jié)合文獻(xiàn)查詢,我們總結(jié)了醫(yī)院普遍存在的一些數(shù)據(jù)質(zhì)量問題。
一致性問題指的是數(shù)據(jù)業(yè)務(wù)表與數(shù)據(jù)字典表無法一一對(duì)照,而產(chǎn)生一致性問題的主要原因是數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,或者雖然有標(biāo)準(zhǔn)并形成了字典表,但是各業(yè)務(wù)系統(tǒng)沒有按照標(biāo)準(zhǔn)執(zhí)行。數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)一致性質(zhì)量的依據(jù)和前提,要保證數(shù)據(jù)一致性,首先要有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。在醫(yī)療機(jī)構(gòu)的多個(gè)信息系統(tǒng)中,存在同一主題比如主診斷的字典具有不同字段、內(nèi)容、編碼和參考標(biāo)準(zhǔn),或者數(shù)據(jù)條目數(shù)不一致;主題相近的字典比如費(fèi)用分類存在不同的統(tǒng)計(jì)口徑、命名規(guī)則;部分?jǐn)?shù)據(jù)存在不根據(jù)字典表生成而是人工自定義的情況,如自定義醫(yī)囑、檢驗(yàn)項(xiàng)目等;業(yè)務(wù)表與字典表字段長(zhǎng)度設(shè)置不合理,存在不一致導(dǎo)致的截?cái)喱F(xiàn)象。
數(shù)據(jù)完整性是指必要的數(shù)據(jù)均已被完備地填寫。必須的數(shù)據(jù)如果都沒有填寫完整,那是否填寫正確更無從談起,所以數(shù)據(jù)完整性是數(shù)據(jù)準(zhǔn)確性乃至整體數(shù)據(jù)質(zhì)量的基礎(chǔ)。數(shù)據(jù)完整性差主要指必填字段缺項(xiàng),存在NULL值、空值或者其他形式的無意義字符[11]。
山西某醫(yī)院收費(fèi)信息系統(tǒng)中2019年3月—4月中必填字段(如地址、現(xiàn)住址、總費(fèi)用)缺項(xiàng)統(tǒng)計(jì),見表1。
通過查閱文獻(xiàn),發(fā)現(xiàn)某院病案信息系統(tǒng)存在出院患者病案首頁部分缺少其他診斷、其他手術(shù)操作內(nèi)容的填寫[12]。
表1 某收費(fèi)信息系統(tǒng)缺項(xiàng)發(fā)生次數(shù)統(tǒng)計(jì) (次)
數(shù)據(jù)割裂即形成了信息孤島,主要體現(xiàn)在整合性和及時(shí)性不符合需求。整合性不足指邏輯上應(yīng)該存在聯(lián)系的數(shù)據(jù)無法關(guān)聯(lián)起來,在數(shù)據(jù)庫中沒有保存關(guān)聯(lián)信息。及時(shí)性不足指數(shù)據(jù)產(chǎn)生時(shí)間和可查看時(shí)間差距太大,使數(shù)據(jù)分析人員無法及時(shí)地拿到想要的信息。
數(shù)據(jù)割裂問題常見的有:因主外鍵缺失,數(shù)據(jù)割裂,無法關(guān)聯(lián)到患者的就診記錄上;無法區(qū)分同一患者不同趟次的診療行為;手術(shù)記錄和麻醉記錄、病程記錄和護(hù)理記錄等系統(tǒng)之間的數(shù)據(jù)無法得到關(guān)聯(lián),出現(xiàn)業(yè)務(wù)斷層,形成了信息孤島,信息無法共享給有需要的信息系統(tǒng)[13];字典更新導(dǎo)致之前生成的業(yè)務(wù)數(shù)據(jù)缺乏關(guān)聯(lián),如檢驗(yàn)項(xiàng)目明細(xì)的參考范圍與字典表不對(duì)應(yīng);ODS庫與生產(chǎn)庫因?yàn)橥絾栴},導(dǎo)致數(shù)據(jù)不一致。
數(shù)據(jù)填寫超出值域范圍,不符合邏輯,如身份證號(hào)、郵編、電話、性別、體溫填寫錯(cuò)誤的;數(shù)據(jù)格式錯(cuò)誤,如數(shù)字填寫為全角數(shù)字,日期格式不統(tǒng)一。
根本原因分析法(root cause analysis, RCA)是一種質(zhì)量管理技術(shù)[14],通過表面上顯露出來的問題,不斷根據(jù)因果邏輯關(guān)系迭代挖掘更深層次的原因,其中包括近期和遠(yuǎn)期的原因,目的是找到表面問題出現(xiàn)的根本原因。
根據(jù)根本原因分析法的理念,我們?cè)诜治鰧?dǎo)致數(shù)據(jù)質(zhì)量問題的原因時(shí),要抓住深層次的原因,而不是被表象所迷惑。當(dāng)一些問題頻繁發(fā)生時(shí),我們應(yīng)當(dāng)想辦法找到這些問題的共性,尋找并抽象出背后的原因,才能防止問題的再次發(fā)生,真正避免“頭痛醫(yī)頭,腳痛醫(yī)腳”,通過幾輪問題挖掘,我們總結(jié)了產(chǎn)生數(shù)據(jù)質(zhì)量問題的根源。
在政策上,國(guó)家衛(wèi)健委把電子病歷評(píng)級(jí)與醫(yī)院等級(jí)評(píng)審掛鉤,要求2020年所有三級(jí)醫(yī)院要達(dá)到4級(jí)以上的評(píng)價(jià)。4級(jí)要求醫(yī)院內(nèi)實(shí)現(xiàn)全院信息共享,對(duì)數(shù)據(jù)質(zhì)量提出了要求[15]。但是在電子病歷評(píng)級(jí)評(píng)審過程中,各種應(yīng)用功能點(diǎn)要求得比較細(xì),數(shù)據(jù)質(zhì)量只要求最近3個(gè)月的數(shù)據(jù)達(dá)標(biāo),所以在政策的傾向下,醫(yī)療機(jī)構(gòu)對(duì)數(shù)據(jù)質(zhì)量的重視程度不足。另一方面,數(shù)據(jù)質(zhì)量畢竟是一個(gè)長(zhǎng)期的工程,不少醫(yī)療機(jī)構(gòu)在建設(shè)信息系統(tǒng)時(shí)更看重應(yīng)用的多寡,功能的有無,而對(duì)數(shù)據(jù)的重視程度不夠[16],無法形成常態(tài)化的數(shù)據(jù)治理。
醫(yī)院的信息化系統(tǒng)有很強(qiáng)的使用慣性,一旦醫(yī)院已使用了某個(gè)廠家的系統(tǒng),再更換系統(tǒng)是一項(xiàng)艱難而且工作量很大的工程,而根據(jù)數(shù)據(jù)治理的要求,信息系統(tǒng)要進(jìn)行長(zhǎng)遠(yuǎn)的、大量的改造,所以很考驗(yàn)廠商的技術(shù)能力和配合程度。在醫(yī)院信息化建設(shè)過程中,各類信息系統(tǒng)大多由使用科室牽頭引進(jìn),各系統(tǒng)相對(duì)獨(dú)立,缺乏整體的數(shù)據(jù)規(guī)劃設(shè)計(jì)的意識(shí)和能力,比如在人力系統(tǒng)中,人力部門認(rèn)為員工的職位、職稱信息填寫好就夠了,對(duì)發(fā)放工資、實(shí)施績(jī)效考核已經(jīng)足夠,對(duì)職工住址的填寫就不做強(qiáng)制要求了,但是若有根據(jù)家庭住址安排任務(wù)或者班車路線的需求,就會(huì)因?yàn)槿鄙僮≈沸畔⒍鵁o法實(shí)現(xiàn)此需求。另一方面是因?yàn)槿鄙籴t(yī)院整體層面的管理機(jī)制,數(shù)據(jù)標(biāo)準(zhǔn)由多部門管理,缺乏協(xié)調(diào)機(jī)制,因關(guān)注角度、管理差異導(dǎo)致口徑不一致,雖然是同一主題的數(shù)據(jù),但是在執(zhí)行中有多套標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)準(zhǔn)字典維護(hù)不及時(shí),不能滿足臨床使用需求,導(dǎo)致臨床自定義人工填寫情況較多。數(shù)據(jù)質(zhì)量責(zé)任不清晰,缺失數(shù)據(jù)質(zhì)量的考核質(zhì)控機(jī)制。
數(shù)據(jù)一致性差的根本原因在于冗余。冗余是指相同的數(shù)據(jù)存儲(chǔ)了多份,比如業(yè)務(wù)明細(xì)表和字典表存在對(duì)應(yīng)關(guān)系,導(dǎo)致在業(yè)務(wù)明細(xì)表中冗余了字典表中的部分?jǐn)?shù)據(jù)。導(dǎo)致當(dāng)字典表更改后,明細(xì)表無法隨之同步,就會(huì)造成數(shù)據(jù)不一致的情況,這一般是電子病歷評(píng)級(jí)中一致性差的大部分原因。冗余的根本原因是數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)不合理,沒有依據(jù)適合的范式進(jìn)行設(shè)計(jì)。
數(shù)據(jù)完整性差的主要原因在于信息系統(tǒng)缺乏校驗(yàn)機(jī)制,在數(shù)據(jù)產(chǎn)生時(shí)沒有進(jìn)行合理的把控。由于各種信息系統(tǒng)是在近年不斷建設(shè)起來的,在建設(shè)之初可能某些字段信息并沒有那么重要,不屬于必填項(xiàng),而后來隨著醫(yī)療管理業(yè)務(wù)需求的不斷延伸,這些信息就變成必填項(xiàng)了,而醫(yī)院的內(nèi)部管理和信息系統(tǒng)的升級(jí)還沒有跟上需求的步伐,導(dǎo)致信息系統(tǒng)設(shè)計(jì)滯后于實(shí)際需求。
針對(duì)上述的原因,我院?jiǎn)?dòng)了數(shù)據(jù)質(zhì)量治理建設(shè)。
首先要完善組織架構(gòu),明確權(quán)利責(zé)任分工,實(shí)現(xiàn)醫(yī)院整體層面重視。
要實(shí)現(xiàn)院級(jí)的重視,主要在于使各個(gè)信息產(chǎn)生部門、使用部門意識(shí)到數(shù)據(jù)資產(chǎn)的價(jià)值,尤其是長(zhǎng)期價(jià)值。
確保資金、人力、技術(shù)的持續(xù)性投入。制度化、規(guī)范化數(shù)據(jù)質(zhì)量管理,實(shí)現(xiàn)對(duì)數(shù)據(jù)的產(chǎn)生、共享、使用、統(tǒng)計(jì)全過程質(zhì)量把控。做好日常數(shù)據(jù)質(zhì)量監(jiān)測(cè),及時(shí)提出質(zhì)控和改進(jìn)意見,補(bǔ)充完善質(zhì)控目標(biāo)。
加強(qiáng)培訓(xùn)和交流,確保在數(shù)據(jù)的理解上不同科室達(dá)成共識(shí),形成一個(gè)完備的數(shù)據(jù)標(biāo)準(zhǔn)。
梳理分散在各系統(tǒng)中的數(shù)據(jù),參考國(guó)家、地方衛(wèi)健委發(fā)布的標(biāo)準(zhǔn)數(shù)據(jù)集,確定統(tǒng)一的命名、定義、數(shù)據(jù)類型、值域規(guī)則、計(jì)算方法,確定解釋、核對(duì)、負(fù)責(zé)科室,避免歧義。醫(yī)療機(jī)構(gòu)在制定數(shù)據(jù)標(biāo)準(zhǔn)時(shí),可能遇到現(xiàn)有國(guó)家、地方標(biāo)準(zhǔn)滯后的情況,需要有敢為人先的膽魄,積極擴(kuò)展數(shù)據(jù)標(biāo)準(zhǔn)。當(dāng)國(guó)家標(biāo)準(zhǔn)更新后,對(duì)標(biāo)會(huì)比梳理雜亂數(shù)據(jù)容易的多,數(shù)據(jù)質(zhì)量也更高,更容易利用。確定數(shù)據(jù)質(zhì)量核查規(guī)則,包括完整性、及時(shí)性、關(guān)聯(lián)性、準(zhǔn)確性等核查規(guī)則,確保按標(biāo)準(zhǔn)行事,把數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用到日常數(shù)據(jù)質(zhì)量評(píng)估工作中,維持?jǐn)?shù)據(jù)模型的一致、規(guī)范。
以電子病歷評(píng)級(jí)、互聯(lián)互通評(píng)級(jí)等為抓手,以患者診療全過程和醫(yī)院運(yùn)營(yíng)管理優(yōu)化為導(dǎo)向,以建設(shè)區(qū)域醫(yī)療中心、科研平臺(tái)為契機(jī),構(gòu)建數(shù)據(jù)中心、集成平臺(tái)、主數(shù)據(jù)、主索引、質(zhì)控、績(jī)效考核、數(shù)據(jù)質(zhì)量自動(dòng)核查等信息系統(tǒng),加大信息化投入,完善功能改造,規(guī)范數(shù)據(jù)的采集、抽取、 交互過程,一方面提升數(shù)據(jù)質(zhì)量,另一方面使數(shù)據(jù)質(zhì)量監(jiān)控可視化、透明化,更方便,更易于暴露出問題來。
完善數(shù)據(jù)填寫界面的必填項(xiàng)、值域核查。根據(jù)范式優(yōu)化數(shù)據(jù)庫設(shè)計(jì),減少冗余,同時(shí)保持服務(wù)器資源的充裕和先進(jìn)性,實(shí)施數(shù)據(jù)庫讀寫分離,保證數(shù)據(jù)檢索速度,減少信息系統(tǒng)自定義錄入的漏洞。在字典維護(hù)時(shí)減少修改和刪除,改為停用和新設(shè),避免數(shù)據(jù)不一致的發(fā)生。持續(xù)數(shù)據(jù)質(zhì)量分析,不斷發(fā)現(xiàn)問題,反饋改進(jìn)建議,積極督促業(yè)務(wù)系統(tǒng)不斷改進(jìn)與完善,嚴(yán)把源頭數(shù)據(jù)質(zhì)量關(guān)。做好培訓(xùn)、考核,提升全體職工信息化水平。
數(shù)據(jù)的質(zhì)量就像地基,埋在地下看不出來,但它是建筑的基礎(chǔ)。基礎(chǔ)不牢,地動(dòng)山搖,沒有一個(gè)好的數(shù)據(jù)質(zhì)量,信息系統(tǒng)就發(fā)揮不出應(yīng)有的作用,數(shù)據(jù)利用、開發(fā)也事倍而功半。所以醫(yī)療機(jī)構(gòu)一定要真正認(rèn)識(shí)到數(shù)據(jù)的價(jià)值,對(duì)數(shù)據(jù)資產(chǎn)加以管理,加強(qiáng)數(shù)據(jù)治理。
數(shù)據(jù)治理不是幾個(gè)科室的事情,也不是單純的技術(shù)問題,而是涉及到醫(yī)院整體管理的諸多方面,包括工作制度、流程、標(biāo)準(zhǔn)、機(jī)制等,所以醫(yī)院管理者在管理數(shù)據(jù)質(zhì)量上要多措并舉,識(shí)別出醫(yī)院數(shù)據(jù)質(zhì)量的現(xiàn)狀,深入性地分析產(chǎn)生問題的原因,并針對(duì)性地提出解決措施。
關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)的制定一定是越嚴(yán)越好,并非有些人說的沒有必要、差不多就行了。原紅塔集團(tuán)董事長(zhǎng)褚時(shí)健創(chuàng)辦褚橙之后曾接受過這么一個(gè)采訪:“記者問,為何果樹間距要規(guī)定這么大,有什么依據(jù)?褚時(shí)健回答說,也沒有什么依據(jù),大一點(diǎn)小一點(diǎn)都行,但是要是沒有這么一個(gè)規(guī)定,農(nóng)民就會(huì)錯(cuò)的離譜。[18]”數(shù)據(jù)標(biāo)準(zhǔn)也是如此,只有堅(jiān)持標(biāo)準(zhǔn),勤抓不懈,才能把數(shù)據(jù)治理做好,為未來數(shù)據(jù)利用夯實(shí)好基礎(chǔ),真正發(fā)揮出數(shù)據(jù)資產(chǎn)的效益,提升醫(yī)院的競(jìng)爭(zhēng)力。
利益沖突:所有作者均聲明不存在利益沖突