馮牧青 賀 云 高雪建 嚴(yán) 梅 馮昌琪 侯光輝
(四川華軟慧醫(yī)科技有限公司 成都610000) (成都智物云科技有限公司 成都610072) (四川華軟慧醫(yī)科技有限公司成都610000) (四川天府健康產(chǎn)業(yè)研究院成都610000) (宜賓市第二人民醫(yī)院宜賓644000)
根據(jù)《衛(wèi)生信息基本數(shù)據(jù)集編制規(guī)范(WS370-2012)》(以下簡(jiǎn)稱WS370-2012),數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符是由數(shù)據(jù)集(數(shù)據(jù)子集)標(biāo)識(shí)符和數(shù)據(jù)元在數(shù)據(jù)集(數(shù)據(jù)子集)中的順序號(hào)組成[1-2],見(jiàn)圖1。數(shù)據(jù)集(數(shù)據(jù)子集)標(biāo)識(shí)符是數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的前9位(含1位小數(shù)點(diǎn)),數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符是在數(shù)據(jù)集標(biāo)識(shí)符基礎(chǔ)上增加了4位(含1位小數(shù)點(diǎn),數(shù)據(jù)元的順序號(hào)3位),共13位。數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符具有數(shù)據(jù)集、數(shù)據(jù)子集的匯聚作用,在數(shù)據(jù)組織、存儲(chǔ)和傳輸方面具有潛在價(jià)值。數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符完整,分類和編碼科學(xué),對(duì)數(shù)據(jù)組織、存儲(chǔ)、傳輸和分析意義較大,可以促進(jìn)大數(shù)據(jù)和區(qū)塊鏈技術(shù)在衛(wèi)生健康領(lǐng)域的應(yīng)用。WS370-2012的發(fā)布對(duì)衛(wèi)生信息化建設(shè)具有里程碑意義,為衛(wèi)生信息(數(shù)據(jù))組織、存儲(chǔ)和傳輸提供更安全可靠的思路。但目前在醫(yī)療衛(wèi)生信息化建設(shè)中,數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的作用遠(yuǎn)沒(méi)有達(dá)到WS370-2012制訂的目的,應(yīng)用現(xiàn)狀不佳。
圖1 數(shù)據(jù)集標(biāo)識(shí)符與數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的關(guān)系和結(jié)構(gòu)
研究醫(yī)療衛(wèi)生信息系統(tǒng)中數(shù)據(jù)庫(kù)的數(shù)據(jù)表發(fā)現(xiàn),目前使用的醫(yī)療衛(wèi)生信息化產(chǎn)品中,數(shù)據(jù)元內(nèi)部標(biāo)識(shí)對(duì)信息系統(tǒng)發(fā)揮的作用不大。在醫(yī)療衛(wèi)生信息系統(tǒng)中,數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符在數(shù)據(jù)表中有以下幾種情況:在數(shù)據(jù)表中沒(méi)有內(nèi)部標(biāo)識(shí)符字段;有內(nèi)部標(biāo)識(shí)符字段但沒(méi)有內(nèi)部標(biāo)識(shí)符;有內(nèi)部標(biāo)識(shí)符字段但僅部分有內(nèi)部標(biāo)識(shí)符(抄取已分布的數(shù)據(jù)集),新增數(shù)據(jù)元都沒(méi)有內(nèi)部標(biāo)識(shí)符;數(shù)據(jù)集有內(nèi)部標(biāo)識(shí)符但較為混亂,內(nèi)部標(biāo)識(shí)符編碼不規(guī)律?;谝陨锨闆r,數(shù)據(jù)元內(nèi)部標(biāo)識(shí)在信息系統(tǒng)中無(wú)法發(fā)揮作用,對(duì)衛(wèi)生健康信息化發(fā)展極為不利。
3.1.1 數(shù)據(jù)集分類代碼體系不完整 自2011年至今已經(jīng)發(fā)布數(shù)十項(xiàng)衛(wèi)生信息基本數(shù)據(jù)集標(biāo)準(zhǔn)[3-7],幾乎覆蓋了大部分醫(yī)療衛(wèi)生業(yè)務(wù),但在醫(yī)療衛(wèi)生信息化系統(tǒng)(軟件)中應(yīng)用不多、執(zhí)行不到位。盡管WS370-2012附錄列出了衛(wèi)生信息基本數(shù)據(jù)集1級(jí)和2級(jí)類目的分類名稱及代碼基本框架,但僅給出A-D這4個(gè)1級(jí)業(yè)務(wù)類目名稱和代碼,衛(wèi)生服務(wù)2級(jí)類目中的5個(gè)2級(jí)類目分類及代碼,見(jiàn)表1。面對(duì)不斷增長(zhǎng)的業(yè)務(wù)需求,醫(yī)療衛(wèi)生信息系統(tǒng)(軟件)廠商不會(huì)增加1級(jí)和2級(jí)類目,更無(wú)法編碼,數(shù)據(jù)集中數(shù)據(jù)元標(biāo)識(shí)符只能為空。
表1 衛(wèi)生信息基本數(shù)據(jù)集分類代碼[2]
3.1.2 新增數(shù)據(jù)元未及時(shí)更新發(fā)布 隨著我國(guó)衛(wèi)生健康事業(yè)的發(fā)展,新業(yè)務(wù)不斷產(chǎn)生。信息系統(tǒng)中新數(shù)據(jù)元和新數(shù)據(jù)集不斷出現(xiàn)。截至目前衛(wèi)生行業(yè)基本數(shù)據(jù)集(子集)標(biāo)準(zhǔn)正式發(fā)布多達(dá)數(shù)十項(xiàng)[3-7],但由于新數(shù)據(jù)集標(biāo)準(zhǔn)沒(méi)有得到及時(shí)共享,后來(lái)者在不知情的情況下又另行編制相同或部分相同的數(shù)據(jù)集,導(dǎo)致相同業(yè)務(wù)信息系統(tǒng)出現(xiàn)多個(gè)基本數(shù)據(jù)集,相同業(yè)務(wù)信息系統(tǒng)不同廠家的產(chǎn)品數(shù)據(jù)匯聚后,數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符仍然不一致,需花費(fèi)大量時(shí)間、人力和財(cái)力對(duì)照做接口。
3.1.3 衛(wèi)生信息標(biāo)準(zhǔn)監(jiān)督執(zhí)法不力 部分衛(wèi)生信息標(biāo)準(zhǔn)是強(qiáng)制性標(biāo)準(zhǔn),受相關(guān)法規(guī)約束必須強(qiáng)制執(zhí)行,否則執(zhí)法部門(mén)可追究法律責(zé)任,見(jiàn)表2。但目前沒(méi)有明確針對(duì)衛(wèi)生信息標(biāo)準(zhǔn)的執(zhí)法主體,其監(jiān)督評(píng)審基本由業(yè)務(wù)部門(mén)或標(biāo)準(zhǔn)主管部門(mén)組織實(shí)施,如醫(yī)療健康信息醫(yī)院信息互聯(lián)互通標(biāo)準(zhǔn)化成熟度測(cè)評(píng)、電子病歷系統(tǒng)應(yīng)用水平分級(jí)評(píng)價(jià)標(biāo)準(zhǔn)(試行)、醫(yī)院智慧服務(wù)分級(jí)評(píng)估標(biāo)準(zhǔn)體系(試行)等[8-10],這些測(cè)評(píng)還沒(méi)有上升到法律法規(guī)層面,因此衛(wèi)生信息強(qiáng)制性標(biāo)準(zhǔn)未能很好地執(zhí)行,導(dǎo)致信息系統(tǒng)存在問(wèn)題。
表2 部分衛(wèi)生信息強(qiáng)制執(zhí)行標(biāo)準(zhǔn)示例
3.2.1 缺乏主動(dòng)執(zhí)行標(biāo)準(zhǔn)意識(shí) 醫(yī)療衛(wèi)生信息系統(tǒng)(軟件)生產(chǎn)廠商是衛(wèi)生信息標(biāo)準(zhǔn)的最大需方。衛(wèi)生信息標(biāo)準(zhǔn)是否執(zhí)行直接關(guān)系到產(chǎn)品質(zhì)量,但生產(chǎn)廠商的設(shè)計(jì)開(kāi)發(fā)人員在短時(shí)間內(nèi)掌握信息標(biāo)準(zhǔn)和醫(yī)療衛(wèi)生業(yè)務(wù)知識(shí),充分理解數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的經(jīng)濟(jì)價(jià)值是較困難的,同時(shí)廠商在相應(yīng)領(lǐng)域的投入積極性不高。這造成醫(yī)療衛(wèi)生信息系統(tǒng)(軟件)生產(chǎn)廠商設(shè)計(jì)和開(kāi)發(fā)人員缺乏衛(wèi)生信息標(biāo)準(zhǔn)和醫(yī)療衛(wèi)生業(yè)務(wù)基礎(chǔ)知識(shí),主觀上缺乏執(zhí)行衛(wèi)生信息標(biāo)準(zhǔn)意識(shí),導(dǎo)致了市場(chǎng)上大多數(shù)醫(yī)療衛(wèi)生信息系統(tǒng)(軟件)產(chǎn)品在衛(wèi)生信息標(biāo)準(zhǔn)執(zhí)行和標(biāo)準(zhǔn)應(yīng)用上存在較多缺陷。例如未利用標(biāo)準(zhǔn)的數(shù)據(jù)元目錄構(gòu)造標(biāo)準(zhǔn)的數(shù)據(jù)表和標(biāo)準(zhǔn)的數(shù)據(jù)集(子集),未科學(xué)利用數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符去組織、應(yīng)用、存儲(chǔ)和傳輸數(shù)據(jù),導(dǎo)致數(shù)據(jù)不準(zhǔn)確、數(shù)據(jù)無(wú)法合并歸檔、統(tǒng)計(jì)指標(biāo)口徑不統(tǒng)一等問(wèn)題,直接影響信息系統(tǒng)(軟件)產(chǎn)品質(zhì)量。
3.2.2 廠商被迫應(yīng)急應(yīng)對(duì)測(cè)評(píng) 當(dāng)前醫(yī)療衛(wèi)生信息化建設(shè)和應(yīng)用水平的國(guó)家級(jí)測(cè)評(píng)有3個(gè)[8-10],部分省份還有省級(jí)測(cè)評(píng)[11]。一方面醫(yī)院建設(shè)之初提出測(cè)評(píng)的達(dá)標(biāo)目標(biāo),將達(dá)標(biāo)目標(biāo)作為信息化建設(shè)項(xiàng)目的驗(yàn)收標(biāo)準(zhǔn)之一,而且時(shí)間要求非常高;另一方面承建商為了滿足醫(yī)院相關(guān)需求,在時(shí)間緊、自身信息標(biāo)準(zhǔn)和業(yè)務(wù)理解不深入的情況下有針對(duì)性地按測(cè)評(píng)要求開(kāi)發(fā)局部信息標(biāo)準(zhǔn)內(nèi)容或功能,即測(cè)什么做什么,導(dǎo)致承建商在執(zhí)行信息標(biāo)準(zhǔn)方面缺乏全盤(pán)思考,“偷工減料”“以點(diǎn)蓋面”,無(wú)法發(fā)揮數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的積極作用。
3.2.3 標(biāo)準(zhǔn)管理手段落后 標(biāo)準(zhǔn)制修訂工作中手動(dòng)建立新數(shù)據(jù)集(子集)時(shí)數(shù)據(jù)元查重非常困難,難以保證數(shù)據(jù)集標(biāo)識(shí)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的一致性;發(fā)布新數(shù)據(jù)集標(biāo)準(zhǔn)時(shí),因廠家不知曉而無(wú)法及時(shí)更新其信息標(biāo)準(zhǔn)體系;項(xiàng)目急需時(shí),廠家因不了解數(shù)據(jù)集標(biāo)識(shí)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符結(jié)構(gòu)和規(guī)則,數(shù)據(jù)集標(biāo)識(shí)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符只好空缺。從標(biāo)準(zhǔn)的生產(chǎn)到標(biāo)準(zhǔn)的使用過(guò)程中,信息化和自動(dòng)化程度較低,未能做到信息標(biāo)準(zhǔn)的生產(chǎn)和更新同步。
衛(wèi)生信息標(biāo)準(zhǔn)服務(wù)和云服務(wù)的研究為解決數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符應(yīng)用問(wèn)題提供了業(yè)內(nèi)認(rèn)同的理念和可行的技術(shù)路線[12-14]。數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符同步首先要解決應(yīng)用架構(gòu)、函數(shù)模型、程序流程3個(gè)方面的問(wèn)題。
構(gòu)建數(shù)據(jù)集標(biāo)準(zhǔn)自動(dòng)服務(wù),即面向醫(yī)療衛(wèi)生信息系統(tǒng)(軟件)開(kāi)發(fā)廠商建立為企業(yè)產(chǎn)品(項(xiàng)目)服務(wù)的數(shù)據(jù)集標(biāo)準(zhǔn)自動(dòng)化服務(wù)系統(tǒng),使數(shù)據(jù)集標(biāo)準(zhǔn)的生產(chǎn)和使用始終保持同步,這樣就可保證廠商在第一時(shí)間獲得最新發(fā)布的數(shù)據(jù)集標(biāo)準(zhǔn)、數(shù)據(jù)集標(biāo)識(shí)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符。數(shù)據(jù)集標(biāo)準(zhǔn)生產(chǎn)方負(fù)責(zé)建立數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的生產(chǎn)和發(fā)送系統(tǒng),使用方負(fù)責(zé)接收并且與企業(yè)信息標(biāo)準(zhǔn)體系同步更新,見(jiàn)圖2。
圖2 數(shù)據(jù)集標(biāo)準(zhǔn)應(yīng)用架構(gòu)
依照WS370-2012編碼規(guī)則與編碼結(jié)構(gòu)可事先構(gòu)建數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符編碼函數(shù),由程序調(diào)用函數(shù)引導(dǎo)生成數(shù)據(jù)集數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符,其函數(shù)模型如下:
f(x)代表待定數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符,HDS表示衛(wèi)生信息領(lǐng)域[2],DC(DomainCode)代表業(yè)務(wù)域1級(jí)類目,SC(SubClasses)代表業(yè)務(wù)域2級(jí)類目,SSN(Subset Sequence Number)代表數(shù)據(jù)子集序號(hào),ON(OrderNumber)代表數(shù)據(jù)元在數(shù)據(jù)集(子集)順序號(hào)。
由程序引導(dǎo)完成數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符編制可最大限度降低人為因素(知識(shí)欠缺、操作筆誤、前后矛盾等)影響,保證數(shù)據(jù)集中數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符質(zhì)量,見(jiàn)圖3。程序引導(dǎo)生成數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符過(guò)程中,手動(dòng)選擇1級(jí)和2級(jí)業(yè)務(wù)域類目名稱(DC∈{A,B,C,D…Z}、SC∈{01,02,03…99})時(shí),需由具備一定醫(yī)療衛(wèi)生基礎(chǔ)和分類知識(shí)的專人完成;選定1級(jí)類目名稱就有1位字母代碼自左至右自動(dòng)迭加,生成數(shù)據(jù)集標(biāo)識(shí)符;選定2級(jí)業(yè)務(wù)類目名稱后(SSN∈{01,02,03…99})有2位數(shù)字代碼由程序自左至右自動(dòng)迭加,生成數(shù)據(jù)子集標(biāo)識(shí)符;SC∈{001,002,003…999}順序號(hào)無(wú)需人工操作,由程序在上一個(gè)數(shù)據(jù)元序號(hào)后加1構(gòu)成。
圖3 數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符程序流程
利用數(shù)據(jù)集標(biāo)識(shí)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符可科學(xué)地組織數(shù)據(jù),方便快捷地建立主題數(shù)據(jù)庫(kù),增強(qiáng)數(shù)據(jù)使用的靈活性和利用效率。如臨床科研需要在數(shù)據(jù)中心提取數(shù)據(jù)時(shí),可利用數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的前6位代碼提取1級(jí)類目(主題)數(shù)據(jù),利用前9位代碼提取2級(jí)類目(亞主題)數(shù)據(jù),利用前13位代碼提取該數(shù)據(jù)元所有數(shù)據(jù)。由計(jì)算機(jī)程序?qū)崿F(xiàn)非常簡(jiǎn)單。
在數(shù)據(jù)傳輸和存儲(chǔ)過(guò)程中,可以數(shù)據(jù)元為最小單位而不是以數(shù)據(jù)表,用特定算法打亂數(shù)據(jù)元在數(shù)據(jù)集(子集)中的順序進(jìn)行傳輸或存儲(chǔ),即便被局部截獲也不會(huì)泄漏完整數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)接收方收到數(shù)據(jù)后,通過(guò)特定算法的逆運(yùn)算還原數(shù)據(jù),為數(shù)據(jù)傳輸和存儲(chǔ)提供新的安全手段。
通過(guò)數(shù)據(jù)集標(biāo)識(shí)符、數(shù)據(jù)子集標(biāo)準(zhǔn)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符可準(zhǔn)確定位大數(shù)據(jù)分析所需要的數(shù)據(jù)集、數(shù)據(jù)子集、數(shù)據(jù)元。在用Selecte語(yǔ)句提取數(shù)據(jù)時(shí),避免同一數(shù)據(jù)元因?yàn)閿?shù)據(jù)集不同或數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符重碼而導(dǎo)致的數(shù)據(jù)誤差。數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的唯一性使得數(shù)據(jù)分析精度更高,大數(shù)據(jù)邏輯鏈更長(zhǎng)、更有實(shí)用價(jià)值。
數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符具有數(shù)據(jù)集、數(shù)據(jù)子集的匯聚作用,其在數(shù)據(jù)組織、存儲(chǔ)和傳輸方面具有巨大應(yīng)用價(jià)值。但目前在醫(yī)療衛(wèi)生信息化建設(shè)中,數(shù)據(jù)集標(biāo)識(shí)符和數(shù)據(jù)元內(nèi)部標(biāo)識(shí)符的作用未能發(fā)揮,這緣于信息標(biāo)準(zhǔn)供方和信息標(biāo)準(zhǔn)需方兩方面原因。信息標(biāo)準(zhǔn)服務(wù)亟需實(shí)現(xiàn)自動(dòng)化,只有建立自動(dòng)化信息標(biāo)準(zhǔn)同步機(jī)制才能保證標(biāo)準(zhǔn)供方和標(biāo)準(zhǔn)需方的信息實(shí)時(shí)同步,數(shù)據(jù)集(子集)標(biāo)識(shí)符和數(shù)據(jù)元標(biāo)識(shí)符才能在數(shù)據(jù)組織、存儲(chǔ)、傳輸和分析中發(fā)揮作用。