孟 亞,嚴(yán) 健,黃優(yōu)杰,劉鵬遠(yuǎn)
(上海市徐匯區(qū)大華醫(yī)院,上海 200237)
基于醫(yī)院數(shù)據(jù)中心的臨床全視圖構(gòu)建方法研究
孟 亞,嚴(yán) 健,黃優(yōu)杰,劉鵬遠(yuǎn)
(上海市徐匯區(qū)大華醫(yī)院,上海 200237)
為了提高醫(yī)院臨床管理的精細(xì)化程度,更好地滿足臨床診療、科研和醫(yī)療質(zhì)量的需求,需要構(gòu)建基于醫(yī)院數(shù)據(jù)中心的臨床全視圖系統(tǒng);當(dāng)前的臨床全視圖構(gòu)建方法,是以數(shù)據(jù)分塊存儲的方式進(jìn)行構(gòu)建,導(dǎo)致臨床醫(yī)護(hù)人員無法獲得完整有效的醫(yī)療數(shù)據(jù),存在臨床數(shù)據(jù)分散、數(shù)據(jù)不完整等問題;為此,提出一種基于醫(yī)院數(shù)據(jù)中心的Paxos算法臨床全視圖構(gòu)建方法;仿真實(shí)驗(yàn)結(jié)果證明,所提方法可以將醫(yī)療數(shù)據(jù)有效地應(yīng)用到醫(yī)務(wù)人員的臨床工作中,達(dá)到數(shù)據(jù)資源利用最大化,幫助醫(yī)院實(shí)現(xiàn)醫(yī)療信息化改進(jìn)和服務(wù)創(chuàng)新,使各個異構(gòu)系統(tǒng)之間的數(shù)據(jù)進(jìn)行交互,實(shí)現(xiàn)了醫(yī)療數(shù)據(jù)共享,為臨床工作的發(fā)展提供了可用工具;基于醫(yī)院數(shù)據(jù)中心構(gòu)建的臨床全視圖具有全面、精準(zhǔn)、可共享的特點(diǎn),在未來醫(yī)院數(shù)據(jù)中心控制系統(tǒng)的發(fā)展中具有重要作用。
醫(yī)院數(shù)據(jù)中心;全視圖構(gòu)建;方法研究
目前,隨著醫(yī)院信息系統(tǒng)的全面發(fā)展,在臨床工作中產(chǎn)生了海量醫(yī)療數(shù)據(jù),例如門急診數(shù)據(jù)、手術(shù)數(shù)據(jù)、住院數(shù)據(jù)等[1]。醫(yī)療數(shù)據(jù)的用處很多,它不僅可以為醫(yī)療技術(shù)的提高提供輔助作用,而且還可以幫助醫(yī)院進(jìn)行管理創(chuàng)新[2]。但由于醫(yī)療數(shù)據(jù)錯綜復(fù)雜,很難將所有的相關(guān)數(shù)據(jù)集合到一個頁面展示,尤其是在臨床方面,因此醫(yī)院臨床全視圖的構(gòu)建成為了當(dāng)今HIT業(yè)界的熱點(diǎn)問題[3-4]。醫(yī)療數(shù)據(jù)具有規(guī)模龐大,數(shù)據(jù)交互性不強(qiáng)等特點(diǎn),多數(shù)醫(yī)院臨床全視圖構(gòu)建方法無法對醫(yī)院臨床數(shù)據(jù)進(jìn)行準(zhǔn)確穩(wěn)定地構(gòu)建,導(dǎo)致基于醫(yī)院數(shù)據(jù)中心的臨床全視圖系統(tǒng)構(gòu)建時,經(jīng)常出現(xiàn)惡意數(shù)據(jù)混淆,可利用數(shù)據(jù)丟失,數(shù)據(jù)查找結(jié)果不明確等問題[5]。在這種情況下,如何提高基于醫(yī)院數(shù)據(jù)中心臨床全視圖構(gòu)建準(zhǔn)確度,增加全視圖構(gòu)建質(zhì)量,成為了該領(lǐng)域亟待解決的問題[6]。而利用Paxos算法進(jìn)行基于醫(yī)院數(shù)據(jù)中心的臨床全視圖構(gòu)建的方法,不僅可以對臨床全視圖進(jìn)行全面,高效地構(gòu)建,而且也是解決上述問題的有效途徑,受到了醫(yī)療信息化方面專家的關(guān)注和深度鉆研,同時也出現(xiàn)了很多好的方法[7]。
文獻(xiàn)[8]提出了一種基于本體論的醫(yī)院臨床全視圖構(gòu)建方法。該方法首先對醫(yī)院信息數(shù)據(jù)網(wǎng)絡(luò)的生成進(jìn)行深入研究,然后利用全局本體對醫(yī)院臨床全視圖的構(gòu)建進(jìn)行透徹分析,最后結(jié)合實(shí)例,完成對醫(yī)院臨床全視圖的構(gòu)建。該方法運(yùn)行起來很簡單,但是存在構(gòu)建準(zhǔn)確率低的問題。文獻(xiàn)[9]提出了一種基于XML中間件技術(shù)的醫(yī)院臨床全視圖構(gòu)建方法。該方法首先在醫(yī)院數(shù)據(jù)集成的基礎(chǔ)上,不局限于原有數(shù)據(jù),對數(shù)據(jù)源的范圍進(jìn)行拓寬,然后利用中間件技術(shù)獨(dú)立開發(fā)的性能,使數(shù)據(jù)彼此間固定接口并進(jìn)行交互,明確各自的功能,最后以數(shù)據(jù)源作為單位,構(gòu)建醫(yī)院臨床全視圖。該方法用時較短,但是對數(shù)據(jù)源范圍的拓寬過程導(dǎo)致了惡意數(shù)據(jù)較多的問題。文獻(xiàn)[10]提出了一種基于Datalog規(guī)則的醫(yī)院臨床全視圖構(gòu)建方法。該方法首先對醫(yī)院數(shù)據(jù)集成結(jié)構(gòu)進(jìn)行分析,然后利用Datalog規(guī)則將醫(yī)院臨床全視圖描述出來,最后將數(shù)據(jù)集成分為自上而下和自下而上兩類,并對醫(yī)院數(shù)據(jù)全視圖的集成部分進(jìn)行討論。該方法對醫(yī)院臨床全視圖構(gòu)建的比較全面,但是存在耗時較長的問題。
針對上述產(chǎn)生的問題,提出一種基于醫(yī)院數(shù)據(jù)中心的Paxos算法臨床全視圖構(gòu)建方法。仿真實(shí)驗(yàn)證明,所提方法可以準(zhǔn)確地對醫(yī)院臨床全視圖進(jìn)行構(gòu)建。
1.1.1 醫(yī)院數(shù)據(jù)清洗
以2.1中的信息為依據(jù),利用擴(kuò)展樹狀知識庫對醫(yī)院數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行清洗。其清洗過程為:首先根據(jù)醫(yī)院實(shí)際情況的需求,獲得清洗的相關(guān)知識和該知識對應(yīng)的原子知識集合,其次要將該原子集合優(yōu)化,取得醫(yī)院數(shù)據(jù)清洗時利用的清洗序列,這也是醫(yī)院數(shù)據(jù)中心數(shù)據(jù)清洗中至關(guān)重要的步驟,最后以清洗序列為基礎(chǔ),對醫(yī)院數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行清洗。假設(shè),輸入為醫(yī)院原始數(shù)據(jù)中心的數(shù)據(jù),則輸出為清洗過的醫(yī)院數(shù)據(jù)。綜上可知對醫(yī)院數(shù)據(jù)中心的原始數(shù)據(jù)清洗時:
1)對醫(yī)院數(shù)據(jù)中心的預(yù)處理對象進(jìn)行選擇。假設(shè),要清洗的醫(yī)院數(shù)據(jù)集為{B1,B2,…,Bn},在知識庫中選取的醫(yī)院數(shù)據(jù)清洗相關(guān)知識為{TQ1,TQ2,…,TQn},醫(yī)院數(shù)據(jù)清洗屬性和知識集(Bi,TQi)為相互對應(yīng)的關(guān)系。由此可得知識集TQi:
TQi={Ti1,Ti2,…,Tim}
(1)
其中:i代表醫(yī)院數(shù)據(jù)數(shù)目,m代表數(shù)據(jù)清洗對象個數(shù),Tij(1≤j≤m)代表擴(kuò)展樹狀知識庫中一個結(jié)點(diǎn),但不是葉結(jié)點(diǎn),j代表數(shù)據(jù)清洗對象中某一數(shù)據(jù)。對于每個(Bi,TQi)轉(zhuǎn)2)。
2)原子知識集的產(chǎn)生。對于TQi中的每一個知識Tij,搜尋其知識庫,得到Tij的所有原子知識:
Tij={Tij1,Tij2,…,Tijq}
(2)
其中:q代表原子知識總量,Tijv(1≤v≤q)代表原子知識。
3)對重復(fù)原子知識進(jìn)行刪除操作,公式為:
TQi={Ti1,Ti2,…,Tim}=
{Ti11,Ti12,…,Ti21,Ti22,…,Tim1,Tim2,…}
(3)
假設(shè),F(xiàn)為醫(yī)院數(shù)據(jù)屬性,該屬性所對應(yīng)的知識集可表示為{T1,T2,T3},則其原子知識集可分別表示為:
T1=(T11,T12)
(4)
T2=(T12,T21)
(5)
T3=(T21,T31)
(6)
根據(jù)上述公式可知,數(shù)據(jù)屬性F所對應(yīng)的原子知識集表示為{T11,T12,T21,T31}。
4)原子知識序列的產(chǎn)生。對醫(yī)院數(shù)據(jù)清洗的過程中,由于數(shù)據(jù)清洗知識的不同,導(dǎo)致數(shù)據(jù)清洗時間也就不同,因此一個數(shù)據(jù)清洗知識對應(yīng)一個數(shù)據(jù)處理權(quán)重。對3)中產(chǎn)生的原子知識集,將權(quán)重按照從小到大的順序進(jìn)行排列,并得到原子知識序列。假設(shè),依據(jù)原子知識權(quán)重按照從小到大進(jìn)行排序,得到序列T12,T31,T11,T21,則屬性B所對應(yīng)的原子知識序列可表示為(T12,T31,T11,T21)。
5)綜上所述,通過原子知識序列完成對醫(yī)院數(shù)據(jù)中心數(shù)據(jù)的預(yù)處理。假設(shè)原始醫(yī)療數(shù)據(jù)庫為G,序列中原子知識個數(shù)為H,則醫(yī)院數(shù)據(jù)中心數(shù)據(jù)的預(yù)處理方法時間復(fù)雜度可表示為O(G×H)。
1.1.2 醫(yī)院數(shù)據(jù)集成與數(shù)據(jù)脫敏
將2.2中清洗過的醫(yī)療數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)集成算法進(jìn)行數(shù)據(jù)集成。首先對醫(yī)院原始數(shù)據(jù)集B訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而得到一個分類器Ni,將該分類器作為醫(yī)院數(shù)據(jù)集成中的一個組成部分,然后利用醫(yī)院原始數(shù)據(jù)集B的特性產(chǎn)生額外數(shù)據(jù),假設(shè)得到的額外數(shù)據(jù)集為M,通過數(shù)據(jù)集成分類器對數(shù)據(jù)集M進(jìn)行分類,使數(shù)據(jù)集M中每個數(shù)據(jù)點(diǎn)都可以得到一個隸屬于各數(shù)據(jù)類的概率分布。
假設(shè),要對每個數(shù)據(jù)點(diǎn)的具體類別進(jìn)行確定,則可以轉(zhuǎn)換為求每個數(shù)據(jù)點(diǎn)所屬類別的概率值,且此概率值為最大概率值。為了使后續(xù)生成的神經(jīng)網(wǎng)絡(luò)分類器以及醫(yī)院數(shù)據(jù)集成中的分類器,可以有較大的差異。將數(shù)據(jù)集M中的每個數(shù)據(jù)點(diǎn),隸屬于各類的概率進(jìn)行求倒數(shù)操作。假設(shè),確定了生成數(shù)據(jù)所屬類別后,與醫(yī)院原始數(shù)據(jù)集B一起訓(xùn)練,成為新神經(jīng)網(wǎng)絡(luò)的醫(yī)療數(shù)據(jù)集,設(shè)置利用該數(shù)據(jù)集得到分類器N′。
為了保障醫(yī)院數(shù)據(jù)集成的準(zhǔn)確性,將新生成的分類器N′,加入至醫(yī)院數(shù)據(jù)集成中,對數(shù)據(jù)集成分類器在醫(yī)院原始數(shù)據(jù)集B上的分類誤差率進(jìn)行計(jì)算,假設(shè)該誤差率小于未加入N′時的誤差率,則N′可以當(dāng)作醫(yī)院數(shù)據(jù)集成中的組成部分,否則將N′丟棄。直至達(dá)到醫(yī)院數(shù)據(jù)集成規(guī)模的要求,或者達(dá)到額定的迭代次數(shù)。
對醫(yī)院數(shù)據(jù)集成規(guī)模以及迭代次數(shù)賦值:i=1,iterations=1,利用數(shù)據(jù)集B進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練操作,則可得到分類器Ni:
Ni=AA(B)
(7)
其中:A代表神經(jīng)網(wǎng)絡(luò)訓(xùn)練的常數(shù)單位。將分類器Ni加入至醫(yī)院數(shù)據(jù)集成過程中,則有N*={Ni},對數(shù)據(jù)集成分類器在醫(yī)院原始數(shù)據(jù)集B上的誤差率λ進(jìn)行計(jì)算可得:
(8)
其中:wi和li分別代表醫(yī)院原始數(shù)據(jù)的兩個子集。利用醫(yī)院原始數(shù)據(jù)集B的數(shù)據(jù)分布產(chǎn)生數(shù)據(jù)集M,數(shù)據(jù)集M中數(shù)據(jù)點(diǎn)個數(shù)通過比例因子ε確定,則:
M=Data-Generation(ε,B)
(9)
利用得到的局部數(shù)據(jù)集成分類器,對數(shù)據(jù)集M進(jìn)行分類,分類結(jié)果代表每個數(shù)據(jù)點(diǎn),隸屬各數(shù)據(jù)類別的概率分布S,則:
S=Local-Ensembie-Classification(N*,M)
(10)
其中:為了生成有差異的神經(jīng)網(wǎng)絡(luò),依據(jù)概率分布S,生成一個與S互為倒數(shù)的概率分布,即:
M-label=set-Class-Label(N*,M)
(11)
將新產(chǎn)生的數(shù)據(jù)集M-label和數(shù)據(jù)集B組合成新數(shù)據(jù)集B,則:
B=B∪M-label
(12)
利用神經(jīng)網(wǎng)絡(luò)算法對新生成的數(shù)據(jù)集B進(jìn)行訓(xùn)練操作,得到的醫(yī)院數(shù)據(jù)分類器為N′,則:
N′=AA(B′)
(13)
將式(13)得到的分類器N′加入到醫(yī)院數(shù)據(jù)集成中,則有:
N*=N*∪{N′}
(14)
將數(shù)據(jù)集B去除,產(chǎn)生新的數(shù)據(jù)集,B=B-M-label,根據(jù)新產(chǎn)生的數(shù)據(jù)集,對醫(yī)院數(shù)據(jù)集成分類器在醫(yī)院原始數(shù)據(jù)集B上的誤差率進(jìn)行計(jì)算:
(15)
其中:λ′代表根據(jù)新產(chǎn)生的數(shù)據(jù)集,醫(yī)院數(shù)據(jù)集成分類器在醫(yī)院原始數(shù)據(jù)集B上的誤差率。假設(shè)加入分類器N′之后,集成分類器在數(shù)據(jù)集B上的誤差率小于未加入集成分類器N′后數(shù)據(jù)集成分類器的誤差率,則在數(shù)據(jù)集成過程中,保留分類器N′,否則從醫(yī)院數(shù)據(jù)集成中將該分類器剔除。假設(shè)醫(yī)院數(shù)據(jù)屬性是連續(xù)性屬性,那么對數(shù)據(jù)集B中的每一個連續(xù)屬性均值與方差進(jìn)行計(jì)算,然后根據(jù)高斯分布產(chǎn)生新的數(shù)據(jù)集Data-con,假設(shè)醫(yī)院數(shù)據(jù)屬性是離散屬性,則對它們的概率分布進(jìn)行計(jì)算,按上述分布產(chǎn)生數(shù)據(jù)集Data-nocon,Data-nocon=generation(S-feature),將各屬性數(shù)據(jù)Data-nocon和Data-con結(jié)合,構(gòu)成新數(shù)據(jù)點(diǎn)Data。
Sl=E(SlN1(wi),SlN2(wi),…,SlN*(wi))
(16)
為了更好地保護(hù)患者隱私,保障醫(yī)院的正常管理,利用DDM對醫(yī)院數(shù)據(jù)進(jìn)行脫敏操作。DDM一般在敏感數(shù)據(jù)具有訪問權(quán)限時,對數(shù)據(jù)進(jìn)行脫敏,而且可以根據(jù)規(guī)劃,執(zhí)行對應(yīng)的脫敏操作。醫(yī)院數(shù)據(jù)脫敏系統(tǒng)主要由資源層、服務(wù)層、應(yīng)用層構(gòu)成,具體配置如下:
1)醫(yī)院敏感數(shù)據(jù)的識別配置:對目標(biāo)模型的全部數(shù)據(jù)進(jìn)行智能化識別,對醫(yī)院數(shù)據(jù)字段內(nèi)容分析透徹,對關(guān)鍵詞進(jìn)行處理,對數(shù)據(jù)庫中敏感數(shù)據(jù)進(jìn)行識別。
2)數(shù)據(jù)脫敏狀態(tài)監(jiān)控:對醫(yī)院數(shù)據(jù)脫敏系統(tǒng)運(yùn)行狀況進(jìn)行監(jiān)控與審計(jì),可以及時觀察到異常并且做出處理,在規(guī)定期限內(nèi)將綜合處理后的操作結(jié)果反饋給醫(yī)院管理人員,將脫敏的需求配置盡量完善,從而提高醫(yī)院數(shù)據(jù)的脫敏效率。
1)以醫(yī)院臨床全視圖組成結(jié)構(gòu)為基礎(chǔ),利用擴(kuò)展樹狀知識庫對醫(yī)院臨床數(shù)據(jù)進(jìn)行清洗。為實(shí)現(xiàn)Paxos算法臨床全視圖系統(tǒng)的構(gòu)建,首先對醫(yī)院臨床數(shù)據(jù)來源進(jìn)行統(tǒng)計(jì)。圖1給出了醫(yī)院臨床診療數(shù)據(jù)的組成部分。
圖1 醫(yī)院臨床診療數(shù)據(jù)的組成
由圖1可知,醫(yī)院臨床診療數(shù)據(jù)主要由:患者基本信息、醫(yī)囑信息、患者治療過敏史、病理報(bào)告、護(hù)理記錄、醫(yī)學(xué)影像報(bào)告、醫(yī)療費(fèi)用記錄、門診處方信息構(gòu)成。醫(yī)院臨床數(shù)據(jù)的構(gòu)成部分,對醫(yī)院臨床全視圖的構(gòu)建起到了輔助作用。
2)采用Paxos算法對清洗過的數(shù)據(jù)進(jìn)行集成。為了獲得差異比較大的神經(jīng)網(wǎng)絡(luò),使用數(shù)據(jù)分類器對數(shù)據(jù)集合中的各個數(shù)據(jù)點(diǎn)分類結(jié)果,進(jìn)行求倒數(shù)操作,從而獲得中的各個數(shù)據(jù)點(diǎn)概率分布。當(dāng)數(shù)據(jù)集成分類器中各個組成部分確定后,利用融合方法將各個分類器的數(shù)據(jù)分類結(jié)果進(jìn)行融合,由此完成對醫(yī)院數(shù)據(jù)的集成操作。
3)通過DDM對醫(yī)院敏感臨床數(shù)據(jù)進(jìn)行脫敏操作,從而完成對醫(yī)院臨床全視圖的構(gòu)建。圖2是醫(yī)院臨床全視圖系統(tǒng)的服務(wù)層架構(gòu)圖。
圖2 臨床全視圖服務(wù)層架構(gòu)
分析圖2可知,在醫(yī)院臨床全視圖架構(gòu)中,首先對醫(yī)院醫(yī)療臨床數(shù)據(jù)進(jìn)行清洗,過濾掉冗余數(shù)據(jù),并對清洗過的數(shù)據(jù)完成脫敏操作,然后將脫敏過的醫(yī)療臨床數(shù)據(jù)進(jìn)行集成和存儲,最后在數(shù)據(jù)中心基礎(chǔ)上采用B/S架構(gòu),將臨床業(yè)務(wù)人員需要的完整詳細(xì)的數(shù)據(jù)展示在臨床全視圖系統(tǒng)界面上。
為了證明基于Paxos算法的醫(yī)院臨床全視圖構(gòu)建方法的實(shí)用性,需要進(jìn)行一次仿真實(shí)驗(yàn)。在matlab R2016b的環(huán)境下搭建基于醫(yī)院數(shù)據(jù)中心的臨床全視圖構(gòu)建實(shí)驗(yàn)仿真平臺。實(shí)驗(yàn)數(shù)據(jù)取自于我院中心機(jī)房,利用本文所提Paxos算法對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行全視圖構(gòu)建,觀察其可靠性。表1是不同方法下數(shù)據(jù)集成時間(s)的對比。下面給出了數(shù)據(jù)集成時間(s)的計(jì)算公式:
(17)
由上述公式得出,當(dāng)數(shù)據(jù)集成量為2000萬個時,文獻(xiàn)[8]所用時間為10 s,本文方法所用時間為5 s;當(dāng)數(shù)據(jù)集成量為3000萬個時,文獻(xiàn)[8]所用時間為17 s,本文方法所用時間為9 s;當(dāng)數(shù)據(jù)集成量為4000萬個時,文獻(xiàn)[8]所用時間為26 s,本文方法所用時間為12 s;當(dāng)數(shù)據(jù)集成量為5000萬個時,文獻(xiàn)[8]所用時間為32 s,本文方法所用時間為17 s;當(dāng)數(shù)據(jù)集成量為6000萬個時,文獻(xiàn)[8]所用時間為41 s,本文方法所用時間為22 s。分析表1可知,文獻(xiàn)[8]所提方法進(jìn)行數(shù)據(jù)集成的所用時間比本文所提Paxos算法所用時間多,因?yàn)槲墨I(xiàn)[8]所提方法最后是以結(jié)合實(shí)例的方式,完成對醫(yī)院臨床全視圖的構(gòu)建,并未設(shè)計(jì)單獨(dú)的數(shù)據(jù)集成模塊,導(dǎo)致數(shù)據(jù)在集成過程中沒有相對應(yīng)的系統(tǒng)控制數(shù)據(jù)集成時間,存在數(shù)據(jù)集成所用時間長的問題。而本文所提Paxos算法利用神經(jīng)網(wǎng)絡(luò)集成算法進(jìn)行數(shù)據(jù)集成,減少了數(shù)據(jù)集成時間。
表1 不同方法下數(shù)據(jù)集成時間對比
分別計(jì)算文獻(xiàn)[8]、文獻(xiàn)[9]、文獻(xiàn)[10]所提方法下構(gòu)建的醫(yī)院臨床全視圖,所占存儲空間很大,尤其是文獻(xiàn)[10]所提方法,全視圖所占存儲空間高達(dá)400 GB,與之相比的本文方法下的醫(yī)院臨床全視圖僅占160 GB的存儲空間,如表2所示,證明了本文所提Paxos算法具有可靠性和穩(wěn)定性。
表2是不同方法下醫(yī)院臨床全視圖所占存儲空間(GB)對比。
表2 不同方法下醫(yī)院臨床全視圖所占存儲空間對比
圖3是不同方法下醫(yī)院數(shù)據(jù)清洗效率(%)對比。下面給出了數(shù)據(jù)清洗效率(%)計(jì)算公式:
(18)
圖3 不同方法下數(shù)據(jù)清洗效率對比
從圖3可以看出,數(shù)據(jù)清洗效率隨著數(shù)據(jù)清洗量的不斷增加而變化,文獻(xiàn)[9]和文獻(xiàn)[10]所提方法的數(shù)據(jù)清洗效率曲線波動很大,而且數(shù)據(jù)清洗效率很低,本文所提方法的數(shù)據(jù)清洗效率高且效率曲線起伏不大,而本文Paxos算法數(shù)據(jù)清洗效率較高,這主要是因?yàn)樵诶肞axos算法進(jìn)行數(shù)據(jù)清洗時,采用了擴(kuò)展樹狀知識庫完成對醫(yī)院數(shù)據(jù)的清洗,使得Paxos算法具有較高的清洗效率,進(jìn)一步證明了本文所提方法的整體有效性。圖4是不同方法下數(shù)據(jù)脫敏覆蓋率(%)的對比。下面給出了數(shù)據(jù)脫敏覆蓋率(%)計(jì)算公式:
(19)
圖4 不同方法下數(shù)據(jù)脫敏覆蓋率對比
脫敏數(shù)據(jù)對醫(yī)院數(shù)據(jù)的管理非常重要,分析圖4可知,文獻(xiàn)所提方法的脫敏覆蓋率相對集中,表示它們的脫敏性能大致相同,覆蓋率基本維持在78%以下,而本文所提Paxos算法的脫敏覆蓋率幾乎在82%以上,本文最低脫敏覆蓋率與文獻(xiàn)最高脫敏覆蓋率相差4%,證明了本文方法對醫(yī)院敏感信息的保護(hù)相對穩(wěn)定可靠。
仿真實(shí)驗(yàn)證明,Paxos算法可以準(zhǔn)確地對基于醫(yī)院數(shù)據(jù)中心的臨床全視圖進(jìn)行構(gòu)建。
采用傳統(tǒng)方法對基于醫(yī)院數(shù)據(jù)中心的臨床全視圖系統(tǒng)進(jìn)行構(gòu)建時,無法構(gòu)建出準(zhǔn)確詳細(xì)的全視圖,存在醫(yī)護(hù)人員對醫(yī)療數(shù)據(jù)查詢時,查詢結(jié)果不理想,無法在同一界面看到所有相關(guān)信息數(shù)據(jù)的問題。提出一種基于Paxos算法的醫(yī)院數(shù)據(jù)中心臨床全視圖構(gòu)建方法。并通過仿真實(shí)驗(yàn)證明,Paxos算法可以準(zhǔn)確地對醫(yī)院臨床全視圖進(jìn)行構(gòu)建,具有優(yōu)秀的應(yīng)用價值。后期我院將與上??铝植既鹦畔⒓夹g(shù)有限公司合作,利用Paxos算法將基于臨床數(shù)據(jù)中心的臨床全視圖系統(tǒng)實(shí)施落地,更好的服務(wù)于臨床。
[1] 奈存劍,任宇飛,李 金,等.醫(yī)院臨床數(shù)據(jù)中心建設(shè)與應(yīng)用[J].中國醫(yī)院管理,2014,34(5):53-54.
[2] 張文捷,蔣 抒,張 民.我院綠色數(shù)據(jù)中心建設(shè)的實(shí)踐[J].中華醫(yī)院管理雜志,2016,32(5):394-396.
[3] 高 明,唐 順,徐福文.醫(yī)院數(shù)據(jù)挖掘平臺中X-11-ARIMA預(yù)測模型的應(yīng)用研究[J].中國衛(wèi)生統(tǒng)計(jì),2016,33(1):139-141.
[4] 于國泳,楊 薇,謝雁鳴,等.醫(yī)院信息系統(tǒng)數(shù)據(jù)庫72772例2型糖尿病患者臨床特征分析[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2014,37(12):851-857.
[5] 吳正一,崔迎慧,陸 耀,等.以臨床數(shù)據(jù)倉庫為核心的醫(yī)院大數(shù)據(jù)平臺構(gòu)建[J].中國醫(yī)院管理,2015,35(11):13-15.
[6] 楊 莘,韓斌如,應(yīng) 波,等.基于信息數(shù)據(jù)中心決策支持平臺構(gòu)建護(hù)理質(zhì)量評價體系[J].中華護(hù)理雜志,2015,50(1):10-13.
[7] 陳 川.基于學(xué)科元數(shù)據(jù)中心的知識服務(wù)平臺建設(shè)研究與應(yīng)用[J].情報(bào)理論與實(shí)踐,2014,37(5):57-60.
[8] 侯佳音,史淳樵.云計(jì)算技術(shù)在醫(yī)院的信息化建設(shè)中的應(yīng)用研究[J].電子設(shè)計(jì)工程,2016,24(5):35-39.
[9] 劉 偉,趙一林.數(shù)據(jù)包絡(luò)分析在地市級中心醫(yī)院綜合效率分析中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),2014,31(5):896-898.
[10] 宗酉明,詹偉國,畢魯佳,等.醫(yī)院影像系統(tǒng)圖文大數(shù)據(jù)云存儲的實(shí)踐應(yīng)用[J].中華醫(yī)院管理雜志,2015,31(12):940-942.
Research on Construction Method of Clinical View Based on Hospital Data Center
Meng Ya,Yan Jian,Huang Youjie,Liu Pengyuan
(Shanghai Dahua Hospital,Shanghai 200237,China)
In order to improve the refinement of clinical management and better meet the needs of clinical diagnosis and research and medical quality, it is necessary to build a clinical whole view system based on hospital data center. The construction method of current clinical view, is based on data block storage mode, leading to clinical medical staff difficult to obtain complete medical data effectively, clinical data scattered and incomplete data problems. Therefore, a method of constructing clinical full view of Paxos algorithm based on hospital data center is proposed. The simulation results show that the proposed method can be effectively applied to medical data in the clinical work of medical personnel, to maximize the use of the data resources, help hospital to realize medical information service innovation and improvement, the interaction between heterogeneous system data, the implementation of medical data sharing, provide the tools available for the development of clinical work. The clinical full view based on hospital data center has the characteristics of comprehensive, accurate and sharable. It plays an important role in the development of hospital data center control system in the future.
hospital data center; full view build; methods to study
2017-05-10;
2017-05-22。
孟 亞(1981-),男,上海人,碩士研究生,高級工程師,主要從事醫(yī)院信息化管理與建設(shè)相關(guān)工作方向的研究。
嚴(yán) 健(1958-),男,江蘇人,碩士研究生,主任醫(yī)師,主要從事醫(yī)院管理方向的研究。
1671-4598(2017)12-0191-04
10.16526/j.cnki.11-4762/tp.2017.12.050
R319
A