向明華,向國華
1.泰興市人民醫(yī)院,江蘇 泰興 225400;2.中國電信股份有限公司泰興分公司,江蘇 泰興 225400
基于OCR技術(shù)的醫(yī)療檔案管理系統(tǒng)研究與構(gòu)建
向明華1,向國華2
1.泰興市人民醫(yī)院,江蘇 泰興 225400;2.中國電信股份有限公司泰興分公司,江蘇 泰興 225400
基于醫(yī)院信息系統(tǒng),利用OCR技術(shù)開發(fā)了醫(yī)療檔案管理系統(tǒng)。系統(tǒng)主要由管理模塊、OCR處理模塊、檔案管理模塊、郵件管理模塊組成。本文詳細(xì)介紹了系統(tǒng)的開發(fā)過程和使用情況。
醫(yī)院信息系統(tǒng);醫(yī)療檔案管理系統(tǒng);光學(xué)字符識(shí)別;便攜式文檔格式
隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,使得醫(yī)療檔案管理數(shù)字化、信息化已成必然趨勢(shì)[1-2]。病歷資料是在診療過程中形成的客觀病歷材料和主觀病歷材料,對(duì)將來醫(yī)療機(jī)構(gòu)舉證也起到舉足輕重的作用。電子醫(yī)療檔案是由病歷資料轉(zhuǎn)化而來,電子醫(yī)療檔案采用的便攜式文檔格式(PDF)不但能夠真實(shí)、準(zhǔn)確和客觀地反映原始病歷材料,而且PDF醫(yī)療檔案只可查閱,不可涂改,保證了病歷資料的客觀性和科學(xué)性[3-4]。筆者利用醫(yī)院現(xiàn)有的醫(yī)院信息系統(tǒng)(HIS)、影像歸檔和通信系統(tǒng)(PACS),構(gòu)建了基于光學(xué)字符識(shí)別(OCR)技術(shù)的PDF醫(yī)療檔案管理系統(tǒng),實(shí)現(xiàn)了信息共享和全文檢索,提高了醫(yī)療檔案文件管理的效率。
1.1 結(jié)構(gòu)設(shè)計(jì)
醫(yī)療檔案管理系統(tǒng)結(jié)構(gòu)設(shè)計(jì)主要包括系統(tǒng)管理模塊、OCR處理模塊、檔案管理模塊、郵件管理模塊等,見圖1。
1.2 功能設(shè)計(jì)
(1)系統(tǒng)管理模塊。該模塊負(fù)責(zé)系統(tǒng)的部門信息維護(hù)、人員信息維護(hù)、角色維護(hù)和模塊維護(hù),工作流程,見圖2。
(2)OCR處理模塊。經(jīng)OCR處理的PDF醫(yī)療文件不依靠第三方數(shù)據(jù)庫技術(shù),直接進(jìn)行內(nèi)容抽取和索引,對(duì)被索引的文件內(nèi)容可以進(jìn)行高效全文檢索。該模塊具有圖像輸入、預(yù)處理(包括二值化、圖像去噪、傾斜矯正)、版面分析、字符切割、字符識(shí)別和版面恢復(fù)等功能,用于對(duì)掃描儀或相關(guān)軟件生成的PDF醫(yī)療檔案文件進(jìn)行處理,以便在Web系統(tǒng)中檢索[5-7]。字符識(shí)別的關(guān)鍵是OCR分辨率的設(shè)置,一般來說,文稿字體大,則OCR分辨率設(shè)置小些,如2、3號(hào)字的文章段,推薦使用200 dpi;反之則大些,如7、8號(hào)字的文章段,推薦使用600 dpi。掃描時(shí)適當(dāng)?shù)卣{(diào)整好亮度和對(duì)比度值,使掃描文件黑白分明;在醫(yī)療檔案管理系統(tǒng)中不得存儲(chǔ)可編輯數(shù)據(jù),如txt、doc及xls等格式文件。
(3)使用權(quán)限設(shè)置。為保證系統(tǒng)安全,本系統(tǒng)共分兩種用戶:一種為系統(tǒng)管理員,主要負(fù)責(zé)人員信息維護(hù)、角色維護(hù)、模塊管理;另一種為部門人員(部門人員分多種用戶),部門人員登錄系統(tǒng)后,可以修改登錄密碼、查詢其他人員的基礎(chǔ)信息,收發(fā)郵件等。系統(tǒng)可以根據(jù)不同權(quán)限的用戶顯示不同的功能模塊,系統(tǒng)管理員才具有創(chuàng)建醫(yī)療檔案、借閱醫(yī)療檔案等管理權(quán)利[8]。
2.1 數(shù)據(jù)庫的創(chuàng)建
系統(tǒng)使用SQL Server2000數(shù)據(jù)庫管理系統(tǒng),數(shù)據(jù)表在創(chuàng)建完成之后生成SQL腳本文件,在查詢分析器中直接運(yùn)行來創(chuàng)建表結(jié)構(gòu)、數(shù)據(jù)表的SQL腳本語句[9]。
2.1.1 目錄結(jié)構(gòu)
此系統(tǒng)實(shí)現(xiàn)的目錄結(jié)構(gòu)比較清晰,src目錄下存放項(xiàng)目中所用到的java源文件,test目錄下存放java測(cè)試類源文件,即本系統(tǒng)所采用的Junit測(cè)試文件,doc目錄下存放項(xiàng)目開發(fā)所用到的說明文檔[10-11]。
2.1.2 數(shù)據(jù)表的創(chuàng)建
(1)用戶信息表SM_USER。此表包括了所有登錄系統(tǒng)用戶的信息。
(2)模塊信息表SM_MODEL。此表中記錄了系統(tǒng)模塊信息,可以根據(jù)用戶的權(quán)限動(dòng)態(tài)顯示相應(yīng)的模塊,本表采用表字段自關(guān)聯(lián)實(shí)現(xiàn)菜單的顯示功能,即子菜單通過父ID查找實(shí)現(xiàn)菜單的關(guān)聯(lián)功能。
(3)部門信息表SM_DEPARTMENT。部門信息表用以記錄部門信息相關(guān)的內(nèi)容,從而實(shí)現(xiàn)對(duì)部門的檢索及分類,通過部門名稱就可以對(duì)部門相關(guān)信息進(jìn)行查詢。
2.2 界面設(shè)計(jì)及實(shí)現(xiàn)代碼
2.2.1 界面設(shè)計(jì)
在本地瀏覽器中輸入http://r-co,即可進(jìn)入PDF醫(yī)療檔案信息管理的登錄界面。在此界面單擊導(dǎo)航欄中的“系統(tǒng)模塊管理”鏈接,打開模塊管理查詢界面,就可以實(shí)現(xiàn)修改、添加等維護(hù)系統(tǒng)操作[12-13]。
2.2.2 代碼實(shí)現(xiàn)
由于每個(gè)模塊的代碼具有相似性,且代碼量較大,這里簡(jiǎn)要介紹人員維護(hù)頁面流程。
(1)Spring配置文件。action-servlet.xm l主要用來通過Spring配置Jsp頁面與action的映射信息。
(2)控制層action。該層為Java源代碼,主要負(fù)責(zé)收集從JSP傳來的數(shù)據(jù)并調(diào)用Spring業(yè)務(wù)代碼,本例中負(fù)責(zé)控制層的java源代碼為SmUserController.java。
(3)業(yè)務(wù)層service。Service層主要負(fù)責(zé)業(yè)務(wù)的處理并調(diào)用Dao層的數(shù)據(jù),并將從Dao層獲取的數(shù)據(jù)回傳給action層,service層分為service層接口的定義和接口的實(shí)現(xiàn)類。
(4)Dao層。Dao層主要用來與底層的數(shù)據(jù)庫交互,Dao層分為Dao層接口的定義和接口的實(shí)現(xiàn)。
(5)JSP顯示層smUsersFrame.jsp。smUserFrame.jsp頁面采用框架結(jié)構(gòu)設(shè)計(jì)。
基于OCR技術(shù)的PDF醫(yī)療檔案管理系統(tǒng)的研究和構(gòu)建,使得檔案管理系統(tǒng)可對(duì)全文進(jìn)行檢索,大大提高了醫(yī)療檔案管理效率和檢索率。另外,該系統(tǒng)可預(yù)留與辦公自動(dòng)化系統(tǒng)交換數(shù)據(jù)的接口,以實(shí)現(xiàn)與辦公自動(dòng)化系統(tǒng)的無縫連接。
[1]戴晟暉,常春英.Dreamweaver8實(shí)例與操作[M].北京:航空工業(yè)出版社,2010.
[2]李興華.JavaW eb開發(fā)實(shí)戰(zhàn)經(jīng)典基礎(chǔ)篇[M].北京:清華大學(xué)出版社,2010.
[3](美)Brian P.Hogan.HTM L5和CSS3實(shí)例教程[M].北京:人民郵電出版社,2012.
[4](美)N icholas C.Zakas.JavaScript高級(jí)程序設(shè)計(jì)[M].3版.北京:人民郵電出版社,2012.
[5]岳峰,李鵬,張玉祥.跟ORACLE工程師學(xué)JAVA軟件項(xiàng)目開發(fā)[M].北京:科學(xué)出版社,2010.
[6]Christian Bauer,Gavin King.Java Persistence w ith H ibernate[M].USA:Manning Publications Co.,2009.
[7](美)斯格科.Jakarta Struts Cookbook[M].北京:清華大學(xué)出版社,2007.
[8]李興華,王月清.Java W eb開發(fā)實(shí)戰(zhàn)經(jīng)典[M].北京:清華大學(xué)出版社,2010.
[9]陳亞輝,繆勇.Struts2+Spring+Hibernate框架技術(shù)與項(xiàng)目實(shí)戰(zhàn)[M].北京:清華大學(xué)出版社,2012.
[10]孫曉非,馮冠,張銀鶴,等.XM L基礎(chǔ)教程與實(shí)驗(yàn)指導(dǎo)[M].北京:清華電腦學(xué)堂,2008.
[11](美)Adobe公司.Adobe Acrobat X中文版經(jīng)典教程[M].北京:人民郵電出版社,2012.
[12]陳金雄,劉寶妹,鐘俊華.基于云計(jì)算的軍人電子健康檔案平臺(tái)架構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國醫(yī)療設(shè)備,2014,29(2):53-55.
[13]黃吳健,帥仁?。娮咏】禉n案的加密研究[J].計(jì)算機(jī)工程與設(shè)計(jì),12(10):3833-3837.
Study and Construction of an OCR-Based M edical Record Adm inistration System
XIANG Ming-hua1, XIANG Guo-hua2
1.The People’s Hospital of Taixing, Taixing Jiangsu 225400, China;2. China Telecom Beijing Branch, Taixing Jiangsu 225400, China
Based on the hospital information system, the medical record administration system was developed by using OCR technology. The system mainly consisted of the management module, OCR processing module, fi le management module and e-mail management module. This paper introduced the development process and the use of the system in detail.
hospital information system;medical record adm inistration system;optical character recognition;portable document format
TP311.52
A
10.3969/j.issn.1674-1633.2015.10.031
1674-1633(2015)10-0106-02
2015-04-01
2015-08-10
本文作者:向明華,高級(jí)工程師。
作者郵箱:225400@126.com