陳皇宇
?
云計算環(huán)境下的海量醫(yī)用信息檢索系統(tǒng)設計
陳皇宇
(南京軍區(qū)南京總醫(yī)院,南京210000)
針對傳統(tǒng)海量醫(yī)用信息檢索系統(tǒng)的檢索準確率低、檢索時間開銷較大,對大規(guī)模醫(yī)用信息的實時檢索性能不好等問題,提出一種云計算環(huán)境下的海量醫(yī)用信息檢索方法。構建醫(yī)用信息檢索系統(tǒng)的總體設計構架,設計基于模糊C均值聚類的醫(yī)用信息檢索數(shù)據(jù)庫訪問算法,構建醫(yī)用信息數(shù)據(jù)庫關聯(lián)指向性特征,通過程序加載模塊加載到系統(tǒng)的數(shù)據(jù)信息處理模塊。在嵌入式Linux環(huán)境下設計海量醫(yī)用信息檢索系統(tǒng)的軟件,采用交叉編譯方式進行程序加載和信息檢索控制,在云計算環(huán)境下實現(xiàn)信息編譯和數(shù)據(jù)存儲,完成海量醫(yī)用信息檢索系統(tǒng)的集成設計和系統(tǒng)調(diào)試。實驗結果表明,采用該檢索系統(tǒng)能大大提高海量醫(yī)用信息的檢索準確率,數(shù)據(jù)的召回率較高、信息檢索的時間開銷較小、實時檢索性能好。
云計算環(huán)境;海量數(shù)據(jù);醫(yī)用信息;檢索系統(tǒng)
隨著醫(yī)院信息管理系統(tǒng)化的快速發(fā)展,醫(yī)院的醫(yī)用信息管理更加智能化和集成化,醫(yī)用信息管理涉及到病歷管理、藥品管理、醫(yī)療設備管理、醫(yī)院的資源管理、醫(yī)生管理等。醫(yī)用信息管理的種類較多,系統(tǒng)復雜度較高,對醫(yī)院的醫(yī)用信息管理是一項系統(tǒng)化工程。在云計算高度發(fā)展的今天,采用云計算信息處理方法進行海量醫(yī)用信息管理,能提高醫(yī)用信息管理的效率和計算速度,云計算環(huán)境下海量醫(yī)用信息檢索的軟件開發(fā)設計是保障醫(yī)院穩(wěn)定和醫(yī)療機構穩(wěn)定運行的關鍵,對海量醫(yī)用信息檢索系統(tǒng)的設計在促進醫(yī)療機構信息化發(fā)展方面具有重要意義。
云計算環(huán)境下的海量醫(yī)用信息檢索以嵌入式操作系統(tǒng)為基礎,通過系統(tǒng)移植可以實現(xiàn)ARM,PowerPC等多種硬件平臺的兼容運行[1,2],對海量醫(yī)用信息檢索系統(tǒng)的開發(fā)設計主要分為硬件設計和軟件設計兩大部分。本文在前期的硬件設計的基礎上,在云計算環(huán)境下,重點對系統(tǒng)的軟件模塊進行開發(fā)設計。傳統(tǒng)方法中,對海量醫(yī)用信息檢索的設計方法主要采用堆棧協(xié)議控制方法[3]、GPRS通信結構的數(shù)據(jù)庫訪問和檢索方法[4]、基于決策樹模型的醫(yī)用信息檢索方法等[5],上述方法通過構建海量醫(yī)用信息的本地數(shù)據(jù)庫,采用Excel和Access 技術實現(xiàn)醫(yī)用信息數(shù)據(jù)的智能化信息管理,在促進醫(yī)用信息的集成智能訪問和信息管理調(diào)度方面發(fā)揮了一定的作用。另外,采用Android嵌入式系統(tǒng)進行海量醫(yī)用數(shù)據(jù)信息檢索設計[6],具有便攜性能佳和人機交互性強的優(yōu)點,但是上述方法存在的共同缺點是難以實現(xiàn)海量規(guī)模的醫(yī)用信息數(shù)據(jù)管理,需要在云計算環(huán)境下,對海量醫(yī)用信息進行大規(guī)模檢索和智能調(diào)度,提高醫(yī)療信息管理的集成智能控制能力。對此,本文提出一種云計算環(huán)境下的海量醫(yī)用信息檢索系統(tǒng)設計方法。首先進行醫(yī)用信息檢索系統(tǒng)的總體設計描述和功能模塊化分析,設計基于模糊C均值聚類的醫(yī)用信息檢索數(shù)據(jù)庫訪問算法,然后在嵌入式Linux環(huán)境下進行海量醫(yī)用信息檢索系統(tǒng)的軟件設計,系統(tǒng)設計包括用戶界面模塊、醫(yī)用信息處理模塊、可視化模塊和上位機網(wǎng)絡通信模塊等。采用交叉編譯方式進行程序加載和信息檢索控制,在云計算環(huán)境下實現(xiàn)信息編譯和數(shù)據(jù)存儲,最后完成海量醫(yī)用信息檢索系統(tǒng)的集成設計和系統(tǒng)調(diào)試,得出有效性結論。
1.1 系統(tǒng)的總體設計構架
傳統(tǒng)的醫(yī)用信息檢索系統(tǒng)大多數(shù)采用集中串行式檢索,造成信息檢索系統(tǒng)的覆蓋面有限,只能完成某一個領域的信息檢索。云計算作將單個的服務器連成了一個云,每個服務器都成為云中一個個節(jié)點。從而形成了一個檢索成本低、信息資源利用率高、檢索速度快的信息檢索系統(tǒng)。云計算采用一種名為云存儲的存儲方式,將網(wǎng)絡中各種存儲設備集合起來協(xié)同工作。云存儲不同于以前的存儲方式,其已由數(shù)據(jù)中心集管理。以前的數(shù)據(jù)通常存存置在數(shù)據(jù)信息提供者自己的服務器中,而云存儲提供商使用數(shù)據(jù)中心,向用戶提供數(shù)據(jù)存儲服務。
根據(jù)上述設計原理,構建醫(yī)用信息檢索系統(tǒng)的總體結構框圖如圖1所示。
圖1 云計算環(huán)境下海量醫(yī)用信息檢索系統(tǒng)總體設計結構框圖
首先分析海量醫(yī)用信息檢索總體設計構架并進行功能模塊組件分析和介紹。在云計算環(huán)境下,海量醫(yī)用信息檢索建立在通用計算機平臺上,為了滿足系統(tǒng)的兼容性,信息檢索系統(tǒng)安裝在Linux系統(tǒng)或者Windows系統(tǒng)上均可。在嵌入式Linux的內(nèi)核結構中進行信息檢索系統(tǒng)的軟件開發(fā)和設計,進行海量醫(yī)用數(shù)據(jù)信息檢索的進程管理和文件配置[7]。在人機交互模塊,采用微機控制方法進行數(shù)據(jù)調(diào)度和信息輸出,結合嵌入式操作平臺,在云計算環(huán)境下進行醫(yī)用信息的實時調(diào)度和存取。
在海量醫(yī)用信息檢索設計中,通過CAN發(fā)送信息檢索的數(shù)據(jù)庫訪問和資源檢索調(diào)度程序,檢索系統(tǒng)的Linux內(nèi)核由幾個重要的子系統(tǒng)組成,分別是醫(yī)用信息檢索的進程管理、寄存器的內(nèi)存管理、檢索任務的文件系統(tǒng)、醫(yī)療設備管理、網(wǎng)絡系統(tǒng)管理等。檢索的進程管理主要完成醫(yī)用信息檢索任務的創(chuàng)建、中止和系統(tǒng)通信的任務,實現(xiàn)多線程管理和任務調(diào)度[8-10]。在kernel內(nèi)核中通過創(chuàng)建Linux內(nèi)核源碼實現(xiàn)對檢索系統(tǒng)終端的人機交互,在檢索系統(tǒng)的操作界面,系統(tǒng)使用Qt/Embedded作為GUI進行人機交互界面設計。根據(jù)上述總體設計,進行系統(tǒng)軟件開發(fā)。
1.2 構建醫(yī)用信息數(shù)據(jù)庫關聯(lián)指向性特征
基于云計算的醫(yī)用信息檢索系統(tǒng)中,采用的是分布式并行計算方式,即同一時間利用多個處理器來執(zhí)行計算,提高了運算速度,能對大規(guī)模的海量數(shù)據(jù)進行運算處理。當用戶提出查詢要求,并將提問式提交給檢索代理,檢索代理將檢索提問式發(fā)送給了存在于云中的各個服務器,并對各個節(jié)點上的存儲服務器中的數(shù)據(jù)信息進行分析排序.得出相關度排在前列的服務器.并對這些存儲服務器進行并行分布式檢索,將檢索結果重新整合按相關度進行排序后傳到用戶檢索界面呈現(xiàn)在用戶面前.大大提高了檢索能力和檢索度。
為了實現(xiàn)對醫(yī)用信息檢索,核心是進行醫(yī)用信息的數(shù)據(jù)庫訪問調(diào)度,本文提出一種基于模糊C均值聚類的醫(yī)用信息檢索數(shù)據(jù)庫訪問算法。假設醫(yī)用信息數(shù)據(jù)庫的三層集成分布式存儲結構的數(shù)學模型,可表示為式(1)。
(2)
其中,單個檢索節(jié)點的約束參量輸入,為式(4):
(4)
(6)
(7)
(9)
通過模糊C均值聚類,對藥品信息、人員信息、財務信息和器械信息等進行準確檢索和召回的自相關函數(shù),為式(10)。
其中,N為采樣的數(shù)據(jù)樣本數(shù)。
通過模糊C均值聚類,對醫(yī)用信息在數(shù)據(jù)庫中分布特征進行關聯(lián)指向性特征提取,構建醫(yī)用信息數(shù)據(jù)庫關聯(lián)指向性特征,分別為式(11)、(12)。
(12)
2.1 嵌入式Linux環(huán)境下數(shù)據(jù)處理
在上述進行云計算環(huán)境下海量醫(yī)用信息檢索系統(tǒng)的總體結構設計和提取醫(yī)用信息數(shù)據(jù)庫關聯(lián)指向性特征基礎上,在嵌入式Linux環(huán)境下進行系統(tǒng)的VXI總線數(shù)據(jù)采集和模塊化設計,利用Busybox的安裝腳本進行海量醫(yī)用信息檢索系統(tǒng)的工程管理應用程序開發(fā),在程序開發(fā)之前,進行根文件系統(tǒng)配置,根文件系統(tǒng)配置過程描述,如圖2所示。
圖2 根文件系統(tǒng)配置過程
在嵌入式Linux環(huán)境下建立系統(tǒng)的開發(fā)環(huán)境,設計的子模塊主要包括用戶界面模塊、醫(yī)用信息處理模塊、可視化模塊和上位機網(wǎng)絡通信模塊等,調(diào)用VISA庫函數(shù)將海量醫(yī)用信息檢索SCPI命令寫入CPI驅(qū)動儀器,信息檢索系統(tǒng)的VXI總線數(shù)據(jù)采集模塊調(diào)用VISA庫函數(shù)vistatus=viWrite(instr, “MMEMory:TUNITx:OPEN”, 15, &retMMEMory:SESSion將命令寫入HP E1652E的通信寄存器單元,使用多個傳輸單元聯(lián)結一個或多個線程完成信息檢索,采用MVB總線控制技術使得數(shù)據(jù)的操作順序能實時地保存到命令子系統(tǒng)集中。在云計算環(huán)境下,構建實時數(shù)據(jù)記錄和流盤會話操作系統(tǒng),建立VXI總線數(shù)據(jù)處理模塊,得到Linux開發(fā)環(huán)境下的系統(tǒng)配置和編譯過程描述為:
Busybox Settings --->
transfer data from a local bus VME bus to a specified session ---> [*]Data from SCSI disk /usr//使用VME總線數(shù)據(jù)傳輸?shù)牟僮?/p>
VME address space (Busybox Target Data transmission port) --->//VME地址空間
(/home/Documents/nfs) start position address//從某個地址空間起始位置的偏移量
tar xvzf arm920t-eabi.tgz//輸入對=HP E1433A采集通道、觸發(fā)、數(shù)據(jù)傳輸端口的初始值。
假設TriggerSlope為正向觸發(fā),調(diào)用函數(shù)設置hpe1432_setTriggerLevel,
在流盤序列中,通過VME總線或局部總線傳輸海量醫(yī)用信息數(shù)據(jù),采用VXI總線數(shù)據(jù)處理技術進行海量醫(yī)用信息數(shù)據(jù)采集,通過上述構建的開發(fā)環(huán)境,設定SIC_IWR寄存執(zhí)行數(shù)據(jù)庫訪問和信息調(diào)度,采用Make menuconfig 進行海量醫(yī)用信息檢索內(nèi)核的配置,實現(xiàn)對信息檢索過程的進程管理。
2.2 軟件集成設計實現(xiàn)
海量醫(yī)用信息檢索系統(tǒng)的模塊化開發(fā)建立在云計算環(huán)境和嵌入式Linux環(huán)境下,利用132MB/s的PCI總線帶寬構建人機交互模塊和網(wǎng)絡通信模塊,初始化系統(tǒng)參考時鐘、觸發(fā)總線,在所需的信息檢索文件和可執(zhí)行文件中建立根目錄在PXI機箱內(nèi)執(zhí)行文件系統(tǒng)配置和數(shù)據(jù)庫訪問程序的編譯,編譯代碼為:
class Bus data acquisition : public vpApp
{
public : HP E1562E () {}; //構造醫(yī)用信息檢索的可執(zhí)行數(shù)據(jù)訪問函數(shù)
~myApp() {}; //系統(tǒng)配置
:initialize Documents (“Recognition using PXI” )// 采用PXI的系統(tǒng)10MHz時鐘
void Sampling frequency setting (Custom Internal time signal customization::Key key, int mod) //myApp類數(shù)據(jù)采集
private : //局部總線和觸發(fā)總線自定義變量
以Linux2.6.32內(nèi)核為平臺,通過網(wǎng)線、232串口構建人機交互模塊,在/lib目錄下提供人機交互的內(nèi)核,存儲器初始化模塊中采用多線程設計,生成一個rootfs.yaffs文件,設計海量醫(yī)用信息檢索系統(tǒng)的Linux設備驅(qū)動程序,在系統(tǒng)fliesystem的lib中建立海量醫(yī)用信息檢索系統(tǒng)的檢索中斷時鐘,中斷時鐘描述為:
#define File link_DYNAMIC 255 //中斷字設計
#define struct inode *inode "pwm"http://海量醫(yī)用信息檢索輸出文件名
int ret source install-qt ();
ret = s3c2440_adc_open() (&ADSP-BF537);// 添加一個CAN收發(fā)器
初始化靜態(tài)變量(static variables)和簡單的類(single classes),利用CAN總線聯(lián)網(wǎng)功能,在Windows 窗口下直接運行主程序,用匯編語言開發(fā)醫(yī)用信息處理模塊的控制程序,在上位機網(wǎng)絡通信模塊中,通過內(nèi)核初始化和外設初始化設計,設定SIC_IWR寄存器進行醫(yī)用信息檢索輸出寄存,設定系統(tǒng)時鐘和內(nèi)核時鐘的分頻數(shù),為使編譯出來的可執(zhí)行代碼能在ARM上運行,在海量醫(yī)用信息檢索系統(tǒng)的接口終端設定PLL_LOCKCNT寄存器,使用命令:
tarLinux PLL_LOCKCNTarm920t-eabi. SPORT0_TCLKDIV
配置串口0發(fā)送數(shù)據(jù)的時鐘頻率,運行命令:
#SPORT0_TFSDIV.Bashrc
編輯配置文件.Bashrc文件,串口發(fā)送時鐘后,產(chǎn)生幀同步脈沖,執(zhí)行命令編譯:
export SPORT0_TCR2:/opt/#make ITFS /armarch/ CAN_ID0(8)/boot/bin
保存退出后,重新登錄系統(tǒng),采用DMA0_IRQ_STATUS寄存器進行程序加載,構建海量醫(yī)用信息檢索系統(tǒng)的網(wǎng)絡通信模塊和接口模塊設計,采用交叉編譯方式進行程序加載和信息檢索控制,完成海量醫(yī)用信息檢索系統(tǒng)的集成設計。軟件實現(xiàn)過程,如圖3所示。
圖3 軟件實現(xiàn)流程
對本文設計的云計算環(huán)境下海量醫(yī)用信息檢索系統(tǒng)調(diào)試建立在Visual DSP++4.5環(huán)境下,VisualDSP++有一個集成開發(fā)環(huán)境IDDE,能有效實現(xiàn)對數(shù)據(jù)信息檢索系統(tǒng)的調(diào)試。實驗的硬件環(huán)境為:處理器Intel(R)Core(TM)2 Duo CPU 2.94GHz,內(nèi)存:8.00GB。醫(yī)用信息數(shù)據(jù)庫訪問中對數(shù)據(jù)采樣的歸一化初始頻率Hz,終止頻率Hz,在信息檢索系統(tǒng)中數(shù)據(jù)傳輸?shù)谋忍芈蕿?.59 Bps/s,根據(jù)上述仿真環(huán)境和參數(shù)設定,進行系統(tǒng)調(diào)試和仿真實驗分析。系統(tǒng)調(diào)試中,使用數(shù)據(jù)召回率和信息檢索的時間開銷作為測試指標,在A/D采樣數(shù)據(jù)緩沖區(qū)完成海量醫(yī)用信息檢索系統(tǒng)控制信號的采集,在人機交互模塊實現(xiàn)數(shù)據(jù)的存儲與管理和系統(tǒng)調(diào)試波形的顯示,為了對比算法性能,采用本文設計方法和傳統(tǒng)方法,得到海量醫(yī)用信息檢索的數(shù)據(jù)召回率和計算開銷對比結果,如圖4和圖5所示。
圖4 數(shù)據(jù)召回性能對比
圖5 時間開銷對比
分析上述仿真結果得出,采用本文設計的醫(yī)用信息檢索系統(tǒng),計算開銷較小,數(shù)據(jù)召回率較高,說明本文方法進行信息檢索在準確度和實時性方面具有優(yōu)越性。
本文進行了云計算環(huán)境下的海量醫(yī)用信息檢索系統(tǒng)設計,提出一種基于模糊C均值聚類的醫(yī)用信息檢索數(shù)據(jù)庫訪問算法,并進行系統(tǒng)軟件開發(fā)設計。首先進行醫(yī)用信息檢索系統(tǒng)的總體設計描述,在嵌入式Linux環(huán)境下進行的海量醫(yī)用信息檢索系統(tǒng)的軟件設計,實現(xiàn)系統(tǒng)的軟件集成設計和組件模塊開發(fā),系統(tǒng)調(diào)試和實驗結果表明,采用該檢索系統(tǒng)能提高對海量醫(yī)用信息的準確檢索能力,數(shù)據(jù)的召回率較高,在信息檢索在準確度和實時性方面優(yōu)于傳統(tǒng)方法,展示了較高的應用價值。
[1] 楊照峰,王啟明,呂海蓮.基于任務延遲的云計算資源調(diào)度算法研究[J].計算機測量與控制,2014,22(2):499-502.
[2] 匡桂娟,曾國蓀.一種基于時分復用的云資源管理方法[J].同濟大學學報(自然科學版),2014,42(5):782-789.
[3] 林冬茂,薛德黔.一種基于無監(jiān)督免疫優(yōu)化分層的網(wǎng)絡入侵檢測算法[J].計算機科學,2013,40(3): 180-182.
[4] 周小娟.一種輕量級大數(shù)據(jù)分析系統(tǒng)的實現(xiàn)[J].電子設計工程,2016,24(8):40-43.
[5] 陸興華,吳恩燊 .基于安卓客戶端的智能家居電力控制優(yōu)化設計[J].電力與能源,2015,35(5): 692-695.
[6] Mahboubi H, Moezzi K, Aghdam A G, et al. Distributed Deployment Algorithms for Improved Coverage in a Network of Wireless Mobile Sensors[J]. IEEE Transactions on Industrial Informatics, 2014, 10(1): 163-174.
[7] 謝洪安, 李棟, 蘇旸, 等. 基于聚類分析的可信網(wǎng)絡管理模型[J]. 計算機應用, 2016, 36(9): 2447-2451.
[8] GUBBI J, BUYYA R, MARUSIC S, et al. Internet of Things (IoT): a vision, architectural elements, and future directions [J]. Future Generation Computer Systems, 2013, 29(7): 1645-1660.
[9] 賀小云, 陳立新, 裴昌幸,等. 一種實用的多數(shù)據(jù)庫量子信息檢索協(xié)議[J]. 電子科技, 2015, 28(4):1-3.
[10] 王莉軍. 海量數(shù)據(jù)下的文本信息檢索算法仿真分析[J]. 計算機仿真, 2016, 33(4):55-60.
Design of Retrieval System for Massive Medical Information under the Cloud Environment
Chen Huangyu
(Nanjing General Hospital of Nanjing Military Region, PLA Nanjing, Nanjing 210002, China)
The traditional medical information retrieval systems exist many problems such as the accuracy is very low, the retrieving time cost is high. A new retrieval system for massive medical information is presented under cloud environment to solve these problems. The overall design framework is given. The design is based on fuzzy algorithm of C mean clustering, and the data processing module is loaded through program loading module. It uses the cross compiler to control program loading and information detection. The data compiling and storage are completed under the cloud environment. At last the system is integrated and adjusted. The experiment results show that the system improves greatly the retrieving accuracy under massive medical information environment with a low time cost and good detecting performance.
Cloud computing environment; Massive data; Medical information; Retrieval system
1007-757X(2016)12-0037-04
TP391
A
陳皇宇(1984-),女,漢族,海安,本科,技師,研究方向:病案管理,醫(yī)療信息管理,南京 210000
(2016.09.19)