羅亞蘭
(成都市第三人民醫(yī)院檢驗(yàn)科,成都 610014)
全自動血凝分析儀具備檢測速度快、測量項(xiàng)目多的特點(diǎn),能夠?qū)崿F(xiàn)復(fù)雜樣本的智能化檢測,可快速得出檢驗(yàn)樣本的檢驗(yàn)結(jié)果及報告[1]??赏ㄟ^Sysmex CS5100 血凝分析儀檢驗(yàn)?zāi)蜃?,從而了解病患不同發(fā)病因素,及時診斷并治療疾病。由于該儀器使用頻率高,容易出現(xiàn)故障。為保證該儀器能夠正常穩(wěn)定運(yùn)行,亟須提升儀器管理水平[2-3]。眾多學(xué)者為此展開相關(guān)研究,劉香君等[4]提出基于長短時記憶網(wǎng)絡(luò)的醫(yī)療器械故障診斷管理,通過對設(shè)備特征編碼及預(yù)處理建立醫(yī)療器械異常診斷模型,經(jīng)數(shù)據(jù)融合實(shí)現(xiàn)醫(yī)療器械異常診斷。該方法能夠有效提高故障診斷準(zhǔn)確率,可行性高,但計算過程復(fù)雜,操作難度大。錢文靜等[5]通過調(diào)查方式實(shí)現(xiàn)醫(yī)療器械管理,但該方法過于簡單,針對設(shè)備管理只通過調(diào)查方式實(shí)現(xiàn),結(jié)果單一且不明確。
為了快速診斷Sysmex CS5100 全自動血凝分析儀故障,本研究提出一種基于貝葉斯估計的Sysmex CS5100 全自動血凝分析儀故障診斷方法。
Sysmex CS5100 全自動血凝分析儀故障診斷架構(gòu)由采集層、處理層、應(yīng)用層和顯示層構(gòu)成(如圖1所示),該架構(gòu)可將各層中的信息進(jìn)行共享和集中控制。
采集層主要通過傳感器來采集Sysmex CS5100全自動血凝分析儀數(shù)據(jù)。采用的傳感器包括紅外遮光式計數(shù)器、電阻溫度傳感器。其中,紅外遮光式計數(shù)器的工作原理是從紅外發(fā)光管發(fā)射出的紅外光線直射在光電元件(如光電管、光敏電阻等)上,每當(dāng)紅外光線被遮擋時,光電元件的工作狀態(tài)就會發(fā)生改變,通過放大器可使計數(shù)器記下被遮擋的次數(shù)。電阻溫度傳感器根據(jù)溫度變化與電阻值變化之間的相關(guān)性確定溫度測量結(jié)果。由此,可獲取.txt 和.jpg 等格式的數(shù)據(jù)。需要采集的數(shù)據(jù)包括毛細(xì)血管脆性試驗(yàn)、出血時間、血小板計數(shù)、血塊收縮試驗(yàn)、凝血時間、血漿凝血酶原時間和活化部分凝血活酶時間等多種。首先,將采集的血凝分析儀數(shù)據(jù)經(jīng)CAN 總線測試口傳輸?shù)教幚韺?;其次,采用貝葉斯估計算法將采集到的信號進(jìn)行融合,并采用幅值譜來實(shí)現(xiàn)數(shù)據(jù)信號的幅值特征提取,由此完成數(shù)據(jù)融合和特征提取操作;最后,通過應(yīng)用層實(shí)現(xiàn)該血凝分析儀的實(shí)時檢測和故障診斷。在應(yīng)用層中,故障診斷模塊通過引入k近鄰(k-nearest neighbors,KNN)算法完成血凝分析儀的故障診斷,并通過故障預(yù)警模塊發(fā)出預(yù)警信息,最后經(jīng)主界面顯示故障診斷結(jié)果[6]。
該血凝分析儀的輸出信號數(shù)據(jù)通過多個傳感器采集,處理層的數(shù)據(jù)融合模塊通過貝葉斯估計算法實(shí)現(xiàn)多個傳感器采集數(shù)據(jù)的融合[7]。假設(shè)有n個傳感器測量血凝分析儀,則多傳感器測量數(shù)據(jù)的融合最佳參數(shù)個數(shù)為l(l≤n),傳感器測量數(shù)據(jù)集合為X={x1,x2,…,xn}。接著利用貝葉斯估計算法完成數(shù)據(jù)的融合處理,則有
式中,P(μ|X)為傳感器數(shù)據(jù)的概率密度函數(shù);P(n|X)為似然度;P(n)表示先驗(yàn)概率;P(X)表示測量數(shù)據(jù)X 的邊緣概率;μ 表示傳感器數(shù)據(jù)均值。
設(shè)μ 遵循高斯分布,也就是正態(tài)分布,則μ~N(μ0,σ02),其中μ0和σ0為測量數(shù)據(jù)初始均值和初始方差,N表示正態(tài)分布。因此,假設(shè)第i個傳感器的輸出結(jié)果用xi表示,xi∈X,xi遵循高斯分布,而xi~N(μ,σi2),則有
式中,Pi(μ|X)表示第i個傳感器的輸出結(jié)果xi的概率密度函數(shù);μN(yùn)與σi分別表示測量數(shù)據(jù)均值和第i個傳感器的輸出結(jié)果方差。由于xi∈X,P(μ|X)呈正態(tài)分布,則Pi(μ|X)遵循N(μN(yùn),σN2)分布,因此可將公式(2)改進(jìn)為
接著,對公式(1)與(3)進(jìn)行加權(quán)平均處理,在高斯分布的情況下可獲得測量數(shù)據(jù)均值μN(yùn),則有
式中,xn、σn分別表示第n個傳感器的輸出數(shù)據(jù)及其方差。
因此,基于上述內(nèi)容,可利用貝葉斯估計算法得到關(guān)于μ 的貝葉斯估計數(shù)據(jù)融合結(jié)果,其表示為
數(shù)據(jù)處理層通過幅值譜提取全自動血凝分析儀多傳感器信號數(shù)據(jù)融合后的信號特征。由于血凝分析儀的切光片輸出波動忽高忽低會產(chǎn)生計算誤差,因此無需測量切光片的輸出信號,只需提取血凝分析儀傳感器的輸出信號即可。而非全周期采集信號融合會產(chǎn)生分析誤差,因此為了有效解決這一問題,對頻譜進(jìn)行改正以實(shí)現(xiàn)對該非全周期采集信號特征的有效提取[8]。具體改正步驟如圖2 所示。
圖2 頻譜改正流程
分析圖2 可知,首先將非全周期采集的全自動血凝分析儀信號進(jìn)行融合后,輸入到矩形窗對其進(jìn)行截短處理。然后采用快速傅里葉變換(fast fourier transform,F(xiàn)FT)算法運(yùn)算截短的數(shù)據(jù)并得出其幅值譜。最后,為提高非全周期采集信號的幅值求解結(jié)果的準(zhǔn)確性,對頻譜分辨力進(jìn)行優(yōu)化,最終輸出得到精準(zhǔn)的幅值結(jié)果。具體實(shí)現(xiàn)過程如下:
首先,通過改進(jìn)頻譜方法處理非全周期采集融合后的信號,降低其分析誤差。其中頻譜方法中的矩形譜內(nèi)模函數(shù)表達(dá)式為
式中,W(m)表示矩形譜內(nèi)模函數(shù),其中m表示非全周期采集融合后數(shù)據(jù);M為實(shí)數(shù)。若M遠(yuǎn)大于1,則sin(πm/M)≈mπ/M,那么公式(7)可以轉(zhuǎn)化為
其次,通過公式(8)完成對融合后信號的截短處理。接下來基于FFT 算法對處理后數(shù)據(jù)進(jìn)行運(yùn)算,獲取的幅值譜表達(dá)式為
式中,C(θ)為幅值譜;X(θ)為截短處理后的第θ 個全自動血凝分析儀信號;f表示頻譜分辨力。
最后,為提高非全周期采集信號的幅值求解結(jié)果的準(zhǔn)確性,對頻譜分辨力進(jìn)行優(yōu)化。
設(shè)信號主瓣內(nèi)2 條幅值譜線存在2 種情況,其中一條幅值譜線是v,另一條幅值譜線是v+1,則信號主瓣中心坐標(biāo)表達(dá)式為
假設(shè)幅值譜主峰峰值用B表示,則可得到頻譜位置,其表達(dá)式為
由此,進(jìn)行頻譜分辨力的優(yōu)化,則優(yōu)化后頻譜分辨力表達(dá)式為
式中,fτ表示τ 譜線的采樣頻率。
將公式(12)代入公式(9)中,實(shí)現(xiàn)對幅值的獲取。同理,若另一條幅值譜線為v-1 時,則信號主瓣中心坐標(biāo)同公式(10)。優(yōu)化后頻譜分辨力為f=(v-Δv)fτM-1,然后代入公式(9)得出幅值結(jié)果。
接下來,為實(shí)現(xiàn)有效的全自動血凝分析儀故障診斷,將獲取的幅值作為血凝分析儀特征參數(shù),以為故障診斷提供重要依據(jù)[9]。
1.4.1 故障數(shù)據(jù)依附率
依據(jù)提取到的Sysmex CS5100 全自動血凝分析儀信號幅值特征,計算血凝分析儀故障數(shù)據(jù)間的依附率,之后結(jié)合KNN 算法完成血凝分析儀故障檢測。
數(shù)據(jù)依附是一個關(guān)系內(nèi)部屬性與屬性之間的一種約束關(guān)系,這種約束關(guān)系是通過判斷屬性間值是否相同來確定數(shù)據(jù)間的聯(lián)系。而故障數(shù)據(jù)依附率可以看作故障數(shù)據(jù)之間存在關(guān)聯(lián)性的概率,可以通過分析數(shù)據(jù)關(guān)聯(lián)性判斷是否發(fā)生了故障,保證故障診斷的精度與效率。通常,可采用模糊決策法求解故障數(shù)據(jù)依附率。在模糊決策法中,故障數(shù)據(jù)簇中心是一個重要的計算條件,而為了確定故障數(shù)據(jù)簇的初始狀態(tài),可以使用提取的幅值特征參數(shù)作為初始的簇中心,以更準(zhǔn)確地計算故障數(shù)據(jù)依附率,實(shí)現(xiàn)可靠的故障診斷[10]。
設(shè)多傳感器采集的血凝分析儀數(shù)據(jù)信號數(shù)據(jù)集X 內(nèi)有Z個血凝分析儀故障數(shù)據(jù),則其集合Y={y1,y2,…,yZ}。針對Y 內(nèi)故障數(shù)據(jù)樣本,假設(shè)初始簇中心數(shù)量為w,將提取的幅值特征參數(shù)作為初始的簇中心。對于剩余的故障數(shù)據(jù)點(diǎn),計算其與每個簇中心之間的距離,將故障數(shù)據(jù)點(diǎn)分配給距離最近的簇中心所屬的簇,其距離計算公式表示如下:
式中,(xyi,yyi)、(xTa,yTa)分別表示某一故障數(shù)據(jù)點(diǎn)yi和簇中心Ta的坐標(biāo)。
對于每個簇,計算該簇中所有數(shù)據(jù)點(diǎn)的平均值,將這些計算得到的新的簇中心作為更新后的簇中心,其計算公式表示如下:
式中,r1,r2,…,rn表示該簇中每個數(shù)據(jù)點(diǎn)的取值;n表示簇中數(shù)據(jù)點(diǎn)的總數(shù)。
然后根據(jù)更新后的簇中心重新計算每個數(shù)據(jù)點(diǎn)與各個簇中心的距離,并重新分配數(shù)據(jù)點(diǎn)到距離最近的簇[11]。由此循環(huán),直至簇中心的變化非常小停止迭代,從而確定得到故障數(shù)據(jù)簇中心。
接著從信號數(shù)據(jù)集中隨機(jī)獲取某個練習(xí)樣本yh∈X,則yh與yi是同類數(shù)據(jù)概率,即故障數(shù)據(jù)依附率為
式中,η 表示血凝分析儀平衡因子;S表示故障數(shù)據(jù)樣本;S(xg,yg)η表示同類數(shù)據(jù)之和;S(xq,yg)表示不屬于同類數(shù)據(jù)之和;k表示練習(xí)樣本數(shù)量φi表示血凝分析儀故障點(diǎn)yi的協(xié)方差矩陣;O表示血凝分析儀信號幅值特征向量矩陣。由此,獲得數(shù)據(jù)集中故障數(shù)據(jù)依附率,以為后續(xù)診斷提供可靠的數(shù)據(jù)支撐。
1.4.2 基于KNN 算法的血凝分析儀故障診斷實(shí)現(xiàn)
根據(jù)運(yùn)算的故障數(shù)據(jù)依附率,引入KNN 算法完成血凝分析儀故障診斷。正常數(shù)據(jù)樣本和練習(xí)數(shù)據(jù)樣本的分布相同,故障數(shù)據(jù)樣本和練習(xí)數(shù)據(jù)樣本分布不同[12],也就是說正常數(shù)據(jù)樣本對應(yīng)的距離平方之和小于故障樣本和練習(xí)樣本集合內(nèi)KNN 的距離平方和[13]。
將由血凝分析儀數(shù)據(jù)信號融合結(jié)果組成的故障數(shù)據(jù)集作為練習(xí)集,依據(jù)數(shù)理統(tǒng)計內(nèi)的優(yōu)越性標(biāo)準(zhǔn)和血凝分析儀故障數(shù)據(jù)依附率R(yh,yi)設(shè)置控制限(control line,CL)。若CL 大于無分類數(shù)據(jù)和練習(xí)集內(nèi)KNN 的距離平方和,則說明血凝分析儀處于正常狀態(tài);反之,血凝分析儀為故障狀態(tài)。其中,設(shè)置CL與故障診斷的具體實(shí)現(xiàn)過程如下。
首先,實(shí)現(xiàn)對CL 的設(shè)置,步驟如下:
第一步,找到練習(xí)集內(nèi)各個樣本xi,xi∈R1×n,并找出與其相關(guān)的k個最相鄰距離2,…,∞),練習(xí)集樣本容積和變量數(shù)目分別為∞、N。
第三步,求解CL,從而檢測血凝分析儀故障。由于D2i分散情況近似于χ2分布[14],因此數(shù)理統(tǒng)計內(nèi)的優(yōu)越性標(biāo)準(zhǔn)a和血凝分析儀故障數(shù)據(jù)依附率決定CL 的控制性,即
其次,假設(shè)未被分類新樣本是x*,基于上述內(nèi)容展開故障診斷,其具體的實(shí)現(xiàn)過程描述如下:
第一步,找出與其相關(guān)的k個最相鄰距離
第二步,運(yùn)算練習(xí)集內(nèi)各樣本k個相鄰間距平方和[15]。
第三步,比較和CL,若CL≥,則該樣本為正常狀態(tài);反之,該樣本為故障狀態(tài)[16]。
最后,經(jīng)故障預(yù)警模塊發(fā)出預(yù)警信息后,在顯示層主界面可視化呈現(xiàn)Sysmex CS5100 全自動血凝分析儀故障診斷結(jié)果。
為了驗(yàn)證基于貝葉斯估計的Sysmex CS5100 全自動血凝分析儀故障診斷方法的有效性,將某醫(yī)院Sysmex CS5100 全自動血凝分析儀作為實(shí)驗(yàn)對象進(jìn)行相關(guān)實(shí)驗(yàn)。利用多個傳感器進(jìn)行血凝分析儀數(shù)據(jù)采集,結(jié)果見表1。
表1 血凝分析儀采集數(shù)據(jù)
采用本文方法對血凝分析儀7 個傳感器進(jìn)行數(shù)據(jù)融合處理,若1 個傳感器數(shù)據(jù)能夠被除該傳感器之外的6 個傳感器讀出,則說明此傳感器輸出數(shù)據(jù)有效,可以進(jìn)行融合。不同數(shù)據(jù)格式的數(shù)據(jù)融合結(jié)果是不一致的,例如.txt 和.txt 格式數(shù)據(jù)融合處理之后產(chǎn)生的數(shù)據(jù)也為.txt 格式,.jpg 和.txt 格式數(shù)據(jù)不能融合,因此在數(shù)據(jù)融合時需要對數(shù)據(jù)進(jìn)行分類,以此保證數(shù)據(jù)融合結(jié)果的精度。隨機(jī)選取該醫(yī)院7 個傳感器采集的數(shù)據(jù)進(jìn)行分析,設(shè)被測儀器運(yùn)動速度遵循高斯分布,其結(jié)果見表2。
表2 多傳感器融合數(shù)據(jù)
由表2 可知,1、2、4 和5 號傳感器輸出值分別為361.77、367.19、365.82、352.58 dB,其最小方差為9.71%,最大方差為36.54%,且讀出上述數(shù)據(jù)的傳感器個數(shù)均低于6 個,說明1、2、4、5 號傳感器輸出數(shù)據(jù)結(jié)果不是最佳且有效的;3、6、7 號傳感器輸出值分別為357.38、350.56、359.43,最大方差為1.01%,最小方差為0.76%,且讀出上述數(shù)據(jù)的傳感器個數(shù)均為6 個,說明這3 個傳感器輸出數(shù)據(jù)屬于有效數(shù)據(jù),可將這3 個傳感器進(jìn)行融合。
隨機(jī)選取表1 中傳感器6 采集的血凝分析儀數(shù)據(jù),模擬該血凝分析儀運(yùn)行20~40 ms 和50~60 ms時壓力泵產(chǎn)生的故障情況,利用本文方法提取該時間段內(nèi)血凝分析儀故障狀態(tài)特征幅值,結(jié)果如圖3 所示。
圖3 血凝分析儀特征分布圖
由圖3 可知,在0~20 ms 時間段內(nèi),壓力泵特征幅值曲線保持平穩(wěn),呈規(guī)律性波動,說明此時血凝分析儀狀態(tài)正常;在20~40 ms 時間段內(nèi),壓力泵特征幅值曲線波動劇烈,說明此時段血凝分析儀處于故障狀態(tài),40 ms 及之后的曲線波動恢復(fù)平穩(wěn)。在50~60 ms時間段內(nèi),壓力泵特征幅值曲線又處于劇烈波動狀態(tài),說明血凝分析儀處于故障狀態(tài),60 ms 后又恢復(fù)正常。
綜上,故障特征幅值提取結(jié)果與實(shí)際模擬情況一致,說明本文方法提取到的血凝分析儀故障信號特征準(zhǔn)確,并且本文方法檢測到該血凝分析儀發(fā)生了2 次故障,利用該故障特征可準(zhǔn)確獲取儀器故障情況,為后續(xù)的故障診斷奠定堅實(shí)的基礎(chǔ)。
隨機(jī)選取1 臺血凝分析儀,利用本文方法對該血凝分析儀進(jìn)行故障診斷處理,故障診斷結(jié)果如圖4 所示。
圖4 血凝分析儀故障診斷界面
由圖4 可知,本文方法檢測到該血凝分析儀比色杯、傳感器、標(biāo)本以及廢液瓶處于正常運(yùn)行狀態(tài),預(yù)警燈呈綠色,此時無需進(jìn)行任何操作;另外,還檢測到血凝分析儀探針、電纜和壓力泵運(yùn)動狀態(tài)顯示異常,預(yù)警界面顯示探針碰撞、電纜接頭斷開和壓力泵錯誤,預(yù)警燈亮紅燈,說明該位置出現(xiàn)故障,需要后臺人員找到故障原因,恢復(fù)其正常操作。由此表明本文方法可判斷儀器故障狀態(tài)并進(jìn)行預(yù)警處理,能夠輔助后臺人員快速處理故障,保證血凝分析儀的正常運(yùn)行。
綜上所述,本文所提方法可通過多傳感器采集血凝分析儀數(shù)據(jù)并進(jìn)行數(shù)據(jù)融合處理,提取到的幅值特征可精準(zhǔn)判斷血凝分析儀的故障狀態(tài),可有效診斷血凝分析儀故障并及時發(fā)出預(yù)警信息,計算過程簡單、操作難度低,且血凝分析儀故障診斷結(jié)果非常明確,有效地解決了文獻(xiàn)[4]方法和文獻(xiàn)[5]方法存在的問題,實(shí)際應(yīng)用效果較好。
為提高Sysmex CS5100 全自動血凝分析儀故障診斷的可靠性,本文提出基于貝葉斯估計的血凝分析儀故障快速診斷方法。首先通過多個傳感器進(jìn)行數(shù)據(jù)采集,并經(jīng)貝葉斯估計算法進(jìn)行數(shù)據(jù)融合處理。然后提取融合后數(shù)據(jù)的幅值作為血凝分析儀特征參數(shù)。最后,通過幅值特征參數(shù)計算故障數(shù)據(jù)之間的依附率,并根據(jù)故障數(shù)據(jù)依附率采用KNN 算法實(shí)現(xiàn)血凝分析儀故障診斷。實(shí)驗(yàn)結(jié)果表明,本文方法滿足血凝分析儀故障診斷要求,可有效診斷故障,幫助后臺工作人員及時發(fā)現(xiàn)儀器故障,具有較高的實(shí)用性。但是該方法在實(shí)驗(yàn)驗(yàn)證中并未設(shè)置對比實(shí)驗(yàn),無法全方面驗(yàn)證該方法的綜合性能,因此下一步需要利用更多的數(shù)據(jù)進(jìn)行相關(guān)對比實(shí)驗(yàn),以進(jìn)一步驗(yàn)證該方法的應(yīng)用效果,促進(jìn)該方法在血凝分析儀故障診斷領(lǐng)域的進(jìn)一步應(yīng)用。