王利平 劉任任
(湘潭大學(xué)信息工程學(xué)院 湘潭 411105)
在醫(yī)學(xué)檢驗中,人體外周血的檢查對人體健康指標(biāo)有著重要參考價值[1]。因此血細胞的識別與分類有著廣泛的研究[2~8]。而紅細胞是人體血液中占比最重的一類細胞,通過對紅細胞進行自動化識別[8],統(tǒng)計分析各形狀特征所占比重,進而得出人體健康狀況。正常紅細胞的形態(tài)與異常紅細胞的在形態(tài)上有差別,正常紅細胞形態(tài)呈雙凹圓盤形,淡桔紅色,中央1/3為生理性淡染區(qū),呈正常色素性。其直徑為6.7μm~7.7μm,平均直徑7.2μm左右,厚約2μm,無核。同時把異常形態(tài)紅細胞分為8類,圖1所示。
紅細胞圖像的采集,通過顯微鏡和CCD相機,顯微鏡將血涂片圖像放大,CCD相機將光學(xué)信息轉(zhuǎn)化為數(shù)字信號,通過傳輸裝置傳輸?shù)接嬎銠C[9~10]。由計算機的識別程序?qū)t細胞圖像進行識別。紅細胞的識別流程如圖2所示。
圖1 紅細胞異常形態(tài)圖
圖2 紅細胞識別流程圖
本文主要探討基于BP神經(jīng)網(wǎng)絡(luò)的紅細胞形狀識別。
在通過CCD拍攝血涂片時,可能存在光照原因,使圖像對比度及邊緣特征不明顯,染色劑的使用,可能使圖像中包含較多噪聲。這些因素的存在都會對紅細胞圖像的特征求取造成不良影響。因此,在進行特征求取時,進行預(yù)處理是非常有必要的。
本文的紅細胞預(yù)處理主要包括以下兩個方面:
1)通過中值濾波處理,去除圖像的噪聲;
2)使用拉普拉斯算子對邊緣銳化,增強邊緣與背景的對比度。
關(guān)于這兩種方法,已經(jīng)有了廣泛的理論和應(yīng)用基礎(chǔ),本文就不再做介紹了。其中對原圖(圖3)進行預(yù)處理的主要步驟為:
(1)將彩色圖像轉(zhuǎn)換為8位灰度圖(圖4)。
(2)使用中值濾波器去除圖像噪聲(圖5)。
(3)增強紅細胞邊緣(圖6)。
圖3 紅細胞原始圖
圖4 紅細胞灰度圖
圖5 中值濾波圖像
圖6 拉普拉斯算子銳化
上面是在Matlab下進行預(yù)處理操作的結(jié)果圖,可以明顯地看到,通過預(yù)處理步驟,紅細胞圖像的噪聲明顯減少,圖像邊緣得到銳化,對比度非常明顯。
對圖像進行預(yù)處理之后,我們將求取圖像的幾何特征值。紅細胞特征向量中包含以下幾個幾何特征值,分別為圓形度、矩形度、長寬比、Hu七個不變矩等幾個特征值。在特征求取過程,采用了鏈碼技術(shù)(圖7)對紅細胞的邊緣進行跟蹤[15]。其跟蹤過程為,通過對圖像進行行掃描,以得到的第一個邊界像素的坐標(biāo)為起點來跟蹤邊界,在跟蹤過程,兩個相鄰的像素之間的連線給定一個方向碼,最后再按照逆時針方向沿著邊界將這些方向碼連接起來,就可以得到鏈碼。而鏈碼的起始位置和鏈碼就完整的包含了圖像的形狀(圖8)。同時鏈碼技術(shù)的應(yīng)用,也方便進行紅細胞特征求取,下面將主要介紹紅細胞圓形度、矩形度、長寬比的計算公式。
圖7 8方向鏈碼
圖8 鏈碼所圍形狀圖
紅細胞周長與面積的計算,在鏈碼求紅細胞形狀的過程中,設(shè)鏈碼值為偶數(shù)的像素個數(shù)為M,鏈碼值為奇數(shù)的像素個數(shù)為N,則此紅細胞的周長P為
其周長所圍的紅細胞面積A應(yīng)該為
在公式中,S為紅細胞的所有像素個數(shù)之和。
圓形度有利于辨識紅細胞形狀復(fù)雜度。面積一定的圖形,如果它的周長越小,則圖形越接近圓;反之,圖形的形狀就越復(fù)雜。其公式如下所示。
在公式中,P表示的是紅細胞圖像的周長,A表示周長所圍的面積,PI表示的是圓周率。
而另外一個反映物體形狀的參數(shù)是它的矩形度。當(dāng)圖像給定后,就可以求出紅細胞的最小外接矩形(MER),而反映紅細胞矩形度則可以用矩形擬合因子R表示,其公式如下所示。
在公式中,A表示的是紅細胞的面積,Ar表示對應(yīng)紅細胞的最小外接矩形的面積。
其中R反映了其與矩形的相似程度,如果被檢測物體為矩形,那么R的值為1。而對于其它物體其值為區(qū)間[0,1]。而矩形度的另外一個參數(shù)為長寬比K,其公式為
在公式中,W表示紅細胞最小外接矩形的寬,L表示最小外接矩形的長。使用這個特征,主要是將紅細胞形狀與圓形做相似度比較。這個特征可以把較纖細的物體與方形的或圓形的物體區(qū)分開來。
Hu不變矩在特征形狀識別方面有著廣泛的應(yīng)用,它具有平移、旋轉(zhuǎn)和尺度不變性。這里不再列出其計算公式。
將所求取的這些形態(tài)特征,描述為成紅細胞的形態(tài)特征向量,做為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和輸入值。
BP神經(jīng)網(wǎng)絡(luò)是采用誤差反傳播算法的多層前饋人工神經(jīng)網(wǎng)絡(luò)。它通過訓(xùn)練和學(xué)習(xí)來確定網(wǎng)絡(luò)的權(quán)值,很強的對環(huán)境的自適應(yīng)學(xué)習(xí)能力,并且還具有較強的容錯性。這使得BP神經(jīng)網(wǎng)絡(luò)應(yīng)用極其廣泛[11~14],其結(jié)構(gòu)如圖9所示。
圖9 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
具有單隱層的三層神經(jīng)網(wǎng)絡(luò)足夠執(zhí)行比較復(fù)雜的函數(shù)映射,多個隱層的網(wǎng)絡(luò)盡管更易學(xué)習(xí),但更易于陷入局部極小值中,這是在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計中要避免的。因些BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的好壞直接關(guān)系到識別效率。
1)隱含層的確定
根據(jù)形態(tài)特征對紅細胞進行識別分類,在識別上來說,是小類別的分類問題,因些,采用具有一個隱含層的三層神經(jīng)網(wǎng)絡(luò),足以解決識別問題。
2)神經(jīng)元數(shù)目
在確定神經(jīng)元數(shù)目時,選擇計算的公式為
其中,hNum表示隱層神經(jīng)元個數(shù),iNum表示輸入神經(jīng)元個數(shù),nNum表示輸出層神經(jīng)元個數(shù)。
3)激活函數(shù)的選擇
神經(jīng)元的激活函數(shù)選擇Sigmoid函數(shù),如下所示。
Sigmoid函數(shù)是光滑、可微的函數(shù),在分類時它比線性函數(shù)更精確,容錯性也更好。
4)動量-自適應(yīng)學(xué)習(xí)法調(diào)整BP算法
在實際應(yīng)用中,使用標(biāo)準(zhǔn)BP算法往往不能達到我們所期望的要求。在結(jié)合本文對學(xué)習(xí)速度與準(zhǔn)確度有比較高的要求后,采用動量-自適應(yīng)法對BP算法進行調(diào)整[16]。動量項提高BP神經(jīng)網(wǎng)絡(luò)收斂速度,合適的自適應(yīng)學(xué)習(xí)率可以極大地提高學(xué)習(xí)速率。動量-自適應(yīng)學(xué)習(xí)率的BP算法權(quán)值調(diào)整算法公式:
公式中:w(k)為第k步時權(quán)值,α為學(xué)習(xí)率,η為動量因子,D(k)為第k步時的負梯度值。
在采用動量-自適應(yīng)學(xué)習(xí)率調(diào)整算法后,收斂速度和學(xué)習(xí)率比標(biāo)準(zhǔn)BP算法,提高了一半以上。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法采用trainlm優(yōu)化算法,trainlm算法的收斂速度比較快,而且訓(xùn)練的誤差也很少。結(jié)果如表1所示。
表1 各trainlm優(yōu)化算法訓(xùn)練結(jié)果表
下面將進行紅細胞的識別工作,將800組測試數(shù)據(jù)(沒有參加訓(xùn)練)用于對BP神經(jīng)網(wǎng)絡(luò)識別的檢驗,其中八種形態(tài)的紅細胞類型各有100組。描述紅細胞形態(tài)的特征值,做為BP神經(jīng)網(wǎng)絡(luò)的輸入。在對800個樣本進行測試,識別的準(zhǔn)確率達到91%(表2),從結(jié)果來看,所求取的紅細胞形態(tài)特征值,能準(zhǔn)確描述8類紅細胞,BP神經(jīng)網(wǎng)絡(luò)識別的準(zhǔn)確率也比較高。
表2 BP神經(jīng)網(wǎng)絡(luò)識別結(jié)果表
傳統(tǒng)方法一般都是模板匹配,即每一類形態(tài)只有一個標(biāo)準(zhǔn),再計算其相似度。因為其簡單快速的特點,是一種被廣泛模式識別方法。下面將通過使用相同特征值,對比BP神經(jīng)網(wǎng)絡(luò)和模板匹配的識別率(表3)。從圖中,可以明顯看出,BP神經(jīng)網(wǎng)絡(luò)的識別準(zhǔn)確度平均要高10%以上。特別是對復(fù)雜紅細胞形狀,識別率比較差。
表3 BP神經(jīng)網(wǎng)絡(luò)與模板匹配識別率比較
本文提出基于BP神經(jīng)網(wǎng)絡(luò)的紅細胞識別方法。通過求取血涂片紅細胞的典型的有區(qū)分度的形態(tài)特征,將這些特征值組合成特征向量,做為已經(jīng)訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)的輸入,由神經(jīng)網(wǎng)絡(luò)進行識別與分類。在大量樣本測試中,結(jié)果表明本方法對8類紅細胞的平均識別率有91%左右,相比傳統(tǒng)的模板匹配方法提高了10%以上。因此,本文提出的基于BP神經(jīng)網(wǎng)絡(luò)的紅細胞識別方法有比較高的實用價值。下一步工作,將根據(jù)本文的算法,在Windows上實現(xiàn)紅細胞的識別與分類系統(tǒng)。
[1]鄭鳳嬌,龔燕紅(綜述),傅泳航(審校).外周血異常紅細胞形態(tài)學(xué)檢驗與診斷的意義[J].醫(yī)學(xué)綜述,2013,19(1):141-143.ZHENG Feng-jiao,GONG Yan-hong,F(xiàn)U Yong-hang.Significance of the Red Blood Cells Morphological Examination and Diagnosis in the Peripheral Blood[J].Medical Recapitulate,2013,19(1):141-143.
[2]Elsalamony H A.Healthy and unhealthy red blood cell detection in human blood smears using neural networks[J].Micron,2016,83:32-41.
[3]Lee H,Chen Y P P.Cellmorphology based classification for red cells in blood smear images[J].Pattern Recognition Letters,2014,49:155-161.
[4]G.Apostolopoulos,S.Tsinopoulos and E.Dermatas.Estimation of size and shape of the Human Red Blood Cellusing light scattering images[J].Journal of Computational Methods in Science and Engineering,IOS press,2009,9(1-2):19-30.
[5]Jambhekar ND.Red blood cells classification using image processing[J].Science Research Reporter,2011,1(3):151-154.
[6]Hirimutugoda Y M,Wijayarathna G.Image analysis system for detection of red cell disorders using artificial neural networks[J].Sri Lanka Journal of Bio-Medical Informatics,2010,1(1).
[7]Khashman A.Blood Cell Identification using Emotional Neural Networks[J].J.Inf.Sci.Eng.,2009,25(6):1737-1751.
[8]Joost Vromen,Brendan McCane.Red blood cell segmentation from SEM Images[J]..The 24th International Conference on Image and Vision Computing New Zealand,2009(9):44-49.
[9]丁建文,周豐良,梁光明.紅細胞形態(tài)學(xué)分析裝置及其方法:CN,CN 102359938 B[P].2012.
[10]TomariR,ZakariaW NW,JamilMM A,etal.Computer aided system for red blood cell classification in blood smear image[J].Procedia Computer Science,2014,42:206-213.
[11]Zheng Q,Milthorpe B K,Jones A S.Direct neural network application for automated cell recognition[J].Cytometry PartA,2004,57(1):1-9.
[12]Sheikh H,Zhu B,Micheli-Tzanakou E.Blood cell identification using neural networks[C]//Bioengineering Conference,1996.,Proceedings of the 1996 IEEE Twenty-Second AnnualNortheast.IEEE,1996:119-120.
[13]張國平,黃淼,馬麗.基于圖像處理的紅細胞自動識別統(tǒng)計系統(tǒng)[J].信息技術(shù),2016,40(1):10-12.ZHANGGuoping,HUANGMiao,MA Li.Statisticalautomatic identification system of erythrocyte based on image processing[J].Information Technology,2016,40(1):10-12.
[14]張寶菊,雷晴,李剛,等.基于BP神經(jīng)網(wǎng)絡(luò)的人體血液中紅細胞濃度無創(chuàng)檢測[J].光譜學(xué)與光譜分析,2012,32(9):2508-2511.ZHANG Baoju,LEIQing,LIGang,et al.Noninvasive Measurement of the Human RBCConcentration Based on BP NN Model[J].Spectroscopy and Spectral Analysis,2012,32(9):2508-2511.
[15]楊萬扣.基于鏈碼的部分算法研究[D].南京:南京理工大學(xué),2004.
[16]李曉峰,徐玖平,王蔭清,等.BP人工神經(jīng)網(wǎng)絡(luò)自適應(yīng)學(xué)習(xí)算法的建立及其應(yīng)用[J].系統(tǒng)工程理論與實踐,2004,24(5):1-8.LI Xiaofeng,XU Jiuping,WANG Yinqing,et al.Adaptive learning algorithm of BP artificial neural network and its application is established[J].Systems Engineering—Theory&Practice,2004,24(5):1-8.