潘燕紅,潘 林
(福州大學(xué)數(shù)字媒體研究院,福建 福州 350002)
糖尿病視網(wǎng)膜病變(Diabetic Retinopathy,DR)是糖尿病的嚴(yán)重眼部并發(fā)癥,已成為導(dǎo)致30歲~69歲成年人失明的最主要原因[1]。DR造成的視力損傷多為不可逆轉(zhuǎn),因此DR的早期診斷、治療及控制非常重要。傳統(tǒng)的由眼科醫(yī)生人工檢查方式存在效率低、勞動(dòng)強(qiáng)度大、主觀因素多等缺點(diǎn),借助計(jì)算機(jī)圖像處理等技術(shù)對DR進(jìn)行準(zhǔn)確、快速的檢測具有重要的臨床意義和科研價(jià)值。
圖1 含硬性滲出的眼底圖像:DIARETDB1 image005
HEs在彩色眼底圖像中呈蠟黃色點(diǎn)片狀,離散分布在眼底中,如圖1所示,當(dāng)HEs出現(xiàn)在黃斑區(qū)域時(shí),會嚴(yán)重威脅到患者視力[1]。由于軟性滲出、視盤與硬性滲出在顏色特征上較為相似,給HEs的檢測帶來困難;此外,因成像硬件條件造成的眼底圖像光照不均、對比度差也會影響檢測效果。HEs的檢測方法大致可分為非監(jiān)督分類方法[2-4]和監(jiān)督分類方法[5-6]。Phillips[2]等人結(jié)合全局及局部閾值來分割滲出物。Sinthanayothin[3]等人采用遞歸區(qū)域生長法提取HEs。Walter[4]在眼底圖像綠色通道上利用數(shù)學(xué)形態(tài)學(xué)方法HEs的輪廓。Osareh[5]等人先利用模糊C均值聚類分析分割出病灶候選區(qū)域,再用多層神經(jīng)網(wǎng)絡(luò)對分割出來的區(qū)域進(jìn)行分類。Adarsh[6]等人基于多分類SVM方法檢測DR眼底圖像特征。
本文提出一種基于支持向量機(jī)(Support Vector Machine,SVM)的HEs檢測方法,屬于監(jiān)督分類方法,其流程如圖2所示。首先對DR眼底圖像進(jìn)行粗分割,獲得HEs病灶候選區(qū)域;接著在此候選區(qū)域上提取特征并SVM分類出候選區(qū)域上的HEs和非HEs,得到HEs的精確檢測。
圖2 本文方法流程圖
為降低計(jì)算復(fù)雜度,本文先使用較簡單、快速的方法對HEs進(jìn)行粗分割,以獲得HEs候選區(qū)域。因硬性滲出和背景在灰度上有一定差異,可用閾值法來進(jìn)行粗分割,但是考慮到眼底圖像的光照條件、對比度差等因素,簡單的閾值分割難以獲得較為理想的分割效果,因此本文結(jié)合形態(tài)學(xué)運(yùn)算和閾值方法進(jìn)行粗分割。具體算法如下:
(1)將原圖(這里使用 DIARETDB1里的 image005圖,見圖1)轉(zhuǎn)換為灰度圖如圖3(a)所示;
(2)使用半徑為13的圓形結(jié)構(gòu)元素S對灰度圖進(jìn)行形態(tài)學(xué)開運(yùn)算獲得背景圖如圖3(b)所示;
(3)灰度圖減去背景圖得到前景圖如圖3(c)所示;
(4)對前景圖進(jìn)行閾值分割,這里取閾值為21,得到候選區(qū)域MASK圖如圖3(d)所示;
(5)視盤在顏色、灰度特征和硬性滲出極為相似,因此需要剔除視盤。這里采用基于Hough變換定位視盤,圓半徑r∈70,[]150[7]。圖3(e)為對圖1進(jìn)行視盤定位圖;
(6)將MASK圖剔除視盤后,疊加到圖1上,最終完成眼底圖像的粗分割,圖3(f)中淺灰點(diǎn)狀物即為HEs候選區(qū)域。
圖3 眼底圖像HEs候選區(qū)域粗分割
本文的粗分割是根據(jù)灰度特征來提取HEs候選區(qū)域,其中可能包含在灰度上與HEs相似的軟性滲出、背景點(diǎn)等非HEs,因此需要進(jìn)一步剔除候選區(qū)域中的非 HEs,以提高 HEs檢測精確度。本文采用SVM分類器對所獲得的候選區(qū)域上進(jìn)行HEs和非HEs的分類。SVM分類器結(jié)構(gòu)如圖4所示。先在已知類別的樣本集上,選擇特征參數(shù),訓(xùn)練得到分類模型,從而將訓(xùn)練集分類到給定類。
圖4 SVM分類器結(jié)構(gòu)圖
候選區(qū)域中非HEs和HEs在灰度上相似,但還有一定的區(qū)別,綜合HEs病灶的顏色、紋理、邊緣等特點(diǎn),提取具有代表性的特征,以訓(xùn)練SVM分類器。本文在文獻(xiàn)[8]的特征集基礎(chǔ)上加入AM-FM特征,使得檢測結(jié)果不受眼底圖像光照條件和對比度的影響,具有更好適應(yīng)性。本文選擇以下特征作為SVM分類器的特征向量:
(1)AM-FM 特征:IA、IF。
1996年 Havlicek提出 AM-FM 圖像模型[9],促進(jìn)了AM-FM模型在圖像領(lǐng)域的應(yīng)用,文獻(xiàn)[10]首次將AM-FM用于眼底圖像分析。圖像可以表示為多個(gè)二維AM-FM信號的疊加:
其中anx,()y和φnx,()y分別為第n個(gè)AM-FM信號分量的幅度函數(shù)和相位函數(shù)。頻率函數(shù)定義為相位函數(shù)的導(dǎo)數(shù):
一張圖像可表示為AM-FM圖像模型,反之解調(diào)得到的幅度和頻率可以表征圖像的一些特征。幅度(IA)反映了局部圖像強(qiáng)度變化,如病灶區(qū)域的邊界等;頻率(IF)是圖像紋理的物理度量,其大小與圖像旋轉(zhuǎn)角度及眼底圖像成像硬件條件無關(guān),而且頻率反應(yīng)了圖像紋理的幾何結(jié)構(gòu)信息,不受圖像對比度和光照變化影響[10]。
(2)候選區(qū)域內(nèi) RGB 均值:μR、μG、μB。
硬性滲出和眼底圖像背景具有較明顯的顏色差異,前者在眼底圖像中呈黃白色,而后者一般為橙紅色。
(3)候選區(qū)域內(nèi) RGB 標(biāo)準(zhǔn)差:σR、σG、σB。
硬性滲出區(qū)域邊界處的顏色變化較大,而背景區(qū)域邊界處顏色無明顯變化。
(4)候選區(qū)域鄰域的 RGB 均值:μ'R、μ'G、μ'B。
硬性滲出和背景在RGB均值和標(biāo)準(zhǔn)差上不同,因此取候選區(qū)域邊界5個(gè)像素寬的區(qū)域?yàn)楹蜻x區(qū)域的鄰域Γ。分別計(jì)算候選區(qū)域極其鄰域的均值和標(biāo)準(zhǔn)差特征可較好區(qū)分HEs和背景。
(5)候選區(qū)域鄰域的 RGB 標(biāo)準(zhǔn)差:σ'R、σ'G、σ'B。
(6)候選區(qū)域和鄰域的RGB均值的比:CR、CG、CB。
(7)候選區(qū)域質(zhì)心的值:RC、GC、BC。
因?yàn)楹蜻x區(qū)域的邊界可能存在誤檢,而質(zhì)心的像素值更能代表硬性滲出的顏色特征。
(8)候選區(qū)域的邊緣強(qiáng)度:ES。
硬性滲出和軟性滲出在顏色、形狀上較為相似,但硬性滲出區(qū)域的邊緣較為清晰顯著,而軟性滲出的邊緣較為模糊,因此計(jì)算候選區(qū)域的邊緣強(qiáng)度能有效區(qū)分HEs和非HEs。設(shè)B為邊界像素集,邊界強(qiáng)度可以用Prewitt算子計(jì)算得到[8]:
因要將病灶候選區(qū)域分類為HEs和非HEs,因此本文采用二類SVM分類模型。對于線性可分的樣本集X,尋找最優(yōu)分類面WX+b=0(W為分類面的法向量,b為偏差項(xiàng)),不但能將2類數(shù)據(jù)正確分開,而且使分類間隔最大。因此尋找最優(yōu)分類面問題轉(zhuǎn)換為分類間隔2/‖W‖最大化,即‖W‖2/2最小化問題。
對于樣本空間線性不可分的情況,則通過非線性變換(核函數(shù))將樣本空間映射到一個(gè)高維空間中,使得樣本線性可分?!琖‖2/2最小化問題可利用拉格朗日乘數(shù)法求解,得到最終決策函數(shù):
其中,K xi,()x為核函數(shù),αi為拉格朗日乘子,yi為SVM的分類類別標(biāo)簽。
本文在3.2GHz雙核CPU,1G內(nèi)存的PC機(jī)上在Matlab 2012a環(huán)境下進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)采用的圖像來自公開的 DR數(shù)據(jù)庫 DIARETDB1[11]。DIARETDB1中的眼底圖像為Kuopio大學(xué)醫(yī)院拍攝,由眼科專家挑選具有代表性的圖像并標(biāo)記病變區(qū),庫中共有89張眼底圖像,其中6張為正常無病變的眼底圖像,其余83張均含有病變,而含有HEs的有47張。本實(shí)驗(yàn)選取45張圖像(其中22張含有HEs)作為訓(xùn)練集,剩下44張作為測試集。訓(xùn)練集中包含895個(gè)硬性滲出區(qū)域,689個(gè)非硬性滲出區(qū)域。為精確分割出DR眼底圖像上的HEs,實(shí)驗(yàn)將在45張測試集上進(jìn)行粗分割得到的2062個(gè)HEs病灶候選區(qū)域作為訓(xùn)練好的SVM分類器輸入,最終分類出HEs和非HEs。
在評價(jià)算法的性能上使用國際上比較通用敏感性(Sensitivity)和特異性(Specificity)參數(shù),敏感性表示正確判斷病灶的比例,特異性表示正確判斷出非病灶的比例。英國糖尿病協(xié)會建議糖尿病視網(wǎng)膜病變檢測系統(tǒng)的病灶檢測敏感性要高于80%[12]。
在訓(xùn)練SVM分類器之前,需要選擇合適的核函數(shù)及參數(shù)。目前常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)(Radial Basis Function,RBF)。
線性核函數(shù):
多項(xiàng)式核函數(shù):
徑向基核函數(shù):
本文通過實(shí)驗(yàn)比較3個(gè)核函數(shù)的分類效果。在核函數(shù)的參數(shù)d、σ和懲罰因子C的選擇上,采用5重交叉驗(yàn)證法與網(wǎng)格搜索法[13],對于徑向基核函數(shù),根據(jù)試驗(yàn),將 σ 范圍設(shè)為0.1~0.9,步長為0.1;C 為0 ~20,步長為 0.1,將每對(σ,C)進(jìn)行交叉驗(yàn)證,找出交叉驗(yàn)證精確度最高的(σ,C)。多項(xiàng)式核函數(shù)使用同樣方法確定參數(shù),d取2~10,步長為1。表1為不同核函數(shù)及其最優(yōu)參數(shù)下的分類效果比較,當(dāng)使用徑向基核函數(shù),參數(shù) C取12.8,σ取0.5時(shí),檢測效果最佳。
表1 不同核函數(shù)及其最優(yōu)參數(shù)下SVM分類器的分類結(jié)果
圖5左、右2列分別為對DIARETDB1中的image005和image019用本文方法進(jìn)行硬性滲出檢測的結(jié)果。先粗分割得到HEs候選區(qū)域(圖5(c)和圖5(d)的淺灰色斑點(diǎn)區(qū)域),再在候選區(qū)域上進(jìn)行SVM精分割,最終檢測出較為精確的HEs區(qū)域(圖5(e)和圖5(f)的黑色斑點(diǎn)區(qū)域),可以看出在本文選擇的特征集上進(jìn)行SVM分類能有效剔除候選區(qū)域上的軟性滲出、背景等非硬性滲出。
為進(jìn)一步評估本文方法的性能,將本文方法的檢測效果與其他方法進(jìn)行比較,如表2所示。Phillips[2]和Sinthanayothin[3]分別采用閾值分割和區(qū)域生長法,僅根據(jù)灰度信息來分割硬性滲出,在敏感性上比本文所采用的方法差。Osareh[5]使用模糊C均值聚類結(jié)合多層神經(jīng)網(wǎng)絡(luò)方法,在敏感性和特異性上都優(yōu)于本文方法,但是平均耗時(shí)長,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法是需要大量樣本來保證其精確度,收斂速度慢,而SVM是基于現(xiàn)有的有限樣本集上得到的最優(yōu)解。Adarsh[6]使用多分類SVM分類方法和本文所采用的二類SVM分類方法得到的敏感性和特異性相差不大,但本文引入AM-FM特征,檢測結(jié)果不受對比度和亮度變化影響,能適用在不同成像條件拍攝得來的眼底圖像。
圖5 硬性滲出提取結(jié)果
表2 本文HEs提取方法和其他方法的比較
采用有效的圖像處理分析技術(shù)來檢測眼底圖像有助于DR的早期診斷、治療監(jiān)控和術(shù)后估計(jì),具有重要意義,DR的早期病變之一硬性滲出的檢測也尤為重要。本文采用粗精結(jié)合的檢測方法,首次將AMFM特征與SVM分類器相結(jié)合提取眼底圖像硬性滲出,不僅在敏感性和特異性指標(biāo)上達(dá)到較好效果,實(shí)時(shí)性較好,而且檢測效果不受圖像成像條件影響,具有更好適應(yīng)性。
:
[1]Watkins P J.ABC of diabetes:Retinopathy[J].BMJ:British Medical Journal,2003,326(7395):924-926.
[2]Phillips R,F(xiàn)orrester J,Sharp P.Automated detection and quantification of retinal exudates[J].Graefe’s Archive for Clinical and Experimental Ophthalmology,1993,231(2):90-94.
[3]Sinthanayothin C,Boyce J F,Cook H L,et al.Automated localisation of the optic disc,fovea,and retinal blood vessels from digital colour fundus images[J].British Journal of Ophthalmology,1999,83(8):902-910.
[4]Walter T,Klein J C,Massin P,et al.A contribution of image processing to the diagnosis of diabetic retinopathydetection of exudates in color fundus images of the human retina[J].IEEE Transactions on Medical Imaging,2002,21(10):1236-1243.
[5]Osareh A,Shadgar B,Markham R.A computational-intelligence-based approach for detection of exudates in diabetic retinopathy images[J].IEEE Transactions on Information Technology in Biomedicine,2009,13(4):535-545.
[6]Adarsh P,Jeyakumari D.Multiclass SVM-based automated diagnosis of diabetic retinopathy[C]//IEEE 2013 International Conference on Communications and Signal Processing(ICCSP).2013:206-210.
[7]Osareh A.Automated Identification of Diabetic Retinal Exudates and the Optic Disc[D].University of Bristol,2004.
[8]Garcia M,Sanchez C I,Poza J,et al.Detection of hard exudates in retinal images using a radial basis function classifier[J].Annals of Biomedical Engineering,2009,37(7):1448-1463.
[9]Havlicek J P,Harding D S,Bovik A C.The multicomponent AM-FM image representation[J].IEEE Transactions on Image Processing,1996,5(6):1094-1100.
[10]Murray V,Psttichis M,Soliz P.New AM-FM analysis methods for retinal image characterization[C]//IEEE 2008 the 42nd Asilomar Conference on Signals,Systems and Computers.2008:664-668.
[11]Tomi Kauppi,Valentina Kalesnykiene,Joni-Kristian Kamarainen,et al.DIARETDB1-Standard Diabetic Retinopathy Database[DB/OL].http://www2.it.lut.fi/project/imageret/diaretdb1/,2007-06-19.
[12]British Academic Association.Retinal Photography Screening for Diabetic Eye Disease[R].London:British Academic Association,1997.
[13]Hsu C W,Chang C C,Lin C J.A Practical Guide to Support Vector Classification[R].University of National Taiwan,Department of Computer Science and Information Engineering,2003.