吳聰 黃中勇 殷浩 劉罡
摘要:卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方面性能出眾,其特有的多層感知器可以提取多類圖片的隱式特征。提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的眼球血絲診斷方法:將3類共1 500幅分辨率為32×32的眼球血絲圖都轉(zhuǎn)換成1 500組數(shù)值矩陣,1 200組作為訓(xùn)練集輸入網(wǎng)絡(luò)訓(xùn)練,300組作為驗(yàn)證集進(jìn)行測(cè)試。實(shí)驗(yàn)表明,該應(yīng)用算法可達(dá)到93.19%的訓(xùn)練準(zhǔn)確率和87.57%的測(cè)試準(zhǔn)確率。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);共享權(quán)值;眼球血絲診斷
DOIDOI:10.11907/rjdk.1511613
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2016)005-0140-03
0 引言
目前,眼球血絲診斷主要依靠人工完成,不僅耗時(shí)費(fèi)力,也會(huì)因醫(yī)生經(jīng)驗(yàn)不足導(dǎo)致誤診情況發(fā)生。如今許多醫(yī)生都會(huì)結(jié)合數(shù)字化的診斷系統(tǒng)來(lái)進(jìn)行病情診斷、分析并給出結(jié)果,然而眼球血絲診斷數(shù)字化尚處于發(fā)展期,沒(méi)有進(jìn)入實(shí)際應(yīng)用。眼球血絲診斷的數(shù)字化研究有著良好的應(yīng)用前景,不僅可以為臨床診斷提供客觀標(biāo)準(zhǔn),也可以為建立中醫(yī)遠(yuǎn)程診斷系統(tǒng)發(fā)揮作用[1]。病人可以用特定的設(shè)備拍攝自己眼部圖像,再通過(guò)網(wǎng)絡(luò)傳遞給數(shù)據(jù)中心進(jìn)行處理而得出結(jié)果;醫(yī)生可以借助診療輔助軟件,極大地減輕自己的工作負(fù)擔(dān),提高醫(yī)療效率。
由于眼球血絲形狀千變?nèi)f化,加之取圖設(shè)備和操作環(huán)境的不同,故圖片難以分類研究。鑒于卷積神經(jīng)網(wǎng)絡(luò)[2](Convolutional Neural Network,CNN)對(duì)復(fù)雜的幾何形變具有較強(qiáng)的不變性且對(duì)圖像處理只需較小的計(jì)算代價(jià)等優(yōu)點(diǎn),本文提出了一種基于CNN的眼球血絲診斷方法,克服了傳統(tǒng)的診斷需要進(jìn)行人工提取分類特征的缺點(diǎn),將原始圖像轉(zhuǎn)變?yōu)閿?shù)據(jù)作為輸入,進(jìn)而學(xué)習(xí)相應(yīng)特征并實(shí)現(xiàn)精確分類。
1 理論依據(jù)
1.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)歸屬于人工神經(jīng)網(wǎng)絡(luò),是接近于實(shí)際的生物神經(jīng)網(wǎng)絡(luò)系統(tǒng),有輸入層、卷積層、下采樣層、全連接層和特征輸出[3],整體結(jié)構(gòu)如圖1所示。CNN的輸入層可直接接收如二維圖像的二維視覺(jué)模式,可不需要過(guò)多的人為參與去計(jì)算原始圖像的合適特征,自動(dòng)從輸入數(shù)據(jù)中提取特征和分類學(xué)習(xí)。實(shí)際應(yīng)用中,輸入層數(shù)據(jù)較為靈活,可為如彩色圖像的多通道圖像或者直接為圖像的灰度值。
卷積層與下采樣層同屬于中間層。其中卷積層為特征抽取層,每層中含有多個(gè)卷積神經(jīng)元(稱為C元);下采樣層為特征映射層,每層中可含有多個(gè)抽樣神經(jīng)元(稱為S元)。卷積層和下采樣層中每個(gè)神經(jīng)元的輸入與前一層的相應(yīng)區(qū)域連接,檢測(cè)出相應(yīng)區(qū)域特征后將特征的相應(yīng)位置傳輸于下一層。CNN可以設(shè)定多層卷積層和下采樣層,卷積層擁有多個(gè)特征平面,每個(gè)平面都由共享相同連接權(quán)值的神經(jīng)元組成,并且神經(jīng)元只接受對(duì)應(yīng)感受野所傳遞的信號(hào)。因?yàn)檩斎霕颖驹诰矸e層中進(jìn)行特征提取并得到高維特征映射,但此映射不可直接作為CNN最后輸出的分類特征,因此要在下采樣層進(jìn)行降維。下采樣層上的每一個(gè)神經(jīng)元也和卷積層相似,是共享相同連接權(quán)重的。相對(duì)于卷積層的神經(jīng)元數(shù)目,由于下采樣層是對(duì)上一卷積層相應(yīng)的感受進(jìn)行取均值、最值等操作,因而下采樣層所需的神經(jīng)元數(shù)目大量減少。全連接層可充分挖掘輸出類別標(biāo)簽和網(wǎng)絡(luò)最后抽取特征之間的映射關(guān)系,可連接對(duì)應(yīng)問(wèn)題的分類數(shù)目。CNN通過(guò)共享權(quán)值大幅縮少了需要訓(xùn)練的權(quán)值數(shù)量,進(jìn)而對(duì)訓(xùn)練樣本的需求大大減少。文獻(xiàn)[4]和[5]更加詳細(xì)地介紹了卷積神經(jīng)網(wǎng)絡(luò)。
卷積神經(jīng)網(wǎng)絡(luò)作為圖像識(shí)別領(lǐng)域的研究方向,已成為研究者們關(guān)注的重點(diǎn)。在一些領(lǐng)域,如模式分類,CNN優(yōu)勢(shì)非常明顯。該算法可以使原始圖像簡(jiǎn)單處理后直接輸入,避免了繁雜的圖像預(yù)處理。最初提出CNN的是Hubel和Wiesel[6],他們?cè)趯?duì)動(dòng)物腦皮層進(jìn)行研究后,發(fā)現(xiàn)了可以有效降低反饋神經(jīng)網(wǎng)絡(luò)復(fù)雜性的結(jié)構(gòu),故而提出卷積神經(jīng)網(wǎng)絡(luò)。而第一個(gè)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的是K.Fukushima在1980年提出的新識(shí)別機(jī)。之后,該網(wǎng)絡(luò)得到更多研究者的改進(jìn)。2012年Dan Ciresan在Yann LeCun、Sven Behnke、Patrice Simard等學(xué)者的研究基礎(chǔ)上,使卷積神經(jīng)網(wǎng)絡(luò)識(shí)別多個(gè)圖像數(shù)據(jù)得到進(jìn)一步的改良發(fā)展。目前,卷積神經(jīng)網(wǎng)絡(luò)發(fā)展非常迅速,孫曄等[7]利用卷積神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)出了一種車標(biāo)識(shí)別的方法;賈世杰等[8]將CNN應(yīng)用于商品圖像精細(xì)分類;呂剛[9]在對(duì)Simard網(wǎng)絡(luò)加以改進(jìn)后,大大提高了CNN多字體字符識(shí)別成功率;Jiang Qing-Ling[10]的基于CNN彩色圖像邊緣檢測(cè)優(yōu)于傳統(tǒng)檢測(cè)方法。
1.2 眼球血絲與疾病
眼球血絲與人體疾病有著非常大的關(guān)系,血絲的顏色、走向等對(duì)應(yīng)著人體某個(gè)部位的病變程度,身體部位的疾病在眼球相應(yīng)位置上都有反應(yīng)[11],如圖2所示為典型的習(xí)慣性便秘眼血絲圖。宋寧[12]在診斷慢性胃炎時(shí)發(fā)現(xiàn),97.43%的慢性胃炎有兩眼出現(xiàn)血絲脈絡(luò)粗大,呈深紅等癥狀。李珪等[13]發(fā)現(xiàn)89.4%的高血壓病人眼球血絲脈絡(luò)根部增粗、彎曲成螺旋狀。龔梅芳[14]發(fā)現(xiàn)頭痛患者眼球血絲微血管分布紊亂,血管周圍有滲出或水腫現(xiàn)象。
由于眼球血絲沒(méi)有皮膚遮蓋,最能直接反應(yīng)人體內(nèi)臟患病情況,所以一般無(wú)假象。醫(yī)生通過(guò)觀察可以知道身體情況和變化,從而進(jìn)行疾病的診斷和治療。傳統(tǒng)中醫(yī)可以利用影像醫(yī)學(xué)技術(shù)成果,使歷史悠久的臨床醫(yī)學(xué)技術(shù)實(shí)現(xiàn)現(xiàn)代化發(fā)展。在這一趨勢(shì)下,基于卷積神經(jīng)網(wǎng)絡(luò)的眼球血絲診斷具有一定意義。
2 實(shí)驗(yàn)分析
基于CNN的眼球血絲診斷是指輸入病人的眼球圖像來(lái)確定所患病癥的過(guò)程。它在醫(yī)療輔助和醫(yī)療自動(dòng)化等領(lǐng)域都有著非常大的實(shí)用價(jià)值,而且是CNN和模式識(shí)別等領(lǐng)域的關(guān)注課題。由于眼球的特殊性,例如性別、人種、年齡的不同,或者有受傷、手術(shù)等不確定因素,以及眼球成像的曝光、聚焦等問(wèn)題,基于卷積神經(jīng)網(wǎng)絡(luò)的眼球血絲診斷依然具有較高的挑戰(zhàn)性。
2.1 算法將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于眼球血絲診斷識(shí)別的方法是本文著重介紹的內(nèi)容。CNN具有能提取表征力強(qiáng)參數(shù)的優(yōu)點(diǎn),故應(yīng)用于血絲病癥的識(shí)別是個(gè)較好的選擇,具體步驟與算法如下:
對(duì)于輸入層樣本,每幅眼球血絲圖像都經(jīng)初步處理(見(jiàn)圖3):首先分割出具有明顯反映病癥特征的血絲所在區(qū)域,統(tǒng)一設(shè)定為32×32大小,再將分割出的血絲圖進(jìn)行灰度化處理,最終將每幅灰度圖“數(shù)值化”處理為一個(gè)32×32的二維矩陣(“數(shù)值化”操作是對(duì)每幅灰度圖共計(jì)1 024個(gè)像素分別除255.000而得出的數(shù)值)。
CNN通過(guò)結(jié)構(gòu)上的局部連接、共享權(quán)值和下采樣等,不僅網(wǎng)絡(luò)規(guī)??刂频煤芎?,而且特征能準(zhǔn)確識(shí)別。如圖4所示,對(duì)于眼球血絲識(shí)別任務(wù),首先獲取輸入眼球血絲圖像的局部特征,再將這些特征做多輪迭代處理以獲取更高級(jí)的特征,這樣最終的特征被處理成一個(gè)一維向量,該向量就是眼球血絲圖像的表征,本文正是用此表征來(lái)有訓(xùn)練CNN。
2.2 實(shí)驗(yàn)
從醫(yī)院獲取3類眼球血絲圖,包括胃病癥、肺疾病和腸雜病這3類;初步分割處理后得到全部血絲圖共1 500張(圖5展示了部分血絲),經(jīng)過(guò)灰度化處理,并“數(shù)值化”成1 500組二維數(shù)組,其中1 200組為訓(xùn)練組,300組為測(cè)試組。繼而將訓(xùn)練組和測(cè)試組全部輸入到網(wǎng)絡(luò)中運(yùn)行,同時(shí)進(jìn)行訓(xùn)練和測(cè)試。關(guān)于程序的主要函數(shù)、函數(shù)參數(shù)及說(shuō)明如表2所示。
卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值是經(jīng)過(guò)梯度下降運(yùn)算得出,通過(guò)多次迭代運(yùn)算繼而得到理想?yún)?shù)。由表3分析可知,在迭代次數(shù)較少時(shí),神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不夠充分,訓(xùn)練所得模型不理想,因此測(cè)試準(zhǔn)確率較低。當(dāng)?shù)螖?shù)達(dá)到一定程度時(shí),網(wǎng)絡(luò)參數(shù)得到充分訓(xùn)練,測(cè)試準(zhǔn)確率上升到一個(gè)定值。然而,隨著迭代次數(shù)的繼續(xù)增加,測(cè)試準(zhǔn)確率反而下降。
3 結(jié)語(yǔ)
本文將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于眼球血絲診斷,通過(guò)對(duì)網(wǎng)絡(luò)的持續(xù)訓(xùn)練,找到眼球血絲圖的最優(yōu)參數(shù),進(jìn)而將參數(shù)應(yīng)用于病癥識(shí)別。在提升效率上,優(yōu)先對(duì)圖進(jìn)行處理——將圖轉(zhuǎn)換成數(shù)值矩陣,這樣可大大減少網(wǎng)絡(luò)訓(xùn)練時(shí)間,整個(gè)算法的訓(xùn)練準(zhǔn)確率達(dá)93.19%,測(cè)試準(zhǔn)確率達(dá)87.57%。但本文所提出的方法也存在一些不足:分類的病癥稍少,針對(duì)更多種類的病癥診斷尚有待研究,因此眼球血絲圖還需完善,數(shù)量和種類也需豐富。
參考文獻(xiàn):
[1]朱貴冬.中醫(yī)“望目辨證”的數(shù)字化技術(shù)研究[D].北京:中國(guó)科學(xué)院研究生院,2006.
[2]ZEILER M D,F(xiàn)ERGUS R.Visualizing and understanding convolutional neural networks[J].Arxiv Preprint Arxiv,2013(24):818-833.
[3]謝劍斌,興軍亮,張立寧,等.視覺(jué)機(jī)器學(xué)習(xí)20講[M].北京:清華大學(xué)出版社,2015.
[4]LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[5]LAWRENCE S,GILES C L,TSOI A C,et al.Face recognition:a convolutional neural-network approach[J].Neural Networks,IEEE Transactions on,1997,8(1):98-113.
[6]HUBEL D H,WIESEL T N.Receptive fields of single neurones in the cat's striate cortex[J].The Journal of Physiology,1959,148(3):574-591.
[7]孫曄,吳銳文.基于卷積神經(jīng)網(wǎng)絡(luò)的車標(biāo)識(shí)別[J].現(xiàn)代計(jì)算機(jī),2015,503(11):84-87.
[8]賈世杰,楊東坡,劉金環(huán).基于卷積神經(jīng)網(wǎng)絡(luò)的商品圖像精細(xì)分類[J].山東科技大學(xué)學(xué)報(bào),2014,33(6):91-95.
[9]呂剛.基于卷積神經(jīng)網(wǎng)絡(luò)的多字體字符識(shí)別[J].浙江師范大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(4):425-428.
[10]JIANG QING-LING.Edge detection for color image based on CNN[J].Engineering Village,2015,2(1):11-12.
[11]宋寧.壯醫(yī)目診診斷慢性胃炎350例觀察[J].云南中醫(yī)學(xué)院學(xué)報(bào),2006(S1):92-93.
[12]李珪,黃莉.高血壓病在壯醫(yī)目診的征象觀察[J].中國(guó)民族醫(yī)藥雜志,2007(4):65.
[13]龔梅芳,鄒季,胡世芬,等.84例頭痛患者球結(jié)膜微循環(huán)和甲襞微循環(huán)研究[J].中國(guó)微循環(huán),2002,6(4):230-231.
[14]王今覺(jué).望目辨證診斷學(xué)[M].北京:中國(guó)中醫(yī)藥出版社,2013.
(責(zé)任編輯:孫 娟)