王巖
摘要:肝穿刺病理學(xué)檢查主要在醫(yī)學(xué)中用于各種肝臟疾病的鑒別與診斷,了解肝臟病變的程度和活動性,發(fā)現(xiàn)早期、靜止期或尚在代償期的肝硬化,判別臨床治療。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的一個重要組成部分,在圖像識別方面有很多重要應(yīng)用。針對肝穿刺圖像分類中病理圖像分類問題,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的分類方法。設(shè)計(jì)并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),得到用于分類的模型。實(shí)驗(yàn)結(jié)果表明,該方法可以有效地對其進(jìn)行分類,提高識別準(zhǔn)確率。
關(guān)鍵詞:肝穿刺圖像;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);圖像識別;人工智能
中圖分類號:TP183 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)25-0203-03
Application of Convolution Neural Network in Image Classification of Liver Puncture
WANG Yan
(Institute of Computer Application, China Academy of Engineering Physics, Mianyang 621900, China)
Abstract:Liver biopsy is mainly used for the identification and diagnosis of various liver diseases in medicine. It was used to diagnose the degree and activity of liver lesions, and to detect early, static or compensatory cirrhosis of the liver, and to identify clinical treatment. As an important part of deep learning, convolution neural network has many important applications in image recognition. A method based on convolution neural network was proposed to classify the pathological images in liver biopsy image classification. The experimental results show that this method can effectively classify and improve the recognition accuracy.
Key words:liver biopsy image; convolution neural network; deep learning; image recognition; artificial intelligence
肝穿刺就是肝臟組織活檢。目前在醫(yī)學(xué)領(lǐng)域方面多用于多種肝臟疾病的鑒別診斷,如鑒別黃疸的性質(zhì)和產(chǎn)生的原因,了解肝臟病變的程度和活動性,為各型病毒性肝炎的病原學(xué)診斷提供依據(jù),發(fā)現(xiàn)早期、靜止期或尚在代償期的肝硬化,尤其在確定肝纖維化嚴(yán)重程度上是國際公認(rèn)的標(biāo)準(zhǔn)。由于其準(zhǔn)確率可以達(dá)到80%以上,故被認(rèn)為是目前比較好的檢查手段。
在檢測過程中,在B超、CT的定位和引導(dǎo)下經(jīng)皮膚穿刺,獲取樣本后再通過顯微鏡觀察肝臟組織和細(xì)胞形態(tài)。傳統(tǒng)的分類方法受限于醫(yī)師的經(jīng)驗(yàn)、判斷標(biāo)準(zhǔn)的主觀性差異和病變特征的非線性特點(diǎn),會對檢測結(jié)果的準(zhǔn)確率造成一定程度的影響[1]。近幾年在計(jì)算機(jī)方向熱門的人工智能技術(shù),尤其是在圖像處理領(lǐng)域應(yīng)用廣泛的深度學(xué)習(xí)算法,在醫(yī)學(xué)圖像領(lǐng)域也有很多的應(yīng)用。為了消除傳統(tǒng)方法中,由于人的原因而造成的準(zhǔn)確率受影響的問題,本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的肝穿刺圖像分類的方法,對圖像進(jìn)行基本的判斷。進(jìn)而希望可以作為一個輔助手段來幫助醫(yī)師進(jìn)行判斷。另一方面,也可以減輕醫(yī)師的工作量,為患者節(jié)約檢驗(yàn)成本。
本實(shí)驗(yàn)所采用的樣本主要分為三個類別---健康、輕微病變、嚴(yán)重病變,如圖1所示。
隨著病變程度的不同,損傷區(qū)域的特征也不同。因此,很難設(shè)計(jì)一種將病變區(qū)域和背景區(qū)域可以很好區(qū)分的特征提取算法。而深度學(xué)習(xí)就是用來進(jìn)行特征提取、訓(xùn)練然后進(jìn)行分類的一個很好的工具。而作為深度學(xué)習(xí)中重要組成部分的卷積神經(jīng)網(wǎng)絡(luò),則是近幾年被國內(nèi)廣泛應(yīng)用的一種人工神經(jīng)網(wǎng)絡(luò)。本文也是基于這種人工神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)。
卷積神經(jīng)網(wǎng)絡(luò)是受貓視覺皮層生理研究啟發(fā),有人提出了卷積神經(jīng)網(wǎng)絡(luò)。而后Yann Lecun最早將其成功應(yīng)用于MNIST手寫體數(shù)字識別任務(wù)中[2],并持續(xù)保持了其在該問題上的霸主地位。由此,卷積神經(jīng)網(wǎng)絡(luò)開始被大眾所熟知。近年來卷積神經(jīng)網(wǎng)絡(luò)在多個領(lǐng)域都開始發(fā)揮自己的優(yōu)勢,如醫(yī)學(xué)圖像識別及分類[3]、語音識別[4]、人臉識別[5]、行為判斷[6]、情感預(yù)測[7]等。
本文以肝穿刺圖像自動分類為目標(biāo),設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)方法。通過對數(shù)據(jù)進(jìn)行訓(xùn)練,得到所需的分類器。本文內(nèi)容的具體安排如下:第二節(jié)介紹深度學(xué)習(xí)及卷積神經(jīng)網(wǎng)絡(luò)的基本原理;第三節(jié)介紹本實(shí)驗(yàn)中所用的卷積神經(jīng)網(wǎng)絡(luò)的模型;第四節(jié)中介紹實(shí)驗(yàn)數(shù)據(jù)以及處理方式;第五節(jié)介紹實(shí)驗(yàn)結(jié)果及分析;第六節(jié)總結(jié)與展望。
1 深度學(xué)習(xí)及卷積神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)的結(jié)構(gòu)基礎(chǔ)是多層神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)則是一種特殊的多層神經(jīng)網(wǎng)絡(luò)。在生物體的神經(jīng)網(wǎng)絡(luò)中,每個神經(jīng)元與其他神經(jīng)元之間相連。當(dāng)神經(jīng)元發(fā)生興奮時,就會向相鄰的神經(jīng)元之間發(fā)送神經(jīng)遞質(zhì),從而改變這些神經(jīng)元內(nèi)部的電位,產(chǎn)生相應(yīng)的變化。多層神經(jīng)網(wǎng)絡(luò)和生物的神經(jīng)網(wǎng)絡(luò)類似,它是由輸入層、隱藏層、輸出層組成的。相鄰的各個位于不同層的神經(jīng)元節(jié)點(diǎn)間均有權(quán)值相連接。如圖2所示,展示了一個具有一個隱含層的神經(jīng)網(wǎng)絡(luò)。
其對應(yīng)的公式(1)如下:
[a(2)1=f(ω(1)11x1+ω(1)12x2+ω(1)13x3+b(1)1)]
[a(2)2=f(ω(1)21x1+ω(1)22x2+ω(1)23x3+b(1)2)] (1)
[a(2)3=f(ω(1)31x1+ω(1)32x2+ω(1)33x3+b(1)3)]
[hω,b(x)=a(3)1=f(ω(2)11a(2)1+ω(2)12a(2)2+ω(2)13a(2)3+b(2)1)]
其中[ω] 為層間的參數(shù)矩陣,[b] 為偏移參數(shù)向量,[x] 為輸入,[f] 為激活函數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)與普通的人工神經(jīng)網(wǎng)絡(luò)的區(qū)別在于,卷積神經(jīng)網(wǎng)絡(luò)在原來的人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了特征學(xué)習(xí)部分,而這部分就是模擬人腦在對接收到的信號處理上的分級的方法。具體操作就是在全連接層前加入了由卷積層和下采樣層構(gòu)成的特征抽取器。在卷積神經(jīng)網(wǎng)絡(luò)中的每一個卷積層中,又包含了若干個特征平面,每個特征平面由一些矩陣排列的神經(jīng)元組成。卷積核的初始化一般是以一個隨機(jī)小數(shù)的矩陣的形式,在訓(xùn)練的過程中得到合適的權(quán)值。下采樣也叫作池化,通常包括均值下采樣和最大值下采樣兩種形式。卷積和下采樣很大程度地簡化了網(wǎng)絡(luò)模型的復(fù)雜程度,減少了模型的參數(shù)。
2 實(shí)驗(yàn)所用到的網(wǎng)絡(luò)模型
本實(shí)驗(yàn)中所采用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖3所示:
如上圖,其中Conv表示卷積層,Sub表示下采樣層,F(xiàn)c表示全連接層。該網(wǎng)絡(luò)結(jié)構(gòu)中卷積層和下采樣層交替出現(xiàn)。在卷積層中,樣本會經(jīng)過卷積核的卷積計(jì)算等一系列處理,形成特征圖。在下采樣層中,樣本數(shù)據(jù)會根據(jù)下采樣算子進(jìn)行下采樣操作。
在本文網(wǎng)絡(luò)模型的卷積層中,采用的是修正線性單元(Rectified linear unit,ReLU)激活函數(shù)。而在前兩個全連接層中采用的是雙曲正切函數(shù)(Tanh)作為激活函數(shù)。在最后一層全連接層采用softmax激活函數(shù)。為了防止卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)過擬合問題,本文采用了Dropout技術(shù)[8]。
3 實(shí)驗(yàn)數(shù)據(jù)
數(shù)據(jù)集是對分類其中參數(shù)進(jìn)行分類的樣本,對于分類器的最終效果影響很大。本實(shí)驗(yàn)中所用的數(shù)據(jù)為肝穿刺圖像,目前在醫(yī)學(xué)圖像處理領(lǐng)域里,尚未存在一個標(biāo)準(zhǔn)化的肝穿刺圖像數(shù)據(jù)集,且本實(shí)驗(yàn)中的應(yīng)用背景是肝穿刺活檢樣本的分類,訓(xùn)練所需的數(shù)據(jù)集也應(yīng)取自實(shí)際醫(yī)院中進(jìn)行肝穿刺檢測的患者,故樣本收集難度較大。
為了有一個標(biāo)準(zhǔn)的訓(xùn)練及檢測數(shù)據(jù)集,本實(shí)驗(yàn)進(jìn)行前對其他圖像處理方向的領(lǐng)域進(jìn)行了調(diào)研,分析了他們的標(biāo)準(zhǔn)數(shù)據(jù)集。發(fā)現(xiàn)其有幾個共同的特點(diǎn):1、數(shù)據(jù)集中數(shù)據(jù)的量很大,通常圖片數(shù)目超過5000張且每個類中圖片的數(shù)目相差不大;2、與訓(xùn)練數(shù)據(jù)集相類似,分別設(shè)置了對應(yīng)的測試樣本數(shù)據(jù)集,用來對其訓(xùn)練好的模型進(jìn)行測試。并且訓(xùn)練數(shù)據(jù)集和測試樣本數(shù)據(jù)集中的數(shù)據(jù)不重復(fù),保證了測試結(jié)果的真實(shí)性。而本實(shí)驗(yàn)所原有的數(shù)據(jù)由于病患群體的特殊性,導(dǎo)致三個類別的樣本數(shù)目分部嚴(yán)重不均衡。健康類圖片的樣本數(shù)目遠(yuǎn)遠(yuǎn)多于其他兩個類的樣本數(shù)目。
通過對上述樣本數(shù)據(jù)集及自有樣本集的分析。本實(shí)驗(yàn)通過調(diào)研發(fā)現(xiàn),對現(xiàn)有數(shù)據(jù)進(jìn)行旋轉(zhuǎn)、翻折等操作可以產(chǎn)生大量可用的偽數(shù)據(jù)樣本[9]。增加可用的樣本數(shù)量且不會影響模型的訓(xùn)練。如圖4來擴(kuò)展兩個數(shù)量不多的樣本庫,使其數(shù)量與健康類數(shù)量相差不大,以保證訓(xùn)練效果。
受到原始數(shù)據(jù)集的影響,本次實(shí)驗(yàn)所用的數(shù)據(jù)集仍達(dá)不到公開數(shù)據(jù)集的樣本數(shù)量。經(jīng)過對數(shù)據(jù)集進(jìn)行處理后,本次實(shí)驗(yàn)所用的訓(xùn)練集為健康樣本720張,輕微病變類樣本612張,嚴(yán)重病變類樣本584張,共計(jì)1916張。而測試集中的健康類樣本為104張,輕微病變樣本為86張,嚴(yán)重病變類樣本82張,共計(jì)272張。且訓(xùn)練集和測試集中的樣本無重復(fù)。
4 實(shí)驗(yàn)結(jié)果及分析
本次實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境為Windows 7系統(tǒng)+TensorFlow+python3.5,應(yīng)用GPU對卷積運(yùn)算進(jìn)行加速,所用GPU型號為GTX1050Ti。在本次實(shí)驗(yàn)中,由于設(shè)備性能受限,只進(jìn)行了400次循環(huán),學(xué)習(xí)率設(shè)置為0.001。采用分批訓(xùn)練方式,每批次含有樣本數(shù)目70個,訓(xùn)練樣本集分為28個 批次。這樣訓(xùn)練的好處是相比于逐一訓(xùn)練是有全局性的,也提高了提高機(jī)器的使用率。而相對于整體訓(xùn)練來說,能大幅度節(jié)約訓(xùn)練時間。當(dāng)所有訓(xùn)練樣本批次訓(xùn)練完畢后,一次循環(huán)完成。如此往復(fù)進(jìn)行400次循環(huán),共計(jì)11200個批次。
圖4是使用tensorboard記錄的訓(xùn)練圖中準(zhǔn)確率的變化情況。可以看出在完成10000個批次訓(xùn)練時準(zhǔn)確率已經(jīng)達(dá)到88.47%。最終,在400次循環(huán)完成后,用測試集進(jìn)行測試的準(zhǔn)確率為91.54%。
對實(shí)驗(yàn)中數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn),測試集中分類錯誤的圖片大部分都在輕微病變類測試樣本中,是因?yàn)閷τ诓∽兂潭鹊慕缍壳皼]有一個準(zhǔn)確的界定方式,模型只能根據(jù)訓(xùn)練數(shù)據(jù)中,它所學(xué)到的訓(xùn)練數(shù)據(jù)樣本的特征進(jìn)行分辨,所以才造成這種問題。
5 總結(jié)
在本文和相關(guān)工作中,設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,從而獲得分類器模型的方法,并在肝穿刺圖像分類中取得了比較好的效果。在制作數(shù)據(jù)集的過程中,利用圖像的各種變換方式,獲取了一定數(shù)量的偽數(shù)據(jù);依據(jù)分類結(jié)果,給出病變程度的診斷。肝穿刺圖像的這種分類方法在現(xiàn)有數(shù)據(jù)中達(dá)到了預(yù)期的效果。
對比于傳統(tǒng)的依靠醫(yī)師主觀經(jīng)驗(yàn)進(jìn)行判別的診斷方法,本實(shí)驗(yàn)證明了采用卷積神經(jīng)網(wǎng)絡(luò)也可以進(jìn)行判別,且準(zhǔn)確率高于傳統(tǒng)方法的平均準(zhǔn)確率。在今后的研究工作中,會進(jìn)一步對卷積神經(jīng)網(wǎng)絡(luò)在圖像處理方面進(jìn)行探索、學(xué)習(xí)、研究,并在實(shí)際中加以應(yīng)用,繼續(xù)提升識別效果以及識別準(zhǔn)確率。
參考文獻(xiàn):
[1] 楊晶晶, 王騫, 宣曉華. 基于深度卷積神經(jīng)網(wǎng)絡(luò)算法的肺結(jié)節(jié)檢測模型[J]. 數(shù)學(xué)建模及其應(yīng)用, 2017(4).
[2] Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.
[3] Hatipoglu N, Bilgin G. Classification of histopathological images using convolutional neural network[C]// International Conference on Image Processing Theory, TOOLS and Applications. IEEE, 2015:1-6.
[4]張晴晴, 劉勇, 王智超,等. 卷積神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用[J]. 網(wǎng)絡(luò)新媒體技術(shù), 2014, 3(6):39-42.
[5]葉浪. 基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別研究[D]. 東南大學(xué), 2015.
[6] Park E, Han X, Berg T L, et al. Combining multiple sources of knowledge in deep CNNs for action recognition[C]// IEEE Winter Conference on Applications of Computer Vision. IEEE Computer Society, 2016:1-8.
[7]蔡國永, 夏彬彬, CAIGuoyong,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖文融合媒體情感預(yù)測[J]. 計(jì)算機(jī)應(yīng)用, 2016, 36(2):428-431.
[8] Murphy K, Van G B, Schilham A M, et al. A large-scale evaluation of automatic pulmonary nodule detection in chest CT using local image features and k-nearest-neighbourclassification[J]. Medical Image Analysis, 2009, 13(5):757-770.
[9]劉巖. 卷積神經(jīng)網(wǎng)絡(luò)在光學(xué)元件損傷檢測中的應(yīng)用[J]. 電腦知識與技術(shù), 2017, 13(4):178-182.
[10]周飛燕, 金林鵬, 董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)學(xué)報, 2017, 40(6):1229-1251.
[11]呂國豪, 羅四維, 黃雅平,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的正則化方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(9):1891-1900.
[12]許可. 卷積神經(jīng)網(wǎng)絡(luò)在圖像識別上的應(yīng)用的研究[D]. 浙江大學(xué), 2012.
[13] 陳先昌. 基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 浙江工商大學(xué), 2014.
[14]郭以河, 張閩峰, 孟家榕,等. 肝穿刺活檢標(biāo)本處理方法的改進(jìn)[J]. 臨床與實(shí)驗(yàn)病理學(xué)雜志, 2004, 20(6):747-748.
[15]徐成潤, 張閩峰, 鄭瑞丹,等. 4200例肝穿刺活檢組織病理與臨床分析[J]. 肝臟, 2008, 13(2):115-117.
[16]周春輝, 孫雷, 李曉楠,等. 127例乙型病毒性肝炎肝穿刺活檢結(jié)果的比較分析[J]. 臨床肝膽病雜志, 2005, 21(5):271-272.
【通聯(lián)編輯:唐一東】