岳棟,鄭苗
1.濟(jì)寧醫(yī)學(xué)院附屬醫(yī)院泌尿外科,山東濟(jì)寧 272000;2.濟(jì)寧醫(yī)學(xué)院附屬醫(yī)院手術(shù)室,山東濟(jì)寧 272000
膀胱腫瘤是泌尿外科最常見(jiàn)的腫瘤,2018年全球報(bào)告了549 393例新發(fā)病例[1]。根據(jù)WHO2016年病理分級(jí)標(biāo)準(zhǔn),膀胱腫瘤分為乳頭狀瘤、低度惡性潛能乳頭狀瘤、低級(jí)別尿路上皮癌、高級(jí)別尿路上皮癌[2]。大約25%的尿路上皮癌被診斷為肌層浸潤(rùn)性膀胱癌(MIBC),預(yù)后較差[3]。高級(jí)別尿路上皮癌的治療方式為經(jīng)尿道膀胱腫瘤電切(TURBT)+放療+化療的三聯(lián)療法或根治性全膀胱切除聯(lián)合化療,嚴(yán)重影響患者生活質(zhì)量[4]。膀胱鏡檢查對(duì)于膀胱腫瘤的診斷、治療方式的選擇以及復(fù)查非常重要,但是膀胱鏡檢查的診斷準(zhǔn)確性因醫(yī)生的技能和經(jīng)驗(yàn)而有所不同,因此帶有一定的主觀性[5]。
當(dāng)前人工智能在計(jì)算機(jī)領(lǐng)域發(fā)展迅速,人工智能的核心是以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為代表的深度學(xué)習(xí),雖然利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行影像診斷已越來(lái)越多的應(yīng)用于醫(yī)學(xué)領(lǐng)域,但其在泌尿外科內(nèi)鏡下影像診斷領(lǐng)域的應(yīng)用尚處于起步階段[6-7]。
該研究收集了濟(jì)寧醫(yī)學(xué)院附屬醫(yī)院2019年4月—2020年4月收治的138例患者的713張圖像構(gòu)建深度學(xué)習(xí)數(shù)據(jù)集,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)膀胱鏡圖像訓(xùn)練,從而提高了膀胱腫瘤病理分級(jí)圖像識(shí)別能力,有助于提升膀胱鏡檢查的客觀性,為下一步手術(shù)治療方式的選擇提供依據(jù),現(xiàn)報(bào)道如下。
138例膀胱腫瘤標(biāo)本來(lái)源于濟(jì)寧醫(yī)學(xué)院附屬醫(yī)院門診膀胱鏡檢查患者,其中男性113例,女性25例;年齡25~89歲,平均64.2歲。按膀胱腫瘤病理分級(jí):乳頭狀瘤組34例,132張圖像;低度惡性潛能乳頭狀瘤組11例,66張圖像;低級(jí)別尿路上皮癌組36例,192張圖像;高級(jí)別尿路上皮癌組57例,323張圖像。9例行膀胱全切,1例行膀胱部分切除術(shù),其余患者行膀胱腫瘤電切術(shù)。標(biāo)本取活檢后,用10%福爾馬林固定后送至該院病理科行石蠟切片及免疫組化診斷。
根據(jù)病理結(jié)果將膀胱腫瘤圖像數(shù)據(jù)集分成4組文件夾進(jìn)行歸一化。處理過(guò)程使用python3.7.1,圖像設(shè)置:像素大小為100×100,格式為“jpg”。將圖像轉(zhuǎn)換成數(shù)組后根據(jù)文件名提取圖像標(biāo)簽:乳頭狀瘤圖像文件名前“0-”、低度惡性潛能乳頭狀瘤“1-”、低級(jí)別尿路上皮癌“2-”、高級(jí)別尿路上皮癌“3-”。
在python3.7.1通過(guò)Keras、TensorFlow構(gòu)建類似于VGG模型的卷積神經(jīng)網(wǎng)絡(luò)。包括輸入層、卷積層、池化層、全連接層、輸出層。引入代碼如下:from keras.utils import np_utils;from keras.models import Sequential;from keras.layers.core import Dense,Dropout,Activation,Flatten;from keras.optimizers import SGD,RMSprop,Adam;from keras.layers import Conv2D,MaxPooling2D。
基本參數(shù)如下:激活函數(shù)“ReLU”,輸出層激活函數(shù)“softmax”,優(yōu)化器算法采用“SGD”,損失函數(shù)“categorical_crossentropy”,指標(biāo)列表設(shè)置為metrics=['accuracy'],采用梯度下降法,迭代“Batch_Size=10”、“epochs=10”。
訓(xùn)練并保存權(quán)重文件,測(cè)試數(shù)據(jù)集結(jié)果以損失函數(shù)、準(zhǔn)確度顯示。
膀胱乳頭狀瘤或低度惡性潛能乳頭狀瘤多呈濾泡樣或水草樣,瘤體上無(wú)血流或血流很少,帶蒂、蒂窄;低級(jí)別尿路上皮癌呈葡萄樣,蒂較寬,血流較豐富;高級(jí)別尿路上皮癌呈乳頭樣或塊狀,瘤體表面常有壞死,一般無(wú)蒂,血流豐富,常有粗大血管與瘤體相連。見(jiàn)圖1。
圖1 A:乳頭狀瘤;B:低度惡性潛能乳頭狀瘤;C:低級(jí)別尿路上皮癌;D:高級(jí)別尿路上皮癌
將所有膀胱鏡圖像歸一化為計(jì)算機(jī)能夠識(shí)別的像素大小100×100,格式為“jpg”。見(jiàn)圖2。
搭建類似于VGG模型的卷積神經(jīng)網(wǎng)絡(luò),圖像經(jīng)過(guò)卷積、池化、全連接層后輸出。見(jiàn)圖3。
圖3 將膀胱腫瘤圖像輸入類似于VGG模型的卷積神經(jīng)網(wǎng)絡(luò)
膀胱腫瘤作為泌尿系統(tǒng)最常見(jiàn)的腫瘤,從發(fā)病機(jī)制、診斷及治療上都是研究的熱點(diǎn)[8-11]。膀胱腫瘤治療方式大部分為外科手術(shù),但是采用何種手術(shù)方式,最主要的決策依據(jù)就是膀胱鏡檢查結(jié)果,對(duì)于低級(jí)別尿路上皮癌或乳頭狀瘤考慮行經(jīng)尿道膀胱腫瘤電切術(shù),高級(jí)別尿路上皮癌一般建議行新輔助化療聯(lián)合根治性膀胱切除術(shù)[12-13]。目前膀胱癌免疫治療尤其是以PD1/PDL1免疫檢查點(diǎn)抑制劑開(kāi)始應(yīng)用于臨床[14-15]。對(duì)于膀胱腫瘤,再行膀胱鏡檢查時(shí)有時(shí)因?yàn)榛顧z取的標(biāo)本表淺造成對(duì)惡性程度低估,電切后發(fā)現(xiàn)實(shí)際惡性程度較高,短期內(nèi)造成腫瘤復(fù)發(fā)、轉(zhuǎn)移,給患者及臨床醫(yī)師帶來(lái)很大困擾。為了盡可能對(duì)膀胱腫瘤進(jìn)行病理分級(jí)準(zhǔn)確判斷,該研究中引入了卷積神經(jīng)網(wǎng)絡(luò)模型,通過(guò)在570個(gè)膀胱腫瘤圖像訓(xùn)練數(shù)據(jù)集上進(jìn)行深度學(xué)習(xí)后進(jìn)行測(cè)試,正確識(shí)別膀胱腫瘤病理分級(jí)的準(zhǔn)確率49%,相比較日本筑波大學(xué)學(xué)者采用GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)腫瘤的良惡性進(jìn)行分類的結(jié)果并通過(guò)ROC曲線對(duì)采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行效果評(píng)價(jià),在測(cè)試數(shù)據(jù)集中的敏感性為89.7%,特異性為94.0%。造成這種情況的原因首先日本學(xué)者均采用最新型號(hào)奧林巴斯鏡頭,圖像清晰度明顯優(yōu)于該研究,其次該研究的測(cè)試結(jié)果不僅判斷膀胱腫瘤良惡性,還要對(duì)惡性程度分級(jí),這就造成該研究的測(cè)試數(shù)據(jù)集準(zhǔn)確度低于國(guó)外同行。
2012年Krizhevsky等提出的卷積神經(jīng)網(wǎng)絡(luò)AlexNet在ImageNet的訓(xùn)練集上取得了圖像分類的冠軍,使得卷積神經(jīng)網(wǎng)絡(luò)成為計(jì)算機(jī)視覺(jué)中的重點(diǎn)研究對(duì)象。2014年牛津大學(xué)提出VGG模型,獲得當(dāng)年ILSVRC (ImageNet large scale visual recognition challenge)競(jìng)賽的亞軍[16-17]。由于VGG模型在遷移學(xué)習(xí)及從圖像中提取CNN特征中的表現(xiàn)要優(yōu)于冠軍googLeNet,而且VGG模型采用3×3的小卷積核以及2×2的小池化核能夠?qū)W⒂谟?xùn)練特征本身,從而大大減少了計(jì)算時(shí)間和內(nèi)存需求。
卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)領(lǐng)域尤其是影像學(xué)方面廣泛應(yīng)用,其原因在于圖像數(shù)據(jù)集獲取相對(duì)便利,如臨床中大量使用的CT、MRI以及神經(jīng)成像和胸腹部成像均可建立數(shù)據(jù)集,最近有學(xué)者嘗試將卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于前列腺癌的診斷和放療部位的預(yù)測(cè),取得良好的效果;國(guó)外有學(xué)者利用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)胸部CT圖像進(jìn)行自動(dòng)分析,對(duì)肺炎進(jìn)行早期、快速診斷[18];對(duì)于內(nèi)鏡診斷方面,日本有學(xué)者將CNN模型與67名胃鏡醫(yī)師對(duì)140例患者2 940張圖像進(jìn)行了診斷能力比較,發(fā)現(xiàn)CNN的敏感性為58.4%,特異性為87.3%,67名胃鏡檢查人員中,分別為31.9%、97.2%,CNN的敏感度明顯高于胃鏡醫(yī)師。
該研究的優(yōu)勢(shì)在于不僅能夠區(qū)分膀胱腫瘤良惡性,而且能夠?qū)盒猿潭冗M(jìn)行病理分級(jí),有利于克服主觀因素,由于該研究的測(cè)試結(jié)果不僅判斷膀胱腫瘤良惡性,還要對(duì)惡性程度分級(jí),所以造成該研究的測(cè)試數(shù)據(jù)集準(zhǔn)確度低于國(guó)外同行,但考慮到卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果快速,一般幾分鐘,而包含免疫組化的病理診斷需要3~5 d,這就為臨床醫(yī)師手術(shù)方案的選擇提供更早的決策,因此對(duì)指導(dǎo)臨床有很大意義。然而,這項(xiàng)研究有局限性:首先,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集一般有百萬(wàn)級(jí)別的圖像供計(jì)算機(jī)訓(xùn)練識(shí)別,而該研究的訓(xùn)練樣本數(shù)少,而且膀胱鏡下如果出血或尿液混濁,成像質(zhì)量會(huì)受影響,建立的CNN模型可靠性較低,另外在該研究中,用于訓(xùn)練和測(cè)試數(shù)據(jù)集的只有靜態(tài)圖像,如果使用opencv采集視頻圖像可能更有利于提高CNN的診斷識(shí)別能力。該文下一步準(zhǔn)備擴(kuò)大樣本量,對(duì)膀胱鏡圖像采集盡量建立統(tǒng)一標(biāo)準(zhǔn),提高圖像清晰度,減少計(jì)算機(jī)識(shí)別中的誤差,另外,該研究針對(duì)腎癌、腎盂癌等泌尿外科手術(shù)視頻圖像進(jìn)行研究,采用計(jì)算機(jī)視覺(jué)分析模式,以便更好地增強(qiáng)術(shù)者術(shù)中判斷識(shí)別能力,為術(shù)中臨床決策提供依據(jù)。
綜上所述,該研究為膀胱腫瘤提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)模型的診斷方法,對(duì)膀胱腫瘤病理分級(jí)具有一定的準(zhǔn)確性,為臨床治療方式的選擇提供依據(jù)。