劉 美,周 龍
(武漢輕工大學(xué)電氣與電子工程學(xué)院,武漢 430023)
宮頸癌是影響婦女健康的重大疾病,在中國(guó),宮頸癌是導(dǎo)致女性死亡的第二大殺手,2020 年我國(guó)新發(fā)宮頸癌數(shù)量達(dá)到了11 萬(wàn),占全球總量的18%[1]。然而,宮頸癌是一種早期可以發(fā)現(xiàn)的腫瘤,開(kāi)展人群篩查是促進(jìn)宮頸癌早診早治的有效措施。宮頸癌篩查,包括婦科檢查、宮頸癌初篩、陰道鏡檢查、病理組織學(xué)檢查等流程,其中宮頸細(xì)胞學(xué)檢查是早期發(fā)現(xiàn)宮頸癌最簡(jiǎn)單、有效、方便的方式,且其準(zhǔn)確性較高,適用于宮頸癌的早期診斷、普查和預(yù)防[2]。宮頸細(xì)胞學(xué)診斷是基于細(xì)胞形態(tài)學(xué)對(duì)宮頸細(xì)胞進(jìn)行分類和統(tǒng)計(jì),是臨床上對(duì)宮頸癌診斷的依據(jù),醫(yī)學(xué)界稱之為巴氏涂片檢查。
傳統(tǒng)的巴氏涂片閱片方法是由病理醫(yī)師人工閱片,這種方法不僅效率低下,而且受限于病理醫(yī)生的主觀性和專業(yè)性,時(shí)不時(shí)會(huì)發(fā)生誤判和漏判。人工閱片的方法一方面需要消耗大量的人力物力,另一方面準(zhǔn)確率得不到保證,這就導(dǎo)致了我國(guó)基層宮頸癌篩查工作進(jìn)展緩慢,篩查質(zhì)量不高,因此應(yīng)用計(jì)算機(jī)輔助宮頸癌篩查是非常有必要的。
過(guò)去,計(jì)算機(jī)輔助系統(tǒng)中的宮頸細(xì)胞分類任務(wù)都是根據(jù)細(xì)胞核和細(xì)胞質(zhì)的形態(tài)學(xué)特征來(lái)分類。而這些特征的選取是依靠人工來(lái)篩選的,不同的方法篩選的特征不同。Marinakis 等[3]使用了基于遺傳算法的特征選擇和最近鄰分類來(lái)進(jìn)行巴氏涂片診斷; Kumar 等[4]設(shè)計(jì)了一個(gè)基于生物學(xué)可解釋特征的框架來(lái)分類癌癥;William 等[5]設(shè)計(jì)了一個(gè)模糊C 均值算法的宮頸癌輔助診斷工具。然而,這些手工設(shè)計(jì)的特征都有一些缺點(diǎn),因?yàn)樗鼈兓蚨嗷蛏贂?huì)受到特征或分類器選擇過(guò)程的影響。
人工智能(AI)技術(shù)正在改變當(dāng)今的醫(yī)療實(shí)踐現(xiàn)狀。人工智能可以應(yīng)用在各種各樣的任務(wù)中,George 等[6]將深度學(xué)習(xí)用于乳腺癌診斷;B?hland 等[7]用機(jī)器學(xué)習(xí)對(duì)甲狀腺癌進(jìn)行自動(dòng)分類; Song 等[8]對(duì)骨髓組織學(xué)的圖像進(jìn)行檢測(cè)和分類,許多人工智能應(yīng)用已經(jīng)達(dá)到了專家級(jí)的診斷準(zhǔn)確度。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)已被證明對(duì)醫(yī)學(xué)圖像分析處理中人工智能的成功具有重要意義。在宮頸細(xì)胞分類領(lǐng)域,近年來(lái)基于深度學(xué)習(xí)和CNN 的研究取得了很大進(jìn)展。研究人員發(fā)現(xiàn),CNN 可以作為特征提取工具,自動(dòng)提取深層特征,對(duì)宮頸細(xì)胞進(jìn)行分類。Zhang 等[9]將深度學(xué)習(xí)應(yīng)用在宮頸細(xì)胞圖片分類中,使用CNN 模型自動(dòng)提取宮頸細(xì)胞的深層特征,且無(wú)需事先分割;Plissiti 等[10]從細(xì)胞特征、圖片特征、深層特征三個(gè)方面出發(fā)探討了CNN 在輔助計(jì)算機(jī)檢測(cè)方面的可行性,并且提出了全新的宮頸細(xì)胞數(shù)據(jù)庫(kù)。在基礎(chǔ)上,Shanthi 等[11]用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建了預(yù)測(cè)模型,對(duì)宮頸癌進(jìn)行不同等級(jí)的分類;Shi 等[12]用圖神經(jīng)網(wǎng)絡(luò)對(duì)宮頸細(xì)胞進(jìn)行分割和分類,深刻地探索了各類宮頸細(xì)胞圖像之間的潛在關(guān)系,進(jìn)一步提高了分類性能。雖然上述方法在一定程度上提升了準(zhǔn)確率,但在宮頸癌診斷上,特異性和召回率還存在不足,用于醫(yī)療輔助診斷還需要進(jìn)一步提高指標(biāo)。
為了進(jìn)一步提高宮頸細(xì)胞診斷的準(zhǔn)確率和特異性,本文提出了基于遷移學(xué)習(xí)和標(biāo)簽平滑正則化損失函數(shù)的TLS-Net50 算法,在特征提取階段使用預(yù)訓(xùn)練參數(shù),使網(wǎng)絡(luò)能更好地學(xué)習(xí)到細(xì)胞特征,同時(shí)改進(jìn)了交叉熵?fù)p失函數(shù),使模型具有更好的泛化性和魯棒性。
TLS-Net50 總體框架如圖1 所示,首先對(duì)輸入的宮頸細(xì)胞圖像進(jìn)行預(yù)處理。預(yù)處理包括對(duì)圖像的裁剪縮放。之后輸入到模型中進(jìn)行特征提取,特征提取基于ResNet50 框架,其中卷積層的參數(shù)是通過(guò)遷移學(xué)習(xí)得到的,用卷積層提取圖像的深層特征。全連接層的參數(shù)則由SIPaKMeD 數(shù)據(jù)集進(jìn)行訓(xùn)練得到。在此基礎(chǔ)之上將原來(lái)的交叉熵?fù)p失函數(shù)進(jìn)行改變,在原來(lái)函數(shù)的基礎(chǔ)上加上一點(diǎn)噪聲,最后經(jīng)過(guò)softmax 函數(shù)進(jìn)行輸出,得到模型的預(yù)測(cè)結(jié)果。
圖1 TLS-Net50模型總體框架
遷移學(xué)習(xí)是指在其他大規(guī)模圖像數(shù)據(jù)集上預(yù)訓(xùn)練的深度學(xué)習(xí)模型的微調(diào)。深度學(xué)習(xí)需要大量有標(biāo)注的數(shù)據(jù),然而現(xiàn)實(shí)條件下無(wú)法獲得大量已標(biāo)注的數(shù)據(jù),因此考慮通過(guò)遷移學(xué)習(xí)的方法,將已有的知識(shí)遷移到目標(biāo)領(lǐng)域中,解決僅有少量已標(biāo)注樣本的學(xué)習(xí)問(wèn)題。ImageNet 是廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域的大型數(shù)據(jù)庫(kù),其中包含了100 萬(wàn)幅圖,共1000 個(gè)類別。因此,在ImageNet 數(shù)據(jù)庫(kù)預(yù)訓(xùn)練過(guò)的ResNet50 模型具有提取宮頸細(xì)胞深度特征的能力,尤其是卷積層具有充分的學(xué)習(xí)圖片邊緣和輪廓特征的能力。
經(jīng)過(guò)預(yù)處理后,我們用在ImageNet 數(shù)據(jù)庫(kù)上預(yù)訓(xùn)練過(guò)的ResNet50 的前幾個(gè)卷積層和池化層用作網(wǎng)絡(luò)的初始參數(shù),在此基礎(chǔ)之上對(duì)全連接層進(jìn)行隨機(jī)權(quán)重初始化。利用Sipakmed 數(shù)據(jù)集對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),就可以獲得融合了遷移學(xué)習(xí)的ResNet50模型。遷移學(xué)習(xí)的過(guò)程如圖2所示。
圖2 遷移學(xué)習(xí)
標(biāo)簽平滑是一種防止模型過(guò)擬合的正則化手段,在訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)模型時(shí)使用標(biāo)簽平滑的方法是很有效的[14]。標(biāo)簽平滑可以應(yīng)用在很多任務(wù)中,例如圖像分類、圖片分割、機(jī)器翻譯和語(yǔ)音識(shí)別,使用該方法可以提高深度學(xué)習(xí)模型的泛化性能和魯棒性。
在分類問(wèn)題中,常用one-hot(獨(dú)熱分布)對(duì)向量進(jìn)行編碼,編碼的標(biāo)簽向量yi為:
其中正確的類概率是1,不正確的類概率是0。在訓(xùn)練時(shí),模型最小化損失函數(shù)H(y,p):
其中,pi由模型前一個(gè)全連接層輸出的logits 向量z應(yīng)用Softmax函數(shù)得到:
在正常的獨(dú)熱向量編碼標(biāo)簽網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中,鼓勵(lì)模型估計(jì)目標(biāo)類別的概率接近1,非目標(biāo)類接近0。但是,如果訓(xùn)練數(shù)據(jù)不足以覆蓋所有情況,這不僅會(huì)導(dǎo)致網(wǎng)絡(luò)的過(guò)擬合還會(huì)降低模型的泛化能力,導(dǎo)致模型在預(yù)測(cè)集上表現(xiàn)不好。在數(shù)據(jù)集較少的情況下,使用交叉熵?fù)p失函數(shù)作為目標(biāo)函數(shù)不一定是最優(yōu)的。
因此考慮通過(guò)標(biāo)簽平滑正則化(Label Smooth Regularization,LSR)來(lái)優(yōu)化模型,LSR是通過(guò)在輸出y添加噪聲,實(shí)現(xiàn)對(duì)模型的預(yù)測(cè)概率的約束,降低模型過(guò)擬合程度的一種約束方法。運(yùn)用了標(biāo)簽平滑正則化策略后,我們用更新的標(biāo)簽向量來(lái)替換獨(dú)熱編碼的標(biāo)簽向量yhot:
其中K為多分類的類別總個(gè)數(shù),ε一般是一個(gè)較小的超參數(shù)(一般取0.1),即:
帶有標(biāo)簽平滑的交叉熵?fù)p失函數(shù)轉(zhuǎn)化為下面的公式:
這樣,標(biāo)簽平滑后的分布就相當(dāng)于往真實(shí)分布中加入了噪聲ε,避免模型對(duì)于正確標(biāo)簽過(guò)于“自信”,減少正確目標(biāo)和錯(cuò)誤目標(biāo)的概率的差距,從而避免過(guò)擬合,提高模型的泛化能力。
標(biāo)簽平滑一般用在以下三個(gè)場(chǎng)景中:
(1)數(shù)據(jù)集比較大,且圖片中包含噪音,加入標(biāo)簽平滑之后可以避免模型錯(cuò)誤地學(xué)習(xí)到圖片中的噪音。
(2)分類任務(wù)中不同種類圖片具有很高的相似度,比如宮頸細(xì)胞圖片分類中,有些圖片又像空泡細(xì)胞又像化生細(xì)胞,利用此策略可以給兩類都提供監(jiān)督效果。
(3)在模型比較小時(shí),為了避免模型被訓(xùn)練得太自信,這會(huì)導(dǎo)致過(guò)擬合,我們希望提高模型學(xué)習(xí)的難度,也會(huì)引入標(biāo)簽平滑。
本課題研究的情況符合標(biāo)簽平滑的使用場(chǎng)景,因此考慮引入標(biāo)簽平滑策略。
宮頸細(xì)胞識(shí)別模型框架主要利用遷移學(xué)習(xí)將ResNet50 經(jīng)過(guò)預(yù)訓(xùn)練的參數(shù)遷移到卷積層、池化層,然后將原來(lái)1000 分類的softmax 函數(shù)改成所需要的目標(biāo)分類函數(shù)(在此文中即五分類)。宮頸細(xì)胞識(shí)別模型的訓(xùn)練和測(cè)試流程如下:
(1)輸入樣本。從宮頸細(xì)胞數(shù)據(jù)庫(kù)中每種細(xì)胞圖片按9∶1 比例抽取訓(xùn)練集和驗(yàn)證集,將訓(xùn)練集樣本作為模型訓(xùn)練輸入。
(2)對(duì)輸入圖片進(jìn)行預(yù)處理。為了保證所有圖片輸入大小相同并且去除圖片中可能存在的噪音,對(duì)輸入的圖像統(tǒng)一進(jìn)行縮放和裁剪操作。在訓(xùn)練階段,將單個(gè)細(xì)胞圖像裁剪為224像素×224 像素大小,并且進(jìn)行歸一化處理,使特征圖像趨近于正態(tài)分布,加快模型的收斂和訓(xùn)練。
(3)構(gòu)建TLS-Net50 宮頸細(xì)胞識(shí)別模型?;赗esNet50[13]模型,優(yōu)化全連接層,將原來(lái)的分類器換成五分類輸出的分類器,這樣不僅可以減少模型學(xué)習(xí)和訓(xùn)練的參數(shù),還可以提升模型的識(shí)別效率。
(4)微調(diào)卷積層的參數(shù)。用Resnet50 經(jīng)過(guò)ImageNet 數(shù)據(jù)集預(yù)訓(xùn)練得到的參數(shù)通過(guò)遷移學(xué)習(xí)方式優(yōu)化TLS-Net50 模型參數(shù),主要是確定卷積層的權(quán)重、偏置等參數(shù)。
(5)訓(xùn)練模型。隨機(jī)初始化模型參數(shù),設(shè)定優(yōu)化器的學(xué)習(xí)率和訓(xùn)練輪數(shù),通過(guò)損失函數(shù)的反向傳播,凍結(jié)卷積層的參數(shù),訓(xùn)練全連接層的權(quán)重。
(6)加入標(biāo)簽平滑策略進(jìn)行訓(xùn)練。通過(guò)對(duì)損失函數(shù)進(jìn)行改正,使模型具有更好的泛化性,避免了模型的過(guò)擬合。
(7)模型測(cè)試。抽取訓(xùn)練集的圖片,作為測(cè)試樣本進(jìn)行模型測(cè)試,以驗(yàn)證模型的精度。
ResNet50 預(yù)訓(xùn)練模型的權(quán)重參數(shù)數(shù)量為25.5 M,計(jì)算量為4.1 G,其中全連接層參數(shù)集中度較高,ResNet50 的預(yù)訓(xùn)練參數(shù)是為1000 分類而設(shè)計(jì)的,而本模型只針對(duì)五個(gè)不同的類。因此本文將原來(lái)的全連接層改成五分類的輸出,這樣雖然稍微增加了模型的計(jì)算量,但是減少了模型的參數(shù),還提高了模型的效率和精度。改進(jìn)后的模型參數(shù)(params)與原來(lái)的模型參數(shù)和計(jì)算量(FLOPS)對(duì)比結(jié)果如表1所示。
表1 模型參數(shù)和計(jì)算量對(duì)比
TLS-Net50 模型的各層參數(shù)大體上與ResNet50一致。表2給出了模型每層的名稱,每層的輸入和輸出特征圖大小,以及每層的層結(jié)構(gòu)。可以看到本模型的一個(gè)標(biāo)志性特點(diǎn)就是特征圖的通道增加一倍時(shí),特征圖的寬高會(huì)縮小一倍,這是為了保證在堆疊網(wǎng)絡(luò)的過(guò)程中,網(wǎng)絡(luò)不會(huì)因?yàn)槔^續(xù)堆疊而產(chǎn)生退化。
表2 TLS-Net50模型各層設(shè)計(jì)
本實(shí)驗(yàn)所用的宮頸細(xì)胞數(shù)據(jù)集是來(lái)自希臘約阿尼納大學(xué)在2018 年發(fā)表的公開(kāi)數(shù)據(jù)集SIPaKMeD[10],該數(shù)據(jù)集包含了五種宮頸細(xì)胞,共4049 張從966 個(gè)Pap 涂片的細(xì)胞簇圖像中手工切分的孤立細(xì)胞圖像,每類細(xì)胞的示例如圖3 所示。
圖3 SIPaKMeD中的五種宮頸細(xì)胞圖像
可以看出五類宮頸細(xì)胞圖像形態(tài)各異,且它們?cè)诔墒?、衰老、癌變的過(guò)程中,其形態(tài)、大小都在發(fā)生著變化,因此可以根據(jù)每種細(xì)胞特異性的形態(tài)學(xué)特征進(jìn)行辨別。
該數(shù)據(jù)集包含4049 張孤立細(xì)胞圖像,其中有831 張淺中層細(xì)胞,787 張副基底層細(xì)胞,825 張空泡細(xì)胞,813 張角化不良細(xì)胞,793 張化生細(xì)胞。表3所示為五類細(xì)胞的訓(xùn)練集、驗(yàn)證集分布。
表3 SIPaKMeD宮頸細(xì)胞數(shù)據(jù)集
2.2.1 實(shí)驗(yàn)環(huán)境
本文所有實(shí)驗(yàn)結(jié)果均在同一實(shí)驗(yàn)環(huán)境下得出。實(shí)驗(yàn)環(huán)境如下:采用Intel(R)Core(TM)i5-6300HQ CPU @ 2.30GH 處理器,NVIDIA Ge-Force GTX 960M 顯卡,windows10 操作系統(tǒng),PyTorch=1.7.0+cu110 深度學(xué)習(xí)框架。編程語(yǔ)言為python3.6,相關(guān)程序依賴包有:numpy、skimage、matplotlib、tqdm 等,模型均訓(xùn)練30輪,采用Adam優(yōu)化器,學(xué)習(xí)率為0.0001。
2.2.2 評(píng)價(jià)指標(biāo)
以混淆矩陣為依據(jù)選取評(píng)價(jià)指標(biāo),混淆矩陣可以理解為下面一張表格,如表4所示,表中有四個(gè)基礎(chǔ)指標(biāo),分別是TP、TN、FP、FN,這四個(gè)指標(biāo)是評(píng)價(jià)模型的一級(jí)指標(biāo)。
表4 混淆矩陣
在分類任務(wù)中一般用ACC(準(zhǔn)確率)、Precison(查準(zhǔn)率)、Recall(查全率)、Specificity(特異度)、F1(綜合評(píng)價(jià)指標(biāo))來(lái)評(píng)價(jià)模型。查準(zhǔn)率和查全率是一對(duì)矛盾的度量,一般來(lái)說(shuō),查準(zhǔn)率高時(shí),查全率往往偏低;而查全率高時(shí),查準(zhǔn)率往往偏低。而F1 就是綜合了查準(zhǔn)率與查全率的加權(quán)調(diào)和平均值,F(xiàn)1 越高說(shuō)明模型查準(zhǔn)率查全率越好。計(jì)算公式如表5所示。
表5 評(píng)估指標(biāo)標(biāo)準(zhǔn)公式
為了證明本文算法的有效性,本文基于ResNet50 模型在測(cè)試集上做了相關(guān)的消融實(shí)驗(yàn),如表6 所示。下面的算法均以ResNet50 為基礎(chǔ),評(píng)價(jià)指標(biāo)為上文所提到的五類指標(biāo),其中TL 代表遷移學(xué)習(xí)(Transfer Learning),LS 代表標(biāo)簽平滑(Label Smooth)。可以看到,N2 模型在N1 的基礎(chǔ)上F1 值提升了4.6%左右;N3 相比N1,其準(zhǔn)確率、查準(zhǔn)率、查全率、特異度、綜合評(píng)價(jià)指標(biāo)均有大幅度提升,查準(zhǔn)率提升了8%,查全率提升了8.7%,F(xiàn)1 提升了8.5%。NA 為本文的TLS-Net50 算法,對(duì)比N3 又提高了1.8%、0.4%、0.5%、0.2%和0.6%。
表6 消融實(shí)驗(yàn)結(jié)果
通過(guò)消融實(shí)驗(yàn)可以知道,融合遷移學(xué)習(xí)和標(biāo)簽平滑策略可以在單獨(dú)使用的基礎(chǔ)上進(jìn)一步提升模型效果。因此可以看出,遷移學(xué)習(xí)和標(biāo)簽平滑策略是非常有用的。這也驗(yàn)證了本文算法在宮頸細(xì)胞識(shí)別領(lǐng)域的有效性。
為了進(jìn)一步分析不同模型對(duì)每一類宮頸細(xì)胞的識(shí)別結(jié)果,圖4 給出了N1、N2、N3、N4的混淆矩陣,混淆矩陣對(duì)角線代表著每類細(xì)胞被正確識(shí)別的數(shù)量??梢钥吹皆谒膫€(gè)模型中,副基底層細(xì)胞最好辨認(rèn),空泡細(xì)胞最難分類正確,且它和化生細(xì)胞有互被錯(cuò)分類的現(xiàn)象,化生細(xì)胞有一定的概率被錯(cuò)認(rèn)為淺中層細(xì)胞,角化不良細(xì)胞有時(shí)候被認(rèn)為是空泡細(xì)胞,淺中層細(xì)胞則有時(shí)被認(rèn)為是角化不良細(xì)胞。
圖4 N1、N2、N3、N4模型混淆矩陣
表7 是N4 模型在測(cè)試集上的表現(xiàn),對(duì)于五類不同的細(xì)胞,TLS-Net50 平均準(zhǔn)確率、查準(zhǔn)率、查全率、特異度、綜合評(píng)價(jià)指標(biāo)分別達(dá)到了98.0%、95.2%、95.0%、98.8 和95.1%,副基底層細(xì)胞和淺中層細(xì)胞被完全分類正確,而空泡細(xì)胞和化生細(xì)胞的準(zhǔn)確率稍低,說(shuō)明這兩類細(xì)胞具有較高的相似度,區(qū)分較為困難。
表7 測(cè)試集評(píng)估指標(biāo)
為了進(jìn)一步說(shuō)明本文算法對(duì)宮頸細(xì)胞分類的有效性,本文與其他的深度學(xué)習(xí)經(jīng)典算法進(jìn)行了對(duì)比,其中實(shí)驗(yàn)參數(shù)均設(shè)置一樣,實(shí)驗(yàn)結(jié)果如表8 所示。實(shí)驗(yàn)說(shuō)明了TLS-Net50 算法的良好性能,也說(shuō)明了TLS-Net50 在計(jì)算機(jī)輔助宮頸細(xì)胞檢測(cè)中的有效性。
表8 與其他算法的性能對(duì)比
為了更好地理解深度網(wǎng)絡(luò),可以將特征圖進(jìn)行可視化。卷積核在訓(xùn)練的過(guò)程中沒(méi)有對(duì)圖像的空間結(jié)構(gòu)進(jìn)行改變,因此直接將特征圖像素的值映射到0~255的范圍,就可以變成圖像。
本文對(duì)TLS-Net50 模型的特征圖進(jìn)行可視化,結(jié)果如圖5 所示。圖5(a)是第一個(gè)卷積層的前12 張?zhí)卣鲌D,從圖片可以看到,每個(gè)卷積核學(xué)習(xí)到的內(nèi)容都不一樣。從不同層可視化出來(lái)的特征圖可以看出,模型前面幾層網(wǎng)絡(luò)可以提取到圖片紋理、細(xì)節(jié)特征,模型后面的深層網(wǎng)絡(luò)提取的是細(xì)胞的輪廓、形狀等特征。一般來(lái)說(shuō),淺層網(wǎng)絡(luò)因?yàn)榫矸e的程度不高,可以學(xué)習(xí)到更多的特征,也包含有圖片的關(guān)鍵特征。例如第一組特征圖的第6張?zhí)卣鲌D,提取出的是細(xì)胞核邊緣。相對(duì)而言,層數(shù)越深,模型提取到的特征就越抽象。圖像的分辨率也會(huì)隨著卷積的操作而越變?cè)叫 ?/p>
圖5 TLS-Net50模型特征圖可視化(續(xù))
圖5 TLS-Net50模型特征圖可視化
這些經(jīng)過(guò)訓(xùn)練的卷積核包括各種頻率和方向的梯度以及不同的顏色斑點(diǎn),這是宮頸細(xì)胞分類任務(wù)所必需的。除了卷積核之外,還提供了池化、激活函數(shù)的示例單元的特征圖,可以觀察到池化操作總結(jié)了先前的特征,并且特征變得越來(lái)越抽象。
由圖片所示的各層顯示結(jié)果可以知道,卷積神經(jīng)網(wǎng)絡(luò)能夠有效地提取細(xì)胞的特征,說(shuō)明本算法通過(guò)遷移學(xué)習(xí)和標(biāo)簽平滑正則化能夠降低背景干擾、增強(qiáng)目標(biāo)特征。
針對(duì)計(jì)算機(jī)輔助診斷宮頸癌的需求,本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的宮頸細(xì)胞分類方法TLS-Net50。本文對(duì)ResNet50 模型進(jìn)行參數(shù)優(yōu)化和標(biāo)簽正則化,并通過(guò)實(shí)驗(yàn)驗(yàn)證,表明改進(jìn)后的模型可以自動(dòng)從圖像中學(xué)習(xí)到細(xì)胞特征,這樣就避免了常規(guī)方法中人工選取特征的不足。同時(shí),TLS-Net50 模型相對(duì)于ResNet50平均準(zhǔn)確率、查準(zhǔn)率、查全率、特異性、F1 值依次提高了3.7%、8.4%、9.2%、2.3%和9.1%,可以滿足計(jì)算機(jī)輔助診斷宮頸癌的需求。
此外,本文所用模型可以準(zhǔn)確地識(shí)別宮頸細(xì)胞的類型,并且減少了模型的參數(shù)量,可以在計(jì)算性能一般的硬件上進(jìn)行應(yīng)用,有利于基層宮頸癌篩查工作的展開(kāi)。