李 雪 石中月 楊志明 龐文博 金木蘭*
(1.首都醫(yī)科大學(xué)附屬北京朝陽(yáng)醫(yī)院病理科,北京 100020; 2. 深思考人工智能機(jī)器人科技(北京)有限公司,北京 100085)
宮頸癌和乳腺癌是全世界婦女中最常見(jiàn)的兩大惡性腫瘤,全球每年新發(fā)宮頸癌患者約50萬(wàn)例,死亡超過(guò)26萬(wàn)例,約80%的患者集中于經(jīng)濟(jì)欠發(fā)達(dá)的發(fā)展中國(guó)家[1]。據(jù)統(tǒng)計(jì),全球每年宮頸癌新發(fā)病例約52萬(wàn),其中我國(guó)有近15萬(wàn),每年有2萬(wàn)~3萬(wàn)婦女死于宮頸癌。近年來(lái),我國(guó)宮頸癌發(fā)病及病死率呈上升趨勢(shì),且發(fā)病年齡出現(xiàn)年輕化趨勢(shì)[2]。
目前宮頸液基薄層細(xì)胞檢測(cè)(thinprep cytologic test,TCT)是宮頸癌篩查的重要手段,但宮頸細(xì)胞學(xué)閱片人員較為匱乏,難以滿(mǎn)足目前宮頸癌篩查的需求。國(guó)際上有關(guān)宮頸癌篩查的質(zhì)量保證指南中規(guī)定,細(xì)胞技術(shù)人員每天要對(duì)玻片進(jìn)行最大官方工作量限制,范圍在25至80例之間[3]。此外,受閱片人員疲勞,技能水平不足和主觀因素的影響,人工判讀結(jié)果假陰性率高達(dá)10%;癌前病變的靈敏度約65%,特異度約90%[4-5]。
隨著人工智能(artificial intelligence,AI)技術(shù)的發(fā)展和該技術(shù)在醫(yī)療影像領(lǐng)域的廣泛應(yīng)用,人工智能可將圖像中的色彩紋理等人眼難以捕捉的信息形成特征數(shù)據(jù)呈現(xiàn)出來(lái),通過(guò)結(jié)合細(xì)胞分割、細(xì)胞分類(lèi)等算法,并融合病理醫(yī)師的閱片技巧,實(shí)現(xiàn)宮頸癌計(jì)算機(jī)輔助篩查系統(tǒng),將其應(yīng)用于巴氏涂片[6]、液基細(xì)胞學(xué)中,可顯著提高工作效率,減輕閱片人員工作量,對(duì)于宮頸癌早期篩查有著重大的意義。本研究比較了人工智能輔助篩查系統(tǒng)和常規(guī)細(xì)胞學(xué)鏡下閱片中的宮頸癌前病變檢出情況,以探討人工智能輔助篩查在宮頸液基薄層細(xì)胞學(xué)檢查中的應(yīng)用價(jià)值。
選取2019年1 月至2019年8 月首都醫(yī)科大學(xué)附屬北京朝陽(yáng)醫(yī)院婦科門(mén)診和體檢門(mén)診收集到的1 000例有明確診斷結(jié)果的TCT涂片進(jìn)行研究。
宮頸細(xì)胞液基薄層涂片均按照美國(guó)新柏氏公司TCT檢測(cè)儀的說(shuō)明采樣,用特制的宮頸刷收集宮頸外口和頸管脫落的細(xì)胞,將收集的細(xì)胞洗入盛有ThinPrep細(xì)胞保存液的小瓶中[7]。專(zhuān)業(yè)病理醫(yī)師采用鏡下閱片方式進(jìn)行細(xì)胞學(xué)診斷,人工智能宮頸癌輔助篩查系統(tǒng)采用數(shù)字化宮頸涂片后智能閱片。
為驗(yàn)證人工智能輔助篩查在宮頸液基薄層細(xì)胞學(xué)檢查中的價(jià)值,采用目前國(guó)際廣泛使用的TBS 2014分級(jí)系統(tǒng)[8]進(jìn)行細(xì)胞學(xué)診斷。診斷結(jié)果具體描述為:①未見(jiàn)上皮內(nèi)病變或惡性細(xì)胞(negative for intraepithelial lesion or malignancy, NILM);②意義不明的非典型鱗狀細(xì)胞(atypical squamous cells of undetermined significance,ASC-US);③不典型鱗狀細(xì)胞,不能排除高度上皮內(nèi)病變的不典型鱗狀細(xì)胞(atypical squa-mous cells, cannot exclude HSIL,ASC-H);④低度鱗狀上皮內(nèi)病變(low grade squamous intra-epithelial lesion,LSIL);⑤高度鱗狀上皮內(nèi)病變(high grade squamous intraepithelial lesion,HSIL);⑥鱗狀細(xì)胞癌(squamous cell carcinoma,SCC);⑦未明確診斷意義的非典型腺癌(adenocarcinoma glandular carcinoma,AGC),其中ASC-US及以上認(rèn)定為陽(yáng)性涂片。
1 000例涂片分別采用病理醫(yī)師人工篩查、深思考公司研發(fā)的人工智能輔助篩查以及人工智能輔助分析基礎(chǔ)上病理醫(yī)師復(fù)查,并對(duì)比分析采用三種篩查方式篩查宮頸癌的結(jié)果。
人工篩查團(tuán)隊(duì)由3名具有10年以上宮頸細(xì)胞學(xué)閱片經(jīng)驗(yàn)的病理醫(yī)師組成。在人工智能輔助篩查的基礎(chǔ)上,病理醫(yī)師復(fù)查閱片中判斷結(jié)果不一致的涂片,以病理醫(yī)師的復(fù)查閱片的結(jié)果為準(zhǔn)。
醫(yī)學(xué)輔助診斷系統(tǒng)的評(píng)價(jià)方法一般是比較系統(tǒng)分析結(jié)果和醫(yī)師診斷的患者真實(shí)病情,目前通常將診斷結(jié)果分為4類(lèi): 真陰性(true negative,Tn),患者的真實(shí)情況為沒(méi)有病變,系統(tǒng)診斷為無(wú)病變;假陰性(false negative,F(xiàn)n),患者的真實(shí)情況為有病變,系統(tǒng)診斷為無(wú)病變;真陽(yáng)性(true positive,Tp),患者的真實(shí)情況為有病變,系統(tǒng)診斷為有病變;假陽(yáng)性(false positive,F(xiàn)p):患者的真實(shí)情況為沒(méi)有病變,系統(tǒng)診斷為有病變。
人工智能輔助篩查系統(tǒng)的性能可以通過(guò)準(zhǔn)確率(accuracy,ACC),特異度(specificity, SPE)和靈敏度(sensibility, SEN)等[9-11]指標(biāo)進(jìn)行度量。SPE是衡量系統(tǒng)準(zhǔn)確診斷為陰性的能力,是真陰性與陰性樣本數(shù)量的比率;SEN是衡量系統(tǒng)準(zhǔn)確診斷為陽(yáng)性的能力,是真陽(yáng)性與陽(yáng)性樣本數(shù)量的比率。
采用SPSS 14.0統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,組間比較采用χ2檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。以原始病理的診斷結(jié)果為標(biāo)準(zhǔn),評(píng)估人工智能輔助篩查技術(shù)與病理診斷的靈敏度和特異度等指標(biāo)。
從表1中可以看出,病理醫(yī)師篩查結(jié)果和人工智能輔助篩查結(jié)果均接近于標(biāo)準(zhǔn)樣片,但由于病理專(zhuān)家對(duì)各分級(jí)樣本的評(píng)判標(biāo)準(zhǔn)不同,在一定程度上存在樣本定級(jí)的分歧;相比較而言,人工智能輔助篩查雖然對(duì)NILM有部分錯(cuò)檢,但可以保證各陽(yáng)性樣本的準(zhǔn)確定級(jí),經(jīng)由病理醫(yī)師對(duì)人工智能輔助篩查的結(jié)果進(jìn)行復(fù)核閱片,AI+醫(yī)師共同閱片分析可以保證病例樣本的精準(zhǔn)分級(jí)。
表1 宮頸細(xì)胞學(xué)檢查結(jié)果對(duì)比
AI: artificial intelligence;NILM: negative for intraepithelial lesion or malignancy;ASC-US: atypical squamous cells of undetermined significance;ASC-H: atypical squamous cells, cannot exclude HSIL;LSIL: low grade squamous intraepithelial lesion;HSIL: high grade squamous intraepithelial lesion;SCC: squamous cell carcinoma;AGC: adenocarcinoma glandular carcinoma.
與病理醫(yī)師人工篩查相比,使用人工智能輔助篩查之后再由病理醫(yī)師進(jìn)行復(fù)核的診斷結(jié)果差異具有統(tǒng)計(jì)學(xué)意義(χ2=2.009,P=0.04)。
通過(guò)對(duì)表1的數(shù)據(jù)進(jìn)一步的統(tǒng)計(jì)和分類(lèi),根據(jù)TBS 2014分級(jí)系統(tǒng)細(xì)胞學(xué)診斷標(biāo)準(zhǔn),ASC-US、ASC-H、LSIL、HSIL、AGC被認(rèn)為陽(yáng)性,NILM和微生物感染被認(rèn)為是陰性。
同時(shí),對(duì)假陰性和假陽(yáng)性進(jìn)行統(tǒng)計(jì)的結(jié)果顯示,人工智能輔助篩查結(jié)果中假陽(yáng)性為22例,即AI診斷結(jié)果會(huì)在一定范圍內(nèi)造成部分假陽(yáng)性病例,詳見(jiàn)表2。但從表1中可知,這部分結(jié)果多數(shù)存在于ASC-US,同時(shí),假陰性0例。
表2 宮頸細(xì)胞學(xué)診斷結(jié)果對(duì)比
AI: artificial intelligence.
此外,在病理醫(yī)師的篩查結(jié)果中,有4例涂片被認(rèn)定為真陰性,但在人工智能輔助篩查的結(jié)果中認(rèn)定為陽(yáng)性,經(jīng)復(fù)檢的病理醫(yī)生對(duì)上述4例涂片進(jìn)行重新閱片并查閱人類(lèi)乳頭瘤病毒(human papillomavirus,HPV)檢驗(yàn)結(jié)果,發(fā)現(xiàn)其中3例(圖1A、B)為陽(yáng)性漏診,1例為人工智能輔助閱片系統(tǒng)誤診,將基底層細(xì)胞誤判為陽(yáng)性細(xì)胞(圖1C)。
圖1 深思考人工智能輔助篩查與人工閱片結(jié)果不一致的涂片
在人工智能輔助下,病理醫(yī)師對(duì)1 000例樣本的診斷準(zhǔn)確率可以達(dá)到99.80%,并且靈敏度高達(dá)100%。詳見(jiàn)表3 。
表3 宮頸細(xì)胞學(xué)靈敏度與特異度指標(biāo)
AI: artificial intelligence.
本研究中,人工篩查閱片經(jīng)由3名病理醫(yī)師分別閱片300余例,共同完成1 000 例的人工篩查的閱片工作,3名病理醫(yī)師人工篩查共計(jì)耗時(shí)3.5 d,人工智能輔助篩查系統(tǒng)僅用20 h 內(nèi)即可完成1 000例的閱片工作。詳見(jiàn)表4。
表4 宮頸細(xì)胞學(xué)篩查閱片時(shí)間對(duì)比
#A pathologist works 8 h per day, while AI assistance analysis system can work 24 h continuously;AI: artificial intelligence.
宮頸癌長(zhǎng)期以來(lái)嚴(yán)重威脅婦女的生命健康,定期進(jìn)行宮頸病變的篩查,及早發(fā)現(xiàn)和治療早期宮頸癌及癌前病變,是降低宮頸癌發(fā)病率和病死率的重要手段。幾乎100%的宮頸癌由HPV所引起,傳統(tǒng)的巴氏涂片假陰性率較高,這是由于取材時(shí)80%以上的細(xì)胞流失,且涂片細(xì)胞過(guò)厚、重疊,過(guò)多的黏液、血液或炎性反應(yīng)細(xì)胞的混雜影響了診斷。但采用HPV DNA作為篩查靶標(biāo)仍然存在特異度較低的缺陷,宮頸細(xì)胞學(xué)檢查是目前宮頸癌篩查的主要方法,降低了傳統(tǒng)細(xì)胞學(xué)涂片的假陰性率,有效提高了宮頸病變?cè)\斷的靈敏度。
婦女發(fā)展綱要(2011-2020)要求宮頸癌篩查覆蓋率需達(dá)到80%,基于我國(guó)女性人口總數(shù)約6.5億,30%的女性從來(lái)沒(méi)有進(jìn)行過(guò)篩查的事實(shí)基礎(chǔ),目前篩查率遠(yuǎn)低于這一水平。受限于有經(jīng)驗(yàn)的專(zhuān)業(yè)病理醫(yī)師的人數(shù)不足,以及閱片效率太低,使得篩查率短期內(nèi)難以進(jìn)一步提升。
本研究結(jié)果表明,人工智能輔助篩查可以降低假陽(yáng)性,而且不會(huì)造成假陰性的出現(xiàn),幫助病理醫(yī)師減少漏診,在人工智能輔助下,病理醫(yī)師診斷準(zhǔn)確率可以達(dá)到99.80%,并且靈敏度高達(dá)100%,說(shuō)明人工智能輔助篩查是可依賴(lài)的。本研究實(shí)驗(yàn)數(shù)據(jù)表明,在人工智能輔助篩查的基礎(chǔ)上由專(zhuān)業(yè)病理醫(yī)師復(fù)核的方式,宮頸癌篩查效率能夠提高4倍以上,同時(shí),由于人工智能篩查能夠自動(dòng)分割和識(shí)別液基涂片上細(xì)胞的病變區(qū)域和類(lèi)型,真正實(shí)現(xiàn)了宮頸細(xì)胞學(xué)智能化閱片,讓診斷醫(yī)生將精力集中于診斷細(xì)胞,而不是尋找細(xì)胞,這極大地節(jié)省了醫(yī)生的精力。
本研究中發(fā)現(xiàn)的1例病例由人工智能輔助閱片系統(tǒng)誤診為陽(yáng)性細(xì)胞,經(jīng)病理醫(yī)生復(fù)診為基底層細(xì)胞或修復(fù)細(xì)胞,這可能是因?yàn)榛讓蛹?xì)胞核漿比較高,被人工智能誤認(rèn)為是病變細(xì)胞,這提示人工智能在正確鑒別基底層細(xì)胞和病變細(xì)胞方面仍需改進(jìn)。
綜上所述,相比于傳統(tǒng)的病理醫(yī)師篩查方式,人工智能輔助篩查具有高靈敏度與特異度,即對(duì)于識(shí)別度較低、人眼難以區(qū)分的樣例,能夠有效地規(guī)避漏檢的風(fēng)險(xiǎn)。在宮頸細(xì)胞學(xué)輔助篩查中采用TCT、人工智能宮頸癌輔助篩查系統(tǒng)聯(lián)合篩查,可提高診斷準(zhǔn)確率,提高工作效率,為治療宮頸癌提供診斷依據(jù),值得臨床推廣。