韓超,朱麗娜,劉想,劉偉鵬,張曉東,王霄英
圖1 納入研究對象的流程圖。TURP:經(jīng)尿道前列腺切除術(shù)。
良性前列腺增生(benign prostate hyperplasia,BPH)、前列腺炎和前列腺癌是影響男性健康和生活質(zhì)量的泌尿系統(tǒng)常見疾病,這三種疾病常常合并存在,在癥狀、體征和實驗室檢查結(jié)果上有一定交叉,不易鑒別,并且多數(shù)情況需要長期隨訪和多次檢查。
在前列腺疾病的長期隨訪過程中,前列腺特異性抗原(prostate specific antigen,PSA)是最常用的實驗室檢查指標(biāo),當(dāng)PSA<4 ng/mL時前列腺癌的可能性較小,而PSA>10 ng/mL時臨床應(yīng)高度懷疑前列腺癌的可能。但BPH和前列腺炎等前列腺良性病變也會導(dǎo)致PSA結(jié)果的異常,一些PSA衍生指標(biāo)也有助于進一步鑒別前列腺癌與其他前列腺疾病。臨床上最受認可的PSA衍生指標(biāo)是前列腺特異性抗原密度(prostate specific antigen density,PSAD)[1],這個指標(biāo)是將PSA和前列腺體積(prostate volume,PV)進行綜合評價得到。因此,測量前列腺體積、計算PSAD用于鑒別診斷也是影像檢查的任務(wù)。
常規(guī)MRI或超聲檢查都可以提供前列腺體積的測量值。前列腺影像報告和數(shù)據(jù)系統(tǒng)(prostate imaging-reporting and data system,PI-RADS)等國際指南對前列腺三維徑線,即左右(transverse,RL)徑、前后(anteroposterior,AP)徑和上下(longitudinal,SI)徑的測量有明確的指導(dǎo)[2]。獲得徑線測量值后,利用橢圓公式計算前列腺體積。但是在實際臨床工作中,醫(yī)師手工測量前列腺徑線比較耗時、步驟單一。因此實現(xiàn)前列腺三維徑線的自動測量,不僅能減少醫(yī)師不必要的簡單勞動,且能縮短報告時間。
近年來,隨著人工智能(artificial intelligence,AI)在影像醫(yī)學(xué)領(lǐng)域的廣泛研究和應(yīng)用[3-5],通過機器學(xué)習(xí)(machine learning)或深度學(xué)習(xí)(deep learning),利用前列腺多參數(shù)磁共振成像(multiparametric MRI,mpMRI)實現(xiàn)前列腺腺體的自動分割[6-8]和前列腺癌的計算機輔助診斷(computer-aided diagnosis,CAD)[9-11]已基本成為現(xiàn)實。我科已實現(xiàn)在前列腺T2WI上使用U形全卷積神經(jīng)網(wǎng)絡(luò)(U-shaped fully convolutional neural network,U-Net)進行腺體分割[8]。本研究利用臨床實際病例,以影像醫(yī)師手工測量的結(jié)果為參照,對基于U-Net的前列腺自動分割和徑線自動測量的準確性進行驗證, 探索此模型植入臨床工作流程的可行性。
本研究獲得本院倫理審查委員會的批準。將2018年10月7日-2019年4月28日在本院行前列腺多參數(shù)(multi-parameter,mp)-MRI檢查的291例連續(xù)病例的影像和報告納入分析,最終篩選出符合研究要求的病例共130例(圖1)。
U-Net自動分割模型是一個U形全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional neural network,F(xiàn)CN),通過在各卷積層的網(wǎng)絡(luò)體系結(jié)構(gòu)中進行上下文信息的跨層連接,實現(xiàn)精確的逐像素預(yù)測分類。在既往研究中,本單位已訓(xùn)練了分割模型,利用163例患者的前列腺T2WI圖像進行驗證,分割前列腺整體的Dice系數(shù)為92.7%±4.2%[12],模型的輸出結(jié)果被認為達到臨床要求[8]。在此基礎(chǔ)上,運用最小體積包圍盒(minimum volume bounding box)算法自動獲得前列腺徑線[13],并與結(jié)構(gòu)式報告對接,軟件分割和計算結(jié)果自動返回到前列腺PI-RADS結(jié)構(gòu)式報告中[14,15]。
圖2 前列腺徑線的2種測量方法的操作步驟(圖a~c為自動測量,圖d~e為醫(yī)師手工測量)。a)在T2WI上由U-Net模型分割得到前列腺的外輪廓;b)用最小體積包圍盒包圍三維前列腺后得到長方體的長、寬和高;c)將測量值自動填寫到報告中;d)根據(jù)PI-RADS指南要求,手工測量前列腺的三維徑線;e)手工錄入到報告中。
實現(xiàn)上述功能的模型在臨床實際病例中的運行過程:在前列腺T2WI每一層圖像上,利用U-Net分割模型自動分割出前列腺外輪廓(圖2a),通過多層輪廓的累加獲得前列腺三維圖像(圖2b)。在前列腺三維圖像的基礎(chǔ)上,運用最小體積包圍盒的算法規(guī)則,得到長方體的長、寬和高分別作為前列腺的RL、AP和SI徑(圖2c)。
以前列腺PI-RADS結(jié)構(gòu)式報告中獲取的前列腺徑線值作為參照標(biāo)準。此徑線值由實際臨床工作中一線報告醫(yī)師根據(jù)PI-RADS[2]的要求測量前列腺各個徑線得到(圖2d),RL徑在橫軸面T2WI前列腺最大層面上進行測量,AP徑和SI徑在正中矢狀面T1WI上測得,填寫到結(jié)構(gòu)式報告內(nèi)(圖2e)。測量結(jié)果由二線醫(yī)師審核,并最終記錄下來。將結(jié)構(gòu)式報告中記錄的徑線數(shù)據(jù)導(dǎo)出為Excel表,作為評價軟件測量結(jié)果的金標(biāo)準。
應(yīng)用SPSS 22.0及Medcalc 15.8軟件進行統(tǒng)計學(xué)分析。正態(tài)分布的計量資料以平均值±標(biāo)準差(mean±SD)表示。采用配對樣本t檢驗比較兩種測量結(jié)果的差異,以P<0.05為差異有統(tǒng)計學(xué)意義。使用Bland-Altman散點圖分析評估軟件自動測量和醫(yī)師手工測量結(jié)果的一致性,置信區(qū)間取95%。
基于130例患者的前列腺T2WI圖像,U-Net分割模型均成功實現(xiàn)前列腺的自動分割,并且自動測得前列腺的RL、AP和SI值。
既往前列腺結(jié)構(gòu)式報告醫(yī)師手工測量徑線的數(shù)據(jù)中,有1例數(shù)據(jù)結(jié)果異常,測得的RL、AP和SI徑分別為43.5、30.3和33.5 cm,信息偏倚較大,剔除此例,因此納入其余129例的前列腺徑線數(shù)據(jù)進行后續(xù)分析。
兩種測量方法所測得的前列腺各徑線結(jié)果見表1。對于前列腺RL徑,軟件自動測量和醫(yī)師手工測量結(jié)果之間的差異無統(tǒng)計學(xué)意義(P>0.05),而對于前列腺AP和SI徑,兩種方法的測量結(jié)果之間的差異有統(tǒng)計學(xué)意義(P<0.05)。
表1 兩種測量方法獲得的前列腺徑線值 (cm)
圖3 軟件自動測量和醫(yī)師手工測量結(jié)果的Bland-Altman散點圖。a~c)分別為兩種不同測量方法所得前列腺RL、AP和SI徑測量值的Bland-Altman散點圖。Bland-Altman散點圖中X軸為兩種測量結(jié)果的平均值,Y軸為測量結(jié)果的差異值。實線代表兩次測量結(jié)果差值的均數(shù),極上、極下兩條虛線代表95%置信區(qū)間的上下限。
運用Bland-Altman 散點圖分析一致性(圖3),顯示兩種測量方法得到的前列腺RL、AP及SI徑測量值的一致性均較高,僅4.65%的數(shù)據(jù)位于95%置信區(qū)間之外。
其中RL徑測量結(jié)果的一致性最好,而SI徑測量結(jié)果的一致性最差。對于RL徑的測量,兩種方法的平均差異值為0.0 cm,95%置信區(qū)間為-1.6~1.5 cm,并且差異值分布相對集中,集中于0.0 cm附近。對于SI徑的測量,95%置信區(qū)間為-2.1~1.7 cm,差異值分散。
另外,軟件自動測量得到的前列腺AP徑與醫(yī)師手工測量值的差值多數(shù)為正值,說明軟件自動測得的AP徑值較醫(yī)師手工測量普遍偏大。
PV的測量對于前列腺疾病的診斷、鑒別和隨訪有重要作用。針對前列腺癌患者,mpMRI提供的定性診斷和定量測量結(jié)果均是影像檢查價值的體現(xiàn)。檢出可疑的臨床顯著癌用于指導(dǎo)穿刺或監(jiān)測腫瘤變化,提供體積測量值可以用于計算PSAD。在特定人群中,PSAD和PI-RADS評分結(jié)合的臨床價值優(yōu)于單獨PI-RADS評分。在穿刺前,將PASD與MRI檢查結(jié)果相結(jié)合可提高PI-RADS評分的陰性預(yù)期值,提高除外前列腺臨床顯著癌的能力,可以安全地避免20%不必要的活檢[16]。在確診前列腺癌后,對患者主動監(jiān)測(active surveillance),將PSAD與MRI結(jié)果相結(jié)合用于風(fēng)險分層,可避免不必要的活檢,且并不漏檢Gleason分級為4級(Gleason pattern 4)的前列腺癌[17]。大量研究結(jié)果證實,對前列腺癌患者做出精準治療決策時,PI-RADS評分和PSAD指標(biāo)均應(yīng)被納入風(fēng)險分層模型中[18],因此臨床測量前列腺體積是必要的。PSAD的參考價值受PSA值的影響。當(dāng)血清總PSA正?;蚝芨邥r,PSAD等衍生指標(biāo)參考價值不大;在PSA 為4~20 ng/mL時,PSAD對BPH、前列腺炎和前列腺癌有一定鑒別作用。
PV測量對BPH患者提供了客觀指標(biāo),不僅用于制定治療計劃、監(jiān)測療效,也對手術(shù)方式的選擇提供一定信息[19-21]。例如對繼發(fā)于BPH的下尿路癥狀患者,前列腺體積較大時(>40 mL)推薦使用5-α還原酶抑制劑,前列腺體積較小時(<30 mL)則推薦使用α-腎上腺素受體阻滯劑。前列腺手術(shù)的選擇很多,包括消融、經(jīng)尿道切除、微創(chuàng)手術(shù)和開放前列腺根治切除等,其中前列腺體積是選擇手術(shù)方法的重要參考,對機器人手術(shù)特別重要。因此,前列腺大小在前列腺MR影像報告中是必報告內(nèi)容之一。當(dāng)然,僅僅測量前列腺整個腺體的體積信息量尚不足,在有條件的情況下分割前列腺不同區(qū)帶的體積進行測量,其臨床價值應(yīng)該更大,這也是AI工具進一步研發(fā)的方向之一。
目前臨床上測量PV的方法主要為B超或mpMRI,在圖像上測量RL、AP和SI徑后,運用橢圓公式(PV=RL×AP×SI×0.52)計算得到[2],此三維徑線的測量是對前列腺大小的大致評估。體積測量的驗證也可以用手術(shù)標(biāo)本或體模進行,在本單位既往做過類似的嘗試,但不適用于本研究。首先,掃描體模獲得的MR圖像與活體盆腔MR圖像的性質(zhì)不同,分割體模的深度學(xué)習(xí)模型不能直接用于人體圖像的預(yù)測。另外,也可以用排水法測量根治手術(shù)切除的前列腺標(biāo)本,但是根治手術(shù)范圍并非完全按照MR圖像所示的前列腺區(qū)域切除,所以圖像上測量的體積和排水法測量的體積不能完全對應(yīng)。因此前列腺體積測量的臨床研究中,在MR圖像上勾畫輪廓測量體積被認為是最可行的方法,準確性優(yōu)于其它臨床技術(shù)[22]。再者,目前臨床工作中橢圓公式的使用符合指南,實際臨床過程中PSAD主要由橢圓公式所得體積計算得到,PSAD閾值相關(guān)研究也是由橢圓公式而來。因此,我們目前對前列腺分割后三維徑線自動測量的臨床植入進行了驗證。
在臨床研究中,使用軟件進行在體臟器的體積測量,其金標(biāo)準的定義常常是有局限性的。目前多數(shù)對前列腺分割的研究,是以有經(jīng)驗醫(yī)師手工勾畫的前列腺輪廓作為金標(biāo)準[23],既往研究結(jié)果證明不同經(jīng)驗的醫(yī)師勾畫準確性基本相似,因此在訓(xùn)練分割模型時,我們亦選擇了以有經(jīng)驗醫(yī)師手工分割的前列腺輪廓作為金標(biāo)準[8]。本研究另外關(guān)注的重點為自動測量模型在臨床前列腺大小測量實際工作中的應(yīng)用價值,研究目的為此徑線測量模型是否可以達到醫(yī)師手工測量的水平,從而減少醫(yī)師的簡單重復(fù)工作的勞動量;因此,我們選擇實際臨床工作中醫(yī)師手工測量的前列腺三維徑線為參考標(biāo)準,觀察此模型植入臨床工作的“自動化”能力,將模型表現(xiàn)與醫(yī)師真實工作場景中的表現(xiàn)做比較。雖然不同醫(yī)生針對同一個前列腺的徑線測量結(jié)果變異較大,但從患者人群整體平均水平來看,多個醫(yī)師測量的大量數(shù)據(jù)的平均準確性是大致相似的。因此雖然本研究的金標(biāo)準是有瑕疵的,但是尚可接受。
應(yīng)用此U-Net自動分割+自動測量模型軟件獲得的徑線值,可被自動返回到前列腺PI-RADS結(jié)構(gòu)式報告中,替代了醫(yī)師手工測量的過程,其精確度在臨床上是可接受的。在 “真實工作場景”前提下,此自動分割和自動測量的模型有三方面的優(yōu)勢:節(jié)省工作時間,提高一致性,減少低級錯誤。首先,將此模型植入到臨床工作中,在結(jié)構(gòu)式報告中自動填寫前列腺徑線的測量值,可節(jié)省醫(yī)師寫報告的時間。醫(yī)師測量徑線的過程中,要調(diào)閱MR圖像的各個序列,找到合適的層面,放置ROI等,還需要把測量值手工錄入到報告模板中相應(yīng)的位置,平均至少花費約1 min。而軟件自動測量可以認為對醫(yī)師的時間成本幾乎為0。其次,在前列腺隨訪過程中的多次MR檢查都需要測量徑線得到PV,醫(yī)師很難保證每次測量的一致性,而模型的表現(xiàn)基本是穩(wěn)定的[24]。最后,手工錄入結(jié)果時,可能發(fā)生抄寫錯誤、數(shù)據(jù)單位錯誤等情況,而模型自動錄入則不會發(fā)生這種情況。本實驗收集的130例入組病例,軟件自動成功測得全部病例的三維徑線值,而在導(dǎo)出的醫(yī)師手工測量值中有1例患者的數(shù)值標(biāo)注的單位是錯誤的。軟件自動測量可以避免這種人工較難避免的因粗心而導(dǎo)致的誤差,從而保證數(shù)據(jù)的完整性和穩(wěn)定性。
本研究有一定局限性。首先,本研究只驗證了模型自動測量前列腺三維徑線的臨床植入結(jié)果,前列腺體積仍需從橢圓公式而來。顯然,對于因重度增生或前列腺癌引起前列腺形變嚴重的情況,橢圓公式有局限性。既往有研究嘗試在手工勾畫前列腺外緣得到前列腺立體圖形的基礎(chǔ)上,以體素×體素數(shù)的方法來精確測量前列腺體積[25],未來可嘗試利用AI自動分割替代手工勾畫來研究精確的體積測算方法。另外,目前的分割模型還未實現(xiàn)前列腺前纖維基質(zhì)帶、移行帶、外周帶和中央帶四個帶的精細分割,分帶PSAD的研究可能為前列腺癌的檢出及隨訪提供新思路。
綜上所述,基于U-Net的前列腺分割和徑線自動測量是準確的,與真實臨床工作場景下醫(yī)師測量的表現(xiàn)相近。將模型結(jié)果自動返回到前列腺PI-RADS結(jié)構(gòu)式報告中,可能提高影像科醫(yī)師的工作效率,減少不必要的低級錯誤,未來應(yīng)進一步推廣驗證。