韓勇森,韓寶三,孫京文,宋成利,閆士舉*
(1.上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海 200093;2.上海交通大學(xué)醫(yī)學(xué)院附屬新華醫(yī)院普外科,上海 200092)
在歐美,前列腺癌(prostate cancer,PCa)是一種常見(jiàn)的惡性腫瘤,死亡率僅次于肺癌[1]。早期診斷PCa對(duì)于患者意義重大。超聲引導(dǎo)下經(jīng)直腸穿刺活檢是診斷PCa的金標(biāo)準(zhǔn),由于我國(guó)前列腺穿刺活檢陽(yáng)性率較低,導(dǎo)致部分患者接受不必要的穿刺活檢[2]。隨著計(jì)算機(jī)輔助診斷(computer assisted diagnosis,CAD)技術(shù)快速發(fā)展,有學(xué)者[3-5]進(jìn)行了基于MRI的PCa CAD模型的研究。
圖1 數(shù)據(jù)分析流程
目前基于前列腺圖像特征的診斷模型多采用方差、偏度等灰度統(tǒng)計(jì)特征[6],基于灰度共生矩陣(gray level co-occurrence,GLCM)等常規(guī)紋理特征[7]及基于局部二值化模式(local binary pattern,LBP)的紋理特征[8]。而前列腺圖像中,正常組織與病灶區(qū)域有較明顯差異,僅通過(guò)局部紋理特征不能全面反映前列腺圖像特性。LBP算法可有效描述圖像的紋理特征,但對(duì)噪聲及光照的變化較敏感[9]。局部三元模式(local ternary pattern,LTP)紋理特征則能夠有效彌補(bǔ)LBP紋理的缺點(diǎn)[10]。傳統(tǒng)LTP算法中,自定義閾值雖然無(wú)法保證適用于所有樣本,卻能使其充分反映組織的局部紋理特征[11]。研究[7]發(fā)現(xiàn)GLCM等常規(guī)紋理特征算法可較充分地提取紋理特征;Gao等[12]研究發(fā)現(xiàn),方差、偏度、第10百分位數(shù)等灰度統(tǒng)計(jì)特征在PCa的診斷中有較高價(jià)值。本研究擬采用三維空間自適應(yīng)閾值LTP紋理特征(正、負(fù)兩類特征)、常規(guī)紋理特征(39個(gè))、灰度統(tǒng)計(jì)特征(4個(gè))族群融合的方法診斷PCa,探討其提高PCa診斷準(zhǔn)確率的可行性。
1.1 一般資料 采用國(guó)際光學(xué)和光子學(xué)會(huì)、美國(guó)物理學(xué)家協(xié)會(huì)和國(guó)家癌癥研究所聯(lián)合發(fā)起的醫(yī)療影像識(shí)別競(jìng)賽PROSTATEx數(shù)據(jù)庫(kù)中的182例患者圖像,其中PCa 83例,非PCa 99例。根據(jù)前列腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(prostate imaging reporting and data system,PI-RADS)2.0[13]要求,本研究選取T2WI、DWI、ADC圖像進(jìn)行聯(lián)合分析。因外周帶為PCa的高發(fā)區(qū)域,本研究以外周帶PCa為研究對(duì)象。
1.2 方法 基本步驟:①對(duì)三維T2WI、DWI、ADC圖像進(jìn)行分割,提取外周帶區(qū)域;②于3種圖像分別提取外周帶的空間自適應(yīng)LTP紋理特征、常規(guī)紋理特征、灰度統(tǒng)計(jì)特征,利用ADC圖像計(jì)算第10% ADC值;③分別利用Adaboost[14]算法對(duì)局部紋理特征、常規(guī)紋理特征、灰度統(tǒng)計(jì)特征3個(gè)特征族群以及其融合后的特征進(jìn)行分類,獲得每個(gè)族群的診斷得分。數(shù)據(jù)分析流程見(jiàn)圖1。
1.2.1 圖像分割 因自動(dòng)化分割難以保證圖像精度[15],故采用手動(dòng)分割,首先在T2WI上進(jìn)行,再將分割結(jié)果配準(zhǔn)到DWI、ADC圖像(圖2)。
1.2.2 特征提取 提取3種序列圖像的前列腺外周帶局部紋理特征、常規(guī)紋理特征及灰度統(tǒng)計(jì)特征。在LTP算法中加入閾值區(qū)間以及-1值模式,將[-t,+t]區(qū)間內(nèi)的鄰域差值編碼為0,大于該區(qū)間的編碼為1,小于該區(qū)間的編碼為-1。算子鄰域權(quán)值T(mi,mc,t)的計(jì)算公式為:
圖2 前列腺軸位MRI分割和LTP算法圖譜 A.前列腺外周帶區(qū)域;B.前列腺外周帶分割;C.自適應(yīng)LTP算法正模式圖譜;D.自適應(yīng)LTP算法負(fù)模式圖譜
(1)
其中t為自定義閾值,mi表示鄰域值,mc表示鄰域中心值。LTP算子[16]權(quán)值的編碼方式與LBP算子編碼方式類似,冠狀位的編碼過(guò)程見(jiàn)圖3。
原始的3×3鄰域LBP編碼,因鄰域與中心像素距離有差別,難以準(zhǔn)確計(jì)算鄰域像素與中心像素的位置關(guān)系。Ojala等[17]提出了圓形LBP編碼,利用圓域代替方域。圓域編碼方式是在半徑為R的圓上選取P個(gè)像素點(diǎn),以最大限度地捕捉像素點(diǎn)的信息,圓域LTP算子特征提取精度公式為:
(2)
其中,g表示權(quán)值T的符號(hào)。LTP算法對(duì)噪聲的對(duì)抗性強(qiáng),對(duì)光照變化有較強(qiáng)均衡能力,使LTP特征的分類能力提高,但無(wú)法保證t值適用于所有樣本。采用自適應(yīng)LTP算法,依據(jù)鄰域像素值與中心像素的離散度確定相應(yīng)閾值,離散度隨不同鄰域的變化而變化,將離散度作為自適應(yīng)閾值,可量化中央像素值與其鄰域像素值之間的關(guān)系。計(jì)算步驟為:①計(jì)算中心點(diǎn)xc在(P,R)鄰域內(nèi)的對(duì)比度值,
Δxi=xi-xc,(i=0,1,...,P-1)
(3)
其中xi表示鄰域值,xc表示鄰域中心值;
②計(jì)算鄰域的平均對(duì)比度:
(4)
其中△xi是各鄰域像素值與中心點(diǎn)像素值的差值,P是鄰域點(diǎn)數(shù);
③通過(guò)鄰域的對(duì)比度和差值計(jì)算鄰域的波動(dòng)程度V,即方差:
(5)
④利用計(jì)算所得V定義離散度(σ):
(6)
離散度σ反應(yīng)靈敏,可隨鄰域變化而變化,在樣本類內(nèi)的離散度一般具有穩(wěn)定性。因此,自適應(yīng)LTP算法不僅保留了傳統(tǒng)LTP算法的優(yōu)勢(shì),并且針對(duì)自定義閾值的局限性,解決了閾值普適性問(wèn)題,適用于復(fù)雜的前列腺圖像,有助于進(jìn)一步提高識(shí)別精度。自適應(yīng)LTP算法正、負(fù)模式圖譜見(jiàn)圖2C、2D,LTP算子編碼見(jiàn)圖3。
1.2.3 特征融合 采用特征降維方法優(yōu)化數(shù)據(jù),但未對(duì)研究結(jié)果有所改善,故對(duì)原始數(shù)據(jù)進(jìn)行分析。對(duì)特征數(shù)據(jù)均采用標(biāo)準(zhǔn)化方法,將不對(duì)稱數(shù)據(jù)標(biāo)準(zhǔn)化到0~1之間。數(shù)據(jù)中不同特征往往具有不同的量綱和量綱單位,標(biāo)準(zhǔn)化可消除這種影響[18],使數(shù)據(jù)之間具有可比性。對(duì)不同的圖像特征進(jìn)行融合,可實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),提高診斷精度。本研究將標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行融合,LTP紋理特征、常規(guī)紋理特征與灰度統(tǒng)計(jì)特征3個(gè)特征族群共同用于Adaboost算法訓(xùn)練,進(jìn)行下一步的特征分類。
1.2.4 特征分類 采取Adaboost分類算法,該算法對(duì)Boost算法進(jìn)行了調(diào)整,可糾正通過(guò)弱學(xué)習(xí)獲得的弱分類器的錯(cuò)誤。通過(guò)將多個(gè)弱分類器組合成強(qiáng)分類器,可較明顯地提高分類精度。本研究在特征分類階段采用留一法(leave-one-out,LOO)[19]對(duì)分類結(jié)果進(jìn)行交叉驗(yàn)證。
采用WEKA軟件[20]實(shí)現(xiàn)機(jī)器學(xué)習(xí),對(duì)數(shù)據(jù)進(jìn)行分類訓(xùn)練,得出分類分?jǐn)?shù)并作為潛在的圖像標(biāo)記,用于診斷PCa。使用ROC曲線計(jì)算各特征族群診斷PCa的AUC。
表1 T2WI、DWI、ADC紋理特征與LTP融合紋理特征診斷PCa的效能
表2 不同特征族群診斷PCa的效能
圖3 LTP算子編碼
圖4 不同紋理特征及融合特征診斷PCa的ROC曲線 A.單個(gè)圖像序列的LTP紋理特征與3個(gè)圖像序列LTP紋理特征融合診斷PCa;B.融合特征診斷PCa
本研究采用T2WI、DWI、ADC圖像提取的LTP局部紋理特征、常規(guī)紋理特征、灰度統(tǒng)計(jì)特征,分別通過(guò)Adaboost算法訓(xùn)練出分類器,同時(shí)使用該算法獲得3個(gè)特征族群融合后的分類器,對(duì)PCa的診斷效能見(jiàn)表1。將3個(gè)序列LTP紋理特征融合后,AUC為0.79±0.04,診斷準(zhǔn)確率79.67%(145/182)。不同序列的LTP紋理特征診斷結(jié)果見(jiàn)圖4A。
從3個(gè)序列圖像提取的常規(guī)紋理特征、灰度統(tǒng)計(jì)特征及本文提出的方法診斷PCa的效能見(jiàn)表2,融合特征后的診斷效能見(jiàn)圖4B,融合特征診斷PCa的AUC為0.87±0.04,診斷PCa的特異度、敏感度、準(zhǔn)確率分別為88.89%(88/99)、86.75%(72/83)、87.91%(160/182)。
根據(jù)PI-RADS 2.0的要求,本研究提出了一種基于T2WI、DWI、ADC圖像,分別在3個(gè)序列提取空間自適應(yīng)LTP紋理特征、常規(guī)紋理、灰度統(tǒng)計(jì)特征3個(gè)特征族群,并將3個(gè)特征族群融合的PCa風(fēng)險(xiǎn)診斷模型,利用Adaboost算法對(duì)單個(gè)特征及融合后的特征進(jìn)行分類,基于分類性能探索該模型診斷PCa的效能。本研究方法所得診斷PCa的AUC、敏感度、特異度、準(zhǔn)確率相對(duì)于既往研究[7,12]均有一定程度提高,提示其為診斷PCa的一種有效方法。
本研究基于新的融合特征模型預(yù)測(cè)PCa的效能均高于單一特征分類的預(yù)測(cè)效果,有助于提高診斷PCa的效能。但本研究采用特征提取算法運(yùn)行效率較低,存在一定局限性,有待進(jìn)一步探討。
中國(guó)醫(yī)學(xué)影像技術(shù)2019年5期