范懷玉,馬軍山,劉玉堂,杜彩虹
(1.上海理工大學 光電信息與計算機工程學院,上海 200093;2.濟寧醫(yī)學院 醫(yī)學信息工程學院,山東 日照 276826)
近年來,乳腺癌已成為世界范圍內(nèi)導致女性死亡的主要原因[1],并且死亡率有逐年上升的趨勢。該病最好的預防和治療方法就是借助于乳腺X射線成像或者乳腺超聲等檢查工具,對可疑病灶早發(fā)現(xiàn)、早治療。乳腺X射線成像技術(shù)被稱為乳腺篩查的黃金標準,被廣泛應(yīng)用到乳腺檢查中,但是該技術(shù)不可避免地存在一個高假陽性率問題。研究者已經(jīng)發(fā)現(xiàn),經(jīng)由乳腺X射線成像技術(shù)檢出的腫塊中有超過60%的實為良性腫塊[2-3]。同時檢測費用較高并有一定的電離輻射。相比而言,乳腺超聲因其是一種費用低、非侵襲、可攜式以及多用途的檢測儀器,在早期的乳腺篩查中被廣泛應(yīng)用[4]。
隨著計算機技術(shù)的飛速發(fā)展和圖像處理技術(shù)的不斷完善,計算機輔助診斷( computer aided diagnosis,CAD)能夠幫助醫(yī)生提高診斷準確率,使得診斷更加高效、實用、智能和自動化[5-6]。在眾多超聲乳腺圖像處理方法中,圖像的分割是非常重要的一個關(guān)鍵環(huán)節(jié),分割結(jié)果不僅能夠提供給醫(yī)生一個更為直觀的判斷,而且為后續(xù)乳腺腫瘤的良惡性判別打下良好基礎(chǔ)。但是超聲圖像噪聲斑點多、對比度差、組織間的邊界模糊不清等不利因素,使得感興趣區(qū)域(the region of interests,ROI)的分割變得非常困難,經(jīng)常要借助于專家的手動分割,這不但費時費力,分割結(jié)果也依賴專家的經(jīng)驗,也就失去了CAD高效、智能和自動化的初衷。研究人員嘗試利用區(qū)域增長的方法來自動分割ROI,并取得了不錯的結(jié)果[7-8]。區(qū)域增長自動分割的關(guān)鍵一步就是種子點或者種子區(qū)域的選擇,如果選擇在腫瘤的外面,則分割結(jié)果注定是失敗的。為防止分割錯誤,在利用區(qū)域增長方法進行分割的時候,大都是提前人工手工選擇種子點。為使得超聲乳腺腫瘤區(qū)域分割完全的自動化,開展一種自動而又準確的種子點(或者區(qū)域)選擇的研究是很有必要的,目前在這方面開展的工作比較少[9]。文獻[10]提出了用灰度共生矩陣特征和游程特征的方法自動地選擇腫塊的種子點,如果種子點的所有游程特征和它的領(lǐng)域的點相等,則該點就被認作種子點。文獻[9]在利用超聲圖像的灰度信息的同時也利用了圖像的空間信息,計算出圖像灰度直方圖的所有局域最小值,設(shè)定閾值從最小的局域最小值開始增大,取出病變部分和背景部分,當目標區(qū)域和背景區(qū)域的比值大于等于0.1時,閾值不再增大,得到的連通區(qū)域在圖像中心位置的被認為是種子區(qū)域。雖然該方法的真陽性(true positive, TP)率達到了 9 5.24% 的良好結(jié)果,但是如果病變出現(xiàn)在圖像的其他位置,算法的魯棒性將會受到影響。本文根據(jù)超聲腫瘤圖像的結(jié)構(gòu)特點和灰度分布,對圖像進行不同閾值下的四叉樹分解,利用約束條件定位初始目標區(qū)域和臨時種子區(qū)域,當臨時種子區(qū)域在初始目標區(qū)域內(nèi)時,臨時種子區(qū)域即為要尋找的種子區(qū)域,再對種子區(qū)域內(nèi)的各點的灰度值進行排序,灰度值最小的點被認為是種子點。
因超聲醫(yī)學圖像灰度的對比度低、局部細節(jié)上沒有明顯的灰度差別等缺點[11],使得以原始灰度為目標的處理方法較為困難?;叶戎狈綀D均衡的圖像增強方法常用來對超聲醫(yī)學圖像進行增強[12]。其基本思想是把原始圖像的直方圖變換為均勻分布的形式,增加了像素灰度值的動態(tài)范圍從而可達到增強圖像整體對比度的效果。超聲乳腺圖像被直方圖均衡化后,圖像的灰度分布被歸一化到[0,1],結(jié)果如圖1所示。
正常的乳腺超聲圖像由淺至深可分五層結(jié)構(gòu):最外層為皮膚,厚2~3 mm,呈強回聲帶;第二層為皮下脂肪,呈低回聲,其內(nèi)可見三角形回聲,為CooPer韌帶聲像;第三層為腺體層,厚1.0 cm ± 3.0 cm,呈低回聲,其中夾雜有點狀及條狀回聲,為纖維組織、脂肪及導管結(jié)構(gòu);第四、五層為胸肌及肋間肌,一般易于分辨,呈條狀回聲[13]。腫瘤在超聲圖像中一般表現(xiàn)為低回聲區(qū),處于腺體層區(qū)域。
四叉樹數(shù)據(jù)結(jié)構(gòu)是一種對柵格數(shù)據(jù)的壓縮編碼方法[14]。該方法是將一幅圖像等分為四個子塊,并逐塊檢查子塊的灰度;如果某子塊內(nèi)所有的灰度值小于指定閾值,則這個子塊就不再繼續(xù)等分,否則,該子塊繼續(xù)分解為四個子塊,直到每個子塊的灰度值均小于指定閾值。在我們運用四叉樹方法對乳腺超聲圖像進行分解之前,先將圖像尺寸統(tǒng)一放縮為 5 12×512 ,閾值不同,圖像的分解程度不同,圖像將會被分解成 2 56×256 、128×128、 6 4×64 、 3 2×32 、 1 6×16 、 8 ×8 、 4 ×4 、2×2、 1 ×1 不同規(guī)格大小的子塊,子塊的規(guī)格、數(shù)量和位置會因圖像的灰度值分布不同而改變。在閾值一定的情況下,因腫瘤內(nèi)部、第四層和第五層的胸肌及肋間肌都屬于低回聲區(qū)域,該位置的圖像灰度值較小,并且灰度值變化相對平緩,規(guī)格較大的子塊會出現(xiàn)在此區(qū)域。而腫瘤邊緣和其他區(qū)域圖像的灰度值較大,且灰度值變化相對劇烈,該區(qū)域會出現(xiàn)規(guī)格較小的子塊。因此定位腫瘤區(qū)域就轉(zhuǎn)化為尋找規(guī)格最大的子塊。
對于不同超聲乳腺腫瘤圖像,要實現(xiàn)自動定位腫瘤區(qū)域進而在其內(nèi)部定位種子點,如何指定閾值是最為關(guān)鍵的環(huán)節(jié)。閾值太大,規(guī)格最大的子塊不只是包含腫瘤區(qū)域,為定位種子點帶來困難;閾值太小,分解后規(guī)格最大的子塊有可能不在腫瘤區(qū)域。超聲乳腺圖像被直方圖均衡化后,圖像的灰度分布被歸一化到[0,1],根據(jù)最大類間方差法,能求出每幅圖像的最佳閾值。由實驗結(jié)果可以得出,不同圖像的最佳閾值不同,但均處于[0.4,0.6]。為了能夠準確定位腫瘤區(qū)域,必須在此區(qū)間選定一個值,通過迭代使閾值動態(tài)變化,以滿足不同圖像定位腫瘤區(qū)域的需要。
設(shè)閾值為 T =0.5/2n-1(為自然數(shù)),算法的流程描述如下。
圖1 被均衡圖像的灰度變化Fig. 1 The grayscale changes of the equalized images
(3)如果臨時種子區(qū)域在初始目標區(qū)域內(nèi),則臨時種子區(qū)域即為要尋找的種子區(qū)域,對種子區(qū)域內(nèi)所有的點的灰度值進行大小排序,灰度值最小的點即為種子點位置。
否則,臨時種子區(qū)域變?yōu)槌跏寄繕藚^(qū)域。返回步驟(2)并賦值對圖像再次進行四叉樹分解,找到臨時種子區(qū)域。重復步驟(3)。
用105幅超聲乳腺腫瘤圖像(其中包括53幅惡性腫瘤圖像和52幅良性腫瘤圖像)來檢驗所提出的算法是否有效,這些圖像都經(jīng)過了組織活檢,均證實了其良惡性。所有圖像的處理均采用軟件MATLAB 2010,計算機的配置為英特爾處理器2.70 GHz和8 G內(nèi)存。
通過一幅超聲乳腺腫瘤圖像尋找種子點的過程來進一步說明我們提出的算法流程。
第一次分解,取閾值 T1=0.5 ,分解后圖像如圖2(a)所示,排除與圖像邊緣相連的子塊,最大子塊規(guī)格為 6 4×64 ,如圖中標示A的子塊,將其視為初始目標區(qū)域。重新對圖像進行第二次分解,閾值變?yōu)?T2=0.25 ,分解后圖像如圖2(b)所示,排除與圖像邊緣相連的子塊后,最大規(guī)格子塊( 3 2×32 )如圖中標示的B、C、D、E和F子塊,對這五個子塊分別計算其內(nèi)部所有點的灰度值之和,發(fā)現(xiàn)C子塊的灰度值之和最小,將其暫定為臨時種子區(qū)域。但臨時種子區(qū)域不在初始目標區(qū)域內(nèi)。根據(jù)算法流程的步驟(3),將臨時種子區(qū)域改為初始目標區(qū)域,第三次對圖像進行重新分解,閾值變?yōu)?T3=0.125 ,分解后圖像如圖2(c)所示,最大子塊共有29個,規(guī)格為 1 6×16 ,對所有該規(guī)格子塊(排除與圖像邊緣相連的子塊)分別計算其內(nèi)部所有點的灰度值之和,發(fā)現(xiàn)標示G的子塊的最小的灰度值之和最小,將其暫定為臨時種子區(qū)域。此時G子塊處于初始目標區(qū)域C子塊內(nèi),所以G子塊被認定為種子區(qū)域,對G子塊區(qū)域內(nèi)所有的點的灰度值進行大小排序,灰度值最小的點即為種子點位置,如圖2(d)標示星號的位置。在軟件MATLAB 2010環(huán)境下,每次分解后所有子塊的位置坐標均能獲知,亦即能夠得到種子點在圖像中的位置。實驗結(jié)果表明,良性腫瘤圖像因形狀規(guī)則、邊界清晰、邊緣光滑、內(nèi)部回聲均勻的特點,種子點均能夠定位在腫瘤內(nèi)部,而惡性超聲腫瘤圖像因形態(tài)不規(guī)則、邊緣呈毛刺狀、邊緣有浸潤、腫瘤內(nèi)部回聲欠均勻、后方回聲呈現(xiàn)衰減暗區(qū)等特點,使得我們的算法在對惡性腫瘤圖像進行種子點的選擇時,有六幅圖像定位在了腫瘤的外部。本文的方法和文獻[9]方法的性能如表1所示。
將種子點定位于腫瘤內(nèi)部,并且所消耗的時間少,以滿足實時在線分割的需求,也是我們設(shè)計算法的初衷。從圖像預處理到定位種子點整個過程所用時間如表2所示。用單一圖像來比較,手動定位更有優(yōu)勢,但是在連續(xù)定位多幅圖像的種子點時,我們提出的算法更為快捷。
在超聲乳腺腫瘤圖像中,腫瘤是單一目標,并且腫瘤內(nèi)部灰度變化較為平緩,腫瘤周圍灰度變化較為劇烈。正是利用了圖像的這一特征,通過四叉樹分解的算法能夠得到:在灰度變化劇烈的區(qū)域,圖像分裂得越厲害,塊的規(guī)格越小;反之,越是灰度較為均勻的區(qū)域,灰度變化平緩,分裂的塊的規(guī)格越大,從而實現(xiàn)了種子點的自動快速定位。在提出的算法中,要求腫瘤區(qū)域與圖像邊緣不相連接(無論它處在圖像的上部還是下部),其實只要是獲取超聲圖像的探頭位于腫瘤的正上方,這一要求就能得到滿足。通過對種子區(qū)域錯選在腫瘤區(qū)域之外的六幅圖像進行分析,我們發(fā)現(xiàn)腫瘤的下方均有明顯的、呈現(xiàn)衰減暗區(qū)的后方回聲,對于這種類型的圖像,即使種子區(qū)域選擇在腫瘤內(nèi)部,因有后方衰減暗區(qū)的存在,后續(xù)的區(qū)域增長也很難將腫瘤分割出來。這既是我們的算法的不足之處,也是我們下一步努力改進的方向。
圖2 定位種子點的流程示意圖Fig. 2 The process diagram of locating the seed
表1 算法的性能Tab. 1 Performance of the method
表2 定位圖像種子點各階段所消耗的時間Tab. 2 The consuming time in the stages for locating the seed piont in images