楊雙
(桂林航天工業(yè)學(xué)院 電子信息與自動化學(xué)院,廣西 桂林 541004)
近年來,分子標(biāo)志物在膠質(zhì)瘤診斷中的應(yīng)用越來越廣泛。常用于腦膠質(zhì)瘤診斷的分子標(biāo)記物主要包括IDH1/2、TERT、1p/19q等[1]。其中1p/19q共缺失狀態(tài)實際上是對一種染色體變異的描述,具體是指1號染色體短臂和19號染色體長臂同時缺失。1p/19q共缺失最早發(fā)現(xiàn)于少突膠質(zhì)細(xì)胞瘤樣本中,在少突膠質(zhì)細(xì)胞瘤中的發(fā)生率為80%~90%。2016年WHO最新分布的中樞神經(jīng)系統(tǒng)腫瘤分類中,把少突膠質(zhì)細(xì)胞瘤分為少突膠質(zhì)細(xì)胞瘤(WHO-II級)及間變性少突膠質(zhì)細(xì)胞瘤(WHO-Ⅲ級),又根據(jù)有無IDH1/2基因突變和1p/19q的缺失,把少突膠質(zhì)細(xì)胞瘤和間變性少突膠質(zhì)細(xì)胞瘤分為IDH突變型、1p/19q缺失型及未另行說明型[2-3]。同時,中國膠質(zhì)瘤診療共識和NCCN指南中都已經(jīng)明確納入了1p/19q共缺失指標(biāo)。因此,檢測1p/19q是否共缺失在診斷少突膠質(zhì)細(xì)胞瘤及判斷患者預(yù)后方面有著重要意義[4-6]。
目前實驗室檢測1p/19q共缺失狀態(tài)的方法主要有熒光原位雜交(fluorescent in situhybridization,FISH)[7]、基于雜合性缺失分析的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)[8]、陣列比較基因組雜交(CGH)和二代測序(NGS)[9]。其中使用熒光原位雜交(FISH)方法進(jìn)行檢測的方法檢測成本較低,在臨床診療中易于實現(xiàn),是大多數(shù)醫(yī)療機構(gòu)所采用的檢測方式。該方法具體的主要檢測原理是:1p/19q 缺失探針采用橘紅色染料標(biāo)記1號染色體短臂p36區(qū)域,采用綠色染料標(biāo)記1號染色體長臂q25區(qū)域;采用橘紅色染料標(biāo)記19號染色體長臂q13區(qū)域,采用綠色染料標(biāo)記19號染色體短臂p13區(qū)域[10],所獲得的熒光原位雜交圖像如圖1所示。
在臨床診療中,對于1p/19q熒光原位染色圖進(jìn)行細(xì)胞計數(shù)及細(xì)胞上紅、綠點進(jìn)行計數(shù),并統(tǒng)計一定量細(xì)胞中紅綠點的比例,再根據(jù)1p/19q的判定準(zhǔn)則獲取1p/19q共缺失的狀態(tài)[11]。這一過程主要由病理科醫(yī)生人工計數(shù)和統(tǒng)計,由于計數(shù)量較大,FISH圖像的成像質(zhì)量參差不一,細(xì)胞粘連情況普遍發(fā)生,因而這項工作的人工成本較大,工作效率不高。
近年來,由于計算機輔助診療的應(yīng)用,對于臨床醫(yī)療中復(fù)雜度較高,識別難度較大的工作希望能借助計算機的計算能力和數(shù)字圖像處理能力來實現(xiàn),以期在提高醫(yī)生工作效率的同時,提升疾病的診斷效率和正確率。鑒于此,利用數(shù)字圖像處理對1p/19q熒光原位染色圖像進(jìn)行細(xì)胞的自動計數(shù)工作具有較高的臨床醫(yī)療輔助意義。
圖1 1p/19q原位熒光染色圖示例
由于大多數(shù)的熒光染色圖像中,藍(lán)色通道的圖像是細(xì)胞圖像結(jié)果,現(xiàn)有的針對熒光染色圖像中細(xì)胞的計數(shù)工作通常將圖像中細(xì)胞分割后再進(jìn)行聚類統(tǒng)計的方法來進(jìn)行計數(shù)。這類操作主要采取的步驟是:首先分離熒光染色圖像的藍(lán)色通道,即RGB通道中的B通道。對藍(lán)色通道的圖像進(jìn)行二值化處理和形態(tài)學(xué)處理(例如:孔填充、偽影去除等操作),再利用聚類算法進(jìn)行聚類,得到初步的細(xì)胞區(qū)域,最后通過相應(yīng)的非橢圓形和邊界區(qū)域抑制操作后進(jìn)行細(xì)胞核計數(shù)[12]。
但是,根據(jù)圖1中的1p/19q 圖像示例,可以獲知,細(xì)胞常常存在團簇粘連現(xiàn)象,單獨分離的細(xì)胞并不多見,由于多個細(xì)胞粘連在一起,通過上述操作后往往存在團簇細(xì)胞無法分離的現(xiàn)象,這就導(dǎo)致了細(xì)胞自動計數(shù)的誤判率較高,間接導(dǎo)致了最終的1p/19q共缺失狀態(tài)診斷誤差。這種粘連的情況如圖2所示,其中 圖2(a)圖展示了1p FISH 原始圖像,圖2(b)圖則展示了該圖像的B通道所對應(yīng)的經(jīng)過二值化、形態(tài)學(xué)處理后的圖像,圖中矩形框標(biāo)注區(qū)域可以發(fā)現(xiàn)多處細(xì)胞粘連情況,難以獲得準(zhǔn)確的細(xì)胞數(shù)量[13]。
圖2 1p FISH圖像經(jīng)二值化、形態(tài)學(xué)處理后圖像示例
為了解決這一問題,本文提出了一種基于1p/19q熒光原位雜交染色圖像自身特點的細(xì)胞自動計數(shù)方法。該方法不再使用傳統(tǒng)的細(xì)胞統(tǒng)計思路,而是利用1p/19q FISH圖像中紅色通道的圖像特點,即同一細(xì)胞中的紅點距離較近,不同細(xì)胞中的紅點距離較遠(yuǎn)的特點,提取出各紅點,并分析紅點間距離,根據(jù)給定閾值來判斷是否處于同一細(xì)胞,最終則根據(jù)紅點的細(xì)胞歸類結(jié)果來獲取細(xì)胞數(shù)量。該方法可以免于分割粘連的細(xì)胞圖像,并能獲得較高的細(xì)胞自動計數(shù)結(jié)果。
由于判斷1p/19q共缺失的依據(jù)是根據(jù)其熒光原位雜交圖像中選擇100個細(xì)胞,并分別統(tǒng)計這100個細(xì)胞中紅點和綠點的數(shù)量,再計算兩者的比值,根據(jù)比值大小來判斷分子標(biāo)記物1p/19q是否共缺失,因此,準(zhǔn)確獲知細(xì)胞數(shù)量將變得尤為關(guān)鍵。通過觀察得知,屬于同一個細(xì)胞的紅點間距離較小,反之,則距離較大。本文提出的算法利用此特點,不再利用RGB圖像的藍(lán)色通道(B通道)進(jìn)行細(xì)胞計數(shù),而是利用紅色通道(R通道)圖像來進(jìn)行處理。這一處理過程主要包括二值化處理,尋找連通域并計算其面積,以及兩點間歐氏距離的計算。
數(shù)字圖像的二值化處理過程實際是針對灰度圖像所進(jìn)行的處理。首先將彩色圖像轉(zhuǎn)化為灰度圖像,此時圖像中的像素點將具有范圍從0~255的256個亮度等級。為了簡化操作,并保留圖像中的局部圖像特征,再將灰度圖像中各像素點的不同亮度值根據(jù)是否大于指定的閾值對應(yīng)轉(zhuǎn)化到亮度值為0或者為255。假設(shè)設(shè)置的二值化閾值為T1,G(m,n)為二維灰度圖中坐標(biāo)為m,n的像素點亮度值,B(m,n)表示該像素點二值化后新的亮度值,則有如式1所示的圖像二值化操作:
(1)
經(jīng)過二值化操作后的圖像即成為黑白圖像,可以起到簡化后續(xù)操作的作用。圖像的二值化操作除了上述的簡單閾值法外,還有平均閾值法、雙峰閾值法、大津法(Otsu’s method)等[14-15],但本文中考慮到1p/19q熒光原位雜交圖像成像質(zhì)量的高度差異性,在方法實現(xiàn)過程中僅采用了簡單閾值法,并設(shè)置了GUI界面,供醫(yī)生即時根據(jù)計數(shù)和標(biāo)記結(jié)果進(jìn)行閾值調(diào)節(jié)。
將圖像經(jīng)過二值化處理后,將會在圖像中出現(xiàn)多個具有相同亮度的區(qū)域。在本文提出的方法中,二值化處理后將在圖像中出現(xiàn)多個白色區(qū)域。這些區(qū)域大多數(shù)是細(xì)胞中的紅點區(qū)域,但也有因為成像過程中雜質(zhì)的存在所造成的干擾區(qū)域。但通常細(xì)胞中的紅點區(qū)域面積較小,因此尋找并統(tǒng)計這些白色區(qū)域的像素點個數(shù)是本文方法非常重要的步驟。而這一過程則是數(shù)字圖像處理的尋找圖像連通域的操作。像素點亮度相同且相鄰是劃歸到一個連通域的兩個重要條件,不可或缺,而尋找二值圖像的各連通域并標(biāo)記的方法主要有種子填充法和兩次掃描法[16]。種子填充法的主要思路為首先選出所有亮度值為非0 的像素點,將其放到一個集合中,接著在集合中選出任意一個像素點作為種子像素點,然后根據(jù)圖像中的領(lǐng)域關(guān)系進(jìn)行該種子像素點的連通域擴充,被選中的屬于擴充范圍的像素點從集合中刪除,直到所選中的種子點像素的鄰域無法再擴充則停止此次連通域?qū)ふ疫^程。然后選擇集合中的其他像素點作為下次鄰域擴充的種子像素點,重復(fù)上述操作,直至集合中不再有可作為種子的像素點。而兩遍掃描法的圖像連通域操作細(xì)節(jié)則是進(jìn)行兩輪圖像遍歷過程。在第一輪圖像遍歷過程中,如果各非0像素點的8鄰域(已經(jīng)掃描的點)都有相同的標(biāo)簽,則給該像素點標(biāo)記一個數(shù)字標(biāo)簽。如果該像素點8鄰域內(nèi)的非0像素點已有數(shù)字標(biāo)簽時,進(jìn)行標(biāo)簽數(shù)值比較,將兩者中的較小值賦予當(dāng)前像素點作為其數(shù)字標(biāo)簽,反之則賦予當(dāng)前像素點新的數(shù)字標(biāo)簽,該方法需要兩次遍歷圖像,因此在算法復(fù)雜度上較種子填充法高,本文算法中選用第一種方法。
本文方法的主要思想是利用每個細(xì)胞核上,紅色熒光點的絕對距離來區(qū)分細(xì)胞核。由圖1所示的熒光原位雜交圖像中可以看出,絕對距離較近的紅點應(yīng)當(dāng)是屬于同一個細(xì)胞核,反之則屬于另一個細(xì)胞核。因此,衡量點間的絕對距離則是非常重要的區(qū)分細(xì)胞核的過程。然而在圖像處理過程中,衡量像素點間的絕對距離常采用計算兩者間的歐氏距離。算法實現(xiàn)過程中,將計算兩個獨立紅點間的中心像素點間的歐氏距離放在了連通域統(tǒng)計和干擾去除操作之后。其歐氏距離D計算原理如式(2)所示。
(2)
其中,xi,yi為第i個紅點中心像素點坐標(biāo),xj,yj為第j個紅點的中心像素點坐標(biāo)。
如上所述,本文方法是利用1p/19q熒光原位雜交圖像的成像特點來進(jìn)行的細(xì)胞自動計數(shù)和標(biāo)記,其具體的實現(xiàn)步驟為:
1)輸入原始圖像,并將該圖像的RGB通道的紅色通道(R通道)取出。
2)輸入二值化閾值T1,對紅色通道的圖像進(jìn)行二值化處理。
3)尋找二值化后圖像中各連通域,并統(tǒng)計各連通域面積(像素點個數(shù))。由于紅點的連通域相對于背景干擾的非零區(qū)域面積較小,因此輸入連通域閾值T2,將小于該閾值的區(qū)域去掉。此操作的目的是保留該通道內(nèi)的干擾信息,用于后續(xù)干擾部分的去除操作。
4) 將步驟2所獲得的二值化圖像與步驟3中所獲得的保留了干擾區(qū)域的圖像進(jìn)行異或操作,即可消除兩者相同部分,保留具有有效紅點的圖像。
5) 對各紅點的中心像素點間的歐氏距離進(jìn)行計算。
6) 輸入紅點距離判別閾值T3,將紅點間絕對距離小于該閾值的點歸為同一個細(xì)胞上的紅點,反之則認(rèn)為是另一細(xì)胞的紅點。
7) 統(tǒng)計細(xì)胞個數(shù),即可獲得本文方法的自動細(xì)胞計數(shù)數(shù)值,并將其輸出。同時對各細(xì)胞區(qū)域進(jìn)行標(biāo)記,輸出標(biāo)記好細(xì)胞的圖像,醫(yī)生可根據(jù)標(biāo)記結(jié)果進(jìn)行相應(yīng)閾值調(diào)整,直至滿意結(jié)果輸出。
為了更為直觀地說明本文方法,在圖3中給出了本文算法的具體實現(xiàn)流程框圖。
本文所研究的圖像取自于武漢大學(xué)人民醫(yī)院腦膠質(zhì)瘤病人的1p/19q共23張圖像,相關(guān)的數(shù)據(jù)已通過倫理審核。本文中用于實驗驗證的1p/19q熒光免疫圖像的原始尺寸為1 360×1 024,在進(jìn)行處理前未進(jìn)行裁剪等操作。
利用上述的細(xì)胞自動計數(shù)算法,基于Python 語言實現(xiàn)了該方法,并利用臨床收集的1p/19q 熒光原位雜交熒光圖像進(jìn)行了實驗結(jié)果的驗證,獲得了該方法的實驗評估效果?;谏鲜鏊惴?為了便于專業(yè)醫(yī)師獲得直觀的細(xì)胞計數(shù)結(jié)果,本文設(shè)計相應(yīng)的GUI界面,相應(yīng)的實驗結(jié)果如圖4-6所示,圖中使用圓圈將識別出的細(xì)胞進(jìn)行標(biāo)注。
圖3 1p/19q 熒光原位雜交免疫熒光染色圖像中細(xì)胞自動計數(shù)和標(biāo)記方法流程圖
圖4 1p熒光原位雜交圖像細(xì)胞自動計數(shù)及標(biāo)記結(jié)果示例1
圖5 19q熒光原位雜交圖像細(xì)胞自動計數(shù)及標(biāo)記結(jié)果示例2
圖6 1p熒光原位雜交圖像細(xì)胞自動計數(shù)及標(biāo)記結(jié)果示例3
圖4和圖5中所示的分別是1p和19q的熒光原位雜交圖像,圖中細(xì)胞核的相對位置較為獨立,細(xì)胞的粘連、團簇情況較輕,但仍然存在亮度不均的問題,經(jīng)本文方法處理后獲得了較好的細(xì)胞計數(shù)結(jié)果。圖6呈現(xiàn)的是細(xì)胞核團簇情況嚴(yán)重的1p熒光原位雜交圖像,經(jīng)過本文方法處理后,從圖中標(biāo)記的細(xì)胞結(jié)果可以看出,在細(xì)胞團簇的區(qū)域,本文的方法可以標(biāo)注出正確的細(xì)胞,獲得較為精確的細(xì)胞數(shù)量,說明本文方法可以在細(xì)胞團簇較多,成像質(zhì)量較差的1p/19q原位雜交熒光圖像中實現(xiàn)較為準(zhǔn)確的細(xì)胞自動計數(shù)和標(biāo)記。
為了進(jìn)一步地說明本文方法的正確率,將該方法應(yīng)用于收集整理的23張1p/19q免疫熒光原位雜交免疫熒光圖像,并將自動識別的細(xì)胞數(shù)與由醫(yī)生識別的細(xì)胞數(shù)進(jìn)行了對比。由于目前在臨床中進(jìn)行計算機輔助理療的過程中,專業(yè)醫(yī)生的判斷結(jié)果仍然具有權(quán)威性,因此本文中將醫(yī)生識別的細(xì)胞數(shù)作為金標(biāo)準(zhǔn),在此基礎(chǔ)上進(jìn)行了本文方法自動識別細(xì)胞數(shù)正確率的定量評估和分析。本文方法細(xì)胞自動識別計數(shù)與醫(yī)生識別計數(shù)結(jié)果的對比分析如圖7所示,其中深色柱狀條表示本文算法的計數(shù)結(jié)果,淺色柱狀條表示醫(yī)生計數(shù)結(jié)果。從圖7中可以獲知,大多數(shù)的算法識別結(jié)果都接近或等于醫(yī)生識別結(jié)果,但是由于背景干擾的影響,也存在有算法識別結(jié)果大于醫(yī)生識別結(jié)果(過識別)的情況。
從基于誤差分析的角度出發(fā),將細(xì)胞識別誤差定義為算法自動識別細(xì)胞數(shù)與醫(yī)生識別細(xì)胞數(shù)的誤差的絕對值,具體的評估自動識別細(xì)胞數(shù)準(zhǔn)確率的統(tǒng)計原理由式(3)給出:
識別準(zhǔn)確率=
(3)
圖8中展示了本文方法在每張圖像上的細(xì)胞自動計數(shù)準(zhǔn)確率統(tǒng)計結(jié)果,其中橫坐標(biāo)表示圖像編號,縱坐標(biāo)表示本文方法在每張圖像上所獲得的細(xì)胞自動計數(shù)準(zhǔn)確率??梢垣@知,本文方法可以獲得單張圖片高于80%以上的細(xì)胞自動計數(shù)準(zhǔn)確率,在成像質(zhì)量較好、背景噪聲干擾較小的情況下,所獲得的細(xì)胞自動計數(shù)準(zhǔn)確率可以達(dá)到100%。將各圖像的細(xì)胞自動計數(shù)準(zhǔn)確率進(jìn)行疊加并除以總的1p/19q FISH圖像數(shù)量,則可獲得其平均準(zhǔn)確率為92.53%。以上結(jié)果說明了在復(fù)雜的背景條件和細(xì)胞團簇情況嚴(yán)重的成像情況下,本文方法可獲得較高的細(xì)胞自動計數(shù)結(jié)果。
圖7 本文算法細(xì)胞自動計數(shù)與醫(yī)生計數(shù)結(jié)果對比圖
圖8 本文方法細(xì)胞自動計數(shù)正確率統(tǒng)計結(jié)果
分子標(biāo)記物1p/19q共缺失狀態(tài)的確定是腦膠質(zhì)瘤分級分類診斷的重要的指標(biāo)之一。臨床中多采用熒光原位雜交(FISH)方式獲取的熒光圖像來判斷共缺失狀態(tài)。這一過程中需要病理科醫(yī)生計數(shù)定量的細(xì)胞數(shù)值后計算紅、綠點的數(shù)量比值來判定1p/19q是否共缺失,由于細(xì)胞統(tǒng)計的數(shù)量較大,其成像質(zhì)量不穩(wěn)定,背景噪聲干擾較多,且細(xì)胞團簇現(xiàn)象頻頻發(fā)生,此項工作對人力的消耗較大,大大降低了醫(yī)生的工作效率。因此,本文提出了一種新1p/19q熒光原位雜交免疫熒光圖像中的細(xì)胞自動計數(shù)和標(biāo)記方法,解決了傳統(tǒng)的使用藍(lán)色通道圖像(細(xì)胞熒光反應(yīng)為藍(lán)色,即RGB通道的B通道)因細(xì)胞團簇?zé)o法準(zhǔn)確衡量細(xì)胞數(shù)量的問題,利用1p/19q熒光原位雜交圖像自身的成像特點,使用R通道圖像實現(xiàn)細(xì)胞自動計數(shù)。將該方法用于臨床采集的23張1p/19q FISH圖像,經(jīng)過直觀的展示和準(zhǔn)確率的統(tǒng)計分析,可知本文提出的方法可以獲得90%以上的平均細(xì)胞自動計數(shù)準(zhǔn)確率,具有較好的臨床使用意義。
值得注意的是,由于背景中亮度較高的紅色區(qū)域影響以及成像過程中不同細(xì)胞中的紅點亮度的差異,本文方法仍無法獲得與醫(yī)生完全一致的識別準(zhǔn)確率,但目前所取得的結(jié)果仍然令人鼓舞,如何進(jìn)一步提高此方法的準(zhǔn)確率將是今后繼續(xù)進(jìn)行研究的方向。