黃忠浩
1 引言
在醫(yī)學(xué)圖像領(lǐng)域,每種醫(yī)學(xué)成像設(shè)備的成像原理和運(yùn)行機(jī)制都會(huì)有所不同,最明顯的問(wèn)題就是任何一種圖像都并不能提供醫(yī)學(xué)診斷需要的所有信息,這樣造成任何一種成像方式的圖像都有很大的局限性和不完整性。
在這種情況下,為了提高疾病診斷的準(zhǔn)確率,需要綜合利用多種設(shè)備的多種圖像。
根據(jù)醫(yī)學(xué)圖像所提供的信息,可以將醫(yī)學(xué)圖像分為兩大類(lèi):解剖圖像(CT、MRI、X線、超聲圖像等)和功能圖像(PET、SPECT等)。
這兩類(lèi)圖像都各有優(yōu)缺點(diǎn),如果能實(shí)現(xiàn)解剖圖像和功能圖像合并(例如現(xiàn)在最常使用的CT與PET圖像的融合),那診斷效果會(huì)得到極大程度地提升,而能順利解決這個(gè)問(wèn)題的技術(shù)就是圖像融合技術(shù)。
但是,醫(yī)學(xué)圖像融合與普通圖像融合不同,不能盲目地進(jìn)行,需要有理論有根據(jù)地進(jìn)行,并且融合后的圖像要進(jìn)行圖像質(zhì)量評(píng)價(jià)和分析,得出正確的診斷信息和較高的融合效果。
在醫(yī)學(xué)圖像融合問(wèn)題的評(píng)價(jià)過(guò)程中,我們可以利用兩類(lèi)方法進(jìn)行圖像處理和評(píng)價(jià),包括主觀定性法和客觀定量法。
主觀定性法主要以人作為觀察者,對(duì)圖像進(jìn)行定性測(cè)試,但由于人會(huì)受到諸多因素的影響,例如環(huán)境、情緒、喜好和狀況等會(huì)明顯影響圖像處理和評(píng)價(jià),因此主觀定性法有明顯的人為性、不全面性[1]和不準(zhǔn)確性。
客觀定量法則是以數(shù)學(xué)運(yùn)算作為基礎(chǔ),通過(guò)定量測(cè)量、分析數(shù)據(jù)的方法得到可靠可信的結(jié)果來(lái)處理和評(píng)價(jià)圖像,而這個(gè)方法現(xiàn)在主要依靠計(jì)算機(jī)處理和評(píng)價(jià)。
可以看出,這兩種方法各有利弊。因此,在實(shí)際工作過(guò)程中,往往是采取主觀定性法和客觀定量法相結(jié)合的方案,既便于工作人員測(cè)試又便于讓計(jì)算機(jī)處理。
2 熵
評(píng)價(jià)圖像融合質(zhì)量的時(shí)候,會(huì)用到“熵”這種定量分析方法。
圖像的“熵”主要是針對(duì)圖像里所包含多少信息而言的,因此信息熵是一種衡量圖像信息程度的重要參數(shù),其值表示的是圖像中所包含的信息量多少。
根據(jù)科學(xué)家Shannon定義的理論,“熵”說(shuō)明的是規(guī)定范圍內(nèi)表現(xiàn)特定數(shù)量的信息所必需的最小數(shù)據(jù)量。
如果數(shù)據(jù)量沒(méi)有達(dá)到“熵”定義的數(shù)值就可能不能完整地表現(xiàn)圖像信息,從而造成圖像信息丟失。
相反地,如果數(shù)據(jù)量超過(guò)“熵”定義的數(shù)值,則圖像會(huì)產(chǎn)生數(shù)據(jù)冗余,這也是本文要論述的兩個(gè)概念。
假設(shè)給定一幅圖像I,則I的信息熵表示如下(此公式在信息技術(shù)界很有名):
此公式中,H是熵,i是灰度級(jí),k是灰度級(jí)總數(shù),p(i)是圖像I中第i級(jí)灰度占整個(gè)圖像的概率。
我們從信息熵的定義中可以得出如下結(jié)論:
如果兩幅圖像進(jìn)行圖像融合處理后,最終的處理結(jié)果中信息熵在增大,這就說(shuō)明圖像融合后的信息量是在增加,反之亦然。
除了熵以外,在醫(yī)學(xué)圖像融合處理時(shí)還會(huì)用到另外一個(gè)概念是交叉熵,也稱(chēng)為相對(duì)熵,是用來(lái)反映兩幅圖像灰度分布信息的差異,交叉熵的值越小,說(shuō)明兩幅融合圖像從原始圖像提取出來(lái)的信息量增加,融合效果越好。
關(guān)于這個(gè)概念在這里就不再敘述,讀者可以查閱相關(guān)文獻(xiàn)。
3 冗余
熵的數(shù)值是圖像能達(dá)到的最好效果,而實(shí)際的圖像并達(dá)不到這種理想狀態(tài),所以任何一幅醫(yī)學(xué)圖像都會(huì)產(chǎn)生冗余。
未經(jīng)壓縮的醫(yī)學(xué)圖像數(shù)據(jù)量大,冗余多,因此大部分采集到的原始圖像都要進(jìn)行數(shù)據(jù)壓縮,這樣可以降低數(shù)據(jù)冗余,因此壓縮算法的好壞對(duì)于圖像來(lái)說(shuō)就顯得至關(guān)重要。
未經(jīng)壓縮的原始圖像是以定長(zhǎng)的二進(jìn)制碼的形式來(lái)表示的,這種編碼的最小長(zhǎng)度lm取決于給定的圖像的大小n。
公式如下:
其中,n是圖像數(shù)據(jù)的大小,[]表示的是向上取整數(shù)。
而計(jì)算圖像中的冗余的方法是信息熵H與原始數(shù)據(jù)實(shí)際大小lm的比與1的差值,表示為:
對(duì)于數(shù)字圖像來(lái)說(shuō),雖然可以使用壓縮比率來(lái)表示壓縮圖像,但經(jīng)常使用的概念是比特率,其單位是bpp。
下面舉例說(shuō)明一下冗余問(wèn)題。
一幅圖像4個(gè)灰度級(jí)的圖像I(真正的圖像遠(yuǎn)大于這個(gè)灰度級(jí),為了降低運(yùn)算量,我們把問(wèn)題簡(jiǎn)化一下),灰度級(jí)的分布概率統(tǒng)計(jì)結(jié)果如下表所示:
4 編碼
所謂熵編碼指在數(shù)據(jù)熵或接近數(shù)據(jù)熵的時(shí)候所進(jìn)行的信息無(wú)損壓縮編碼。
編碼的基本思想是:
首先確定和描述數(shù)據(jù)冗余,然后對(duì)數(shù)據(jù)中的信息進(jìn)行編碼,最后給每個(gè)符號(hào)分配一個(gè)不同的編碼。
每個(gè)編碼的大小取決于各個(gè)符號(hào)各自出現(xiàn)的概率??傮w來(lái)說(shuō),最常用的符號(hào)編碼最小,而最不常用的符號(hào)編碼最大,這些編碼產(chǎn)生的方式取決于編碼算法。
相關(guān)算法在業(yè)界有很多種,最常用的是Huffman編碼。
Huffman算法通過(guò)對(duì)信號(hào)源符號(hào)的遞歸排序來(lái)產(chǎn)生自己的編碼字母表,并根據(jù)得到的概率分布構(gòu)建二叉樹(shù)。
具體算法如下:
(1)循環(huán)。
(2)符號(hào)概率分布按降序排列。
(3)將概率最低的兩個(gè)符號(hào)合并,建立一個(gè)分支并生成一個(gè)新的符號(hào)表,對(duì)每個(gè)分支而言,兩個(gè)合并符號(hào)中的每一個(gè)都分配一個(gè)二進(jìn)制數(shù)值,數(shù)值0給倒數(shù)第一個(gè)符號(hào),數(shù)值1給倒數(shù)第二個(gè),在循環(huán)中逐漸建立起二進(jìn)制編碼表。
(4)循環(huán)執(zhí)行直到樹(shù)的根部。
5 總結(jié)
任何醫(yī)學(xué)圖像在采集、處理、融合過(guò)程中,產(chǎn)生數(shù)據(jù)冗余是必定的,而熵公式所計(jì)算出來(lái)的數(shù)值只是理想情況。
對(duì)冗余進(jìn)行降低和壓縮處理是醫(yī)學(xué)圖像融合技術(shù)的重點(diǎn),降低數(shù)據(jù)冗余后的醫(yī)學(xué)圖像再進(jìn)行融合,得到的結(jié)果可以增加醫(yī)學(xué)圖像的信息量,降低無(wú)用途信息產(chǎn)生的幾率,從而讓醫(yī)學(xué)圖像融合達(dá)到比較好的結(jié)果。
參考文獻(xiàn)
[1]Biomedical Information Technology[澳]馮大淦編,朱志良等譯,科學(xué)出版社;
[2]C.E. Shannon, A mathematical theory of Communication, Bell System Technical Journal, 27:379-423,623-656, 1948;
[3]A .K. Jain, Fundamentals of Digital Image Processing, Prentice Hall,1989;
[4]D .A. Huffman, Method for the Construction of Minimum Redundancy Codes, Proceedings of the IRE 40(9):1098-1101, 1952;
[5]數(shù)字圖像處理——Visual C#,NET編程與實(shí)驗(yàn),機(jī)械工業(yè)出版社,孫燮華;
[6]Visual C++數(shù)字圖像模式識(shí)別技術(shù)詳解,馮偉興、賀波,機(jī)械工業(yè)出版社。