張 濤,王正勇,張 影,何小海
(四川大學(xué)電子信息學(xué)院圖像信息研究所,四川成都610064)
美國(guó)早在20世紀(jì)70年代就開始提出圖像配準(zhǔn),后來(lái)得到了軍方的大力支持與贊助,用于當(dāng)時(shí)的飛行器輔助導(dǎo)航系統(tǒng)、武器投射系統(tǒng)等研究中[1]。在20世紀(jì)80年代后,較為成熟的配準(zhǔn)技術(shù)[2]開始大量應(yīng)用在其他領(lǐng)域,如目標(biāo)識(shí)別、醫(yī)學(xué)診斷、自動(dòng)導(dǎo)航、計(jì)算機(jī)視覺等。在這些領(lǐng)域中,配準(zhǔn)技術(shù)都是針對(duì)其具體的應(yīng)用背景,與實(shí)際情況結(jié)合發(fā)展出不同的技術(shù)。但是不同領(lǐng)域的配準(zhǔn)技術(shù)之間在理論方法上又有很大的相似性。在某一領(lǐng)域的配準(zhǔn)技術(shù)很容易移植到其他相關(guān)領(lǐng)域進(jìn)行應(yīng)用[3]。
目前國(guó)內(nèi)外研究圖像配準(zhǔn)技術(shù)較多的應(yīng)用領(lǐng)域有:遙感圖像處理、紅外圖像處理、數(shù)字地圖定位和醫(yī)學(xué)圖像處理等領(lǐng)域,側(cè)重研究的方面主要是:復(fù)雜場(chǎng)景下的小目標(biāo)運(yùn)動(dòng)跟蹤檢測(cè)、地景的匹配、飛機(jī)和導(dǎo)彈的導(dǎo)航及目標(biāo)定位、基于模板匹配的圖像識(shí)別等[4]。通常是對(duì)圖像間存在平移、比例縮放、旋轉(zhuǎn)、幾何失真和扭曲等差異而進(jìn)行配準(zhǔn)研究。目前運(yùn)用較多的圖像配準(zhǔn)方法[5]主要有:基于灰度相關(guān)法、基于變換域法以及基于圖像特征法[6]、傅里葉變換法、點(diǎn)映射法。本文對(duì)比的算法就是采用基于圖像特征點(diǎn)法。
本文運(yùn)用互信息作為適應(yīng)度函數(shù),將和聲搜索(Harmony Search,HS)[7]算法作為優(yōu)化策略用于醫(yī)學(xué)圖像配準(zhǔn)中。通過(guò)實(shí)驗(yàn)證明,將和聲算法用于醫(yī)學(xué)圖像配準(zhǔn)具有較為理想的結(jié)果。
和聲搜索算法(HS)是韓國(guó)學(xué)者Green ZW等人[8]基于音樂(lè)演奏過(guò)程提出來(lái)的一種新的算法。在演奏過(guò)程中,每個(gè)樂(lè)師都能夠發(fā)出一個(gè)音調(diào),這些音調(diào)會(huì)形成一個(gè)和聲向量值,如果這個(gè)和聲比較美妙,就把它記錄下來(lái),便于下次產(chǎn)生更好的和聲。和聲搜索算法就是把演奏者發(fā)出的和聲比作優(yōu)化問(wèn)題的解向量Yj=(yj1,yj2,…,yj n),評(píng)價(jià)類比于目標(biāo)函數(shù)f(Yj),音樂(lè)家們需要尋找的是由美學(xué)評(píng)價(jià)定義的和聲,而研究人員則要找的是由目標(biāo)函數(shù)定義的全局最優(yōu)解。HS包含了一系列的參數(shù),比如和聲記憶庫(kù)(HM)、和聲記憶庫(kù)取值概率(HMCR)、微調(diào)概率(PAR),記憶庫(kù)的大小(HMS)等,其中HMCR和PAR是主要參數(shù)。在和聲搜索算法中,和聲記憶庫(kù)初始化存儲(chǔ)可行解向量HMS個(gè),HMS決定著記憶庫(kù)的可行解數(shù)量。通過(guò)隨機(jī)產(chǎn)生0~1的隨機(jī)數(shù)random和HMCR相比較,從而決定是在HS里面搜素新解還是在HS之外搜索可能值。目前和聲搜索算法應(yīng)用于許多領(lǐng)域[9],以它為基礎(chǔ)的衍生算法也很多[10]。其中和聲搜索算法的基本步驟如下[7,11]。
1)設(shè)定基本參數(shù)并初始化。假設(shè)問(wèn)題最小化,其形式為:minf(x),這里f(x)是目標(biāo)函數(shù),x是由決策變量xi構(gòu)成的解向量,每一個(gè)決策的值域?yàn)閄i,即xi∈Xi,i=1,2,…,N。對(duì)于離散 型 變量Xi={xi(1),xi(2),…,xi(K)}。而連續(xù)型變量Xi:<Xi<,N為決策變量個(gè)數(shù),K為離散型變量可能值的個(gè)數(shù)。
算法參數(shù)有:(1)和聲記憶庫(kù)保存的和聲個(gè)數(shù)HMS;(2)和聲記憶庫(kù)取值概率HMCR;(3)音調(diào)微調(diào)概率PAR;(4)迭代的最大次數(shù)MAX;(5)和聲記憶庫(kù)HM。這些參數(shù)均要在第一步中進(jìn)行初始化。其中記憶庫(kù)形式為
式中:random表示[0,1]的隨機(jī)數(shù)。然后,新的和聲來(lái)自和聲記憶庫(kù)HM,要進(jìn)行音調(diào)微調(diào),操作如下
式中:bw為音調(diào)微調(diào)帶寬;PAR為音調(diào)微調(diào)概率;rand1表示[0,1]上的隨機(jī)數(shù)。
3)更新和聲記憶庫(kù)。若新解優(yōu)于記憶庫(kù)中最差的一個(gè)解,則用新解替換HM中差的解,得到新的記憶庫(kù)。
4)判斷是否到達(dá)結(jié)束條件,若滿足,則停止迭代,輸出最優(yōu)解;否則,重復(fù)步驟2)、步驟3),直到迭代次數(shù)達(dá)到最大的MAX次為止。
算法步驟流程如圖1所示。
圖1 和聲算法流程
互信息是信息論中的一個(gè)概念,它定義在熵的基礎(chǔ)上。對(duì)于概率分布函數(shù)為p(a)的隨機(jī)變量集A,其熵的定義如下[12]
熵表示的是一個(gè)系統(tǒng)的復(fù)雜性或不確定性,對(duì)灰度圖像而言,灰度級(jí)別越多,像素灰度值越分散,熵值也就越大;同時(shí),熵也是灰度直方圖形狀的一個(gè)測(cè)度。
聯(lián)合熵H(A,B)是檢驗(yàn)隨機(jī)變量A和B相關(guān)性的統(tǒng)計(jì)量。對(duì)于兩個(gè)離散的隨機(jī)變量A和B,它們的邊緣概率分布函數(shù)分別是pa和pb,聯(lián)合概率分布函數(shù)是pa,b,則隨機(jī)變量A和B的聯(lián)合熵定義如下
式中:log的底數(shù)決定熵的單位。給定圖像A和B,它們的互信息互定義為
式(6)的意義:圖像A的不確定性大小減去當(dāng)B已知時(shí)A的不確定性大小,其中I(A,B)的值越大,A,B兩幅圖像的相似性越高。
和聲搜索算法應(yīng)用到圖像配準(zhǔn)[13]當(dāng)中去,其主要思路是將求解空間變換參數(shù)的優(yōu)化問(wèn)題看作音調(diào),所有的音調(diào)都有自己的特征,另外還有一個(gè)是由參考圖像和待配準(zhǔn)圖像之間的互信息作為適應(yīng)度,以互信息作為圖像相似性準(zhǔn)則[14]。每個(gè)音調(diào)都在解空間中進(jìn)行搜索,在搜索過(guò)程中通過(guò)不停地迭代去尋找使互信息量最大的組合,搜索出的互信息最大值的組合是最優(yōu)解。
具體步驟為:
1)讀取參考圖像及待配準(zhǔn)圖像。
2)初始化和聲搜索算法的參數(shù),如HM,HMS,HMCR,PAR,MAX等。其中每個(gè)和聲變量由水平和垂直平移、旋轉(zhuǎn)三個(gè)運(yùn)動(dòng)量構(gòu)成的一個(gè)三維向量。
3)計(jì)算各和聲的適應(yīng)度值,并記錄最優(yōu)和最差適應(yīng)度值及對(duì)應(yīng)的和聲變量。
4)在配準(zhǔn)過(guò)程中,程序不斷檢測(cè)配準(zhǔn)結(jié)果圖當(dāng)前適應(yīng)度值是否優(yōu)于其前一次的適應(yīng)度值(即互信息值是否越來(lái)越大),如果優(yōu)于,則替換。
5)條件終止。如果達(dá)到最大迭代次數(shù)MAX或已經(jīng)收斂,則終止迭代,得出配準(zhǔn)結(jié)果圖的互信息值;否則返回4),進(jìn)行下一次迭代。
6)圖像配準(zhǔn)。根據(jù)找到的最優(yōu)參數(shù)組合(即互信息取最大值)后,對(duì)待配準(zhǔn)圖像進(jìn)行空間變換,得到最終配準(zhǔn)結(jié)果。
實(shí)驗(yàn)選擇了3組圖像,并把本文提出的方法與基于特征點(diǎn)配準(zhǔn)的方法進(jìn)行了比較。第一組是脊椎側(cè)面圖像,如圖2a所示。對(duì)其進(jìn)行5°的旋轉(zhuǎn)得到待配準(zhǔn)圖像,如圖2b所示。第二組圖像是脊椎正面圖像,如圖3a所示。對(duì)圖3a進(jìn)行5像素的水平平移后得到待配準(zhǔn)圖像,如圖3b所示。第三組是CT醫(yī)學(xué)圖像,如圖4a所示。對(duì)圖4a同時(shí)進(jìn)行旋轉(zhuǎn)5°和平移5像素后得到待配準(zhǔn)圖像,如圖4b所示。
依據(jù)最大互信息準(zhǔn)則分別對(duì)原始圖像(圖2a、圖3a、圖4a)和待配準(zhǔn)圖像(圖2b、圖3b、圖4b)進(jìn)行配準(zhǔn),得到進(jìn)行基于特征點(diǎn)配準(zhǔn)的結(jié)果圖(圖5a、圖6a、圖7a)和采用本文方法的配準(zhǔn)結(jié)果圖(圖5b、圖6b、圖7b)。
在這3組圖片中,本文通過(guò)互信息的大小比較配準(zhǔn)前和配準(zhǔn)后的差異性和相關(guān)性,對(duì)比其原先數(shù)據(jù)與結(jié)果數(shù)據(jù),如表1所示。
圖2 圖像1
圖3 圖像2
圖4 圖像3
圖5 實(shí)驗(yàn)1
圖6 實(shí)驗(yàn)2
圖7 實(shí)驗(yàn)3
表1 數(shù)據(jù)對(duì)比
從表1可以看出,對(duì)實(shí)驗(yàn)原始圖像進(jìn)行對(duì)應(yīng)的變化可能產(chǎn)生細(xì)微的誤差,但總體上可以看出相對(duì)于基于特征點(diǎn)算法的圖像配準(zhǔn),和聲搜索算法無(wú)論是對(duì)原始圖像進(jìn)行旋轉(zhuǎn)還是平移或者同時(shí)旋轉(zhuǎn)和平移,配準(zhǔn)結(jié)果都達(dá)到了理想的效果。
本文提出了和聲搜索算法在圖像配準(zhǔn)中的新應(yīng)用,主要是利用和聲搜索算法尋找最佳配準(zhǔn)參數(shù),而后通過(guò)計(jì)算互信息的取值大小,判斷是否達(dá)到了圖像配準(zhǔn)的最佳效果。同時(shí),和聲搜索算法本身參數(shù)較少,作為圖像配準(zhǔn)的方法之一,較為方便。實(shí)驗(yàn)結(jié)果也顯示出配準(zhǔn)較為準(zhǔn)確。
[1]夏明革,何友.多傳感器圖像融合應(yīng)用評(píng)述[J].艦船電子對(duì)抗,2002,25(5):38-44.
[2] ZHANG Xiaohong,LEIMing,YANG Dan,et al.Multi-scale curvature product for robust image corner detection curvature scale space[J].Pattern Recognition Letters,2007(28):545-554.
[3]呂海霞.自動(dòng)圖像配準(zhǔn)技術(shù)研究[D].西安:西北工業(yè)大學(xué),2007.
[4]王倩.一種改進(jìn)的和聲搜索算法及其應(yīng)用[D].上海:華東理工大學(xué),2012.
[5] 王蕾.圖像配準(zhǔn)技術(shù)及應(yīng)用研究[D].西安:西安電子科技大學(xué),2007.
[6]常麗萍,冀小平,趙梁.分塊的基于Harris角點(diǎn)檢測(cè)的圖像配準(zhǔn)方法[J].電視技術(shù),2013,37(1):45-47.
[7]雍龍泉.和聲搜索算法進(jìn)展[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2011,20(7):244-248.
[8] GEEM Z,KIM J,LOGANATHANG.A new heuristic optimization algorithm:harmony search[J].Simulation,2001,76(2):60-68.
[9]梁海伶.和聲搜索算法在函數(shù)優(yōu)化問(wèn)題中的應(yīng)用研究[D].沈陽(yáng):東北大學(xué),2009.
[10]張秀杰,李士勇,沈毅,等.和聲量子遺傳算法在圖像配準(zhǔn)中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2012,34(10):2152-2156.
[11]陳瑩珍,高岳林.多目標(biāo)自適應(yīng)和聲搜索算法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(31):108-111.
[12]張倩.基于互信息的醫(yī)學(xué)圖像配準(zhǔn)算法研究[D].濟(jì)南:山東大學(xué),2009.
[13]魏曉敏.圖像配準(zhǔn)算法研究與系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)[D].南京:南京航空航天大學(xué),2010.
[14]唐紅梅,宋培嬌,王霞,等.基于改進(jìn)粒子群優(yōu)化算法的互信息圖像配準(zhǔn)[J].電視技術(shù),2011,35(23):8-10.