譚 暢,季春玉,龔俊松,趙永黨,魏景海
(東北林業(yè)大學(xué)理學(xué)院,哈爾濱150040)
從視頻序列圖像中提取有關(guān)物體運(yùn)動的信息稱為運(yùn)動估計,其表達(dá)方式是運(yùn)動矢量[1-3].常見的運(yùn)動估計算法主要有塊匹配法、像素遞歸法、全局運(yùn)動估計算法等[4-5],其中,塊匹配法因其算法簡單有效而得到廣泛應(yīng)用.塊匹配運(yùn)動估計就是按照匹配準(zhǔn)則尋找當(dāng)前塊在參考幀中的匹配塊.其算法分為2類,一類是完全搜索塊匹配(FSBM)算法,它可以獲得全局最優(yōu)解,但是運(yùn)算量大,不適合實時應(yīng)用[6-7].一類是快速搜索塊匹配算法CS、CDS、AMTS、GPS.利用相鄰塊之間的運(yùn)動相關(guān)性,選擇一個反映當(dāng)前塊運(yùn)動趨勢的預(yù)測點作為初始搜索點,以提高搜索速度和預(yù)測的準(zhǔn)確性.評價運(yùn)動估計最佳匹配的準(zhǔn)則有很多種,常用的有平均絕對誤差(mean absolute difference,MAD)、均方誤差(mean square error,MSE)和歸一化互相關(guān)系數(shù)(normalized cross correlation function,NCCF)等.
當(dāng)前幀中特征塊的選取對匹配的準(zhǔn)確性有較大影響,特征塊中包含圖像的特征越多,越有利于提高配準(zhǔn)的精度.另外考慮到圖像在傳輸?shù)倪^程中會受到噪聲的污染,而噪聲也會影響匹配的精度.基于以上兩方面的考慮,本文首先利用Canny算子提取當(dāng)前幀的輪廓,并用差分算子找出包含輪廓最多的小塊,作為特征塊.然后對參考幀進(jìn)行2值化處理,并將處理后的參考幀在新的匹配準(zhǔn)則下與特征塊進(jìn)行配準(zhǔn).與其他塊匹配算法相比,本文算法在不增加計算復(fù)雜度的同時,還能有效地提高搜索精度.
Canny算子是一種常用的邊緣檢測算子,它可以有效地提高圖像的邊緣信息.這是由于其具有最為嚴(yán)格的邊緣檢測的3個標(biāo)準(zhǔn),即好的信噪比、好的定位性能和單邊響應(yīng)準(zhǔn)則(產(chǎn)生多個響應(yīng)的概率低).
Canny算子的實現(xiàn)步驟如下.
1)用高斯濾波器對圖像進(jìn)行濾波,以減小噪聲影響;
2)利用微分算子(如Roberts算子、Sobel算子)找到每個像素的梯度,并求出梯度的大小和方向;
3)對梯度進(jìn)行非極大抑制,保留局部梯度最大的點,確定邊緣,即若像素的灰度值與其梯度方向上前后兩個像素的灰度值相比不是最大的,則認(rèn)為不是邊緣,并將該像素值置0;
4)邊緣連接,設(shè)置高、低閾值.根據(jù)高低閾值判斷出強(qiáng)、弱邊緣點,在2值圖像上標(biāo)出強(qiáng)邊緣點,并標(biāo)出與強(qiáng)邊緣點8連接的弱邊緣點,得到邊緣圖像.利用形態(tài)學(xué)方法把2值化的邊緣圖像細(xì)化,得到源圖像的邊緣信息.
影響配準(zhǔn)結(jié)果的主要因素有噪聲和亮度,在信噪比較低的情況下,如果在最佳匹配點噪聲很大,利用以往的匹配準(zhǔn)則(如MAD),會使得MAD最小值不出現(xiàn)在最佳匹配點處,而出現(xiàn)在附近點,從而導(dǎo)致匹配結(jié)果不準(zhǔn)確.
基于Canny算子對噪聲有很好的抑制,本文的主要思路是利用Canny算子對參考幀進(jìn)行2值化輪廓提取,并提出了一種新的匹配準(zhǔn)則,降低了在配準(zhǔn)過程中噪聲對最佳匹配點選取的影響.
步驟如下:
Step1.在當(dāng)前幀中選取特征塊
首先用Canny算子提取圖像的輪廓,這里使用的高斯濾波器為
并采用Sobel算子求平滑后圖像的梯度,分別使用兩個的卷積“掩?!眮砬蟮盟椒较蚝秃痛怪狈较虻奶荻?
得到當(dāng)前幀的2值化圖像后,利用差分算子計算出包含輪廓最多的小塊,作為特征塊;
Step2.對參考幀進(jìn)行2值化處理
將參考幀中的像素值進(jìn)行2值化處理,其中像素值大于等于2Q-1的置為1,小于2Q-1的置為0,Q為圖像的位深;
Step3.搜索最佳匹配點
在參考幀的輪廓圖像中搜索與當(dāng)前特征塊最為相似的匹配塊,取當(dāng)前塊的中心作為參考幀的搜索起始點,取距起始點長度為64的8個點,按照下面的匹配準(zhǔn)則計算這9個點的T值,找出T值最小的點,再以找出的點為中心,將步長減半,重復(fù)如上計算.依此過程,直至步長為1.
匹配準(zhǔn)則如下:
其中:(k,l)為參考幀中待匹配點的坐標(biāo),f表示當(dāng)前塊的像素,g表示待匹配塊的像素,M,N分別是特征塊的行數(shù)和列數(shù),Q為圖像的位深.
該準(zhǔn)則的優(yōu)點在于,對于灰度值t大于2Q-1的像素點,若為正確的匹配點,T(k,l)=t-2Q+1,若為錯誤的匹配點,T'(k,l)=t,T'(k,l)?T'(k,l).
實驗采用醫(yī)學(xué)圖像對基于特征的三步搜索塊匹配法和本文的方法進(jìn)行計算機(jī)模擬,其中,2種方法選取的特征塊如圖1、2所示.
圖1 差分法選取的特征塊
圖2本文算法選取的特征塊
圖3 是在另一幅圖像中選取的特征塊,圖4、5分別是在加入高斯噪聲后利用兩種方法所得到的匹配結(jié)果.
圖5本方法在參考幀中搜索的匹配塊
圖1 、2表明,本文計算的特征塊比差分法尋找的特征塊包含的圖像信息要多.圖4、5顯示,本文方法在加入高斯噪聲的參考幀中可以準(zhǔn)確找到最匹配特征塊的小塊,而基于MAD準(zhǔn)則的三步搜索算法在橫向上有偏差.因此,本文的方法在噪聲較大的情況下,準(zhǔn)確性高于基于MAD準(zhǔn)則的三步搜索算法.
本文提出了一種新的、有效的塊匹配算法.先利用Canny算子提取當(dāng)前幀的輪廓,并用差分算子找出包含輪廓最多的小塊,即為特征塊.然后對參考幀進(jìn)行2值化處理,并將處理后的參考幀在新的匹配準(zhǔn)則下與特征塊進(jìn)行配準(zhǔn).提取當(dāng)前幀的輪廓再選取特征塊,這使得選取的特征塊包含的圖像信息更多.而Canny算子的使用及對參考幀進(jìn)行2值化處理降低了配準(zhǔn)過程中噪聲對最佳匹配點選取的影響.實驗結(jié)果表明,在噪聲較大的情況下,本文算法的準(zhǔn)確性高于基于MAD準(zhǔn)則的三步搜索算法.
[1]SEFERIDISV,GHANBARIM.General approach to block matching motion estimation[J].Optical Engineering,1993,32(7):1464-1474.
[2]VOS L D,STEGHEER M.Parameterizable VLSIarchitectures for the full-search block-matching algorithm[J].IEEE Trans on Circuits and Systems,1989,36(10):1309-1316.
[3]GHANBARIM.The Cross-Search Algorithm for Motion Estimation[J].IEEE Trans on Communications,1990,38(7):950-953.
[4]SRINIVASAN R,RAO K R.Predictive Coding Based on Efficient Motion Estimation[J].IEEE Trans on Communications,1985,COM-33:888-896.
[5]XU JB,PO L M,CHEUNG C K.Adaptive Motion Tracking Block Matching Algorithms for Video Coding[J].IEEE Trans on Circuits and System for Video Technology,1999,9(7):1025-1029.
[6]JOU JM,CHEN PY,SUN JM.The Gray Prediction Search Algorithm for Block Motion Estimation[J].IEEE Trans on Circuits and System for Video Technology,1999,9(6):843-848.
[7][美]岡薩雷斯.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2003:152-153.