【摘要】人臉研究一直是計(jì)算機(jī)視覺、模式識(shí)別和計(jì)算機(jī)圖形學(xué)領(lǐng)域中的熱點(diǎn)研究問題之一?,F(xiàn)今,通過監(jiān)視器得到的人臉圖像分辨率不高,以至于給人臉識(shí)別和跟蹤等后續(xù)應(yīng)用帶來很大的難度。本文提出一種基于學(xué)習(xí)的超分辨率重構(gòu)算法來得到清晰的人臉圖像,采用對(duì)圖像塊搜索操作進(jìn)行位置限制和檢查圖像分塊間重疊區(qū)域水平兼容性的思想,降低了搜索的復(fù)雜度,提高了匹配相關(guān)性。
【關(guān)鍵詞】人臉圖像識(shí)別;超分辨率重構(gòu);學(xué)習(xí)算法
Abstract:The research of face image is one of hot questions in the field of the pattern recognition and computer graphics.Now adays,the human face image resolution through the monitoring device is not effective and it’s not so helpful to the human face recognition and the track and so on.We propose a novel algorithm that uses the location-restraint operation and the most compatible neighboring patches along horizontal dimension of the face to directly mosaic the high-resolution patches into the outcome.This method can reduce the complexity of search order,enhance the match relevance.
Key Words:Human face image recognition;Super resolution;Learning-based algorithm
1.前言
很多應(yīng)用領(lǐng)域如醫(yī)學(xué),遙感,監(jiān)視系統(tǒng),常常需要高分辨率的圖像,但是通常的成像系統(tǒng)由于受到成像條件和成像方式的限制,我們不能得到很高分辨率的圖像。因此需要對(duì)得到的觀測圖像進(jìn)行放大處理。很多傳統(tǒng)單幀縮放算法,如最近鄰域法,雙線性插值法,三次卷積法等算法都可實(shí)現(xiàn)圖像的放大效果,但是由于受到信息量的限制,這些單幅圖像處理后高頻細(xì)節(jié)被丟失,放大以后也不清晰。本文提出一種基于超分辨率圖像重構(gòu)技術(shù)(Super Resolution Image Reconstruction,SR)來獲得較高分辨率圖像的方法。
SR技術(shù)的基本思想是,以若干模糊、有噪、頻譜混疊的低分辨率(Low Resolution,LR)圖像為輸入源,通過信號(hào)處理技術(shù)融合出一幅高分辨率(Hight Resolution,HR)圖像[1][2]。由于SR技術(shù)可以克服圖像系統(tǒng)的內(nèi)在分辨率限制,同時(shí)還能夠消除噪聲以及由有限檢測器尺寸和光學(xué)元件產(chǎn)生的模糊,改進(jìn)圖像處理中大多數(shù)圖像的質(zhì)量,且具有低成本的特點(diǎn),現(xiàn)有的LR成像系統(tǒng)仍可以使用。
近年來,一種基于學(xué)習(xí)(learning-based algorithm)的SR方法正在興起。學(xué)習(xí)算法主張,利用訓(xùn)練圖像集中的HR圖像與LR圖像的對(duì)應(yīng)關(guān)系來幫助定義PDF。本文利用馬爾可夫網(wǎng)絡(luò)模型來學(xué)習(xí)訓(xùn)練庫中與低分辨率圖像不同區(qū)域相對(duì)應(yīng)的高分辨率圖像的精細(xì)細(xì)節(jié),然后利用學(xué)習(xí)得到的關(guān)系來預(yù)測輸入低分辨率圖像的細(xì)節(jié)信息。
2.生成低分辨率圖像訓(xùn)練庫
通過對(duì)原始高分辨率圖像IH應(yīng)用幾何扭曲,模糊和子采樣,得到低分辨率圖像IL,然后在其中加入噪聲,產(chǎn)生的模型可描述為:
(1)
在(1)式中,矩陣A表示一些線性降階處理,而被認(rèn)為是0域和白高斯隨機(jī)矢量,其概率為:
(2)
對(duì)訓(xùn)練用的高分辨率圖像和對(duì)應(yīng)的低分辨率圖像進(jìn)行分塊,使訓(xùn)練圖像集由塊對(duì)(patch pair)構(gòu)成。分塊的最小尺度是一個(gè)像素,但在本文提出的方案中,實(shí)驗(yàn)表明分塊太小不僅會(huì)增加匹配計(jì)算量,而且會(huì)降低有限次匹配操作內(nèi)找到相容鄰居的概率。但是分塊也不能過大,過大的分塊會(huì)減少訓(xùn)練圖像集中合適樣本的數(shù)量。本文采用的分塊大小是3×3和4×4。
一個(gè)HR圖像的分塊數(shù)與一個(gè)LR圖像的分塊數(shù)是相等的。這樣,就得到訓(xùn)練圖像的分塊集合:
由(7)式可知,當(dāng)d值為0或者很小時(shí),表示圖像完全一樣或者相似度很高。但此方法只能用于圖像對(duì)齊的情況。,一般情況下,人臉圖像都是對(duì)齊的,所以可以采用歐幾里德距離規(guī)范來解決塊匹配問題。
算法將在整個(gè)訓(xùn)練集中,對(duì)每一個(gè)圖像ILp的每一個(gè)分塊進(jìn)行匹配操作,以確定距離最近的k個(gè)分塊。得到k個(gè)LR分塊后,利用訓(xùn)練集的對(duì)應(yīng)關(guān)系,確定這k個(gè)LR分塊所對(duì)應(yīng)的k個(gè)HR分塊。依次把每一個(gè)IL[m,n]塊對(duì)應(yīng)的k個(gè)HR分塊拼鑲起來即得到k個(gè)HR圖像IH|ki=1。用上述方法得到的HR圖像,與輸入圖像對(duì)應(yīng)的原高分辨率圖像有一定程度的相似性。
為了降低搜索空間的復(fù)雜度,本文采用一種限位匹配技術(shù)。在訓(xùn)練集中為一個(gè)低分辯圖像塊尋找最相似的分塊,最好在相同性質(zhì)的區(qū)域進(jìn)行,例如尋找一個(gè)眼部分塊的匹配塊應(yīng)當(dāng)在訓(xùn)練圖像的眼部區(qū)域進(jìn)行。如果不作這種位置限制,一個(gè)眼部分塊的相似分塊很可能會(huì)出現(xiàn)在其他部位(如嘴部)。算法的基本過程就是在每一幅ILp圖像中找出每一個(gè)IL[k,l]的K個(gè)最鄰近塊。
4.實(shí)驗(yàn)結(jié)果
算法最后采用樣本拼鑲技術(shù)直接輸出超分辨率圖像。本文提出的算法在VC++軟件平臺(tái)上實(shí)現(xiàn)。訓(xùn)練集來自于湖南工學(xué)院學(xué)生信息庫,圖2為人臉庫中的中示例,圖3為采集圖像模糊處理后的圖像,圖4為算法處理后圖像。分析和實(shí)驗(yàn)表明,在同等訓(xùn)練集條件下,不僅具有良好的輸出質(zhì)量,而且具有更好的實(shí)用性和實(shí)時(shí)性。
參考文獻(xiàn)
[1]Kenneth.R.Castleman.數(shù)字圖像處理[M].朱志剛,等,譯.電子工業(yè)出版社,1998.
[2]張新明.圖像融合技術(shù)的初步研究——超分辨率復(fù)原[D].博士學(xué)位論文,北京工業(yè)大學(xué),2002,4.
[3]黃華,樊鑫,等.基于識(shí)別的凸集投影人臉圖像超分辨率重建[J].計(jì)算機(jī)研究與發(fā)展,2005,42(10):1718-1725.
[4]Sung Cheol Park,Min Kyu Park,Moon Gi Kang.Super-Resolution Image Reconstruction.A Technical Overview.IEEE Signal Processing Magazine,2003:21-36.
[5]Sina Farsiu,Dirk Robinson,Michael Elad,et al.Advances and Challenges in Super-Resolution.International Journal of Imaging Systems and Technology,2004,14(2):47-57.
[6]Tasso R.M.Sales,G..M.Morris.Fundamental limits of optical superresolution.Optics Letters,2005,22(9):582-584.
本項(xiàng)工作得到湖南省高等學(xué)??茖W(xué)研究項(xiàng)目資助(項(xiàng)目批準(zhǔn)號(hào):11C0368)。