于前洋
(中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所,吉林長春130033)
本期《中國光學(xué)》成組呈現(xiàn)在讀者面前的16篇論文,計(jì)有發(fā)展趨勢1篇,方法論1篇,硬件2篇,軟件11篇,像質(zhì)評價(jià)1篇,構(gòu)成一期覆蓋面較全的視頻圖像處理專集。
文[1]分析了當(dāng)今自動目標(biāo)識別(ATA)技術(shù)的發(fā)展趨勢,提出了對智能圖像處理進(jìn)行必要的理論研究對高效智能算法和并行硬件系統(tǒng)的理論與應(yīng)用研究具有指導(dǎo)意義,便于將長春光機(jī)所圖像處理的智能化推向一個(gè)新高度。文章建議圍繞復(fù)雜背景下的ATA扎實(shí)開展如下研究:智能傳感器應(yīng)用的研究,各種先進(jìn)圖像處理算法的研究,使用傳輸機(jī)(如Transputer等)構(gòu)成并行處理的新系統(tǒng)結(jié)構(gòu)的研究。
文[2]針對目前數(shù)字圖像數(shù)據(jù)量以指數(shù)增長,致使后續(xù)處理面臨巨大壓力的局面,提出壓縮感知理論(Compressed Sensing,CS),該方法論可為緩解這一壓力提供解決途徑。論文綜述了CS理論及其關(guān)鍵技術(shù),著重介紹了CS理論在成像、圖像融合、目標(biāo)識別與跟蹤等領(lǐng)域的應(yīng)用與發(fā)展?fàn)顩r,特別是壓縮感知理論使從部分采集數(shù)據(jù)中“解壓縮”出更大量信息的想法變成可能。這種思路改變了人們對于香濃-奈奎斯特采樣定理的傳統(tǒng)理解,突破了先行產(chǎn)生大量冗余信息,然后再去費(fèi)勁地壓縮/解壓的怪圈。顯然,隨著其理論進(jìn)一步完善與發(fā)展,壓縮感知必將會有更廣泛而有效的應(yīng)用。
文[3]是涉及視頻處理器硬件的1篇論文,以TI公司的先進(jìn)DSP芯片為核心構(gòu)成,應(yīng)用價(jià)值明顯,工程考慮充分。文[4]為描述2款千兆級像元數(shù)的幀頻500 Hz CMOS圖像傳感器研制與測試的文章,其真實(shí)地反映了相關(guān)研究過程,所測關(guān)鍵參數(shù)亦有重要參考價(jià)值。
視頻圖像壓縮的實(shí)時(shí)性一直是圖像壓縮算法能否付諸實(shí)施的關(guān)鍵問題之一。對于多核DSP,關(guān)注底層優(yōu)化是效果顯著但有些辛苦的途徑。文[5]給出了在TMS320C6416上對MPEG-4視頻編碼器進(jìn)行底層優(yōu)化的明顯效果,包括利用并行特性進(jìn)行匯編優(yōu)化,用兩級高速緩存作內(nèi)存空間優(yōu)化,利用EDMA級聯(lián)特性開辟雙緩沖區(qū),同時(shí)完成編碼和傳輸以改善編碼效率等。實(shí)踐表明:采用上述措施后,對768 pixel×576 pixel,25 frame/s的視頻圖像可進(jìn)行實(shí)時(shí)編碼壓縮。
有關(guān)紅外圖像軟件處理的論文有2篇。文[6]針對紅外和可見圖像對場景中高頻成分的相似特性,提出一種基于矢量邊緣的模型構(gòu)建法,用來進(jìn)行異源圖像的快速特征匹配與配準(zhǔn),有助于實(shí)現(xiàn)實(shí)景中的自動目標(biāo)搜索。文[7]針對紅外圖像低對比和邊緣模糊的特點(diǎn),研究了一種結(jié)合自適應(yīng)直方圖均衡化和拉普拉斯變換的方法,采用雙DSP并行處理,適用于紅外圖像的實(shí)時(shí)增強(qiáng)。實(shí)驗(yàn)證明:增強(qiáng)效果明顯,實(shí)時(shí)性好,滿足50 frame/s的幀頻要求。
其余8篇軟件論文中,文[8]給出一種目標(biāo)跟蹤技術(shù),采用粒子濾波進(jìn)行粗定位,采用SIFT特征匹配精定位,對目標(biāo)旋轉(zhuǎn)、遮擋、光照變化有很好的適應(yīng)性。文[9]提出在圖像融合中,低頻基于區(qū)域梯度信息、高頻基于區(qū)域特征因子的加權(quán)與選擇算法,比基于像素的算法具有更高的融合性能。文[10]提出模式識別中使用彩色圖像的四元數(shù)仿射不變矩作為目標(biāo)的特征描述子,可以實(shí)現(xiàn)彩色圖像的高效目標(biāo)識別。文[11]采用基于小波變換的模極大值的小目標(biāo)檢測算法,與各向異性擴(kuò)散濾波相結(jié)合,通過對各尺度方向小波系數(shù)進(jìn)行擴(kuò)散濾波來檢測弱小目標(biāo),能夠檢測到不均勻噪聲背景下對比度為2%的弱小目標(biāo)。文[12]選用Mean-Shift算法對莫爾條紋方向角精確求解,使計(jì)算速度和精度得到提高。在對比度為5.4%時(shí),精度達(dá)到29',計(jì)算時(shí)間為15 ms。文[13]提出一種基于加權(quán)預(yù)測的迭代解盲卷積算法,根據(jù)預(yù)測值計(jì)算方向加速算子,收斂速度比L-R算法提高43.8倍,具有較好的工程實(shí)用價(jià)值。文[14]提出在電子穩(wěn)像中,使用運(yùn)動矢量修正的灰度投影運(yùn)動估計(jì)算法。這種方法可以使運(yùn)動目標(biāo)造成的影響只作用在其中的若干局部子塊上,而其他塊不受影響,保證了穩(wěn)像的準(zhǔn)確性。實(shí)驗(yàn)表明,穩(wěn)像后圖像與參考幀的RMSE值明顯下降。文[15]通過計(jì)算立體模板的參數(shù),在已知載機(jī)飛行參數(shù)和建筑物參數(shù)時(shí),可對建筑物目標(biāo)進(jìn)行識別,允許參數(shù)誤差為10 pixel。該方法適合于具有明顯形狀特征的立體目標(biāo)的自動捕獲與跟蹤。
文[16]試圖對傳統(tǒng)圖像質(zhì)量評價(jià)的主觀和客觀方法相互沖突做出改進(jìn),將局部灰度方差分布作為表征圖像結(jié)構(gòu)信息的一個(gè)重要特征,增強(qiáng)了像質(zhì)評價(jià)中人眼敏感細(xì)節(jié)信息的權(quán)重,提高了客觀評價(jià)與主觀評價(jià)的一致程度。實(shí)驗(yàn)表明:所提出的方法優(yōu)于傳統(tǒng)的MSE、PSNR以及SSIM方法,使主觀評價(jià)中與人眼視覺特性相關(guān)的部分得到體現(xiàn),向與客觀評價(jià)的溝通邁出了踏實(shí)的一步。
我深信,對視頻圖像處理感興趣的讀者,如能花半小時(shí)瀏覽這16篇文章,再花半天時(shí)間精讀特別關(guān)注的幾篇文章,將會是饒有興趣而又頗有收益的。