于前洋
(中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,吉林長(zhǎng)春130033)
本期《中國(guó)光學(xué)》成組呈現(xiàn)在讀者面前的16篇論文,計(jì)有發(fā)展趨勢(shì)1篇,方法論1篇,硬件2篇,軟件11篇,像質(zhì)評(píng)價(jià)1篇,構(gòu)成一期覆蓋面較全的視頻圖像處理專集。
文[1]分析了當(dāng)今自動(dòng)目標(biāo)識(shí)別(ATA)技術(shù)的發(fā)展趨勢(shì),提出了對(duì)智能圖像處理進(jìn)行必要的理論研究對(duì)高效智能算法和并行硬件系統(tǒng)的理論與應(yīng)用研究具有指導(dǎo)意義,便于將長(zhǎng)春光機(jī)所圖像處理的智能化推向一個(gè)新高度。文章建議圍繞復(fù)雜背景下的ATA扎實(shí)開展如下研究:智能傳感器應(yīng)用的研究,各種先進(jìn)圖像處理算法的研究,使用傳輸機(jī)(如Transputer等)構(gòu)成并行處理的新系統(tǒng)結(jié)構(gòu)的研究。
文[2]針對(duì)目前數(shù)字圖像數(shù)據(jù)量以指數(shù)增長(zhǎng),致使后續(xù)處理面臨巨大壓力的局面,提出壓縮感知理論(Compressed Sensing,CS),該方法論可為緩解這一壓力提供解決途徑。論文綜述了CS理論及其關(guān)鍵技術(shù),著重介紹了CS理論在成像、圖像融合、目標(biāo)識(shí)別與跟蹤等領(lǐng)域的應(yīng)用與發(fā)展?fàn)顩r,特別是壓縮感知理論使從部分采集數(shù)據(jù)中“解壓縮”出更大量信息的想法變成可能。這種思路改變了人們對(duì)于香濃-奈奎斯特采樣定理的傳統(tǒng)理解,突破了先行產(chǎn)生大量冗余信息,然后再去費(fèi)勁地壓縮/解壓的怪圈。顯然,隨著其理論進(jìn)一步完善與發(fā)展,壓縮感知必將會(huì)有更廣泛而有效的應(yīng)用。
文[3]是涉及視頻處理器硬件的1篇論文,以TI公司的先進(jìn)DSP芯片為核心構(gòu)成,應(yīng)用價(jià)值明顯,工程考慮充分。文[4]為描述2款千兆級(jí)像元數(shù)的幀頻500 Hz CMOS圖像傳感器研制與測(cè)試的文章,其真實(shí)地反映了相關(guān)研究過程,所測(cè)關(guān)鍵參數(shù)亦有重要參考價(jià)值。
視頻圖像壓縮的實(shí)時(shí)性一直是圖像壓縮算法能否付諸實(shí)施的關(guān)鍵問題之一。對(duì)于多核DSP,關(guān)注底層優(yōu)化是效果顯著但有些辛苦的途徑。文[5]給出了在TMS320C6416上對(duì)MPEG-4視頻編碼器進(jìn)行底層優(yōu)化的明顯效果,包括利用并行特性進(jìn)行匯編優(yōu)化,用兩級(jí)高速緩存作內(nèi)存空間優(yōu)化,利用EDMA級(jí)聯(lián)特性開辟雙緩沖區(qū),同時(shí)完成編碼和傳輸以改善編碼效率等。實(shí)踐表明:采用上述措施后,對(duì)768 pixel×576 pixel,25 frame/s的視頻圖像可進(jìn)行實(shí)時(shí)編碼壓縮。
有關(guān)紅外圖像軟件處理的論文有2篇。文[6]針對(duì)紅外和可見圖像對(duì)場(chǎng)景中高頻成分的相似特性,提出一種基于矢量邊緣的模型構(gòu)建法,用來(lái)進(jìn)行異源圖像的快速特征匹配與配準(zhǔn),有助于實(shí)現(xiàn)實(shí)景中的自動(dòng)目標(biāo)搜索。文[7]針對(duì)紅外圖像低對(duì)比和邊緣模糊的特點(diǎn),研究了一種結(jié)合自適應(yīng)直方圖均衡化和拉普拉斯變換的方法,采用雙DSP并行處理,適用于紅外圖像的實(shí)時(shí)增強(qiáng)。實(shí)驗(yàn)證明:增強(qiáng)效果明顯,實(shí)時(shí)性好,滿足50 frame/s的幀頻要求。
其余8篇軟件論文中,文[8]給出一種目標(biāo)跟蹤技術(shù),采用粒子濾波進(jìn)行粗定位,采用SIFT特征匹配精定位,對(duì)目標(biāo)旋轉(zhuǎn)、遮擋、光照變化有很好的適應(yīng)性。文[9]提出在圖像融合中,低頻基于區(qū)域梯度信息、高頻基于區(qū)域特征因子的加權(quán)與選擇算法,比基于像素的算法具有更高的融合性能。文[10]提出模式識(shí)別中使用彩色圖像的四元數(shù)仿射不變矩作為目標(biāo)的特征描述子,可以實(shí)現(xiàn)彩色圖像的高效目標(biāo)識(shí)別。文[11]采用基于小波變換的模極大值的小目標(biāo)檢測(cè)算法,與各向異性擴(kuò)散濾波相結(jié)合,通過對(duì)各尺度方向小波系數(shù)進(jìn)行擴(kuò)散濾波來(lái)檢測(cè)弱小目標(biāo),能夠檢測(cè)到不均勻噪聲背景下對(duì)比度為2%的弱小目標(biāo)。文[12]選用Mean-Shift算法對(duì)莫爾條紋方向角精確求解,使計(jì)算速度和精度得到提高。在對(duì)比度為5.4%時(shí),精度達(dá)到29',計(jì)算時(shí)間為15 ms。文[13]提出一種基于加權(quán)預(yù)測(cè)的迭代解盲卷積算法,根據(jù)預(yù)測(cè)值計(jì)算方向加速算子,收斂速度比L-R算法提高43.8倍,具有較好的工程實(shí)用價(jià)值。文[14]提出在電子穩(wěn)像中,使用運(yùn)動(dòng)矢量修正的灰度投影運(yùn)動(dòng)估計(jì)算法。這種方法可以使運(yùn)動(dòng)目標(biāo)造成的影響只作用在其中的若干局部子塊上,而其他塊不受影響,保證了穩(wěn)像的準(zhǔn)確性。實(shí)驗(yàn)表明,穩(wěn)像后圖像與參考幀的RMSE值明顯下降。文[15]通過計(jì)算立體模板的參數(shù),在已知載機(jī)飛行參數(shù)和建筑物參數(shù)時(shí),可對(duì)建筑物目標(biāo)進(jìn)行識(shí)別,允許參數(shù)誤差為10 pixel。該方法適合于具有明顯形狀特征的立體目標(biāo)的自動(dòng)捕獲與跟蹤。
文[16]試圖對(duì)傳統(tǒng)圖像質(zhì)量評(píng)價(jià)的主觀和客觀方法相互沖突做出改進(jìn),將局部灰度方差分布作為表征圖像結(jié)構(gòu)信息的一個(gè)重要特征,增強(qiáng)了像質(zhì)評(píng)價(jià)中人眼敏感細(xì)節(jié)信息的權(quán)重,提高了客觀評(píng)價(jià)與主觀評(píng)價(jià)的一致程度。實(shí)驗(yàn)表明:所提出的方法優(yōu)于傳統(tǒng)的MSE、PSNR以及SSIM方法,使主觀評(píng)價(jià)中與人眼視覺特性相關(guān)的部分得到體現(xiàn),向與客觀評(píng)價(jià)的溝通邁出了踏實(shí)的一步。
我深信,對(duì)視頻圖像處理感興趣的讀者,如能花半小時(shí)瀏覽這16篇文章,再花半天時(shí)間精讀特別關(guān)注的幾篇文章,將會(huì)是饒有興趣而又頗有收益的。