四川大學(xué)電子信息學(xué)院 謝云聰
數(shù)字圖像處理的發(fā)展與應(yīng)用趨勢討論
四川大學(xué)電子信息學(xué)院謝云聰
俗話說“百聞不如一見”,人類接受外部信息的主要途徑就是眼部的感知,即圖像,它對于我們生活、工作的重要性不言而喻。伴隨著計算機軟硬件技術(shù)的快速發(fā)展與進步,數(shù)字圖像處理已經(jīng)進入了我們生活與工作的多個領(lǐng)域,如科學(xué)研究,工農(nóng)業(yè)生產(chǎn),軍事,公安,醫(yī)療衛(wèi)生,教育等。本文主要是從數(shù)字圖像處理的基本內(nèi)容、基本組成、具體應(yīng)用以及當(dāng)前的發(fā)展趨勢進行分析與討論,目的在于幫助更多人認(rèn)識與了解數(shù)字圖像處理技術(shù)。
數(shù)字圖像處理;邊緣檢測;超分辨率;應(yīng)用;發(fā)展趨勢
圖像是物體或事物的一種表示、寫真或臨摹,人們通過視覺系統(tǒng)接受它,并在系統(tǒng)中進行初步的辨識之后形成最終的印象與了解。人們是通過自身擁有的聽覺、視覺、觸覺、嗅覺、味覺等來獲取外部的信息,約83%的信息是依靠視覺獲取的。為了能夠及時、便捷的接受所需的圖像,并在一定程度上保證圖像的清晰度,避免圖像失真、保存等出現(xiàn)問題,就需要利用現(xiàn)代化技術(shù),對圖像進行有效處理,因此數(shù)字圖像處理技術(shù)應(yīng)運而生,它是將圖像物體運用數(shù)字表示并描述,是時間和空間的非連續(xù)函數(shù),使計算機可以非常方便地對圖像信號進行處理。數(shù)字圖像處理技術(shù)的一個主要特點是可以在不增加硬件成本的前提下,通過數(shù)字運算對圖像信息進行加工與處理,消除各類噪聲得到清晰的圖像,最終實現(xiàn)圖像的精準(zhǔn)識別,滿足各行各業(yè)的需求。
數(shù)字圖像處理通常包括以下幾個基本內(nèi)容:
圖像變換:由于圖像信號數(shù)據(jù)量巨大,直接在空間域中處理將涉及大量的計算,因此常采用圖像變換的方法將空間域處理轉(zhuǎn)換為變換域處理,以獲得更有效的處理結(jié)果,其中最常使用的數(shù)字圖像處理算法是小波分析,它可以進行“空間-尺度分析”和“多分辨率分析”;
圖像壓縮編碼:由于圖像的龐大數(shù)據(jù)量,例如:動態(tài)圖像、高分辨率圖像等,使得存儲和傳輸需要占據(jù)大量資源(空間和帶寬),不便于后續(xù)識別時的特征提取,影響效率,因此在保證不失真的前提下采用編碼壓縮是圖像處理中常用且成熟的技術(shù);
圖像增強與復(fù)原:其目的是將圖像有效部分或選擇感興趣部分通過定量強化,用圖像強化技術(shù)改善圖像質(zhì)量,獲取清晰輪廓及所需細(xì)節(jié);然后,當(dāng)了解圖像品質(zhì)下降(或退化)的原因后,建立“降質(zhì)模型”,產(chǎn)生一個等價于理想成像系統(tǒng)所獲得的圖像,利用復(fù)原技術(shù)恢復(fù)原來圖像,其整個過程是從圖像到圖像;
圖像重建:與圖像增強和復(fù)原不同,它是從數(shù)據(jù)到圖像的處理過程,通常是將圖像重建與計算機圖形學(xué)結(jié)合將數(shù)據(jù)轉(zhuǎn)換為有真實感的高品質(zhì)圖像;
圖像分割:是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一,顧名思義即把圖像分成區(qū)域的過程就是圖像分割,是將圖像中具有重要信息與意義的部位分割出來,它的難度在于圖像不能完全依靠計算機自動分割,需將人工信息與之結(jié)合,因此如何將各種方法充分融合是目前提高準(zhǔn)確性和有效性的主要內(nèi)容,這也是未來研究的重點;
圖像描述與分析:圖像描述是圖像識別和理解的必要前提,當(dāng)前對圖像的描述不僅僅是二維形狀(采用二值),還包括對三維物體的描述;而圖像處理的應(yīng)用目標(biāo)就是通過對圖像的分析獲取事件的真相,那么圖像分析就是抓住目標(biāo)特征將其從圖像到數(shù)據(jù)的轉(zhuǎn)換過程;
圖像分類與理解:圖像的分類屬于一種基礎(chǔ)性的識別模式,主要是在對圖像進行復(fù)原、壓縮等處理后,再進行分割與特點提取,進而決定如何分類;而圖像理解則是在圖像分析基礎(chǔ)上進一步研究圖像中各目標(biāo)的性質(zhì)和它們之間的相互聯(lián)系,得出對圖像內(nèi)容含義的理解及原來客觀場景的解釋,并給出指導(dǎo)性決策。
與此同時,數(shù)字圖像處理技術(shù)還具有這樣幾個優(yōu)點:再現(xiàn)性比較好,經(jīng)過數(shù)字圖像技術(shù)處理的圖像可以始終保持原有的圖像再現(xiàn);處理精度比較高,因為圖像數(shù)字化設(shè)備的能力比較高;適用面比較寬,圖像可以是來自多種信息源,針對不同的信息源,采取具體的圖像信息收集措施,圖像數(shù)字處理方法可以運用到任何一種圖像;靈活性比較高,數(shù)字圖像處理不僅可以進行線性運算,還可以進行非線性處理,即用數(shù)學(xué)公式等關(guān)系來表達(dá)的運算都可以利用數(shù)學(xué)圖像處理實現(xiàn)。
數(shù)字圖像處理系統(tǒng)與一般計算機處理系統(tǒng)不同之處是必須有專用輸入/輸出(圖像采集/通訊顯示)和通訊設(shè)備,見下圖:
圖1-1 數(shù)字圖像處理系統(tǒng)的基本組成
圖像是人們從外部獲取信息與交換信息的重要來源,數(shù)字圖像處理的應(yīng)用已涉及各個技術(shù)領(lǐng)域,與人們的工作、生活、學(xué)習(xí)等緊密聯(lián)系,不僅在理論上取得了一定的成果,還在實際應(yīng)用中取得一些成就,并起到至關(guān)重要的作用。其主要體現(xiàn)在以下幾個方面:
首先,航空航天領(lǐng)域上有所體現(xiàn),同時還涉及到飛機遙感及衛(wèi)星遙感領(lǐng)域中,它通過圖像處理實現(xiàn)了對遠(yuǎn)距離不通過接觸物體而獲取物體信息的能力,通過不同時期的遙感圖像形成的差值圖像可以獲取相應(yīng)地區(qū)的動態(tài)變化信息,比如:資源調(diào)查、氣候調(diào)查、洪水漲落、環(huán)境分析、城市規(guī)劃等;人們在對火星照片處理有了新發(fā)現(xiàn)之后,世界上很多國家派出飛機對他們所感興趣的地區(qū)進行空中攝影,將拍攝獲得的照片進行處理,利用計算機的數(shù)字圖像處理系統(tǒng)分析與判斷照片,這樣做不僅在很大的程度上節(jié)省了人力、物力,還加快了對圖像處理的速度,并且能夠從計算機的處理中獲得人工所不能發(fā)現(xiàn)的重要內(nèi)容與信息,得到有指導(dǎo)意義的結(jié)果;
此外,在生物醫(yī)學(xué)工程方面的應(yīng)用,如:X射線圖像、超聲圖像、CT圖像、核磁共振影像等技術(shù),都是運用數(shù)字圖像處理技術(shù)而得到高清晰度和高分辨率的圖像,成為醫(yī)生診斷病情的有力助手;在文化體育方面,可以進行數(shù)字編輯、動畫制作、運動員動作分析等,通過圖像撲捉轉(zhuǎn)變?yōu)閿?shù)字信息,再進行大數(shù)據(jù)綜合分析、評判給出有意義的結(jié)論,最終實現(xiàn)技術(shù)的科學(xué)提升;
在通信工程方面,對超大數(shù)據(jù)量的高清圖像信號的傳輸就依賴圖像編碼壓縮技術(shù),實現(xiàn)多媒體信號(電話、電視和計算機)的“三網(wǎng)合一”;在工業(yè)領(lǐng)域的應(yīng)用,如在一些高溫、有毒、放射性等惡劣環(huán)境下識別工件、物體形狀、排列狀態(tài)等均可以依靠數(shù)字圖像處理技術(shù)無接觸獲取所需信息,其中,以高溫環(huán)境惡劣的鋁冶煉生產(chǎn)為例,對加料口狀態(tài)的識別即采用了該技術(shù),解決了惡劣環(huán)境下人工觀察的不安全性、不及時性和不標(biāo)準(zhǔn)化的難題;另外,通過數(shù)字圖像處理研制出來的智能機器人可以在該領(lǐng)域中進行有效利用,因為這些機器人同時具備了視覺、聽覺以及觸覺功能,這將是人類的一個突破性進步。
最后,數(shù)字圖像處理還在軍事以及公安方面得到了廣泛應(yīng)用,例:導(dǎo)彈的精確制導(dǎo)、對各種偵查照片進行判斷與分析;在公安方面,對指紋進行識別,對人臉進行鑒別,將不完整的圖片進行復(fù)原等;在高速公路系統(tǒng)中,例:ETC技術(shù),實現(xiàn)了車輛、車牌照的自動識別。
由此可以看出,數(shù)字圖像處理的應(yīng)用已經(jīng)遍及我們生活的方方面面,此項技術(shù)為人類對不可觸及的世界的認(rèn)知提供了強有力的手段,同時對人身安全有威脅的工作有了替代工具,用設(shè)備替代人工完成對事件的快速響應(yīng),等等,為我們探索未來,科學(xué)看待世界起到了巨大的推動作用。
邊緣(edge)是指圖像局部強度變化最顯著的部分。主要存在于目標(biāo)與目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要基礎(chǔ)。
Canny邊緣檢測算子是John F.Canny于 1986 年開發(fā)出來的一個多級邊緣檢測算法。更為重要的是 Canny 創(chuàng)立了邊緣檢測計算理論(Computational theory of edge detection),解釋了這項技術(shù)是如何工作的。 Canny邊緣檢測算法以Canny的名字命名,被很多人推崇為當(dāng)今最優(yōu)的邊緣檢測的算法。
邊緣檢測的三個主要評價標(biāo)準(zhǔn):
1)低錯誤率:標(biāo)識出盡可能多的實際邊緣,同時盡可能的減少噪聲產(chǎn)生的誤報。2)高定位性:標(biāo)識出的邊緣要與圖像中的實際邊緣盡可能接近。3)最小響應(yīng):圖像中的邊緣只能標(biāo)識一次,并且可能存在的圖像噪聲不應(yīng)標(biāo)識為邊緣。
為了滿足這些要求 Canny 使用了變分法,這是一種尋找滿足特定功能的函數(shù)的方法。
Canny邊緣檢測的一般步驟:
1)消除噪聲。一般情況下,使用高斯平滑濾波器卷積降噪。2)計算梯度幅值和方向。
使用下列公式計算梯度幅值和方向:
梯度方向近似到四個可能角度之一(一般為0, 45, 90, 135)
3)非極大值抑制。 這一步排除非邊緣像素,僅僅保留了一些細(xì)線條(候選邊緣)。
4)滯后閾值。最后一步,Canny 使用了滯后閾值,滯后閾值需要兩個閾值(高閾值和低閾值):
Ⅰ.如果某一像素位置的幅值超過高閾值, 該像素被保留為邊緣像素。
Ⅱ.如果某一像素位置的幅值小于低閾值, 該像素被排除。
Ⅲ.如果某一像素位置的幅值在兩個閾值之間,該像素僅僅在連接到一個高于高閾值的像素時被保留。
函數(shù)實例:
Mat src=imread(“test.jpeg”); //工程目錄下應(yīng)該有一張名為test. jpeg的素材圖片
Canny(src, src, 20, 60,3 );
imshow(“【效果圖】Canny邊緣檢測”, src);
canny邊緣檢測效果:
如上邊緣檢測在人像截取,圖片紋理分析等實際問題中有較為廣泛的應(yīng)用。
目前,相關(guān)技術(shù)的發(fā)展與進步,使數(shù)字圖像處理技術(shù)在新領(lǐng)域上得以廣泛應(yīng)用,可以料想到今后數(shù)字圖像處理將會得到快速的發(fā)展與進步,并在其應(yīng)用領(lǐng)域上發(fā)揮出重要的作用。根據(jù)我國的分析與研究情況來說,在理論方面的研究成果十分豐富,但是在實際應(yīng)用上還是比較缺乏,所以說,必須將理論與實踐結(jié)合起來,使其朝著高速化、智能化、標(biāo)準(zhǔn)化的方向發(fā)展與進步。其具體體現(xiàn)在以下這幾個方面:首先,數(shù)字處理有待應(yīng)用于計算機視覺中,伴隨著我國計算機技術(shù)的發(fā)展,人工智能技術(shù)的進步,思維科學(xué)研究的進程,可以看出數(shù)字圖像處理將會得到更好的發(fā)展;機器人視覺作為智能機器人身上的一種重要器官,可以對景物進行識別與分析,這也是目前研究的熱點之一,用于軍事偵查的機器人,家庭服務(wù)的機器人等等都是未來發(fā)展的重要方向;因為人類本身對自己視覺的了解是非常少的,因此,計算機視覺是一個比較新穎的研究領(lǐng)域,有待人們對其進行探究。其次,數(shù)字圖像處理還有望應(yīng)用于虛擬現(xiàn)實中,虛擬現(xiàn)實屬于一個借助計算機生成的虛擬空間,目前,虛擬現(xiàn)實伴隨計算機技術(shù)的發(fā)展而得到一定程度上的提高,該技術(shù)勢必會受到更多人的關(guān)注與重視,也會在未來得到更好的發(fā)展;通過采用數(shù)據(jù)手套以及在機器人身上安裝攝像頭,人們就可以感受到機器人所處的環(huán)境,對機器人進行控制,所以說虛擬現(xiàn)實是未來的一個重點研究課題;再次,數(shù)字處理有望應(yīng)用于三維重建,人類對社會事物的認(rèn)識與工具的操作,都是喜歡將其掌握在自己的手中,并通過自身的實際操作來完成一定的生產(chǎn)與發(fā)展,因此,將原本二維的東西通過三維來重現(xiàn),這必然會成為時代發(fā)展的潮流與趨勢;另外,在兩點之間的障礙物等也可以直觀的顯示出來,還可以模擬飛機的路線,這些都為指揮作戰(zhàn)提供了極大的便利;如何在計算機中對場景進行有效重建也是對未知事物準(zhǔn)確了解的一項重要內(nèi)容,例如:采用超分辨率技術(shù)(SR技術(shù))得到高清晰度圖像重建,這是人類未來需要深入研究的主題,也是圖像處理未來的發(fā)展方向之一;圖像理解雖然在理論方面上的分析與研究已經(jīng)取得了很多不錯的成績,但是,出于其本身屬于一個比較難的研究領(lǐng)域,仍存在很多難題;還有,拓展圖像壓縮、分割以及識別算法也是數(shù)字處理研究的關(guān)鍵技術(shù)之一。
數(shù)字圖像處理理論與技術(shù)已經(jīng)受到了社會各界的廣泛關(guān)注與重視,當(dāng)前面臨的首要工作就是研究新的處理方法,創(chuàng)造一個新的系統(tǒng),使其滿足更多新的領(lǐng)域的需求。
綜上所述,隨著科學(xué)技術(shù)的快速發(fā)展,數(shù)字圖像處理技術(shù)已被廣泛地應(yīng)用到人們的現(xiàn)實生活中,這使得數(shù)字圖像處理技術(shù)與人們的生活變得息息相關(guān),人們的生活也因此變得更加多元化、智能化、網(wǎng)絡(luò)化、信息化和科學(xué)化。相信隨著相關(guān)理論、實踐的不斷完善和提高,數(shù)字圖像處理技術(shù)必定朝著高速、超分辨率、智能化方向快速發(fā)展。
[1]陳書海,傅錄祥.實用數(shù)字圖像處理[J].北京:科學(xué)出版社,2015(1):8.
[2]常青.數(shù)字圖像處理教程[M]..華東理工大學(xué)出版社,2009,11(1).
[3]李竹林,張根耀.圖像立體匹配技術(shù)及其發(fā)展和應(yīng)用[M].西安:陜西科學(xué)技術(shù)出版社,2014(3):16.
[4]孔大力,崔洋.數(shù)字圖像處理技術(shù)的研究現(xiàn)狀與發(fā)展方向[J].山東水利職業(yè)學(xué)院院刊,2012(04):11-14.
[5]陳炳權(quán),劉宏立,孟凡斌.數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向[J].吉首大學(xué)學(xué)報(自然科學(xué)版),2014(01):63-70.
[6]呂戈靜.淺談數(shù)字圖像處理技術(shù)的現(xiàn)狀及發(fā)展[J].電腦知識與技術(shù),2012(33):8035-8036.
謝云聰(1994—),男,遼寧沈陽人,四川大學(xué)電子信息學(xué)院電子信息工程專業(yè)大三本科在讀。