翟乃強(qiáng)
(青島遠(yuǎn)洋船員學(xué)院 現(xiàn)代教育技術(shù)中心,山東 青島 266071)
在圖形圖像的處理中,經(jīng)典的方式是將彩色的位圖變換為灰度圖,然后再通過濾波、求梯度、細(xì)化等方式提取所需的信息。這種方式,可以滿足大多數(shù)的圖像識(shí)別要求。但是,一幅彩色的圖像轉(zhuǎn)換為灰度圖,事實(shí)上拋棄了許多有用的信息,這些信息的缺失導(dǎo)致在圖像識(shí)別或者分割時(shí)不能很好的反映實(shí)際圖像的特點(diǎn),甚至也有可能使得圖像中具有顯著區(qū)別的區(qū)域變?yōu)闆]有任何區(qū)別的相同區(qū)域。本文在RGB空間使用顏色距離的方式代替灰度圖下求梯度的方式,對(duì)于圖像進(jìn)行分析,由于充分利用顏色信息,處理的結(jié)果也就更能接近于原始圖像的特點(diǎn)。
現(xiàn)在的大多數(shù)圖像識(shí)別方法首先將彩色圖像轉(zhuǎn)化成二值圖像或灰度圖像,在保留有效信息的同時(shí)將大大地縮減冗余信息,減少圖像的文件大小,從而為后續(xù)的數(shù)字圖像處理減少所需的計(jì)算機(jī)內(nèi)存、提高運(yùn)算的速度、縮短運(yùn)算的時(shí)間。在RGB圖像中需要24位來表示一個(gè)像素,而灰度圖像只需要8位就可以表示一個(gè)像素,因此轉(zhuǎn)化為灰度圖像后將至少減少2/3的存儲(chǔ)空間和處理時(shí)間。
圖像灰度化轉(zhuǎn)換目前在絕大多數(shù)的圖像處理研究中已成為首要的圖像處理步驟,在進(jìn)行如圖像分割、特征提取、模式識(shí)別等高層次圖像處理之前,一般都首先將原始圖像轉(zhuǎn)化為灰度圖像,這樣做的意義主要基于以下3點(diǎn):
1)將圖像上每個(gè)像素所表達(dá)的色彩信息轉(zhuǎn)換為亮度信息,在保留圖像重要特征的前提下大大地壓縮圖像文件的數(shù)據(jù)大小,為后續(xù)的圖像處理操作提供更小的數(shù)據(jù)處理量、更少的計(jì)算機(jī)內(nèi)存需求、更快的計(jì)算速度,從而將大大地減少計(jì)算處理所需要的時(shí)間。
2)對(duì)于彩色圖像而言,原始RGB全彩色圖像中有用信息占全部信息的比例是非常低的,需要進(jìn)行相關(guān)處理來壓縮冗余信息的比例,是對(duì)彩色圖像的一種降噪處理。
3)更為重要的是,目前成熟的圖像識(shí)別算法都是在基于灰度圖像上進(jìn)行的。通常由現(xiàn)代數(shù)碼照相設(shè)備獲取的圖像都是色彩豐富的RGB全彩色圖像,在圖像中每個(gè)像素的色彩信息是用3個(gè)字節(jié)(即24 bit)的存儲(chǔ)空間來表示,而灰度圖像中每個(gè)像素的亮度信息是用1個(gè)字節(jié)(即1 bit)的存儲(chǔ)空間來表示,因此從理論可知,將RGB全彩色圖像轉(zhuǎn)化為灰度圖像將減少至少2/3的數(shù)據(jù)存儲(chǔ)空間和處理所需時(shí)間,同時(shí)也將減少2/3的色彩冗余信息[1]。
彩色圖像的灰度化是圖像處理的基本方法,在圖像檢測(cè)與識(shí)別、圖像分析與處理等領(lǐng)域有著廣泛的應(yīng)用,如人像、文字、車牌的識(shí)別和處理等。灰度化的方法有多種,最簡(jiǎn)單的方式為平均值法,其近似公式為:
這種方式將R、G、B 3個(gè)分量同等看待,灰度化的原理和實(shí)現(xiàn)都很簡(jiǎn)單,對(duì)于24位位圖來說,為了處理方便起見,僅需要將各顏色分量設(shè)置為此灰度值即可。這種方式并沒有考慮3種基本色各自具有不同視覺效果的情況,比如在背景色為白色情況下,藍(lán)色和紅色看起來就要比綠色顯得更醒目一些[2]。
另一種應(yīng)用較多的方法是加權(quán)平均法,其近似公式為:
這種方式事實(shí)上是由RGB空間轉(zhuǎn)換到Y(jié)UV空間所得到的亮度值Y。在空間的轉(zhuǎn)換過程中充分考慮了人眼對(duì)于不同顏色敏感度的高低?;叶然聦?shí)上一般取得是彩色圖像的亮度信息,只包含原始圖像信息的一部分。在灰度化過程中,不論是哪一種灰度化方式,給定一個(gè)灰度值Y,RGB分量的值可能有多組,這也就決定了一幅彩色圖片的灰度化,可能多種顏色值所得到的灰度值是一樣的,如圖1所示。
圖1 不同的顏色對(duì)應(yīng)相同的灰度值Fig.1 Different colors have the same gray value
圖1(a)中彩色圖片左上角沿順時(shí)針RGB值分別為{0,103,255},{255,23,0},{0,153,0}和{203,0,255}。
它們是按照加權(quán)平均法計(jì)算所得灰度值為90的多種RGB組合中的其中4種,這些顏色值在灰度化過程中將變的沒有任何區(qū)別。如圖1(b)所示,如果用求梯度的方式來進(jìn)行圖像的邊緣提取,將只能得到一個(gè)圓。
在實(shí)際的彩色圖像中,很難發(fā)生圖片的組成顏色灰度化后均得到相同灰度值的情形,但是這種現(xiàn)象也是實(shí)際存在的,它會(huì)導(dǎo)致一幅圖像在灰度化后邊緣信息的缺失。如果以顏色為圖像劃分區(qū)域的判定方式,則可以大大提高邊緣信息的識(shí)別率。
CIE L*a*b*(CIELAB)是常用來描述人眼可見的所有顏色的最完備的色彩模型。在L*a*b*模型中的均勻改變對(duì)應(yīng)于在感知顏色中的均勻改變。所以在L*a*b*中任何2個(gè)顏色的相對(duì)感知差別,可以通過把每個(gè)顏色處理為三維空間中一個(gè)點(diǎn)來近似,并計(jì)算在它們之間的歐幾里得距離[3]。使用CIE L*a*b*空間的顯著優(yōu)點(diǎn)是可以進(jìn)行較為精確的顏色區(qū)分。
常用的色彩空間還包括HSV和HSL空間。HSV和HSL均屬于認(rèn)知顏色空間,從這樣的空間中可以很容易得到顏色的認(rèn)知屬性飽和度、亮度和色調(diào)。但HSV或HSL顏色空間中,色彩信息與H分量和S分量有關(guān),并且各分量中的顏色值也不是線性的,因此需要首先將顏色空間進(jìn)行區(qū)域的劃分,然后給出各區(qū)域內(nèi)顏色距離的定義[4]。
因?yàn)槟壳皥D像處理中現(xiàn)有的圖像采集設(shè)備最初采集到的顏色信息大多是RGB值,其他所有的顏色空間都是從RGB顏色空間轉(zhuǎn)換而來的,包括CIE L*a*b*空間。其處理結(jié)果,如果需要顯示出來,也轉(zhuǎn)換回RGB顏色空間。如果使用CIE L*a*b*空間雖然可以進(jìn)行較為精確的顏色區(qū)分,但涉及到較為復(fù)雜的正向和反向的變換運(yùn)算。
雖然RGB空間不是一個(gè)均勻的顏色空間,任何2個(gè)顏色點(diǎn)之間的距離并不等同于它們的視覺差異[5]。但是,只要取一個(gè)合適的閾值,對(duì)于人眼實(shí)際的顏色分辨能力來說,也完全能夠進(jìn)行顏色的區(qū)分。在RGB空間中,表示兩個(gè)顏色相近程度的方式,仍然采用歐幾里得距離。
其中 R1、R2、G1、G2、B1和 B2分別表示 RGB 顏色空間中的2個(gè)點(diǎn)3種顏色分量。為了計(jì)算方便,假定RGB顏色立方體的原點(diǎn)為RGB(0,0,0),每個(gè)顏色的最大值是 255。 因此的整數(shù)取值范圍約為[0,441]。
顏色直方圖所描述的是不同色彩在整幅圖像中所占的比例,而并不關(guān)心每種色彩所處的空間位置,即無法描述圖像中的對(duì)象或物體。直方圖中的數(shù)值都是統(tǒng)計(jì)而來,描述了該圖像中關(guān)于顏色的數(shù)量特征,可以反映顏色直方圖圖像顏色的統(tǒng)計(jì)分布和基本色調(diào);直方圖只包含了該圖像中某一顏色值出現(xiàn)的頻數(shù),而丟失了某象素所在的空間位置信息;任一幅圖像都能唯一的給出一幅與它對(duì)應(yīng)的直方圖,但不同的圖像可能有相同的顏色分布,從而就具有相同的直方圖,因此直方圖與圖像是一對(duì)多的關(guān)系;如將圖像劃分為若干個(gè)子區(qū)域,所有子區(qū)域的直方圖之和等于全圖直方圖;一般情況下,由于圖像上的背景和前景物體顏色分布明顯不同,從而在直方圖上會(huì)出現(xiàn)雙峰特性,但背景和前景顏色較為接近的圖像不具有這個(gè)特性。因此,由顏色直方圖可以反映顏色的數(shù)量特征和基本色調(diào)[6]。相對(duì)于顏色直方圖提出顏色距離直方圖的概念,表示兩點(diǎn)之間距離的分布情況。
距離的計(jì)算可以參考邊緣檢測(cè)里面常用的梯度算子。屬于梯度算子的有Roberts算子、Sobel算子、Prewitt算子、高斯偏導(dǎo)濾波器(LOG)以及Canny邊緣檢測(cè)器等[7]。任意的算子在這里均能得到相似的比較結(jié)果。這里采用計(jì)算較為簡(jiǎn)單的Roberts算子,計(jì)算當(dāng)前點(diǎn)2個(gè)方向鄰點(diǎn)間顏色距離的均值,作為此點(diǎn)的顏色距離值。其算子模板為:
統(tǒng)計(jì)圖中每個(gè)點(diǎn)的顏色距離值可以得到一個(gè)顏色距離直方圖,如圖2所示。
圖2 顏色距離直方圖Fig.2 Color distance histogram
圖2(b)中直方圖x軸方向代表兩點(diǎn)之間顏色距離值,長(zhǎng)度單位為10,y方向代表圖像2點(diǎn)之間同一距離下具有的像素點(diǎn)數(shù)。顏色距離直方圖直觀的給出了圖像中各點(diǎn)之間顏色距離值的數(shù)量,此圖片顏色距離在30左右數(shù)量迅速較少,因此可以采用此值作為邊緣值的閾值。實(shí)際應(yīng)用中,不同類型的圖像其顏色直方圖差別也較大,但大多數(shù)的顏色豐富的圖片,其直方圖可通過曲線擬合的方式得到一個(gè)合適的閾值。
圖像邊緣指的是圖像中灰度值或者色彩值的突變部分,是圖像最基本的特征之一。邊緣包含了圖像大部分信息,邊緣檢測(cè)是圖像處理和分析的關(guān)鍵步驟,對(duì)后續(xù)高層次的特征描述、匹配和識(shí)別等有著重大的影響。在第3部分的顏色距離直方圖的計(jì)算中采用了Roberts算子進(jìn)行閾值的確定,閾值的確定過程中事實(shí)上已經(jīng)進(jìn)行了邊緣提取的計(jì)算,只需要根據(jù)確定的閾值,將彩色圖像二值化,就可以得到提取的邊緣圖像[8]。對(duì)于圖2中原始圖像分別進(jìn)行文中所述的應(yīng)用顏色信息法和通常的灰度化后進(jìn)行邊緣提取所得到的圖像如圖3所示。
圖3 邊緣提取比較Fig.3 Comparison of edge extraction
對(duì)于圖1原始圖像分別進(jìn)行文中所述的應(yīng)用顏色信息法和通常的灰度化后進(jìn)行邊緣提取所得到的圖像如圖4所示。
圖4 邊緣提取比較Fig.4 Comparison of edge extraction
由圖3及圖4可以得出,本文所提出的應(yīng)用顏色信息法進(jìn)行邊緣提取所得到的圖像比灰度圖下使用同樣的算法保留了更多的邊緣信息,尤其是圖像中邊緣兩邊的區(qū)域顏色亮度接近的部分,能夠更好的保留下來。
[1]張秉正.基于保留色度信息灰度化編碼的彩色圖像識(shí)別方法研究[D].長(zhǎng)春:東北師范大學(xué),2010.
[2]周金和,彭福堂.一種有選擇的圖像灰度化方法[J].計(jì)算機(jī)工程,2006,32(20):198-200.ZHOU Jin-he,PENG Fu-tang.A method of selective image graying[J].Computer Engineering,2006,32(20):198-200.
[3]維基百科.Lab色彩空間 [EB/OL][2011-11-10].http://zh.wikipedia.org/wiki/CIELAB.
[4]張國(guó)權(quán),李戰(zhàn)明,李向偉,等.HSV空間中彩色圖像分割研究[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(26):179-181.ZHANG Guo-quan,LI Zhan-ming,LI Xiang-wei,et al.Research on color image segmentation in HSV space[J].Computer Engineering and Applications,2010,46(26):179-181.
[5]陶霖密,徐光枯.機(jī)器視覺中的顏色問題及應(yīng)用[J].科學(xué)通報(bào),2001,46(3):178-190.TAO Lin-mi,XU Guang-you.The color machine vision problems and applications[J].Chinese Science Bulletin, 2010,46(3):178-190.
[6]百度百科.顏色直方圖 [EB/OL][2010-11-10].http://baike.baidu.com/view/2438797.htm.
[7]馬艷,張治輝.幾種邊緣檢測(cè)算子的比較[J].工礦自動(dòng)化,2004(1):54-55.MA Yan,ZHANG Zhi-hui.Several comparison of edge detection operators[J].Industry and Mine Automation,2004(1):54-55.
[8]楊枝靈,王開.Visual C++數(shù)字圖像獲取、處理及實(shí)踐應(yīng)用[M].北京:人民郵電出版社,2003.