,
(三明學院信息工程學院,福建 三明 365004)
目前,大部分的彩色圖像采用RGB或RGBA的顏色模式,其中R、G、B、A分別表示圖像的紅色、綠色、藍色和不透明度分量。應(yīng)用傳統(tǒng)的數(shù)字圖像處理技術(shù)來處理圖像的時候,如果對原始彩色圖進行處理,需要對R、G、B三個分量逐一處理,計算量較大[1]。于是,通常將彩色圖轉(zhuǎn)換為灰度圖來處理,以減少計算量,并且,灰度圖充分反映了圖像的形態(tài)學特征?;诖耍芯空咴谧錾疃葘W習之前經(jīng)常需要將彩色圖轉(zhuǎn)變?yōu)榛叶葓D,通用的計算公式是Gray=R·0.299 +G·0.587 +B·0.114。該轉(zhuǎn)換公式,適用于所有彩色圖像,與圖像的像素分布無關(guān),進而沒有反映出圖像的個體特征[2]。
彩色圖像的每個像素有R、G、B三個分量,可以由三維空間中的一個點來描述。這樣,每一幅彩色圖像的所有像素在三維空間中就形成一個像素分布。傳統(tǒng)的轉(zhuǎn)換方法就是將三維空間降維至一維空間,將所有像素點投影到一個固定的向量n上[3]:
n=(0.299,0.587,0.114)
(1)
以投影點在該向量中的相對位置作為最終的灰度值。如果像素本來就近似地分布于該向量的方向上,那么該公式是比較合理的;但是,如果所有像素點近似于分布在同一個平面上,并且該平面近似于垂直于向量n,那么所有投影點都會堆積在一小段區(qū)域內(nèi)。于是該公式得到的結(jié)果就沒有很高的對比度了。文中設(shè)計的方法是找到一個合適的向量,使得所有像素點在該向量上的投影盡可能地分散開,提高灰度圖的對比度,稱該向量為主軸。顯然,不同圖像有著不同的主軸。
主成分分析起源于統(tǒng)計學,是為了將高維數(shù)據(jù)映射到低維空間。有時候,圖像的像素點之間具有一定的相關(guān)性,例如,對于一幅彩色圖像,由黑暗過渡到明亮的區(qū)域時,R、G、B三個分量的強度同時遞增?;谶@種統(tǒng)計相關(guān)性,就可以對像素進行降維,灰度圖的所有像素分布在一維空間,于是需要將三維空間中的像素點投影到一維空間中來。那么,目的就是要尋找這個一維空間的方向,即尋找圖像的主軸[4,5]。
為了充分反映出每幅圖像自身的特性,也為了利用灰度圖進行形態(tài)學檢測,及深度學習相關(guān)領(lǐng)域,希望該灰度圖中的所有像素盡可能地分離開來,即有盡可能高的對比度。但是,如果單純地為了提高對比度而直接將圖像進行灰度均衡化,又會丟失每幅圖像特有的灰度分布信息?;诖耍?位圖像為例來說明PCA灰度化方法,每個像素點的每個顏色分量只占八個比特位,取值為0-255[6]。設(shè)投影矩陣為W,它是一個三行一列的矩陣,每一列是一個單位向量。只有一列,是因為只需要投影到一維的灰度空間。每個像素點可以用一個包含三個元素的列向量x表示,N個像素點組成一個三行N列的矩陣X。為了便于計算,將所有像素點進行中心化,即將每一個像素點的三個分量,減去所有像素點三個分量的平均值。假設(shè)中心化以后的像素矩陣依然用X表示,那么,有:
(2)
那么,投影到一維空間中的像素點可以表示為:
圖1 三組彩色圖片轉(zhuǎn)灰度對比組圖
Z=WTX
(3)
其中Z是一個一行N列矩陣。矩陣的每個元素表示一個灰度值,共N個點。如前所述,希望這N個點盡可能地分離,即樣本方差盡可能大。投影后的樣本的協(xié)方差矩陣為ZZT,該優(yōu)化問題的目標函數(shù)可以寫作
fX(W)=tr(WTXXTW)
(4)
需要求目標函數(shù)(4)的極大值,其中約束條件為
WTW=I
(5)
其中I為單位向量。在這里就是數(shù)值1。
利用拉格朗日乘子法,其拉格朗日函數(shù)為:
L(W)=WTXXTW-λ(WTW-I)
(6)
令
(7)
即得到
XXTW=λW
(8)
可見,只需要對像素點的協(xié)方差矩陣XXT進行相似對角化,求得三個特征值,取最大的特征值即為(8)中的λ,最大特征值所對應(yīng)的特征向量即為主軸。
從前一節(jié)可以很容易寫出基于主成分分析對彩色圖像進行灰度化的算法流程:
輸入:一幅RGB三色圖,其中寬為m高為n。
輸出:PCA灰度圖。
1)變形:將輸入圖像以行為主序排列成一個3×mn矩陣X,每一列為一個像素。
2)中心化:分別計算矩陣X的每一行的平均值,然后用X的每個元素減去對應(yīng)行所在的平均值,結(jié)果依然用X表示。此時其每行的元素和為零。
3)計算協(xié)方差矩陣:計算像素點的協(xié)方差矩陣XXT。
4)對角化:對XXT進行相似對角化,取最大的特征值λ,以及其對應(yīng)的特征向量,特征向量組成一個三行一列矩陣W。
5)剔除:若W的所有元素同號,則將其歸一化為元素之和為1的三行一列的矩陣W,執(zhí)行6;若W的元素有正有負,則該圖片不適合與主軸灰度化,退出。
6)灰度化:計算每個像素點對應(yīng)的灰度值Z=WTX。
7)變形:將Z轉(zhuǎn)換為寬為m高為n的矩陣,即得到PCA灰度圖。
由前述推導可知,XXT是一個對稱的半正定矩陣,一定可以相似對角化,其所有的特征值都是0或者正值,所有的特征向量相互正交[7-9]。但是,線性代數(shù)理論并不能保證主軸一定指向三維直角坐標系的第一掛線,因此在具體的算法中,強調(diào)了對于求出來的主軸要分情況討論。無論如何,在所有特征值大于零所對應(yīng)的特征向量的低維空間來看,各個像素的三色分量的相關(guān)度為零。
下面給出幾張圖片的對比見圖1,該對比圖中,所有的主軸均能歸一化到元素和為1,且各元素均為正數(shù)。第一行是彩色圖像原圖,第二行是傳統(tǒng)方法將彩色圖轉(zhuǎn)換成灰度圖,第三行是傳統(tǒng)灰度圖的直方圖,第四行是主軸灰度圖,第五行是主軸灰度圖的直方圖。
最上面一層為三張原始彩色圖片,第二層為使用傳統(tǒng)方法轉(zhuǎn)變的灰度圖,第三層為傳統(tǒng)灰度圖的直方圖,第四層為使用PCA得到的主軸灰度圖,第五層為主軸灰度圖的直方圖??梢钥吹?,主軸灰度圖的直方圖更加均衡化。進一步,可以計算每幅圖的主軸與如式(1)所示的傳統(tǒng)的投影軸之間的夾角。對于上面三張圖,其夾角分別為58.9,27.6,35.2。可見,對于同一張圖片,主軸與傳統(tǒng)投影軸的夾角越大,它們之間的灰度直方圖的差距也越大,通常,主軸灰度圖的直方圖的的像素分布比傳統(tǒng)的直方圖更均衡化。
必須強調(diào)的是,主軸灰度化并不適用于所有情況。上面列舉的三張圖片,它們的主軸向量的各個分量都是同號的。若以三維空間坐標系的第一卦限的遠方為正,那么它們的主軸元素都是正數(shù)。這時候便可以對R、G、B的各個分量求加權(quán)平均。但是,有時候,會求得主軸的三個分量元素有正有負,這時候若依然把像素向主軸投影,會產(chǎn)生有違生理學與物理學意義的情況,因為系數(shù)為負的像素分量,它的像素分量值越大,物理上表示它的能量越大,但是投影到主軸以后,對最后的灰度強度的貢獻卻越小。這顯然是不能接受的。
文中給出了將彩色圖像轉(zhuǎn)換為灰度圖的一種方法,即把每個彩色圖像像素看作RGB三維彩色空間中的一個點,求得所有像素點分布的一個主軸,若該主軸能歸一化為元素和為1,且各元素均為正,則可以將各個像素點投影到該主軸;若主軸的各個元素有正有負,彩色圖轉(zhuǎn)灰度圖的效果就不能達到最佳效果。
事實上,單純從統(tǒng)計學角度說,主成分分析的目標就是對高維數(shù)據(jù)進行降維,尋找最能反映數(shù)據(jù)本身的特征,找出各個數(shù)據(jù)點之間的本質(zhì)差異,同時消除數(shù)據(jù)各個維度之間的相關(guān)關(guān)系。如果拋開物理學和生理學對彩色圖像的視覺要求,而僅僅從圖像的邊緣特征、形態(tài)學角度去分析圖像,那么不管主軸的方向如何,都可以朝這個主軸上投影。這樣投影得到的像素點的坐標有正有負,且相對于傳統(tǒng)圖片灰度化而言,像素已經(jīng)盡可能地分開了。這時候用數(shù)字圖像處理的方法對圖像進行形態(tài)學分析和邊緣檢測,將會大大提升準確率。
參考文獻:
[1] 譚亞芳, 劉娟, 王才華,等. 一種稀疏可控的主成分分析方法[J]. 計算機科學, 2017, 44(1):243-246.
[2] 蔡曉洋, 張思荻, 曾俊,等. 基于主成分分析和聚類分析的梔子種質(zhì)資源評價[J]. 中國實驗方劑學雜志, 2017(14):30-37.
[3] 杜陽, 趙輝. 基于主成分分析的MWC采樣數(shù)據(jù)壓縮方法[J]. 計算機應(yīng)用研究, 2017, 34(3):940-944.
[4] 段峰峰, 王永濱, 楊麗芳,等. 基于主成分分析方向深度梯度直方圖的立體視覺深度圖特征提取[J]. 計算機應(yīng)用, 2016, 36(1):222-226.
[5] 陳鍛生, 陳齊松, 劉政凱. 基于類灰度圖的類Haar特征構(gòu)建及其應(yīng)用[J]. 鄭州大學學報(理學版), 2007, 39(1):33-39.
[6] 陳文靜, 蘇顯渝. 利用灰度圖減小Fourier變換輪廓術(shù)的頻譜混疊[J]. 激光雜志, 2002, 23(6):37-38.
[7] 周曄, 張軍平. 基于多尺度深度學習的商品圖像檢索[J]. 計算機研究與發(fā)展, 2017, 54(8):1824-1832.
[8] 孫旭, 李曉光, 李嘉鋒,等. 基于深度學習的圖像超分辨率復原研究進展[J]. 自動化學報, 2017, 43(5):697-709.
[9] 劉麗麗. 車牌識別中的圖像分割技術(shù)研究[J]. 科技通報, 2017, 33(4):125-129.