唐彩紅
摘? 要: 針對多種特征權(quán)重值無法合理設(shè)置,得到的檢索效果無法達到用戶要求的問題,將多種特征融合在一起,對圖像進行分類處理,可以彌補單一特征檢索帶來的局限性問題,并采用遺傳算法對圖像特征進行提取并進行優(yōu)化,以獲取最優(yōu)的特征權(quán)重值,將獲取的最優(yōu)權(quán)重值用于圖像檢索與分類中。運用加權(quán)融合方法對圖像的顏色、紋理等特征進行加權(quán)處理,可以有效實現(xiàn)多種特征融合的目的。通過實驗證明,基于遺傳算法確定特征權(quán)重值的圖像檢索與分類方法具有較強的學習效果,可以自動為特征權(quán)值進行賦值,大大提高了圖像分類的簡潔性,提升了圖像檢索的效果。
關(guān)鍵詞: 遺傳算法; 特征權(quán)重值; 圖像分類; 卷積神經(jīng)網(wǎng)絡(luò); 初始種群; 檢索率
中圖分類號: TN911.73?34? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)03?0058?04
Image classification to determine feature weight values by genetic algorithm
TANG Caihong
(Qilu Medical University, Zibo 255300, China)
Abstract: In order to deal with the fact that it is difficult to set multiple feature weight values reasonably and the retrieval results fail to satisfy user′s requirements, multiple features are fused? to classify images, which can make up the limitation of single feature retrieval. The genetic algorithm is used to extract and optimize the image features to obtain the optimal feature weight values for image retrieval and classification. The image features like color and texture can be weighted by the weighted fusion method, which can effectively achieve the purpose of multi?feature fusion. The experiment results show that the method of image retrieval and classification to determine feature weight values by genetic algorithm has obvious learning effect and can automatically assign values to feature weight, which greatly improves the simplicity of image classification and the effect of image retrieval.
Keywords: genetic algorithm; feature weight value; image classification; convolutional neural network; initial population; retrieval ratio
0? 引? 言
信息的快速發(fā)展使圖像數(shù)據(jù)呈井噴式發(fā)展,各大社交網(wǎng)站的推廣應用,導致圖像數(shù)量猛漲,造成存儲管理困難。在海量的圖像數(shù)據(jù)中所包含的信息更是千絲萬縷。因此,圖像分類成為了研究的重點內(nèi)容。在圖像分類中對圖像的特征進行提取,將多種相同特征的圖像提取完成后進行分類,傳統(tǒng)的圖像特征提取方法主要針對特定的圖像數(shù)據(jù),雖然能夠完成基本的圖像特征提取,但是無法更深層次的理解圖像中所包含的信息,所得到的圖像分類準確性較低。因此,如何提取圖像中所包含的更深層次的信息成為研究的重點。卷積神經(jīng)網(wǎng)絡(luò)在圖像分類處理上能夠達到較高的分類精度,受到了專家學者的廣泛關(guān)注,但是由于卷積神經(jīng)網(wǎng)絡(luò)的收斂速度較慢,提高收斂速度是重點。針對該問題,引入遺傳算法,利用遺傳算法的全局搜索能力,尋找最優(yōu)權(quán)重值,以更快地提升圖像的分類性能。
1? 基于遺傳算法的多特征圖像檢索技術(shù)
1.1? 提取顏色和紋理特征
針對基于內(nèi)容的圖像檢索,顏色空間的選擇非常重要,影響最終的檢索效果。在HSV空間中提取圖像特征可以得到一個有效的非線性變換,適合人眼視覺感知距離。顏色直方圖計算圖像的顏色特征,簡單快捷、不易變形[1],可以對圖像中的顏色分布進行細致描述,在直方圖的基礎(chǔ)上進行顏色特征檢索。采用顏色直方圖計算圖像的顏色特征,可能會失去一些空間信息,但是在紋理特征中卻能夠得到空間特征的融合,借助鄰域矩統(tǒng)計共生矩陣方法,完成空間特征的融合。
提取圖像特征的方法為:轉(zhuǎn)化彩色圖像時,需要先從RGB顏色空間開始進行轉(zhuǎn)化,將其轉(zhuǎn)化為HSV空間,繼而對HSV空間圖像進行量化,并獲取量化后的圖像顏色直方圖,將其作為顏色特征進行保存;然后從HSV空間中,利用鄰域統(tǒng)計矩共生矩陣的方法獲取紋理特征,并結(jié)合HSV的顏色和紋理特征進行圖像檢索。
1.1.1? ?提取顏色特征
在對圖像顏色特征進行計算時,要想獲得更好的結(jié)果,可以利用真彩色進行計算。但是這種方式會增加計算量,占據(jù)大量的存儲空間。因此,需要對顏色空間進行量化處理,將較高的顏色進行標注,可以提高檢索的效率,然后根據(jù)不同的色彩范圍對圖像進行量化處理。本研究采用非均勻量化的方式,在HSV空間中,根據(jù)人眼對顏色的主觀感知特性,可以得到量化方法[2],即:
為了可以獲取更好的像素值,需要轉(zhuǎn)化視覺特征分量,以降低飽和度和亮度帶來的干擾,賦予不同的權(quán)重值[H]=9,[S]=3,[V]=1。
量化后的HSV空間顏色有72種,利用顏色直方圖作為圖像的顏色特征,得到如圖1所示的圖像[3]。
1.1.2? 提取紋理特征
采用鄰域統(tǒng)計矩共生矩陣對圖像進行紋理提取,得到能量、對比度分量。圖2為HSV分量圖像紋理提取圖,圖2a)為原始圖像,圖2b)為[H],[S],[V]分量圖像。
1.2? 特征權(quán)值的優(yōu)化調(diào)整
1.2.1? 特征權(quán)值分析
當對圖像進行檢索時,不同特征所表示的意義與取值范圍不同,為了保證各個特征的比重同步,需要對圖像的各個特征進行歸一化處理[4]。對提取圖像的顏色和紋理等特征進行歸一化處理,顏色和紋理分別用C,T表示,對圖像的顏色和紋理特征進行提取和組合,得到最終的特征向量,即:
式中:[Q]表示示例圖像;[P]表示目標圖像;[n]表示特征個數(shù);[wi]表示權(quán)值。
選擇不同特征的權(quán)值時,需要對每一種特征賦予同等的權(quán)值。對于自然圖像而言,所包含的特性重要性不足,對圖像檢索的結(jié)果影響較大;在選擇特征權(quán)重時,可以對特征權(quán)重進行賦值,即使維數(shù)降低也不會完全被摒棄;人為設(shè)置權(quán)重值時,需要反復進行算法測試,以取得精確的檢索結(jié)果,找出最優(yōu)的權(quán)重值,這種方式所消耗的人力和物力巨大。為此,本文提出基于遺傳算法對權(quán)重值進行調(diào)整,從而獲取圖像的分類信息,利用遺傳算法找出最優(yōu)權(quán)重值。
1.2.2? 特征權(quán)值問題的轉(zhuǎn)化
2? 基于遺傳算法確定特征權(quán)重值的最優(yōu)解
2.1? ?遺傳算法
遺傳算法模擬生物進化過程,以隨機、自適應的方式尋找最優(yōu)解,在處理復雜數(shù)據(jù)方面頗有造詣。遺傳算法通常被定義為:
式中:[C]表示染色體編碼;[E]表示評價函數(shù);[P0]表示初始化種群;[M]表示種群大小;[Φ,Γ,ψ,Τ]表示選擇、交叉、變異、終止。
2.2? 算法步驟
1) 隨機選擇初始化種群;
2) 計算個體的適應度值;
3) 判斷終止化的條件;
4) 選擇父個體;
5) 生成新個體;
6) 通過交叉、變異產(chǎn)生新的種群,返回,反復執(zhí)行上述步驟[6]。
3? 基于遺傳算法和卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法
3.1? 卷積神經(jīng)網(wǎng)絡(luò)
利用遺傳算法訓練卷積神經(jīng)網(wǎng)絡(luò)權(quán)重,并在遺傳算法的協(xié)助下找出最優(yōu)權(quán)重,以解決卷積神經(jīng)網(wǎng)絡(luò)在進行圖像分類過程中收斂速度過慢的問題,提高圖像分類的性能。
卷積神經(jīng)網(wǎng)絡(luò)如圖3所示。
LRN層可以提高網(wǎng)絡(luò)的分類精度,ReLU表示激活函數(shù)。
3.2? 權(quán)重調(diào)整策略
卷積神經(jīng)網(wǎng)絡(luò)是正向傳播,卷積神經(jīng)網(wǎng)絡(luò)權(quán)重是反向傳播,因此,需要進行權(quán)重調(diào)整策略分析。在遺傳算法的基礎(chǔ)上,對網(wǎng)絡(luò)權(quán)重進行初始化,對初始化的網(wǎng)絡(luò)權(quán)重進行編碼,生成種群,對種群進行一系列的選擇、交叉、變異等操作,最后進行解碼,生成新的權(quán)重。
訓練卷積神經(jīng)網(wǎng)絡(luò)就是進行權(quán)重更新的過程,將初始化生成的權(quán)重放入卷積神經(jīng)網(wǎng)絡(luò)中進行二次計算,得到網(wǎng)絡(luò)數(shù)據(jù)后進行傳播,在傳播的過程中,利用梯度下降法進行權(quán)重更新,更新完成之后,對更新后的權(quán)重進行編碼并生成種群,最后完成一系列的遺傳操作。不斷重復以上步驟,直至訓練結(jié)束[7]。
3.3? 更新網(wǎng)絡(luò)權(quán)重
在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)權(quán)重都是自最后一層開始進行后向傳播的,采用后向傳播的方式進行網(wǎng)絡(luò)權(quán)重更新,采用梯度下降法計算當前層的網(wǎng)絡(luò)權(quán)重,再根據(jù)遺傳算法的特有方式進行權(quán)重優(yōu)化,將優(yōu)化后的網(wǎng)絡(luò)權(quán)重作為當前層繼續(xù)進行反向傳播。一直重復該步驟直到訓練結(jié)束。權(quán)重更新公式為:
式中:[W]表示權(quán)重;[b]表示偏置;[θ]表示參數(shù);[n]表示訓練集大小;[k]表示當前層。
3.4? 優(yōu)化網(wǎng)絡(luò)權(quán)重
利用遺傳算法對網(wǎng)絡(luò)權(quán)重進行優(yōu)化,操作方法為:
1) 初始化染色體種群
利用二進制編碼得到染色體種群,表示初始解,在初始種群中創(chuàng)建染色體數(shù)量,創(chuàng)建完成后對其進行評估,確定權(quán)重與最優(yōu)解的接近程度。初始種群生成步驟如圖4所示。
初始種群生成后進行一系列的遺傳操作,得到最優(yōu)初始種群,將不再對后期權(quán)重更新,不再進行初始化[8]。
2) 染色體編碼
在優(yōu)化權(quán)重的過程中,不可直接使用遺傳算法進行優(yōu)化,需要先對網(wǎng)絡(luò)權(quán)重進行二進制編碼,即[L=h*i+h*j+j],[h]表示隱層,[i,j]表示輸入層與輸出層。
3) 選擇
在遺傳算法中,迭代結(jié)束后都會形成一個新的種群。從當前種群中隨機選擇一組個體,構(gòu)成一個相互競爭的關(guān)系,采用錦標賽選擇模式,防止最優(yōu)個體支配種群。
4) 交叉
采用遺傳算法在更新網(wǎng)絡(luò)權(quán)重過程中會產(chǎn)生一個新的個體,產(chǎn)生的個體就是交叉算子。交叉率影響遺傳算法優(yōu)化的性能。每當執(zhí)行完交叉算子后,都需要采用局部交叉算子進行二次優(yōu)化。
5) 變異
在遺傳操作過程中,每執(zhí)行一個變異算子,都會獲取父代,生成后代1,在后代1中應用變異算子,生成后代2,比較后代1、后代2。
6) 適應度評價
適應度函數(shù)表示當前染色體的性能好壞,決定了卷積神經(jīng)網(wǎng)絡(luò)是否能夠找到最優(yōu)解,在遺傳算法中,將卷積神經(jīng)網(wǎng)絡(luò)中的各層數(shù)據(jù)之間的誤差作為適應度函數(shù),表示為:
式中:[k]表示系數(shù);[n]表示神經(jīng)元個數(shù);[yi],[oi]表示期望輸出與實際輸出。
4? 實驗結(jié)果與分析
為了驗證本文算法性能,從HSV空間中的[V]分量提取圖像紋理,并判斷提取的有效性,需要先提取紋理特征再進行檢索。將彩色圖像轉(zhuǎn)化為灰色圖像,從灰色圖像中提取紋理特征。對轉(zhuǎn)化后的HSV空間進行紋理特征提取,對提取的精確度與檢索率進行評價,對圖像庫中的圖像進行檢索和分類處理,隨機選取30幅圖像進行檢索,分別采用GLCM(灰度共生矩陣)、MLCM(鄰域統(tǒng)計矩共生矩陣)進行檢索,并進行結(jié)果對比,如圖5所示。
結(jié)果表明,[V]分量圖像可以完全代表原圖像進行紋理特征提取,分別采用兩種不同的算法對圖像進行紋理特征提取,結(jié)果證明采用MLCM(鄰域統(tǒng)計矩共生矩陣)算法得到的圖像檢索效果更好。
利用遺傳算法確定特征權(quán)重值,并進行圖像分類。為了驗證遺傳算法獲取特征權(quán)重值的有效性,與其他特征權(quán)重方法進行對比,比較結(jié)果如圖6所示。
圖7列舉出了采用遺傳算法確定特征權(quán)重值返回的圖像分類結(jié)果,可以看出采用遺傳算法獲取的檢索效果比其他算法更好。
5? 結(jié)? 語
互聯(lián)網(wǎng)的迅速發(fā)展產(chǎn)生了豐富的圖像資源,如何合理利用這些海量圖像信息是研究的重點。為了更加方便快捷地從海量圖像信息中找到有用的資源,提高圖像檢索與圖像分類的能力,提出一種基于遺傳算法的圖像特征提取與描述方法。利用圖像鄰域灰度的統(tǒng)計矩表述圖像數(shù)據(jù)的變化規(guī)律,增強紋理特征的提取效果,提高檢索能力。在進行圖像特征融合檢索時,為了使圖像的檢索效果達到最佳,需要轉(zhuǎn)化特征權(quán)重的設(shè)定問題,利用遺傳算法獲取最優(yōu)權(quán)重值,實現(xiàn)圖像的檢索效率與分類效果。卷積神經(jīng)網(wǎng)絡(luò)在進行圖像分類時的收斂速度較慢,需要借助遺傳算法提高卷積神經(jīng)網(wǎng)絡(luò)的圖像分類速率,對卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重策略進行更新與優(yōu)化,以提高分類精度。
參考文獻
[1] ZHOU X, GAO X, WANG J, et al. Eye tracking data guided feature selection for image classification [J]. Pattern recognition, 2016, 63: 56?70.
[2] 呂衛(wèi),鄧為賢,褚晶輝,等.采用S變換特征選擇方法的心律失常分類[J].數(shù)據(jù)采集與處理,2018,33(2):306?316.
[3] WANG Y, ZHUO T, ZHANG Y, et al. Hierarchical polarimetric SAR image classification based on feature selection and Genetic algorithm [C]// 2014 12th International Conference on Signal Processing (ICSP). Hangzhou, China: IEEE, 2014: 764?768.
[4] 李雋,王偉.遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)在圖像目標識別中的應用研究[J].現(xiàn)代電子技術(shù),2017,40(20):111?113.
[5] WANG Y, SONG B, ZHANG P, et al. A fast feature fusion algorithm in image classification for cyber physical systems [J]. IEEE access, 2017, 5: 9089?9098.
[6] 王東霞,周觀民.遺傳算法優(yōu)化特征權(quán)值的支持向量機圖像分類[J].電視技術(shù),2015,39(2):75?79.
[7] 張棟冰.一種基于遺傳算法的特征選擇和權(quán)重確定方法[J].懷化學院學報,2015,34(5):59?62.
[8] 楊劍,宋超峰,宋文愛,等.基于遺傳算法的模糊RBF神經(jīng)網(wǎng)絡(luò)對遙感圖像分類[J].小型微型計算機系統(tǒng),2018(3):621?624.