摘要: ?為提高水果種類識別的準確性,本文提出一種基于優(yōu)化粒子群結合BP神經(jīng)網(wǎng)絡的識別算法。在算法初期,針對不同種類水果圖像樣本,借助K均值聚類分割算法,融合彩色信息和灰度信息,完成目標圖像的準確分割,提取目標區(qū)域在HSV顏色空間下非均勻量化后的顏色特征,使用分塊局部二值模式和灰度共生矩陣,分別提取局部和全局紋理特征,并對與粒子群算法(particle swarm optimization,PSO)結合的BP神經(jīng)網(wǎng)絡進行優(yōu)化,以獲得最優(yōu)的BP神經(jīng)網(wǎng)絡權值和閾值,同時使用分塊的LBP算子和GLCM方法,采用Matlab 2017b軟件,對蘋果、草莓、檸檬3種水果圖像局部和整體紋理信息進行提取,并與傳統(tǒng)的PSO-BP神經(jīng)網(wǎng)絡、IPSO-BP神經(jīng)網(wǎng)絡及單一BP神經(jīng)網(wǎng)絡訓練之后對測試樣本的識別相對誤差進行比較。研究結果表明,雖然標準PSO-BP算法對圖形的分割效率和識別能力不能與深度學習結果相媲美,但在優(yōu)化后的PSO-BP中,將3種水果識別率與RCNN系列的優(yōu)化結果相比并不遜色,且與結合ResNet的SSD算法的結果對比中表現(xiàn)出優(yōu)異性。該算法保證了圖像分割目標的完整性,有效控制了整體算法的時間性,提高了識別過程的精確性。該研究對水果識別精度的提高具有重要的應用價值。
關鍵詞: ?水果識別; K均值算法; 粒子群算法; 圖像分割; 神經(jīng)網(wǎng)絡
中圖分類號: TP391.413 ?文獻標識碼: A
在落實“互聯(lián)網(wǎng)+農(nóng)業(yè)”戰(zhàn)略和智慧農(nóng)業(yè)改革的背景下,傳統(tǒng)農(nóng)業(yè)與高新技術融合已成為發(fā)展趨勢。水果產(chǎn)業(yè)是農(nóng)業(yè)重要組成部分,對水果實現(xiàn)高效快捷的智能識別分類具有深遠意義,融入圖像識別技術可減少勞動力消耗,且高識別率和短周期有利于水果分類儲存與保鮮。通過模式識別技術進行水果分類,多是依據(jù)水果圖像的顏色、局部紋理和形狀等特征屬性進行定量,然后訓練分類器區(qū)分判決,但在實際應用中仍無法避免因紋理和形狀相似而造成較高的誤差。特征提取能力較強的機器學習,最初經(jīng)歷淺層機器學習階段,該階段主要采用支持向量機(support vector machine,SVM)、Boosting和最大熵方法等。近年來,一些學者對水果識別分類進行研究,李大華等人[1]采用SVM分類器對果蔬紋理特征進行分類;Kuang H L等人[2]利用全局顏色直方圖、局部二值模式(local binary patterns,LBP)、方向梯度直方圖(histogram of gradient,HOG)和基于Gabor小波(GaborLBP)的LBP多特征融合,提高水果識別。根據(jù)交叉驗證精度選擇最優(yōu)塊,但也提升了計算的復雜難度。深度學習是建立類似大腦的神經(jīng)網(wǎng)絡,在大數(shù)據(jù)中自主提取特征,其中基于卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)模型和深度置信網(wǎng)絡(deep belief network,DBN)模型的水果識別算法取得很好的效果[34]。由于傳統(tǒng)的淺層學習在訓練方面受經(jīng)驗的限制,而深度學習模型的計算對硬件資源要求較高。因此,為避免對硬件資源較高的要求,同時追求高效、準確的效果,本研究引入一種基于粒子群優(yōu)化算法優(yōu)化的BP神經(jīng)網(wǎng)絡算法(improved particle swarm optimization-back propagation,IPSO-BP)的方法,實現(xiàn)水果識別中的評估。與傳統(tǒng)方法相比,PSO優(yōu)化的BP神經(jīng)網(wǎng)絡算法,具有更高的識別精度和更快的識別速度。該研究在果品質量、安全評估及消費和儲藏中更具適用性。
1 K均值圖像分割
水果圖像在進行目標體分割和特征提取過程中,易受噪聲影響,進而帶來誤差,因此在對水果圖像分割之前進行預處理,最大程度的保留有效信息。
圖像分割是對整個圖像內容中感興趣的區(qū)域實現(xiàn)標記的過程,標記的完整性及準確性直接影響目標體的識別結果。K均值算法是基于距離相似性的聚類算法[5],使用K均值算法的距離相似性原則,對圖像像素點實現(xiàn)同類別劃分,從而完成圖像分割任務。相較于顏色分量之間存在高度相關性[67]的RGB(red,green,blue)顏色空間,選擇HSV(hue,saturation,value)顏色空間作為圖像信息源,可更大程度得到目標體的有效信息。HSV顏色分量直方圖分布如圖1所示。圖中,H和S包含圖像的彩色信息,V包含圖像的亮度信息。
在對BP神經(jīng)網(wǎng)絡進行優(yōu)化過程中,用粒子代表神經(jīng)網(wǎng)絡中的權值和閾值,以均方誤差,即粒子適應度值最小作為尋優(yōu)目標,在更新迭代中找到最優(yōu)解。
使用Griewank基準測試函數(shù),對標準的PSO和優(yōu)化的PSO在迭代600次過程中最佳適應度值進行比較,Griewank函數(shù)測試結果如圖8所示。由圖8可以看出,IPSO在迭代前期,收斂速度加快;迭代后期,平穩(wěn)度加強,說明全局尋優(yōu)能力和局部尋優(yōu)能力可以達到平衡狀態(tài)。在相同系統(tǒng)中,實驗取相同的迭代訓練次數(shù),適應度值的大小決定粒子質量,適應度值越小,神經(jīng)網(wǎng)絡的訓練效果越好。IPSO-BP算法訓練過程如下:
1) 根據(jù)提取到的特征信息,構建a-b-c三層神經(jīng)網(wǎng)絡結構。
2) 初始化PSO算法,包括粒子數(shù),粒子群的速度和位置,其中粒子群緯度S=ab+bc+b+c。
3) 計算粒子的適應度,并與pid和pgd比較后做出更新。
4) 采用IPSO算法公式,對神經(jīng)網(wǎng)絡權值和閾值更新。
5) 判斷停止條件,得到最優(yōu)權值和閾值。
6) 以最優(yōu)權值和閾值進行訓練,直到網(wǎng)絡均方誤差滿足條件。
基于IPSO-BP神經(jīng)網(wǎng)絡的算法流程如圖9所示。
4 實驗數(shù)據(jù)與結果
4.1 實驗數(shù)據(jù)與結果
實驗中對蘋果、草莓、檸檬3種水果進行測試,使用分塊的LBP算子和GLCM方法對圖像的局部和整體紋理信息進行提取。從中可以看出不同類別的水果具有不同的分布特征,而且LBP算子提取的紋理特征不受光照的影響。在十字鄰域LBP模式下不同水果頻率圖如圖10所示。
不同種類的水果圖像紋理信息都可被細致表征出來,現(xiàn)提取每類水果各30幅圖像GLCM特征的能量、對比度、相關性和熵參數(shù)信息,蘋果灰度共生矩陣參數(shù)值如圖11所示。由圖11可以看出,其紋理幅度波動較大,相應的對比度值也較大,含有較細的紋理組織,其熵值在3種水果中最大。統(tǒng)計各圖像灰度共生矩陣參數(shù)值的平均值和標準差,作為神經(jīng)網(wǎng)絡輸入端的特征向量進行訓練。
4.2 實驗結果
整個實驗過程是在Window10,Matlab 2017b下進行。計算機的內存6 GB,搭載Inter(R) Core(TM) i58265U CPU @ 1.60 GHz 1.80 GHz處理器。
實驗中,為建立更有說服力的水果數(shù)據(jù)集,綜合考慮水果圖像采集過程中的光照、角度及遮擋等外界因素,將采集的圖像統(tǒng)一轉換成60×60,像素大小約為60 kB的圖像,每幅水果都包含RGB彩色圖像。數(shù)據(jù)集中包含3個類別的水果,共計1 200幅圖片。根據(jù)不同的干擾情況,每種類別的水果對應選取226幅圖片作為訓練樣本,其余為測試樣本。利用融合彩色與灰度像素的K均值聚類分割算法,對訓練樣本中的水果圖像進行預處理,處理后分別提取顏色特征和紋理特征,將收集到的數(shù)據(jù)集所有樣本數(shù)據(jù),采用最大最小法在[-1,1]之間進行向量歸一化。將融合后的特征向量輸入到BP神經(jīng)網(wǎng)絡分類器進行學習和訓練。標準的PSO參數(shù)設置為種群規(guī)模30,迭代次數(shù)400,慣性權重ω取0~1之間的隨機數(shù),學習因子c1=c2=2;優(yōu)化后的PSO參數(shù)為種群規(guī)模30,迭代次數(shù)400,c10=2.5,c11=1.5,c20=0.5,c21=2.5。設置BP網(wǎng)絡的輸入層節(jié)點為92,輸出層有3個節(jié)點,[1 0 0],[0 1 0],[0 0 1]分別對應3類不同的水果,隱含層節(jié)點受輸入層節(jié)點影響,隱含層節(jié)點數(shù)影響模型訓練程度。隱含層的節(jié)點個數(shù)由經(jīng)驗公式h=2n+1(h為隱含層節(jié)點,n為輸入層節(jié)點)確定為185個。隱含層激勵函數(shù)為tansig,輸出層激勵函數(shù)使用logsig,訓練函數(shù)使用traingd,學習速率設為0.05,最大允許迭代次數(shù)400。
傳統(tǒng)PSO-BP神經(jīng)網(wǎng)絡、IPSO-BP神經(jīng)網(wǎng)絡及單一BP神經(jīng)網(wǎng)絡訓練之后,對測試樣本的識別相對誤差進行比較,訓練識別絕對誤差如圖12所示。由圖12可以看出,采用IPSO-BP神經(jīng)網(wǎng)絡識別比單一BP神經(jīng)網(wǎng)絡更加精確,絕對誤差極大縮小。而IPSO-BP神經(jīng)網(wǎng)絡絕對誤差都保持在0.4以內,有更好的擬合能力,說明IPSO-BP神經(jīng)網(wǎng)絡對識別精度的提高具有重要的應用價值。
在淺層學習和深度學習算法下,對水果種類進行識別,不同算法下的識別結果如表1所示。其中,深度置信網(wǎng)絡(deep belief networks,DBN)采用單隱含層結構。由表1可以看出,IPSO-BP神經(jīng)網(wǎng)絡識別率相對其他算法最高,平均識別率高于94%;淺層學習SVM識別率最差;BP人工神經(jīng)網(wǎng)絡雖然能夠做出識別,但滿足不了需求;單隱層的DBN模型對特征的吸收達到了很好的效果。本文對神經(jīng)網(wǎng)絡的權值和閾值使用PSO做優(yōu)化,提高了分類器的性能,效果較為優(yōu)異。
為了更好的展示算法的適用性,文中針對提取不同光照、角度、大小的水果顏色、紋理特征分別構建不同的識別模型,不同影響因素下草莓識別率如表2所示。由表2中橫向數(shù)據(jù)可知,相同特征信息進行訓練檢測,優(yōu)化的PSO結合BP神經(jīng)網(wǎng)絡識別率不斷得到改善。融合色度分割更大程度保留了目標體,十字型LBP紋理提取克服光線的影響。隨著提取特征信息詳細性增加,光線、角度等外界干擾因素的影響降低。
以同一測試集識別時間作為模型的識別運行時間,不同特征不同算法下蘋果識別率和識別時間如表3所示。由表3可以看出,單一特征信息的DBN模型識別率普遍比較低,這是因為DBN深度學習為挖掘數(shù)據(jù)分布式特征的網(wǎng)絡結構,在特征維度較小的情況下不能充分發(fā)揮優(yōu)勢。而反觀優(yōu)化的PSO-BP模型識別率高于比SVM模型和BP神經(jīng)網(wǎng)絡,同時在高維度特征中,特征學習能力也得到極大的改善,緊逼深度學習模型;隨著特征信息提取維度數(shù)的增加,模型運行結構也會相應改變,對測試集識別時間也相應變長。IPSO-BP模型在識別時間不斷改善,并且與深度學習DBN模型識別耗時相差不大,可以滿足實時檢測的要求。
4.3 魯棒性與對比結果分析
為了更好地證明IPSO-BP算法的有效性,將其與其他文獻中運用深度學習算法,且在水果識別中表現(xiàn)優(yōu)異的結果進行比較分析,IPSO-BP與深度學習算法識別比較如表4所示。
由表4可以看出,雖然標準PSO-BP算法對圖形的分割效率和識別能力不能與深度學習結果相媲美,但在優(yōu)化之后的PSO-BP中,將三種水果識別率與RCNN系列的優(yōu)化結果相比毫不遜色,且與結合ResNet的SSD算法結果對比中表現(xiàn)出優(yōu)異性。
5 結束語
本文以優(yōu)化粒子群算法提高尋優(yōu)能力為基礎,結合BP神經(jīng)網(wǎng)絡為模型對閾值和權值進行改善,既達到提高神經(jīng)網(wǎng)絡性能的目的,又避免了之前研究中出現(xiàn)的計算復雜難度高的問題,實現(xiàn)對水果種類的高質量識別。實驗中,借助全新的顏色分量融合聚類的分割方法,克服圖像顏色采集過程中的光線干擾,實現(xiàn)對十字型LBP特征的完整提取,對于水果產(chǎn)業(yè)的智能識別具有一定的應用價值。但是在特征維數(shù)冗余、復雜背景圖像干擾以及訓練樣本數(shù)量方面存在不足,在比較中發(fā)現(xiàn),深度學習模型識別的應用會是今后進一步研究的重點。
參考文獻:
[1] 李大華, 趙相飛, 許亮, 等. 基于紋理特征與HIS空間的蘋果識別與標定[J]. 圖學學報, 2016, 37(5): 688693.
[2] Kuang H L, Chan L L H, Yan H. Multi-Class fruit detection based on multiple color channels [C]∥Proceedings of the 2015 International Conference on Wavelet Analysis and Pattern Recognition. IEEE: 2015: 1215.
[3] 孟欣欣, 呂情深, 周雷, 等. 基于遷移學習的自然環(huán)境下香梨目標識別研究[J]. 新疆大學學報, 2019, 36(4): 461467.
[4] 王前程. 基于深度學習的水果圖像識別算法研究[D]. 保定: 河北大學, 2016.
[5] Jia L, Li M, Zhang P, et al. SAR image change dectection based on multiple kernel k-means clustering with local-neighborhood information[J]. IEEE Geoscience Science and Remote Sensing Letters, 2016, 13(6): 856860.
[6] 張經(jīng)緯, 貢亮, 黃亦翔, 等. 基于隨機森林算法的黃瓜種子腔圖像分割方法[J]. 農(nóng)機化研究, 2017, 39(10): 163168.
[7] 吳煥麗, 崔可旺, 張馨, 等. 基于改進K-means圖像分割算法的細葉作物覆蓋度提取[J]. 農(nóng)業(yè)機械學報, 2019, 50(1): 4250.
[8] 鄧向武, 齊龍, 馬旭, 等. 基于多特征融合和深度置信網(wǎng)絡的稻田苗期雜草識別[J]. 農(nóng)業(yè)工程學報, 2018, 34(14): 165172.
[9] 張娟利, 宋朝陽, 韓文霆, 等. 基于RGB圖像處理的煙葉水分無損檢測方法研究[J]. 中國農(nóng)機化學報, 2019, 40(5): 6268.
[10] 白靈鴿, 段先華. 改進的LBP算法在圖像檢索中的應用[J]. 計算機工程與設計, 2019, 40(6): 16711675.
[11] Ojala T, Pietikainen M, Maenpaa T. Multiresolution gray scale and rotation invariant texture classification with local binary pattrerns[J]. IEEE Trans. On Pattern Analysis and Machine Intelligence, 2002, 24(7): 971987.
[12] Houssem Lahiani, Mahmoud Neji. Hand gesture recognition method based on HOG-LBP features for mobile devices[J]. Procedia Computer Science, 2018, 126: 254263.
[13] Liu P Z, Guo J M, Chamnongthai K, et al. Fusion of color histogram and LBP-based features for texture image retrieval and classification[J]. Information Sciences, 2017, 390: 95111.
[14] 陳雪鑫, 孫玥, 苗圃, 等. 基于多級紋理特征的深度信念網(wǎng)絡人臉識別算法[J]. 計算機應用與軟件, 2020, 37(4): 156163.
[15] 李春利, 深魯娟. 基于改進LBP算子的紋理圖像分類方法[J]. 計算機工程與設計, 2016, 37(1): 232236.
[16] 吳慶濤, 曹再輝, 施進發(fā). 基于改進顏色直方圖和灰度共生矩陣的圖像檢索[J]. 圖學學報, 2017, 38(4): 543548.
[17] Gu B, Hu H J, Huang H. Hybrid PSO-BP neural network approach for wind power forecasting[J]. International Energy Journal, 2017, 17(4): 211222.
[18] 張德慧, 張德育, 劉清云. 基于粒子群算法的BP神經(jīng)網(wǎng)絡優(yōu)化技術[J]. 計算機工程與技術, 2015, 36(5): 13211326.
[19] 孫衛(wèi)喜. 用于網(wǎng)絡安全態(tài)勢預測的粒子群與支持向量機算法研究[J]. 計算機應用與軟件, 2019, 36(6): 308316.
[20] Lal S, Behera S K, Sethy P K, et al. Identification and counting of mature apple fruit based on BP feed forward neural network[C]∥ 2017 IEEE 3rd International Conference on Sensing. Chennai India: Signal Processing and Security, 2017: 361368.
[21] 張曉莉, 王秦飛, 冀汶莉. 一種改進的自適應慣性權重的粒子群算法[J]. 微電子學與計算機, 2019, 36(3): 6670.
[22] 仝秋娟, 趙豈, 李萌. 基于自適應動態(tài)改變的粒子群優(yōu)化算法[J]. 微電子學與計算機, 2019, 36(2): 610, 15.
[23] 張繼榮, 張?zhí)? 基于改進粒子群算法的PID控制參數(shù)優(yōu)化[J]. 計算機工程與設計, 2020, 41(4): 10351040.
[24] 趙越, 吳瑩. 自適應PSO-SVM上產(chǎn)期油氣操作成本預測模型[J]. 計算機仿真, 2019, 36(11): 6974.
[25] 徐浩天, 季偉東, 孫小晴, 等. 基于正態(tài)分布衰減慣性權重的粒子群優(yōu)化算法[J]. 深圳大學學報, 2020, 37(2): 208213.
[26] 張開生, 黃謙. 基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡的脈象識別方法[J]. 現(xiàn)代電子技術, 2018, 41(3): 96100, 106.