摘要:為了解決現(xiàn)有水果分類識別方法存在的識別精度低等問題?;谒诸愖R別系統(tǒng),提出了一種用于不同水果分類識別的改進深度置信網(wǎng)絡。通過2路深度置信網(wǎng)絡將不同特征圖像作為輸入,使用SoftMax對輸出分類。與常規(guī)分類識別方法相比,所提方法能較準確地實現(xiàn)不同水果的分類識別,多特征融合識別準確率最高,識別準確率為98.75%,滿足水果分類識別的需要。通過優(yōu)化現(xiàn)有深度學習方法,可有效提高該方法的性能。
關鍵詞:水果識別;自動檢測;深度置信網(wǎng)絡;多特征融合;SoftMax 分類器
中圖分類號:TS255.7;TP391.41" " " " "文獻標識碼:A
文章編號:0439-8114(2024)08-0035-04
DOI:10.14088/j.cnki.issn0439-8114.2024.08.007 開放科學(資源服務)標識碼(OSID):
Fruit classification recognition methods based on improved deep confidence network
GUO Ying-di1, ZHAO Chao-yu2
(1. Intelligent Control Department, Yantai Vocational College, Yantai" 264670, Shandong, China;
2. College of Agriculture, Shandong Agricultural University, Tai’an" 271001,Shandong,China)
Abstract: In order to solve the problems of low recognition accuracy in existing fruit classification recognition methods, based on the fruit classification recognition system, an improved deep confidence network for different fruit classification recognition was proposed. Different feature images were taken as input through 2-channel deep confidence network, and the output was classified using SoftMax. Compared with the conventional classification recognition methods, the proposed method could more accurately achieve the classification recognition of different fruits, and the multi-feature fusion recognition accuracy was the highest, with the recognition accuracy of 98.75%, which met the needs of fruit classification recognition. By optimizing the existing deep learning method, the performance of this method could be effectively improved.
Key words: fruit recognition; automatic detection; deep confidence network; multi-feature fusion; SoftMax classifier
中國是水果種植大國,目前國內產(chǎn)后處理技術仍以人工為主,但人工方法缺陷明顯,效率低和工作量大等[1]。隨著人工智能技術的不斷發(fā)展,基于計算機的識別技術逐漸代替了耗時的人工目視檢測,在水果識別、病蟲害檢測等方面給生產(chǎn)生活帶來了極大的便利[2]。在智能生產(chǎn)領域的機器人分揀中,可以結合計算機識別技術對不同水果進行更加高效和便捷的智能識別,為企業(yè)節(jié)省人工成本以及縮短運輸?shù)绞袌龅闹芷?,提高企業(yè)綜合效益。因此,對基于深度學習的水果分類識別方法進行研究具有重要的實際意義。
目前,國內外已有不少學者對水果分類識別方法進行了研究,并取得了一些優(yōu)異的成果,主要集中在深度學習方法上[3-5]。田有文等[6]提出了一種深入學習方法用于水果品質檢測,結果表明,所提方法與常規(guī)方法相比,具有良好的適應性和較高的精度。黃豪杰等[7]提出了一種改進的SSD模型用于不同水果的檢測,結果表明,所提方法在數(shù)據(jù)增強后精度有所提高,適用于自然環(huán)境下水果的精確檢測,平均檢測精度在85%以上。徐清華等[3]提出了一種將深度殘差網(wǎng)絡模型與遷移學習相結合的水果圖像分類方法,結果表明,所提方法與常規(guī)方法相比,在不同水果的實時檢驗中具有較好的識別精度。王輝等[8]提出了一種用于水果圖像識別的改進YOLOv3模型,結果表明,與原模型相比,提取特征更為豐富,不依賴批量大小,精度達95.6%。Indira等[9]提出了一種卷積神經(jīng)網(wǎng)絡模型用于水果圖像分類方法,結果表明,所提方法在不同水果的識別中具有較好的識別效果。雖然上述方法對水果圖像分類識別進行了深入研究,但存在識別精度低等問題,需要進一步提高適應性。
在此基礎上,基于水果分類識別系統(tǒng),提出了一種用于不同水果分類識別的改進深度置信網(wǎng)絡。通過2路深度置信網(wǎng)絡將不同特征圖像作為輸入,使用SoftMax對輸出分類。通過試驗驗證該方法的可行性,旨在為不同水果分類識別技術的發(fā)展提供一定的參考。
1 系統(tǒng)結構
水果分類識別系統(tǒng)對攝像機采集到的圖像進行特征提取,以判斷目標為何種水果[10]。結合圖像采集和處理技術,形成相對簡單和強大的抗干擾能力,適合大規(guī)模檢測。水果分類識別系統(tǒng)如圖1所示。它由上位機和圖像采集系統(tǒng)兩部分組成[10]。在帶式輸送機的驅動下,水果和帶式輸送機沿同一方向運行,通過燈箱后,內部視覺傳感器將拍攝水果照片傳輸?shù)接嬎銠C,再根據(jù)標準提取水果的特征參數(shù),識別不同的水果。
2 識別檢測模型
2.1 深度置信網(wǎng)絡
DBN是一種基于概率結構的深度學習方法,可以看成是受限玻耳茲曼機RBM疊加而成,RBM僅為兩層結構,RBM網(wǎng)絡結構[11]如圖2所示。
如圖2所示,RBM主要由可視層v、隱含層h以及兩者間的網(wǎng)絡權重[ω]構成,神經(jīng)元為1時為激活狀態(tài),為0時為抑制狀態(tài)[12]。
設可視層和隱含層節(jié)點數(shù)分別為[n]和[m],表示為[(v1,v2,…,vn)]和[(h1,h2,…,hm)]。該RBM的能量函數(shù)式[13]如式(1)所示。
[E(v,h/θ)=-i=1naivi-j=1mbjhj-i=1nj=1mvihjωij] (1)
式中,[vi]與[hj]、[ωij]、[ai]與[bj]分別為可視層和隱含層之間的節(jié)點狀態(tài)、權重、偏差;參數(shù)[θ=(ω,a,b)]。已知[θ]通過式(2)可求(v,h)的聯(lián)合概率分布[14]。
[P(v,h/θ)=e-E(v,h/θ)Z(θ)] " " "(2)
式中,[Z(θ)=v,he-E(v,h/θ)]為歸一化因子。
求輸入數(shù)據(jù)分布[P(v/θ)]時,需要根據(jù)[P(v,h/θ)]的邊緣分布來確定[15],如式(3)所示。
[P(v/θ)=he-E(v,h/θ)Z(θ)]" " " " " " " " " (3)
在求解式(3)時,[θ]確定后計算的工作量也非常大,難以得到[P(v/θ)]結果。則隱含層節(jié)點神經(jīng)元的激活概率[16]如式(4)所示。
[P(hj=1/v,θ)=σ(bj+iviωij)]" (4)
式中,[σ]為激活函數(shù)。
同理,求出可視層節(jié)點的激活概率[17]如式(5)所示。
[P(vi=1/h,θ)=σ(ai+jhjωij)]" " (5)
當確定可視節(jié)點的輸入時,基于式(4)和(5)來計算[P(v/h)],由此可以獲得隱含層h的狀態(tài)。根據(jù)隱含層h可以求出可視層狀態(tài)[18]。
RBM在大數(shù)據(jù)中很難提取有用特征,因此,引入深層網(wǎng)絡DBN。DBN網(wǎng)絡結構如圖3所示。
DBN的網(wǎng)絡從下到上訓練,直到RBM訓練完成。DBN構成有輸入層、輸出層、若干層的隱含層[19]。
2.2 改進深度置信網(wǎng)絡
為了完善訓練學習的特征信息,對傳統(tǒng)深度置信網(wǎng)絡進行了改進,根據(jù)數(shù)據(jù)集的實際情況,通過2路深度置信網(wǎng)絡將不同特征圖像作為輸入,使用SoftMax對輸出分類,網(wǎng)絡結構如圖4所示。
深度置信網(wǎng)絡具有強大的特征學習能力,能夠深入挖掘潛在的特征信息。深度置信網(wǎng)絡可以對特征信息進行深入挖掘,將顏色特征HSV作為一路深度置信網(wǎng)絡輸入,將局部紋理特征HOG和多層LBP特征進行加權融合后作為一路深度置信網(wǎng)絡輸入,輸出通過Softmax進行分類。
3 結果與分析
3.1 試驗參數(shù)
本研究主要識別蘋果、檸檬、草莓、柑橘4種水果,數(shù)據(jù)總量4 000張,4種水果各1 000張,將數(shù)據(jù)集劃分為兩類,訓練集和測試集,比值為8∶2。為了保證識別的準確性,采用10次試驗取平均值。系統(tǒng)參數(shù)如表1所示。圖像數(shù)據(jù)集組成如圖5所示。
訓練好的模型應選擇適當?shù)脑u價指標評價性能。本研究采用準確率作為評價指標。預測結果中實際含有的陽性樣本數(shù)。只有2種可能的預測:正確預測的TP和錯誤預測的FP,如式(6)所示。
[P=TPTP+FP×100%]" " " " " " " "(6)
式中,[P]為識別準確率。
3.2 試驗分析
為了驗證方法的準確性,采用本研究方法對蘋果、檸檬、草莓、柑橘進行分類識別,識別結果如表2所示。
統(tǒng)計試驗表明,蘋果、檸檬、草莓、柑橘的識別錯誤數(shù)分別為3、3、2、2。本研究方法中的網(wǎng)絡模型的分類精度分別為98.50%、98.50%、99.00%、99.00%,對幾種水果的分類識別都具有較高的精度,總體分類精度為98.75%。
為了驗證本研究多特征融合的優(yōu)勢,進行單一特征、組合特征對比試驗,不同特征融合的識別準確率結果如表3所示。
從表3可以看出,單個特征識別的準確率僅為80.25%,兩個特征組合的準確率約為90.00%,本研究特征融合方法的準確率為98.75%。結果表明,單個特征的DBN網(wǎng)絡模型識別效果并不理想,多特征融合的雙路DBN模型具有較高的分類識別準確率,這是因為本研究方法充分融合特征信息,表征能力較強。
為了驗證本研究分類識別方法的優(yōu)越性,將本研究分類識別方法與文獻[20]結合深度學習和遷移學習方法和文獻[21]支持向量機進行對比分析,輸入均為本研究融合特征。不同模型的識別準確率如表4所示。
從表4可以看出,文獻[21]中的常規(guī)SVM模型能夠實現(xiàn)分類識別,但效果相對較差,這是因為該模型對特征學習較差。文獻[20]中的深度學習方法通過自動提取和層次化地學習特征可以自動訓練學習圖像特征,與本研究中使用的算法結果相似。而本研究方法對特征的訓練更加具體,特征互不干擾,最大限度地利用特征,提高模型分類識別的精度。
4 小結
將深度學習與水果識別系統(tǒng)相結合,提出了一種改進的深度置信網(wǎng)絡用于水果分類識別。結果表明,本研究方法能夠充分吸收特征信息,特征表示能力強,提高了識別精度。與文獻[20]和文獻[21]相比,所提出的方法在蘋果、檸檬、草莓和柑橘的分類識別中具有較高的準確率,識別準確率為98.75%,該研究具有一定的應用價值。但所作研究仍存在一些問題,如運算效率較低,后續(xù)應進一步提高該方法的性能。
參考文獻:
[1] 李佳俊,朱子峰,劉洪鑫, 等. 基于改進Faster R-CNN模型的草莓果實識別算法[J]. 湖北農(nóng)業(yè)科學, 2023,62(11): 183-190.
[2] 楊志銳, 鄭 宏, 郭中原, 等. 基于網(wǎng)中網(wǎng)卷積神經(jīng)網(wǎng)絡的紅棗缺陷檢測[J]. 食品與機械, 2020,36(2): 140-145, 181.
[3] 徐清華, 鄭譽煌, 戴冰燕. 基于深度殘差網(wǎng)絡的水果圖像分類算法研究[J]. 工業(yè)控制計算機, 2020, 33(12):37-38,40.
[4] 賈艷平,桑妍麗,李月茹. 基于改進Faster R-CNN模型的水果分類識別[J]. 食品與機械, 2023,39(8): 129-135.
[5] 曾平平,李林升. 基于卷積神經(jīng)網(wǎng)絡的水果圖像分類識別研究[J].機械設計與研究, 2019, 35(1): 23-26, 34.
[6] 田有文, 吳 偉, 盧時鉛, 等. 深度學習在水果品質檢測與分級分類中的應用[J]. 食品科學, 2021, 42(19): 260-270.
[7] 黃豪杰, 段先華, 黃欣辰.基于深度學習水果檢測的研究與改進[J].計算機工程與應用, 2020, 56(3): 127-133.
[8] 王 輝, 張 帆, 劉曉鳳, 等. 基于DarkNet-53和YOLOv3的水果圖像識別[J].東北師大學報(自然科學版), 2020, 52(4): 60-65.
[9] INDIRA D, GODDU J, INDRAJA B,et al. A review on fruit recognition and feature evaluation using CNN[J]. Materials today: Proceedings, 2023, 80(3):3438-3443.
[10] 薛 勇, 王立揚, 張 瑜, 等. 基于 GoogLeNet 深度遷移學習的蘋果缺陷檢測方法[J]. 農(nóng)業(yè)機械學報, 2020, 51(7): 30-35.
[11] 周靖宇,孫 銳,余 多,等 . 基于近紅外技術和偏最小二乘判別法對無花果成熟度的快速判別[J]. 食品與機械,2020,36(11):107-111.
[12] 張 錚, 熊盛輝, 王孫強, 等 . 基于機器視覺的香蕉果肉缺陷預測方法[J]. 食品與機械, 2020, 36(7): 150-154.
[13] 張義志, 王 瑞, 張偉峰, 等 . 高光譜技術檢測農(nóng)產(chǎn)品成熟度研究進展[J]. 湖北農(nóng)業(yè)科學, 2020, 59(12): 5-8, 12.
[14] 楊晨昱,袁鴻飛,馬惠玲,等. 基于傅里葉近紅外光譜和電子鼻技術的蘋果霉心病無損檢測[J]. 食品與發(fā)酵工業(yè),2021,47(7):211-216.
[15] 劉 芳,劉玉坤, 林 森, 等. 基于改進型YOLO的復雜環(huán)境下番茄果實快速識別方法[J]. 農(nóng)業(yè)機械學報, 2020, 51(6):229-237.
[16] 趙利平, 吳德剛. 融合GA的三點定位夜間蘋果目標的識別算法研究[J]. 中國農(nóng)機化學報, 2020, 41(5): 134-138.
[17] 宋海濤,何文浩,原 魁. 一種基于SIFT特征的機器人環(huán)境感知雙目立體視覺系統(tǒng)[J]. 控制與決策,2019,34(7):1 545-1 552.
[18] 馮 喆, 李衛(wèi)豪, 崔 笛. 基于高光譜成像和深度學習的山核桃內源性異物檢測[J].農(nóng)業(yè)機械學報,2021, 52(S1): 466-471.
[19] 王紅霞, 周家奇, 辜承昊, 等.用于圖像分類的卷積神經(jīng)網(wǎng)絡中激活函數(shù)的設計[J]. 浙江大學學報(工學版),2019,53(7):1363-1373.
[20] 廉小親, 成開元, 安 颯, 等. 基于深度學習和遷移學習的水果圖像分類[J]. 測控技術, 2019, 38(6): 15-18.
[21] LI D H, SHEN M M," LI D, et al. Green apple recognition method based on the combination of texture and shape features[A]. 2017" IEEE" international" conference" on" mechatronics" and" automation (ICMA)[C]. Takamatsu: IEEE, 2017.264-269.
基金項目:煙臺職業(yè)學院校本科研項目(2023XBZC035);山東省教育廳教育課題項目(2014zcj081)
作者簡介:郭迎娣(1979-),女,山東濰坊人,講師,主要從事電子信息等研究,(電話)13256987756(電子信箱)13256987756@163.com。