陳 輝
(塔里木大學 信息工程學院,新疆 阿拉爾 843300)
水果因其鮮美可口和富含多種營養(yǎng)受到許多消費者的喜愛,隨著生活水平的不斷提高,消費者開始越來越多注重水果品質,但水果在采收、貯藏、運輸等環(huán)節(jié)會因操作不當或意外發(fā)生損傷,造成腐爛,在生產環(huán)節(jié)易受病蟲害影響,從而影響水果品質。為了解決該問題,需對水果進行檢測,篩選出有損傷的水果,提高水果的商品質量。在對水果品質進行檢測時,若使用人工進行評判,會受檢測人員的經驗水平影響,其受主觀性較大,使得檢測結果參差不齊,難以形成規(guī)范。深度學習因其能提取目標的全局特征和局部特征,且能從大量數據中提取特征,在數據處理方面優(yōu)勢明顯,在目標檢測識別領域深受歡迎。深度學習的特性在水果檢測和病蟲害識別等方面受到了廣泛關注。
深度學習[1](Deep Learning,DL)是機器學習的子集,機器學習從淺層機器學習發(fā)展到深度學習。深度學習是一種表示學習能夠學到數據更高層次的抽象表示,能自動從數據中提取特征。通過對模型進行預訓練,能持續(xù)不斷地調整及優(yōu)化特征,可用于更快速方便地處理大量數據,擁有更好的性能和更高的精度。DL中的“深度”意指神經網絡的層之深,最常見的人工神經網絡由輸入層、隱藏層和輸出層組成如圖1所示,依次為輸入層、隱藏層和輸出層。
圖1 深度神經網絡
卷積神經網絡[2](Convolutional Neural Network,CNN)是一種特殊的深層前饋網絡,CNN主要包含輸入層、卷積層、池化層、全連接層及輸出層。但是,在網絡結構中,為了使輸出更加準確,特征提取更加豐富,通常網絡模型中使用多卷積層和多池化層相結合的網絡模型,卷積神經網絡分類模型的優(yōu)勢在于,摒棄了復雜煩瑣的圖像預處理過程,并將特征提取、分類器識別等模塊的功能集合在一個網絡里,節(jié)省了特征提取和數據重建等工作。同時整個網絡模型的復雜度得到簡化,層與層之間參數值的數量也有效減少,最終導致網絡的訓練學習和識別更容易,而且還提升了圖像分類的泛化能力及精準度。
循環(huán)神經網絡[3](Recurrent Neural Networks,RNN)主要是用來解決序列數據問題。RNN隨著時間的推移反復迭代的結構實現對序列數據的學習。RNN的高維隱藏狀態(tài)和非線性演化特性賦予了其更加強大復雜的表達分析能力,使RNN的隱藏狀態(tài)都能夠同時整合多個時間步節(jié)點上的信息,并利用其進行準確的預測。RNN在訓練中會出現梯度消失問題,采用長短期記憶算法LSTM來解決此類問題。
生成對抗網絡(Generative Adversarial Networks,GAN)是一種無監(jiān)督深度學習模型,通過計算機生成數據,GAN由生成器和判別器組成,生成器通過機器產生數據,判別器負責對這些數據進行檢測判別其是真數據還是假數據,通過不斷循環(huán),獲得所需輸出。
深度學習算法眾多紛雜,不同的算法適用于不同的應用場景,選用合適的深度學習算法對水果品質檢測準確率和效率非常重要,深度學習主流的目標檢測算法有Faster R-CNN、YOLO、SSD等。
2.1.1 YOLO算法
2016年,Joseph Redmon等[4]人提出了一種單階段(one-stage)的目標檢測網絡YOLO。不久,YOLOv2也被提出,YOLOv2是一種單階段完整的對象檢測框架,是對YOLO的改進,使其更好、更快、更強。YOLOv2基于Darknet-19,其有19個卷積層,主要使用類似于VGGNet 的3×3過濾器。YOLOv2有22個卷積層和1個檢測層。YOLOv3基于Darknet-53,是YOLOv2的改進。并具有類似 ResNet的跳躍連接。YOLOv3為了獲取更有意義和更細粒度的信息,將下層特征映射與上層特征映射進行合并并進一步處理。YOLOv4參考跨級局部網絡的思想,在 YOLOv3的基礎上使用特征學習效果更強的交叉跨級局部網絡作為主干網絡。對特征圖進行堆疊、卷積采用空間金字塔池化,目的是擴大視覺感受也有利于全局檢測。路徑聚合網絡(Path Aggregation Network,PANet)將特征圖進行上下采樣,以此來融合提取到的圖像信息。最后YOLOv4生成三個檢測頭Head去檢測目標。不久后,YOLOv5被提出,是YOLOv4的改進, YOLOv5綜合了許多深度學習目標檢測算法的優(yōu)點。
2.1.2 Faster R-CNN算法
R-CNN模型最初由R Girshick等[5]提出,成為兩階段目標檢測R-CNN系列的開端。R-CNN通過不斷優(yōu)化改進相繼出現Fast R-CNN、Faster R-CNN。Faster R-CNN用區(qū)域生成網絡(Region Proposal Network, RPN)取代R-CNN的選擇搜索方法,具有檢測速度更快的優(yōu)點。Faster R-CNN的原理是以CNN為基礎輸入圖像,經過多層卷積層和池化層進入RPN。RPN將特征分為兩個部分通過卷積核來實現。一般來說,Faster R-CNN可以看作是Fast R-CNN加上一個RPN。
2.1.3 SSD算法
SSD是一種單階段目標檢測算法,采用多尺度目標檢測,從網絡不同層抽取目標不同尺度的特征做預測。SSD 是VGG16網絡的基礎上進行修改得到,使用兩個卷積層替換VGG16網絡最后的全連接層,然后在VGG網絡的后面再增加4個卷積層。
Faster R-CNN、YOLO、SSD均能達到實時性要求且精度較高,Fast R-CNN較其他兩種算法精度更高,但速度慢。YOLO特點是速度快,YOLO提取特征采用將輸入圖片分成網格,造成精度低。SSD 借鑒了Fast R-CNN和YOLO的特點,SSD特點是速度快,但其在訓練中產生較多超參數是一難點。未來研究可以結合多類算法的優(yōu)點進行改進,獲得合適的算法。
水果在采摘和運輸等環(huán)節(jié)受到損傷,容易產生腐爛,從而影響水果的品質,影響消費者的購買欲望。近年來,國內外眾多學者運用深度學習技術對水果品質外部檢測。
周輝禮[6]采用深度卷積神經網絡對蘋果表面成熟度進行了分類評估及識別,平均結果準確率達到82%。在檢測蘋果腐爛、裂紋和蟲眼等方面,實驗表明SSD_ResNet101比Faster R-CNN_ResNet101更佳。周勝安等[7]使用MobileNetV3 替代CenterNet原有的骨干網絡,加快檢測速度,對MobileNetV3模塊進行改進,提高模型對水果中小缺陷的識別。研究結果表明,深度CNN在分析水果內部力學損傷方面具有廣闊的應用前景。Ashutosh等[8]開發(fā)基于人工神經網絡(ANN)的蘋果分類器。測試工作量采用ANN方法計算,建模結果表明實驗數據和預測值之間有很好的一致性。較低的預測誤差證實了神經網絡模型是蘋果品質評價的有效工具。
水果糖度、酸度、堅實度等內部品質也是水果檢測的重點,深度學習無法檢測水果內部,需要結合光譜技術來檢測。近年來,深度學習和光譜技術結合廣泛應用于水果內部品質檢測,是一種精準、快速、無損的水果品質檢測手段。
溫馨[9]重點研究分析對象為臍橙、香梨,其果實糖度為檢測的關鍵指標,依托深度學習和可見/近紅外光譜技術,開發(fā)了一種水果糖度回歸模型(MLP-CNN)。MLP-CNN可實現對水果糖度的實時精準、快速測量、無損。高沖[10]應用高光譜與深度學習的技術,基于內外部品質無損檢測模型,開發(fā)品質檢測及分級裝置。結果表明,設計開發(fā)的蘋果品質檢測及分選裝置可以快速準確檢測蘋果綜合品質,分級準確率高,對促進蘋果產業(yè)發(fā)展有積極意義。GarillosManliguez等[11]研究分析對象為木瓜,預測木瓜的六種成熟度,提出了一種對可見光和高光譜兩種成像模式獲取數據,然后進行特征拼接來估測水果成熟度。樣品水果的形態(tài)變化通過RGB圖像可以很容易地測量,而從400~900 nm波長范圍的高光譜圖像中可以提取出與水果內部性質相關性的光譜特征,這是建立模型時必要因素。實驗表明,采用強大的深度卷積神經網絡模型和多模態(tài)輸入相結合,可以對水果成熟度進行分類。其表明,多模態(tài)深度學習架構和多模態(tài)成像在估測田間水果成熟度方面具有巨大的潛力,可以幫助果農估測最佳收獲時間和應用到其他農產品中,促進了深度學習在農業(yè)中的應用。
深度學習在水果品質檢測研究領域取得了顯著的成果,相比于機器學習等檢測技術優(yōu)勢明顯,傳統(tǒng)的檢測算法需要人為提取特征,且人為設計特征非常費時費力,參數的調整需要很長時間,不能很好適應不同的檢測識別問題。深度學習因其能自動提取特征,在目標檢測領域廣受歡迎。其在水果品質檢測方面準確率和速度都相對較高,越來越多的學者將其應用在水果品質檢測研究中。
深度學習做模型訓練需要大量數據,當前公開的水果數據集比較少,符合模型訓練的數據較少,數據采集需花費大量時間。深度學習模型訓練時間較長,對算力要求高。深度學習在水果品質檢測領域尚處在實驗研究階段,未被應用于生產生活方面。隨著計算機性能的提升,期待水果品質智能化檢測應用在生產生活中,提高水果分類識別和品質檢測效率,減少人力物力的投入。
(04)