李金玉,陳曉雷,張愛華,李 策,林冬梅
(1.蘭州理工大學(xué)電氣工程與信息工程學(xué)院,蘭州 730050;2.蘭州理工大學(xué) 甘肅省工業(yè)過程先進(jìn)控制重點實驗室,蘭州 730050;3.蘭州理工大學(xué)電氣與控制工程國家級實驗教學(xué)示范中心,蘭州 730050)
隨著我國經(jīng)濟(jì)的高速發(fā)展,城鎮(zhèn)人口日益增多,城市生活垃圾迅猛增長。逐年增長的城市生活垃圾,不僅對城市發(fā)展帶來阻力,而且對生態(tài)環(huán)境的破壞帶來不可估量的影響。因此,2018 年由國務(wù)院發(fā)布的《關(guān)于全面加強(qiáng)生態(tài)環(huán)境保護(hù)堅決打好污染防治攻堅戰(zhàn)的意見》中要求加快推進(jìn)垃圾分類實施,到2020 年實現(xiàn)所有城市生活垃圾分類處理全覆蓋。垃圾分類已成為國家生態(tài)環(huán)境保護(hù)、促進(jìn)經(jīng)濟(jì)發(fā)展的重要舉措。
由于城市生活垃圾多數(shù)為多種廢棄物的混合體,無論是采取衛(wèi)生填埋、堆肥,還是焚燒的處理方式,都不能有效地解決生活垃圾所帶來的問題。通過分類改變垃圾的混雜性是實現(xiàn)垃圾處理資源化、減量化、無害化的重要前提。傳統(tǒng)的生活垃圾分類方法主要有篩分、重力分選、風(fēng)力分選、浮力分選、磁力分選以及光點分選等,以上無論是哪種分選方法,人工分選都是不可或缺的一個環(huán)節(jié),用于挑選這些傳統(tǒng)分類方法無法識別的目標(biāo)物,以及傳統(tǒng)方法分類之后的進(jìn)一步質(zhì)量控制。然而,人工垃圾分選存在勞動強(qiáng)度大、監(jiān)督任務(wù)重、分選效率低和工作環(huán)境差等問題,急需智能化、自動化的分類方法取代傳統(tǒng)分類方法。
近年來,深度學(xué)習(xí)已滲透到各行各業(yè),如何利用深度學(xué)習(xí)高效地進(jìn)行垃圾分類已成為當(dāng)前的研究熱點。但是,目前還缺乏針對這一研究領(lǐng)域的綜述性研究,本文主要對目前已有的深度學(xué)習(xí)垃圾分類方法進(jìn)行綜述,分析近年來深度學(xué)習(xí)相關(guān)方法在垃圾分類中的應(yīng)用,將其歸納整合為基于ResNet 的方法、基于DenseNet 的方法、基于單階段目標(biāo)檢測的方法和基于卷積神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)相結(jié)合的方法,在此基礎(chǔ)上總結(jié)各個方法的分類效果及優(yōu)缺點,分析并探討基于深度學(xué)習(xí)的垃圾分類研究面臨的挑戰(zhàn)和未來發(fā)展方向。
深度學(xué)習(xí)能夠有效地解決傳統(tǒng)機(jī)器學(xué)習(xí)中手工特征提取不全和選擇繁瑣的問題,挖掘樣本數(shù)據(jù)的內(nèi)在規(guī)律,并帶來性能的改善,廣泛應(yīng)用于計算機(jī)視覺[1]、自然語言處理[2]、數(shù)據(jù)挖掘[3]等領(lǐng)域。因此,基于深度學(xué)習(xí)的垃圾分類方法為垃圾分類指出了一條新的道路,本節(jié)根據(jù)不同深度學(xué)習(xí)模型對現(xiàn)有深度學(xué)習(xí)垃圾分類方法進(jìn)行闡述,并給出各種方法在垃圾分類領(lǐng)域的算法及模型的總結(jié)對比。
ResNet[4]基本框架如圖1 所示,其最大的特點是在進(jìn)行特征提取時,直接將輸入信息繞道傳到輸出端,極大增加網(wǎng)絡(luò)深度,從最初的十幾層增加到后來的150 多層,并且不會產(chǎn)生過擬合現(xiàn)象。
圖1 ResNet 基本框架Fig.1 ResNet basic framework
文獻(xiàn)[5]提出一種基于ResNet50 和支持向量機(jī)(SVM)[6]的智能廢料分類系統(tǒng),該系統(tǒng)采用ResNet50進(jìn)行特征提取,通過SVM 對所提取到的特征進(jìn)行分類,在TrashNet 數(shù)據(jù)集上的準(zhǔn)確率達(dá)到87%。然而,SVM只對小樣本數(shù)據(jù)具有較好的分類效果,故該方法不具有通用性。
文獻(xiàn)[7]提出基于ResNet 和Inceptionv-4[8]的垃圾自動分類DSCR 網(wǎng)絡(luò),該網(wǎng)絡(luò)構(gòu)建一個IR-Block使得模型在多尺度上獲得更多的特征,解決了由于使用縮減模塊(reduction module)導(dǎo)致模型過于敏感的問題,準(zhǔn)確率達(dá)到94.38%。文獻(xiàn)[9]提出一種注意力機(jī)制模型,該模型通過完成局部、全局的特征提取和特征融合機(jī)制等手段建立了垃圾圖像分類模型GCNet,能獲取更加有效完善特征信息,通過有效利用特征信息進(jìn)而避免梯度消失的現(xiàn)象。
文獻(xiàn)[10]提出的自動垃圾檢測系統(tǒng)使用ResNet網(wǎng)絡(luò)作為卷積層,輸入數(shù)據(jù)集圖像后通過ResNet 的共享卷積層生成特征圖,再通過RPN(區(qū)域提議網(wǎng)絡(luò))層得到輸出,生成大量的區(qū)域建議,該方法很好地克服了區(qū)域誤檢問題。文獻(xiàn)[11]修改了原始ResNext 模型,在全局平均池化層之后添加了兩個全連接層以提高網(wǎng)絡(luò)的分類性能,能夠快速實現(xiàn)分類模型的穩(wěn)定和泛化,相比于ResNet-101,該方法對金屬、紙張和塑料的分類性能表現(xiàn)較差,如何利用這些樣本的獨有特征提高分類精度值得深入探索。
文獻(xiàn)[12]從輸入圖像的多特征融合、殘差單元的特征重用和新激活函數(shù)的設(shè)計3個方面對ResNet-34算法進(jìn)行優(yōu)化,該方法改進(jìn)的ResNet-34 對小目標(biāo)物體檢測結(jié)果較好,但對嵌入式等移動設(shè)備而言,由于該方法運算量太大,無法保證垃圾分類的實時性。針對此問題,研究人員通過減少ResNet 模型的參數(shù)量實現(xiàn)輕量級的垃圾分類,以促使分類任務(wù)能夠在移動手機(jī)端、嵌入式等設(shè)備上執(zhí)行。文獻(xiàn)[13]提出一種基于輕量級殘差網(wǎng)絡(luò)MAPMobileNet-18,通過使用最大平均組合池化代替Bottleneck 中的最大池化與平均池化,深度可分離卷積替換Bottleneck 中的3×3 卷積核,模型參數(shù)量在理論上減少為原來的1/8,在保持模型精度不變的同時提高了模型的運算效率。在ResNet-18 中的BasicBlock后串聯(lián)添加通道注意力機(jī)制[14]和空間注意力機(jī)制[15],用殘差塊替換了BasicBlock 中的3×3 卷積核,使網(wǎng)絡(luò)模型更適合使用移動手機(jī)端等計算能力較差的設(shè)備進(jìn)行垃圾分類。
文獻(xiàn)[16]基于ResNet50設(shè)計一種輕量級垃圾分類模型GA_MobileNet,利用深度卷積和分組卷積減少計算量和參數(shù),通過通道注意力機(jī)制提高模型的準(zhǔn)確性。相對于原始模型,該模型分類精度更高,占用內(nèi)存更少,能夠解決垃圾分類在嵌入式設(shè)備上的應(yīng)用問題。
DenseNet[17]為確保網(wǎng)絡(luò)中最大的信息流通,使每層都與該層之前的所有層相連,即每層的輸入是前面所有層的輸出,從而可以有效減輕梯度彌散,加強(qiáng)特征的傳播和復(fù)用,減少模型參數(shù)量。
文 獻(xiàn)[18]將AlexNet[19]、VGG16、ResNet50、DesneNet169 在數(shù)據(jù)集TrashNet 上進(jìn)行驗證,結(jié)果表明,DenseNet169 性能更好,檢測精度達(dá)到94.9 %。文獻(xiàn)[20]提出一種新的密集連接模式構(gòu)建了智能垃圾分類網(wǎng)絡(luò)RecycleNet,該網(wǎng)絡(luò)改變了原始Densenet121密集塊內(nèi)跳躍連接的連接模式,可以將Densenet121 網(wǎng)絡(luò)中的參數(shù)數(shù)量從700 萬減少到大約300 萬,很大程度上縮短了檢測時間。
Densenet121 全連接層的分類能力是非常明顯的,但全連接層的參數(shù)占整個網(wǎng)絡(luò)參數(shù)的80%。為了在提高分類性能和減少網(wǎng)絡(luò)參數(shù)之間獲得平衡,文獻(xiàn)[21]利用遺傳算法優(yōu)化了DenseNet121 全連接層的超參數(shù)以提高精度,實驗結(jié)果表明,使用兩個全連接層作為DenseNet121 的分類器,相比配備有全局平均池化和softmax 分類器的原始DenseNet121,在垃圾分類任務(wù)上表現(xiàn)更好。
單階段目標(biāo)檢測方法以結(jié)構(gòu)簡單、計算高效,同時具備較高檢測精度的優(yōu)勢,在實時目標(biāo)檢測領(lǐng)域中具有廣泛的研究和應(yīng)用價值[22]。文獻(xiàn)[23]采用改進(jìn)的YOLOv2 網(wǎng)絡(luò)模型進(jìn)行裝修垃圾檢測和識別,并通過目標(biāo)盒維數(shù)聚類和分類網(wǎng)絡(luò)預(yù)訓(xùn)練來提高YOLOv2 模型的性能,使 用MobileNet[24]代 替YOLOv2 原來的Darknet-19 進(jìn)行垃圾檢測,將整個改進(jìn)的模型移植到嵌入式模塊中得到較好的分類效果。
文獻(xiàn)[25]提出一種YOLOv2-dense 網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠有效解決隨著深度卷積深度增加而帶來的梯度消失問題,并且還能夠很好地復(fù)用與融合圖像淺層特征和深層特征。改進(jìn)后的YOLOv2-Dense 算法可以保留更多的淺層圖像信息,提取目標(biāo)特征的能力顯著提高,可在不同光照、背景、視角與分辨率情況下進(jìn)行精確實時的垃圾定位和檢測。
文獻(xiàn)[26]研究YOLOv3 算法在垃圾分類中的應(yīng)用,在自制數(shù)據(jù)集上的mAP 值達(dá)到94.99%。文獻(xiàn)[27]構(gòu)建了面向瓶罐識別分類的網(wǎng)絡(luò)模型并進(jìn)行實驗驗證,針對YOLOv3 對小目標(biāo)不敏感的問題,用GIOU 替代傳統(tǒng)的IOU,通過K-means 聚類算法來優(yōu)化錨框尺寸。實驗結(jié)果表明,改進(jìn)后的YOLOv3 算法識別精確率比原始算法提高約4%。文獻(xiàn)[28]提出一種新的基于YOLO 的變分自動編碼器神經(jīng)網(wǎng)絡(luò)模型,該模型由卷積特征提取器、卷積預(yù)測器和解碼器組成。經(jīng)過訓(xùn)練過程,該模型以3 210 萬個參數(shù)和60 frame/s 的處理速度達(dá)到69.70%的準(zhǔn)確率,使其可應(yīng)用于現(xiàn)實生活的垃圾回收場景。
文獻(xiàn)[29]介紹一種LSSD 算法,該算法克服SSD[30]算法存在小目標(biāo)丟失和用不同大小框同時檢測同一目標(biāo)的缺點,建立一個在所有類型的尺度上都具有更強(qiáng)語義的新特征金字塔,將Focal Loss[31]函數(shù)代替?zhèn)鹘y(tǒng)損失函數(shù)解決了單階段目標(biāo)檢測方法正負(fù)樣本比例嚴(yán)重失衡的問題。
深度學(xué)習(xí)的性能提高主要依賴于大量的訓(xùn)練數(shù)據(jù)集,與其他領(lǐng)域的大規(guī)模數(shù)據(jù)集(如ImageNet 數(shù)據(jù)集)等相比,當(dāng)前公開的垃圾數(shù)據(jù)集數(shù)量和種類很少,有限地標(biāo)注垃圾數(shù)據(jù)集已成為深度學(xué)習(xí)方法在垃圾圖像分類中的應(yīng)用瓶頸。因此,研究人員利用遷移學(xué)習(xí)來解決垃圾分類的小樣本數(shù)據(jù)集問題。
文獻(xiàn)[32]提出一種基于遷移學(xué)習(xí)和Inceptionv3[33]的垃圾圖像分類方法,該方法保留了Inceptionv3 模型出色的特征提取能力,可以提供有效的計算機(jī)輔助檢測,在圖像數(shù)據(jù)不足時具有較高的識別精度。文獻(xiàn)[34]在“華為云人工智能大賽·垃圾分類挑戰(zhàn)杯”上,發(fā)揮深度遷移學(xué)習(xí)的優(yōu)勢,構(gòu)建一種端到端面向細(xì)粒度垃圾圖像分類的遷移模型GANet。實驗結(jié)果表明,該方法能較好地應(yīng)對多分辨率、多尺度、多粒度垃圾圖像的特征提取,有效緩解過擬合,提高收斂速度,減少訓(xùn)練參數(shù)。
文獻(xiàn)[35]提出基于Inception-v3 網(wǎng)絡(luò)特征提取模型和遷移學(xué)習(xí)相結(jié)合的垃圾分類方法,該方法使用2 個1×n和n×1 的卷積核取代n×n的卷積核以減小計算量,RMSprop(Root Mean Square prop)替代SGD(Stochastic Gradient Descent)對模型進(jìn)行優(yōu)化以提取更多特征,利用LSR(Label Smoothing Regularization)方法降低過擬合。文獻(xiàn)[36]提出一種擴(kuò)展特定網(wǎng)絡(luò)層分支的新方法來拓寬Xception[37]網(wǎng)絡(luò)結(jié)構(gòu),將網(wǎng)絡(luò)底層的信息映射到網(wǎng)絡(luò)高層,傳輸梯度可以無損,從而解決了反向傳播的負(fù)面效應(yīng)。實驗結(jié)果表明,該方法對遮擋環(huán)境下的垃圾分類效果較好。
文獻(xiàn)[38]在Inception-v3 模型的基礎(chǔ)上,使用遷移學(xué)習(xí)來訓(xùn)練一個專門識別垃圾類別的模型,通過對算法的研究和模型的修改,在實際效果下的識別率較高。文獻(xiàn)[39]開源一個基于TACO 數(shù)據(jù)集的數(shù)據(jù)集AquaTrash,在此數(shù)據(jù)集上應(yīng)用了基于深度學(xué)習(xí)的對象檢測模型AquaVision,該模型可以檢測和分類漂浮在海洋和海岸上的不同污染物和有害廢物,平均精度達(dá)到81.48%。
文獻(xiàn)[40]設(shè)計一個新的增量學(xué)習(xí)框架GarbageNet,以解決垃圾分類面臨的缺乏足夠數(shù)據(jù)、高成本的類別增量和噪聲標(biāo)簽等問題,使用增量學(xué)習(xí)方法使模型不斷從新樣本中學(xué)習(xí)和更新,通過AFM(Attentive Feature Mixup)消除噪聲標(biāo)簽的影響,在華為云垃圾數(shù)據(jù)集上以可接受的推理速度達(dá)到了96.96%的最佳性能。
表1對以上基于深度學(xué)習(xí)的垃圾分類方法從所使用的基礎(chǔ)網(wǎng)絡(luò)、數(shù)據(jù)集、是否進(jìn)行數(shù)據(jù)增強(qiáng)、使用場景、測試精度、優(yōu)缺點等方面進(jìn)行了詳細(xì)總結(jié),其中使用場景“單”表示單目標(biāo),“多”表示多目標(biāo),背景單一指圖像背景是固定的,背景復(fù)雜則指圖像的背景處于不同環(huán)境下,(1)表示引用Trash垃圾數(shù)據(jù)集[42],(2)表示引用華為云人工智能大賽,見https://competition.huaweicloud.com/information/1000007620/introduction?track=107。
表1 基于深度學(xué)習(xí)的垃圾分類方法對比Table 1 Comparison of garbage classification methods based on deep learning
續(xù)表
由于開源的垃圾數(shù)據(jù)集較少,研究人員一般采用自行拍攝和互聯(lián)網(wǎng)查找的方式建立數(shù)據(jù)集。
TrashNet 數(shù)據(jù)集[41]由斯坦福大學(xué)的YANG 等創(chuàng)建,通過將物體放置在白色海報板上并使用自然光或室內(nèi)照明來采集圖像,所有圖像均調(diào)整為512×384 的空間分辨率。該數(shù)據(jù)集包含6 類垃圾的RGB圖像,其中每個圖像僅包含一種類型的垃圾,分別是:玻璃、紙張、紙板、塑料、金屬和普通垃圾。當(dāng)前,該數(shù)據(jù)集由2 527 張圖像組成,每類包含的圖像數(shù)量具體為:玻璃501 張,紙張594 張,紙板403 張,塑料482 張,金 屬410張和普通垃 圾137 張。
GINI[42]數(shù)據(jù)集包 含2 561 張垃圾圖像,其中956 張圖像通過在互聯(lián)網(wǎng)上查詢“路邊垃圾”、“市場垃圾”等垃圾相關(guān)的關(guān)鍵詞獲得。該數(shù)據(jù)集的每個圖像還標(biāo)注了其嚴(yán)重程度和可生物降解性的水平。
2020 年深圳舉辦“華為云人工智能大賽-垃圾分類挑戰(zhàn)杯”數(shù)據(jù)應(yīng)用創(chuàng)新大賽發(fā)布了一組生活垃圾圖像數(shù)據(jù)集,該數(shù)據(jù)集有4個大類和44個小類,總計14 964張圖像,數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)是標(biāo)準(zhǔn)的VOC格式,見https://modelarts-competitions.obs.cn-north-1.myhua weicloud.com/garbage_classify/dataset/garbage_classify.zip。
TACO[43]是一個用于垃圾分類和檢測的數(shù)據(jù)集,包括1 500 張圖像和4 784 個標(biāo)注,盡管該數(shù)據(jù)集非常小,但是在此數(shù)據(jù)集上可以進(jìn)行垃圾分類和垃圾的邊緣檢測。
AquaTrash[39]數(shù)據(jù)集通過對TrashNet 數(shù)據(jù)集和TACO 數(shù)據(jù)集進(jìn)行比較研究后,發(fā)現(xiàn)兩個數(shù)據(jù)集都有一些缺點,例如TrashNet 數(shù)據(jù)集沒有注釋,TACO數(shù)據(jù)集的注釋不可靠等,因此提出AquaTrash 數(shù)據(jù)集,該數(shù)據(jù)集包含來自與各種垃圾物品相關(guān)的4 個不同類別的369 張圖像。其中所有圖像都經(jīng)過手動注釋以獲得結(jié)果的準(zhǔn)確性。
垃圾分類公開數(shù)據(jù)集如表2 所示。
表2 現(xiàn)有垃圾分類公開數(shù)據(jù)集Table 2 Existing garbage classification public dataset
深度學(xué)習(xí)以精度高、速度快、穩(wěn)定性強(qiáng)、特征可重用性高等優(yōu)勢在垃圾圖像分類任務(wù)領(lǐng)域中表現(xiàn)優(yōu)異,但深度學(xué)習(xí)在垃圾圖像分類應(yīng)用中還存在著一些無法規(guī)避的問題亟待解決:1)可用數(shù)據(jù)集少,對數(shù)據(jù)依賴性高;2)現(xiàn)有的模型訓(xùn)練與預(yù)測耗費大量時間和成本,需設(shè)計輕量級網(wǎng)絡(luò);3)現(xiàn)有方法關(guān)注單目標(biāo)和少目標(biāo)數(shù)據(jù)且背景簡單,難以適應(yīng)現(xiàn)實生活中垃圾種類多、數(shù)量大、背景復(fù)雜的特點,需設(shè)計復(fù)雜情況下魯棒性好的多目標(biāo)檢測網(wǎng)絡(luò)。
目前,垃圾分類領(lǐng)域公開的數(shù)據(jù)集較少,構(gòu)建數(shù)量龐大、內(nèi)容豐富的垃圾數(shù)據(jù)集需要耗費大量的資源和成本。而主動學(xué)習(xí)(Active Learning)[44]、零樣本學(xué)習(xí)[45]、遷移學(xué)習(xí)[46]等方法放寬了對數(shù)據(jù)集的要求和依賴性。將深度學(xué)習(xí)與主動學(xué)習(xí)、零樣本學(xué)習(xí)和遷移學(xué)習(xí)相結(jié)合很可能成為消除或減少數(shù)據(jù)依賴的突破口。
主動學(xué)習(xí)能通過自適應(yīng)查詢策略選擇大量未標(biāo)注的數(shù)據(jù)交由專門人員進(jìn)行標(biāo)記,用盡可能少的高質(zhì)量標(biāo)注數(shù)據(jù)訓(xùn)練高性能的模型,主要有基于預(yù)設(shè)計策略和基于學(xué)習(xí)損失的主動學(xué)習(xí)方法,但目前的多數(shù)主動學(xué)習(xí)方法主要是針對特定任務(wù)而預(yù)設(shè)計采樣策略,如何在垃圾圖像分類領(lǐng)域設(shè)計采樣策略是主動學(xué)習(xí)應(yīng)用的難點。
零樣本學(xué)習(xí)框架如圖2 所示,零樣本學(xué)習(xí)在圖像分類中主要包括基于空間嵌入和基于生成模型兩種方法,能將可見類學(xué)習(xí)到的屬性遷移到不可見類上,建立可見類與不可見類的耦合關(guān)系,實現(xiàn)在沒有學(xué)習(xí)不可見類標(biāo)簽樣本的前提下對不可見類的分類,對垃圾分類模型的長久可用性具有重要意義,如何消除零樣本學(xué)習(xí)在垃圾分類領(lǐng)域中出現(xiàn)的領(lǐng)域漂移、樞紐點和語義鴻溝等問題有著巨大的研究前景。
圖2 零樣本學(xué)習(xí)框架Fig.2 Framework of zero-shot learing
深度學(xué)習(xí)與遷移學(xué)習(xí)結(jié)合的方法已經(jīng)有了一些成果[47],可以通過遷移對所傳輸?shù)淖泳W(wǎng)絡(luò)進(jìn)行微調(diào)以適應(yīng)新的數(shù)據(jù),再進(jìn)行深度特征的挖掘,能有效解決垃圾圖像小規(guī)模數(shù)據(jù)集的問題。隨著深度學(xué)習(xí)在各個領(lǐng)域的廣泛應(yīng)用,大量的深度遷移學(xué)習(xí)方法被提出,利用深度學(xué)習(xí)在無監(jiān)督或半監(jiān)督學(xué)習(xí)中進(jìn)行知識的遷移將會受到越來越多的關(guān)注。預(yù)計未來的研究將集中在使用很少的標(biāo)注數(shù)據(jù)以獲得更好的結(jié)果。
盡管目前提出的輕量級網(wǎng)絡(luò)方法很多,但這些模型通常只針對通用物體檢測,當(dāng)前較少有專注于垃圾檢測和分類的輕量級模型,深度學(xué)習(xí)在垃圾分類領(lǐng)域依舊面臨運算復(fù)雜、時效性差、成本高等問題。
目前主流的網(wǎng)絡(luò)輕量化方法主要有:
1)首先通過逐點卷積(Pointwise Convolution,PW)對數(shù)據(jù)進(jìn)行降維,然后進(jìn)行常規(guī)卷積核的卷積,最后根據(jù)PW 對數(shù)據(jù)進(jìn)行升維;
2)多尺度卷積和多個小卷積代替大卷積;
3)權(quán)值量化;
4)使用depth-wise 卷積等操作,起到減少網(wǎng)絡(luò)計算量的作用。
因此,針對垃圾圖像特性設(shè)計提出輕量級模型,降低運算成本和復(fù)雜度,使其能夠在實時垃圾檢測和分類領(lǐng)域上帶來新的突破。主流輕量化方法的優(yōu)缺點對比如表3 所示。
表3 主流輕量化方法的優(yōu)缺點對比Table 3 Comparison of advantages and disadvantages of mainstream lightweight methods
多目標(biāo)檢測和多目標(biāo)跟蹤在交通監(jiān)控、自動駕駛以及虛擬現(xiàn)實等領(lǐng)域已有廣泛應(yīng)用[48]。為適應(yīng)我國垃圾復(fù)雜度高、數(shù)量大的特點,多目標(biāo)垃圾檢測和分類在垃圾焚燒發(fā)電廠等垃圾處理的末端有很大的應(yīng)用前景,可采用在算法中增加更精細(xì)的特征提取層和大尺度特征層上的檢測輸出,改進(jìn)現(xiàn)有的深度學(xué)習(xí)模型。
值得注意的是如紐扣電池等小體積垃圾的正確分類非常重要,此類小目標(biāo)垃圾像素少,圖像模糊,難以提取有效的特征,一直是目標(biāo)檢測領(lǐng)域中的熱點和難點,常用的方法是用不同分辨率的分類器確定小目標(biāo)物體的關(guān)鍵點,利用空洞卷積、特征金字塔[49](FPN)、極端尺寸檢測[50](SNIP)等進(jìn)行多尺度方法處理和利用生成對抗網(wǎng)絡(luò)、提高小物體檢測率將是更具挑戰(zhàn)和發(fā)展前景的研究方向。
本文總結(jié)垃圾分類領(lǐng)域中深度學(xué)習(xí)應(yīng)用的研究現(xiàn)狀,從算法特點及模型方面介紹經(jīng)典的垃圾分類方法并進(jìn)行分類、評估、對比不同方法和模型在數(shù)據(jù)集上的分類效果。通過分析深度學(xué)習(xí)在垃圾分類應(yīng)用中的有效性,指出基于深度學(xué)習(xí)的垃圾分類方法是未來發(fā)展的重要方向,但面對準(zhǔn)確度高、實時性強(qiáng)的應(yīng)用需求,垃圾分類的發(fā)展仍面臨較多的挑戰(zhàn)。因此,研究人員應(yīng)針對減少對標(biāo)注數(shù)據(jù)集的依賴、輕量級網(wǎng)絡(luò)模型設(shè)計和適應(yīng)多目標(biāo)網(wǎng)絡(luò)模型進(jìn)行研究,提升深度學(xué)習(xí)技術(shù)在垃圾分類領(lǐng)域內(nèi)的應(yīng)用能力。