崔博超 鄭江華 劉忠軍 馬 濤 沈江龍 趙雪迷
(1.新疆大學(xué)資源與環(huán)境科學(xué)學(xué)院 烏魯木齊 830046;2.新疆大學(xué)綠洲生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室 烏魯木齊 830046; 3.新疆林業(yè)有害生物防治檢疫局 烏魯木齊830000)
生態(tài)環(huán)境是人類文明存在和發(fā)展的基礎(chǔ),新疆作為絲綢之路經(jīng)濟(jì)帶核心區(qū),生態(tài)環(huán)境保護(hù)在新疆的發(fā)展戰(zhàn)略中占有重要的地位;古爾班通古特沙漠作為中國(guó)最大的固定半固定沙漠,其荒漠林作為沙漠邊緣城市的前沿保護(hù)地帶和天然生態(tài)屏障有著防風(fēng)固沙、改良土壤的重要作用,是維系新疆北部城市整體生態(tài)環(huán)境安全的重要保障。然而近十幾年來(lái),作為三大林業(yè)生物災(zāi)害之一的鼠害,在新疆每年平均發(fā)生面積約為414.57萬(wàn)hm2(康淑紅等,2015),給林業(yè)資源和生態(tài)環(huán)境保護(hù)造成重大損失。古爾班通古特沙漠邊緣的荒漠林長(zhǎng)期受到鼠害的嚴(yán)重威脅,導(dǎo)致荒漠化加劇,畜牧業(yè)生產(chǎn)受到阻礙,生態(tài)環(huán)境持續(xù)惡化(馮文武等,2014;陳夢(mèng)等,2014;梁倩玲等,2015)。大沙鼠(Rhombomysopimus) 是古爾班通古特沙漠邊緣荒漠林中最主要的害鼠,其大面積的采食和掘洞行為造成荒漠林灌木植被枯死,土壤沙化,風(fēng)沙四起,嚴(yán)重影響周圍居民的日常生活。不僅如此,大沙鼠還易造成鼠疫等流行性傳染病的大范圍傳播,威脅人類的生命安全(盛兆湖等,2015;Kausrudetal.,2007)。
新疆鼠害發(fā)生區(qū)多在人煙稀少、交通不便的荒漠林,危害面積大、鼠洞數(shù)量多,在統(tǒng)計(jì)調(diào)查鼠洞數(shù)量及分布情況時(shí)費(fèi)時(shí)費(fèi)力。因此,尋求一種自動(dòng)、準(zhǔn)確、高效的統(tǒng)計(jì)調(diào)查方法刻不容緩。與傳統(tǒng)的人工地面調(diào)查相比,遙感是一種高效、準(zhǔn)確的識(shí)別鼠洞技術(shù)。目前在國(guó)內(nèi)外已有學(xué)者將遙感探測(cè)技術(shù)應(yīng)用于鼠害監(jiān)測(cè),并取得了一定的成果。黃建文等(2004)基于TM衛(wèi)星影像對(duì)比梭梭(Haloxylonammodendron)林區(qū)中荒漠大沙鼠鼠害防治前后的土壤調(diào)節(jié)植被指數(shù)變化為鼠害防治和監(jiān)測(cè)提供科學(xué)依據(jù);Addink等(2010)利用quickbird衛(wèi)星建立了鼠洞監(jiān)測(cè)系統(tǒng);徐正剛(2013)運(yùn)用MODIS 衛(wèi)星影像提取湖南洞庭湖區(qū)綠色植被的植被指數(shù),并根據(jù)年季間指數(shù)的變化預(yù)估洞庭湖區(qū)東方田鼠(Microtusfortis)的暴發(fā)情況;本研究團(tuán)隊(duì)自2013年開(kāi)始低空遙感監(jiān)測(cè)鼠洞和鼠害,并取得了一些成果:軒俊偉等(2015)運(yùn)用動(dòng)力三角翼飛行器對(duì)鼠害區(qū)進(jìn)行航拍,在遙感目視解譯的基礎(chǔ)上獲取試驗(yàn)區(qū)鼠害的空間分布及危害程度情況;溫阿敏等(2018)運(yùn)用UAV低空遙感對(duì)荒漠林大沙鼠鼠洞進(jìn)行監(jiān)測(cè),探究大沙鼠低空遙感影像的最佳解譯方法;馬濤等(2018a;2018b)運(yùn)用無(wú)人機(jī)(UAV)低空遙感,基于遙感目視解譯對(duì)荒漠林大沙鼠洞群覆蓋率及分布特征進(jìn)行研究,同時(shí)還探究荒漠林大沙鼠鼠洞分布與地形的關(guān)系。周曉琳等(2018)運(yùn)用UAV低空遙感結(jié)合面向?qū)ο蟮哪0迤ヅ浞ê椭С窒蛄繖C(jī)法對(duì)草原鼠洞進(jìn)行識(shí)別定位,2種方法的準(zhǔn)確度分別在89%和90%左右;孫迪等(2019)運(yùn)用極大似然法和面向?qū)ο蠓诸惙椒ㄌ崛∈蠖矗?種方法的準(zhǔn)確度分別為69%和91%。上述研究體現(xiàn)了在利用低空遙感對(duì)鼠害進(jìn)行監(jiān)測(cè)研究時(shí)的實(shí)時(shí)性,靈活性,但在解譯鼠洞時(shí),大都使用目視及傳統(tǒng)機(jī)器學(xué)習(xí)方法進(jìn)行解譯,目視解譯雖然保證了準(zhǔn)確率,但其需花費(fèi)大量時(shí)間,對(duì)監(jiān)測(cè)的實(shí)時(shí)性有較大影響。傳統(tǒng)機(jī)器學(xué)習(xí)方法在一定程度上保證了監(jiān)測(cè)的實(shí)時(shí)性,但在準(zhǔn)確率方面仍有較大的改進(jìn)空間。
將機(jī)器視覺(jué)與無(wú)人機(jī)遙感相結(jié)合運(yùn)用于荒漠林大沙鼠鼠害調(diào)查與防治是一種新的研究思路。目前國(guó)內(nèi)已有大量學(xué)者利用無(wú)人機(jī)作為遙感平臺(tái)結(jié)合機(jī)器視覺(jué)進(jìn)行科學(xué)研究。鄭二功等(2018)運(yùn)用無(wú)人機(jī)遙感結(jié)合FCN框架對(duì)玉米(Zeamays)倒伏區(qū)域進(jìn)行影像提取;王術(shù)波等(2018)運(yùn)用無(wú)人機(jī)遙感結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)生態(tài)灌區(qū)內(nèi)雜草進(jìn)行檢測(cè)分類;楊紅艷等(2019)運(yùn)用無(wú)人機(jī)遙感結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)荒漠草原物種進(jìn)行分類;孫鈺等(2018)運(yùn)用無(wú)人機(jī)遙感結(jié)合精簡(jiǎn)的SSD300框架對(duì)森林蟲(chóng)害進(jìn)行實(shí)時(shí)監(jiān)測(cè)。上述研究體現(xiàn)出無(wú)人機(jī)遙感結(jié)合機(jī)器視覺(jué)在生物監(jiān)測(cè)方面的顯著優(yōu)勢(shì),無(wú)人機(jī)低空遙感彌補(bǔ)了衛(wèi)星遙感在空間分辨率及時(shí)間分辨率上的不足,而機(jī)器視覺(jué)擁有自動(dòng)、準(zhǔn)確、高效等特點(diǎn),兩者的結(jié)合可以彌補(bǔ)傳統(tǒng)調(diào)查監(jiān)測(cè)的不足,更好地運(yùn)用于新疆鼠害的調(diào)查研究中。
本文以新疆古爾班通古特沙漠南緣典型荒漠林大沙鼠鼠洞作為研究對(duì)象,基于無(wú)人機(jī)低空遙感對(duì)鼠害區(qū)域進(jìn)行航拍,運(yùn)用YOLOv3和YOLOv3-tiny目標(biāo)檢測(cè)框架對(duì)鼠害區(qū)域的鼠洞進(jìn)行檢測(cè)定位,高效監(jiān)測(cè)荒漠林大沙鼠鼠洞的分布情況。
1.1 研究區(qū)概況 研究區(qū)位于新疆阜康市,如圖1所示,2塊試驗(yàn)樣地均屬于古爾班通古特沙漠南緣的荒漠林大沙鼠典型危害區(qū)。第1塊試驗(yàn)樣地為1 km×1 km,中心經(jīng)緯度為44.583°N、88.160°E;第2塊試驗(yàn)樣地為2.4 km×1.5 km,中心緯度為44.413°N、87.857°E。研究區(qū)內(nèi)多為固定沙丘與半固定沙丘,固定沙丘上植被覆蓋度為40%~50%,半固定沙丘上植被覆蓋度為15%~25%,植被多為梭梭、檉柳(Tamarixchinensis)、蛇麻黃(Ephedrasp.)、鹽爪爪(Kalidiumfoliatum)等。
1.2 數(shù)據(jù)采集 以古爾班通古特沙漠南緣的荒漠林大沙鼠典型危害區(qū)鼠洞作為識(shí)別對(duì)象。第1塊試驗(yàn)樣地的數(shù)據(jù)采集時(shí)間為2015-10-12,無(wú)人機(jī)選擇型號(hào)為DOPSV360的固定翼無(wú)人機(jī),攜帶傳感器為索尼NEX7相機(jī),共拍攝空間分辨率為2.4 cm的航空正射影像1 632張;第2塊試驗(yàn)樣地的數(shù)據(jù)采集時(shí)間為2016-05-13,無(wú)人機(jī)同上,傳感器為索尼ilce-7m相機(jī),共拍攝空間分辨率為2 cm的航空正射影像1 079張。2次拍攝的航向重疊度設(shè)定為65%,旁向重疊度設(shè)定為35%。2次拍攝均為晴天,無(wú)風(fēng)。無(wú)人機(jī)及搭載傳感器詳細(xì)參數(shù)見(jiàn)表1。
表1 航拍設(shè)備參數(shù)Tab.1 Aerial equipment parameters
1.3 數(shù)據(jù)集建立 2次航拍共獲取2 711張航空正射影像,首先運(yùn)用目視解譯和ENVI5.3軟件選取符合數(shù)據(jù)集要求的數(shù)據(jù)坐標(biāo)點(diǎn)共1 011個(gè),而后將航拍影像和1 011個(gè)坐標(biāo)點(diǎn)以文本文檔的形式輸入至ExtractInterface軟件中,裁剪出空間分辨率為416×416像素的1 011張影像作為樣本集,最后運(yùn)用編程語(yǔ)言python,隨機(jī)挑選出其中811張作為訓(xùn)練集,剩余200張作為測(cè)試集。所有圖像的標(biāo)注工作通過(guò)圖像標(biāo)注工具Labelling完成,標(biāo)注內(nèi)容為大沙鼠鼠洞的矩形框坐標(biāo)及分類信息,如圖2所示。對(duì)于在標(biāo)注過(guò)程中遇到一些混淆不清、無(wú)法判斷是否為鼠洞的地物,經(jīng)鼠害專家鑒定確認(rèn)是否為鼠洞。
圖2 數(shù)據(jù)集建立流程Fig.2 Data set establishment process
1.4 YOLOv3目標(biāo)檢測(cè)框架 YOLO系列算法是一種基于深度神經(jīng)網(wǎng)絡(luò)的對(duì)象識(shí)別和定位算法,因其快速、準(zhǔn)確、靈活而受到廣泛關(guān)注,目前已經(jīng)發(fā)展了3代(v1、v2/9000和v3)。YOLOv1是YOLO系列算法的第1代版本,其最大的特點(diǎn)是采用直接預(yù)測(cè)目標(biāo)對(duì)象邊界框的方法替代滑動(dòng)窗口,將候選區(qū)和對(duì)象識(shí)別2步工作合為1步,在保證準(zhǔn)確率的情況下提高了運(yùn)行速度,但由于其對(duì)邊界框預(yù)測(cè)強(qiáng)加了空間約束,在針對(duì)多目標(biāo)識(shí)別檢測(cè)和小目標(biāo)識(shí)別檢測(cè)時(shí)不占優(yōu)勢(shì)(Redmonetal.,2016);YOLOv2/9000相對(duì)于v1,在保證識(shí)別速度和準(zhǔn)確率的基礎(chǔ)上,增強(qiáng)了識(shí)別類別的能力,從v1只能識(shí)別20類目標(biāo)增加到能夠識(shí)別9 000類目標(biāo)。V2/9000的另一個(gè)特點(diǎn)是借鑒faster rcnn,采用了先驗(yàn)框,并在此基礎(chǔ)上,聚類提取先驗(yàn)框尺度,提升了整體框架的性能。但對(duì)于重疊分類問(wèn)題,v2并沒(méi)有給出好的解決方案(Redmonetal.,2017);v3在之前2代的基礎(chǔ)上,主要做了3方面的改進(jìn):1)調(diào)整了網(wǎng)絡(luò)結(jié)構(gòu),由Darknet-19變更為Darknet-53,Darknet-53借鑒了ResNet的思想,在網(wǎng)絡(luò)中加入了殘差模塊,保證了在網(wǎng)絡(luò)加深的同時(shí),梯度不會(huì)消失;2)采用多個(gè)尺度進(jìn)行預(yù)測(cè),YOLOv3采用了3個(gè)不同尺度的特征圖對(duì)目標(biāo)進(jìn)行檢測(cè),增強(qiáng)了對(duì)小目標(biāo)檢測(cè)的識(shí)別能力;3)對(duì)象分類函數(shù)由softmax替換為logistic,支持一個(gè)對(duì)象有多個(gè)標(biāo)簽(Redmonetal.,2018)。
YOLOv3目標(biāo)檢測(cè)算法通過(guò)3個(gè)版本的迭代,借鑒融合多種先進(jìn)算法,解決了前2個(gè)版本的遺留問(wèn)題,已經(jīng)成為了目標(biāo)檢測(cè)領(lǐng)域最優(yōu)秀的算法之一,其主要結(jié)構(gòu)如圖3所示。
圖3 YOLOv3結(jié)構(gòu)Fig.3 YOLOv3 structure
YOLOv3的主體網(wǎng)絡(luò)Darknet-53由5個(gè)殘差塊組成,每個(gè)殘差塊(Res×n)由多個(gè)殘差單元組成,如圖3c所示。通過(guò)輸入與2個(gè)DBL單元進(jìn)行殘差操作構(gòu)建了殘差單元(Res unit),如圖3b所示。其中,基礎(chǔ)組件(DBL)單元包含卷積層(conv)、批歸一化(batch normalization,BN)和帶泄露整流激活函數(shù)(leaky relu),如圖3a所示。通過(guò)引入殘差單元使得網(wǎng)絡(luò)深度可以更深,避免梯度消失。在本文中,其參數(shù)量為469 MB。
1.5 YOLOv3-tiny目標(biāo)檢測(cè)框架 相比于YOLOv3,YOLOv3-tiny版本將主體網(wǎng)絡(luò)架構(gòu)壓縮了許多,主體網(wǎng)絡(luò)采用7層conv+maxpool構(gòu)成,沒(méi)有使用殘差層,特征金字塔網(wǎng)絡(luò)也只有2層。在本文中,其參數(shù)量為33.7 MB。結(jié)構(gòu)如圖所示。YOLOv3-tiny網(wǎng)絡(luò)簡(jiǎn)單,計(jì)算量小,檢測(cè)速度快,可在移動(dòng)端或設(shè)備端運(yùn)行,但其缺點(diǎn)也較為明顯,由于網(wǎng)絡(luò)深度不夠,無(wú)法提取更高層次的語(yǔ)義特征,從而會(huì)影響其檢測(cè)精度。
1.6 數(shù)據(jù)集目標(biāo)框聚類分析 本文的研究對(duì)象是大沙鼠鼠洞,鼠洞屬于小目標(biāo),而原網(wǎng)絡(luò)定義的先驗(yàn)框本文的研究對(duì)象并不適用。因此,本文利用 K-means 聚類算法對(duì)大沙鼠鼠洞數(shù)據(jù)集中的鼠洞目標(biāo)進(jìn)行聚類分析。
YOLOV3沿用了YOLOv2所引入的Faster R-CNN中所使用的先驗(yàn)框的思想(Renetal.,2017),先驗(yàn)框是一組寬高固定的初始候選框,對(duì)初始先驗(yàn)框的選擇會(huì)直接影響網(wǎng)絡(luò)對(duì)目標(biāo)的檢測(cè)精度和速度。本文利用k-means 聚類算法對(duì)大沙鼠鼠洞數(shù)據(jù)集中的目標(biāo)框的寬高進(jìn)行聚類。聚類的自定義距離函數(shù)如下:
圖4 YOLOv3-tiny結(jié)構(gòu)Fig.4 YOLOv3-tiny structure
d(box,centroid)=1-IOU(box,centroid)。
(1)
式中,centroid表示以簇為中心的邊框,box表示樣本標(biāo)注框,d表示兩者間的距離,IOU(box,centroid)表示以簇為中心的邊框與樣本標(biāo)注框的交并比。本文選取k=1~9,對(duì)數(shù)據(jù)集中目標(biāo)框進(jìn)行聚類分析,得到k與Avg IOU(平均交并比)之間的關(guān)系如圖5所示。隨著k值的增大,Avg IOU逐漸增大,當(dāng)k=9 時(shí),Avg IOU達(dá)到最大值且曲線變化趨于平穩(wěn),所以選取先驗(yàn)框的數(shù)量為9,既可以加快損失函數(shù)的收斂,又可以消除候選框帶來(lái)的誤差。對(duì)應(yīng)的預(yù)測(cè)框的大小設(shè)置為9個(gè)聚類中心,在大沙鼠鼠洞數(shù)據(jù)集上對(duì)應(yīng)聚類中心的寬和高分別為(5,5),(19,18),(7,7),(15,13),(13,12),(9,10),(11,11),(11,9),(11,14)。
圖5 k-means聚類分析結(jié)果Fig.5 k-means clustering analysis result
YOLOv3-tiny是YOLOv3的輕量級(jí)解決方案,過(guò)多的先驗(yàn)框會(huì)影響其檢測(cè)速度,綜合考慮,所以本文按照其原本設(shè)計(jì)方案,取k=6,選取先驗(yàn)框數(shù)量為6。對(duì)于的預(yù)測(cè)框大小設(shè)置為6個(gè)聚類中心,在大沙鼠鼠洞數(shù)據(jù)集上對(duì)應(yīng)聚類中心的寬和高分別為(11,10),(4,4),(6,6),(15,14),(8,7),(5,5)。
1.7 評(píng)價(jià)指標(biāo) 采用對(duì)大沙鼠鼠洞數(shù)據(jù)集目標(biāo)檢測(cè)的準(zhǔn)確率(precision,P)、召回率(recall,R)和平均精確率(average precision,AP)作為目標(biāo)檢測(cè)算法的評(píng)價(jià)指標(biāo)(Everinghametal.,2015)。AP為準(zhǔn)確率和召回率曲線下的面積,是評(píng)價(jià)檢測(cè)模型準(zhǔn)確性的直觀評(píng)價(jià)標(biāo)準(zhǔn),可以用來(lái)分析單個(gè)類別的檢測(cè)效果。準(zhǔn)確率和召回率的定義為
(2)
(3)
式中:TP表示檢測(cè)結(jié)果為正確,即檢測(cè)框和標(biāo)注框類別相同且 IoU >0.5。FP表示被錯(cuò)誤識(shí)別出的目標(biāo),F(xiàn)N表示未被識(shí)別出的目標(biāo)。
2.1 模型的訓(xùn)練與調(diào)整 用于訓(xùn)練與測(cè)試模型的電腦安裝windows10系統(tǒng),搭載 Intel Core(TM)i7-7700 CPU@3.60 GHz、6 GB NVIDIA GeForce GTX 1060 GPU和16 GB運(yùn)存。訓(xùn)練期間參數(shù)設(shè)置如下:動(dòng)量參數(shù)設(shè)置為 0.9,對(duì)隨機(jī)梯度下降算法進(jìn)行優(yōu)化,權(quán)重衰減系數(shù)設(shè)為 0.000 4,初始學(xué)習(xí)率設(shè)置為 0.001,以 16 張圖像為1個(gè)批次,共訓(xùn)練 500個(gè)周期,每迭代10 000次學(xué)習(xí)率下降為原來(lái)的1/10。同時(shí),為避免全局最優(yōu)點(diǎn)在網(wǎng)絡(luò)初始位置附近而被錯(cuò)過(guò),設(shè)置burn_in參數(shù)為1 000,當(dāng)?shù)螖?shù)小于1 000時(shí),學(xué)習(xí)率按照此公式更新:學(xué)習(xí)率=學(xué)習(xí)率×(迭代次數(shù)/burn_in)。訓(xùn)練過(guò)程運(yùn)用隨機(jī)水平翻轉(zhuǎn)、隨機(jī)圖像飽和度、曝光度、色調(diào)變化、和隨機(jī)圖像裁剪來(lái)進(jìn)行數(shù)據(jù)擴(kuò)增。
更新先驗(yàn)框的YOLOv3和YOLOv3-tiny網(wǎng)絡(luò)訓(xùn)練過(guò)程中損失函數(shù)收斂圖與平均交并比曲線如圖6所示:大約經(jīng)過(guò)500個(gè)epoch(25 000次迭代)之后,更新先驗(yàn)框的YOLOv3網(wǎng)絡(luò)與YOLOv3-tiny網(wǎng)絡(luò)各項(xiàng)參數(shù)變化基本趨于穩(wěn)定,YOLOv3的loss值下降到0.07左右,Avg IOU穩(wěn)定在0.96左右;YOLOv3-tiny的loss值下降到0.2左右,Avg IOU的值穩(wěn)定在0.92左右?;谝陨蠀?shù)分析,2個(gè)模型的訓(xùn)練結(jié)果都較為理想。
圖6 損失值函數(shù)曲線和Avg IOU曲線Fig.6 Loss curve and Avg IOU curve
2.2 網(wǎng)絡(luò)測(cè)試與對(duì)比 測(cè)試的200幅圖像中共有677個(gè)大沙鼠鼠洞,運(yùn)用更新先驗(yàn)框后的YOLOv3與YOLOv3-tiny目標(biāo)檢測(cè)算法在測(cè)試集上進(jìn)行測(cè)試,分別計(jì)算準(zhǔn)確率和召回率,如表2所示。
表2 不同網(wǎng)絡(luò)目標(biāo)檢測(cè)結(jié)果對(duì)比Fig.2 Comparison of target detection results of different networks
YOLOv3與YOLOv3-tiny相比,對(duì)大沙鼠鼠洞的檢測(cè)準(zhǔn)確率提高到91.3%,召回率提高到94.8%。在測(cè)試集上,YOLOv3檢測(cè)單張圖片的平均時(shí)間為0.83 s,YOLOv3-tiny檢測(cè)單張圖片的平均時(shí)間為0.22 s。
在大沙鼠鼠洞數(shù)據(jù)集上,分別運(yùn)用2種目標(biāo)檢測(cè)算法對(duì)鼠洞檢測(cè)的平均精確率進(jìn)行計(jì)算,YOLOv3的AP=92.37%(圖7a),YOLOv3-tiny的AP=85.86%(圖7b),YOLOv3網(wǎng)絡(luò)的AP高于YOLOv3-tiny。
圖7 YOLOv3(a)和YOLOv3-tiny(b)目標(biāo)檢測(cè)框架AP曲線Fig.7 YOLOv3(a) and YOLOv3-tiny(b) target detection framework AP curve
2.3 檢測(cè)結(jié)果與典型錯(cuò)誤分析 對(duì)YOLOv3與YOLOv3-tiny2種網(wǎng)絡(luò)進(jìn)行對(duì)比時(shí),設(shè)置檢測(cè)閾值為0.5,在大沙鼠鼠洞數(shù)據(jù)集上的檢測(cè)結(jié)果如圖8所示。對(duì)比圖8a與b,YOLOv3無(wú)漏檢,而YOLOv3-tiny則出現(xiàn)了漏檢,主要原因可能是YOLOv3比YOLOv3-tiny擁有層次更深的主體網(wǎng)絡(luò),能夠?qū)W習(xí)鼠洞及其背景更深的語(yǔ)義特征,但整體來(lái)看,YOLOv3-tiny也有著不錯(cuò)的檢測(cè)結(jié)果。對(duì)比圖8c與d,YOLOv3網(wǎng)絡(luò)與YOLOv3-tiny網(wǎng)絡(luò)均出現(xiàn)了漏檢的情況,結(jié)合鼠洞數(shù)據(jù)集與網(wǎng)絡(luò)情況可知,出現(xiàn)漏檢的原因主要是由于數(shù)據(jù)集鼠洞形狀數(shù)量分布不均造成的。漏檢的鼠洞呈斜條狀,而在數(shù)據(jù)集中鼠洞的形狀大都近似圓狀,斜條狀鼠洞數(shù)據(jù)數(shù)量的缺少導(dǎo)致網(wǎng)絡(luò)缺乏對(duì)此類鼠洞的學(xué)習(xí),從而使得漏檢發(fā)生。
圖8 鼠洞(Mousehole)典型測(cè)試樣本檢測(cè)結(jié)果示例Fig.8 Sample test results of typical test samples for mouseholea.YOLOv3檢測(cè)大沙鼠鼠洞YOLOv3 detects mouseholes of gerbils;b.YOLOv3-tiny檢測(cè)大沙鼠鼠洞YOLOv3-tiny detects mouseholes of gerbils;c.YOLOv3漏檢Missing detection of YOLOv3;d.YOLOv3-tiny漏檢Missing detection of YOLOv3-tiny.
本文所使用的YOLOv3與YOLOv3-tiny網(wǎng)絡(luò)在識(shí)別鼠洞的平均精確率分別為92.37%和85.86%,但在模型架構(gòu)、參數(shù)改進(jìn)和數(shù)據(jù)選擇上仍有較大的改進(jìn)空間。在模型架構(gòu)上,由于鼠洞屬于小目標(biāo),可以在殘差塊中添加相應(yīng)的殘差單元,以求能夠獲取更多的小目標(biāo)特征信息;在參數(shù)改進(jìn)上,可以嘗試多種參數(shù)組合求得更優(yōu)解,從而提高模型的可用性;在數(shù)據(jù)選擇上,可以嘗試運(yùn)用小樣本數(shù)據(jù)模型,在不擴(kuò)大人力成本的基礎(chǔ)上,通過(guò)小樣本數(shù)據(jù)模型來(lái)擴(kuò)增數(shù)據(jù)集,以期提高模型的可用性。
傳統(tǒng)的圖像分類方法如周曉琳(2018)等運(yùn)用UAV低空遙感結(jié)合面向?qū)ο蟮哪0迤ヅ浞ê椭С窒蛄繖C(jī)法對(duì)草原鼠洞進(jìn)行識(shí)別定位,2種方法的準(zhǔn)確度分別在89%和90%左右;本團(tuán)隊(duì)孫迪等(2019)運(yùn)用極大似然法和面向?qū)ο蠓诸惙椒ㄌ崛∈蠖矗?種方法的準(zhǔn)確度分別為69%和91%。與本文的方法相比,傳統(tǒng)的圖像分類方法在準(zhǔn)確度上已無(wú)較大的提升空間。另外從監(jiān)測(cè)實(shí)時(shí)性和模型通用性方面考慮,無(wú)人機(jī)影像結(jié)合深度學(xué)習(xí)監(jiān)測(cè)鼠洞分布要優(yōu)于傳統(tǒng)圖像分類方法,能夠更好地為新疆鼠害的調(diào)查研究提供技術(shù)服務(wù)。
本研究均在實(shí)驗(yàn)室環(huán)境下進(jìn)行,并未在野外實(shí)地進(jìn)行實(shí)時(shí)監(jiān)測(cè),但YOLOv3-tiny在實(shí)驗(yàn)室環(huán)境下的表現(xiàn)使得鼠害實(shí)地實(shí)時(shí)監(jiān)測(cè)成為可能,這也將是本研究團(tuán)隊(duì)未來(lái)繼續(xù)探索的方向之一。
1) 針對(duì)荒漠林大沙鼠鼠洞為小目標(biāo)的特點(diǎn),運(yùn)用k-means聚類算法對(duì)大沙鼠鼠洞數(shù)據(jù)集中的目標(biāo)框進(jìn)行聚類分析。通過(guò)對(duì)鼠洞數(shù)據(jù)集中的目標(biāo)框進(jìn)行聚類分析,在一定程度上提高了目標(biāo)檢測(cè)框架的速度與精度,為后續(xù)框架的訓(xùn)練提供了基礎(chǔ)。
2) 基于卷積神經(jīng)網(wǎng)絡(luò)的YOLOv3模型和其輕量級(jí)YOLOv3-tiny模型,通過(guò)對(duì)網(wǎng)絡(luò)參數(shù)的修改構(gòu)建適合荒漠林大沙鼠鼠洞識(shí)別的網(wǎng)絡(luò)框架,并建立數(shù)據(jù)集對(duì)2個(gè)模型進(jìn)行訓(xùn)練和性能測(cè)試,最終YOLOv3模型輸出的平均精確率為92.37%,YOLOv3-tiny模型為85.86%,兩者相差6.51%。在檢測(cè)對(duì)象為大沙鼠鼠洞時(shí),在精確率方面2個(gè)模型的差距并不太大。
3) 在同一軟硬件平臺(tái)下,YOLOv3的參數(shù)量為469 MB,YOLOv3-tiny的參數(shù)量為33.7 MB,后者約為前者的1/13;前者網(wǎng)絡(luò)在本文硬件環(huán)境中檢測(cè)單張圖像的平均時(shí)間為0.83 s,后者為0.22 s,后者的檢測(cè)時(shí)間約為前者的1/4。YOLOv3在準(zhǔn)確率方面占據(jù)著優(yōu)勢(shì),而YOLOv3-tiny在檢測(cè)速度方面占據(jù)著優(yōu)勢(shì)。
4) 漏檢的主要原因是數(shù)據(jù)集中各形態(tài)鼠洞數(shù)量不均導(dǎo)致漏檢的情況發(fā)生。針對(duì)這種情況,在今后的研究中應(yīng)運(yùn)用數(shù)據(jù)擴(kuò)增等手段對(duì)形態(tài)較為特殊的鼠洞數(shù)據(jù)進(jìn)行處理,從而避免漏檢的情況發(fā)生。
5) 將機(jī)器視覺(jué)與無(wú)人機(jī)遙感相結(jié)合運(yùn)用于荒漠林大沙鼠鼠害調(diào)查與防治能夠在保證準(zhǔn)確率的基礎(chǔ)上提高效率,彌補(bǔ)傳統(tǒng)調(diào)查方法的不足。