亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于無(wú)人機(jī)圖像的多尺度感知麥穗計(jì)數(shù)方法

        2021-03-11 01:13:28楊鍇鋒羅元秋沈繼鋒武小紅
        關(guān)鍵詞:麥穗計(jì)數(shù)卷積

        孫 俊,楊鍇鋒,羅元秋,沈繼鋒,武小紅,錢(qián) 磊

        (江蘇大學(xué)電氣信息工程學(xué)院,鎮(zhèn)江 212000)

        0 引 言

        小麥?zhǔn)鞘澜缟喜シN面積最大、產(chǎn)量最多、分布最廣的糧食作物[1],2021 年世界小麥?zhǔn)褂昧窟_(dá)到7.54 億t[2]。然而,受人口增長(zhǎng)、需求增加和氣候變化等因素的影響,相關(guān)部門(mén)需要準(zhǔn)確決策以確保小麥作物的可持續(xù)生產(chǎn)[3]。小麥的生產(chǎn)對(duì)中國(guó)以及世界各地的作物生產(chǎn)[4]、糧食價(jià)格[5]和糧食安全[6-7]等產(chǎn)生了重大影響,因此,快速、準(zhǔn)確產(chǎn)量估計(jì)對(duì)于小麥管理、貿(mào)易和政府決策至關(guān)重要。

        小麥產(chǎn)量預(yù)估主要由單位面積穗數(shù)、單穗粒數(shù)和千粒質(zhì)量3 個(gè)參數(shù)決定[8],傳統(tǒng)產(chǎn)量預(yù)估主要通過(guò)農(nóng)業(yè)部門(mén)根據(jù)經(jīng)驗(yàn)進(jìn)行目測(cè)估產(chǎn)或者隨機(jī)選取大田區(qū)域進(jìn)行人工采樣、計(jì)數(shù)、稱(chēng)質(zhì)量統(tǒng)計(jì)來(lái)完成[9],前者準(zhǔn)確率低,易受個(gè)人經(jīng)驗(yàn)影響,后者則工作量巨大,費(fèi)時(shí)費(fèi)力。

        當(dāng)前,隨著傳感器與計(jì)算機(jī)技術(shù)的發(fā)展[10],對(duì)農(nóng)作物成熟前進(jìn)行估產(chǎn)的方法層出不窮。針對(duì)超大面積農(nóng)田估產(chǎn),相關(guān)研究主要通過(guò)宏觀數(shù)據(jù),例如氣候變化[11-12]、空氣中氮氧含量[13]、衛(wèi)星遙感葉面積指數(shù)等進(jìn)行估產(chǎn)[14-15]。Cao 等[16]比較了傳統(tǒng)的機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)模型,通過(guò)整合谷歌地球引擎平臺(tái)內(nèi)的氣候、衛(wèi)星、土壤特性和空間信息數(shù)據(jù)對(duì)小麥進(jìn)行產(chǎn)量預(yù)估,建立模型的決定系數(shù)R2達(dá)到了0.90。宏觀數(shù)據(jù)雖然可以快速對(duì)大范圍農(nóng)作物進(jìn)行估產(chǎn),但數(shù)據(jù)的收集、變化都極易受外界因素影響,產(chǎn)量預(yù)估準(zhǔn)確率不能保證。近年來(lái),隨著視覺(jué)技術(shù)的發(fā)展,通過(guò)近景圖像進(jìn)行目標(biāo)計(jì)數(shù)的方法層出不窮。深度學(xué)習(xí)中計(jì)數(shù)方法可以分為以下三類(lèi):基于目標(biāo)檢測(cè)、圖像分割和密度圖計(jì)數(shù)的方法。基于檢測(cè)的目標(biāo)計(jì)數(shù)方法使用Faster R-CNN[17]、Yolo[18]、SSD[19]等算法通過(guò)檢測(cè)到目標(biāo)區(qū)域生成多個(gè)位置框,進(jìn)而統(tǒng)計(jì)出目標(biāo)的數(shù)量。Madec等[20]使用Faster R-CNN 對(duì)240 張高空間分辨率小麥RGB圖像進(jìn)行計(jì)數(shù),最終預(yù)測(cè)方程R2達(dá)到0.91,線(xiàn)性擬合效果較好。文獻(xiàn)[21]通過(guò)卷積神經(jīng)網(wǎng)絡(luò)結(jié)合梯度下降法與非極大值抑制構(gòu)建冬小麥麥穗檢測(cè)計(jì)數(shù)系統(tǒng)。對(duì) 100 幅冬小麥圖像進(jìn)行麥穗計(jì)數(shù)測(cè)試,采用決定系數(shù)和歸一化均方根誤差(Normalized Root Mean Square Error,NRMSE)進(jìn)行正確率定量評(píng)價(jià),最終R2與NRMSE 分別達(dá)到0.62、11.73%,精度有待進(jìn)一步提高。謝元澄等[22]通過(guò)引入特征金字塔及在線(xiàn)負(fù)樣本挖掘技術(shù)構(gòu)建 FCS R-CNN 網(wǎng)絡(luò)對(duì)麥穗進(jìn)行檢測(cè),檢測(cè)精度達(dá)到92.9%。Wang 等[23]針對(duì)小麥遮擋問(wèn)題,提出了一種隨機(jī)切割方法,根據(jù)圖像中的小麥數(shù)量和大小選擇和刪除一些矩形框,模擬真實(shí)小麥圖像的遮擋。采用卷積塊注意模塊(Convolutional Block Attention Module,CBAM)對(duì)無(wú)用的背景信息進(jìn)行剔除,關(guān)注麥穗?yún)^(qū)域,提出的模型計(jì)數(shù)精度達(dá)到94%。使用目標(biāo)檢測(cè)的方法對(duì)麥穗進(jìn)行識(shí)別計(jì)數(shù),雖然能直觀顯示每個(gè)麥穗的目標(biāo)信息,但目標(biāo)檢測(cè)算法對(duì)部分遮擋的麥穗識(shí)別效果差,因此上述研究的計(jì)數(shù)精度以及R2有待進(jìn)一步提高。Ma 等[24]使用基于深度卷積神經(jīng)網(wǎng)絡(luò)與像素級(jí)語(yǔ)義分割的全卷積網(wǎng)絡(luò)(Fully Convolutional Networks,F(xiàn)CN)結(jié)合的網(wǎng)絡(luò)模型,對(duì)冬小麥麥穗進(jìn)行分割,分割精度達(dá)到了82.9%,且通過(guò)泛化測(cè)試驗(yàn)證了所提出的兩階段分割方法的實(shí)用性。錢(qián)立冬[25]使用基于多尺度殘差U-net 分割網(wǎng)絡(luò)結(jié)合注意力子對(duì)抗網(wǎng)絡(luò)對(duì)小麥進(jìn)行分割計(jì)數(shù),實(shí)現(xiàn)了90.8%的召回率,展現(xiàn)了較好的分割計(jì)數(shù)性能。但基于分割的方法對(duì)重疊相互遮擋的目標(biāo)識(shí)別效果較差,而基于密度圖計(jì)數(shù)的方法可以很好緩解這個(gè)問(wèn)題。

        MCNN(Multi-Column Convolutional Neural Network,MCNN)[26]與CSRnet[27]等方法在密集人群計(jì)數(shù)中展現(xiàn)了良好的計(jì)數(shù)性能,這些方法依賴(lài)于訓(xùn)練回歸來(lái)估計(jì)圖像不同部分的目標(biāo)密度,然后進(jìn)行積分得到目標(biāo)數(shù)量??紤]到麥田實(shí)拍麥穗分布密集,鮑文霞等[28]將基于密度圖的方法用在了麥穗計(jì)數(shù)上,并且在4 種不同品種小麥上,取得的平均絕對(duì)誤差達(dá)到了 16.23。劉航等[29]提出Resnet-16 模型,對(duì)全球小麥數(shù)據(jù)集實(shí)現(xiàn)端到端的麥穗密度圖回歸計(jì)數(shù),引入矯正因子和膨脹因子后,模型的R2達(dá)到了0.973,計(jì)數(shù)準(zhǔn)確率達(dá)到了94%?;诿芏葓D方法對(duì)麥穗計(jì)數(shù)展現(xiàn)了良好的性能,但是還存在部分不足,如模型的泛化能力未得到驗(yàn)證,精度有待進(jìn)一步提升。

        相關(guān)研究表明,小麥估產(chǎn)可以通過(guò)對(duì)大區(qū)域宏觀數(shù)據(jù)建模,以及對(duì)近景圖片使用深度學(xué)習(xí)的方法進(jìn)行計(jì)數(shù)。但宏觀數(shù)據(jù)收集難度較大,易受到外界因素干擾。深度學(xué)習(xí)的方法雖然準(zhǔn)確率高,但其需要大量的圖像以及標(biāo)注,圖像采集與標(biāo)注過(guò)程費(fèi)時(shí)費(fèi)力,因此目前基于深度學(xué)習(xí)的麥穗計(jì)數(shù)研究中,大部分自建的數(shù)據(jù)集[20-21,28]圖像數(shù)量少于300 張,且部分研究對(duì)小麥品種進(jìn)行劃分,單獨(dú)評(píng)估某一品種小麥計(jì)數(shù)準(zhǔn)確性指標(biāo)。使用過(guò)小的數(shù)據(jù)量與單一固定品種的麥穗圖像容易造成訓(xùn)練的模型泛化能力太弱,陷入局部最優(yōu)[30]。因此現(xiàn)階段研究無(wú)法建立通用的麥穗計(jì)數(shù)模型,不能很好地用于不區(qū)分品種的小麥計(jì)數(shù)??紤]到現(xiàn)存問(wèn)題,本研究使用全球收集的小麥圖像,通過(guò)圖像濾波以增強(qiáng)對(duì)無(wú)人機(jī)麥穗圖像的泛化能力,另外通過(guò)改進(jìn)CSRnet 網(wǎng)絡(luò)結(jié)構(gòu),將前端網(wǎng)絡(luò)增加三個(gè)卷積層,以提取小麥更深層的特征,另外將特征提取網(wǎng)絡(luò)插入4 種不同尺度的上下文語(yǔ)義信息提取模塊,最終融合兩部分信息提取小麥特征,構(gòu)建 Wheat Ear Counting 網(wǎng)絡(luò)(WECnet),對(duì)麥穗進(jìn)行準(zhǔn)確計(jì)數(shù)。為了驗(yàn)證模型的泛化能力,本文除了在原有的全球小麥數(shù)據(jù)集進(jìn)行測(cè)試驗(yàn)證其評(píng)估指標(biāo)外,還通過(guò)使用無(wú)人機(jī)獲取的實(shí)拍小麥圖像驗(yàn)證,其與訓(xùn)練集來(lái)源完全不同,用于確保模型的可移植性。

        1 材料與方法

        1.1 數(shù)據(jù)來(lái)源與處理

        1.1.1 數(shù)據(jù)來(lái)源與劃分

        為了獲取足夠多樣且有代表性的小麥圖像,避免因小麥圖像特征單一,導(dǎo)致訓(xùn)練模型泛化能力弱的問(wèn)題,本文使用的麥穗圖像來(lái)源于全球小麥檢測(cè)數(shù)據(jù)集(GWHD,http://www.global-wheat.com)。選擇GWHD圖像中5 個(gè)國(guó)家的小麥數(shù)據(jù)集,不同國(guó)家圖像采集與麥穗特征如表1 所示。

        表1 不同國(guó)家麥穗圖像特征Table 1 Image features of wheat ears in different countries

        小麥種植的行間距從15~30.5 cm 不等,每平方米種植150~450 粒種子不等,包含多種基因型,小麥生長(zhǎng)階段在開(kāi)花期與成熟期之間,所使用相機(jī)焦距在10~60 mm不等,相機(jī)與地面的距離在1.8~2.9 m 之間,俯視拍攝,圖像大小統(tǒng)一為1 024×1 024 像素。本文選取GWHD 數(shù)據(jù)集中的1 000 幅圖像,累計(jì)包含47 573 個(gè)麥穗。此1 000幅圖像按照8∶1∶1 劃分為訓(xùn)練集、測(cè)試集、驗(yàn)證集。驗(yàn)證集參與網(wǎng)絡(luò)訓(xùn)練,對(duì)當(dāng)前訓(xùn)練模型的超參數(shù)進(jìn)行對(duì)比尋優(yōu);測(cè)試集不參與訓(xùn)練,僅通過(guò)評(píng)價(jià)指標(biāo)驗(yàn)證模型的泛化效果。

        另外,為了更好驗(yàn)證模型的泛化能力,本文還通過(guò)無(wú)人機(jī)獲取田間實(shí)拍小麥圖像進(jìn)行驗(yàn)證。圖像采集區(qū)域位于江蘇江陰市(31°51′N(xiāo),120°29′E)以及安徽淮南市(32°28′N(xiāo),117°2′E)兩處農(nóng)田。數(shù)據(jù)采集時(shí)間分別在2021年5 月4 日16:00 和5 月10 日10:00,此時(shí)小麥正處于灌漿期。選用的無(wú)人機(jī)鏡頭型號(hào)為DJI-FC1102,光圈大小為f/2.6,曝光時(shí)間自動(dòng)。原始圖像分辨率為3 968×2 976 像素,考慮到網(wǎng)絡(luò)輸入尺寸限制,將圖像調(diào)整到1 209×907 像素。鏡頭距離麥穗上部0.5~1.2 m,俯視拍攝,拍攝細(xì)節(jié)如圖1 所示。為了避免太陽(yáng)劇烈照射影響成像效果,拍攝時(shí)天氣情況為多云,并且剔除模糊和畸變嚴(yán)重的圖像,最終篩選出46 幅符合要求的圖像,經(jīng)人工統(tǒng)計(jì)麥穗數(shù)目總和為3 780 穗。

        1.1.2 數(shù)據(jù)標(biāo)注與人工計(jì)數(shù)

        本文對(duì)GWHD 數(shù)據(jù)集中的訓(xùn)練集與驗(yàn)證集進(jìn)行麥穗點(diǎn)標(biāo)注,使用shanghaitech 數(shù)據(jù)集標(biāo)注格式,通過(guò)matlab人工標(biāo)注圖片中的麥穗中心坐標(biāo)點(diǎn)與麥穗總數(shù)。另外,本文對(duì)GWHD 數(shù)據(jù)集中劃分的測(cè)試集(Test_A)與無(wú)人機(jī)拍攝的圖像(Test_B)進(jìn)行人工計(jì)數(shù),通過(guò)使用序號(hào)筆工具與多人共同統(tǒng)計(jì)數(shù)量取平均值以保證計(jì)數(shù)的準(zhǔn)確性,保存每幅圖像中麥穗數(shù)量。麥穗細(xì)節(jié)與數(shù)據(jù)集劃分標(biāo)注流程如圖2 所示。

        1.1.3 數(shù)據(jù)增強(qiáng)

        深度學(xué)習(xí)需要數(shù)以百萬(wàn)計(jì)的大量參數(shù),足夠充足的數(shù)據(jù)才能使這些參數(shù)更具有代表性,但實(shí)際情況中獲取足量數(shù)據(jù)存在難度。在麥穗計(jì)數(shù)中,實(shí)拍麥穗會(huì)因?yàn)槌砷L(zhǎng)階段、光照、拍攝狀態(tài)等不同造成麥穗狀態(tài)不一,難以獲取所有狀態(tài)的小麥圖像,因此需要對(duì)原始圖像進(jìn)行數(shù)據(jù)增強(qiáng)。采用數(shù)據(jù)增強(qiáng)技術(shù)增加樣本多樣性是提升卷積神經(jīng)網(wǎng)絡(luò)檢測(cè)精度和泛化能力最簡(jiǎn)單有效的方法。隨機(jī)增加數(shù)據(jù)多樣性的方法包括旋轉(zhuǎn)、裁剪、鏡像等,針對(duì)性數(shù)據(jù)增強(qiáng)策略包括添加噪聲、改變對(duì)比度,濾波等。針對(duì)細(xì)節(jié)模糊的圖像樣本,加強(qiáng)圖像邊緣、保持真實(shí)度是圖像增強(qiáng)時(shí)關(guān)注的兩大要素[31]。數(shù)據(jù)增強(qiáng)的目的就是使有限數(shù)據(jù)集包含更多目標(biāo)特征,更擬合現(xiàn)實(shí)場(chǎng)景。本研究使用公開(kāi)的全球采集的小麥圖像,公開(kāi)的圖像經(jīng)過(guò)壓縮處理,圖像平均大小為180 kB,圖像質(zhì)量較差,包含較多噪音[32]。經(jīng)過(guò)添加多種噪聲與不同濾波卷積核試驗(yàn)對(duì)比,發(fā)現(xiàn)對(duì)數(shù)據(jù)集進(jìn)行濾波可以有效提升圖像的泛化能力。選擇的濾波器卷積核與濾波效果如圖3所示。小麥灌漿期麥穗與葉片顏色接近,濾波后有效突出了麥穗邊緣細(xì)節(jié),提升了圖像質(zhì)量。本文使用OpenCV 中的filter2D()函數(shù),將線(xiàn)性濾波器應(yīng)用于圖像,濾波函數(shù)為

        式中 dst()為目標(biāo)圖像,src()為原始圖像,k為卷積核(kernel),cols、rows 分別為卷積核的列數(shù)、行數(shù),A表示內(nèi)核的錨點(diǎn)(anchor)。

        1.2 灌漿期小麥計(jì)數(shù)方法

        1.2.1 WECnet 小麥計(jì)數(shù)模型網(wǎng)絡(luò)框架

        CSRnet[27]人群計(jì)數(shù)模型網(wǎng)絡(luò)框架包括前端和后端網(wǎng)絡(luò),前端網(wǎng)絡(luò)使用VGG16 的前10 層提取特征,后端網(wǎng)絡(luò)使用空洞卷積生成高質(zhì)量的密度圖,此方法對(duì)密集人群計(jì)數(shù)展現(xiàn)了良好的性能。CSRnet 網(wǎng)絡(luò)主要識(shí)別人群頭部區(qū)域,頭部與其他部位顏色與紋理等信息區(qū)別較大,且頭部形狀單一,因此計(jì)數(shù)效果良好。而灌漿期麥穗與葉片顏色接近,且存在多種長(zhǎng)寬比的麥穗,給網(wǎng)絡(luò)準(zhǔn)確計(jì)數(shù)帶來(lái)挑戰(zhàn)。因此本研究使用VGG19 替代VGG16 以提取更深層特征,使用不同空洞率卷積替代固定空洞卷積,在融合多尺度特征的同時(shí),可以保證網(wǎng)絡(luò)輸出較高分辨率的密度圖。在網(wǎng)絡(luò)中插入上下文語(yǔ)義信息提取模塊,使用不同大小感受野,關(guān)注麥穗上下文語(yǔ)義信息。WECnet 整體框架如圖4 所示。前端網(wǎng)絡(luò)由VGG19 的前12 層組成,對(duì)輸入固定大小的224×224 RGB 圖像進(jìn)行3×3、步長(zhǎng)為1 的卷積。在卷積第2、4、8 層后,使用大小為2×2、步長(zhǎng)為2 的最大池化層,通過(guò)前端網(wǎng)絡(luò)提取麥穗的基本特征。將提取到的VGG特征通過(guò)平均池化操作,使其成為不同大小的核,1×1 卷積可以跨通道組合上下文特征而不改變它們的維度,由于輸出的特征圖只包含部分原始輸入值,因此需要上采樣到原始輸入值大小,獲取尺度特征。將尺度特征與VGG 特征進(jìn)行融合,然后將其傳遞給后端網(wǎng)絡(luò)。后端網(wǎng)絡(luò)使用空洞卷積,在不減小感受野的情況下降低空間特征的損失,針對(duì)麥穗特征,對(duì)空洞率進(jìn)行調(diào)整,前兩層使用普通卷積,3~6 層使用空洞率為2 與4 的空洞卷積,最后一層使用1×1 卷積進(jìn)行輸出,生成高質(zhì)量的密度圖,預(yù)測(cè)麥穗目標(biāo)數(shù)量。

        1.2.2 上下文語(yǔ)義信息提取

        前端VGG網(wǎng)絡(luò)在整幅圖像上使用相同的感受野對(duì)圖像進(jìn)行卷積,而麥穗大小尺度不一,長(zhǎng)寬比例不同,VGG網(wǎng)絡(luò)提取的特征對(duì)麥穗計(jì)數(shù)存在局限,容易對(duì)較長(zhǎng)的麥穗誤檢,影響計(jì)數(shù)精度。因此,在文中通過(guò)引入上下文語(yǔ)義信息提取模塊,通過(guò)將VGG19 前12 層提取的局部特征進(jìn)行平均池化分為4 種不同大小的塊,然后對(duì)其進(jìn)行上采樣,以返回原始特征圖大小形成對(duì)比度特征。對(duì)比度特征進(jìn)一步用于學(xué)習(xí)不同尺度的權(quán)重,然后將其反饋至后端網(wǎng)絡(luò),最終生成高質(zhì)量的密度圖。上下文語(yǔ)義信息提取示意如圖5 所示。

        1.2.3 標(biāo)簽密度圖生成

        在麥穗標(biāo)注中,每個(gè)麥穗僅標(biāo)注其中心點(diǎn)坐標(biāo)(x,y)。實(shí)際上,麥穗不可能只由一個(gè)像素點(diǎn)代替,中心點(diǎn)附近的坐標(biāo)也可以代表麥穗。若直接將麥穗中心點(diǎn)作為目標(biāo)1,其他部位直接視為負(fù)樣本0,會(huì)對(duì)網(wǎng)絡(luò)的訓(xùn)練帶來(lái)極大的干擾,影響模型擬合。因此,本文采用MCNN[26]中生成密度圖的方法,利用自適應(yīng)高斯卷積核對(duì)麥穗標(biāo)注形成標(biāo)簽密度圖,距離中心點(diǎn)越近,激活值越大,這樣網(wǎng)絡(luò)能有方向地快速收斂到最優(yōu)模型,密度生成函數(shù)為

        式中di表示與第i個(gè)麥穗最相鄰的m個(gè)麥穗的平均距離,β為增益系數(shù),本文中,m取3,β取0.3。xi表示標(biāo)注中心點(diǎn)坐標(biāo),δ(x?xi)表示圖像包含的麥穗位置信息,G(x)為自適應(yīng)高斯核函數(shù)。根據(jù)人工標(biāo)注的坐標(biāo)生成的麥穗密度可視化圖如圖6 所示。

        1.2.4 田間小麥密度預(yù)測(cè)模型

        田間小麥實(shí)拍面積大小計(jì)算方法如下:1)從無(wú)人機(jī)獲取的圖像信息中讀取無(wú)人機(jī)飛行的相對(duì)地面高度H,為了便于計(jì)算,本文使用無(wú)人機(jī)進(jìn)行水平飛行,可視為高度H固定。2)測(cè)量小麥高度,同一品種相同生長(zhǎng)狀態(tài)的小麥可視為同一高度,通過(guò)測(cè)量多株小麥麥穗高度取平均值獲取h。3)通過(guò)鏡頭與小麥距離,鏡頭的水平視場(chǎng)角計(jì)算圖像覆蓋的面積S。田間小麥密度模型可由麥穗計(jì)數(shù)模型預(yù)測(cè)的單幅圖像平均麥穗數(shù)量與圖像覆蓋面積計(jì)算。

        式中S為拍攝圖像的實(shí)際面積,m2;H為無(wú)人機(jī)距離地面高度,m;h為麥穗高度,m;θ為無(wú)人機(jī)鏡頭的水平視場(chǎng)角,(°),ρear為平均麥穗密度,個(gè)/m2,Ni為第i幅圖像預(yù)測(cè)的麥穗數(shù)量,n為圖像數(shù)量。

        1.3 模型訓(xùn)練環(huán)境

        本文使用端到端的方法訓(xùn)練WECnet 網(wǎng)絡(luò),前12 層由訓(xùn)練良好的VGG19 進(jìn)行微調(diào),其他層進(jìn)行標(biāo)準(zhǔn)偏差為0.01 的高斯初始化。所有模型均在Ubuntu 16.04 LTS 64位系統(tǒng)環(huán)境下運(yùn)行,采用pytorch 深度學(xué)習(xí)框架。計(jì)算機(jī)硬件配置為32GB 內(nèi)存,搭載 Intel? Core? i7-8700K CPU 和GTX1080Ti 11GB 顯卡。迭代次數(shù)為100 次,初始學(xué)習(xí)率設(shè)置為1×10-5,每30 次迭代學(xué)習(xí)率下降為原來(lái)的十分之一,動(dòng)量(momentum)設(shè)置為 0.95,batch size設(shè)置為2。為了在訓(xùn)練前期更有效利用信息,采用隨機(jī)梯度下降算法法(Stochastic Gradient Descent,SGD)優(yōu)化訓(xùn)練模型。訓(xùn)練中損失函數(shù)的計(jì)算公式為

        1.4 評(píng)價(jià)指標(biāo)

        深度學(xué)習(xí)的計(jì)數(shù)相關(guān)研究通常使用平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squared Error,RMSE)、決定系數(shù)(R2)作為模型評(píng)價(jià)指標(biāo)。另外,對(duì)無(wú)人機(jī)圖像計(jì)數(shù)增加整體錯(cuò)誤率(Error rate,Er)指標(biāo)。MAE 為預(yù)測(cè)值與真實(shí)值的平均誤差,表示算法的準(zhǔn)確性,MAE 越小,算法準(zhǔn)確度越高;RMSE為預(yù)測(cè)值與真實(shí)值誤差的分散程度,代表算法的穩(wěn)定性,RMSE 越小,算法的魯棒性越高;R2表示趨勢(shì)線(xiàn)擬合程度,它的數(shù)值大小可以反映麥穗計(jì)數(shù)的估計(jì)值與對(duì)應(yīng)的實(shí)際數(shù)據(jù)之間的擬合程度,數(shù)值越接近1,擬合程度越高,趨勢(shì)線(xiàn)的可靠性就越高;Er 表示模型在整體測(cè)試集上預(yù)測(cè)麥穗計(jì)數(shù)結(jié)果的錯(cuò)誤率,數(shù)值越小,整體誤差越小。

        2 結(jié)果與分析

        2.1 不同方法計(jì)數(shù)結(jié)果對(duì)比與分析

        為了驗(yàn)證WECnet 的性能,本文將WECnet 與其他4種經(jīng)典、性能優(yōu)異的方法進(jìn)行對(duì)比,對(duì)比的方法分為兩類(lèi):目標(biāo)檢測(cè)計(jì)數(shù)方法和密度圖計(jì)數(shù)方法。目標(biāo)檢測(cè)算法使用矩形框標(biāo)記目標(biāo)的位置,結(jié)果更加直觀,但在目標(biāo)檢測(cè)后處理過(guò)程中,單個(gè)目標(biāo)物會(huì)應(yīng)與多個(gè)預(yù)測(cè)目標(biāo)輸出,因此在對(duì)正樣本的選擇中,網(wǎng)絡(luò)容易對(duì)密集、遮擋嚴(yán)重的目標(biāo)漏檢,影響計(jì)數(shù)效果。計(jì)數(shù)整體性能不如密度圖方法。目標(biāo)檢測(cè)計(jì)數(shù)方法中,YOLO V5 為單階段算法,其基于整張圖片信息進(jìn)行預(yù)測(cè),因此速度較快,平均單幅圖像檢測(cè)僅需18 ms,但其通過(guò)長(zhǎng)寬比篩選并過(guò)濾了大小和長(zhǎng)寬比較極端的真實(shí)目標(biāo)框,對(duì)部分麥穗未成功檢測(cè),影響計(jì)數(shù)性能。FPN[33]為兩階段算法,使用滑窗式的檢測(cè)窗口,基于局部圖片信息進(jìn)行推理,速度較慢,平均單幅圖像檢測(cè)需60 ms,算法定位準(zhǔn)確率較高,在麥穗數(shù)據(jù)集上MAE 到達(dá)了6.77。在密度圖計(jì)數(shù)方法中,MCNN 使用多列分別訓(xùn)練,其參數(shù)計(jì)算量過(guò)大,并不能高效地預(yù)測(cè)不同大小的目標(biāo),并且難以訓(xùn)練,單幅圖像計(jì)數(shù)耗時(shí)72 ms。CSRnet 采用易于訓(xùn)練的端到端方法,通過(guò)空洞卷積擴(kuò)展感受野,用于人群計(jì)數(shù)和高質(zhì)量密度圖生成,單幅圖像計(jì)數(shù)耗時(shí)28 ms。WECnet 由于增加了網(wǎng)絡(luò)層數(shù)與語(yǔ)義信息提取結(jié)構(gòu),速度相較CSRnet 有所減慢,單幅圖像計(jì)數(shù)耗時(shí)32 ms,提升精度的同時(shí)速度依然可以滿(mǎn)足實(shí)際應(yīng)用需求。不同方法對(duì)比結(jié)果如表2 所示。

        表2 不同方法評(píng)估結(jié)果Table 2 Evaluation results of different methods

        為了直觀展示檢測(cè)結(jié)果,本文將5 種方法計(jì)數(shù)結(jié)果進(jìn)行可視化展示,如圖7 所示。其中,圖像1、2 包含麥穗數(shù)量的人工計(jì)數(shù)結(jié)果為49、64。檢測(cè)算法使用矩形框標(biāo)記目標(biāo)的位置,結(jié)果更加直觀,但在目標(biāo)檢測(cè)后處理過(guò)程中,單個(gè)目標(biāo)物會(huì)應(yīng)與多個(gè)預(yù)測(cè)目標(biāo)輸出,因此對(duì)正樣本的選擇中網(wǎng)絡(luò)容易對(duì)密集、遮擋嚴(yán)重的目標(biāo)漏檢,影響計(jì)數(shù)效果,計(jì)數(shù)結(jié)果小于真實(shí)值。密度圖方法直接進(jìn)行回歸計(jì)數(shù),計(jì)數(shù)準(zhǔn)確率相對(duì)較高。由于MCNN 與CSRnet 網(wǎng)絡(luò)針對(duì)人群計(jì)數(shù),將近似圓形的頭部視為關(guān)鍵區(qū)域,未考慮小麥存在不同長(zhǎng)寬比例的情況,過(guò)于狹長(zhǎng)的麥穗被重復(fù)計(jì)數(shù),造成部分圖像計(jì)數(shù)值高于真實(shí)值的情況,而本文網(wǎng)絡(luò)WECnet 進(jìn)行改進(jìn),很好地避免了重復(fù)計(jì)數(shù),并且加深網(wǎng)絡(luò)層次,提取更深層次特征,取得了最優(yōu)的計(jì)數(shù)效果。

        2.2 不同網(wǎng)絡(luò)結(jié)構(gòu)對(duì)比與分析

        WECnet 在原始人群計(jì)數(shù)網(wǎng)絡(luò)CSRnet 的基礎(chǔ)上添加了上下文語(yǔ)義信息提取模塊,另外在前端特征提取網(wǎng)絡(luò)將原有的VGG16 更換為VGG19,后端網(wǎng)絡(luò)對(duì)固定空洞率的卷積替換為多種空洞率的卷積。為了驗(yàn)證改進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)在麥穗計(jì)數(shù)中提升性能的能力,對(duì)不同網(wǎng)絡(luò)結(jié)構(gòu)的測(cè)試結(jié)果如表3 所示。

        表3 不同網(wǎng)絡(luò)結(jié)構(gòu)計(jì)數(shù)性能比較Table 3 Comparison of counting performance of different network structures

        表3 中,模型1 單獨(dú)加入上下文語(yǔ)義信息提取模塊,提取小麥尺度信息,模型2 單獨(dú)使用多種空洞率的卷積,模型4 單獨(dú)使用更深的VGG19 前端網(wǎng)絡(luò)提取特征,更深的結(jié)構(gòu)提取了更多麥穗特征。分別單獨(dú)使用語(yǔ)義信息提取、多空洞率的卷積或VGG19 改進(jìn)后,模型計(jì)數(shù)性能都有所上升,模型取得最優(yōu)的R2、RMSE 與MAE 達(dá)到0.92、6.65 與5.12。

        模型3 使用多空洞率卷積與語(yǔ)義信息提取模塊,模型5 使用VGG19 與語(yǔ)義信息提取模塊,模型6 使用VGG19 與多空洞率卷積。采用兩種優(yōu)化方式結(jié)合,計(jì)數(shù)性能得到進(jìn)一步提升,模型取得最優(yōu)的R2、RMSE 與MAE達(dá)到0.93、6.31 與4.92。最終,使用VGG19 作為前端網(wǎng)絡(luò)、插入上下文語(yǔ)義信息提取模塊以及使用多種空洞率的后端網(wǎng)絡(luò)構(gòu)建的WECnet 達(dá)到了最優(yōu)的性能,其線(xiàn)性擬合R2達(dá)到0.95,RMSE 降低至6.1,MAE 降低至4.78,均為所有模型評(píng)價(jià)指標(biāo)的最優(yōu)值,相較于原始的人群計(jì)數(shù)網(wǎng)絡(luò),R2、RMSE 與MAE 性能分別提升4.4%、13.2%、9.8%,可以準(zhǔn)確對(duì)麥穗進(jìn)行計(jì)數(shù)。

        2.3 無(wú)人機(jī)實(shí)拍圖像計(jì)數(shù)結(jié)果分析

        在改進(jìn)的計(jì)數(shù)網(wǎng)絡(luò)上,本文對(duì)無(wú)人機(jī)拍攝的小麥圖像使用原始計(jì)數(shù)網(wǎng)絡(luò)及改進(jìn)網(wǎng)絡(luò)進(jìn)行麥穗數(shù)量預(yù)測(cè),同時(shí)與人工計(jì)數(shù)真實(shí)值進(jìn)行比較,結(jié)果如圖8 所示。

        總體來(lái)說(shuō),改進(jìn)后的4 種網(wǎng)絡(luò)都可以較準(zhǔn)確的對(duì)無(wú)人機(jī)獲取的圖像進(jìn)行麥穗計(jì)數(shù),R2均能達(dá)到0.85 以上,線(xiàn)性擬合線(xiàn)可以有效反映預(yù)測(cè)值與真實(shí)值的關(guān)系。具體來(lái)看,原始人群計(jì)數(shù)網(wǎng)絡(luò)CSRnet 的R2達(dá)到了0.87,擬合程度較高,但是大部分圖像預(yù)測(cè)麥穗數(shù)量大于真實(shí)數(shù)量,整體計(jì)數(shù)錯(cuò)誤率較高,錯(cuò)誤率5.49%。通過(guò)數(shù)據(jù)增強(qiáng)和改進(jìn)網(wǎng)絡(luò),降低了整體計(jì)數(shù)錯(cuò)誤率。在本文的WECnet上,使用數(shù)據(jù)增強(qiáng)計(jì)數(shù)對(duì)46 幅圖像總計(jì)3 880 個(gè)麥穗的計(jì)數(shù)結(jié)果為3 871,錯(cuò)誤率僅為0.23%,性能最優(yōu)。因此,本文方法訓(xùn)練的模型可以有效用于田間實(shí)拍的麥穗圖像計(jì)數(shù)中,對(duì)無(wú)人機(jī)獲取的小麥圖像可以進(jìn)行準(zhǔn)確的麥穗計(jì)數(shù),進(jìn)而對(duì)小麥的密度進(jìn)行預(yù)估以實(shí)現(xiàn)精準(zhǔn)的小麥估產(chǎn)。

        3 結(jié) 論

        本研究在人群計(jì)數(shù)網(wǎng)絡(luò)CSRnet 的基礎(chǔ)上,通過(guò)改進(jìn)構(gòu)建WECnet 網(wǎng)絡(luò)對(duì)無(wú)人機(jī)采集圖像中麥穗進(jìn)行計(jì)數(shù)。為了獲得可遷移的麥穗計(jì)數(shù)模型,選用全球5 個(gè)國(guó)家的1 000 幅不同品種小麥圖像以保證麥穗多樣性,并對(duì)訓(xùn)練集圖像進(jìn)行線(xiàn)性濾波增強(qiáng)。在WECnet 網(wǎng)絡(luò)前端,通過(guò)使用VGG19 的前12 層進(jìn)行特征提取,同時(shí)與上下文語(yǔ)義特征進(jìn)行融合,充分提取麥穗的特征信息,后端網(wǎng)絡(luò)使用多空洞率卷積在融合多尺度特征的同時(shí),保持網(wǎng)絡(luò)輸出較高分辨率的密度圖。為了驗(yàn)證模型的可遷移性,本研究通過(guò)訓(xùn)練好的模型對(duì)無(wú)人機(jī)獲取的麥田圖像進(jìn)行計(jì)數(shù)。研究結(jié)論如下:

        1)在全球小麥數(shù)據(jù)集上,本文訓(xùn)練的模型決定系數(shù)、均方根誤差與平均絕對(duì)誤差達(dá)到了0.95、6.1、4.78,相較原始的人群計(jì)數(shù)網(wǎng)絡(luò),計(jì)數(shù)準(zhǔn)確率得到提升。

        2)在無(wú)人機(jī)拍攝圖像計(jì)數(shù)中,決定系數(shù)達(dá)到了0.886,整體錯(cuò)誤率僅為0.23%,平均單幅圖像計(jì)數(shù)時(shí)間為32 ms,計(jì)數(shù)速度與精度都表現(xiàn)優(yōu)異。

        通過(guò)本文構(gòu)建的普適田間小麥密度預(yù)測(cè)模型,可以為無(wú)人機(jī)獲取的小麥圖像進(jìn)行麥田估產(chǎn)提供數(shù)據(jù)參考。

        猜你喜歡
        麥穗計(jì)數(shù)卷積
        五月麥穗金燦燦
        輕音樂(lè)(2022年11期)2022-11-22 12:56:18
        古人計(jì)數(shù)
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        彩虹色的雨
        遞歸計(jì)數(shù)的六種方式
        古代的計(jì)數(shù)方法
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        麥穗穗
        揀麥穗
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        日韩爱爱网站| 操风骚人妻沉沦中文字幕| 婷婷四虎东京热无码群交双飞视频 | 欧美成人国产精品高潮| 人妻少妇精品中文字幕av蜜桃| 国产又黄又爽视频| 日韩在线精品视频免费| 亚洲网站一区在线播放| 亚洲综合精品中文字幕| 国产中文欧美日韩在线| 欧美成人三级网站在线观看| 国产免费人成网站在线播放| 日韩精品极品免费在线视频 | 亚洲精品午夜精品国产| 国产专区国产精品国产三级| 人人摸人人搞人人透| 一本一本久久a久久精品综合| 无码av专区丝袜专区| 成人性生交大全免费看| 免费a级毛片无码免费视频120软件 | 日本在线观看| 欧洲亚洲视频免费| 大胸美女吃奶爽死视频| 中文字幕人成乱码中文| 99re6在线视频精品免费下载| 国产精品老熟女露脸视频| 日韩啪啪精品一区二区亚洲av| 久久精品国产一区老色匹| 日本免费在线不卡一区二区 | 激情欧美日韩一区二区| 在线不卡中文字幕福利| 国产麻豆精品传媒av在线| 无码人妻av一二区二区三区 | 最新国产av无码专区亚洲| 久久99国产亚洲高清观看首页| 青青草手机在线观看视频在线观看| 韩国三级中文字幕hd| 无码午夜人妻一区二区三区不卡视频| 亚洲国产字幕| 一区二区三区四区在线观看日本| 欧美乱人伦人妻中文字幕|