孫月瑩 ,陳俊霖 ,張勝茂 ,王書(shū)獻(xiàn) ,熊 瑛 ,樊 偉
(1.上海海洋大學(xué)信息學(xué)院,上海 201306;2.大連海洋大學(xué)航海與船舶工程學(xué)院,大連 116023;3.農(nóng)業(yè)農(nóng)村部漁業(yè)遙感重點(diǎn)試驗(yàn)室,中國(guó)水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所,上海 200090;4.江蘇省海洋水產(chǎn)研究所,南通 226007)
中國(guó)毛蝦 (Acetes chinensis) 又稱蝦皮,隸屬于櫻蝦科、毛蝦屬,為浮游性小型蝦類,分布于中國(guó)渤海、黃海、東海及南海北部沿岸,是重要的海洋經(jīng)濟(jì)漁業(yè)資源[1]。長(zhǎng)期以來(lái),生物和環(huán)境學(xué)家十分重視對(duì)海洋生物多樣性的保護(hù)[2],而非法的過(guò)度捕撈一直是海洋生物多樣性的最大威脅之一[3],導(dǎo)致包括中國(guó)毛蝦在內(nèi)的許多漁獲物的產(chǎn)量逐年下降?!吨袊?guó)漁業(yè)統(tǒng)計(jì)年鑒》顯示,中國(guó)毛蝦的捕撈產(chǎn)量自2006年達(dá)到72萬(wàn)t的峰值后,出現(xiàn)了急劇下降現(xiàn)象。2019年,中國(guó)毛蝦捕撈產(chǎn)量為38.9萬(wàn)t,相較于2018年42.5萬(wàn)t的捕撈產(chǎn)量再次出現(xiàn)了高達(dá)8.46%的負(fù)增長(zhǎng)。2020年,中國(guó)毛蝦捕撈產(chǎn)量為36.7萬(wàn)t,相較于2019年38.9萬(wàn)t的捕撈產(chǎn)量達(dá)5.62%的負(fù)增長(zhǎng)。為科學(xué)捕撈毛蝦、保護(hù)海洋漁業(yè)資源,中國(guó)于2020年開(kāi)始實(shí)行毛蝦限額捕撈[1, 4- 5]。嚴(yán)格的限額捕撈依賴于精準(zhǔn)的漁船捕撈作業(yè)數(shù)據(jù)[6],但是傳統(tǒng)的漁撈日志存在記錄完整度低、數(shù)據(jù)客觀性差等缺點(diǎn)[7]。因此,可將近幾年新興的電子監(jiān)控(electronic monitoring,EM)系統(tǒng)應(yīng)用于中國(guó)毛蝦限額捕撈漁船中,并以此數(shù)據(jù)來(lái)源開(kāi)發(fā)出自動(dòng)化的漁船作業(yè)信息記錄系統(tǒng),以規(guī)避傳統(tǒng)漁撈日志的弊端。
近年來(lái),國(guó)內(nèi)外許多學(xué)者進(jìn)行了相關(guān)捕撈作業(yè)研究。李國(guó)東等[8]以中國(guó)毛蝦限額捕撈管理為例,提取毛蝦網(wǎng)船在限額捕撈期間的北斗船位數(shù)據(jù),對(duì)捕撈努力量等管控要素進(jìn)行了分析研究,為解決中國(guó)單品種限額捕撈難點(diǎn)積累了經(jīng)驗(yàn)。WANG等[7]以監(jiān)控?cái)?shù)據(jù)為數(shù)據(jù)來(lái)源提出了一種基于三維卷積神經(jīng)網(wǎng)絡(luò)的中國(guó)毛蝦漁船狀態(tài)識(shí)別方法,實(shí)現(xiàn)了對(duì)捕撈作業(yè)漁船船位狀態(tài)的實(shí)時(shí)監(jiān)控。KALAISELVIV等[9]基于VMS(vessel monitoring system,VMS)數(shù)據(jù)開(kāi)發(fā)了用于預(yù)測(cè)船舶捕撈狀態(tài)的模型,該模型可以用來(lái)監(jiān)控非法的捕撈活動(dòng)。以上研究大多側(cè)重于捕撈行為,在漁業(yè)捕撈作業(yè)中目標(biāo)檢測(cè)和計(jì)數(shù)方面的研究較少。
深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)在文字、語(yǔ)音、圖片和視頻等領(lǐng)域應(yīng)用廣泛,近年來(lái),正逐漸深入到海洋等研究領(lǐng)域中[10-12]。各種預(yù)訓(xùn)練卷積網(wǎng)絡(luò)模型被用于提取圖像特征,但由于缺少運(yùn)動(dòng)建模,基于圖像的深度特征無(wú)法直接應(yīng)用于視頻[13-16]?;谏疃葘W(xué)習(xí)的行為識(shí)別技術(shù)通常以視頻流為數(shù)據(jù)源,綜合考察一個(gè)時(shí)間序列的圖像信息,繼而實(shí)現(xiàn)一個(gè)完整的行為識(shí)別[17-18]。深度學(xué)習(xí)中的目標(biāo)檢測(cè)算法,具有自動(dòng)提取特征,可并行化和檢測(cè)精度高等優(yōu)點(diǎn),廣泛應(yīng)用于高精度測(cè)量領(lǐng)域[19]。目標(biāo)檢測(cè)算法主要分為兩類:?jiǎn)坞A段算法(one stage)和雙階段算法(two stage)。單階段算法通過(guò)網(wǎng)絡(luò)提取特征來(lái)預(yù)測(cè)物體的分類與位置,主要有YOLO系列算法、SSD算法。雙階段算法需先生成候選區(qū)域再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)目標(biāo)的分類與定位,主要有R-CNN系列算法[20-22]。一般認(rèn)為,單階段算法實(shí)時(shí)性較好但檢測(cè)精度相比雙階段算法較差。但是,隨著YOLO等單階段目標(biāo)檢測(cè)算法的不斷迭代,其快速、高效、準(zhǔn)確的檢測(cè)性能受到了廣泛關(guān)注和應(yīng)用,目前主流的目標(biāo)檢測(cè)算法精度已經(jīng)達(dá)到了工業(yè)標(biāo)準(zhǔn)[23]。此外,YOLO系列算法還具有較強(qiáng)的泛化能力和適應(yīng)性,能夠適應(yīng)不同尺度、姿態(tài)、遮擋等復(fù)雜情況下的目標(biāo)檢測(cè)任務(wù),這對(duì)于海洋漁業(yè)領(lǐng)域的實(shí)際應(yīng)用非常有意義。
傳統(tǒng)的漁船捕撈作業(yè)研究主要基于VMS數(shù)據(jù),但VMS數(shù)據(jù)相比于EM數(shù)據(jù)具有一定的局限性,在停泊狀態(tài)下難以進(jìn)一步細(xì)分捕撈行為。EM可采集豐富的數(shù)據(jù)源,其中包含多種漁業(yè)信息[24-26],結(jié)合深度學(xué)習(xí)技術(shù),有助于分析捕魚(yú)動(dòng)態(tài),在漁船監(jiān)測(cè)領(lǐng)域有很好應(yīng)用前景。本研究以中國(guó)毛蝦限額捕撈漁船的EM數(shù)據(jù)為數(shù)據(jù)來(lái)源,對(duì)數(shù)據(jù)進(jìn)行篩選、標(biāo)記、劃分,采用目標(biāo)檢測(cè)算法中的YOLOv7算法實(shí)現(xiàn)毛蝦捕撈作業(yè)目標(biāo)檢測(cè),結(jié)合實(shí)際數(shù)據(jù)特征,對(duì)算法做了進(jìn)一步改進(jìn),以期提升算法在該領(lǐng)域的檢測(cè)性能。基于目標(biāo)檢測(cè)的結(jié)果,使用SORT算法,以視頻流為數(shù)據(jù)源,對(duì)檢測(cè)到的目標(biāo)進(jìn)行追蹤計(jì)數(shù),實(shí)現(xiàn)中國(guó)毛蝦捕撈漁船作業(yè)信息統(tǒng)計(jì)記錄。
本研究毛蝦捕撈船長(zhǎng)36.9 m、噸位160 t、主機(jī)功率220 kW,網(wǎng)具為張網(wǎng)(圖1a)。本研究所采用的EM數(shù)據(jù)利用型號(hào)為DS-2CD7A47EWD-XZS(D)的海康威視高清攝像頭拍攝,分辨率均為2 560×1 440像素,設(shè)置5個(gè)位置的拍攝(圖1b)。
圖1 毛蝦捕撈漁船監(jiān)控示意圖Fig.1 Schematic diagram of the monitoring of fishing vessels for Acetes chinensis
前甲板鐵桿上的攝像頭1朝船尾方向拍攝,從正方向拍攝記錄漁船工作區(qū)。前甲板駕駛艙上方的攝像頭2和攝像頭3互為補(bǔ)充的拍攝記錄了收放網(wǎng)過(guò)程及鐵錨的狀態(tài)。安裝在后甲板鐵桿上的攝像頭4朝船尾方向拍攝,用于拍攝記錄船舶碰撞等安全狀態(tài)。安裝在前甲板駕駛艙左下方的攝像頭5,用于拍攝記錄捕撈的毛蝦裝筐的漁獲過(guò)程。
捕撈漁船一般在白天作業(yè),晚上偶爾作業(yè)。為確保數(shù)據(jù)的有效性,對(duì)2022年6月15日—2022年7月10日的中國(guó)毛蝦限額捕撈EM數(shù)據(jù)進(jìn)行篩選,剔除晚上無(wú)作業(yè)、視頻模糊不清和斷幀等無(wú)效視頻段。選擇使用攝像頭2拍攝到的下網(wǎng)視頻,對(duì)下網(wǎng)時(shí)拋出的錨(anchor)進(jìn)行標(biāo)注識(shí)別,進(jìn)而對(duì)毛蝦捕撈漁船下網(wǎng)數(shù)量實(shí)現(xiàn)計(jì)數(shù)。選擇使用攝像頭5拍攝到的毛蝦裝筐漁獲過(guò)程視頻,對(duì)裝有毛蝦的筐(basket)進(jìn)行標(biāo)注識(shí)別,并對(duì)捕撈的毛蝦筐數(shù)進(jìn)行計(jì)數(shù),為實(shí)現(xiàn)毛蝦單位捕撈努力量漁獲量(catch per unit effort,CPUE)計(jì)算提供產(chǎn)量數(shù)據(jù)。經(jīng)過(guò)以上篩選后,最終選擇使用其中的80個(gè)有效視頻段作為本次試驗(yàn)的數(shù)據(jù)。
在有效視頻段中,隨機(jī)選取部分視頻使用PotPlayer工具截取目標(biāo)檢測(cè)模型所需的圖片數(shù)據(jù)(圖2),對(duì)圖片進(jìn)行篩選,并使用labelImg軟件標(biāo)注,同時(shí)生成對(duì)應(yīng)包含標(biāo)注類別和位置坐標(biāo)的txt標(biāo)簽文件,共標(biāo)注6 258張圖片。標(biāo)注分為兩類,分別命名為basket和anchor,依次代表裝有毛蝦的漁筐和下網(wǎng)時(shí)拋出的錨,其中含有basket目標(biāo)的圖片共3 364張,含有anchor目標(biāo)的圖片共2 894張。將兩類目標(biāo)圖片及其txt標(biāo)簽文件分別按照8∶1∶1分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,然后再將兩類目標(biāo)的對(duì)應(yīng)數(shù)據(jù)集合并,形成標(biāo)準(zhǔn)的coco格式數(shù)據(jù)集。
圖2 預(yù)訓(xùn)練圖片F(xiàn)ig.2 Pre-training images
本研究旨在利用深度學(xué)習(xí)方法通過(guò)中國(guó)毛蝦漁船EM視頻數(shù)據(jù)實(shí)現(xiàn)毛蝦捕撈作業(yè)目標(biāo)檢測(cè)與計(jì)數(shù),本研究的技術(shù)路線如圖3所示。
圖3 技術(shù)路線圖Fig.3 Technical routes graph
1)圖像獲?。涸趯?shí)施中國(guó)毛蝦限額捕撈的漁船上安裝EM系統(tǒng),獲取毛蝦捕撈過(guò)程的視頻數(shù)據(jù)。通過(guò)通訊基站或移動(dòng)硬盤(pán)等設(shè)備將數(shù)據(jù)傳輸?shù)椒?wù)器上。
2)數(shù)據(jù)集構(gòu)建:篩選有效視頻片段,提取視頻中關(guān)鍵的毛蝦捕撈作業(yè)圖像,對(duì)圖像進(jìn)行分類標(biāo)注后構(gòu)建目標(biāo)檢測(cè)數(shù)據(jù)集、目標(biāo)跟蹤計(jì)數(shù)數(shù)據(jù)集。
3)毛蝦捕撈作業(yè)目標(biāo)檢測(cè)網(wǎng)絡(luò)構(gòu)建:將構(gòu)建的目標(biāo)檢測(cè)數(shù)據(jù)集輸入到Y(jié)OLOv7網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,結(jié)合數(shù)據(jù)集的特征和實(shí)際需求對(duì)原始模型進(jìn)行改進(jìn),以得到目標(biāo)檢測(cè)性能更高的模型作為毛蝦捕撈作業(yè)跟蹤計(jì)數(shù)的檢測(cè)器。
4)毛蝦捕撈作業(yè)目標(biāo)識(shí)別和計(jì)數(shù)實(shí)現(xiàn):將采集篩選出的毛蝦捕撈作業(yè)視頻,使用改進(jìn)后的SORT算法進(jìn)行目標(biāo)檢測(cè)與計(jì)數(shù)試驗(yàn)。
5)結(jié)果分析:對(duì)毛蝦捕撈作業(yè)目標(biāo)檢測(cè)和計(jì)數(shù)結(jié)果進(jìn)行評(píng)估,將模型輸出的結(jié)果與人工核驗(yàn)的結(jié)果進(jìn)行對(duì)比分析,驗(yàn)證方法的可行性。
1.3.1 YOLOv7網(wǎng)絡(luò)模型
YOLOv7整體的網(wǎng)絡(luò)架構(gòu)如圖4所示,主要由輸入端Input、主干網(wǎng)絡(luò)Backbone和網(wǎng)絡(luò)輸出端Head3個(gè)部分組成。輸入端Input部分對(duì)輸入的圖片預(yù)處理,經(jīng)過(guò)Mosaic數(shù)據(jù)增強(qiáng)、自適應(yīng)圖像填充、自適應(yīng)錨框后得到640×640大小的RGB圖片,輸入到Backbone中。Backbone為網(wǎng)絡(luò)的主干,用于提取特征,由若干CBS模塊、MP1及ELAN結(jié)構(gòu)組成,其中CBS模塊由Conv+BN+SiLU構(gòu)成,MP1主要是由Maxpool和CBS構(gòu)成,ELAN是由多個(gè)CBS構(gòu)成的結(jié)構(gòu),實(shí)現(xiàn)對(duì)同一特征圖不同尺寸的特征提取。輸出端Head部分是一個(gè)PAFPN結(jié)構(gòu),與YOLOv5的head結(jié)構(gòu)基本一致,區(qū)別在于將YOLOv5中的CSP模塊換成了ELAN-P模塊,ELAN-P與backbone部分ELAN的組成結(jié)構(gòu)基本一致,不同之處是CAT數(shù)量不同。網(wǎng)絡(luò)Head部分最終完成類別預(yù)測(cè)和目標(biāo)邊界框錨定,輸出3個(gè)不同尺寸的預(yù)測(cè)結(jié)果,實(shí)現(xiàn)對(duì)多目標(biāo)的多尺度預(yù)測(cè)。
圖4 YOLOv7網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 YOLOv7 network structure
1.3.2 YOLOv7模型改進(jìn)
為了提高網(wǎng)絡(luò)性能,本文引入了MobileOne結(jié)構(gòu),提出了改進(jìn)的YOLOv7網(wǎng)絡(luò)模型YOLOv7-MO。主要改進(jìn)工作為:1)使用輕量級(jí)網(wǎng)絡(luò)MobileOne作為YOLO v7的主干網(wǎng)絡(luò)。2)網(wǎng)絡(luò)輸出端Head部分加入C3模塊。3)剪除一些冗余操作,讓整個(gè)網(wǎng)絡(luò)輕量化。
MobileOne的核心模塊基于MobileNetV1設(shè)計(jì),結(jié)構(gòu)與MobileNetV1基本一致,區(qū)別是把MobileNet中的深度可分離卷積替換為了圖5所示的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)塊。圖5中左側(cè)部分構(gòu)成了MobileOne的一個(gè)完整結(jié)構(gòu)塊,由上下兩部分構(gòu)成,其中上面部分基于深度卷積(depthwise convolution),下面部分基于點(diǎn)卷積(pointwise convolution),Act.表示激活函數(shù)。深度卷積模塊由三條分支構(gòu)成,最左側(cè)分支是1×1卷積;中間分支是過(guò)參數(shù)化的3×3卷積,即k個(gè)3×3卷積;右側(cè)部分是一個(gè)包含BN層的跳躍連接。深度卷積本質(zhì)上是分組卷積,分組數(shù)與通道數(shù)相同,這里的1×1卷積和3×3卷積都是深度卷積。點(diǎn)卷積模塊由兩條分支構(gòu)成,左側(cè)分支是過(guò)參數(shù)化的1×1卷積,由k個(gè)1×1卷積構(gòu)成,右側(cè)部分是一個(gè)包含BN層的跳躍連接。在訓(xùn)練階段,MobileOne由如圖5所示的神經(jīng)網(wǎng)絡(luò)塊堆疊而成。訓(xùn)練完成后經(jīng)過(guò)重參數(shù)化方法將圖5左側(cè)所示的神經(jīng)網(wǎng)絡(luò)塊重參數(shù)化為圖5右側(cè)的結(jié)構(gòu)。
圖5 MobileOne神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)塊Fig.5 MobileOne neural network blocks
1.3.3 SORT算法
在目標(biāo)檢測(cè)的基礎(chǔ)上對(duì)毛蝦捕撈作業(yè)信息進(jìn)行統(tǒng)計(jì),主要統(tǒng)計(jì)對(duì)象為漁筐(裝有毛蝦的筐)、錨(下網(wǎng)時(shí)拋的錨)即目標(biāo)檢測(cè)階段的basket和anchor目標(biāo)。根據(jù)視頻數(shù)據(jù)中basket和anchor目標(biāo)移動(dòng)時(shí)間不固定、同一時(shí)間可能出現(xiàn)多個(gè)basket目標(biāo)等特點(diǎn),本研究選擇使用基于目標(biāo)檢測(cè)的多目標(biāo)跟蹤算法SORT(simple online and realtime tracking)對(duì)毛蝦捕撈漁船EM數(shù)據(jù)進(jìn)行目標(biāo)跟蹤?;趯?duì)算法效率和準(zhǔn)確率的提升,對(duì)SORT算法的檢測(cè)部分做出改進(jìn):將其檢測(cè)部分由原始的Fast R-CNN替換為本研究預(yù)訓(xùn)練階段得到的最優(yōu)模型;在SORT算法中添加合適的碰撞檢測(cè)線、計(jì)數(shù)器、閾值和時(shí)間戳,在對(duì)basket和anchor進(jìn)行目標(biāo)追蹤的基礎(chǔ)上實(shí)現(xiàn)對(duì)兩者的計(jì)數(shù),由anchor和basket的數(shù)量可進(jìn)一步計(jì)算得到中國(guó)毛蝦捕撈漁船作業(yè)時(shí)的下網(wǎng)數(shù)量和CPUE值。
SORT算法是一個(gè)簡(jiǎn)單、有效、實(shí)用的多目標(biāo)跟蹤算法,核心是卡爾曼濾波和匈牙利算法[27],其算法流程如圖6所示。
圖6 改進(jìn)的SORT算法流程圖Fig.6 Flowchart of the improved SORT algorithm
卡爾曼濾波(Kalman filter)是一種高效的自回歸濾波器[28-29],其主要作用是通過(guò)傳感器測(cè)量獲得預(yù)測(cè)數(shù)據(jù),再根據(jù)預(yù)測(cè)和更新的公式,可以基于目標(biāo)前一時(shí)刻的位置來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的位置。
預(yù)測(cè)式:
更新式:
匈牙利算法又稱匈牙利匹配法,常在數(shù)學(xué)問(wèn)題上用于解決指派問(wèn)題,即上一幀的目標(biāo)和當(dāng)前幀的目標(biāo)具有一一對(duì)應(yīng)的關(guān)系,可求解出最好的分配結(jié)果[30-31]。在目標(biāo)追蹤中解決的是預(yù)測(cè)框和檢測(cè)框之間的分配問(wèn)題,即確定當(dāng)前幀的某個(gè)目標(biāo)是否與前一幀的某個(gè)目標(biāo)相同,如本試驗(yàn)的漁筐和錨。
通過(guò)卡爾曼濾波預(yù)測(cè)軌跡,并使用匈牙利算法將預(yù)測(cè)后的軌跡和當(dāng)前幀中的檢測(cè)目標(biāo)進(jìn)行匹配,之后對(duì)卡爾曼濾波更新,實(shí)現(xiàn)對(duì)同一物體的定位。最后,結(jié)合數(shù)據(jù)的實(shí)際特征設(shè)置閾值和時(shí)間戳,通過(guò)線與線的碰撞檢測(cè)方法,用計(jì)數(shù)器實(shí)現(xiàn)了對(duì)捕撈的漁筐和拋錨數(shù)量的精準(zhǔn)統(tǒng)計(jì)。
試驗(yàn)基于Ubuntu 18.04操作系統(tǒng), Python 3.8編程語(yǔ)言, Pytorch 1.8.2深度學(xué)習(xí)框架。試驗(yàn)使用訓(xùn)練集和驗(yàn)證集的數(shù)據(jù)進(jìn)行模型訓(xùn)練和驗(yàn)證。試驗(yàn)相關(guān)硬件配置和訓(xùn)練階段的模型參數(shù)設(shè)置如表1所示。
表1 試驗(yàn)相關(guān)硬件配置和模型參數(shù)Table 1 Experiment-related hardware configuration and model parameters
在檢驗(yàn)?zāi)P托Ч麜r(shí),本文采用精確度(precision,P)、召回率(recall,R)、平衡分?jǐn)?shù)(F1)、模型參數(shù)量(parameters)、浮點(diǎn)運(yùn)算數(shù)(floating point operations,F(xiàn)LOPs)、查準(zhǔn)率和查全率(P-R)曲線、F1曲線來(lái)評(píng)估目標(biāo)檢測(cè)模型的性能。
精確度(P)和召回率(R)的計(jì)算公式如下:
式中TP指將正樣本正確預(yù)測(cè)出來(lái)的數(shù)量,F(xiàn)P指將負(fù)樣本錯(cuò)誤的預(yù)測(cè)為正樣本的數(shù)量,F(xiàn)N指將正樣本預(yù)測(cè)為負(fù)樣本的數(shù)量。以本試驗(yàn)檢測(cè)的anchor為例,TP指在檢測(cè)anchor目標(biāo)時(shí)將真實(shí)為anchor的目標(biāo)預(yù)測(cè)為anchor的數(shù)量,F(xiàn)P指將不是anchor的目標(biāo)預(yù)測(cè)為anchor的數(shù)量,F(xiàn)N指將真實(shí)anchor的目標(biāo)預(yù)測(cè)為其他的數(shù)量。
F1是P和R的調(diào)和值,綜合考慮了召回率和精確率對(duì)試驗(yàn)數(shù)據(jù)的影響,防止某一指標(biāo)主導(dǎo)試驗(yàn)結(jié)果,計(jì)算式如下所示:
浮點(diǎn)運(yùn)算量(floating point operations,F(xiàn)LOPs)即模型計(jì)算量,其大小可以用來(lái)衡量模型復(fù)雜度。
P-R曲線可以直觀地顯示出樣本的精確率和召回率在總體數(shù)據(jù)上的關(guān)系,曲線與坐標(biāo)軸圍成的面積為類別平均精度AP值和各類平均精度mAP值,兩者的計(jì)算式如下所示:
本文使用ACP值(average counting precision)來(lái)評(píng)估中國(guó)毛蝦捕撈漁船作業(yè)的計(jì)數(shù)算法準(zhǔn)確率,計(jì)算式如下所示:
式中S表示算法統(tǒng)計(jì)的basket或anchor數(shù)量,N表示人工統(tǒng)計(jì)的basket或anchor數(shù)量,i表示視頻序號(hào),j代表目標(biāo)種類,M表示計(jì)數(shù)試驗(yàn)的視頻段總數(shù)量。
2.1.1 YOLOv7模型與YOLO系列其他模型對(duì)比
為驗(yàn)證YOLOv7在本研究毛蝦捕撈漁船作業(yè)數(shù)據(jù)集上檢測(cè)效果,分別將YOLOv3、YOLOv5s和YOLOv7三種YOLO系列的網(wǎng)絡(luò)模型在毛蝦捕撈漁船作業(yè)數(shù)據(jù)集上進(jìn)行訓(xùn)練,并在測(cè)試集上進(jìn)行測(cè)試,試驗(yàn)結(jié)果如表2所示。
表2 不同YOLO系列模型檢測(cè)結(jié)果Table 2 Different YOLO series model target detection results
通過(guò)表2對(duì)比結(jié)果可以看出,在相同迭代次數(shù)內(nèi),YOLOv7網(wǎng)絡(luò)模型的大小和參數(shù)量小于YOLOv3,大于YOLOv5s, 但YOLOv7網(wǎng)絡(luò)模型的大小和參數(shù)量已能滿足毛蝦捕撈作業(yè)的決策需求。YOLOv7的各類平均平衡分?jǐn)?shù)F1比YOLOv3和YOLOv5s分別高出10.2、3.4個(gè)百分點(diǎn),F(xiàn)1得分情況在basket和anchor兩類目標(biāo)上YOLOv7均高于YOLOv3和YOLOv5s兩類模型。因此,本研究選用YOLOv7模型,并在此基礎(chǔ)上進(jìn)行改進(jìn),以增強(qiáng)其在實(shí)際漁船作業(yè)情況下,提高捕撈漁船作業(yè)目標(biāo)的實(shí)時(shí)監(jiān)測(cè)準(zhǔn)確率并使得模型更加容易嵌入到EM系統(tǒng)中。
2.1.2 改進(jìn)YOLOv7結(jié)果對(duì)比
將目標(biāo)檢測(cè)階段訓(xùn)練得到的YOLOv7和YOLOv7-MO模型在相同的測(cè)試集(658張圖像)下進(jìn)行對(duì)比試驗(yàn),得到如表3所示目標(biāo)檢測(cè)結(jié)果。
表3 目標(biāo)檢測(cè)模型結(jié)果對(duì)比Table 3 Comparison of target detection models results
由表3可知,本研究改進(jìn)的YOLOv7-MO模型相比原始YOLOv7模型檢測(cè)效果有了明顯提升。改進(jìn)后的YOLOv7-MO模型在測(cè)試集上獲得了97.3%的平均識(shí)別精確率,其中漁筐和錨的識(shí)別精確率分別為96.9%和97.6%。改進(jìn)后的YOLOv7-MO相比原始YOLOv7模型的P、R、F1值均有提升,根據(jù)表中數(shù)據(jù)計(jì)算可得,改進(jìn)后的模型相比原始模型,兩類平均P、R、F1分別提升了2.0、1.1、1.5個(gè)百分點(diǎn)。
圖7a為本試驗(yàn)?zāi)P蚘OLOv7-MO的總體及兩類目標(biāo)(Basket、anchor)在測(cè)試集上的P-R曲線對(duì)比圖。其中橫軸代表Recall,縱軸代表Precision,該曲線與坐標(biāo)軸圍成的面積為類別精度(AP)值,其中basket和anchor的值分別為98.9%和98.8%,各類平均精度(mAP)值為98.8%。
圖7 YOLOv7-MO模型目標(biāo)檢測(cè)結(jié)果Fig.7 YOLOv7-MO model target detection results
圖7b為本試驗(yàn)?zāi)P蚘OLOv7-MO的總體及兩類目標(biāo)(Basket、anchor)在測(cè)試集上的F1得分圖。由圖可得,置信度在40%~60%區(qū)間上取得了比較好的F1分?jǐn)?shù),在置信度為51.9%時(shí),兩類平均F1分?jǐn)?shù)取得了最大值97.0%。
在深度學(xué)習(xí)模型中,模型大小及其復(fù)雜度直接影響了實(shí)際應(yīng)用的效果。模型大小(model size)可以直接影響模型的運(yùn)行速度。模型的復(fù)雜度可以用參數(shù)量(parameters)和浮點(diǎn)運(yùn)算數(shù)(floating point operations,F(xiàn)LOPs)來(lái)衡量,兩者可以共同描述模型計(jì)算量,模型的復(fù)雜度也可以直接影響模型的運(yùn)行速度。
由表4的模型參數(shù)結(jié)果對(duì)比可得,本研究?jī)?yōu)化的YOLOv7-MO模型大小、參數(shù)量、浮點(diǎn)運(yùn)算量較原始模型YOLOv7均有所下降,模型運(yùn)行速度得到了提升。因此,在毛蝦捕撈目標(biāo)識(shí)別中,本研究?jī)?yōu)化的YOLOv7-MO模型相較于原始的YOLOv7模型目標(biāo)檢測(cè)效果和模型大小及其復(fù)雜度均取得了較好的效果,模型性能得到了提升,可用于毛蝦捕撈目標(biāo)識(shí)別。
表4 模型參數(shù)比較Table 4 Comparison of model parameters
2.1.3 與其他模型的比較
在本研究的毛蝦捕撈漁船作業(yè)數(shù)據(jù)集上,將本研究改進(jìn)的模型與改進(jìn)前的YOLOv7模型以及其他典型的目標(biāo)檢測(cè)算法模型Faster RCNN、YOLOv3、YOLOv5s分別進(jìn)行對(duì)比,結(jié)果如表5所示。
表5 不同模型檢測(cè)效果對(duì)比Table 5 Comparison of detection results of different models
通過(guò)對(duì)比可以看出,相比雙階段模型(以Faster RCNN為例)YOLO系列模型較小且目標(biāo)檢測(cè)效果較好。雖然Faster RCNN模型的精確度和召回率較高,但是平均準(zhǔn)確率和各類AP值明顯低于YOLO系列模型,在實(shí)際的漁船捕撈作業(yè)中錯(cuò)檢漏檢情況會(huì)較為明顯。本文根據(jù)YOLOv7改進(jìn)后的YOLOv7-MO模型平均準(zhǔn)確率與Faster RCNN、YOLOv3、YOLOv5s、YOLOv7模型相比,分別提高了21.4、12.7、1.1和0.7個(gè)百分點(diǎn)。平衡分?jǐn)?shù)F1相比YOLO系列模型中的YOLOv3、YOLOv5s、YOLOv7分別提升了11.7、4.9、1.5個(gè)百分點(diǎn)。改進(jìn)后的模型大小和參數(shù)量小于YOLOv7,綜合性能指標(biāo)有一定的優(yōu)勢(shì)。
2.1.4 改進(jìn)后模型檢測(cè)效果
本試驗(yàn)?zāi)P蚘OLOv7-MO的檢測(cè)效果如圖8所示,圖8a、8b、8c分別表示了在等待拋錨、開(kāi)始拋錨和拋錨過(guò)程三個(gè)主要狀態(tài)下,模型對(duì)anchor目標(biāo)的檢測(cè)情況;圖8d、8e、8f表示了在收網(wǎng)過(guò)程中,模型對(duì)basket目標(biāo)的檢測(cè)情況,圖8d表示單個(gè)目標(biāo)出現(xiàn)時(shí)的檢測(cè)情況、圖8e表示目標(biāo)被遮擋時(shí)的檢測(cè)情況、圖8f表示多個(gè)目標(biāo)出現(xiàn)時(shí)的檢測(cè)情況。由圖片和視頻檢測(cè)效果可得,該模型可以精確的識(shí)別出漁船EM視頻數(shù)據(jù)中的basket和anchor,由此進(jìn)一步可得漁船作業(yè)過(guò)程中的下網(wǎng)數(shù)量和漁獲量。
圖8 YOLOv7-MO模型檢測(cè)效果Fig.8 YOLOv7-MO model detection effects
對(duì)毛蝦主要作業(yè)類別(下網(wǎng)數(shù)量和漁獲筐數(shù))進(jìn)行人工統(tǒng)計(jì),與YOLOv7-MO-SORT的統(tǒng)計(jì)結(jié)果作對(duì)比。在算法中添加碰撞檢測(cè)線,如圖9所示,采用黑色線作為計(jì)數(shù)統(tǒng)計(jì)試驗(yàn)的碰撞檢測(cè)線,圖9a、9b中黑色水平直線為basket計(jì)數(shù)的碰撞檢測(cè)線,圖9c、9d中黑色斜線為anchor計(jì)數(shù)的碰撞檢測(cè)線。
圖9 計(jì)數(shù)統(tǒng)計(jì)碰撞檢測(cè)線示意圖Fig.9 Schematic diagram of the counted statistical collision detection line
在算法中設(shè)置碰撞檢測(cè)線、計(jì)數(shù)器、閾值和時(shí)間戳。根據(jù)視頻數(shù)據(jù)的實(shí)際情況,毛蝦漁獲過(guò)程中basket目標(biāo)由人拖動(dòng),所以攝像頭5拍攝到的basket目標(biāo)通過(guò)檢測(cè)線時(shí)存在目標(biāo)被遮擋和目標(biāo)不完整的情況。結(jié)合實(shí)際數(shù)據(jù)特征,將basket目標(biāo)的置信度計(jì)數(shù)閾值設(shè)置為0.5,即當(dāng)通過(guò)檢測(cè)線的basket目標(biāo)檢測(cè)置信度大于等于0.5時(shí),認(rèn)為該目標(biāo)是應(yīng)當(dāng)被檢出的basket目標(biāo)。通過(guò)觀察訓(xùn)練出的最優(yōu)目標(biāo)檢測(cè)模型對(duì)EM視頻中anchor目標(biāo)的檢測(cè)情況,在下網(wǎng)拋錨過(guò)程中anchor目標(biāo)的置信度在0.8左右,因此將anchor目標(biāo)的置信度計(jì)數(shù)閾值設(shè)置為0.7。圖像左上方顯示目標(biāo)計(jì)數(shù)器,檢測(cè)到的目標(biāo)未通過(guò)檢測(cè)線時(shí)計(jì)數(shù)器并未對(duì)該目標(biāo)計(jì)數(shù),目標(biāo)達(dá)到設(shè)定閾值并通過(guò)檢測(cè)線后計(jì)數(shù)器對(duì)目標(biāo)進(jìn)行計(jì)數(shù)。
隨機(jī)選取有效視頻段中15個(gè)含有漁獲毛蝦裝筐的視頻段,人工統(tǒng)計(jì)15個(gè)視頻段的漁獲毛蝦筐數(shù)(Nb)。將隨機(jī)選取的15個(gè)漁獲毛蝦視頻段輸入YOLOv7-MOSORT算法中,對(duì)漁獲的毛蝦筐數(shù)(Sb)進(jìn)行統(tǒng)計(jì),得到如表6所示的計(jì)數(shù)信息。
表6 漁獲毛蝦筐數(shù)計(jì)數(shù)試驗(yàn)結(jié)果統(tǒng)計(jì)Table 6 Statistics on the results of the basket counting experiment
隨機(jī)選取有效視頻段中含有10次下網(wǎng)作業(yè)的視頻段,人工統(tǒng)計(jì)10次下網(wǎng)作業(yè)的下網(wǎng)數(shù)量(Nn)。將隨機(jī)選取的10次下網(wǎng)作業(yè)的視頻段輸入YOLOv7-MO-SORT算法中,對(duì)拋錨的數(shù)量(Sa)進(jìn)行統(tǒng)計(jì)繼而得到下網(wǎng)數(shù)量(Sn),據(jù)張網(wǎng)捕撈示意圖可得兩者的數(shù)量關(guān)系如式(9)所示。下網(wǎng)數(shù)量計(jì)數(shù)信息如表7所示。
表7 下網(wǎng)數(shù)量計(jì)數(shù)試驗(yàn)結(jié)果統(tǒng)計(jì)Table 7 Statistics on the results of the net counting experiment
通過(guò)計(jì)算可得,本研究YOLOv7-MO-SORT模型實(shí)現(xiàn)了毛蝦筐數(shù)80.0%和下網(wǎng)數(shù)量95.8%的計(jì)數(shù)精度。
傳統(tǒng)的漁船捕撈作業(yè)研究主要基于VMS數(shù)據(jù),但VMS數(shù)據(jù)相比于EM數(shù)據(jù)具有一定的局限性。VMS系統(tǒng)是基于衛(wèi)星定位技術(shù)的船舶監(jiān)控系統(tǒng),其數(shù)據(jù)主要包含船舶經(jīng)緯度、航速、航向等船位信息,可用于識(shí)別漁船捕撈行為[12, 32]。EM系統(tǒng)是以攝像裝置為核心的電子監(jiān)控系統(tǒng),以視頻的形式記錄作業(yè)漁船的行為活動(dòng),EM數(shù)據(jù)是實(shí)時(shí)的視頻,可用于量化漁船作業(yè)信息。例如,在航速為0時(shí),基于VMS數(shù)據(jù)僅可將漁船行為識(shí)別為停泊。但在此情況下,根據(jù)EM數(shù)據(jù)可做進(jìn)一步的漁船作業(yè)識(shí)別和信息統(tǒng)計(jì),如:拋錨、下網(wǎng)、收錨、收網(wǎng)行為識(shí)別、量化漁獲或下網(wǎng)數(shù)量。此外,目前漁船作業(yè)的統(tǒng)計(jì)主要依靠人工記錄的方法,往往會(huì)出現(xiàn)漏記、錯(cuò)記等現(xiàn)象,導(dǎo)致航次捕撈統(tǒng)計(jì)的結(jié)果不準(zhǔn)確。在作業(yè)漁船上安裝EM系統(tǒng),可以輔助觀察員,以更加直觀、客觀的方法對(duì)漁船作業(yè)信息監(jiān)控和記錄。
本研究在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理時(shí)首先對(duì)獲取到的EM數(shù)據(jù)進(jìn)行篩選,剔除晚上無(wú)作業(yè)、視頻模糊不清和斷幀等無(wú)效的視頻段,提高了數(shù)據(jù)質(zhì)量,確保了試驗(yàn)數(shù)據(jù)的有效性,提高了試驗(yàn)效率。在深度學(xué)習(xí)算法中,訓(xùn)練集用于計(jì)算梯度更新權(quán)重,即訓(xùn)練模型;驗(yàn)證集在模型訓(xùn)練過(guò)程中檢驗(yàn)?zāi)P团渲?,?yàn)證模型的有效性,挑選獲得最佳效果的模型,在模型訓(xùn)練過(guò)程中通常是重復(fù)利用的;測(cè)試集用于評(píng)估模型,選擇使用未參與模型訓(xùn)練和驗(yàn)證的數(shù)據(jù)對(duì)模型進(jìn)行評(píng)估可避免過(guò)擬合現(xiàn)象的出現(xiàn),有效評(píng)估模型的泛化能力。因此,本研究進(jìn)行目標(biāo)檢測(cè)模型訓(xùn)練與評(píng)估時(shí),將數(shù)據(jù)集按照8∶1∶1劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,確保了試驗(yàn)結(jié)果的可靠性。
本研究以YOLOv7模型為基礎(chǔ),它在YOLO系列先前工作的基礎(chǔ)上進(jìn)一步提高了檢測(cè)速度和精度[33-36]??傮w架構(gòu)方面提出了ELAN結(jié)構(gòu)及基于此的E-ELAN結(jié)構(gòu)[37-38],該架構(gòu)在不破壞原始梯度路徑的情況下可以增強(qiáng)網(wǎng)絡(luò)的學(xué)習(xí)能力。在網(wǎng)絡(luò)優(yōu)化策略方面,添加了一個(gè)額外的輔助頭部結(jié)構(gòu)[39]。網(wǎng)絡(luò)新增方便部署的REP層,REP層在訓(xùn)練時(shí),如果輸入和輸出的通道數(shù)、高、寬和大小一致時(shí),會(huì)再添加一個(gè)BN的分支,三個(gè)分支相加輸出。在部署時(shí),會(huì)將分支的參數(shù)重參數(shù)化到主分支上,取3×3的主分支卷積輸出,這對(duì)部署非常方便[40-41]。
MobileOne是Apple公司為移動(dòng)設(shè)備設(shè)計(jì)的基于重參數(shù)化的主干神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),具有簡(jiǎn)單、高效、即插即用的特點(diǎn),實(shí)現(xiàn)了高效架構(gòu)中最先進(jìn)的技能[42]。本研究選擇使用該輕量級(jí)網(wǎng)絡(luò)作為YOLOv7的主干網(wǎng)絡(luò),并在輸出端head部分加入了C3模塊,從試驗(yàn)結(jié)果來(lái)看,該改進(jìn)方法使得模型精確率(P)、召回率(R)、F1得分情況相比YOLOv7模型分別提升了2.0、1.1和1.5個(gè)百分點(diǎn)。在選擇使用輕量級(jí)網(wǎng)絡(luò)MobileOne輕量級(jí)網(wǎng)絡(luò)作為模型主干網(wǎng)絡(luò)的同時(shí)剪除了YOLOv7模型中的一些冗余操作,使得模型更加輕量化,改進(jìn)后的模型大小明顯減小,模型大小、參數(shù)量和浮點(diǎn)運(yùn)算數(shù)相比YOLOv7模型分別縮小了10.2%、10.6%和61.6%,提高了模型的運(yùn)行速度和可用性。
評(píng)估計(jì)數(shù)模型時(shí),使用本研究設(shè)計(jì)的評(píng)估指標(biāo)ACP。隨機(jī)選取一定數(shù)量的有效視頻段,對(duì)每個(gè)視頻段進(jìn)行人工計(jì)數(shù),再輸入模型進(jìn)行計(jì)數(shù),計(jì)算得到兩者計(jì)數(shù)之差,將所有視頻段的計(jì)數(shù)差值相加除以各視頻段的人工計(jì)數(shù)總數(shù)得到計(jì)數(shù)誤差,進(jìn)而計(jì)算得到計(jì)數(shù)準(zhǔn)確率(ACP)。吳必朗等[43]在進(jìn)行魚(yú)道過(guò)魚(yú)計(jì)數(shù)時(shí),采用模型計(jì)數(shù)總數(shù)除以人工計(jì)數(shù)總數(shù)的計(jì)算方法評(píng)估計(jì)數(shù)模型性能,該方法可能會(huì)因?yàn)樵囼?yàn)樣本的選擇存在一定的偶然誤差。ZHANG等[44]在進(jìn)行丁香魚(yú)作業(yè)漁船信息計(jì)數(shù)時(shí),也采用模型計(jì)數(shù)總數(shù)除以人工計(jì)數(shù)總數(shù)的計(jì)算方法評(píng)估計(jì)數(shù)模型性能,但試驗(yàn)數(shù)據(jù)本身可能是多個(gè)視頻段,因此該計(jì)算方法可能會(huì)存在一定的修正誤差。本研究中的計(jì)數(shù)試驗(yàn)選擇采用多個(gè)視頻段作為試驗(yàn)數(shù)據(jù),避免了單個(gè)視頻段帶來(lái)的計(jì)數(shù)偶然誤差;計(jì)算計(jì)數(shù)準(zhǔn)確率時(shí),用每個(gè)視頻段人工計(jì)數(shù)與模型計(jì)數(shù)的差值之和除以總體人工計(jì)數(shù)之和,可以避免修正誤差,本試驗(yàn)設(shè)計(jì)的評(píng)估指標(biāo)能更加合理評(píng)估計(jì)數(shù)試驗(yàn)?zāi)P汀?/p>
對(duì)于置信度計(jì)數(shù)閾值的選取,一般需要根據(jù)實(shí)際場(chǎng)景中目標(biāo)的大小、形態(tài)、數(shù)量等特點(diǎn)來(lái)確定。通常情況下,較小的置信度計(jì)數(shù)閾值可以提高目標(biāo)檢測(cè)的召回率,但同時(shí)也會(huì)引入一些誤檢結(jié)果。較高的置信度計(jì)數(shù)閾值可以提高檢測(cè)結(jié)果,但可能會(huì)導(dǎo)致漏檢的情況。
本研究在對(duì)目標(biāo)的計(jì)數(shù)閾值進(jìn)行選取時(shí),主要考慮目標(biāo)的大小、數(shù)量和分布情況。Anchor目標(biāo)的數(shù)量相對(duì)較多出現(xiàn)頻率較高,且anchor目標(biāo)個(gè)體較大,結(jié)合目標(biāo)檢測(cè)階段對(duì)anchor目標(biāo)檢測(cè)精度和置信度均大于0.8的試驗(yàn)結(jié)果,將anchor目標(biāo)的計(jì)數(shù)閾值設(shè)置為0.7,以確保目標(biāo)檢測(cè)追蹤到anchor目標(biāo)并完成正確計(jì)數(shù),并避免一些虛假檢測(cè)結(jié)果的產(chǎn)生。Basket目標(biāo)的數(shù)量根據(jù)實(shí)際作業(yè)情況來(lái)看,在大多數(shù)情況下,其出現(xiàn)的頻率較低,且basket目標(biāo)個(gè)體較小,在漁船工作人員將其移動(dòng)通過(guò)攝像頭5時(shí),會(huì)出現(xiàn)目標(biāo)遮擋的情況,在目標(biāo)追蹤到通過(guò)檢測(cè)線的瞬間,basket目標(biāo)的目標(biāo)檢測(cè)置信度較低,因此適當(dāng)降低目標(biāo)計(jì)數(shù)閾值,將basket目標(biāo)的計(jì)數(shù)閾值設(shè)置為0.5,減少漏檢情況的發(fā)生。
本研究仍存在一些不足之處有待改進(jìn)。在EM視頻識(shí)別計(jì)數(shù)結(jié)果中,目標(biāo)檢測(cè)框會(huì)出現(xiàn)短暫的消失和重現(xiàn),這使得計(jì)數(shù)結(jié)果出現(xiàn)了一定的誤差。因此,在試驗(yàn)中采用卡爾曼濾波消除抖動(dòng),使得預(yù)測(cè)框在整個(gè)檢測(cè)過(guò)程中保持平穩(wěn),得到更加準(zhǔn)確的檢測(cè)結(jié)果。模型統(tǒng)計(jì)的下網(wǎng)數(shù)量偏高,是因?yàn)樵谀P徒y(tǒng)計(jì)拋錨數(shù)量時(shí),anchor目標(biāo)被重復(fù)檢測(cè)。通過(guò)觀察總結(jié)拋錨規(guī)律,設(shè)置時(shí)間戳,當(dāng)兩次檢測(cè)出anchor目標(biāo)之間達(dá)到一定時(shí)間間隔時(shí)被認(rèn)為出現(xiàn)下一個(gè)anchor目標(biāo),進(jìn)行計(jì)數(shù),anchor目標(biāo)的計(jì)數(shù)誤差問(wèn)題因此得到了一定的解決。在進(jìn)行毛蝦筐(basket)的計(jì)數(shù)統(tǒng)計(jì)時(shí),實(shí)際作業(yè)規(guī)律不穩(wěn)定,并非所有漁獲的裝有毛蝦的筐都會(huì)通過(guò)本研究設(shè)置的檢測(cè)線。當(dāng)漁獲量較大時(shí),作業(yè)后期漁獲的一些裝有毛蝦的筐可能未通過(guò)檢測(cè)線,如圖10a所示。當(dāng)轉(zhuǎn)運(yùn)船到達(dá)時(shí),這些未通過(guò)計(jì)數(shù)檢測(cè)線的漁筐會(huì)直接轉(zhuǎn)載到轉(zhuǎn)運(yùn)船,本試驗(yàn)設(shè)置的計(jì)數(shù)器未對(duì)其進(jìn)行計(jì)數(shù),如圖10b所示直接被移動(dòng)到圖像的右側(cè)區(qū)域。此外,當(dāng)裝有毛蝦的筐(basket)通過(guò)檢測(cè)線時(shí),在攝像頭拍攝到的圖像中,basket目標(biāo)會(huì)被船員遮擋,如圖10c左下方所示導(dǎo)致可識(shí)別的目標(biāo)不完整,當(dāng)模型識(shí)別出此目標(biāo)時(shí),置信度較低。
圖10 漁獲毛蝦時(shí)的特殊情況Fig.10 Special circumstances when catching Acetes chinensis
本研究為確保計(jì)數(shù)目標(biāo)是正確目標(biāo),在計(jì)數(shù)模型中設(shè)置了閾值,考慮到basket目標(biāo)通過(guò)檢測(cè)線時(shí)目標(biāo)不完整、置信度較低的情況,適當(dāng)調(diào)低了basket計(jì)數(shù)閾值,以盡可能確保船員拖動(dòng)的basket目標(biāo)通過(guò)檢測(cè)線時(shí)被檢測(cè)出。因此,本研究所作的毛蝦筐數(shù)計(jì)數(shù)統(tǒng)計(jì)是在basket目標(biāo)均通過(guò)檢測(cè)線的理想狀態(tài)下的統(tǒng)計(jì)。針對(duì)以上所述問(wèn)題,還需進(jìn)行進(jìn)一步的研究,可以解決的方案有:1)在作業(yè)漁船的適當(dāng)位置增加安裝攝像頭,拍攝作業(yè)漁船漁獲物的轉(zhuǎn)運(yùn)情況,通過(guò)漁獲物的轉(zhuǎn)運(yùn)EM數(shù)據(jù)進(jìn)行計(jì)數(shù)。調(diào)整現(xiàn)有攝像頭的位置,拍攝更清楚的作業(yè)過(guò)程。2)制定漁船作業(yè)規(guī)范,劃分漁船工作區(qū)域,船員在工作時(shí)將漁獲物按照指定區(qū)域和流程進(jìn)行移動(dòng)。3)修改模型,設(shè)計(jì)更加合理的計(jì)數(shù)方法,以進(jìn)行完整計(jì)數(shù)。
針對(duì)中國(guó)毛蝦捕撈漁船限額捕撈作業(yè)規(guī)范問(wèn)題,研究采用漁船電子監(jiān)控(electronic monitoring,EM)系統(tǒng)采集作業(yè)數(shù)據(jù),改進(jìn)YOLOv7模型,構(gòu)建了YOLOv7-MO目標(biāo)檢測(cè)模型和YOLOv7-MO-SORT計(jì)數(shù)模型。目標(biāo)檢測(cè)YOLOv7-MO模型使用輕量級(jí)網(wǎng)絡(luò)MobileOne作為主干網(wǎng)絡(luò),網(wǎng)絡(luò)輸出端head部分加入C3模塊,在原始YOLOv7模型上剪除了一些冗余操作,讓整個(gè)網(wǎng)絡(luò)輕量化,更適合漁船捕撈作業(yè)識(shí)別。使用該模型對(duì)中國(guó)毛蝦限額捕撈漁船的主要特征進(jìn)行檢測(cè),達(dá)到了97.3%的識(shí)別精確率,在模型更加輕量化的基礎(chǔ)上實(shí)現(xiàn)了更好的準(zhǔn)確性。在目標(biāo)檢測(cè)的基礎(chǔ)上,改進(jìn)SORT算法對(duì)目標(biāo)進(jìn)行計(jì)數(shù),將目標(biāo)檢測(cè)部分修改為預(yù)訓(xùn)練的YOLOv7-MO,并在算法當(dāng)中添加合適的碰撞檢測(cè)線,設(shè)置閾值和計(jì)數(shù)器,實(shí)現(xiàn)了對(duì)毛蝦捕撈漁船漁獲毛蝦筐數(shù)和下網(wǎng)數(shù)量的自動(dòng)化數(shù)量統(tǒng)計(jì),分別達(dá)到了80%和95.8%的計(jì)數(shù)準(zhǔn)確率。該功能方便漁船作業(yè)信息的管理和記錄,一定程度上避免了傳統(tǒng)的人工記錄漁船作業(yè)信息的一些弊端,進(jìn)行毛蝦筐數(shù)計(jì)數(shù)統(tǒng)計(jì)可為毛蝦單位捕撈努力量漁獲量(catch per unit effort,CPUE)等漁業(yè)信息值的計(jì)算提供方便。本研究解決了毛蝦捕撈漁船作業(yè)識(shí)別和計(jì)數(shù)問(wèn)題,同樣可應(yīng)用于其他作業(yè)漁船,為后續(xù)實(shí)現(xiàn)精度更高、更快的捕撈漁船作業(yè)識(shí)別和統(tǒng)計(jì)方法提供了參考。