袁紅春 陳冠奇 張?zhí)祢? 宋利明
摘要:長(zhǎng)鰭金槍魚(Thunnus alalunga)為南太平洋延繩釣的主要目標(biāo)魚種之一,精確預(yù)報(bào)其漁場(chǎng)對(duì)于提高捕撈效率和優(yōu)化漁業(yè)資源管理具有重要意義。本研究依據(jù)2000-2015年南太平洋長(zhǎng)鰭金槍魚的延繩釣數(shù)據(jù)、漁場(chǎng)時(shí)空數(shù)據(jù)以及海表溫度、葉綠素a濃度和海面高度3種環(huán)境因子,采用全卷積網(wǎng)絡(luò)構(gòu)建了一種以月為單位、空間分辨率為5°×5°的漁場(chǎng)預(yù)報(bào)模型。本研究提出三維獨(dú)熱編碼技術(shù)將各月環(huán)境數(shù)據(jù)映射到三維矩陣的不同層上,并設(shè)計(jì)2種卷積結(jié)構(gòu)和3種全卷積網(wǎng)絡(luò)模型,利用2015年數(shù)據(jù)對(duì)研究模型進(jìn)行驗(yàn)證,最佳模型總精準(zhǔn)率達(dá)到72.0%。結(jié)果表明,全卷積網(wǎng)絡(luò)在一定程度上解決了傳統(tǒng)漁場(chǎng)預(yù)報(bào)方法在處理高維復(fù)雜海洋數(shù)據(jù)時(shí)準(zhǔn)確率偏低的問(wèn)題,為漁場(chǎng)預(yù)報(bào)提供了一種新方法。
關(guān)鍵詞:全卷積網(wǎng)絡(luò);三維獨(dú)熱編碼;漁場(chǎng)預(yù)報(bào);長(zhǎng)鰭金槍魚
中圖分類號(hào):S934文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000-4440(2020)02-0423-07
Abstract:Thunnus alalunga is one of main objects of longline fishing in the South Pacific. Accurate prediction of albacore tuna fisheries is of great significance for improving fishing efficiency and optimizing the management of fishery resources. Based on the historical catching data of albacore tuna, spatio-temporal data and three environmental data including sea surface temperature (SST), sea surface height (SSH) and chlorophyll-a concentration (Chla) form 2000 to 2015 in the South Pacific, a fishing ground prediction model with a monthly unit and spatial resolution of 5°×5° in the South Pacific was established using fully convolutional networks. This model mapped the environmental data to 3D array using 3D one-hot encoding, and designed two types of convolution kernel and three types of convolution network models. The prediction accuracy reached 72.0% based on the environmental data in 2015. The results show that the fully convolutional network solves the problem of low accuracy of the traditional prediction methods in processing high-dimensional complex ocean data to a certain extent, and provides a new idea for fishing ground prediction.
Key words:fully convolutional networks;3D one-hot encoding;fishing ground forecasting;albacore tuna
長(zhǎng)鰭金槍魚(Thunnus alalunga)作為高度洄游的大洋性魚類,廣泛分布于三大洋,具有較高的經(jīng)濟(jì)價(jià)值和豐富的資源量。通過(guò)分析區(qū)域漁業(yè)管理組織的漁獲量和努力量數(shù)據(jù)庫(kù)發(fā)現(xiàn),長(zhǎng)鰭金槍魚的種群主要分布于太平洋,并且近二十年來(lái)在南太平洋海域長(zhǎng)鰭金槍魚產(chǎn)量呈增長(zhǎng)趨勢(shì)。目前長(zhǎng)鰭金槍魚已經(jīng)成為南太平洋金槍魚延繩釣漁業(yè)的主要捕撈對(duì)象之一[1],準(zhǔn)確預(yù)報(bào)南太平洋長(zhǎng)鰭金槍魚漁場(chǎng),對(duì)于合理安排漁業(yè)生產(chǎn),提高捕撈效益具有重要意義。
目前國(guó)內(nèi)外學(xué)者將漁場(chǎng)預(yù)報(bào)看作是一種分類問(wèn)題或者回歸問(wèn)題,通過(guò)統(tǒng)計(jì)學(xué)方法和GIS技術(shù)對(duì)漁場(chǎng)進(jìn)行分析和預(yù)測(cè)。但是,由于海洋數(shù)據(jù)的復(fù)雜性和多變性,預(yù)測(cè)過(guò)程中需要人為對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和樣本組織,整個(gè)過(guò)程較為復(fù)雜,且特征的篩選和預(yù)處理會(huì)直接影響模型的預(yù)測(cè)準(zhǔn)確率,預(yù)測(cè)結(jié)果受人為因素影響較大。近年來(lái)國(guó)內(nèi)外有研究者構(gòu)建多種模型進(jìn)行漁場(chǎng)預(yù)報(bào),如Zagaglia等 [2-3]使用廣義加性模型(GAM)和廣義線性模型(GLM)對(duì)長(zhǎng)鰭金槍魚漁場(chǎng)進(jìn)行回歸預(yù)測(cè)。崔雪森等[4] 使用樸素貝葉斯方法對(duì)西北太平洋柔魚漁場(chǎng)建立預(yù)報(bào)模型,在高產(chǎn)區(qū)取得了69.9%的預(yù)報(bào)準(zhǔn)確率。宋利明等[5]使用支持向量機(jī)對(duì)不同水層的環(huán)境因子進(jìn)行分析,得到了庫(kù)克群島海域長(zhǎng)鰭金槍魚棲息環(huán)境綜合指數(shù)。
隨著技術(shù)水平的提高,漁業(yè)數(shù)據(jù)規(guī)模變得更加巨大,而傳統(tǒng)的線性模型在對(duì)高維度數(shù)據(jù)進(jìn)行分析時(shí),數(shù)據(jù)量較大往往導(dǎo)致模型準(zhǔn)確率降低[6] ,所以現(xiàn)有漁場(chǎng)預(yù)報(bào)模型多基于小范圍海域或者短期數(shù)據(jù)進(jìn)行預(yù)測(cè)。深度神經(jīng)網(wǎng)絡(luò)在復(fù)雜動(dòng)態(tài)場(chǎng)景中可以挖掘出重要的語(yǔ)義特征,對(duì)大規(guī)模數(shù)據(jù)有較好的擬合效果,其中深度CNN模型可以通過(guò)卷積和池化操作將不同環(huán)境因子進(jìn)行交互運(yùn)算,分析漁場(chǎng)等級(jí)。目前基于獨(dú)熱編碼的神經(jīng)網(wǎng)絡(luò)模型已經(jīng)在多個(gè)領(lǐng)域應(yīng)用并取得了較好的結(jié)果[7-9] 。基于上述方法,本研究通過(guò)獨(dú)熱編碼技術(shù)將環(huán)境數(shù)據(jù)映射到三維矩陣,構(gòu)建全卷積網(wǎng)絡(luò)的預(yù)測(cè)模型對(duì)南太平洋長(zhǎng)鰭金槍魚進(jìn)行漁場(chǎng)預(yù)報(bào),以提高南太平洋長(zhǎng)鰭金槍魚漁場(chǎng)預(yù)報(bào)的精度。
1材料與方法
1.1數(shù)據(jù)來(lái)源
根據(jù)南太平洋長(zhǎng)鰭金槍魚的作業(yè)范圍,選取135° W~110° E,5° S~40° S為研究海域,采用2000-2015年的數(shù)據(jù)進(jìn)行分析研究。
本研究的漁業(yè)作業(yè)數(shù)據(jù)來(lái)源于中西太平洋漁業(yè)委員會(huì)(Western and central pacific fisheries commission, WCPFC)的南太平洋延繩釣數(shù)據(jù)。該數(shù)據(jù)包括作業(yè)時(shí)間、作業(yè)空間坐標(biāo)位置、釣鉤數(shù)、捕獲量(噸數(shù)和尾數(shù))。該捕撈數(shù)據(jù)以月為時(shí)間分辨率進(jìn)行記錄,將產(chǎn)量以5°×5°空間分辨率進(jìn)行匯總。
長(zhǎng)鰭金槍魚分布受海表溫度、葉綠素a濃度、鹽度、渦動(dòng)能和海流等多種因子影響[10-12] ,因此本研究選取即時(shí)性較強(qiáng)、獲取方便的環(huán)境遙感數(shù)據(jù)作為解釋因子,包括海表溫度(SST)、葉綠素a濃度(Chla)、海面高度(SSH)。其中海表溫度、葉綠素a濃度數(shù)據(jù)來(lái)源于美國(guó)國(guó)家海洋和大氣管理局(Nation oceanic and atmospheric administration, NOAA)環(huán)境數(shù)據(jù)庫(kù)。海面高度數(shù)據(jù)來(lái)源于哥白尼海洋環(huán)境監(jiān)測(cè)服務(wù)中心(Copernicus marine environment monitoring service,CMEMS)。該環(huán)境數(shù)據(jù)以月為時(shí)間分辨率,空間分辨率為1°×1°。由于作業(yè)數(shù)據(jù)和實(shí)際環(huán)境因子數(shù)據(jù)的空間分辨率不一致,本研究將環(huán)境因子取在漁區(qū)網(wǎng)格的中心點(diǎn)上,歸并為5°×5°的空間分辨率。
1.2數(shù)據(jù)預(yù)處理
1.2.1單位捕撈努力量漁獲量(CPUE)的計(jì)算在漁業(yè)作業(yè)生產(chǎn)中通常采用單位捕撈努力量漁獲量來(lái)表示漁業(yè)資源的豐度水平[13] 。本研究在5°×5°的空間網(wǎng)格內(nèi)對(duì)CPUE進(jìn)行計(jì)算,公式如下:
1.2.2漁場(chǎng)等級(jí)劃分研究中常使用三分位數(shù)將漁區(qū)按照CPUE的大小劃分成若干個(gè)類別,從而將CPUE有效進(jìn)行離散化[14],適用于分類模型。由于漁業(yè)作業(yè)中各月產(chǎn)量差異較大,僅以歷史CPUE的三分位點(diǎn)進(jìn)行分級(jí)并不能有效地表示各月漁場(chǎng)的實(shí)際豐度水平,甚至?xí)?dǎo)致某些月份不存在高產(chǎn)區(qū)或者高產(chǎn)區(qū)較少,不利于指導(dǎo)漁業(yè)作業(yè)。因此借鑒文獻(xiàn)[15] 的分類方法,將漁區(qū)以各月CPUE的三分位數(shù)分位點(diǎn)66.7%和33.3%劃分為高產(chǎn)區(qū)、中產(chǎn)區(qū)和低產(chǎn)區(qū)3類。
1.3基于三維獨(dú)熱編碼的全卷積網(wǎng)絡(luò)方法
1.3.1三維獨(dú)熱編碼本研究基于獨(dú)熱編碼技術(shù)提出一種三維獨(dú)熱編碼方法,將2000年至2015年空間因子與環(huán)境因子數(shù)據(jù)映射為n×d×m大小的三維矩陣,其中n=5,為空間因子和環(huán)境因子(經(jīng)度、緯度、海表溫度、葉綠素a濃度、海面高度)數(shù)目,m=12,為總月數(shù),d=320,表示通過(guò)獨(dú)熱編碼將每種環(huán)境因子由大到小映射到320個(gè)等級(jí)。三維獨(dú)熱編碼技術(shù)通過(guò)將不同月份的空間因子和環(huán)境因子映射到三維矩陣不同的層上,建立一個(gè)12層的三維矩陣,實(shí)現(xiàn)特征屬性離散化。對(duì)于每一條數(shù)據(jù)的特征值使用獨(dú)熱編碼進(jìn)行轉(zhuǎn)換,即建立一個(gè)320維的零向量ei,將特征值i的所有值由小到大劃分為320個(gè)等級(jí),若某條記錄的特征值i處于第j個(gè)等級(jí),則令向量ei的第j個(gè)分量為 1,其他值仍為0。將多個(gè)特征按順序組合為二維矩陣N= [e1,e2,…,en],其中n為該條記錄的空間因子和環(huán)境因子數(shù)目,本研究中n為5。若此條數(shù)據(jù)為m月,則令該三維矩陣的m-1層為N,其他11層為零。具體操作如圖1。
1.4算法步驟
基于全卷積網(wǎng)絡(luò)的漁情預(yù)測(cè)算法的步驟如下:
輸入: ?訓(xùn)練集(D)為2000-2014年環(huán)境因子數(shù)據(jù)和CPUE。
測(cè)試集T為2015年環(huán)境因子數(shù)據(jù)和CPUE。
輸出: ?測(cè)試集(T)的等級(jí)分類
Step1:對(duì)訓(xùn)練集和測(cè)試集進(jìn)行數(shù)據(jù)預(yù)處理,并歸一化到0~1。將各條數(shù)據(jù)按月CPUE三分位點(diǎn)將漁場(chǎng)劃分為高、中、低3個(gè)等級(jí),并生成D和T的標(biāo)簽集L1、L2。
Step2:對(duì)各條數(shù)據(jù)使用方法1.3的方法進(jìn)行編碼,將環(huán)境因子數(shù)據(jù)映射到三維矩陣。由訓(xùn)練集(D)構(gòu)建三維矩陣集(D1),由測(cè)試集T構(gòu)建三維矩陣集(T1)。
Step3:訓(xùn)練模型。將step2構(gòu)造好的訓(xùn)練集(D1)輸入到網(wǎng)絡(luò)模型中作為輸入數(shù)據(jù),將標(biāo)簽集(L1)使用獨(dú)熱編碼轉(zhuǎn)換為輸出向量,訓(xùn)練全卷積網(wǎng)絡(luò)得到分類器(F)。
Step4:將測(cè)試集(T1)輸入分類器(F)得到漁場(chǎng)預(yù)報(bào)結(jié)果R。將R與標(biāo)簽集(L2)進(jìn)行對(duì)比得到模型的預(yù)報(bào)準(zhǔn)確率。
1.5試驗(yàn)設(shè)計(jì)
本試驗(yàn)工作站顯卡型號(hào)為NVIDIA GTX 1080Ti,CPU型號(hào)為AMD Ryzen Threadripper 1950X,操作系統(tǒng)為Windows10,并搭建了基于Python3.6的TensorFlow 1.3框架與Keras 2.0.8框架。
試驗(yàn)數(shù)據(jù)集為南太平洋海域2000年到2015年空間因子、環(huán)境因子和長(zhǎng)鰭金槍魚漁業(yè)作業(yè)數(shù)據(jù)。其中2000-2014年共有數(shù)據(jù)9 860條,將其按照85%和15%的比例劃分為訓(xùn)練集和驗(yàn)證集,另外選擇2015年743條數(shù)據(jù)作為測(cè)試集。
由于進(jìn)行三維獨(dú)熱編碼后數(shù)據(jù)維度較高但信息較為稀疏,所以設(shè)置初始學(xué)習(xí)率lr=0.000 5,并采用學(xué)習(xí)率動(dòng)態(tài)調(diào)整,當(dāng)進(jìn)行了10次迭代循環(huán)后,驗(yàn)證集損失值仍不下降時(shí),將學(xué)習(xí)率減半,衰減率(decay)=1.0×e-6,動(dòng)量參數(shù)(momentum)=0.9。訓(xùn)練停止方式采取早停策略(Early stopping)防止過(guò)擬合[19] ,即15次迭代循環(huán)后驗(yàn)證集損失值仍不下降時(shí)結(jié)束訓(xùn)練,并將最大迭代次數(shù)設(shè)置為500。
本研究設(shè)計(jì)2組試驗(yàn)分別研究卷積核大小與網(wǎng)絡(luò)結(jié)構(gòu)對(duì)模型準(zhǔn)確率的影響,為了評(píng)估模型性能,除了使用方法1.3.4的預(yù)報(bào)精度檢驗(yàn)方法作為主要評(píng)估標(biāo)準(zhǔn)外,選擇所有漁場(chǎng)的精準(zhǔn)率(Precision)和F1分?jǐn)?shù)作為綜合評(píng)估參考。
1.5.1卷積核尺度對(duì)模型性能的影響本研究分別使用3×1的一維卷積核和3×3卷積核進(jìn)行模型構(gòu)建。特別強(qiáng)調(diào)在測(cè)試不同卷積核的效果時(shí),網(wǎng)絡(luò)結(jié)構(gòu)與超參數(shù)設(shè)置均相同。
1.5.2網(wǎng)絡(luò)結(jié)構(gòu)對(duì)模型性能的影響對(duì)于網(wǎng)絡(luò)卷積層數(shù)選擇,本研究分別嘗試了2到5層卷積層,并構(gòu)建濾波器數(shù)目為64/128/256、128/256/512和256/256/256 3種不同結(jié)構(gòu)的網(wǎng)絡(luò)模型。
2結(jié)果與分析
2.1卷積核尺度對(duì)模型性能的影響
表1為使用不同卷積核時(shí),在測(cè)試集上的對(duì)比結(jié)果。由表1可知,3×1的一維卷積核模型將大量中產(chǎn)區(qū)誤分為其他產(chǎn)區(qū),無(wú)法對(duì)各等級(jí)漁場(chǎng)進(jìn)行明確劃分,這是由于本研究的矩陣與傳統(tǒng)的特征矩陣相比更為稀疏,不利于一維矩陣的特征提取。而3×3卷積核由于具有更大的感受野,有利于提取特征,因此本研究采用3×3卷積核構(gòu)建模型進(jìn)行訓(xùn)練。
2.2網(wǎng)絡(luò)結(jié)構(gòu)對(duì)模型性能的影響
通過(guò)觀察損失值曲線發(fā)現(xiàn),當(dāng)網(wǎng)絡(luò)層數(shù)增加到4層時(shí),模型在50次迭代循環(huán)后就發(fā)生了嚴(yán)重的過(guò)擬合現(xiàn)象,因此模型最終設(shè)置3層卷積層。本研究數(shù)據(jù)經(jīng)過(guò)三維獨(dú)熱編碼后矩陣的尺度為5×320×12,矩陣高度較小,所以不進(jìn)行高度降維,僅用步長(zhǎng)為1×2和1×3的卷積層替代池化層(其中1×3大小的步長(zhǎng)是對(duì)上一卷積層的全部輸出特征值進(jìn)行卷積運(yùn)算的最大步長(zhǎng)),行與行之間通過(guò)卷積核交互運(yùn)算。通過(guò)分析表1,本研究將卷積核的大小設(shè)為3×3,激活函數(shù)使用ReLU函數(shù)。本試驗(yàn)一共設(shè)置3種不同結(jié)構(gòu)的全卷積網(wǎng)絡(luò)模型,每個(gè)模型都為3個(gè)卷積層和2個(gè)全連接層,整個(gè)模型采取全卷積結(jié)構(gòu),不使用池化層,具體結(jié)構(gòu)見(jiàn)表2。
由表3可以看出,在選擇不同過(guò)濾器數(shù)目時(shí),全卷積網(wǎng)絡(luò)模型均取得了較高準(zhǔn)確率,但是隨著卷積層濾波器層數(shù)的增加,由于深層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)過(guò)多,網(wǎng)絡(luò)發(fā)生過(guò)擬合現(xiàn)象,導(dǎo)致中產(chǎn)區(qū)被誤分為其他產(chǎn)區(qū),整體準(zhǔn)確率下降。由于本研究網(wǎng)絡(luò)模型采用全卷積結(jié)構(gòu),不存在池化層造成的信息損失,所以在各層可以采取相同的節(jié)點(diǎn)數(shù)。模型3將各卷積層均設(shè)置為256個(gè)濾波器,在增加模型參數(shù)量的同時(shí)保持了與模型1相同的深層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù),不易發(fā)生過(guò)擬合現(xiàn)象,并且明顯提高了準(zhǔn)確率。因此本研究選用表現(xiàn)最好的模型3結(jié)構(gòu)作為全卷積網(wǎng)絡(luò)最終結(jié)構(gòu)并將其命名為F-ACN。
2.3模型擬合分析
由于本研究樣本數(shù)目龐大,傳統(tǒng)漁場(chǎng)預(yù)報(bào)方法由于參數(shù)數(shù)目等原因預(yù)測(cè)結(jié)果并不理想,而F-ACN模型由于卷積神經(jīng)網(wǎng)絡(luò)的多層非線性結(jié)構(gòu)和龐大可訓(xùn)練參數(shù)可以充分?jǐn)M合多參數(shù)間的非線性關(guān)系,在大規(guī)模數(shù)據(jù)集上能取得更好的結(jié)果。如圖2所示,在訓(xùn)練過(guò)程中訓(xùn)練集與驗(yàn)證集的準(zhǔn)確率曲線和損失值曲線基本重合,F(xiàn)-ACN在驗(yàn)證集和測(cè)試集上的準(zhǔn)確率僅略低于訓(xùn)練集,該模型表現(xiàn)出良好的泛化性。F-ACN模型在訓(xùn)練初期學(xué)習(xí)緩慢,這是由于本研究數(shù)據(jù)集劃分沒(méi)有明確的邊界,模型在訓(xùn)練初期無(wú)法判明類別,梯度方向不斷變化,當(dāng)進(jìn)行了約10次迭代后,損失值開(kāi)始快速下降。
2.4不同模型預(yù)測(cè)結(jié)果
雖然國(guó)內(nèi)外進(jìn)行了大量漁場(chǎng)預(yù)報(bào)模型研究,但傳統(tǒng)漁場(chǎng)預(yù)報(bào)方法多針對(duì)小型數(shù)據(jù)集,為了驗(yàn)證F-ACN模型準(zhǔn)確率,本研究使用樸素貝葉斯方法、BP神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)(DNN)構(gòu)建南太平洋長(zhǎng)鰭金槍魚預(yù)報(bào)模型與該模型進(jìn)行對(duì)比。其中樸素貝葉斯模型采用文獻(xiàn)[4] 的基于FastICA方法進(jìn)行獨(dú)立成分分析的樸素貝葉斯方法。BP神經(jīng)網(wǎng)絡(luò)采用5-512-3結(jié)構(gòu)。DNN神經(jīng)網(wǎng)絡(luò)模型采取與CNN完全相同的節(jié)點(diǎn)數(shù)。
由表4可以看出,相比于其他模型本研究算法總體準(zhǔn)確率最高,在高產(chǎn)區(qū)和低產(chǎn)區(qū)的預(yù)測(cè)準(zhǔn)確率上有明顯優(yōu)勢(shì)。實(shí)際作業(yè)受捕撈效率影響,漁業(yè)作業(yè)位置一般依賴于高產(chǎn)區(qū)預(yù)測(cè)結(jié)果,而F-ACN模型在高產(chǎn)區(qū)和低產(chǎn)區(qū)預(yù)測(cè)準(zhǔn)確率較高,對(duì)于作業(yè)漁船尋找最佳漁場(chǎng)有較好的指導(dǎo)意義。由于漁情預(yù)報(bào)方法的漁場(chǎng)等級(jí)劃分界限并不明確,只按照月CPUE的三分位點(diǎn)進(jìn)行劃分,而受實(shí)際天氣、政策等因素的影響,漁場(chǎng)的實(shí)際水平可能高于或低于等級(jí)標(biāo)簽,所以處在2個(gè)等級(jí)邊界部分漁場(chǎng)容易被誤分,出現(xiàn)了中產(chǎn)區(qū)預(yù)報(bào)準(zhǔn)確率明顯低于高產(chǎn)區(qū)和低產(chǎn)區(qū)的現(xiàn)象。
3討論
本研究針對(duì)傳統(tǒng)漁情預(yù)報(bào)方法難以擬合海洋大數(shù)據(jù)的缺陷,提出了一種基于三維獨(dú)熱編碼的全卷積網(wǎng)絡(luò)南太平洋長(zhǎng)鰭金槍魚漁場(chǎng)預(yù)報(bào)模型F-ACN。本研究發(fā)現(xiàn),F(xiàn)-ACN可以對(duì)大規(guī)模海洋數(shù)據(jù)進(jìn)行特征提取,同時(shí)與傳統(tǒng)漁情預(yù)報(bào)方法相比準(zhǔn)確率明顯提升,在一定程度上解決了傳統(tǒng)漁情預(yù)報(bào)方法在處理高維復(fù)雜海洋數(shù)據(jù)時(shí)準(zhǔn)確率下降的問(wèn)題,為漁場(chǎng)預(yù)報(bào)提供了一種新思路。
F-ACN模型由多層卷積神經(jīng)網(wǎng)絡(luò)和DNN構(gòu)成,比傳統(tǒng)漁場(chǎng)預(yù)報(bào)模型具有更多的可訓(xùn)練參數(shù),且非線性更強(qiáng)。同時(shí)F-ACN模型采用全卷積網(wǎng)絡(luò)結(jié)構(gòu),使用步長(zhǎng)為2的卷積層代替了池化操作,模型在卷積層的計(jì)算量比普通卷積神經(jīng)網(wǎng)絡(luò)減少了1/2,并且省去了所有的池化操作,極大地加速了運(yùn)算速度。面對(duì)海洋數(shù)據(jù)大規(guī)模、多源化和異構(gòu)性的特點(diǎn),此模型可以更好地?cái)M合復(fù)雜數(shù)據(jù)形式,自動(dòng)獲取海量高維數(shù)據(jù)中存在的復(fù)雜關(guān)聯(lián),精準(zhǔn)預(yù)報(bào)漁場(chǎng)。
與回歸模型相比,F(xiàn)-ACN模型得到的預(yù)報(bào)結(jié)果是一個(gè)離散值,即漁場(chǎng)等級(jí),不存在一個(gè)連續(xù)的概率預(yù)測(cè)值,因此可以更加明確直觀地表示漁場(chǎng)水平。同為分類模型的樸素貝葉斯方法要求各輸入變量相互獨(dú)立,模型進(jìn)行訓(xùn)練前要對(duì)多種參數(shù)進(jìn)行獨(dú)立成分分析,這不僅增加了模型的復(fù)雜度還造成了數(shù)據(jù)信息量損失。而F-ACN模型是一種“黑盒”模型,并不要求漁業(yè)數(shù)據(jù)滿足任何假設(shè),只需要簡(jiǎn)單的對(duì)數(shù)據(jù)進(jìn)行三維獨(dú)熱編碼,原理和實(shí)現(xiàn)更為簡(jiǎn)單,不用考慮環(huán)境因子間的相互影響,因此該模型使用方便。同時(shí)F-ACN模型具有很好的可擴(kuò)展性,在環(huán)境因子種類增加時(shí),只需增加訓(xùn)練集三維矩陣的維度就可以在原模型進(jìn)行訓(xùn)練,不需要進(jìn)行其他預(yù)處理操作。但F-ACN模型只考慮到了漁場(chǎng)與環(huán)境因子的關(guān)系,獨(dú)立地對(duì)漁場(chǎng)進(jìn)行預(yù)報(bào),而長(zhǎng)鰭金槍魚作為一種高度洄游的大洋性魚類,各個(gè)漁區(qū)在連續(xù)時(shí)間內(nèi)存在一定的空間關(guān)系,下一步需要將漁場(chǎng)的時(shí)間序列因素和空間相關(guān)性加入到模型中,提高漁場(chǎng)預(yù)報(bào)準(zhǔn)確率。
參考文獻(xiàn):
[1]NIKOLIC N, MORANDEAU G, HOARAU L, et al. Review of albacore tuna, Thunnus alalunga, biology, fisheries and management[J]. Reviews in Fish Biology and Fisheries, 2017, 27(4): 775-810.
[2]ZAGAGLIA C R, LORENZZETTI J A, STECH J L. Remote sensing data and longline catches of yellowfin tuna (Thunnus albacares) in the equatorial Atlantic[J]. Remote Sensing of Environment, 2004, 93(1/2):267-281.
[3]ZAINUDDIN M, SAITOH K, SAITOH S E I I. Albacore (Thunnus alalunga) fishing ground in relation to oceanographic conditions in the western North Pacific Ocean using remotely sensed satellite data[J]. Fisheries Oceanography, 2008, 17(2): 61-73.
[4]崔雪森,唐峰華,張衡,等.基于樸素貝葉斯的西北太平洋柔魚漁場(chǎng)預(yù)報(bào)模型的建立[J].中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,45(2):37-43.
[5]宋利明,周建坤,沈智賓,等.基于支持向量機(jī)的庫(kù)克群島海域長(zhǎng)鰭金槍魚棲息環(huán)境綜合指數(shù)[J].海洋通報(bào),2017,36(2):195-208.
[6]HARRELL F E, LEE K L, MARK D B. Tutorial in biostatistics multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors[J]. Statistics in Medicine,1996,1(15):361-387.
[7]李思琴,林磊,孫承杰.基于卷積神經(jīng)網(wǎng)絡(luò)的搜索廣告點(diǎn)擊率預(yù)測(cè)[J].智能計(jì)算機(jī)與應(yīng)用,2015,5(5):22-25,28.
[8]LIU Q, YU F, WU S, et al. A convolutional click prediction model[C]//Association for Computing Machinery. Proceedings of the 24th ACM international on conference on information and knowledge management. New York, USA: ACM, 2015: 1743-1746.
[9]WANG P, XU B, XU J, et al. Semantic expansion using word embedding clustering and convolutional neural network for improving short text classification [J]. Neurocomputing, 2016,174: 806-814.
[10]毛江美,陳新軍,余景.基于神經(jīng)網(wǎng)絡(luò)的南太平洋長(zhǎng)鰭金槍魚漁場(chǎng)預(yù)報(bào)[J].海洋學(xué)報(bào),2016,38(10):34-43.
[11]宋利明,謝凱,趙海龍,等.庫(kù)克群島海域海洋環(huán)境因子對(duì)長(zhǎng)鰭金槍魚漁獲率的影響[J].海洋通報(bào),2017,36(1):96-106.
[12]范永超,戴小杰,朱江峰,等.南太平洋長(zhǎng)鰭金槍魚延繩釣漁業(yè)CPUE標(biāo)準(zhǔn)化[J].海洋湖沼通報(bào),2017(1):122-132.
[13]ZAINUDDIN M, SAITOH S, SAIROH K. Detection of potential fishing ground for albacore tuna using synoptic measurements of ocean color and thermal remote sensing in the northwestern North Pacific[J]. Geophysical Research Letters, 2004, 31(20):183-213.
[14]ISMAIL A I, MORRISION E C, BURT B A, et al. Natural history of periodontal disease in adults: findings from the tecumseh periodontal disease study[J]. Journal of Dental Research, 1990, 69(2): 430-435.
[15]陳雪忠,樊偉,崔雪森,等.基于隨機(jī)森林的印度洋長(zhǎng)鰭金槍魚漁場(chǎng)預(yù)報(bào)[J].海洋學(xué)報(bào),2013,35(1):158-164.
[16]KRIZHEVSKY A,SUTSKEVER I,HINTON G E. Imagenet classification with deep convolutional neural networks[C]//NIPS. Advances in neural information processing systems. USA: Curran Associates Inc,2012: 1097-1105.
[17]SPTINGENBERG J T, DOSOVITSKIY A, BROX T, et al. Striving for simplicity: The all convolutional net[EB/OL].(2015-4-13)[2019-7-15]. https://arxiv.org/abs/1412.6806.pdf.
[18]張衡,崔雪森,樊偉.基于遙感數(shù)據(jù)的智利竹筴魚漁場(chǎng)預(yù)報(bào)系統(tǒng)[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(15):140-144.
[19]PRECHELT L. Automatic early stopping using cross validation: quantifying the criteria[J]. Neural Networks, 1998, 11(4): 761-767.
(責(zé)任編輯:陳海霞)