童亮,陳雪梅,鄭朋飛
(重慶交通大學(xué) 航運(yùn)與船舶工程學(xué)院,重慶 400074)
由于不斷增長(zhǎng)的航運(yùn)需求,船舶溫室氣體排放量預(yù)計(jì)將在2050年前較2018年增加50%[1]。因此,作為《船舶能效管理計(jì)劃》(ship energy efficiency management plan,SEEMP)的重要組成部分,越來(lái)越多的國(guó)際規(guī)則的制定已集中于船舶能源效率的提高。在船舶實(shí)際運(yùn)營(yíng)過(guò)程中,燃油費(fèi)用占運(yùn)營(yíng)總成本的30%~60%[2],而內(nèi)河船舶多變的通航環(huán)境使其油耗過(guò)程更具復(fù)雜性。因此,在一定的航程和有限的時(shí)間內(nèi)使船舶油耗最低是我國(guó)內(nèi)河航運(yùn)業(yè)技術(shù)改造和產(chǎn)業(yè)升級(jí)迫切需要解決的重要問(wèn)題之一。
船舶油耗預(yù)測(cè)的建模方法可分為:理論公式建模和統(tǒng)計(jì)數(shù)據(jù)建模。理論建模,模型的建立需要完整的船舶設(shè)計(jì)參數(shù)和實(shí)驗(yàn)數(shù)據(jù),分析過(guò)程中涉及環(huán)境因素過(guò)多且建模難度相對(duì)較大[3-4],因此理論公式建模無(wú)法囊括所有船型,實(shí)用性需進(jìn)一步提高。統(tǒng)計(jì)數(shù)據(jù)的建模主要通過(guò)分析船舶油耗相關(guān)因素,將數(shù)學(xué)方法和機(jī)器學(xué)習(xí)相結(jié)合,擯棄冗雜的機(jī)理分析,建立實(shí)測(cè)數(shù)據(jù)的預(yù)測(cè)模型,準(zhǔn)確度高,實(shí)用性好。
因此,針對(duì)復(fù)雜的能耗特征和多變的內(nèi)河環(huán)境,考慮以內(nèi)河某散貨船為例,對(duì)目標(biāo)船舶安裝多個(gè)傳感器測(cè)得實(shí)船數(shù)據(jù),采用多個(gè)模型(SVR模型、BP模型和ELM模型)分別對(duì)油耗進(jìn)行預(yù)估,對(duì)比分析網(wǎng)絡(luò)模型對(duì)實(shí)船油耗的預(yù)測(cè)結(jié)果;利用支持向量回歸機(jī)(support vector regression,SVR)與模糊信息?;?fuzzy information granulation,FIG)結(jié)合的方法對(duì)船舶未來(lái)一段時(shí)間內(nèi)的油耗進(jìn)行回歸于預(yù)測(cè)分析。
內(nèi)河運(yùn)輸節(jié)能降耗面臨著以下問(wèn)題[5]:①量大面廣,船型雜亂;②船齡偏老,信息化不高;③管理水平低較,運(yùn)輸效率有待提高;④能耗管控不力,綜合油耗相對(duì)偏高,排放高。列舉影響船舶油耗的主要因素見(jiàn)表1。
表1 影響船舶油耗的主要因素
船舶航行時(shí),系統(tǒng)采集到的多維數(shù)據(jù)具有樣本大、準(zhǔn)確度低的特點(diǎn)。為了得到精準(zhǔn)的預(yù)測(cè)模型和有效的預(yù)測(cè)結(jié)果,通常使用區(qū)間縮放法將輸入數(shù)據(jù)、輸出數(shù)據(jù)線性壓縮至[0,1]區(qū)間內(nèi)的量綱值,以消除多維數(shù)據(jù)不同量綱的影響。歸一化處理見(jiàn)下式[6]。
(1)
式中:x*為歸一化處理后的數(shù)據(jù);x為輸入數(shù)據(jù);xmax為輸入數(shù)據(jù)最大值;xmin為輸入數(shù)據(jù)最小值。
模型的輸入?yún)?shù)眾多,變量之間有一定的相互作用和關(guān)聯(lián)性。因此,采用主成分分析法(principal component analysis,PCA)對(duì)變量進(jìn)行降維處理,提取影響油耗的關(guān)鍵特征。
Fp=a1i·ZX1+a2i·ZX2+…+api·ZXp
(2)
式中:FP為影響油耗的主成分;a1i,a2i,…,api(i=1,2,…,m)為輸入變量的協(xié)方差陣Σ對(duì)應(yīng)的特征向量,ZX1,ZX2,…,ZXp為輸入變量的標(biāo)準(zhǔn)化值。
在航船舶的燃油消耗時(shí)間序列具有較強(qiáng)的非線性和隨機(jī)性,采用SVR模型對(duì)船舶油耗進(jìn)行預(yù)測(cè),該模型具有以下優(yōu)勢(shì)[7]:①SVR模型得到的是理論上的全局最優(yōu)解,可避免局部最優(yōu)問(wèn)題;②SVR模型通過(guò)非線性變換將原始變量映射到高維特征空間構(gòu)造線性分類函數(shù),既可保證模型的良好泛化能力,又可解決向量“維數(shù)災(zāi)難”問(wèn)題。模型中關(guān)于油耗預(yù)測(cè)的非線性回歸問(wèn)題的尋優(yōu)實(shí)施步驟為:
1)在高維特征空間建立線性回歸函數(shù)。
f(x)=wΦ(x)+b
(3)
式中:Ф(x)為非線性映射函數(shù)。
2)定義ε線性不敏感損失函數(shù)。
(4)
式中:f(x)為預(yù)測(cè)值;y為對(duì)應(yīng)的實(shí)際值。若預(yù)測(cè)值與實(shí)際值之間的差值小于等于ε,則損失為0。
(5)
式中:Ф(x)為非線性映射函數(shù),C為懲罰因子,ε規(guī)定了回歸函數(shù)的誤差要求。
f(x)=w*Φ(x)+b*=
(6)
選取徑向基核函數(shù)
K(xi,xj)=Φ(xi)Φ(xj)
(7)
5)帶入核函數(shù),求解回歸函數(shù)。
f(x)=w*Φ(x)+b*=
(8)
傳統(tǒng)油耗預(yù)測(cè)模型只對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,未對(duì)其影響因素進(jìn)行特征分析,使得預(yù)測(cè)結(jié)果不精確、波動(dòng)性大;預(yù)測(cè)大多停留在點(diǎn)時(shí)間上,忽視了對(duì)油耗一段時(shí)間內(nèi)的波動(dòng)情況和變化范圍。因此,通過(guò)信息粒化(information granulation, IG)對(duì)大量油耗數(shù)據(jù)的內(nèi)部特征進(jìn)行分析,將整體劃分為個(gè)體。
FIG將油耗數(shù)據(jù)劃分成2 h一個(gè)窗口并對(duì)其模糊化處理,選用三角型的模糊粒子在窗口上建立模糊集,代替原窗口數(shù)據(jù),使實(shí)船油耗數(shù)據(jù)中不確定的變量轉(zhuǎn)換成確定數(shù)值,很好地解決了模糊數(shù)中無(wú)法準(zhǔn)確度量只能模糊處理的矛盾。三角型隸屬函數(shù)如下。
(9)
式中:x為輸入的時(shí)間變量;a、m、b分別為輸入數(shù)據(jù)粒化后的最小值Low、平均值average和最大值Up。
基于模糊信息?;腟VR組合預(yù)測(cè)模型的流程見(jiàn)圖1。
圖1 基于模糊信息?;腟VR組合模型流程
運(yùn)用三角型函數(shù)對(duì)記錄的油耗時(shí)序值進(jìn)行FIG處理,得到粒化值Low、R、Up,利用SVR模型對(duì)?;蟮臄?shù)據(jù)進(jìn)行回歸預(yù)測(cè),得到預(yù)測(cè)的每個(gè)窗口油耗范圍RLow、Raverage和RUp,將預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)的變化趨勢(shì)和變化范圍進(jìn)行比較,驗(yàn)證模型預(yù)測(cè)效果。
以長(zhǎng)江某散貨船為研究對(duì)象,該輪主要參數(shù)和主機(jī)相關(guān)參數(shù)見(jiàn)表2。
表2 目標(biāo)船舶主要參數(shù)
運(yùn)用PCA對(duì)表1中的油耗相關(guān)參數(shù)進(jìn)行分析,得到10個(gè)主成分的特征值、貢獻(xiàn)率。通過(guò)式(2),計(jì)算主成分與相關(guān)參數(shù)的對(duì)應(yīng)關(guān)系,得到各參數(shù)的主成分貢獻(xiàn)率見(jiàn)表3。
表3 相關(guān)參數(shù)主成分貢獻(xiàn)率
從表3知,Z1~Z7的累積貢獻(xiàn)率達(dá)到96.367 2%,Z8~Z10的貢獻(xiàn)率則很小。因此,油耗預(yù)測(cè)模型的輸入維數(shù)降為以下7維:雙機(jī)轉(zhuǎn)速n2、單機(jī)轉(zhuǎn)速n1、航速V、水流速Vw、載貨量W、風(fēng)速Vs、風(fēng)向Vd。
選取目標(biāo)船舶江陰-南家坨航次,總計(jì)1 320組上水航行數(shù)據(jù),以每30 min內(nèi)主機(jī)累積消耗的燃油作為分析對(duì)象。為不失一般性,采用隨機(jī)的方法產(chǎn)生1 000組數(shù)據(jù)作為訓(xùn)練集和320組數(shù)據(jù)作為測(cè)試集分別對(duì)模型的性能進(jìn)行評(píng)價(jià)。按照時(shí)間序列的燃油消耗數(shù)據(jù)集見(jiàn)圖2。
圖2 目標(biāo)船舶燃油消耗時(shí)間序列
觀察圖2燃油消耗時(shí)間序列,可知油耗波動(dòng)起伏明顯,多個(gè)無(wú)序的峰值給預(yù)測(cè)帶來(lái)了難度。運(yùn)用SVR模型對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè),過(guò)程如下:首先對(duì)輸入的多維參數(shù)作歸一化處理,默認(rèn)核函數(shù)為徑向基核函數(shù)(RBF),采用交叉驗(yàn)證的方法尋找中間參數(shù)C(懲罰因子)和參數(shù)g(RBF核函數(shù)中的方差),運(yùn)用GS算法得到精細(xì)尋優(yōu)的最佳C和g來(lái)訓(xùn)練SVR模型,記錄輸入?yún)?shù)的回歸預(yù)測(cè)值,輸出真實(shí)值與預(yù)測(cè)值的對(duì)比結(jié)果。本次精細(xì)尋優(yōu)下的最優(yōu)參數(shù)bestC=16,bestg=0.250 0,數(shù)據(jù)集的預(yù)測(cè)結(jié)果見(jiàn)圖3、4。
圖3 SVR訓(xùn)練集預(yù)測(cè)結(jié)果
圖4 SVR測(cè)試集預(yù)測(cè)結(jié)果
由圖3、4所示,SVR模型訓(xùn)練集和測(cè)試集的均方誤差分別為0.000 991 15和0.007 124 99,決定系數(shù)分別達(dá)到0.985 65和0.976 54。這表明,所建立的SVR油耗回歸模型具有非常好的泛化能力,預(yù)測(cè)效果良好。
對(duì)320組測(cè)試集分別運(yùn)用BP模型、ELM模型進(jìn)行預(yù)測(cè)。BP模型參數(shù)設(shè)置如下:最大訓(xùn)練次數(shù)為1 000、訓(xùn)練要求精度為10-3、學(xué)習(xí)率為0.1;ELM模型的激活函數(shù)為sigmoid、隱含層神經(jīng)元個(gè)數(shù)為7、性能函數(shù)為mse。測(cè)試集的預(yù)測(cè)結(jié)果見(jiàn)圖5、6。
圖5 BP模型測(cè)試集預(yù)測(cè)結(jié)果
圖6 ELM極限學(xué)習(xí)機(jī)測(cè)試集預(yù)測(cè)結(jié)果
將SVR模型的測(cè)試集預(yù)測(cè)結(jié)果對(duì)比BP神經(jīng)網(wǎng)絡(luò)、ELM極限學(xué)習(xí)機(jī),結(jié)果見(jiàn)表4。表4表明4VR模型的預(yù)測(cè)誤差最小且準(zhǔn)確度最高。
表4 SVR、BP模型和Elman測(cè)試集結(jié)果對(duì)比
將記錄的1 320組油耗時(shí)序值作為輸入數(shù)據(jù),以每2 h為1個(gè)粒化窗口對(duì)油耗進(jìn)行?;Y(jié)果見(jiàn)圖7。其中,Low粒子描述的是油耗2 h內(nèi)變化的最小值;R粒子描述的是油耗2 h內(nèi)變化的平均值;Up粒子描述的是油耗2 h內(nèi)變化的最大值。
圖7 模糊?;Y(jié)果
將?;Y(jié)果Low、R、Up作為SVR模型的輸入?yún)?shù),構(gòu)建FIG_SVR組合預(yù)測(cè)模型,結(jié)果見(jiàn)圖8。
圖8表明組合模型的Low參數(shù)、Up參數(shù)預(yù)測(cè)準(zhǔn)確率較高且符合參數(shù)走勢(shì),但R參數(shù)預(yù)測(cè)值普遍高于粒化值。這是由于目標(biāo)船舶的主機(jī)分為左機(jī)、右機(jī),航行時(shí)當(dāng)只開(kāi)單機(jī)(左機(jī)或者右機(jī))時(shí),速度低,油耗?。浑p機(jī)(左右機(jī))航行時(shí),速度高,油耗大。因此,進(jìn)行預(yù)測(cè)時(shí),對(duì)于單雙機(jī)的油耗并未能區(qū)分預(yù)測(cè),導(dǎo)致數(shù)據(jù)之間的跳躍性大,降低了組合模型的魯棒性,所以平均值R參數(shù)的預(yù)測(cè)結(jié)果偏高。以Low參數(shù)為例詳解FIG_SVR組合模型回歸預(yù)測(cè):選用三角型函數(shù)對(duì)油耗時(shí)序值進(jìn)行FIG處理,對(duì)粒化值Low參數(shù)作歸一化處理,利用交叉驗(yàn)證(CV)方法得到最佳參數(shù)組合C=35,g=0.125 0,根據(jù)最佳參數(shù)訓(xùn)練SVR模型,得到Low參數(shù)的擬合預(yù)測(cè)值,將預(yù)測(cè)值與實(shí)際值進(jìn)行差值計(jì)算,誤差結(jié)果見(jiàn)圖8d)。
圖8 ?;礥p、R和Low的SVR預(yù)測(cè)結(jié)果
通過(guò)對(duì)油耗數(shù)據(jù)進(jìn)行FIG_SVR組合模型的預(yù)測(cè)得到波動(dòng)范圍RLow、Raverage和RUp,將預(yù)測(cè)值與2 h內(nèi)的實(shí)際油耗值進(jìn)行比較,結(jié)果見(jiàn)表5。
表5 船舶油耗變化趨勢(shì)和變化空間預(yù)測(cè)
真實(shí)值與預(yù)測(cè)值的相對(duì)誤差不超過(guò)4%,由模糊粒子提供的預(yù)測(cè)范圍也符合油耗的真實(shí)波動(dòng)范圍。由此可見(jiàn),基于模糊信息?;闹С窒蛄炕貧w機(jī)組合預(yù)測(cè)模型能夠準(zhǔn)確地描述油耗未來(lái)2 h內(nèi)的波動(dòng)態(tài)勢(shì)。
通過(guò)FIG對(duì)數(shù)據(jù)進(jìn)行窗口劃分和模糊化處理,以粒子為單位對(duì)油耗數(shù)據(jù)進(jìn)行Low、R和Up粒子的分類。與原始數(shù)據(jù)相比,該方法對(duì)實(shí)船2 h內(nèi)的油耗波動(dòng)情況進(jìn)行了有效的挖掘,解決了以往預(yù)測(cè)模型中大量數(shù)據(jù)模糊分類和粗糙處理的弊?。桓鶕?jù)挖掘得到的Low、R和Up粒子通過(guò)歸一化和預(yù)處理后作為輸入建立泛化功能良好的SVR油耗動(dòng)態(tài)預(yù)測(cè)模型,該組合模型良好的預(yù)測(cè)結(jié)果得到了合理驗(yàn)證。
基于支持向量回歸機(jī)的油耗預(yù)測(cè)模型具有較優(yōu)的預(yù)測(cè)性能,模型的預(yù)測(cè)精度為SVR模型>ELM模型>BP模型;通過(guò)FIG_SVR組合預(yù)測(cè)模型得到了較為精確的未來(lái)油耗的變化趨勢(shì)和波動(dòng)情況。