史方敏,郝永志,2
(1.浙江國(guó)際海運(yùn)職業(yè)技術(shù)學(xué)院航海工程學(xué)院,浙江舟山 316021;2.上海海事大學(xué)商船學(xué)院,上海 201306)
全球貨物貿(mào)易絕大部分都需要通過船舶運(yùn)輸來完成,經(jīng)濟(jì)一體化的發(fā)展趨勢(shì)帶來了航運(yùn)業(yè)的變化,使航運(yùn)業(yè)出現(xiàn)了貿(mào)易貨物標(biāo)準(zhǔn)化管理、裝卸、運(yùn)輸?shù)内厔?shì),推進(jìn)了船舶技術(shù)的不斷變革[1]。但在船舶技術(shù)變革的過程中,存在船舶航行效率較低、無法克服復(fù)雜的海上環(huán)境等多種問題[2]。針對(duì)這種情況,人們將注意力集中在怎樣減少人力、物力損失以及實(shí)現(xiàn)智能化船舶控制等問題上,而對(duì)于航線規(guī)劃等問題則缺乏關(guān)注。事實(shí)上,航線規(guī)劃問題與船舶操縱智能化水平息息相關(guān),對(duì)于實(shí)現(xiàn)船舶快速、經(jīng)濟(jì)、安全航行可以說是至關(guān)重要。為了實(shí)現(xiàn)船舶的智能航線規(guī)劃,需要對(duì)船舶航行水域航線調(diào)度信息進(jìn)行采集。國(guó)內(nèi)外都十分重視對(duì)船舶航行水域航線調(diào)度信息的采集問題。在國(guó)外研究中,致力于將數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能等技術(shù)與理論應(yīng)用到航運(yùn)數(shù)據(jù)智能應(yīng)用與分析上,以進(jìn)行船舶航行水域航線調(diào)度信息采集,金輝等[3]提出1 種基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法,主要通過高斯混合模型構(gòu)建船舶航行水域航線調(diào)度信息采集模型進(jìn)行船舶航行水域航線調(diào)度信息的采集。在國(guó)內(nèi),對(duì)于船舶航行水域航線調(diào)度信息采集的研究則相對(duì)起步較晚,最早開始通過借鑒國(guó)外的研究成果進(jìn)行相關(guān)研究,接著主要集中于對(duì)船舶航行水域航線調(diào)度信息的捕捉與預(yù)測(cè)等方向進(jìn)行研究,冉明華[4]提出一種基于DSP(digital signal processing)技術(shù)的船舶航行水域航線調(diào)度信息采集方法,主要通過DSP 技術(shù)實(shí)現(xiàn)船舶航行水域航線調(diào)度信息的采集。但是,在利用以上方法進(jìn)行船舶航行水域航線調(diào)度信息的采集時(shí),受軌跡數(shù)據(jù)中存在缺失值與異常數(shù)據(jù)的影響而無法進(jìn)行數(shù)據(jù)壓縮,導(dǎo)致船舶在航行過程中的航線轉(zhuǎn)向點(diǎn)存在識(shí)別率較低的問題。因此,本文提出一種基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法?;贖adoop 大數(shù)據(jù)處理框架提取船舶軌跡數(shù)據(jù),對(duì)軌跡數(shù)據(jù)進(jìn)行預(yù)處理,并利用D-P 壓縮方法對(duì)軌跡數(shù)據(jù)進(jìn)行壓縮,利用ECDIS 系統(tǒng)平臺(tái)進(jìn)行船舶航行水域航線的軌跡調(diào)度信息采集。
首先獲取AIS(automatic identification system)報(bào)文里的UTC 時(shí)間、船寬、船長(zhǎng)、對(duì)水速度、對(duì)地速度、航向、船舶位置、MMSI(maritime mobile service identify)碼等船舶軌跡數(shù)據(jù)[5]。利用AIS 系統(tǒng)(船舶自動(dòng)識(shí)別系統(tǒng))對(duì)船舶進(jìn)行解碼識(shí)別,并將其導(dǎo)入SHIPDB 數(shù)據(jù)庫(kù)中。并對(duì)需要的船舶軌跡數(shù)據(jù)基于Hadoop 大數(shù)據(jù)處理框架進(jìn)行提取[6]。根據(jù)船舶實(shí)際航行狀態(tài)提取船舶軌跡數(shù)據(jù),將原始的船舶軌跡數(shù)據(jù)序列設(shè)為T={p1,p2,p3,……pn},則具體提取步驟如下:第一步:對(duì)原始的船舶軌跡數(shù)據(jù)序列集合進(jìn)行初始化處理;第二步:對(duì)原始的船舶軌跡數(shù)據(jù)序列進(jìn)行遍歷,一直到找到pj這一數(shù)據(jù)點(diǎn),該數(shù)據(jù)點(diǎn)的對(duì)應(yīng)航行狀態(tài)是錨泊;第三步:從pj這一數(shù)據(jù)點(diǎn)開始向下進(jìn)行遍歷,一直到找到pk這一數(shù)據(jù)點(diǎn),該數(shù)據(jù)點(diǎn)的對(duì)應(yīng)航行狀態(tài)是在航[7]。第四步:重新構(gòu)建1 個(gè)軌跡序列s={pj,pj+1,pj+2,……pk-1},將重新構(gòu)建的軌跡序列添加到原始的船舶軌跡數(shù)據(jù)序列集合中,將k 作為新的起點(diǎn)對(duì)第二步進(jìn)行重復(fù),一直到完成所有數(shù)據(jù)點(diǎn)的偏離[7]。
提取到所需的船舶軌跡數(shù)據(jù)信息如表1 所示。
表1 提取到所需的船舶軌跡數(shù)據(jù)信息Tab.1 The required ship track data information is extracted
首先運(yùn)用均值插補(bǔ)法對(duì)提取的船舶軌跡數(shù)據(jù)實(shí)施缺失值處理。將提取的船舶軌跡數(shù)據(jù)整體視為線性軌跡[8],利用缺失數(shù)據(jù)的2 個(gè)相鄰的已知數(shù)據(jù)D-P 壓縮缺失數(shù)據(jù)[9]。將缺失數(shù)據(jù)設(shè)為(ti,pti),其中pti代表缺失值;ti代表缺失數(shù)據(jù)所對(duì)應(yīng)的時(shí)間。缺失數(shù)據(jù)的2 個(gè)相鄰的已知數(shù)據(jù)分別為(tk,ptk)與(tm,ptm),利用這2 個(gè)數(shù)據(jù)點(diǎn)對(duì)pti進(jìn)行擬合,以對(duì)缺失值進(jìn)行填補(bǔ)。插補(bǔ)公式見式(1)。
接著對(duì)提取的船舶軌跡數(shù)據(jù)中的異常數(shù)據(jù)進(jìn)行處理,包括軌跡點(diǎn)漂移情況、軌跡稀疏情況以及航線過短情況[10]。對(duì)于軌跡稀疏情況與航線過短情況需要直接放棄[11]。
對(duì)于軌跡點(diǎn)漂移情況,需要對(duì)其進(jìn)行D-P 壓縮處理,以軌跡變化情況為依據(jù)對(duì)軌跡點(diǎn)漂移情況進(jìn)行識(shí)別[12]。將當(dāng)前軌跡點(diǎn)設(shè)為Ti,當(dāng)Ti與其前后的軌跡點(diǎn)距離較大時(shí),則認(rèn)為其為軌跡漂移點(diǎn),通過Ti前后的軌跡點(diǎn)對(duì)直線進(jìn)行擬合。軌跡點(diǎn)漂移情況及擬合后的軌跡點(diǎn)情況示意圖如圖1 所示。
圖1 軌跡點(diǎn)漂移情況及擬合后的軌跡點(diǎn)情況示意圖Fig.1 The drift of track points and the sketch diagram of track points after fitting
接著利用D-P 壓縮方法對(duì)船舶軌跡數(shù)據(jù)實(shí)施壓縮處理,具體處理流程如下:
(1)對(duì)軌跡序列中各軌跡點(diǎn)進(jìn)行逐個(gè)掃描,獲取相鄰子段間的平均速率和角度變化值[13]。
(2)對(duì)航向變化率或航向變化進(jìn)行判斷,當(dāng)其超越閾值時(shí)直接存入軌跡特征點(diǎn)航向數(shù)據(jù)庫(kù)內(nèi)[14]。
(3)當(dāng)航速和航向都比閾值小,對(duì)下一個(gè)軌跡點(diǎn)進(jìn)行掃描,對(duì)其是否為最后一個(gè)船舶軌跡點(diǎn)進(jìn)行判斷[15],當(dāng)確定其是最后一個(gè)船舶軌跡點(diǎn),將其直接存入軌跡特征點(diǎn)航向數(shù)據(jù)庫(kù)內(nèi),結(jié)束壓縮流程;否則繼續(xù)對(duì)下一個(gè)軌跡點(diǎn)進(jìn)行掃描。
在上述所得船舶軌跡數(shù)據(jù)的基礎(chǔ)上,利用ECDIS 系統(tǒng)平臺(tái)進(jìn)行船舶航行水域航線的軌跡調(diào)度信息采集,從而利用采集的軌跡調(diào)度信息自動(dòng)生成水域航線[16]。首先利用ECDIS 基礎(chǔ)顯示平臺(tái)構(gòu)建ENC(environmental noise cancellation) 數(shù)據(jù)模型,ENC 是指由海道測(cè)量機(jī)構(gòu)或其他相關(guān)政府機(jī)構(gòu)制定的矢量電子海圖,如圖2 所示。
圖2 ENC 數(shù)據(jù)模型Fig.2 ENC data model
通過ENC 數(shù)據(jù)模型[17]對(duì)壓縮后的船舶軌跡數(shù)據(jù)進(jìn)行記錄分析,采集壓縮后的船舶軌跡數(shù)據(jù)中的5 種船舶航行水域航線調(diào)度記錄[18],在其中提取船舶航行水域航線軌跡調(diào)度信息,具體如表2 所示。
表2 提取的船舶航行水域航線軌跡調(diào)度信息Tab.2 The route track scheduling information extracted from the navigation area of the ship
為證明設(shè)計(jì)的基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法的性能,對(duì)其進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)中船舶航行水域?yàn)槟澈{水域,收集該海峽水域的50 248 條船舶軌跡數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。船舶速度、航跡向和船舶轉(zhuǎn)向點(diǎn)是航線規(guī)劃信息采集中的重要因素,統(tǒng)計(jì)不同船舶速度和航向數(shù)據(jù)并進(jìn)行壓縮篩選,匹配ENC 數(shù)據(jù)模型,從而獲取水域航線軌跡調(diào)度信息。該海峽水域的最大速度、平均速度及交通流速度等相關(guān)速度數(shù)據(jù)如圖3~5 所示。最大速度是指船舶在該海峽水域的最大行駛速度;平均速度是指船舶在該海峽水域的平均行駛速度;交通流速度是指船舶在該海峽水域上連續(xù)行駛形成的船舶流量速度。
圖3 該海峽水域的最大速度分布Fig.3 Maximum velocity distribution in the channel
圖4 該海峽水域的平均速度分布Fig.4 Mean velocity distribution in the channel
圖5 該海峽水域的交通流速度分布Fig.5 Velocity distribution of traffic flow in the channel
該海峽水域內(nèi)的實(shí)際速度分布具體如圖6 所示。實(shí)際速度是指船舶在該海峽水域受到水流壓力等因素的影響而實(shí)際航行的速度。獲取該海峽水域的實(shí)際航向分布特征,具體如表3 所示。
表3 該海峽水域的實(shí)際航向分布特征Tab.3 The actual course distribution characteristics of the channel waters
圖6 該海峽水域內(nèi)的實(shí)際速度分布Fig.6 The actual velocity distribution in the waters of the channel
對(duì)該海峽水域的航跡向?qū)嵤┙y(tǒng)計(jì)分析,具體結(jié)果如圖7 所示。
圖7 航跡向統(tǒng)計(jì)分析結(jié)果Fig.7 Statistical analysis results of track direction
利用設(shè)計(jì)的基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法針對(duì)該海峽水域進(jìn)行船舶航行水域航線軌跡調(diào)度信息采集實(shí)驗(yàn)。為避免本次實(shí)驗(yàn)結(jié)果過于單一,將原有的2 種方法作為實(shí)驗(yàn)中的對(duì)比方法,分別為基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法。DSP 技術(shù)是基于數(shù)字信號(hào)處理的船舶信息采集系統(tǒng),這種方法進(jìn)行航線調(diào)度信息的采集時(shí),受軌跡數(shù)據(jù)中存在缺失值與異常數(shù)據(jù)的影響,航線轉(zhuǎn)向點(diǎn)存在識(shí)別率較低。高斯混合模型是一個(gè)常用的描述混合密度分布的模型,通過刻畫參數(shù)空間中數(shù)據(jù)的分布及其特性,用高斯概率密度函數(shù)量化事物,它是一個(gè)將事物分解為K 個(gè)基于高斯概率密度函數(shù)的線性組合而形成的模型。
運(yùn)用這3 種方法進(jìn)行實(shí)驗(yàn),船舶在航行中轉(zhuǎn)舵改變航向時(shí)的地點(diǎn)叫轉(zhuǎn)向點(diǎn),轉(zhuǎn)向點(diǎn)識(shí)別率越高,船舶水域航線調(diào)度能力越高,對(duì)航線調(diào)度信息采集具有重要意義,選用該海峽水域內(nèi)具有20~30 個(gè)船舶航線的轉(zhuǎn)向點(diǎn)識(shí)別率數(shù)據(jù)作為對(duì)比實(shí)驗(yàn)數(shù)據(jù)。
當(dāng)船舶轉(zhuǎn)向點(diǎn)為20~25 個(gè)時(shí),基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法與基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點(diǎn)識(shí)別率對(duì)比實(shí)驗(yàn)數(shù)據(jù)具體如表4 所示。
表4 航線轉(zhuǎn)向點(diǎn)識(shí)別率對(duì)比實(shí)驗(yàn)數(shù)據(jù)Tab.4 Comparison experimental data of recognition rate of course turning point
根據(jù)表4 的航線轉(zhuǎn)向點(diǎn)識(shí)別率對(duì)比實(shí)驗(yàn)數(shù)據(jù)可知,基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點(diǎn)識(shí)別率普遍高于92%,相比基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法,基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點(diǎn)識(shí)別率較高。
當(dāng)船舶轉(zhuǎn)向點(diǎn)為26~30 個(gè)時(shí),基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法與基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點(diǎn)識(shí)別率對(duì)比實(shí)驗(yàn)數(shù)據(jù)具體如表5 所示。
表5 航線轉(zhuǎn)向點(diǎn)識(shí)別率對(duì)比實(shí)驗(yàn)數(shù)據(jù)Tab.5 Comparison experimental data of recognition rate of course turning point
由表5 的航線轉(zhuǎn)向點(diǎn)識(shí)別率對(duì)比實(shí)驗(yàn)數(shù)據(jù)可知,基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點(diǎn)識(shí)別率高于基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法。這是因?yàn)楸疚姆椒ɡ肊CDIS 系統(tǒng)平臺(tái)采集船舶航行水域航線軌跡調(diào)度信息,提高航向轉(zhuǎn)向點(diǎn)識(shí)別率。
本研究提出1 種基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集的新方法。運(yùn)用AIS 系統(tǒng)獲取船舶實(shí)際航行軌跡數(shù)據(jù)信息,提取所需要的船舶軌跡數(shù)據(jù)進(jìn)行分析,并對(duì)該數(shù)據(jù)進(jìn)行預(yù)處理和壓縮處理,利用ECDIS 系統(tǒng)平臺(tái)采集船舶航行水域航線軌跡調(diào)度信息,從而實(shí)現(xiàn)了航線軌跡調(diào)度信息采集。最后進(jìn)行實(shí)驗(yàn)研究,得到結(jié)果顯示基于ECDIS 平臺(tái)的船舶航行水域航線調(diào)度信息采集方法實(shí)現(xiàn)了航線轉(zhuǎn)向點(diǎn)識(shí)別率的提升,對(duì)于船舶水域航線調(diào)度信息采集有很大意義。