王日金 鄭宇翔 湯海亮 陳霄 辛晶昊
1 研究背景
隨著船舶大型化趨勢的持續(xù)發(fā)展,遠(yuǎn)洋集裝箱船舶在碼頭的單次靠泊裝卸箱量不斷上升,導(dǎo)致碼頭堆場面臨堆存周期延長和堆存箱量超標(biāo)等問題。大規(guī)模裝卸作業(yè)對集裝箱碼頭堆場管理提出較高要求,集裝箱碼頭運營瓶頸逐漸從岸線轉(zhuǎn)向堆場,堆場集裝箱堆存質(zhì)量成為影響集裝箱碼頭運營管理的重要因素。[1]目前,業(yè)內(nèi)尚未形成科學(xué)嚴(yán)謹(jǐn)?shù)募b箱堆存質(zhì)量評價方法,只能依賴人工經(jīng)驗對其進(jìn)行粗略評價;但當(dāng)堆場堆存箱量較多時,基于人工經(jīng)驗的評價方法需要耗費大量人力和物力。在此背景下,以自動化和可靠的集裝箱堆存質(zhì)量評價方法替代基于人工經(jīng)驗的評價方法,成為現(xiàn)階段我國集裝箱碼頭的迫切需求。
k均值聚類算法是一種常見的數(shù)據(jù)挖掘算法,用于多特征樣本的分類,如圖像分割、路徑分類、等級劃分等。楊艷等[2]通過優(yōu)化k均值聚類算法特征空間的權(quán)重,獲得更優(yōu)的圖像分類結(jié)果。李爽等[3]通過改進(jìn)k均值聚類算法的親和距離函數(shù)提升算法的聚類穩(wěn)定性,從而在航線分類實驗中得出更優(yōu)的聚類結(jié)果。楊善林等[4]提出k均值聚類算法的距離代價函數(shù),建立k取值有效性的檢驗方法。雷小鋒等[5]通過建立加權(quán)連通圖和合并子簇方法,構(gòu)造k均值聚類算法的子簇交集,從而提升算法效率。李潔等[6]提出基于特征加權(quán)的模糊k均值聚類算法,得出各維特征對分類結(jié)果的貢獻(xiàn)度。受以上研究成果的啟發(fā),本文基于k均值聚類算法設(shè)計集裝箱分類算法,實現(xiàn)對集裝箱的合理分類,并結(jié)合集裝箱碼頭業(yè)務(wù)邏輯,建立集裝箱堆存質(zhì)量評價方法,實現(xiàn)集裝箱堆存質(zhì)量的自動化評價。
2 問題描述
集裝箱碼頭船舶作業(yè)主要分為出口作業(yè)(包含集港、堆存、配載、裝船等環(huán)節(jié))和進(jìn)口作業(yè),其中出口作業(yè)的裝船環(huán)節(jié)對堆場集裝箱堆存質(zhì)量的要求較高。為了確保船舶穩(wěn)泊和航行安全,集裝箱在船上的分布必須符合相應(yīng)要求,從而對集裝箱裝船順序提出一定要求。在裝船作業(yè)過程中,岸橋、場橋和內(nèi)集卡等設(shè)備相互配合,從堆場提取集裝箱并依次裝船。出口箱區(qū)的集裝箱堆存質(zhì)量較差容易導(dǎo)致場橋移動頻繁、翻箱作業(yè)增加等問題,從而降低碼頭裝船作業(yè)效率;因此,出口箱區(qū)的集裝箱堆存質(zhì)量是碼頭運營管理的核心問題。
出口箱區(qū)的集裝箱堆存質(zhì)量主要由集港環(huán)節(jié)決定。貨主通常在船舶到港前的4~7 d將集裝箱運至碼頭堆場,碼頭按照集裝箱的箱型、出口航次、卸貨港口和質(zhì)量等屬性分配箱區(qū)位置。由于無法提前獲得集港集裝箱的數(shù)量、質(zhì)量、箱型和到達(dá)次序等信息,碼頭通常會制訂堆場集港位置策略,并結(jié)合堆場堆存箱量、作業(yè)繁忙度和航線規(guī)劃等,實時檢測堆場集裝箱堆存質(zhì)量,調(diào)整集港位置策略。
為此,有必要建立堆場集裝箱堆存質(zhì)量評價方法,按相應(yīng)屬性對集裝箱進(jìn)行分類,并結(jié)合碼頭業(yè)務(wù)邏輯,對分類后的堆場箱區(qū)位置進(jìn)行統(tǒng)計,從而評價同類型集裝箱集港后在堆場堆存的科學(xué)性和合理性。多特征屬性樣本分類求解適合采用聚類算法,而集裝箱類別可根據(jù)船方裝卸工藝要求獲得;因此,采用聚類算法中的k均值聚類算法劃分集裝箱類別,在此基礎(chǔ)上建立集裝箱堆存質(zhì)量評價方法。由表1可見,集裝箱的主要特征屬性包括箱區(qū)位置、船舶箱位號、箱型、卸貨港口和質(zhì)量等。
3 模型構(gòu)建
3.1 模型說明
模型符號定義如下:x為樣本;m為特征屬性; 為特征的權(quán)重系數(shù);d為歐幾里得距離;D為距離矩陣;k為子集合數(shù)量;G為子集合;e為簇的聚類中心;W為損失函數(shù)。
給定n個集裝箱樣本組成集合X,X={x1,x2, ,xn};i為樣本序號,i∈{1,2, ,n};x[m]為樣本的特征屬性;G為子集合,G={G1,G2,G3, ,Gk},Gi=X,Gi∩Gj= 。首先,選取k個樣本作為簇中心;然后,將樣本分到與簇中心的親和距離最小的簇中,計算簇中心到簇內(nèi)各樣本的距離之和,將其作為損失函數(shù),并持續(xù)更換樣本作為簇中心,實現(xiàn)重復(fù)迭代;
最后,找到使損失函數(shù)值最小的分類組合,將其作為最優(yōu)子集合劃分。
3.2 算法設(shè)計
3.2.1 親和距離函數(shù)
為了合理表達(dá)樣本屬性間的關(guān)系,設(shè)置親和距離函數(shù),親和距離越小表示關(guān)系越近。參考文獻(xiàn)[3]的方法,對樣本的各個特征進(jìn)行加權(quán),以保證親和距離函數(shù)合理表達(dá)業(yè)務(wù),加權(quán)系數(shù)由人工經(jīng)驗給出。集裝箱的特征屬性分為數(shù)值型和字符型兩種,分別設(shè)置兩種特征的親和距離。
3.3 算法流程
算法要求輸入樣本集合X,輸出聚類后的集合G *,具體流程如下。
步驟一:從樣本中隨機(jī)選取k個樣本作為第0代聚類中心,即t=0,則初始聚類中心為。
步驟二:將各樣本分配到距離最近的聚類中心的簇中,構(gòu)成聚類結(jié)果G t,并計算聚類結(jié)果的損失函數(shù)值。
步驟三:重新選取k個樣本作為聚類中心{},執(zhí)行步驟二。
步驟四:當(dāng)所有聚類中心組合遍歷完成后,輸出損失函數(shù)值最小的聚類結(jié)果G *。
步驟五:統(tǒng)計G *中每個簇內(nèi)同箱區(qū)位置的樣本占比,將其作為集裝箱堆存質(zhì)量得分并輸出。
4 算例分析
選取2020年靠泊梅東集裝箱碼頭的20艘大型遠(yuǎn)洋船舶作為樣本進(jìn)行試驗,并通過分析模型評價分值與人工評價分值的相關(guān)性,驗證模型評價方法與人工評價方法的相似性。試驗中,人工評價分值由碼頭管理者根據(jù)經(jīng)驗給出,取值為1~10的整數(shù)。
4.1 參數(shù)設(shè)置
根據(jù)船方裝卸工藝要求設(shè)置k值,并根據(jù)經(jīng)驗設(shè)置集裝箱的特征屬性參數(shù)(見表2)。
4.2 結(jié)果分析
試驗結(jié)果中的集裝箱堆存質(zhì)量得分、人工評價分值、損失函數(shù)值和k值均無計量單位。
4.2.1 集裝箱堆存質(zhì)量得分與人工評價分值的關(guān)系
試驗結(jié)果顯示,集裝箱堆存質(zhì)量得分與人工評價分值高度正相關(guān)(見圖1),兩者的相關(guān)系數(shù)為0.97,說明模型評價方法與人工評價方法的結(jié)果高度一致。
4.2.2 損失函數(shù)值與人工評價分值的關(guān)系
試驗結(jié)果顯示,損失函數(shù)值與人工評價分值高度負(fù)相關(guān)(見圖2),兩者的相關(guān)系數(shù)為 0.94,說明損失函數(shù)值越小,集裝箱堆存質(zhì)量得分越高,即聚類過程的損失函數(shù)越小,集裝箱堆存質(zhì)量越高。
4.2.3 k值與集裝箱堆存質(zhì)量得分和人工評價分值的關(guān)系
試驗結(jié)果顯示,k值與集裝箱堆存質(zhì)量得分和人工評價分值均為負(fù)相關(guān)(見圖3和圖4),相關(guān)系數(shù)分別為 0.46和 0.42,說明集裝箱類別越多,集裝箱堆存質(zhì)量越差,這與實際業(yè)務(wù)情況相符。k值與人工評價分值的相關(guān)系數(shù)絕對值小于k值與集裝箱堆存質(zhì)量得分的相關(guān)系數(shù)絕對值,主要原因是:當(dāng)集裝箱類別較多時,碼頭管理者認(rèn)為集裝箱堆存管理難度提升,從而會根據(jù)主觀判斷適當(dāng)提高分值。
5 結(jié)束語
隨著港口數(shù)字化建設(shè)的持續(xù)推進(jìn),數(shù)據(jù)挖掘算法逐步推廣應(yīng)用于港口管理領(lǐng)域。基于k均值聚類算法的集裝箱堆存質(zhì)量評價方法實現(xiàn)集裝箱堆存質(zhì)量的自動化評價,從而為堆場數(shù)字化管理提供支持。目前該評價方法只能用于單船出口集裝箱堆存質(zhì)量評價,尚未實現(xiàn)全堆場集裝箱堆存質(zhì)量評價。未來可以繼續(xù)探索全堆場集裝箱堆存質(zhì)量評價方法,從而實現(xiàn)集裝箱堆場自動化管理。
參考文獻(xiàn):
[1] 姜東瑞. 基于排隊論的專用集裝箱堆場空間分配問題[D]. 大連:大連海事大學(xué),2020:1-4.
[2] 楊艷,許道云. 優(yōu)化加權(quán)核K-means聚類初始中心點的SLIC算法[J]. 計算機(jī)科學(xué)與探索,2018,12(3):494-501.
[3] 李爽,史國友,高邈,等. 基于改進(jìn)譜聚類算法的航路辨識[J]. 上海海事大學(xué)學(xué)報,2019,40(4):1-6.
[4] 楊善林,李永森,胡笑旋,等. K-MEANS算法中的K值優(yōu)化問題研究[J]. 系統(tǒng)工程理論與實踐,2006(2):97-101.
[5] 雷小鋒,謝昆青,林帆,等. 一種基于K-Means局部最優(yōu)性的高效聚類算法[J]. 軟件學(xué)報,2008(7):1683-1692.
[6] 李潔,高新波,焦李成. 基于特征加權(quán)的模糊聚類新算法[J]. 電子學(xué)報,2006(1):89-92.
(編輯:張敏 收稿日期:2021-09-02)