呂靖,齊海迪,李寶德
(大連海事大學(xué),交通運(yùn)輸工程學(xué)院,遼寧大連 116026)
海運(yùn)是當(dāng)今世界上最重要的跨國運(yùn)輸方式,對世界貿(mào)易與經(jīng)濟(jì)的發(fā)展起到了至關(guān)重要的作用。然而,以海盜和海上恐怖主義為主的非傳統(tǒng)安全風(fēng)險成為困擾海上運(yùn)輸安全的主要問題[1]。其中,海盜襲擊事件影響的范圍最為廣泛,一旦發(fā)生,不僅會造成財產(chǎn)損失,還會對船上人員的生命安全產(chǎn)生巨大威脅,甚至還有可能對通航、環(huán)境等產(chǎn)生不利影響。因此,如何根據(jù)現(xiàn)有信息,構(gòu)建合理準(zhǔn)確的海盜風(fēng)險預(yù)測模型,在海盜襲擊時,給出海盜襲擊的風(fēng)險等級,使相關(guān)方迅速采取有效應(yīng)對行動,減少嚴(yán)重?fù)p失顯得尤為重要。
針對海盜襲擊事件的研究主要圍繞海盜襲擊事件的海軍護(hù)航策略博弈、預(yù)警等,如朱樂群等[2]根據(jù)演化博弈理論建立海軍護(hù)航下海盜襲擊決策的非對稱演化博弈模型,并對近年來索馬里海盜活動情況進(jìn)行模擬。孫茂金等[3]采用決策樹方法并以東非海域海盜事件為研究對象進(jìn)行海盜襲擊后果預(yù)警,結(jié)果表明,預(yù)測結(jié)果遠(yuǎn)優(yōu)于隨機(jī)猜測。
為綜合利用人類在決策過程中的不確定信息和定性知識,YANG 等[4]通過在傳統(tǒng)的IF-THEN 規(guī)則中加入置信框架,首次提出置信規(guī)則庫(Belief Rule Base,BRB)。隨后,置信規(guī)則庫被廣泛應(yīng)用于不同領(lǐng)域的決策研究。隨后,考慮置信規(guī)則庫的前提屬性數(shù)量和屬性值過多會產(chǎn)生“組合爆炸”的問題,LIU 等[5]提出擴(kuò)展置信規(guī)則庫(Extended Belief Rule Base,EBRB),并應(yīng)用于預(yù)測和評估領(lǐng)域。葉菲菲等[6]針對交通運(yùn)輸業(yè)中環(huán)境治理成本規(guī)劃問題,提出基于數(shù)據(jù)包絡(luò)分析和擴(kuò)展置信規(guī)則庫的環(huán)境治理成本預(yù)測模型。楊隆浩等[7]引入?yún)?shù)優(yōu)化和數(shù)據(jù)包絡(luò)分析,分別提出擴(kuò)展置信規(guī)則庫的規(guī)則生成方法和規(guī)則約減方法,并應(yīng)用于橋梁風(fēng)險評估。
綜上所述,海盜襲擊事件風(fēng)險預(yù)測方面的研究并不多,本文提出基于擴(kuò)展置信規(guī)則庫聯(lián)合優(yōu)化方法對海盜襲擊事件進(jìn)行風(fēng)險預(yù)測,為相關(guān)方制定應(yīng)急決策方案提供參考依據(jù)。
EBRB 系統(tǒng)是一個基于擴(kuò)展置信規(guī)則的預(yù)測和推理系統(tǒng),目前大多被用來做預(yù)測和評估。假設(shè)EBRB 系統(tǒng)中有M個前提屬性Ui(i=1,…,M),每個前提屬性有Ji個參考值A(chǔ)i,j(j=1,…,Ji),以及一個結(jié)果屬性D,結(jié)果屬性有N個參考值Dn(n=1,…,N)。EBRB 系統(tǒng)的第k(k=1,…,L,L為總規(guī)則數(shù))條擴(kuò)展置信規(guī)則Rk為
EBRB 系統(tǒng)構(gòu)建的關(guān)鍵步驟是利用專家知識確定規(guī)則中前提屬性Ui(i=1,…,M)的所有參考值A(chǔ)i,j(j=1,…,Ji)的效用值u(Ai,j),結(jié)果屬性D所有參考值Dn(n=1,…,N)的效用值u(Dn),以及每個前提屬性的屬性權(quán)重δi(i=1,…,M)。但EBRB 系統(tǒng)由于缺乏信息、知識或數(shù)據(jù),這種依靠決策者主觀確定參數(shù)的方法會存在著一定的不合理性,因此本文提出一種新的聯(lián)合優(yōu)化方法,同時優(yōu)化EBRB系統(tǒng)中的基本參數(shù)個數(shù)和數(shù)值。EBRB 系統(tǒng)的聯(lián)合優(yōu)化過程如圖1所示。
圖1 EBRB系統(tǒng)聯(lián)合優(yōu)化過程Fig.1 EBRB system joint optimization process
1.2.1 基于Relief F算法的EBRB系統(tǒng)結(jié)構(gòu)優(yōu)化
Relief F 算法由Relief 算法演變而來,Relief 算法是一種多變量過濾式特征選擇算法,也是一種基于樣本學(xué)習(xí)的特征權(quán)重算法。Relief算法通過考察特征在同類近鄰樣本與異類近鄰樣本之間的差異來度量特征的區(qū)分能力。若特征在同類樣本之間差異小,而在異類樣本之間差異大,則該特征具有較強(qiáng)的區(qū)分能力。Relief算法只適用于兩類數(shù)據(jù)問題,因此Kononenko[8]提出適用于多類別分類問題的Relief F算法。海盜襲擊事件的風(fēng)險等級屬于一個多分類的問題,因此采用Relief F 算法對其進(jìn)行關(guān)鍵屬性提取具有一定的適用性和有效性,Relief F算法的偽代碼如表1所示。
表1 Relief F算法Table 1 Relief F algorithm
表1 中,xrl為第l(l=1,…,m)次從原始樣本集中隨機(jī)抽取的樣本;為的A個同類最鄰近樣本,a=1,2,…,A;為來自于異類的A個的最鄰近樣本,ac=1,2,…,A;diff 為兩樣本在前提屬性Ui上的差,對于離散性屬性Ui有
對于連續(xù)性屬性Ui有
Relief F 算法計算第i(i=1,…,M)個屬性Ui的權(quán)重公式為
當(dāng)計算得出所有屬性權(quán)重,給定一個閾值進(jìn)行關(guān)鍵屬性選擇或者是按照權(quán)重降序排列并選擇權(quán)重最大的前若干個屬性。通過Relief F算法提取出關(guān)鍵屬性,能夠降低EBRB 系統(tǒng)的計算復(fù)雜度,提高系統(tǒng)的效率,實現(xiàn)對EBRB系統(tǒng)的結(jié)構(gòu)優(yōu)化。
1.2.2 基于差分進(jìn)化算法的EBRB系統(tǒng)參數(shù)優(yōu)化
在提取出關(guān)鍵屬性后,本文采用參數(shù)學(xué)習(xí)方法來確定EBRB系統(tǒng)中的基本參數(shù)的最優(yōu)值,具體參數(shù)優(yōu)化的數(shù)學(xué)模型[9]如下。
假設(shè)EBRB 系統(tǒng)中有M個前提屬性和1 個結(jié)果屬性,前提屬性各有Ji(i=1,…,M)個參考值的效用值u(Ai,j),j=1,…,Ji;i=1,…,M,結(jié)果屬性有N個結(jié)果參考值的效用值u(Dn),n=1,…,N。同時有T組數(shù)據(jù),假設(shè)EBRB系統(tǒng)對數(shù)據(jù)推理的結(jié)果為f(xt),EBRB的參數(shù)優(yōu)化模型為
式中:bli、bui分別為第i個前提屬性取值的下限、上限;bl、bu分別為結(jié)果屬性取值的下限、上限。
為了得到目標(biāo)函數(shù)中的參數(shù)最優(yōu)取值,本文利用差分進(jìn)化算法進(jìn)行迭代求解,具體步驟偽代碼如表2所示。
表2 差分進(jìn)化算法Table 2 Differential evolution algorithm
為了確保系統(tǒng)預(yù)測的準(zhǔn)確性,需要通過專家知識和歷史數(shù)據(jù)構(gòu)建基礎(chǔ)EBRB系統(tǒng),基本流程如圖2所示。從圖2 可知,EBRB 系統(tǒng)包括了兩部分,即擴(kuò)展置信規(guī)則(EBRB)和證據(jù)推理(ER)過程。通過這兩部分,EBRB 系統(tǒng)能夠為每個輸入數(shù)據(jù)生成輸出。
圖2 EBRB系統(tǒng)風(fēng)險預(yù)測過程Fig.2 EBRB system risk prediction process
1.3.1 EBRB系統(tǒng)構(gòu)建過程
利用歷史數(shù)據(jù)構(gòu)建EBRB的過程如下:
Step 1 通過1.2節(jié)的聯(lián)合優(yōu)化方法確定基本參數(shù)的數(shù)量和取值。
Step 2 利用基于效用值的轉(zhuǎn)換方式計算置信度分布。
這一步是將海盜襲擊事件的歷史輸入輸出數(shù)據(jù)轉(zhuǎn)換為擴(kuò)展置信規(guī)則的置信分布[10],輸入數(shù)據(jù)的置信分布為
同理,通過輸出數(shù)據(jù)yk和式(14)可以得到輸出數(shù)據(jù)的置信分布為
Step 3 利用相似度度量計算規(guī)則權(quán)重[11]。
假設(shè)在EBRB系統(tǒng)中共有L條擴(kuò)展置信規(guī)則,輸入輸出數(shù)據(jù)的置信分布分別如式(13)和式(16)所示,則第k(k=1,…,L)條規(guī)則的前提屬性相似度SRA 和結(jié)果屬性相似度SRC 分別為
第k(k=1,…,L)條規(guī)則的不一致性度為
最后,第k條規(guī)則的權(quán)重為
根據(jù)上述步驟可將海盜襲擊事件的歷史數(shù)據(jù)轉(zhuǎn)化為EBRB 系統(tǒng)中的擴(kuò)展置信規(guī)則,至此,海盜襲擊事件的擴(kuò)展置信規(guī)則庫構(gòu)建完成。
1.3.2 EBRB系統(tǒng)預(yù)測過程
基于1.2.1節(jié)建立的EBRB系統(tǒng),海盜襲擊事件的風(fēng)險等級預(yù)測步驟如下。
Step 1 計算每條規(guī)則的激活權(quán)重。
計算輸入數(shù)據(jù)xi和第k條規(guī)則的匹配度[11]為
相應(yīng)地,輸入數(shù)據(jù)x=(x1,…,xM)對第k條規(guī)則的激活權(quán)重[5]為
wk >0 代表第k條規(guī)則被激活。
Step 2 用ER算法集成所有激活規(guī)則。
利用ER 算法[12]將所有激活權(quán)重大于0 的規(guī)則集成,得到結(jié)果屬性置信度為
根據(jù)效用值[u(Dn);n=1,…,N]預(yù)測海盜襲擊事件的風(fēng)險等級,計算預(yù)測結(jié)果為
為驗證本文提出的基于擴(kuò)展置信規(guī)則庫聯(lián)合優(yōu)化海盜襲擊事件風(fēng)險預(yù)測模型的有效性,選取Global Integrated Shipping Information System(GISIS)數(shù)據(jù)庫統(tǒng)計的2011—2020年的海盜襲擊事件作為基礎(chǔ)數(shù)據(jù)集,其中2011—2019年的數(shù)據(jù)作為歷史數(shù)據(jù)建立EBRB 推理系統(tǒng)并進(jìn)行結(jié)構(gòu)和參數(shù)學(xué)習(xí),2020年數(shù)據(jù)作為測試數(shù)據(jù)驗證本文所提出方法的有效性。
根據(jù)海盜事件的已有研究[13],海盜襲擊事件是由于船舶、海盜、環(huán)境三者之間相互作用而發(fā)生的,這三者之間不同的作用導(dǎo)致海盜事件結(jié)果演化不同。其中,船舶影響因素包括船舶類型、航行狀態(tài),以及船舶的反海盜措施;海盜影響因素包括海盜人數(shù),是否持有武器;環(huán)境影響因素主要包括時間、沿岸政治環(huán)境,以及海上犯罪威脅情況等。海盜事件發(fā)生可能造成的結(jié)果有人員傷亡、財產(chǎn)損失、通航影響以及環(huán)境影響。因通航和環(huán)境影響并不常見,且鑒于人員傷亡和財產(chǎn)損失結(jié)果所選擇的輸入指標(biāo)相同,因此兩者的預(yù)測過程具有相似性,考慮到篇幅原因,本文將人員傷亡等級作為海盜事件的風(fēng)險預(yù)測輸出屬性。根據(jù)上述海盜襲擊事件風(fēng)險影響因素分析,建立如表3所示的海盜襲擊事件風(fēng)險預(yù)測輸入輸出指標(biāo)體系。
表3 風(fēng)險預(yù)測指標(biāo)體系Table 3 Risk prediction index system
IMO(國際海事組織)發(fā)布的GISIS數(shù)據(jù)庫中的《Piracy and Armed Robbery》詳細(xì)地記錄了海盜事件的發(fā)生報告,包括船舶類型、航行狀態(tài)、反海盜措施、海盜人數(shù)、是否持有武器、發(fā)生時間、發(fā)生海域、沿岸國家、人員傷亡、財產(chǎn)損失等;沿岸國家政治環(huán)境數(shù)據(jù)取自PRS(政治風(fēng)險服務(wù))集團(tuán)發(fā)布的國家風(fēng)險指數(shù)。
首先,對于本身就是定量數(shù)據(jù)的屬性,無需定量化處理,如海盜人數(shù)和沿岸國家政治環(huán)境。其次,可以用定量化數(shù)據(jù)來衡量的屬性,本文將2020年各船舶類型遭受海盜襲擊的次數(shù)作為船舶類型這一屬性的量化數(shù)據(jù);同理,將2020年海盜事件發(fā)生在各個時段的統(tǒng)計次數(shù)作為時間這一因素的量化數(shù)據(jù);海上犯罪威脅情況衡量了某一海域發(fā)生海盜及恐怖主義事件的風(fēng)險大小,根據(jù)2020年該區(qū)域的海盜活動總次數(shù)作為衡量依據(jù)。
對于定性化描述數(shù)據(jù),包括航行狀態(tài)、反海盜措施、是否持有武器以及人員傷亡,根據(jù)數(shù)據(jù)不同的特點(diǎn)進(jìn)行量化。GISIS數(shù)據(jù)庫記錄船舶的航行狀態(tài)有行駛和停泊兩種,用0-1 變量將這兩種狀態(tài)量化。GISIS數(shù)據(jù)庫對反海盜措施是利用定性語言來描述的,對數(shù)據(jù)進(jìn)行仔細(xì)分析后,本文依據(jù)采取的反海盜措施個數(shù)進(jìn)行量化。同理,根據(jù)海盜持有武器的種類對是否持有武器定量化描述。人員傷亡屬性也為語言型的描述,對數(shù)據(jù)分析后,依據(jù)關(guān)鍵字進(jìn)行量化[1],人員傷亡屬性的關(guān)鍵字為人質(zhì)、輕傷、重傷、失蹤/死亡。根據(jù)水上交通事故分級標(biāo)準(zhǔn)[14]和對海盜事件數(shù)據(jù)集的分析,人員傷亡等級劃分方式如表4所示。將數(shù)據(jù)處理后,數(shù)據(jù)集各指標(biāo)的描述性統(tǒng)計如表5所示。
表4 人員傷亡等級Table 4 Casualty level
表5 描述性統(tǒng)計Table 5 Descriptive statistics
篩選發(fā)生在2011—2019年間的200 件數(shù)據(jù)完整的海盜襲擊事件作為歷史數(shù)據(jù)集,20 件發(fā)生在2020年的海盜襲擊事件作為測試集。設(shè)定Relief F算法中的抽樣次數(shù)m為80次,近鄰數(shù)據(jù)個數(shù)A為8個,運(yùn)行次數(shù)N為20 次。在使用差分進(jìn)化算法進(jìn)行參數(shù)優(yōu)化的過程中,設(shè)定迭代次數(shù)S為300 次,待優(yōu)化參數(shù)為19 個,變異因子F為0.5,交叉因子CR為0.8。
2.2.1 關(guān)鍵屬性提取結(jié)果
利用Relief F算法對輸出屬性人員傷亡的關(guān)鍵輸入屬性進(jìn)行選擇,表6 為各屬性權(quán)重的計算結(jié)果。結(jié)果表明,反海盜措施、海盜人數(shù)、是否持有武器這3個屬性的權(quán)重明顯高于其他幾個屬性,對于海盜襲擊事件而言,海盜的武裝力量和船舶的反海盜措施對結(jié)果的演變起著重要作用[13]。因此本文提取這3個屬性作為人員傷亡屬性的關(guān)鍵屬性,以實現(xiàn)對EBRB系統(tǒng)的結(jié)構(gòu)優(yōu)化,提高計算效率。
表6 屬性權(quán)重Table 6 Attribute weight
2.2.2 參數(shù)優(yōu)化結(jié)果
首先,根據(jù)專家知識和數(shù)據(jù)的描述性統(tǒng)計,確定各輸入和輸出屬性的參考值等級Ai,j,各屬性的參考值等級皆為{低,一般,較高,高},以及初始參數(shù)值,包括輸入和輸出屬性的效用值u(Ai,j)(j=1,…,Ji;i=1,…,M),u(Dn)以及輸入屬性的權(quán)重δi,具體如表7所示。
表7 初始參數(shù)值Table 7 Initial value of parameters
接下來,利用差分進(jìn)化算法進(jìn)行參數(shù)優(yōu)化。平均絕對誤差(MAE)的變化如圖3所示,可以看出,MAE隨著迭代次數(shù)的增加而減小,并逐漸收斂,在迭代233次時達(dá)到最優(yōu)。這意味著EBRB系統(tǒng)參數(shù)的值,包括輸入屬性權(quán)重和輸入、輸出屬性參考值的效用值均為最優(yōu)值,最優(yōu)參數(shù)如表8所示。
圖3 參數(shù)優(yōu)化過程Fig.3 Parameter optimization process
表8 最優(yōu)參數(shù)值Table 8 Optimal value of parameters
2.2.3 風(fēng)險預(yù)測結(jié)果及分析
為了證明此方法的準(zhǔn)確性,對2020年海盜事件人員傷亡風(fēng)險等級預(yù)測,結(jié)果如圖4 和圖5所示。很明顯,聯(lián)合優(yōu)化方法的預(yù)測結(jié)果與實際情況更相符。同時,從誤差圖可以直觀的看出,聯(lián)合優(yōu)化EBRB 系統(tǒng)的誤差基本控制在0.5 以內(nèi),而EBRB 系統(tǒng)在多數(shù)情況下誤差都超過了1.0,聯(lián)合優(yōu)化的方法能夠?qū)⒊跏糆BRB 系統(tǒng)的預(yù)測準(zhǔn)確性提高60%。
圖4 2020年人員傷亡等級預(yù)測值Fig.4 Prediction of casualty levels in 2020
圖5 2020年人員傷亡等級預(yù)測誤差Fig.5 Prediction error of casualty levels in 2020
為了更加直觀地體現(xiàn)兩種方法的差異,表9給出兩種方法的平均絕對誤差(MAE)、均方根誤差(RMSE)和均方誤差(MSE),可以看出,聯(lián)合優(yōu)化的EBRB方法在各個指標(biāo)上都明顯優(yōu)于初始EBRB。
表9 不同EBRB模型的性能比較Table 9 Comparison of performance of different EBRB models
為進(jìn)一步比較聯(lián)合優(yōu)化EBRB 系統(tǒng)在海盜事件風(fēng)險預(yù)測方面的優(yōu)越性,將現(xiàn)有兩種風(fēng)險預(yù)測方法,即人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)和自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)與本文提出的模型進(jìn)行對比分析。其中,BP-ANN在風(fēng)險評估領(lǐng)域得到了廣泛應(yīng)用,而ANFIS與EBRB系統(tǒng)預(yù)測模型都屬于規(guī)則推理范疇。
以MAE、RMSE、MSE 等評價指標(biāo)對比模型預(yù)測效果,結(jié)果如表10所示。聯(lián)合優(yōu)化EBRB系統(tǒng)的MAE 值為0.1839,相比于其他兩種預(yù)測方法的準(zhǔn)確性分別提高了95.1%和186.7%;聯(lián)合優(yōu)化EBRB系統(tǒng)得到的RMSE、MSE也明顯小于其他風(fēng)險預(yù)測模型,說明聯(lián)合優(yōu)化EBRB系統(tǒng)能夠有效避免在海盜事件風(fēng)險預(yù)測中出現(xiàn)誤差較大的情形。
表10 不同方法性能比較Table 10 Comparison of performances of different methods
本文提出一種基于擴(kuò)展置信規(guī)則庫聯(lián)合優(yōu)化的海盜襲擊事件風(fēng)險預(yù)測模型。首先利用Relief F算法進(jìn)行結(jié)構(gòu)優(yōu)化,以去除冗余指標(biāo),提取出關(guān)鍵屬性,結(jié)果表明,海盜的武裝力量和船舶的反海盜措施對海盜襲擊事件后果的嚴(yán)重程度起著關(guān)鍵作用;之后采用差分進(jìn)化算法進(jìn)行參數(shù)優(yōu)化,以減小誤差。應(yīng)用該方法對海盜事件人員傷亡風(fēng)險等級預(yù)測能夠明顯減小預(yù)測誤差,提高EBRB系統(tǒng)的預(yù)測精度。并與BP 神經(jīng)網(wǎng)絡(luò)、ANFIS 等預(yù)測方法對比,本文方法能夠?qū)㈩A(yù)測準(zhǔn)確性分別提高95.1%和186.7%。研究結(jié)果一方面可以為我國建立實時的海盜風(fēng)險預(yù)測體系提供方法指導(dǎo),另一方面能夠為相關(guān)方及時展開應(yīng)急活動提供有效依據(jù),為打擊海盜做出重要貢獻(xiàn)。