中圖分類號:TP181 文獻(xiàn)標(biāo)志碼:B 文章編碼:1672-7274(2025)05-0059-03
Abstract: Effective early warning of ofshore oil hazardous chemical accidents can identify potential risks in advance,take emergency measures,reduce the probabilityof accidents,minimize the damage caused by accidents, protectthe marine environment,reduce economic losses,and ensure public safety.The article improves the support vector machine model by combining different kernel functions in a weighted manner and using the AdaBoost algorithm to improve its prediction performance.Through empirical testing,ithas been proven to effectively improve the performance of accident warning.
Keywords: offshore oily hazardous chemicals; fault warning; improving support vector machine
1 研究背景
海上石油開采和運(yùn)輸過程中涉及大量油性?;?,極易因操作失誤、設(shè)備故障或外界環(huán)境因素引發(fā)爆炸、泄漏等安全事故。這些?;肪哂懈叨纫兹家妆?、揮發(fā)性強(qiáng)的特點(diǎn),一旦發(fā)生事故,后果往往十分嚴(yán)重,不僅威脅操作人員的生命安全,還可能對海洋生態(tài)環(huán)境造成難以估量的破壞。隨著對油性?;吩诤I鲜烷_采和運(yùn)輸過程中的監(jiān)測需求不斷增加,如何高效處理大量監(jiān)測數(shù)據(jù)并進(jìn)行精準(zhǔn)預(yù)警,已成為研究熱點(diǎn)。在各類預(yù)警模型中,基于機(jī)器學(xué)習(xí)的支持向量機(jī)因其在小樣本、高維數(shù)據(jù)及非線性問題處理中的優(yōu)勢,被廣泛應(yīng)用于油性危化品的風(fēng)險(xiǎn)預(yù)警中。支持向量機(jī)可以通過構(gòu)建高維決策超平面來有效分類正常和異常數(shù)據(jù),識別潛在風(fēng)險(xiǎn),實(shí)現(xiàn)對?;沸孤⒈ǖ仁鹿实目焖兕A(yù)警。為此,本文基于該模型對海上油性危化品事故進(jìn)行預(yù)警[1]。
2 支持向量機(jī)模型的改進(jìn)
在采集海上油性?;废嚓P(guān)信息的基礎(chǔ)上,本文對支持向量機(jī)模型進(jìn)行改進(jìn),以提高預(yù)警能力。首先,支持向量機(jī)的分類性能依賴于核函數(shù)的選擇。在油性危化品預(yù)警中,可以通過核函數(shù)優(yōu)化來增強(qiáng)模型對非線性數(shù)據(jù)的處理能力。一般常用的核函數(shù)有線性核、徑向基函數(shù)(RBF)核、多項(xiàng)式核等??梢钥紤]使用自適應(yīng)核或組合核函數(shù),以適應(yīng)復(fù)雜的數(shù)據(jù)模式,如式(1)所示:
(1)式中, Kliner ,
以及
分別表示線性、徑向基、多項(xiàng)式核函數(shù); α 、 β 以及Y分別代表不同核函數(shù)的權(quán)重。
其次,引入AdaBoost模型,以增強(qiáng)分類器的準(zhǔn)確性和魯棒性。AdaBoost(AdaptiveBoosting)通過迭代訓(xùn)練多個(gè)弱分類器(在此處為支持向量機(jī))并組合它們的輸出,以構(gòu)建一個(gè)強(qiáng)分類器。其基本思想是在每一輪迭代中,增加對前一輪分類錯(cuò)誤樣本的關(guān)注度,從而使模型逐漸聚焦于難以分類的樣本,提高整體預(yù)測效果。假設(shè)樣本集為 , xi 代表危化品預(yù)警信息采集的各項(xiàng)數(shù)據(jù)指標(biāo), yi∈Y , Y=(-1,1) ,代表危化品的狀態(tài),當(dāng)取值為1時(shí)表示發(fā)生危險(xiǎn)事件,0代表正常狀態(tài)。AdaBoost首先為每個(gè)訓(xùn)練樣本分配一個(gè)初始權(quán)重,通常初始化為相等的權(quán)重分布。如果訓(xùn)練集共有
個(gè)樣本,則每個(gè)樣本的初始權(quán)重為式(2):
在每一輪迭代中,訓(xùn)練一個(gè)支持向量機(jī) ht(x) ,計(jì)算在當(dāng)前樣本權(quán)重分布下的加權(quán)錯(cuò)誤率 εt 。
式中, I(x) 是指示函數(shù),當(dāng)分類錯(cuò)誤時(shí)值為1,正確時(shí)為 0 根據(jù) εt 計(jì)算該支持向量機(jī)的權(quán)重,權(quán)重用于表示該分類器在最終組合中的重要性。若支持向量機(jī)的誤差率越小,權(quán)重 at 就越大,即該分類器在最終模型中的貢獻(xiàn)越大。
更新樣本權(quán)重,使得分類錯(cuò)誤的樣本在下一輪中受到更高的關(guān)注度。權(quán)重更新公式為:
之后,對所有權(quán)重進(jìn)行歸一化處理,使得新的權(quán)重之和為1。
經(jīng)過T輪迭代后,對各分類器進(jìn)行加權(quán)匯總,得到最終的預(yù)警模型。
式中,sign表示符號函數(shù),結(jié)果為0或1,以作為最終分類結(jié)果; ht(x) 代表每一輪訓(xùn)練得到的支持向量機(jī)。
為得到 α 、 β 以及Y等支持向量機(jī)模型參數(shù),本文采用遺傳算法對模型參數(shù)進(jìn)行優(yōu)化。遺傳算法隨機(jī)生成一組解,每個(gè)解(個(gè)體)表示支持向量機(jī)參數(shù)組合的一種可能配置。每個(gè)個(gè)體通過適應(yīng)度函數(shù)(支持向量機(jī)模型在驗(yàn)證集上的分類準(zhǔn)確率或均方誤差)來衡量其優(yōu)劣,適應(yīng)度越高的個(gè)體在后續(xù)選擇中保留的概率越高[2]。
3 基于改進(jìn)支持向量機(jī)的海上油性危化品預(yù)警流程
基于改進(jìn)的支持向量機(jī)模型,本文構(gòu)建海上油性危化品預(yù)警流程如圖1所示。
進(jìn)行優(yōu)化。第四,通過測試樣本集合,對參數(shù)優(yōu)化后的AdaBoost-SVM模型進(jìn)行評價(jià)。最后,將該模型用于海上油性危化品的預(yù)警[3]
1 實(shí)證檢驗(yàn)
本文收集某海上石油?;繁O(jiān)測與預(yù)警數(shù)據(jù)集,共76萬條數(shù)據(jù),其中包括7372條報(bào)警數(shù)據(jù),占比為0.97% ,樣本比例嚴(yán)重失衡。為處理不平衡樣本,采用SMOTE算法進(jìn)行處理。通過SMOTE,可以有效生成新的少數(shù)類樣本,平衡兩類樣本的數(shù)量,從而改善模型的分類性能,主要步驟如下:
(1)從少數(shù)類樣本集中隨機(jī)選取一個(gè)樣本 xi ,使用歐氏距離)計(jì)算它與其他少數(shù)類樣本的距離,得到xi 的 k 個(gè)最近鄰。
(2)從 的k個(gè)最近鄰中隨機(jī)選取一個(gè)樣本 xnn 然后在x和 |xnn 之間生成一個(gè)新的合成樣本。
(3)使用以下公式生成新樣本,該樣本位于 ??x 和xnn 之間。
xnew=x+δ?(xnn-x)
式中, δ 為隨機(jī)數(shù),取值范圍在[0,1]之間。
(4)重復(fù)上述步驟,直到少數(shù)類樣本達(dá)到與多數(shù)類樣本相對平衡的數(shù)量。
采用SMOTE平衡樣本以后,在訓(xùn)練集上,采用
如圖1所示,第一,對海上?;废嚓P(guān)數(shù)據(jù)進(jìn)行搜集。第二,在處理不平衡數(shù)據(jù)基礎(chǔ)上,將樣本拆分為訓(xùn)練樣本集合以及測試樣本集合。第三,在訓(xùn)練樣本集合上,對AdaBoost-SVM模型的參數(shù)采用遺傳算法
遺傳算法得到AdaBoost-SVM模型的最優(yōu)參數(shù)。其中遺傳算法的種群大小設(shè)為50,以確保有足夠的解空間進(jìn)行搜索;最大迭代次數(shù)為100,保證算法有足夠的迭代次數(shù)來收斂到最優(yōu)解;選擇率為0.4,通過
保留優(yōu)秀個(gè)體加速收斂;交叉率設(shè)置為0.8,以較高的重組概率增加解的多樣性;變異率為0.05,通過適當(dāng)?shù)碾S機(jī)擾動(dòng)防止算法陷入局部最優(yōu),得到算法收斂圖,如圖2所示。
通過遺傳算法,得到AdaBoost-SVM模型的主要參數(shù)如表1所示。
基于表1的各項(xiàng)參數(shù),建立AdaBoost-SVM模型,并在測試集上進(jìn)行預(yù)測,同時(shí),將AdaBoost-SVM與其他模型進(jìn)行對比,得到表2。
如表2所示,總體而言,AdaBoost-SVM在各個(gè)指標(biāo)上都表現(xiàn)出了明顯的優(yōu)勢,尤其在準(zhǔn)確率、精確率、召回率和真負(fù)率上提升較為顯著,相較于其他模型展現(xiàn)出更強(qiáng)的預(yù)警能力。
5 結(jié)束語
本文對支持向量機(jī)模型進(jìn)行改進(jìn),采用加權(quán)方式聯(lián)合不同核函數(shù),并且采用AdaBoost算法改進(jìn)其預(yù)測效果。與普通SVM相比,AdaBoost-SVM在各項(xiàng)指標(biāo)上均有顯著提升,準(zhǔn)確率提高了約 14.6% ,精確率提升了 14.6% ,召回率和真負(fù)率分別提高了 10.7% 和 15% .AUC值也提升了 14.4% 。
參考文獻(xiàn)
[1]張廣毓.?;愤\(yùn)輸中的安全與事故防范探究[J].石油石化物資采購,2023,1(20):137-139.
[2]黃守斌.關(guān)于?;分卮笪kU(xiǎn)源漏判的辨識和探討[J].內(nèi)蒙古石油化工,2024,50(1):43-48.
[3]孫振民.石油化工企業(yè)加強(qiáng)?;钒踩芾淼牟呗匝芯縖J].石化技術(shù),2022,29(10):169-171.