摘" 要: 針對海洋的現(xiàn)代化智能觀測需求,提出一種基于模糊SVM算法的海洋觀測數(shù)據(jù)智能處理算法。為了解決海洋多維指標(biāo)數(shù)據(jù)的線性不可分問題,采用模糊隸屬度對訓(xùn)練樣本進(jìn)行模糊映射,并在此基礎(chǔ)上利用拉格朗日模糊偏導(dǎo)數(shù)方法將最優(yōu)化問題轉(zhuǎn)化為二次規(guī)劃問題,從而求解出最佳決策函數(shù)。此外,采用基于樣本鄰近密度的模糊隸屬度函數(shù)構(gòu)造方法,有效降低了異常樣本對決策函數(shù)訓(xùn)練的影響。仿真結(jié)果表明,相比于現(xiàn)有算法,所提算法對海洋觀測數(shù)據(jù)處理的正確率高于95%,且對于多種海洋觀測專業(yè)指標(biāo)均具有良好的適用性。
關(guān)鍵詞: 海洋智能觀測; 模糊SVM算法; 模糊隸屬度; 決策函數(shù); 模糊映射; 二次規(guī)劃
中圖分類號: TN919.5?34" " " " " " " " " " " " " 文獻(xiàn)標(biāo)識碼: A" " " " " " " " " " " "文章編號: 1004?373X(2025)08?0133?06
Design of intelligent processing algorithm for ocean observation data
QI Guangpeng1, 2
(1. School of Physics and Electronic Engineering, Northeast Petroleum University, Daqing 163318, China;
2. Inspur Yunzhou Industrial Internet Co., Ltd., Jinan 250000, China)
Abstract: In order to meet the needs of modern intelligent ocean observation, an intelligent ocean observation data processing algorithm based on fuzzy support vector machines (SVM) algorithm is proposed. In order to solve the linear indivisibility problem of marine multi?dimensional index data, the fuzzy membership degree is used conduct the fuzzy mapping for the training samples. On this basis, the Lagrange fuzzy partial derivative method is used to transform the optimization problem into a quadratic programming problem, so as to solve the optimal decision function. The influence of abnormal samples on the training of decision function is effectively reduced by means of the fuzzy membership function construction based on sample adjacent density. The simulation results show that, in comparison with the existing algorithms, the accuracy of the proposed algorithm for ocean observation data processing is higher than 95%, and it has good applicability for a variety of ocean observation professional indicators.
Keywords: marine intelligent observation; fuzzy SVM algorithm; fuzzy membership degree; decision function; fuzzy mapping; secondary planning
0" 引" 言
海洋數(shù)據(jù)的觀測對于海洋漁業(yè)、海底能源開采等領(lǐng)域均具有重要意義。近年來,針對海洋數(shù)據(jù)的處理技術(shù)得到了廣泛關(guān)注[1?3]。而陸海空天多維一體全方位的海洋觀測平臺與數(shù)據(jù)融合處理系統(tǒng),也為海洋觀測數(shù)據(jù)智能處理技術(shù)的研究提供了基礎(chǔ)支撐[4]。針對海洋數(shù)據(jù)指標(biāo)復(fù)雜的特點(diǎn),文獻(xiàn)[5]提出了一種基于降維特征選擇的方法進(jìn)行數(shù)據(jù)分析。文獻(xiàn)[6]提出利用隨機(jī)森林(Random Forest, RF)法對指標(biāo)進(jìn)行二叉樹訓(xùn)練,然而該方法雖適用于多維指標(biāo),但靈活性較差。文獻(xiàn)[7]提出一種模糊綜合評價(jià)方法(Fuzzy Comprehension Evaluation Method),通過計(jì)算多維指標(biāo)的模糊隸屬度加權(quán),對海洋狀態(tài)進(jìn)行監(jiān)控。雖然上述算法的訓(xùn)練計(jì)算復(fù)雜度較低,但觀測準(zhǔn)確率仍無法滿足要求。為了進(jìn)一步提高觀測準(zhǔn)確率,文獻(xiàn)[8]提出一種基于粒子群優(yōu)化算法(Particle Swarm Optimization, PSO)的數(shù)據(jù)分類方法,其可在一定程度上提高準(zhǔn)確率。類似地,文獻(xiàn)[9?10]提出一種基于SVM(Support Vector Machines)的分類算法對數(shù)據(jù)樣本進(jìn)行分類。而在其他領(lǐng)域,一些SVM改進(jìn)算法也取得了一定的成果[11?12]。文獻(xiàn)[13]基于決策樹?SVM算法進(jìn)行了研究。上述算法雖在一定程度上提高了觀測準(zhǔn)確率,但在面對復(fù)雜線性不可分?jǐn)?shù)據(jù)時(shí),分類準(zhǔn)確率明顯下降。因此,本文則基于模糊SVM(FSVM)算法提出一種海洋觀測數(shù)據(jù)處理方法。
1" 系統(tǒng)模型
為滿足海洋觀測數(shù)據(jù)智能處理的需求,本文使用的智能觀測系統(tǒng)模型由多源觀測模塊與數(shù)據(jù)智能處理模塊兩部分所組成,如圖1所示。
多源觀測模塊通過多種渠道觀測并收集海洋數(shù)據(jù),主要包括天基觀測、航空觀測、?;^測、水下觀測與岸基觀測等,通過全方位的渠道對海洋多指標(biāo)數(shù)據(jù)進(jìn)行觀測。而數(shù)據(jù)智能處理模塊則負(fù)責(zé)對所采集的海洋數(shù)據(jù)進(jìn)行建庫,并實(shí)現(xiàn)綜合處理。同時(shí),對異常情況加以告警并協(xié)調(diào)系統(tǒng)資源進(jìn)行任務(wù)規(guī)劃,從而對其進(jìn)行重點(diǎn)關(guān)注。本文所采用的智能觀測框架綜合考慮了多源觀測所獲得的多維指標(biāo)信息,再進(jìn)行數(shù)據(jù)的融合分析。如圖2所示,海洋數(shù)據(jù)智能處理流程由數(shù)據(jù)融合、數(shù)據(jù)分析、海洋實(shí)況監(jiān)控以及海洋狀態(tài)預(yù)測等組成。其中,在對多源觀測數(shù)據(jù)進(jìn)行數(shù)據(jù)融合分析之后,可實(shí)現(xiàn)對海洋狀態(tài)的實(shí)時(shí)監(jiān)控。同時(shí),為進(jìn)一步提高海洋觀測的準(zhǔn)確率,還基于當(dāng)前數(shù)據(jù)分析結(jié)果進(jìn)行海洋狀態(tài)預(yù)測,并將預(yù)測結(jié)果存入數(shù)據(jù)庫中,根據(jù)實(shí)時(shí)分析結(jié)果進(jìn)行修正。
2" 算法模型
本文對海洋狀況進(jìn)行了狀態(tài)監(jiān)測,首先將問題加以簡化,先不考慮多維指標(biāo)的影響,則可將海洋狀況評估轉(zhuǎn)化為一個(gè)二元分類問題[14?15]。基于此,本文采用SVM算法對海洋狀況進(jìn)行分類。SVM算法通過尋找一個(gè)最優(yōu)超平面,將不同類別的數(shù)據(jù)隔開,并最大化兩類數(shù)據(jù)之間的間隔,從而提高模型的泛化能力。SVM算法的基本架構(gòu)圖如圖3所示。
基于SVM算法的分類模型如圖4所示。
設(shè)[T=x1,y1,x2,y2,…,xl,yl∈x×yl]為樣本訓(xùn)練集合,考慮到指標(biāo)的多維性,使用SVM算法進(jìn)行訓(xùn)練時(shí),需采用非線性模型,則最優(yōu)分類平面A的表達(dá)式為:
式中:[w]表示權(quán)值;[c]表示懲罰因子;[l]表示樣本數(shù)量;訓(xùn)練樣本集合中的參數(shù)[xi∈x]表示訓(xùn)練樣本,[yi∈y],[y∈-1,1]表示訓(xùn)練樣本類別;[b∈R]表示偏移量;[ζi]為松弛變量。[ζi]滿足:
則可以將式(1)轉(zhuǎn)化為:
式中[αi]表示拉格朗日系數(shù),滿足:
式中[l′]表示樣本i鄰近區(qū)域其他類別數(shù)據(jù)的數(shù)量。利用鄰近樣本密度函數(shù)作為樣本的模糊隸屬度,即可進(jìn)行模糊SVM訓(xùn)練。
基于上述改進(jìn)SVM算法的設(shè)計(jì),改進(jìn)后的算法整體架構(gòu)如圖6所示。
SVM算法和模糊算法進(jìn)行融合,形成改進(jìn)SVM算法,提升了對海洋觀測數(shù)據(jù)的處理能力。改進(jìn)后的SVM算法通過引入模糊隸屬度函數(shù),有效降低了異常樣本數(shù)據(jù)對決策函數(shù)的影響,并且增強(qiáng)了模型對高頻噪聲數(shù)據(jù)的抗擾性和魯棒性。同時(shí),在處理多維目標(biāo)數(shù)據(jù)時(shí),改進(jìn)SVM算法還可有效融合不同數(shù)據(jù)指標(biāo),解決了數(shù)據(jù)復(fù)雜性導(dǎo)致的計(jì)算瓶頸問題。改進(jìn)SVM算法的設(shè)計(jì)流程如圖7所示。
由圖7可知,在改進(jìn)SVM算法運(yùn)行過程中,通過優(yōu)化模糊隸屬度函數(shù)的構(gòu)造方法,進(jìn)一步提升了模型的性能。基于樣本鄰近密度的隸屬度函數(shù)構(gòu)造方法更好地反映了樣本數(shù)據(jù)在特征空間中的分布情況,從而提高了模型對負(fù)載數(shù)據(jù)的適應(yīng)性。同時(shí),改進(jìn)SVM算法將最優(yōu)問題轉(zhuǎn)化為二次規(guī)劃問題,進(jìn)一步提高了算法的計(jì)算效率。因此,改進(jìn)SVM算法不僅提高了模型的分類精度,而且在處理多維指標(biāo)數(shù)據(jù)時(shí)具有較好的適應(yīng)性。
4" 仿真驗(yàn)證及數(shù)據(jù)分析
為驗(yàn)證本文所提改進(jìn)SVM算法對海洋觀測數(shù)據(jù)智能處理的有效性,本文對比了現(xiàn)有4種算法與本文算法對于海洋狀態(tài)監(jiān)控的準(zhǔn)確率。同時(shí),針對所監(jiān)控海洋數(shù)據(jù)7個(gè)指標(biāo)的觀測準(zhǔn)確率進(jìn)行分析對比,以此說明本文算法對不同觀測指標(biāo)的適用性。在實(shí)驗(yàn)前,先對數(shù)據(jù)集進(jìn)行準(zhǔn)備,如數(shù)據(jù)來源、數(shù)據(jù)預(yù)處理和數(shù)據(jù)標(biāo)注。
1) 數(shù)據(jù)來源:選擇真實(shí)的海洋觀測數(shù)據(jù)集,其中包括多種海洋觀測指標(biāo),如溫度、鹽度、海流、海浪、潮汐、重力及磁力等。
2) 數(shù)據(jù)預(yù)處理:對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,去除數(shù)據(jù)缺失值和明顯異常值,并選擇數(shù)據(jù)集中的70%作為訓(xùn)練集,剩下的30%作為測試集。
3) 數(shù)據(jù)標(biāo)注:將實(shí)際海洋環(huán)境狀態(tài)分為正常狀態(tài)、異常狀態(tài)和特定狀態(tài),按照此三類狀態(tài)對各類別數(shù)據(jù)進(jìn)行分類標(biāo)注。
實(shí)驗(yàn)的具體參數(shù)如表2所示。
不同算法的海洋狀態(tài)監(jiān)控的準(zhǔn)確率對比結(jié)果如表3所示。從表中可以觀察到:隨機(jī)森林方法和模糊綜合評價(jià)方法對海洋數(shù)據(jù)的誤判率較低,但二者的漏判率均較高,故對于多維指標(biāo)的適用性較弱;LS?SVM與粒子群算法在整體觀測準(zhǔn)確率上有所提高,但漏判率仍在3%以上;而本文算法在漏判率與誤判率上均大幅降低,且整體觀測準(zhǔn)確率均在95%以上,算法性能進(jìn)一步提高,說明其更具實(shí)用性。
而針對所監(jiān)控海洋數(shù)據(jù)中7個(gè)指標(biāo)的觀測準(zhǔn)確率分析對比結(jié)果如表4所示。表中:本文算法對于7個(gè)海洋觀測指標(biāo)的觀測準(zhǔn)確率均在95%以上,說明本文算法對于多種指標(biāo)均具有較優(yōu)的適用性。同時(shí),對于溫度、鹽度等指標(biāo)的觀測準(zhǔn)確率在96%以上,而對重力及磁力等指標(biāo)觀測的準(zhǔn)確率相對較低。這與實(shí)際觀測采集的數(shù)據(jù)準(zhǔn)確性有關(guān),通常數(shù)據(jù)采集準(zhǔn)確性越高,則智能處理分類準(zhǔn)確率也越高。
高效的海洋觀測效率是快速獲取大量海洋數(shù)據(jù)、降低觀測成本、提升資源利用率的基礎(chǔ)。因此本文在觀測準(zhǔn)確率的基礎(chǔ)上,引入觀測效率,對本文所提算法和其他算法進(jìn)行了對比。不同算法的海洋觀測效率的對比情況如圖8所示。
從圖8中可明顯看出,在海洋觀測數(shù)據(jù)處理中,本文提出的基于模糊SVM的智能處理算法隨著迭代次數(shù)的增加,展現(xiàn)出了較高的觀測效率,顯著優(yōu)于其他傳統(tǒng)算法。該結(jié)果表明,模糊SVM算法在處理復(fù)雜海洋觀測數(shù)據(jù)時(shí),能夠快速收斂并找到最優(yōu)解,從而大幅減少計(jì)算時(shí)間,提升了整體的觀測效率。本文算法通過引入模糊隸屬度,有效降低了異常樣本對決策函數(shù)的影響,同時(shí)增強(qiáng)了模型對噪聲數(shù)據(jù)的魯棒性,不僅為多維數(shù)據(jù)的優(yōu)化與處理提供了重要技術(shù)支持,還為海洋資源開發(fā)等實(shí)際應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。
5" 結(jié)" 語
針對海洋狀態(tài)智能觀測的需求,本文提出了一種基于模糊SVM算法的海洋數(shù)據(jù)處理方法。首先,基于SVM算法,通過在訓(xùn)練集合中引入模糊隸屬度,對復(fù)雜、多維且不可分樣本進(jìn)行決策訓(xùn)練;然后,采用拉格朗日偏導(dǎo)數(shù)方法將最優(yōu)化問題轉(zhuǎn)化為二次規(guī)劃問題,以得到最佳決策函數(shù);最后為了去除異常數(shù)據(jù)對模糊SVM算法訓(xùn)練的影響,本文還采用了基于鄰近樣本密度的模糊隸屬度函數(shù)構(gòu)造方法。數(shù)據(jù)測試結(jié)果表明,本文所設(shè)計(jì)算法相對于現(xiàn)有算法的觀測準(zhǔn)確率和效率均得到了進(jìn)一步提高,且更具實(shí)用價(jià)值。后續(xù),將針對海洋狀態(tài)的預(yù)測與修正算法進(jìn)行進(jìn)一步研究。
參考文獻(xiàn)
[1] 熊金蓮,高志剛,胡鵬,等.基于區(qū)塊鏈的海洋觀測數(shù)據(jù)傳輸與共享方案[J].計(jì)算機(jī)應(yīng)用與軟件,2024,41(10):1?7.
[2] 熊金蓮,芮龍.海洋觀測數(shù)據(jù)規(guī)范化整理系統(tǒng)的設(shè)計(jì)[J].信息技術(shù),2024(2):121?127.
[3] 譚哲韜,張斌,吳曉芬,等.海洋觀測數(shù)據(jù)質(zhì)量控制技術(shù)研究現(xiàn)狀及展望[J].中國科學(xué):地球科學(xué),2022,52(3):418?437.
[4] 張由余,韓曉寧.陸??仗煲惑w化海事監(jiān)管指揮系統(tǒng)發(fā)展設(shè)想[J].指揮信息系統(tǒng)與技術(shù),2022,13(6):42?49.
[5] 郭政,趙梅,胡長青.一種有效降維的特征選擇方法及其在水聲目標(biāo)識別中的應(yīng)用[J].聲學(xué)技術(shù),2021,40(1):14?20.
[6] 邱耀煒,沈蔚,惠笑,等.基于WorldView?2數(shù)據(jù)和隨機(jī)森林算法的遙感水深反演[J].遙感信息,2019,34(2):75?79.
[7] 秦麗,劉保占,王茂君.基于模糊綜合評價(jià)方法的海上溢油應(yīng)急能力評估技術(shù)研究[J].海洋環(huán)境科學(xué),2022,41(6):910?914.
[8] 陳佳兵,吳自銀,趙荻能,等.基于粒子群優(yōu)化算法的PSO?BP海底聲學(xué)底質(zhì)分類方法[J].海洋學(xué)報(bào),2017,39(9):51?57.
[9] 張隨艷.基于SVM算法的海洋微生物種群多樣性信息自適應(yīng)分類方法[J].海洋技術(shù)學(xué)報(bào),2024,43(5):36?42.
[10] 紀(jì)雪,唐秋華,陳義蘭,等.聯(lián)合支持向量機(jī)和增強(qiáng)學(xué)習(xí)算法的多波束聲學(xué)底質(zhì)分類[J].測繪學(xué)報(bào),2021,50(7):972?981.
[11] 邵志慧,楊儉,袁天辰,等.基于排列熵和支持向量機(jī)的軌枕病害診斷[J].電子科技,2022,35(2):52?58.
[12] 劉云,李維嘉,趙子豪,等.基于改進(jìn)SVM的電力工程造價(jià)預(yù)測[J].沈陽工業(yè)大學(xué)學(xué)報(bào),2024,46(4):367?372.
[13] 周妍,廖振良,周燦.基于決策樹支持向量機(jī)的地表水水質(zhì)評價(jià)研究[J].環(huán)境科技,2021,34(5):57?61.
[14] 李炳霖,司夢.二元分類問題的最優(yōu)分類線性降維[J].中國電子科學(xué)研究院學(xué)報(bào),2022,17(4):404?410.
[15] 張代俐,汪廷華,朱興淋.基于模糊隸屬度函數(shù)的SVM樣本約簡算法[J].山西大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,47(1):18?29.
作者簡介:齊光鵬(1981—),男,陜西寶雞人,碩士研究生,教授級高級工程師,研究方向?yàn)殡娮有畔⒐こ獭?/p>
收稿日期:2024?11?04" " " " " "修回日期:2024?12?12
基金項(xiàng)目:中華人民共和國科學(xué)技術(shù)部項(xiàng)目(2023YFF0905500)