邢煥革,衛(wèi)一熳,彭義波
(海軍工程大學(xué) 管理工程系,武漢 430033)
基于多尺度最小二乘支持向量機(jī)的艦船備件器材多類分類
邢煥革,衛(wèi)一熳,彭義波
(海軍工程大學(xué) 管理工程系,武漢 430033)
針對(duì)遠(yuǎn)海任務(wù)艦船備件器材的分類管理,通過運(yùn)用支持向量機(jī)理論,充分發(fā)揮多尺度核在非線性分類中的優(yōu)勢(shì),借助最小二乘原理,構(gòu)建了多尺度最小二乘支持向量機(jī)學(xué)習(xí)模型。在實(shí)際運(yùn)用中,通過選用高斯徑向函數(shù)作為多尺度核函數(shù),以訓(xùn)練樣本數(shù)據(jù)分布的離散系數(shù)作為核函數(shù)寬度參數(shù)取值依據(jù),采取ECOC方法建立了多類分類模型,實(shí)例計(jì)算表明,該方法對(duì)遠(yuǎn)海任務(wù)艦船備件器材的分類是有效、可行的。
多尺度;支持向量機(jī);多類分類;艦船備件器材
備件器材保障是海軍艦船執(zhí)行多樣化任務(wù)的基礎(chǔ),對(duì)于執(zhí)行一般性任務(wù)艦船而言,其所攜帶的備件器材都是遵循嚴(yán)格的配置標(biāo)準(zhǔn)。但是,對(duì)于執(zhí)行遠(yuǎn)海任務(wù)艦船而言,由于航行時(shí)間長(zhǎng),艦船設(shè)備又長(zhǎng)期處在高溫、高濕、高鹽、多塵等復(fù)雜惡劣環(huán)境中高強(qiáng)度、超負(fù)荷運(yùn)行,設(shè)備故障率較平時(shí)明顯升高,如果其所攜帶的備件器材還是按照近海任務(wù)艦船標(biāo)準(zhǔn)的規(guī)定來執(zhí)行,則可能影響艦船遠(yuǎn)海任務(wù)的完成,為此,需要加強(qiáng)對(duì)備件器材的配置。而如何對(duì)備件器材進(jìn)行加強(qiáng)配置,目前還沒有準(zhǔn)確的方法可供使用,通常是采用經(jīng)驗(yàn)法來規(guī)劃下一批次遠(yuǎn)海任務(wù)艦船所需要加強(qiáng)配置的備件器材種類和數(shù)量。支持向量機(jī)(support vector machine,SVM)是Cortes等[1]1995年提出的一種機(jī)器學(xué)習(xí)算法,它的基礎(chǔ)是Vapnik創(chuàng)建的統(tǒng)計(jì)學(xué)習(xí)理論[2]。在備件器材保障的應(yīng)用中,任博等[3]人將此理論應(yīng)用于飛機(jī)備件需求預(yù)測(cè),構(gòu)建了飛機(jī)備件智能預(yù)測(cè)模型,預(yù)測(cè)效果可行有效;王宏焰等[4]將此理論應(yīng)用于陸軍裝備維修器材消耗的預(yù)測(cè)中,其預(yù)測(cè)效果與實(shí)際情況基本一致;趙建忠等[5]將該理論應(yīng)用于導(dǎo)彈備件消耗的預(yù)測(cè)中,然后建立了基于熵權(quán)法和自適應(yīng)粒子群優(yōu)化加權(quán)的支持向量機(jī)的導(dǎo)彈備件消耗預(yù)測(cè)模型,實(shí)例結(jié)果表明導(dǎo)彈備件消耗預(yù)測(cè)時(shí)具有較高的精度。本文在上述應(yīng)用方法的基礎(chǔ)上,通過運(yùn)用多尺度最小二乘支持向量機(jī)理論的原理,充分發(fā)揮多尺度核在非線性分類中的優(yōu)勢(shì),將支持向量機(jī)學(xué)習(xí)算法應(yīng)用于遠(yuǎn)海任務(wù)艦船備件器材的分類管理中,構(gòu)建遠(yuǎn)海任務(wù)艦船加強(qiáng)備件器材配置分類模型,以利于對(duì)艦船備件器材進(jìn)行分類管理,并通過實(shí)例來驗(yàn)證該方法的實(shí)用性。
1.1.1 基本思想
其對(duì)應(yīng)的核函數(shù)可表示為:
式中Φ1,Φ2,…,Φm為m個(gè)非線性映射;k1,k2,…,km是其對(duì)應(yīng)的核函數(shù)。通過運(yùn)用多尺度核函數(shù),將原空間的非線性分類問題轉(zhuǎn)化為多個(gè)高維空間的線性分類問題,然后在各自的特征空間中尋優(yōu)。而本文的思想則是將這多個(gè)不同的高維特征空間組成一個(gè)增廣特征空間,運(yùn)用最小二乘方法,求出包含多個(gè)高維空間優(yōu)勢(shì)的最優(yōu)解。
1.1.2 多尺度核函數(shù)的選用
在常用的核函數(shù)中,高斯徑向函數(shù)是典型的可多尺度化的核函數(shù),通過對(duì)高斯徑向函數(shù)寬度參數(shù)σn的不同取值,其多尺度特性得以充分展現(xiàn)。
式中σn為寬度參數(shù)。當(dāng)σn取值較大時(shí),對(duì)樣本數(shù)據(jù)變化比較平滑的區(qū)域進(jìn)行分類時(shí)其優(yōu)勢(shì)效果較為明顯;當(dāng)σn取值較小時(shí),對(duì)樣本數(shù)據(jù)變化比較激烈的區(qū)域進(jìn)行分類時(shí)其優(yōu)勢(shì)效果得到體現(xiàn)。
1.1.3 多尺度核函數(shù)寬度參數(shù)的取值
用來描述數(shù)據(jù)分布離散程度的測(cè)度指標(biāo)主要有方差、標(biāo)準(zhǔn)差、離散系數(shù)等,其中離散系數(shù)可以比較好地反映數(shù)據(jù)分布波動(dòng)大小,離散系數(shù)越大,數(shù)據(jù)的波動(dòng)越大。為此,本文以數(shù)據(jù)分布的離散系數(shù)作為選擇高斯徑向函數(shù)寬度參數(shù)σn的依據(jù)。
1.1.4 多尺度最小二乘支持向量機(jī)算法
多尺度支持向量機(jī)基本原理從定性上可以這樣理解,即先用大尺度核函數(shù)所擬合的決策函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行粗分,實(shí)際上利用大尺度核函數(shù)的優(yōu)勢(shì)對(duì)樣本數(shù)據(jù)變化比較平滑的區(qū)域進(jìn)行分類,然后用小尺度核函數(shù)的優(yōu)勢(shì)對(duì)樣本數(shù)據(jù)變化激烈的區(qū)域進(jìn)行細(xì)分,最終得到比較滿意的分類結(jié)果。
為分析問題簡(jiǎn)單起見,僅考慮兩個(gè)非線性映射Φ1(·)和Φ2(·),則(5)可表示為:
對(duì)于式(5)而言,基于結(jié)構(gòu)風(fēng)險(xiǎn)最小原則可等效求解以下優(yōu)化問題:
根據(jù)目標(biāo)函數(shù)及約束條件,建立Lagrange函數(shù):
式中 λ =[λ1,λ2,…,λn]是 Lagrange乘子。
對(duì)于式(12),由于已運(yùn)用大尺度核函數(shù)k1完成了對(duì)比較平滑的區(qū)域數(shù)據(jù)進(jìn)行分類,亦即ω1、b1、yi[ωT1·Φ1(xi)+b1]是固定項(xiàng),根據(jù)最小二乘原則,則上式最優(yōu)化條件可以轉(zhuǎn)換為如下形式:
將式(13)用矩陣形式可表示如下:
采用簡(jiǎn)潔形式可表示為:
因此,在多維特征空間中構(gòu)造的最優(yōu)決策函數(shù)如下:
對(duì)于多類分類問題,本文采用ECOC方法[10-11]進(jìn)行建模。由于每?jī)深悊栴}需要建立一個(gè)決策函數(shù),每個(gè)決策函數(shù)輸出為+1或-1,對(duì)于S種不同分類問題而言,則需要構(gòu)建L=INT(log2S)個(gè)決策函數(shù)。假設(shè)給定的輸入樣本為xi,依次輸入到L、元素為+1或-1的數(shù)列,將這些數(shù)列按照類別順序逐行排列起來,即可得到一個(gè)S行L列的矩陣A。實(shí)際上,這就是將S種不同分類問題轉(zhuǎn)化為S組長(zhǎng)度為L(zhǎng)的二進(jìn)制編碼,矩陣A的第i行對(duì)應(yīng)是第i類問題的編碼。例如,對(duì)于六種不同分類問題而言,需要構(gòu)建3個(gè)決策函數(shù),其編碼形式如表1所示。
表1 六種不同分類問題的編碼形式
其對(duì)應(yīng)的矩陣形式為:
遠(yuǎn)海任務(wù)艦船攜帶備件器材可分隨艦備件器材、戰(zhàn)攜備件器材以及加強(qiáng)攜帶備件器材,其中隨艦備件器材、戰(zhàn)攜備件器材是根據(jù)既有的標(biāo)準(zhǔn)攜帶,而加強(qiáng)攜帶備件器材由于受到采購(gòu)經(jīng)費(fèi)、艦上存放空間等條件的限制,沒有統(tǒng)一標(biāo)準(zhǔn)。對(duì)于某種設(shè)備是否應(yīng)該加強(qiáng)配置,需要考慮以下方面因素的影響:
2.1.1 重要程度
若設(shè)備重要等級(jí)高,一旦故障,則直接影響到任務(wù)執(zhí)行,該備件器材需要得到加強(qiáng);
2.1.2 可靠性
若設(shè)備的可靠性不高,則容易頻繁出現(xiàn)故障,為此,需要加強(qiáng)該備件器材的配置;
2.1.3 可維修性
若設(shè)備可維修性不高,一旦出現(xiàn)故障,只能進(jìn)行換件維修,為此,需要加強(qiáng)該備件器材的配置;
2.1.4 工作時(shí)間
若設(shè)備連續(xù)工作時(shí)間較長(zhǎng),其故障率可能較高,為此需要加強(qiáng)該備件器材的配置;
2.1.5 經(jīng)濟(jì)性
由于采購(gòu)經(jīng)費(fèi)有限,對(duì)于價(jià)格昂貴的備件器材,則盡可能少地配置。
實(shí)際上,遠(yuǎn)海任務(wù)艦船加強(qiáng)攜帶備件器材配置問題是一種多類分類問題。為此,需要對(duì)遠(yuǎn)海任務(wù)艦船所加強(qiáng)攜帶的備件器材數(shù)量和種類進(jìn)行合理的規(guī)范,通常將所配置的加強(qiáng)備件器材分為4種類型,分別為無需加強(qiáng)、稍許加強(qiáng)(備件器材數(shù)量較少)、一般加強(qiáng)(備件器材數(shù)量一般)和重點(diǎn)加強(qiáng)(備件器材數(shù)量較多)。
通過以上分析,可將遠(yuǎn)海任務(wù)艦船設(shè)備的重要程度、平均故障間隔時(shí)間、平均維修時(shí)間、連續(xù)工作時(shí)間和設(shè)備單價(jià)五種因素作為備件器材配置屬性,其中設(shè)備的重要程度分普通件(1)、重要件(2)、關(guān)鍵件(3)三種,備件器材的等級(jí)類別分為無需加強(qiáng)(1)、稍許加強(qiáng)(2)、一般加強(qiáng)(3)和重點(diǎn)加強(qiáng)(4)四種,其余屬性值根據(jù)設(shè)備的性能參數(shù)和實(shí)際運(yùn)行情況來確定。因此,多尺度最小二乘支持向量機(jī)的輸入學(xué)習(xí)樣本為五維,其經(jīng)驗(yàn)數(shù)據(jù)分類如表2所示:
表2 設(shè)備樣本屬性及分類
根據(jù)多類分類模型,需要對(duì)備件器材等級(jí)類別進(jìn)行編碼。由于有四種情況,其編碼形式如表3所示。
表3 備件器材等級(jí)類型編碼
對(duì)于四種類別的備件器材,需要構(gòu)建2個(gè)多尺度最小二乘乘向量機(jī)的決策函數(shù),將表2中1~10個(gè)樣本作為訓(xùn)練樣本輸入到?jīng)Q策函數(shù)進(jìn)行學(xué)習(xí),然后求出對(duì)應(yīng)的決策函數(shù)。將表2中11~14個(gè)樣本作為測(cè)試樣本,通過計(jì)算,B11屬于重點(diǎn)加強(qiáng)配置,B12屬于一般加強(qiáng)配置,B13屬于無需加強(qiáng)配置,B14屬于重點(diǎn)加強(qiáng)配置,計(jì)算分類結(jié)果與實(shí)際分類完全一致。因此,采用多尺度最小二乘支持向量機(jī)對(duì)備件器材的分類是非常有效的。
本文通過運(yùn)用多尺度最小二乘支持向量機(jī)理論,充分發(fā)揮多尺度核在非線性分類中的優(yōu)勢(shì),將支持向量機(jī)學(xué)習(xí)算法應(yīng)用于遠(yuǎn)海任務(wù)艦船備件器材的分類管理中。在實(shí)際運(yùn)用中,選用高斯徑向函數(shù)作為多尺度核函數(shù),以訓(xùn)練樣本數(shù)據(jù)分布的離散系數(shù)作為核函數(shù)寬度參數(shù)取值依據(jù),采取ECOC方法進(jìn)行多類分類建模,通過實(shí)例計(jì)算,取得了較好的效果。本文的研究成果已在遠(yuǎn)海護(hù)航艦船裝備技術(shù)保障中得到應(yīng)用,但在實(shí)際運(yùn)用中發(fā)現(xiàn),當(dāng)樣本數(shù)據(jù)量較大時(shí)存在著運(yùn)行速度較慢的現(xiàn)象,對(duì)于這一情況將是下一步需要著力解決的問題。
[1]Cortes C,Vapnik V.Support vector networks[J].Machine Learning ,1995(2):131-159.
[2]Vapnik V.Statistical learning theory[M].New York:Wiley press,1998.
[3]任博,張恒斌,蘇暢.基于支持向量機(jī)的飛機(jī)備件需求預(yù)測(cè)[J].火力與指揮控制,2005,30(3):78-80.(Ren B,Zhang H X,Su C.Requirement prediction of aircraft spare parts based on support vector machines[J].Fire Control and Command Control,2005,30(3):78-80.)
[4]王宏焰,高崎,王家鵬.支持向量回歸機(jī)在裝備維修器材消耗預(yù)測(cè)中的應(yīng)用[J].物流技術(shù),2008,27(8):246-250.(WANG H Y,GAO Q,WANG J P.Application of support vector regression in consumption prediction of equipment maintenance materials[J].Logistics Technology,2008,27(8):246-250.)
[5]趙建忠,徐廷學(xué),郭宏超.基于改進(jìn)最小二乘支持向量機(jī)的導(dǎo)彈備件消耗預(yù)測(cè)[J].貴州師范大學(xué)學(xué)報(bào),2012,30(2):95-102.(ZHAO J Z,XU T X,GUO H C.Consumption forecasting of missile spare parts based on improved least squares support vector machine[J].Journal of Guizhou Normal University,2012,30(2):95-102.)
[6]Mehmet Gonen,Ethem Alpagdm.Multiple kernel learning algorithms[J].Machine Learning ,2011(12):2211-2268.
[7]MingQing Hu,YiQiang Chen,James Tin-Yan Kwok.Building sparse multi-kernel SVM classification [J].IEEE Trans on Neural Networks,2009,20(5):927-839.
[8]Soren Sonnenburg,Gunnar Ratsch,Christin Schager.Large scale multiple kernel learning[J].Machine Learning ,2006(7):1531-1565.
[9]Chapell,O,Vapnil,V,Bousquet,O.Choosing multiple parameters for SVM[J].Machine Learning ,2002(46):131-159.
[10]茍博,黃賢武.支持向量機(jī)多類分類方法[J].數(shù)據(jù)采集與處理,2006,21(3):334-339.(GouB,Huang X W.SVM multi-class classification[J].Journal of Data Acquisition &Processing,2006,21(3):334-339.)
[11]Hsu C W,Lin C J.A comparison of methods for multi-class support vector machines[J].IEEE Trans on Neural Networks,2002,13(2):415-425.
Multi-class Classification of Ship Spare Parts Equipment Based on Multi-scale Least Squares Support Vector Machine
XING Huan-ge,WEI Yi-man,PENG Yi-bo
(Department of Management Engineering,Navy University of Engineering,Wuhan 430033,China)
In view of the classification management problems of pelagic task ship spare parts equipment,based on the support vector machines theory,making full use of the advantages of the multi-scale kernel in nonlinear classification,with the aid of the least squares principle,this paper establishes a multi-scale model of least squares support vector machine.In practical application,by selecting Gauss radical function as the multi-scale kernel function,taking the discrete coefficient of the training samples data distribution as the width parameter value reference of kernel function,the multiclass classification model is established by ECOC method.The result indicates that this method is effective and feasible for the classification of pelagic task ship spare parts equipment.
multi-scale;support vector machine;multi-class classification;ship spare parts equipment
U674.7+07
A
1009-3907(2013)12-1528-07
2013-09-18
軍隊(duì)研究生課題(2010JY0684-394)、(2011JY002-422)的資助
邢煥革(1967-),男,湖北武穴人,副教授,博士,主要從事裝備保障指揮,軍事復(fù)雜網(wǎng)絡(luò)系統(tǒng)方面研究。
責(zé)任編輯:
吳旭云
長(zhǎng)春大學(xué)學(xué)報(bào)2013年12期