趙轉(zhuǎn)哲,葉國文,張 宇,劉永明+,張 振,何 康
(1.安徽工程大學(xué) 機械工程學(xué)院,安徽 蕪湖 241000;2.安徽工程大學(xué) 人機自然交互和高效協(xié)同技術(shù)研究中心安徽省新型研發(fā)機構(gòu),安徽 蕪湖 241000;3.宿州學(xué)院 機械與電子工程學(xué)院,安徽 宿州 234000)
在機器學(xué)習(xí)過程中,過少的特征輸入會降低系統(tǒng)學(xué)習(xí)精度,過多則會引起“維數(shù)災(zāi)難”,因此,特征選擇對于機器學(xué)習(xí)的效果影響很大。根據(jù)選擇過程中使用評價函數(shù)不同的物理意義,其方法可分為過濾式(Filter)、封裝式(Wrapper)、混合式(Hybrid)3種。其中過濾式作為一種常用的數(shù)據(jù)預(yù)處理過程,可以對不相關(guān)的噪聲特征進行快速篩選,計算時間成本低;封裝式是基于各種分類器的輸出精度來評價特征子集,分類精度高于過濾式方法,得到的特征子集維數(shù)也較少,但計算成本較高;混合式則結(jié)合了過濾式與封裝式方法各自優(yōu)勢,兼顧分類精度和計算效率[1],因而引起了國內(nèi)外學(xué)者的重視。張潔等[2]提出一種基于遺傳算法和徑向基網(wǎng)絡(luò)進行特征預(yù)選,同時與拉普拉斯評價標(biāo)準(zhǔn)結(jié)合,形成混合式特征選擇算法模型,并將制造車間高度冗余的數(shù)據(jù)特征置于該模型中,結(jié)果表明該模型數(shù)據(jù)壓縮能力與分類性能得到了提高;雷亞國等[3]將基于過濾式的新型距離評估技術(shù)與多個融合遺傳算法的自適應(yīng)神經(jīng)模糊推理系統(tǒng)相結(jié)合,提出一種新型混合故障特征選擇模型,通過軸承故障識別實驗驗證了有效性;CADENAS等[4]提出一種基于模糊隨機森林算法的混合式特征選擇算法,并用于處理模糊高維且低質(zhì)量的數(shù)據(jù)集;LU等[5]針對在DNA微陣列研究領(lǐng)域基因表達數(shù)據(jù)特征尺寸過大的問題,提出一種基于信息增益與改進遺傳算法相結(jié)合的混合式特征選擇方法,實驗結(jié)果表明該方法在提高基因數(shù)據(jù)識別率的同時還具有較高的魯棒性,但算法計算復(fù)雜度與CPU耗時普遍較高;SINGH等[6]提出一種融合特征選擇與特征加權(quán)的混合式特征選擇模型。上述學(xué)者針對各種特征選擇算法,在計算速度與精度方面提出了不同的改進方案,做出了重要貢獻,但在普適性方面仍需進一步研究。
特征選擇本質(zhì)上屬于0-1規(guī)劃的組合優(yōu)化問題,已被證明是NP(non-deterministic polynomial)難題[7],受生物體捕食策略和進化方式啟發(fā)的智能計算算法在解決NP難題中有獨特優(yōu)勢,因此有學(xué)者已嘗試將其應(yīng)用到特征選擇中,如改進的蜻蜓算法[8]、二進制粒子群算法[9]等,取得了不錯的分類效果。
MIRJALILI等[10]通過觀察并模仿蟻獅在幼蟲時期的捕食行為,提出了一種新型群智能仿生算法——蟻獅算法(Ant Lion Optimizer,ALO),由于該算法具有參數(shù)設(shè)置少、尋優(yōu)精度高等特點,被國內(nèi)外學(xué)者應(yīng)用于求解各種優(yōu)化問題[11-12]。
EMARY等[13]在連續(xù)型ALO算法的基礎(chǔ)上首先提出了用于解決離散優(yōu)化問題的二進制ALO算法(Binary ALO,BALO),但該算法在實際使用中存在易陷入局部最優(yōu)、收斂速度慢等缺陷。基于此,本文提出將保護集策略和多種群并行迭代的改進型二進制蟻獅算法,并將該算法結(jié)合混合式特征選擇模型應(yīng)用到UCI(University of California Irvine)標(biāo)準(zhǔn)數(shù)據(jù)集與滾動軸承故障集的特征選擇實驗中,以提高機器學(xué)習(xí)模型的識別精度,同時提升特征約簡能力。
蟻獅的獵捕過程經(jīng)簡化并抽象后,可分為5個階段,即螞蟻的隨機游走、蟻獅的陷阱挖掘、螞蟻落入陷阱、蟻獅捕食螞蟻、陷阱重建[10]。如圖1a所示為蟻獅在土地上挖出大小不一的陷阱。由于蟻獅了解螞蟻的行蹤軌跡,蟻獅在構(gòu)筑陷阱時會確保螞蟻在陷阱附近進行隨機游走。蟻獅幼蟲在挖好陷阱后,便蹲守在陷阱底部等待附近游走的螞蟻落入陷阱,此過程如圖1b所示。
BALO算法將螞蟻與蟻獅個體的各個維度取值限制為0或1,并加入了遺傳算法中的交叉算子,對螞蟻位置進行更新:
X(t+1)=Crossover(Rrs(t),Re(t))。
(1)
式中:X(t+1)表示第t+1代的新螞蟻個體;交叉操作Crossover通過輪盤賭選擇蟻獅Xrs(t)與精英蟻獅Xe(t)位置附近游走獲得兩個二進制解Rrs(t)、Re(t)。該交叉操作在X(t+1)的各個維度的具體實現(xiàn)形式如式(2):
(2)
(3)
(4)
在BALO的標(biāo)準(zhǔn)流程中,由于蟻獅個體對螞蟻個體的替換機制,導(dǎo)致算法在每次迭代末期,將生存能力較差的螞蟻個體直接從群體中剔除,種群規(guī)模的突然縮減不僅使得種群個體的多樣性急劇下降,使得具有搜索潛力的個體丟失,還會因此導(dǎo)致算法全局搜索能力降低、易早熟等缺陷的產(chǎn)生?;诖?,本文提出基于保護集策略與多種群并行迭代的改進型二進制蟻獅算法,記作IBALO(improved BALO)。通過引入種群保護集策略,對尚未表現(xiàn)出潛力的個體進行捕捉與保護,防止在種群迭代中被遺失,可以提高種群的多樣性與抗干擾性;使用多種群并行迭代的特點,可以提高算法的收斂速度,更快速地獲取問題的最佳解決方案。
(1)保護集策略 在BALO中,蟻獅群體屬于強勢群體,螞蟻群體為弱勢群體,模擬算法的迭代過程即是螞蟻被蟻獅捕食取代的過程,在群智能算法中,更多的思想是考慮群體之間的共同進化,如粒子群算法是在鳥群個體之間進行食物信息共享,從而使群體錯落有致、方向明確地前往食物地點;算法的迭代過程可以視作群體之間相互協(xié)作,實現(xiàn)互利共贏的過程,算法中個體無論優(yōu)劣,都會在迭代中被引領(lǐng)而逐步進化,而非由于適應(yīng)度值過低而直接淘汰出局。
因此,本文對螞蟻群體進行部分保護,以免部分具有尋優(yōu)潛力的個體被忽視。在各代種群適應(yīng)度排序結(jié)算完成后,以適應(yīng)度作為一定的權(quán)重,在螞蟻弱勢群體中選拔部分螞蟻個體進入保護集內(nèi)進行暫時保護,且適應(yīng)度優(yōu)良的個體更容易進入保護集,為了引領(lǐng)該集合內(nèi)個體發(fā)揮自身潛能,選取部分擁有特征數(shù)較少的蟻獅個體進入保護集。
(2)多種群并行迭代策略 在求解復(fù)雜優(yōu)化問題時,為了提高算法代碼執(zhí)行效率和精確性,可以對算法進行并行化處理[14]。LAMPINEN等[15]對差分進化算法種群進行多種群并行化處理,各個子種群互相獨立,在相同的代數(shù)間隔下各子群通過相互溝通尋找這些子種群中存在的適應(yīng)度最優(yōu)值,以達到搜索精度要求。本文借鑒其核心思想,對BALO種群分為兩個子種群進行并行執(zhí)行,以提高算法收斂性能。
為了與原算法群體加以區(qū)分,以保護集為初始父本產(chǎn)生的集合稱為次群,原算法種群稱為主群。在接下來的迭代中,次群中的所有個體采取與主群相同的方式產(chǎn)生輪盤賭選蟻獅,并進行隨機游走更新次群中螞蟻群體(為了使次群集合有著良好的進化方向,次群中精英蟻獅仍使用主群中的Xe);主次群迭代完成后,所有個體融合成一個總集合,并進行適應(yīng)度評估。
上述兩種策略在融入算法的過程中互相依賴,相輔相成。在每次算法迭代循環(huán)末期,要求程序?qū)χ?、次種群按適應(yīng)度進行排序劃分,模型如式(5):
mixp=mp+sp=gi+wi。
(5)
式中:mp表示主群集合;sp表示次群集合;mixp表示主、次群構(gòu)成的總集合;gi表示mixp排名靠前的個體集合;wi表示mixp排名劣勢的個體集合,且下一代以gi為父本產(chǎn)生mp;對保護集策略中提到的排序與篩選方法模型如式(6)~式(9):
rankc=sort(fc(gi));
(6)
rankv=sort(rmat·fv(wi));
(7)
(savev,savec)=extract(rankv,rankc);
(8)
save=savev+savec。
(9)
其中:rankc、rankv分別表示按特征數(shù)個數(shù)與擁有適應(yīng)度值大小排名后的個體集合;fc()為統(tǒng)計特征個數(shù)的算子;fv()為統(tǒng)計適應(yīng)度值的算子;sort()為按參數(shù)的適應(yīng)度排序的算子;rmat為一個包含0~1之間隨機數(shù)的矩陣,隨機數(shù)個數(shù)與fv(rpt)包含值的個數(shù)保持一致;extract()為提取前20%占優(yōu)個體的算子,將savec與savev儲存到表示保護集的save變量中,并作為下一代sp的產(chǎn)生依據(jù)。
IBALO的實現(xiàn)步驟如下:
(1)IBALO初始化參數(shù)。種群維度、規(guī)模,最大迭代次數(shù)等。
(2)種群初始化。由于IBALO針對二進制0-1組合優(yōu)化,故在僅含有0,1的邊界集合中隨機選取并對蟻獅、螞蟻進行種群初始化。
(3)計算適應(yīng)度值并排序。計算各個蟻獅的適應(yīng)度并排序,記錄全局最優(yōu)蟻獅Xe。
(4)對各個螞蟻進行位置更新(主群迭代開始)。分別使用輪盤賭法選擇蟻獅Xrs和精英蟻獅Xe,并在其周圍使用變異操作進行隨機游走,得出Rrs、Re。
(5)對Rrs、Re使用交叉操作更新螞蟻的位置,計算更新后螞蟻適應(yīng)度,并與原有蟻獅進行合并得到mp,按適應(yīng)度進行排序。
(6)若當(dāng)前迭代次數(shù)t=1,轉(zhuǎn)步驟(7),且此時次群視為空集;若t>1且不大于T,進入次群迭代:以save中的個體為父本,對次群螞蟻進行同步驟(4)和步驟(5)的位置更新操作,為了使sp有良好的進化方向,精英蟻獅仍使用Xe,把得到的螞蟻群體與來自上代的save進行合并產(chǎn)生本代sp集合,次群創(chuàng)建完成后轉(zhuǎn)步驟(6)。
(7)將mp與sp合并得到mixp并按適應(yīng)度排序,由式(5)得到gi與wi,從gi中提取一定的種群保護百分比p個特征最少的個體為savec,提取wi中按適應(yīng)度權(quán)重隨機選擇相同百分比的p個適應(yīng)度最好個體為savev,二者組合為保護集save。
(8)提取mixp中最優(yōu)個體與Xe進行比較,若優(yōu)于Xe,則Xe以最優(yōu)個體進行替換。判斷是否超過最大迭代次數(shù)T,若超過則算法結(jié)束,反之則轉(zhuǎn)步驟(4)循環(huán)執(zhí)行。
綜上所述,得到IBALO流程圖,如圖2所示。
為驗證改進后的二進制蟻獅算法的性能,將典型整數(shù)規(guī)劃問題的0-1背包問題[16]用于對IBALO算法的測試,該問題模型如式(10):
(10)
s.t.
xi∈{0,1},i=1,2,…,D。
其中:D為物品的總數(shù),設(shè)為20;xi為旅行者選擇第i種商品,且對應(yīng)重量為wi、價值為qi;具體設(shè)W={wi}={92,4,43,83,84,68,92,82,6,44,32,18,56,83,25,96,70,48,14,58};Q={qi}={44,46,90,72,91,40,75,35,8,54,78,40,77,15,61,17,75,29,75,63};V表示最大承重,V=878。
實驗中,用標(biāo)準(zhǔn)BALO算法進行對比,設(shè)種群規(guī)模A=300,最大迭代次數(shù)設(shè)T=300,種群保護百分比p=20%且各算法獨立運行30次,平均迭代曲線如圖3所示,統(tǒng)計結(jié)果如表1所示。
表1 優(yōu)化結(jié)果比較
由圖3可以看出,IBALO在整個收斂過程中適應(yīng)度值皆優(yōu)于傳統(tǒng)BALO,這表明改進算法尋優(yōu)精度較高;由表1可知,兩算法最優(yōu)值皆能達到文獻[16]所述的理論最優(yōu)值1 024,但改進算法不但所需迭代步數(shù)較少,算法收斂速度較快,而且方差較小,算法穩(wěn)定性較高。綜上所述,改進算法IBALO在提升收斂精度的同時,收斂速度與算法穩(wěn)定性也有較為明顯的提升。
為了更有效地對特征數(shù)據(jù)冗余進行篩選,本節(jié)提出一種基于IBALO的Hybrid式特征選擇算法模型。在Filter式特征選擇中,使用最大相關(guān)最小冗余理論[17](Minimal Redundancy Maximal Relevance,MRMR)對特征子集進行預(yù)選;在Wrapper式特征選擇中,IBALO被用于進一步減少特征冗余以選擇最優(yōu)的特征子集。上述混合式特征選擇算法的流程如圖4所示。
(1)基于MRMR的Filter式特征選擇步驟
為增加提取特征有效性,該階段使用基于互信息理論的MRMR準(zhǔn)則,以分類器精度最優(yōu)構(gòu)造評價函數(shù),實現(xiàn)Filter特征篩選。具體步驟如下:
步驟1設(shè)原始特征集為S且包含特征個數(shù)為u個,使用MRMR準(zhǔn)則構(gòu)造出特征排序集合Sq,并記qz為排序序號為z的特征值:
Sq={q1,q2,…,qu}。
(11)
步驟2將特征排序集合Sq的子集i記作Sqi,對Sq以每次遞增一個特征的形式構(gòu)造特征子集Sqi并輸送到分類器中(本文選取5-近鄰分類器)計算其分類精度,如式(11):
(11)
步驟3以分類結(jié)果繪制分類精度曲線,設(shè)置橫坐標(biāo)為特征數(shù),縱坐標(biāo)為分類精度。記錄曲線達到最高點時對應(yīng)的特征數(shù),并以此為依據(jù)舍棄其他無關(guān)特征,進而得到過濾除雜后的特征子集Sf。
(2)基于IBALO的Wrapper式特征選擇步驟
在這一階段,為了進一步降低特征冗余,將Sf作為Wrapper型特征選擇的輸入,并在該過程中融入IBALO,以分類器分類精度作為IBALO的適應(yīng)度評價標(biāo)準(zhǔn),以算法迭代結(jié)果確定最終的最優(yōu)子集,實現(xiàn)Wrapper式特征選擇。具體步驟如下:
步驟1對IBALO進行適應(yīng)度函數(shù)構(gòu)建。將特征子集Sf與分類器進行連接并置于適應(yīng)度函數(shù)內(nèi)。
步驟2IBALO的參數(shù)初始化、種群初始化等,鑒于特征選擇屬于0-1組合優(yōu)化問題,故種群初始化每個個體含有一組0-1字符串,0代表舍棄該特征,1表示選擇該特征。
步驟3對IBALO進行算法迭代,當(dāng)達到最大迭代次數(shù)時,算法停止尋優(yōu),并給出適應(yīng)度最優(yōu)的特征組合。
上述兩個階段組成的混合式特征選擇算法模型記為MRIBALO。
本實驗從UCI數(shù)據(jù)庫[18]中提取了6個不同特征數(shù)數(shù)據(jù)集對上述模型性能進行測試,其中數(shù)據(jù)集的特征數(shù)最低為21,最高為60,具體信息如表2所示。另外,本實驗隨機抽取總樣本的3/4作為訓(xùn)練樣本,剩余1/4作為測試樣本。
表2 測試用UCI數(shù)據(jù)集詳情表
以平均識別率最大為目標(biāo)構(gòu)建適應(yīng)度函數(shù),其中TRi表示某數(shù)據(jù)集中第i類數(shù)據(jù)的識別率,c表示該數(shù)據(jù)集所含類別的個數(shù):
(12)
為突出MRIBALO的優(yōu)勢,本文結(jié)合基于MRMR準(zhǔn)則的Filter式的特征選擇算法(MRMR Feature Selection,MRFS)與基于傳統(tǒng)的BALO混合式特征選擇算法(記為MRBALO)進行對比實驗,參數(shù)設(shè)置如下:設(shè)種群規(guī)模A=30、最大迭代次數(shù)T=50。為避免偶然性誤差,各算法在每個數(shù)據(jù)集上需要獨立運行20次,實驗對比結(jié)果如表2所示。
如圖5所示為各個數(shù)據(jù)集通過Filter式特征選擇方法——MRMR準(zhǔn)則得到的序列特征子集數(shù)的識別率曲線??梢钥闯?,算法識別率未必隨著特征數(shù)的增多而增大,這說明在原始特征集中含有影響分類精度的冗余特征,各個曲線最佳特征集的提取與曲線峰值記錄在如表3所示的MRFS算法對應(yīng)欄中。
表3 不同算法實驗結(jié)果對比
如圖6所示為使用基于MRBALO與MRIBALO的Wrapper式特征選擇算法在6種測試集上的收斂曲線對比??梢悦黠@看出,經(jīng)過改進后的MRIBALO擁有更高的收斂速度、識別精度與魯棒性。
由表3可知:
(1)從識別正確率的角度看,基于混合式特征選擇的MRBALO與MRIBALO得出的最優(yōu)識別率整體高于MRFS算法,雖然在WDBC這個數(shù)據(jù)集中,與基于新型模糊粗糙集(New Fuzzy Rough Sets, NFRS)的約簡方法效果近似,但在Sonar數(shù)據(jù)集中,其識別率最高僅為95.78%,低于MRBALO與MRIBALO模型,這印證了基于蟻獅優(yōu)化算法的混合式特征選擇模型的有效性。其中,MRFS、MRBALO和MRIBALO三個模型相比,MRIBALO的整體識別率表現(xiàn)最好,提升幅度分別為14.52%、16.67%、0.42%、2.98%、0.92%、1.04%。
(2)從特征約簡維數(shù)的角度看,基于蟻獅優(yōu)化算法的二次尋優(yōu)大幅度減少了特征維數(shù),相較于MRFS的約簡得到的特征數(shù),MRIBALO模型的特征縮減比例分別為65.71%、77.27%、28.57%、53.85%、63.63%、56.00%。相較于MRBALO,基于改進二進制算法的MRIBALO模型在Sonar、Lungcancer、Waveform40這3個數(shù)據(jù)集中特征縮減比例分別25%、37.5%、30.77%,其中,NFRS模型雖然在WDBC數(shù)據(jù)集中約簡維數(shù)平均值小于MRIBALO模型,但實質(zhì)上差別不大;在Sonar數(shù)據(jù)中,MRIBALO模型約簡能力更強,與NFRS模型相比,縮減比例為39.08%。以上數(shù)據(jù)表明了本文提出的特征選擇MRIBALO模型在提升識別率與約簡特征維數(shù)方面的有效性。
本章采用來自美國凱斯西儲大學(xué)滾動軸承故障模擬平臺驅(qū)動端的故障數(shù)據(jù)[20],實驗采用電火花技術(shù)對軸承的不同部位造成不同尺寸大小的損傷以對滾動軸承的早期故障進行模擬,并使用加速度振動傳感器對軸承振動信號進行采集,采樣頻率為12 kHz,選取軸承損傷分別位于滾子、外圈、內(nèi)圈與正常軸承共4類振動信號數(shù)據(jù)構(gòu)成故障特征原始數(shù)據(jù)集,其時域波形如圖7所示。另外,設(shè)各組數(shù)據(jù)對原始數(shù)據(jù)的采樣點數(shù)均為2 048。
對滾動軸承振動信號的故障診斷,已有很多信號處理方法提取的特征被證明有效,如時域、頻域、以及時—頻域特征等。但是單純以某類特征作為性能評判指標(biāo)不能全面地反映滾動軸承的退化信息[21-22]?;诖?,本文選用57個特征構(gòu)建混合特征集,其中包括峰值、方根幅值、方差、標(biāo)準(zhǔn)差、偏度、峭度、絕對均值作為時域特征;重心頻率、均方頻率、頻率方差作為頻域特征;時—頻域特征提取方面,考慮到提取軸承特征信息的有效性,對軸承故障信號分別取前30個奇異值特征,記為[λ1,λ2,…,λ30];三層小波包分解的8個頻帶能量特征,記為[E30,E31,…,E37];基于局部均值分解(Local Mean Decomposition,LMD)得到的前3個PF(product funtion)分量的符號熵特征,記為[PF1,PF2,PF3];基于變分模態(tài)分解(Variational Mode Decomposition,VMD)得到的前6個IMF(intrinsic mode function)分量的符號熵特征,記為[IMF1,IMF2,…,IMF6],上述特征構(gòu)成的混合特征集具體參數(shù)如表4所示。
表4 特征集特征名稱與序號
對混合特征集分別使用MRFS,MRBALO以及MRIBALO對上述軸承故障數(shù)據(jù)集進行故障診斷。公平起見,算法初始參數(shù)均設(shè)為:A=50、T=50,實驗采用5-近鄰分類器對特征進行故障識別,考慮到偶然性因素,MRBALO與MRIBALO算法的Wrapper過程各個獨立求解20次。對4類軸承樣本每個樣本各取50組,且訓(xùn)練集與測試集之比為4∶1。
特征選擇要求特征子集經(jīng)過分類算法后得出的識別率好,且特征子集維數(shù)較少,即最大化識別率和最小化特征子集大小。考慮多目標(biāo)優(yōu)化的適應(yīng)度函數(shù)可以用權(quán)重法轉(zhuǎn)化為單目標(biāo)求解,設(shè)置適應(yīng)度函數(shù)如式(14):
(14)
式中:γR為所有類別分類正確率均值;N為總數(shù)據(jù)集中特征數(shù);L為實驗得出最優(yōu)特征子集包含的特征數(shù);α、η分別表示等式右邊兩項的權(quán)重,依據(jù)文獻[13]對α、η的設(shè)置推薦值,設(shè)α=0.99、η=0.01。
如圖8所示為MRFS算法對混合特征集的初步篩選階段中序列特征子集的識別率曲線,說明了不同容量的特征子集輸入到分類器中表現(xiàn)出各自不同的識別率。當(dāng)以總序列特征的前18個特征作為分類器輸入的預(yù)選特征子集時,識別率達到78.64%的峰值,其對應(yīng)特征與排序分別為:方根幅值、頻率方差、E36、λ27、λ24、PF1、λ25、PF2、λ26、PF3、λ29、λ23、E37、IMF1、IMF6、λ22、重心頻率、λ11。對應(yīng)特征序號如表5所示,MRFS對軸承各狀態(tài)的識別率如表6所示。
表5 預(yù)選特征子集的特征序號
表6 MRFS對軸承4種狀態(tài)的識別率 %
由于Filter式的MRFS算法是與MRBALO、MRIBALO共有的特征選擇流程,該特征子集Sf亦作為MRBALO與MRIBALO在Wrapper特征選擇中的共同輸入。如圖9所示為MRBALO與MRIBALO在Wrapper特征選擇過程中經(jīng)20次獨立求解的平均識別率γR與特征數(shù)N隨迭代步數(shù)變化的曲線??梢钥闯?,在在迭代過程中,除個別點外,MRIBALO平均識別率整體上高于MRBALO,且平均特征數(shù)小于MRBALO,說明本文提出的MRIBALO特征選擇算法既提升了識別率,在特征約簡方面也有所成效。
為了更直觀地對算法性能作出比較,表7列出了本文算法MRIBALO和MRBALO算法識別率與特征維數(shù)的具體數(shù)據(jù),包含平均識別率最高的最優(yōu)組與20次實驗各組的識別率均值與特征維數(shù)均值。結(jié)合表6可以看出,由MRFS得到的正常狀態(tài)與內(nèi)圈故障識別率分別為56.24%、69.11%,特征子集維數(shù)為18;而表7中基于ALO的混合式特征選擇算法對故障的識別率均超過80%,特征子集維數(shù)小于13。由此看出,基于ALO的混合式特征選擇算法有效地對軸承故障分類精度及特征維數(shù)進行了優(yōu)化,其中以MRIBALO表現(xiàn)最優(yōu),最優(yōu)組識別率相較于MRBALO提升了3.64%,最優(yōu)組特征約簡比例為18.18%;平均識別率相較于MRFS與MRBALO分別提升了15.67%、5.15%,平均特征約簡比例分別為45.94%、25.03%,證明了MRIBALO特征選擇模型在提升滾動軸承故障的識別率與縮減故障特征維數(shù)方面的優(yōu)越性。
表7 識別率(%)與特征子集維數(shù)對比
本文針對傳統(tǒng)二進制蟻獅算法在離散空間內(nèi)對最優(yōu)特征子集的尋優(yōu)能力不足的缺點,提出一種基于種群保護集和多種群策略的二進制改進算法,并將該算法融入混合式特征選擇算法中,實現(xiàn)了滾動軸承故障集的特征優(yōu)化選擇,主要結(jié)論如下:
(1)將本文提出的改進二進制蟻獅算法IBALO與MRMR結(jié)合形成一種新型混合式特征選擇算法模型MRIBALO,并在UCI標(biāo)準(zhǔn)測試數(shù)據(jù)集與滾動軸承故障數(shù)據(jù)集上分別應(yīng)用該模型,結(jié)果表明,MRIBALO模型的識別精度與特征約簡能力明顯優(yōu)于MRFS與MRBALO。
(2)本文提出的MRIBALO特征選擇模型質(zhì)量優(yōu)越的原因在于:IBALO中引入了種群保護集策略與并行迭代策略,使螞蟻群體中具有尋優(yōu)潛力的個體有機會進入保護集內(nèi),維持種群多樣性,提升算法的收斂速度和全局收斂性能。
本文通過仿真模型測試了改進的二進制蟻獅算法IBALO算法性能,下一步需要采用馬爾科夫模型、鞅理論等數(shù)學(xué)方法對蟻獅算法以及改進蟻獅算法進行理論推導(dǎo),全面研究算法的收斂性能。