◆吳丁杰 溫立書
基于獅群算法優(yōu)化的KELM及分類診斷
◆吳丁杰1溫立書2通訊作者
(1.沈陽航空航天大學航空發(fā)動機學院 遼寧 110136;2.沈陽航空航天大學理學院 遼寧 110136)
獅群算法;核極限學習機;優(yōu)化;分類診斷
極限學習機是一種求解單隱含層前饋神經(jīng)網(wǎng)絡(Single-hidden Layer Feedforward Neural Network,SLFN)[1-2]的方法,與傳統(tǒng)的BP、RBF神經(jīng)網(wǎng)絡相比較,具有訓練參數(shù)少、訓練速度快、預測精度高、適應性好等優(yōu)點[3]。Huang[4]等人將最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)中的核函數(shù)加入到極限學習機,提出核極限學習機算法(Kernel Extreme Learning Machine,KELM),進一步增強了模型的適應性和穩(wěn)定性。
其中:
成年獅的數(shù)量:
更新自己的位置。母獅則通過與另外一只母獅協(xié)作捕食,通過:
更新自己的位置。幼獅通過:
LSO-KELM分類算法流程如下:
Step1:建立分類數(shù)據(jù)庫,將其分為訓練集和測試集并進行歸一化。
Step2:將訓練集作為KELM的輸入向量,對KELM進行訓練。
Step4:是否滿足終止條件,若滿足則退出循環(huán),輸出尋優(yōu)結(jié)果;否則,重復Step4。
Step5:將測試集輸入優(yōu)化后的KELM中,輸出分類結(jié)果。
數(shù)據(jù)集來源于機器學習中的典型分類問題,乳腺良惡性腫瘤的分類診斷。數(shù)據(jù)集相關(guān)變量如表1所示。
表1 乳腺腫瘤數(shù)據(jù)集相關(guān)變量
變量名稱相關(guān)解釋 Clump Thickness腫瘤厚度 Uniformity of Cell Size細胞大小均勻性 Uniformity of Cell Shape細胞形狀均勻性 Marginal Adhesion邊緣粘附力 Single Epithelial Cell Size單上皮細胞大小 Bare Nuclei裸核 Bland Chromatin染色質(zhì)的顏色 Normal Nucleoli核仁正常情況 Mitoses有絲分裂情況 Class分類情況,良性為1,惡性為2
通過表1中決定乳腺腫瘤的9個相關(guān)變量,可以實現(xiàn)對數(shù)據(jù)集中良惡性腫瘤的分類。
選擇500組樣本數(shù)據(jù)來驗證LSO-KELM算法的分類效果,并進行數(shù)據(jù)的歸一化處理。其中訓練集為400組,測試集為100組,運行軟件為MATLAB R2018a。將400組訓練集分別輸入到LSO-KELM和KELM中,LSO迭代曲線如圖2所示,測試集診斷結(jié)果如圖3所示,診斷正確率如表2所示。
圖1 LSO迭代曲線
由圖2可以看出,隨著LSO的不斷迭代,適應度值明顯下降,即訓練集和測試集的誤差逐漸減小,驗證了LSO對KELM分類的優(yōu)化能力。
圖2 LSO-KELM與KELM測試集分類結(jié)果
表2 LSO-KELM與KELM測試集診斷結(jié)果
測試集樣本個數(shù):100良性乳腺腫瘤個數(shù):65惡性腫瘤個數(shù):35 LSO-KELM診斷結(jié)果確診:59;誤診:6確診:30;誤診:5 診斷正確率:90.7692%診斷正確率:85.7143% 總體診斷正確率:89% KELM診斷結(jié)果確診:59;誤診:6確診:18;誤診:17 診斷正確率:90.7692%診斷正確率:51.4286% 總體診斷正確率:77%
由2可以看出,在測試集樣本數(shù)為100時,LSO-KELM的總體診斷正確率達到了89%,相較于KELM的77%提高了12%;在另一方面,KELM的惡性腫瘤診斷正確率僅為51.4286%,正確率很低,在LSO-KELM中,惡性腫瘤診斷正確率提高到了85.7143%。綜上所述,經(jīng)過LSO的優(yōu)化后,LSO-KELM的分類正確率相較于原始KELM有了一定程度的提高,證實了LSO對KELM的優(yōu)化作用。
(1)基于LSO尋優(yōu)精度高、收斂速度快的特點,通過LSO對KELM的參數(shù)進行優(yōu)化,運行結(jié)果表明,適應度值隨迭代次數(shù)而降低,從而優(yōu)化了KELM的訓練過程。
(2)以乳腺腫瘤數(shù)據(jù)集為例,設置了訓練集和測試集。測試結(jié)果表明,LSO-KELM的分類正確率優(yōu)于KELM,且LSO-KELM的惡性腫瘤診斷正確率明顯高于KELM。
[1]LIU Peng,LI Zhengtian,ZHOU Yixin,et al.Design of Wind Turbine Dynamic Trip-off Risk Alarming Mechanism for Large-scale Wind Farms[J].IEEE Transactions on Sustainable Energy,2017,8(4):1668-1678.
[2]TANG Jiexiong,DENG Chenwei,HUANG Gguangbin.Extreme Learning Machine for Multilayer Perceptron[J].IEEE Transactions on Neural Networks and Learning Systems,2015,27(4):809-821.
[3]Huang G B,Zhu Q Y,Siew C K.Extreme Learning Machine:a new learning scheme of feedforward neural networks[J].IEEE International Joint Conference on Neural Networks,2004,2:985-990.
[4]Huang G B.An Insight into extreme learning machines:random neurons,random features and kernels[J].Cognitive Computation,2014,6(3):376-390.
[5]劉生建,楊艷,周永權(quán).一種群體智能算法——獅群算法[J].模式識別與人工智能,2018,31(05):431-441.
[6]汪嬋嬋.基于改進獅群算法的汽輪機熱耗率模型預測[J].計量學報,2021,42(07):853-860.
[7]朱丙麗,程波,高曉琴.基于獅群優(yōu)化算法的自適應圖像去噪技術(shù)[J].計算機應用與軟件,2021,38(05):225-230.
[8]張曉通,韓躍平,楊洋.基于遺傳-獅群算法優(yōu)化的獨立分量分析算法[J].計算機應用與軟件,2021,38(02):244-249.
[9]甘福寶,黃友銳,韓濤,等.基于獅群優(yōu)化二維Otsu算法的輸送帶撕裂檢測方法[J].工礦自動化,2019,45(10):55-60+79.
[10]方俊豪,陳正坤,陳保家,等.GAPSO-KELM在滾動軸承故障診斷中的應用[J].機械,2021,48(03):9-16.