李國友, 楊夢琪, 杭丙鵬, 李晨光, 王維江
(燕山大學(xué) 智能控制系統(tǒng)與智能裝備教育部工程研究中心,河北 秦皇島 066004)
化工過程的動態(tài)工業(yè)生產(chǎn)過程常具有較強的非線性、時變性等特性,其工藝過程復(fù)雜、生產(chǎn)危險性大,不同的化學(xué)原料或產(chǎn)品會導(dǎo)致化工過程具有較大差別?;み^程各個單元相互影響,一處發(fā)生故障將引起一系列的鏈?zhǔn)椒磻?yīng)[1],影響整個化工過程的運行甚至引發(fā)重大事故,因此對化工過程故障的監(jiān)測與診斷尤為重要。
隨著動態(tài)系統(tǒng)故障診斷復(fù)雜程度的逐步提升,基于數(shù)據(jù)驅(qū)動的故障診斷發(fā)展愈加迅速[2]。傳統(tǒng)的故障定性分析已無法滿足生產(chǎn)實際中的要求,而基于解析模型的故障診斷亦不適用于復(fù)雜系統(tǒng)故障模型的建立,利用數(shù)據(jù)驅(qū)動進行故障診斷的優(yōu)勢顯而易見。機器學(xué)習(xí)作為人工智能領(lǐng)域數(shù)據(jù)驅(qū)動的一個重要分支,可以通過模型對故障歷史數(shù)據(jù)進行訓(xùn)練,從而對運行得到的過程數(shù)據(jù)進行診斷。文獻[3]最早將神經(jīng)網(wǎng)絡(luò)用于化工過程故障診斷,提出了利用神經(jīng)網(wǎng)絡(luò)對工業(yè)的氯化氫汽提塔進行故障診斷。針對BP神經(jīng)網(wǎng)絡(luò)收斂速度慢、易陷入局部最優(yōu)的問題,文獻[4]通過遺傳算法對神經(jīng)網(wǎng)絡(luò)的初始權(quán)值及閾值進行優(yōu)化,應(yīng)用于化工發(fā)酵過程故障診斷。由于一些系統(tǒng)無法獲取大量樣本數(shù)據(jù)以供神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,文獻[5]提出了一種適用于小樣本的機器學(xué)習(xí)故障分類方法,利用支持向量機(support vector machine, SVM)對油泵進行故障診斷。由于支持向量機參數(shù)的選取對故障診斷模型性能影響較大,文獻[6]提出了利用粒子群算法優(yōu)化的支持向量機對大型煉油廠催化裂化裝置中反應(yīng)-再生系統(tǒng)故障診斷,通過元啟發(fā)式算法對SVM參數(shù)進行優(yōu)化,提高故障診斷的準(zhǔn)確率。
Emary等[7]在2016年提出的一種新型元啟發(fā)式算法——鯨魚優(yōu)化算法(whale optimization algorithm, WOA),可以更加高效穩(wěn)定地對全局進行優(yōu)化。文獻[8]利用WOA算法優(yōu)化雙向循環(huán)神經(jīng)網(wǎng)絡(luò),將其用于非平衡大數(shù)據(jù)分類,取得了很好的優(yōu)化效果。
針對故障數(shù)據(jù)中冗余信息過多影響故障診斷速度的問題,文獻[9]提出了先利用粗糙集理論進行屬性約簡,再做故障診斷的方法。粗糙集理論近年來在數(shù)據(jù)挖掘方面得到了廣泛的應(yīng)用[10]。粗糙集可以在屬性間的定性關(guān)系未知的情況下,僅通過屬性數(shù)據(jù)對樣本標(biāo)簽的影響就可以對數(shù)據(jù)進行屬性約簡,但其結(jié)構(gòu)化的信息表示也造成了它的局限性[11]。對此,文獻[12]提出模糊粗糙集(fuzzy rough sets, FRS)通過模糊相似關(guān)系對粗糙集進行優(yōu)化,兩者可以很好的互補,使約簡更加準(zhǔn)確。
綜合以上問題,本文構(gòu)建了一個基于模糊粗糙集和鯨魚優(yōu)化算法的支持向量機(FRS-WOA-SVM)故障數(shù)據(jù)分類模型來對化工系統(tǒng)進行故障診斷。先利用FRS約簡掉冗余屬性,進行故障特征選擇,縮短診斷時間;再通過WOA優(yōu)化的SVM故障分類模型進行故障分類,提高故障診斷的準(zhǔn)確率及效率。
影響故障發(fā)生的因素復(fù)雜,故障樣本數(shù)據(jù)屬性數(shù)量眾多,樣本維數(shù)較大,導(dǎo)致數(shù)據(jù)處理時間長,不利于故障分類。由于故障數(shù)據(jù)中存在大量的相似屬性,而這些相似屬性對故障分類的結(jié)果影響近似,差別微乎其微,可以通過故障屬性約簡,即一個主要屬性代替與之近似的屬性來進行后續(xù)數(shù)據(jù)分類[13]。利用FRS算法對故障數(shù)據(jù)約簡,對故障數(shù)據(jù)進行故障特征選擇,通過進行故障特征選擇,得出數(shù)據(jù)的最小故障特征屬性集合[14],可以提升后續(xù)故障診斷的速度。
對于含糊不完備信息,粗糙集可以僅通過樣本數(shù)據(jù),不需要任何數(shù)據(jù)集外的預(yù)備先驗信息就可以對邊界線區(qū)域的數(shù)據(jù)進行描述。通過粗糙集進行屬性約簡,選擇有效的故障特征,可以降低數(shù)據(jù)維數(shù),減少不必要的條件屬性,進而簡化計算,降低故障診斷模型的復(fù)雜程度。
模糊集和粗糙集都能對數(shù)據(jù)信息的不確定性進行描述,相對于需要憑專家經(jīng)驗主觀決定隸屬度的模糊集,粗糙集對數(shù)據(jù)的描述更具有客觀性和說服力,但同樣,粗糙集本身的結(jié)構(gòu)化也帶來一定的局限性,對含糊的概念描述的過于簡單,缺乏處理不確定原始數(shù)據(jù)的機制?;谀:蕾嚩鹊拇植诩且环N簡單、可信度高的屬性約簡算法,可以將粗糙集與模糊集的優(yōu)點相結(jié)合,通過模糊近似關(guān)系對粗糙集的的上、下近似進行研究[15],采用模糊粗糙集做屬性約簡,來對數(shù)據(jù)集做更準(zhǔn)確的描述。
(1)
上近似隸屬函數(shù)
(2)
構(gòu)建CD決策表,x屬于模糊正域的隸屬度為
μPOSC(D)(x)=supμC(D)(x)
(3)
根據(jù)模糊正域,可以得到?jīng)Q策屬性D對條件屬性C的模糊依賴度
(4)
設(shè)條件屬性α∈C,則屬性α對全部條件屬性C的相對重要程度為
(5)
故障屬性是一種連續(xù)的屬性,由于FRS的條件屬性模糊化,不需要對數(shù)據(jù)做離散化處理,先利用min-max標(biāo)準(zhǔn)化分別對同一故障屬性的數(shù)據(jù)進行歸一化處理。對于第i個屬性下的故障數(shù)據(jù)xi,第k個樣本xik歸一化的結(jié)果為
(6)
式中,xi max和xi min分別為第i個屬性故障數(shù)據(jù)的最大值和最小值。
將故障屬性作為FRS的條件屬性集C={c1,c2,…,cm},類別標(biāo)簽作為決策屬性集D={d1,d2,…,dn},建立故障診斷決策表,將條件屬性模糊化為模糊等價類,根據(jù)式(4)計算故障屬性對故障類別的屬性依賴度γC(D)。
根據(jù)式(5)計算條件屬性的相對重要程度β對故障屬性進行約簡,設(shè)置相對重要程度的閾值,剔除依賴度低的屬性,得到最小故障特征集合。
鯨魚優(yōu)化算法通過模擬座頭鯨捕獵過程中的社會行為,根據(jù)氣泡網(wǎng)搜索策略,提煉出一種元啟發(fā)式算法來解決最優(yōu)化問題[16]。一些經(jīng)典的種群算法存在優(yōu)化過程的隨機性問題[17],鯨魚優(yōu)化算法提出一種全局優(yōu)化器,將搜索過程分為探索階段和開發(fā)階段兩個階段,兩者共同作用來解決搜索過程中探索與開發(fā)之間的不平衡問題[18]。在探索階段對獵物先后進行大范圍和局部搜索,開發(fā)階段利用氣泡網(wǎng)攻擊法建立超立方體的收縮包圍機制,同時螺旋更新位置,通過自適應(yīng)變化,保證開發(fā)和探索過程間平穩(wěn)過渡,快速、穩(wěn)定地尋得最優(yōu)解。
2.1.1 包圍獵物
設(shè)當(dāng)前解X(t)是最佳搜索代理,其他搜索代理向最佳搜索代理X*(t)更新位置
D=|C·X*(t)-X(t)|
(7)
式中,系數(shù)向量C=2·r,r為[0,1]間的任意向量。
每一次迭代后更新當(dāng)前最佳搜索代理
X(t+1)=X*(t)-A·D
(8)
式中,系數(shù)向量A=2a·r-a,a在迭代過程中從2~0線性降低。
式(8)允許任何搜索代理在當(dāng)前最佳鄰域內(nèi)更新位置,搜索代理可以圍繞當(dāng)前最優(yōu)解所構(gòu)成的n維超立方體中移動。
2.1.2 氣泡網(wǎng)攻擊法
開發(fā)階段采用氣泡網(wǎng)攻擊法,通過收縮包圍機制和螺旋更新位置這兩方面共同實現(xiàn)。
收縮包圍機制通過縮小A=2a·r-a中的a實現(xiàn),隨著a的減小,A的波動范圍也隨之減小。開發(fā)階段|A|<1,搜索代理的新位置可以是當(dāng)前位置到最佳搜索代理間的任何位置。
通過計算搜索代理和當(dāng)前最佳搜索代理間的距離D′模擬鯨魚做螺旋狀運動,螺旋方程為
X(t+1)=D′·ebl·cos(2πl(wèi))+X*(t)
(9)
式中:D′=|X*(t)-X(t)|為鯨魚到獵物的距離;b為定義對數(shù)螺旋線形狀的常數(shù);l∈[-1,1]。
由于座頭鯨同時在收縮圈和螺旋線間游動,這里假設(shè)搜索代理采用各占50%的概率選擇尋優(yōu)方式,來更新當(dāng)前位置。氣泡網(wǎng)攻擊法的數(shù)學(xué)模型為
(10)
2.1.3 搜素獵物
探索階段WOA進行全局尋優(yōu),座頭鯨根據(jù)彼此的位置隨機搜索,為避免陷入局部最優(yōu),令|A|>1,遠離當(dāng)前搜索代理更新位置
(11)
更新搜索代理
(12)
WOA算法流程圖如圖1所示。|A|在搜索過程中能自適應(yīng)變化,保證開發(fā)、探索過程的平穩(wěn)過渡,快速、穩(wěn)定地尋求最優(yōu)解。
圖1 WOA算法流程圖Fig.1 Flow chart of the WOA algorithm
在實際應(yīng)用中,大多數(shù)故障樣本數(shù)據(jù)是線性不可分的。支持向量機作為機器學(xué)習(xí)中一種有效且應(yīng)用廣泛的主流分類算法,不僅可以對線性可分的數(shù)據(jù)進行分類,同時對非線性可分、非線性不可分的數(shù)據(jù)也具有卓越的分類效果[19]。支持向量機可以根據(jù)已知的故障樣本數(shù)據(jù),平衡學(xué)習(xí)能力與故障分類模型復(fù)雜程度之間的關(guān)系,且不需要大量的故障樣本數(shù)據(jù)[20],很適用于對復(fù)雜化工系統(tǒng)進行故障分類。
為求解非線性問題,SVM引入了核函數(shù)K(xi,x),將低維空間線性不可分的樣本映射到高維空間[21],轉(zhuǎn)化成線性可分問題
(13)
徑向基函數(shù)作為常用的一種核函數(shù),能把原始的特征數(shù)據(jù)映射到無窮維空間中[22],其表達式為
(14)
對于通過核函數(shù)映射到高維后仍然線性不可分的問題,引入了松弛變量ξi來對模型進行調(diào)整,并對損失部分加入懲罰項C,來平衡松弛變量對模型造成的負(fù)面影響,引入松弛變量后得到的新模型為
s.t.yi(wTxi+b)≥1-ξi,ξi≥0,i=1,2,…,n
(15)
解得
(16)
核函數(shù)gamma的參數(shù)g和懲罰因子C的參數(shù)c對最佳模型的建立影響很大[23],是影響故障分類模型訓(xùn)練精確度的一個重要因素,需通過優(yōu)化算法對c,g參數(shù)進行尋優(yōu)。
為防止故障分類模型的泛化能力過低,采用十折交叉驗證(cross-validation, CV)解決過擬合問題[24]。將數(shù)據(jù)集分成10份,輪流選擇1份作為驗證集,其余9份作為訓(xùn)練集對模型進行訓(xùn)練,得出驗證集分類的準(zhǔn)確率,將10次準(zhǔn)確率的均值作為模型最終準(zhǔn)確率。
為保證模型達到CV下的最高準(zhǔn)確率,先采用網(wǎng)格搜索法(grid search, GS)進行大范圍尋優(yōu)[25],之后對得到的粗略尋優(yōu)范圍利用WOA算法進行精確尋優(yōu)得到全局最優(yōu)解。通過新型元啟發(fā)式WOA算法對SVM的參數(shù)進行優(yōu)化,可以加快c,g參數(shù)的尋優(yōu)速度,縮短故障分類模型建立的時間,提高故障診斷的準(zhǔn)確率。
首先通過網(wǎng)格搜索粗略尋優(yōu),在大范圍內(nèi)對c,g參數(shù)進行搜索。由于GS尋優(yōu)耗時較長,因此只對參數(shù)進行粗略選擇,為后續(xù)精確尋優(yōu)提供合適的尋優(yōu)范圍。初始化GS參數(shù),針對c,g參數(shù)生成網(wǎng)格采樣點,一一遍歷所有采樣點,若當(dāng)前組c,g下分類精確度滿足精度要求,則更新當(dāng)前最佳模型,得出粗略尋優(yōu)的參數(shù)范圍作為精確尋優(yōu)搜索范圍的上下限。
通過GS得到c,g參數(shù)粗略范圍后,利用WOA算法在這個范圍內(nèi)繼續(xù)對c,g進行精確尋優(yōu),WOA優(yōu)化SVM參數(shù)的算法流程圖如圖2所示,具體步驟如下:
圖2 WOA優(yōu)化SVM參數(shù)的算法流程圖Fig.2 Algorithmic flow char for optimizing SVM parameters by WOA
步驟1初始化WOA-SVM參數(shù)。對WOA的相關(guān)參數(shù)初始化;此外,對WOA優(yōu)化SVM的相關(guān)參數(shù):搜索代理X*(t)維數(shù)及數(shù)量、最大迭代次數(shù)、搜索范圍上下限,進行初始化。其中,搜索代理向量X*(t)={c,g},維數(shù)設(shè)置為2。
步驟2檢查位置是否越界。依次檢查每個個體位置是否超出搜索范圍上下限,調(diào)整超出搜索空間邊界的搜索代理。
步驟3計算適應(yīng)度函數(shù)。將當(dāng)前搜索代理位置向量作為c,g參數(shù)得到當(dāng)前SVM模型,將當(dāng)前模型CV意義下的準(zhǔn)確率作為WOA的適應(yīng)度函數(shù)值,對適應(yīng)度定標(biāo)。
步驟4更新當(dāng)前最優(yōu)解。通過WOA算法對當(dāng)前搜索代理位置更新,得到全局最佳適應(yīng)度函數(shù)值,更新當(dāng)前最佳搜索代理。
步驟5計算精確度是否滿足終止條件。模型精確度為當(dāng)前適應(yīng)度與當(dāng)前全局最佳適應(yīng)度的差值,若當(dāng)前模型精確度滿足終止標(biāo)準(zhǔn)公差條件,則將當(dāng)前模型更新為當(dāng)前最佳模型。如果當(dāng)前模型與當(dāng)前最佳模型性能近似相同,此時比較c的大小,優(yōu)先選擇c較小的模型作為最佳模型以減少計算量。
步驟6輸出最優(yōu)搜索代理X*={bestc, bestg},即為WOA-SVM故障分類模型的最優(yōu)c,g參數(shù)。
FRS-WOA-SVM故障診斷主要由數(shù)據(jù)采集與預(yù)處理、模糊粗糙集故障特征選擇、鯨魚算法優(yōu)化的支持向量機故障分類模型這三部分構(gòu)成,結(jié)構(gòu)框圖如圖3所示。
圖3 FRS-WOA-SVM故障診斷框圖Fig.3 FRS-WOA-SVM fault diagnosis block diagram
數(shù)據(jù)采集可分為離線和在線兩種方式。離線采集是通過管理員提前錄入大量的故障歷史數(shù)據(jù),根據(jù)現(xiàn)有的數(shù)據(jù)庫對當(dāng)前故障類型做出判斷。在線采集目前一般采用DCS分布式控制系統(tǒng)[26],通過DCS實時采集過程數(shù)據(jù),即故障屬性信息,并存入到實時數(shù)據(jù)庫中。將采集到的原始數(shù)據(jù)通過清洗除噪及均值法等預(yù)處理方式進行轉(zhuǎn)換[27],得到可供后續(xù)步驟利用的故障樣本數(shù)據(jù)。由于TE過程仿真系統(tǒng)中包含大量數(shù)據(jù)集,因此采用離線采集方式獲取數(shù)據(jù)。
通過對被檢測系統(tǒng)采集的故障歷史數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)化預(yù)處理,利用FRS對屬性數(shù)據(jù)約簡進行特征選擇,再提取得到的最簡屬性,構(gòu)建新的最小故障特征屬性數(shù)據(jù)集。將FRS處理得到的數(shù)據(jù)集送入構(gòu)建的新型的元啟發(fā)式WOA優(yōu)化的SVM分類模型中,最終運行得出故障診斷的結(jié)果。
田納西-伊斯曼(Tennessee Eastman, TE)過程由伊斯曼化學(xué)品公司為模擬實際化工過程而創(chuàng)建的仿真系統(tǒng)[28],TE化工過程工藝流程圖如圖4所示。該系統(tǒng)主要由5個單元模塊構(gòu)成,從左至右依次為反應(yīng)器、冷凝器、汽提塔、壓縮機、汽液分離器[29]。反應(yīng)過程含八種成分,其中A、B、C、D、E為氣體反應(yīng)物,G、H為液態(tài)氣體生成物,即最終產(chǎn)品,F(xiàn)為反應(yīng)過程中生成的副產(chǎn)品。
圖4 TE化工過程工藝流程圖Fig.4 The flow chart of the TE chemical process
TE過程的訓(xùn)練集由1個正常工況下的數(shù)據(jù)集和21個預(yù)設(shè)故障下的數(shù)據(jù)集構(gòu)成,每個數(shù)據(jù)集都包含了480個樣本對應(yīng)的52個觀測變量數(shù)據(jù)。21個預(yù)設(shè)故障中存在16個不同的已知故障及5個未知故障,其中故障IDV(1)~IDV (7)有關(guān)階躍變化,故障IDV(8)~IDV(12)有關(guān)隨機變量,故障IDV(13)為緩慢漂移,故障IDV(14)、IDV(15)、IDV(21)與黏滯閥相關(guān),其他為未知故障。52個觀測變量包含41個測量變量XMEAS(1)~XMEAS(41)及11個控制變量XMV(1)~XMV(11)。
從四種已知故障類型分別選取故障IDV(1)、IDV(8)、IDV(13)、IDV(14),以及無故障情況這五類進行故障診斷,分別從TE訓(xùn)練集的480個樣本中選取前100個樣本,組成由500個樣本構(gòu)成的TE樣本數(shù)據(jù)集。由于實際生產(chǎn)工藝測量變量中的成分變量XMEAS(23)~XMEAS(41)對TE過程故障分類的貢獻不大[30],所以將這些屬性值舍去,只對剩余的33個觀測變量進行分析。
為清晰的呈現(xiàn)故障特征選擇后的結(jié)果,分別對FRS約簡前后的屬性做可視化分析,TE樣本數(shù)據(jù)集的分維可視化圖如圖5所示。其中,第1個圖為數(shù)據(jù)的5個類別標(biāo)簽分布,記類別標(biāo)簽為0、1、8、13、14;其余33個圖為故障樣本各屬性分布情況。
圖5 約簡前TE數(shù)據(jù)集的分維可視化圖Fig.5 Fractal dimension visualization of TE dataset before reduction
對從TE過程數(shù)據(jù)集選取的500個樣本數(shù)據(jù)進行故障特征選擇。對于故障屬性集A=C∪D,由33個觀測變量組成條件屬性集C={c1,c2,…,c33},五種故障類別標(biāo)簽作為決策屬性集D={d0,d1,d2,d3,d4},記為{0,1,8,13,14}。其中:d0為無故障情況;d1為有關(guān)階躍變化故障IDV(1);d2為有關(guān)隨機變量故障IDV(8);d2為緩慢漂移故障IDV(13);d3為與黏滯閥相關(guān)故障IDV(14)。根據(jù)第2章構(gòu)建的FRS故障特征選擇模型,先分別將33個故障屬性的500個故障數(shù)據(jù)樣本數(shù)據(jù)歸一化,計算500個故障數(shù)據(jù)樣本的33個故障屬性相對重要程度βi(i=1,2,…,33),設(shè)置閾值β=0.8,將相對重要程度βi<0.8的屬性剔除,只保留βi>0.8的屬性。經(jīng)過FRS約簡后,剩余6個故障屬性,組成最小故障特征集合,記為C′={a1,a2,a3,a4,a5,a6}。
根據(jù)FRS特征選擇得到的TE過程最小故障特征集合C′,剔除TE樣本數(shù)據(jù)集中的冗余屬性數(shù)據(jù),構(gòu)建新的數(shù)據(jù)集,包含500個故障數(shù)據(jù)樣本對應(yīng)的6個故障屬性數(shù)據(jù)。
對FRS約簡后的屬性做可視化分析。由圖5可見各觀測變量的故障屬性值呈現(xiàn)連續(xù)分布且數(shù)量級差異較大,為便于觀察約簡后的情況,將數(shù)據(jù)離散化并標(biāo)準(zhǔn)化到1~10,對FRS特征選擇得到6個約簡屬性做可視化分析,約簡后的TE數(shù)據(jù)分維可視化圖,如圖6所示。
圖6 約簡后TE數(shù)據(jù)分維可視化圖Fig.6 Fractal dimension visualization of reduced TE dataset
對FRS特征選擇后構(gòu)建的TE數(shù)據(jù)集進行故障分類。先通過網(wǎng)格搜索法進行大范圍尋優(yōu),確定c,g參數(shù)搜索范圍上下限,基于GS的SVM參數(shù)選擇等高線圖,如圖7所示。根據(jù)圖7,參數(shù)c范圍縮小為2-2~28,即0.25~256,參數(shù)g范圍縮小為2-5~25,即0.03~32。
圖7 基于網(wǎng)格搜索法的SVM參數(shù)選擇等高線圖Fig.7 Contour map of SVM parameter selection based on grid search method
通過WOA精確尋優(yōu)。設(shè)最大迭代次數(shù)為100,搜索代理數(shù)量為20,根據(jù)GS尋優(yōu)得到的粗略范圍設(shè)定c,g參數(shù)搜索范圍分別為[0.25,256],[0.03,32]。經(jīng)過WOA-SVM故障分類模型訓(xùn)練,得到最佳尋優(yōu)參數(shù)為bestc=0.705 5,bestg=1.198 6,即此時模型的最佳適應(yīng)度得分最高。
為判定模型的性能,選取GA、PSO兩種元啟發(fā)式算法,將其優(yōu)化的SVM故障分類模型與WOA-SVM故障分類模型進行比較。設(shè)定相同的最大迭代次數(shù)、c,g參數(shù)搜索范圍、種群數(shù)量,三種優(yōu)化算法的尋優(yōu)過程如圖8所示??梢?,相比于GA、PSO兩種優(yōu)化算法,WOA優(yōu)化的SVM故障分類模型的最佳適應(yīng)度得分最高,為99.466 7%,GA、PSO優(yōu)化的SVM故障分類模型的最佳適應(yīng)度得分分別為98.666 7%,99.2%;WOA算法尋優(yōu)速度較快,迭代次數(shù)在5代時適應(yīng)度函數(shù)值就可達到最佳,GA、PSO分別在20代、96代時達到最優(yōu);且WOA算法相對更穩(wěn)定,不易陷入局部最優(yōu),PSO算法在尋優(yōu)過程中易陷入局部最優(yōu),在4代、30代時都陷入了局部最優(yōu)解。
圖8 WOA和其他元啟發(fā)式算法尋優(yōu)過程比較Fig.8 Comparison of optimization process of WOA and other meta-heuristic algorithms
選取125個樣本數(shù)據(jù)作為測試集,利用訓(xùn)練好的SVM優(yōu)化模型對TE數(shù)據(jù)集進行故障分類,三種模型故障診斷結(jié)果如圖9所示。尋優(yōu)參數(shù)及模型準(zhǔn)確率如表1所示,其中WOA-SVM故障分類準(zhǔn)確率最高,為88%(110/125),GA-SVM、PSO-SVM故障分類準(zhǔn)確率相對較低,分別為86.4%,87.2%。可見WOA優(yōu)化的故障分類模型在訓(xùn)練精度和測試精度上都可以達到一個較高的水平。
表1 尋優(yōu)參數(shù)及模型準(zhǔn)確率比較Tab.1 Comparison of optimization parameters and model accuracy
圖9 三種模型故障診斷結(jié)果比較Fig.9 Comparison of fault diagnosis results of three models
對于故障診斷時間,利用WOA-SVM故障分類模型分別對經(jīng)過及未經(jīng)過故障特征選擇的TE數(shù)據(jù)集進行試驗,記錄故障診斷所需時間。得到經(jīng)過FRS屬性約簡的故障診斷時間為42 s;未經(jīng)過FRS屬性約簡的故障診斷時間為74 s??梢娎肍RS進行屬性約簡,能在對故障診斷準(zhǔn)確率影響相對較小的情況下縮減故障分類所需時間。
通過TE化工過程對構(gòu)建的FRS-WOA-SVM故障分類模型進行故障診斷,結(jié)果表明該分類模型不僅可以提高故障診斷準(zhǔn)確率,還能提高診斷速度,使結(jié)果更加準(zhǔn)確、穩(wěn)定,對系統(tǒng)做出診斷,保證化工過程的安全運行。
針對化工過程復(fù)雜,故障屬性多,影響故障診斷的速度的問題,F(xiàn)RS通過模糊相似關(guān)系對粗糙集進行優(yōu)化,可以避免數(shù)據(jù)過于結(jié)構(gòu)化,對數(shù)據(jù)集做更準(zhǔn)確的描述,得到更加準(zhǔn)確的約簡屬性。通過TE過程試驗可見,F(xiàn)RS可以保證對故障診斷準(zhǔn)確率影響較小的情況下,縮減診斷所需時間,提高診斷效率。
對于傳統(tǒng)的SVM故障分類模型雖然可以通過少量樣本對系統(tǒng)做出故障診斷,但隨著故障類型和樣本屬性的增多,分類模型的尋優(yōu)精度也會隨之降低。新型的元啟發(fā)式算法WOA根據(jù)氣泡網(wǎng)搜索策略螺旋更新位置,建立超立方體的收縮包圍機制,在搜索過程自適應(yīng)變化,通過WOA對SVM的c,g參數(shù)進行全局優(yōu)化,可以快速、穩(wěn)定地尋求最優(yōu)解。通過對約簡后的TE過程數(shù)據(jù)進行試驗表明,WOA-SVM故障分類模型相比于GA、PSO算法優(yōu)化的SVM分類模型,尋優(yōu)速度更快,故障診斷準(zhǔn)確率更高。整體上而言,通過模糊粗糙集和鯨魚優(yōu)化支持向量機進行故障診斷具有一定的優(yōu)越性,在化工過程故障診斷中在準(zhǔn)確率及速度上都達到了很好的一個效果。