張榮昌
(廣東電網有限責任公司江門開平供電局,廣東江門529300)
控制網絡故障診斷在本質上就是模式識別的問題??刂凭W絡故障診斷主要是根據(jù)發(fā)生故障時的系統(tǒng)現(xiàn)象和網絡狀態(tài)參數(shù),通過分析診斷找出故障發(fā)生的原因以及位置。
通過閱讀國內外相關文獻,總結故障診斷的方法論,基本是遵循以下三個步驟:第一步是故障檢測,采集控制網絡系統(tǒng)狀態(tài)參數(shù)的故障信號;第二步是故障分離,對故障狀態(tài)信號數(shù)據(jù)進行預處理,提取特征;第三步是故障識別,根據(jù)網絡的狀態(tài)參數(shù)快速確定網絡故障的類別。控制網絡故障診斷流程如圖1所示。
圖1 控制網絡故障診斷流程圖
由于控制網絡結構的復雜化和綜合化,故障聯(lián)鎖產生的關聯(lián)現(xiàn)象通常會使采集的數(shù)據(jù)中包含了大量的冗余,而這些冗余的特征會增加數(shù)據(jù)的維度,增加計算的復雜度,無法達到快速準確診斷故障的要求,甚至有可能出現(xiàn)“維數(shù)災難”。
因此文獻[1]提出了中心距離比值加權主元成分分析(CDRWPCA)算法。該方法對主流的降維算法PCA進行了改進,克服了PCA作為無監(jiān)督特征提取方法,在將特征投影到低維空間時,可能會丟失對分類有用的鑒別信息的弊端(圖2)。
圖2 基于CDR-PCA特征提取流程圖
文獻[1]主要是通過計算每維特征的中心距離比值來衡量特征間的差異,然后根據(jù)比值來生成權重系數(shù),對關鍵的特征乘以較大的權重系數(shù)使其得以保留,能夠提高故障的識別率。
評價:
(1)該方法由于引進了距離和權重因子,增加了計算的復雜度,影響了故障診斷時效性。
(2)選擇合適的系數(shù)因子η在CDRWPCA特征提取中,對于特征降維和最終對分類的影響都是非常關鍵的。如果η超過一定的范圍,故障識別率就會變得不理想。但是文獻中并沒有進一步去說明如何選擇最優(yōu)的權重因子,這樣會導致模型的泛化性能較差,無法完全實現(xiàn)智能化。
網絡故障識別的核心問題包括兩個:知識庫的建立和識別方法。對應這兩個問題,現(xiàn)在的研究重點包括故障特性研究和識別方法研究。本文主要對識別方法進行討論,選取了以數(shù)據(jù)驅動為核心的機器學習方向,挑選了近年比較主流的神經網絡和支持向量機算法進行概述分析。
3.1.1 基于改進BP神經網絡的故障診斷方法
文獻[2]提出了一種基于改進BP神經網絡的故障診斷方法,通過對控制網絡故障信息樣本進行訓練,利用神經網絡自適應能力,建立從控制網絡采集到的故障信息到故障診斷結果的復雜映射關系,提高故障診斷的有效性跟準確性。
評價:
(1)BP神經網絡的方法容易陷入局部最小甚至是發(fā)散。
(2)神經網絡訓練效率低。計算迭代的速度較慢,單次網絡訓練時間較長。文獻[2]在實例分析驗證時需要經過140次訓練才可達到設定的精度。
(3)故障數(shù)據(jù)及特征重疊冗余。在實際網絡的采集過程中不可避免地會產生冗余樣本,如果對這些樣本進行訓練,不但不會提高模型的準確性,反而會影響神經網絡的訓練效率。因此可以嘗試結合PCA處理后再對樣本進行訓練,模型的性能可能會更優(yōu)。
3.1.2 結合粗糙集理論的神經網絡方法
文獻[3]結合粗糙集理論,針對不一致、不完整的采集數(shù)據(jù)進行有效的處理分析,發(fā)現(xiàn)數(shù)據(jù)間隱藏的關系,簡化故障特征。粗糙集神經網絡的故障診斷方法首先從全部故障特征中選擇出最能反映網絡故障本質的貢獻大的特征。然后,將網絡故障輸入屬性進行分類簡化,刪除冗余或者重疊的特征屬性。最后,輸入到神經網絡中,迭代訓練得出符合精度的模型。
評價:
基于粗糙集神經網絡的方法主要從數(shù)據(jù)預處理方面入手,簡化了故障特征,在方法論上與第2節(jié)中所提到的主元成分分析法(PCA)很類似。通過對屬性的約簡,神經網絡的輸入會更加有效,訓練的步數(shù)更少,從而提高了神經網絡的學習效率。并且由于結合了粗糙集,對噪聲的抑制消除效果也較明顯,提高了模型的識別精度。
但文獻[3]并沒有對神經網絡本身進行調整改進,所以神經網絡固有的單次訓練時間較長、神經網絡結構的選取容易出現(xiàn)“過擬合”現(xiàn)象等問題依舊存在,還有待去解決。
神經網絡以其良好的容錯性和自適應性,已被應用于故障診斷中,在這方面也涌現(xiàn)出了大量的研究文獻。不過神經網絡存在過擬合以及陷入局部最優(yōu)等問題,同時工業(yè)控制網絡中正常樣本多,故障樣本少。支持向量機(SVM)是一種專門針對小樣本的機器學習方法,并且其在處理非線性和高維數(shù)據(jù)時的精確度和泛化性能也很好,因此接下來本文將概述支持向量機的診斷流程及其性能。
3.2.1 基于LSSVM的網絡故障診斷算法
文獻[4]中提及的LSSVM即最小二乘向量機,LSSVM與經典的支持向量機區(qū)別在于,LSSVM把原方法的不等式約束變?yōu)榈仁郊s束,從而大大方便了Lagrange乘子α的求解,原問題是QP問題,而在LSSVM中則是一個解線性方程組的問題。文獻中的LSSVM網絡故障診斷流程與上文提及的神經網絡算法基本一致,首先是故障數(shù)據(jù)采集,通過PSO粒子群算法確定LSSVM的最優(yōu)初始參數(shù),對故障數(shù)據(jù)進行預處理,然后輸入到LSSVM進行訓練,最后對模型進行交叉驗證。
優(yōu)點:
文獻[4]最后的測試集驗證中,針對小樣本的網絡故障診斷,LSSVM的診斷精度要明顯高于BP神經網絡,訓練速度也更快。
不足:
(1)文獻中對于支持向量機中關鍵的核函數(shù)選取并沒有進行詳細討論;
(2)只對一個測試集進行驗證,并且是一個小樣本的數(shù)據(jù)集,本身就具有很大的隨機性,應對多個不同的網絡故障數(shù)據(jù)集進行驗證;
(3)故障診斷中客觀存在大量不確定信息,算法處理效果將大受影響。
3.2.2 基于模糊集的雙重支持向量機網絡故障診斷方法
為了進一步提高支持向量機的泛化性能,文獻[5]進行了兩次SVM訓練,第一次SVM訓練通過類中心確定近似的最優(yōu)分類面,而第二次SVM訓練主要是為了讓模型稀疏化,但是由于樣本的減少,噪聲以及故障數(shù)據(jù)的不確定性對分類面的影響也會增大。
針對故障診斷中數(shù)據(jù)不確定性和噪聲的影響,文獻[5]將模糊理論在處理不確定性上的優(yōu)勢與SVM相結合,在第二次SVM訓練中引入模糊因子。模糊集給每個樣本都賦予一個模糊隸屬度,這樣不同的樣本對決策函數(shù)的學習都有不同的貢獻,從而減少了外部的影響,提高了故障診斷的精度(圖3)。
評價:
(1)時效性高,泛化性能好。對比經典SVM,Dual-SVM經過兩次訓練后,模型稀疏化,支持向量個數(shù)少,診斷模型更加簡單,訓練時間遠少于SVM。
(2)故障診斷模型精度高。由于結合模糊化理論,克服了數(shù)據(jù)不確定性和噪聲的影響。文獻[5]對3組樣本進行了訓練,故障模型診斷精度并沒有因為泛化性能的提高而下降。
圖3 基于模糊集的雙重支持向量機網絡故障診斷流程圖
(3)不過該文獻并沒有對支持向量機的核函數(shù)選取進行說明,是本文比較遺憾的地方。
通過研究近年來國內外關于控制網絡故障診斷方面的文獻,本文針對故障特征提取、故障識別方法進行了概述和分析,討論了目前研究中存在的不足和需要改進的方向。隨著控制網絡的快速發(fā)展,使用單一的方法、從單一的角度進行故障診斷已不能滿足要求。故障診斷方法的發(fā)展趨勢大概有如下兩點:
(1)綜合化。由于控制網絡設備的復雜化和故障的不確定性,用一種算法已不能滿足控制網絡可靠性和故障診斷高效性的要求,所以需要綜合多種算法,取其精華,克服其不足,來提高控制網絡故障診斷的智能化水平。
(2)機器學習。利用機器學習來豐富故障知識庫,形成、豐富故障診斷模型,對專家系統(tǒng)知識庫進行補充,使故障診斷變得更加高效、準確。