于孟喜,謝 鶴
山西晉緣網(wǎng)絡(luò)技術(shù)有限公司,山西太原 030000
信息環(huán)境之下,企業(yè)對于信息系統(tǒng)的依賴性逐步加強,并且這種依賴性,會隨著企業(yè)規(guī)模的擴大而呈現(xiàn)出顯著的上升趨勢。在電力系統(tǒng)中,隨著電力自動化技術(shù)的逐步成熟,信息系統(tǒng)中的數(shù)據(jù),無論從格式還是從容量方面,都在近年呈現(xiàn)出顯著膨脹,隨著變化的,還包括電力信息系統(tǒng)的運行模式。與此同時,人們對于電能的質(zhì)量和供配可靠性也提出了更高的要求,這對于中心調(diào)度而言,必然從客觀上需要更為可靠和精準(zhǔn)的數(shù)據(jù)參與決策。因此如何切實提升整個信息系統(tǒng)環(huán)境之下的數(shù)據(jù)質(zhì)量,就成為當(dāng)前人們共同關(guān)注的重點。
在電力信息系統(tǒng)中,所涉及到的數(shù)據(jù)來自于多個方面,除了相對比較常規(guī)的辦公數(shù)據(jù)以外,還包括營銷和輸配狀態(tài)兩個重要的數(shù)據(jù)來源。在這樣的環(huán)境之下,有效提升各類數(shù)據(jù)準(zhǔn)確水平,對于穩(wěn)定電力供給有著毋庸置疑的積極價值。
在電力信息系統(tǒng)中,對于供配網(wǎng)絡(luò)各個方面的實時測量結(jié)果,會因為測量系統(tǒng)本身安排的不合理以及冗余度不足,或者通信網(wǎng)本身可靠性不夠等因素,而在系統(tǒng)環(huán)境中呈現(xiàn)出某些數(shù)據(jù)無法進行有效的辨識,從而形成不良數(shù)據(jù)。對于這一類的數(shù)據(jù),必須展開檢查和清理,否則會影響調(diào)度系統(tǒng)決策失誤,無法形成有效的決策支持信息。同樣的問題會出現(xiàn)在任何一個相對大型的信息系統(tǒng)環(huán)境中,包括電力銷售數(shù)據(jù)環(huán)境等,而當(dāng)前以二次系統(tǒng)以及電力通信系統(tǒng)所組成的信息反饋體系,則成為不良數(shù)據(jù)辨識工作的重點領(lǐng)域。不良數(shù)據(jù)檢測與辨識是電力系統(tǒng)狀態(tài)估計的重要功能之一,其功能是在獲得狀態(tài)估計值的基礎(chǔ)上,依靠系統(tǒng)本身的冗余信息,通過數(shù)據(jù)挖掘和識別等自動化技術(shù),發(fā)現(xiàn)采樣數(shù)據(jù)中偶然出現(xiàn)的不良數(shù)據(jù)進行剔除,借以實現(xiàn)對于狀態(tài)估計的可靠性提升。
不良數(shù)據(jù)的檢測與識別,對于狀態(tài)估計結(jié)果的正確性有著至關(guān)重要的作用,也因此一直都得到相關(guān)領(lǐng)域的關(guān)注。近年來數(shù)據(jù)挖據(jù)技術(shù)成為該領(lǐng)域中廣泛研究的重點,并且在不良數(shù)據(jù)的檢測和識別過程中表現(xiàn)良好。其能夠有效面對海量數(shù)據(jù),并且從不完全和模糊、隨機的實際應(yīng)用數(shù)據(jù)中分理處正確和可理解的信息,并且在一定程度上對于保護數(shù)據(jù)的及時性和有效性有著積極價值。當(dāng)前國內(nèi)外在基于數(shù)據(jù)挖據(jù)技術(shù)的基礎(chǔ)上,已經(jīng)提出了多種不良數(shù)據(jù)檢測與辨識的方法。其中首先包括相對傳統(tǒng)的,以目標(biāo)函數(shù)極值檢測法、加權(quán)殘差檢測法、標(biāo)準(zhǔn)化殘差檢測法以及測量量突變檢測法作為突出代表。同時隨著相關(guān)技術(shù)的發(fā)展,更多新的理論和對于不良數(shù)據(jù)的檢測方法開始得到應(yīng)用,其中包括模糊數(shù)學(xué)法、神經(jīng)網(wǎng)絡(luò)法、聚類分析法、間隙統(tǒng)計法等,且大部分都以數(shù)據(jù)挖掘作為重要的技術(shù)基礎(chǔ)之一。
在電力信息系統(tǒng)環(huán)境中,對于不良數(shù)據(jù)的檢測呈現(xiàn)出其獨有特征。通常而言,可以將電力系統(tǒng)量測數(shù)據(jù)看作為有效的量測數(shù)據(jù)和量測噪聲的線性組合,并且通常以白噪聲作為突出表現(xiàn)。通過一定的技術(shù)手段,能夠?qū)Π自肼暜a(chǎn)生的不良影響進行消除,但是如果在量測數(shù)據(jù)中包含有不良數(shù)據(jù),則通常會通過如下兩類方法展開辨識和剔除,其差異在于狀態(tài)估計與不良數(shù)據(jù)辨識展開的先后順序。
如果先展開狀態(tài)估計,而后進行檢測和辨識,則在檢測之前可以通過狀態(tài)估計獲取到量測量殘差,對其進行加權(quán)和標(biāo)準(zhǔn)化處理之后,設(shè)定閾值,進一步展開假設(shè)檢驗,確定是否存在殘差,并且進一步利用殘差搜索展開對于不良數(shù)據(jù)的辨識工作。此種工作方式在辨識的有效性方面表現(xiàn)良好,但是問題在于計算量會相對較大,隨著電力環(huán)境中更多數(shù)據(jù)的涌入,整體工作效率會略有下降。除此以外,殘差淹沒也是會降低此種檢測靈敏度的一個重要問題。另一種方法,即首先對量測數(shù)據(jù)展開預(yù)測而后展開狀態(tài)估計。預(yù)測之后先偶去量測殘差,而后依據(jù)量測殘差之間的相關(guān)關(guān)系展開檢測,并且對不良數(shù)據(jù)進行辨識。此種方法在動態(tài)系統(tǒng)中可能會出現(xiàn)檢測困難,并且對量測過程中產(chǎn)生的冗余信息無法展開有效利用。
兩種面向電力信息系統(tǒng)展開不良數(shù)據(jù)檢測的技術(shù),各有優(yōu)劣,在實際工作環(huán)境中也均呈現(xiàn)出不同的適用特征。其中前者,即先展開狀態(tài)估計而后進行不良檢測的工作方式相對而言比較成熟,而后者則起步較晚尚待進一步的成熟。
從常規(guī)工作展開的層面看,想要落實針對不良數(shù)據(jù)的檢測工作,首先需要選取一定長度的窗口樣本作為量測數(shù)據(jù)的范本,并且針對其展開該時間段內(nèi)的量測數(shù)據(jù)方差的計算,如果方差沒有超過規(guī)范閾值,則可視為不存在不良數(shù)據(jù)。在方差超過規(guī)定閾值的情況下,需要進一步將超標(biāo)數(shù)據(jù)置入可疑數(shù)據(jù)集中,并計算可疑量測量與其它量測量之間的相關(guān)系數(shù),隨后確定該系數(shù)是否超過預(yù)定閾值,如果超過,則認定該量測量最近一個數(shù)據(jù)為不良數(shù)據(jù),并且加以處理并展開進一步的檢測,如果未超過閾值則認為不存在不良數(shù)據(jù)。
信息系統(tǒng)中,尤其是自動化信息系統(tǒng)之中,必然會存在不良數(shù)據(jù)。而想要通過人工智能等相關(guān)技術(shù)從海量數(shù)據(jù)中獲取到有用的信息用于支持決策,對不良數(shù)據(jù)展開識別和剔除就成了信息系統(tǒng)面對的首要問題。實際工作中需要密切關(guān)注技術(shù)發(fā)展方向和趨勢,切實深入地了解電力系統(tǒng)內(nèi)數(shù)據(jù)環(huán)境與特征,謹慎選擇和引入才能取得良好效果。
[1]張海波,李林川.電力系統(tǒng)狀態(tài)估計的混合不良數(shù)據(jù)檢測方法[J].電網(wǎng)技術(shù),2001,25(10).
[2]魏強,王凱,韓學(xué)山.不良數(shù)據(jù)識別發(fā)生誤判和漏判時的處理[J].東北電力學(xué)院學(xué)報,2003,23(1).