左 濤
(國家能源集團廣東電力有限公司,廣東 廣州 510000)
近幾年來,電力企業(yè)的電力系統(tǒng)在實際運行中產(chǎn)生許多數(shù)據(jù),包括運營管理、電網(wǎng)設備、運行檢修等,如何利用已有技術充分對復雜繁多的數(shù)據(jù)進行挖掘,發(fā)現(xiàn)數(shù)據(jù)中存在的實際價值,從而實現(xiàn)降低企業(yè)運營成本,提高企業(yè)經(jīng)濟效益和管理水平的基本目標。這也是現(xiàn)階段電力企業(yè)在發(fā)展過程中,亟需重點解決的問題,在互聯(lián)網(wǎng)信息技術不斷發(fā)展的背景下,電力企業(yè)需要在各項設備運行中有效地應用數(shù)據(jù)挖掘技術,將數(shù)據(jù)挖掘存在的價值充分地發(fā)揮,這也是企業(yè)發(fā)展的重點內(nèi)容。
數(shù)據(jù)挖掘技術最早出現(xiàn)于20世紀80年代后期,是在數(shù)據(jù)庫、人工智能、數(shù)據(jù)整理、數(shù)據(jù)統(tǒng)計以及數(shù)據(jù)可視化等基礎上發(fā)展的全新交叉學科,因此數(shù)據(jù)挖掘技術中含有多種不同專業(yè)的理論知識和專業(yè)技術。數(shù)據(jù)挖掘技術主要是利用機器學習的方法,從數(shù)據(jù)庫中尋找和發(fā)現(xiàn)全新的知識,以此來作為解決實際問題的重要依據(jù),預測未來數(shù)據(jù)發(fā)展趨勢,為決策問題提供更有力的保障和依據(jù)[1]。
傳統(tǒng)數(shù)據(jù)庫技術實現(xiàn)對數(shù)據(jù)的收集和管理工作,基本實現(xiàn)數(shù)據(jù)的一致性和準確性等相關要求。數(shù)據(jù)庫系統(tǒng)可以實現(xiàn)對數(shù)據(jù)的記錄、查詢以及統(tǒng)計等相關功能,但是無法實現(xiàn)數(shù)據(jù)中的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)資料對未來發(fā)展趨勢進行預測,缺少數(shù)據(jù)挖掘的手段。數(shù)據(jù)挖掘就是對傳統(tǒng)的數(shù)據(jù)庫技術進行創(chuàng)新和完善,對現(xiàn)實中存在的數(shù)據(jù)內(nèi)容進行識別,更加具有有效性、新穎性,形成對前存的數(shù)據(jù)進行處理的全新模式。數(shù)據(jù)挖掘技術讓數(shù)據(jù)庫技術進入全新的發(fā)展階段,不僅能對歷史數(shù)據(jù)進行查詢,還能找出歷史數(shù)據(jù)之間存在的鏈接,從數(shù)據(jù)中發(fā)現(xiàn)模式,從而找到內(nèi)在未知的技術內(nèi)容,讓數(shù)據(jù)真正實現(xiàn)與物質、能源相媲美的資源形式[2]。
數(shù)據(jù)挖掘的基本原則是為計算配置數(shù)據(jù)結構,處理數(shù)據(jù)并發(fā)現(xiàn)數(shù)據(jù)結果,將處理的數(shù)據(jù)結果以可以理解的方式進行提交。數(shù)據(jù)挖掘技術在工作的過程中,經(jīng)常會分為數(shù)據(jù)準備階段、數(shù)據(jù)發(fā)掘階段以及解釋評價階段,其中數(shù)據(jù)準備階段中可以實現(xiàn)對數(shù)據(jù)的篩選、變換和處理,數(shù)據(jù)發(fā)掘階段主要是根據(jù)任務自身的特點,建立對應的模型,選擇有效的計算方式對數(shù)據(jù)進行挖掘,而解釋評價階段可以對模式進行合理的解釋和評價,更好地幫助工作人員對數(shù)據(jù)信息進行解析。
關聯(lián)分析。關聯(lián)分析主要是顯示數(shù)據(jù)之間存在的關系,如果2個或者多個數(shù)據(jù)項目的取值重復出現(xiàn)并且概率較高的情況下,數(shù)據(jù)之間必定存在某種關聯(lián),關聯(lián)分析的目的就是找出數(shù)據(jù)中隱藏的關系。在大型數(shù)據(jù)庫中,這種存在關聯(lián)的數(shù)據(jù)信息較多,一般會選擇支持度與可信度2個閾值來對數(shù)據(jù)關聯(lián)規(guī)則進行評價。
分類和預測。分類是數(shù)據(jù)挖掘技術中應用較為廣泛的技術類型,主要是找出描述并區(qū)分數(shù)據(jù)類型或者概念的模型,以此來確保模型預測類標記位置的數(shù)據(jù)分類。分類也可以對位置數(shù)據(jù)進行預測,這樣的功能也被稱為預測功能。盡管現(xiàn)階段預測對象可以是類標記或者數(shù)據(jù)值,但是通常預測范圍僅在數(shù)據(jù)值預測內(nèi),并且預測技術與分類技術有著明顯的區(qū)別。預測技術主要包括對可用數(shù)據(jù)分布趨勢的識別,對數(shù)據(jù)未來走向的評估[3]。
聚類。聚類可以將數(shù)據(jù)分成多個類別或者子集。與分類問題不同,在聚類分析中,類的數(shù)量是未知不可預測的,因此聚類通常分成3個步驟進行。首先發(fā)現(xiàn)合適的類,其次形成每個類的基本模型,最后對所有數(shù)據(jù)項目進行類聚。
演化分析。演化分析描述對象的行為隨時都會出現(xiàn)變化,變化也具有一定的規(guī)律和趨勢,因此需要建立相應的模型。演化分析包括與時間相關的序列數(shù)據(jù)分析,序列或者周期模型的匹配程度,在類似性的基礎上對數(shù)據(jù)進行分析。
偏差檢測。偏差檢測是聚類分析中的特例,數(shù)據(jù)庫中經(jīng)常會出現(xiàn)一些異常的數(shù)據(jù)內(nèi)容,大多數(shù)數(shù)據(jù)挖掘技術都會將這些異常數(shù)據(jù)進行丟棄,但是在一些特殊的情況下,從數(shù)據(jù)庫中檢測的偏差數(shù)據(jù)具有重要的意義。偏差檢測的基本方法就是對觀測結果進行尋找,與參照值之間進行差別對比。
機器學習方法主要包括范例和歸納學習2種方法,這也是數(shù)據(jù)挖掘技術中常見的方法之一。
統(tǒng)計方法主要包括回歸分析、判別分析、聚類分析和探索性分析4種,在回歸分析中主要有多元回歸、自動回歸等;判別分析包括貝葉斯判別、費歇爾判別、非參數(shù)判別等;聚類分析主要有系統(tǒng)、動態(tài)聚類等;探索分析包括主元分析、相關分析等。
數(shù)據(jù)庫方法包括多維度的數(shù)據(jù)分析或者在線的數(shù)據(jù)分析處理等,同時還有面向屬性的歸納方式等。
神經(jīng)網(wǎng)絡方法有前向神經(jīng)網(wǎng)絡和自動組織神經(jīng)網(wǎng)絡等,需要根據(jù)挖掘數(shù)據(jù)的不同進行適當?shù)倪x擇[4]。
在數(shù)據(jù)挖掘技術中,還包括遺傳算法、近似和不確定推力等方法,主要是根據(jù)數(shù)據(jù)庫中數(shù)據(jù)形態(tài)的不同進行選擇,以此來更好地保證數(shù)據(jù)挖掘的精準性和良好性。
數(shù)據(jù)挖掘技術的應用主要是源于商業(yè)價值的直接需要,因此數(shù)據(jù)挖掘技術在各行業(yè)中都有著較為廣泛的應用價值。本文根據(jù)電力行業(yè)特點來闡述數(shù)據(jù)挖掘技術在電力企業(yè)中應用的價值。
在電力設備更新的過程中,主要有2種方式,首先是電力設備意外損壞,針對這樣的情況需要及時進行更新,這種更新需要通過對電力設備進行實時監(jiān)控,或者通過安裝監(jiān)控系統(tǒng)的及時發(fā)現(xiàn),然后對損壞設備進行維修或者更換。其次是對老化的電力設備進行更新,現(xiàn)階段主要是通過工作人員常年工作積累的經(jīng)驗對電力設備老化情況進行判斷,比如提供使用年限來判定設備老化程度等[5]。但是憑借工作經(jīng)驗對設備進行判斷也會存在一定的誤差問題,比如一些設備已經(jīng)達到使用期限,但是設備的養(yǎng)護措施完善,依舊可以繼續(xù)進行使用,但是評價工作經(jīng)驗認定設備需要進行更換,造成不必要的浪費,或者部分設備沒有達到使用年限,但是各種參數(shù)已經(jīng)不能滿足使用要求,卻沒有得到及時更換,導致電力資源出現(xiàn)大量的損耗問題。數(shù)據(jù)挖掘技術的有效應用,能夠對經(jīng)驗判斷方式存在的問題進行改善,通過數(shù)據(jù)挖掘將存在故障問題的設備進行確定,對設備故障檢修記錄、電力損耗情況以及各種參數(shù)進行分析,從而判定設備故障和老化的實際情況,電力企業(yè)將此作為基本的標準,最終決定設備是否需要進行更新。
在電力企業(yè)發(fā)展的過程中,集團公司對一個子公司的業(yè)績進行評價,一直以來都是集團企業(yè)業(yè)績總結中較為困難的問題。只針對利潤方面對子公司業(yè)績進行分析,受到地區(qū)影響的子公司,利潤也會有所變化。并且電力資源關系到國民的升級問題,安全與其余方面都比利潤更加重要,因此以利潤對子公司業(yè)績進行分析,較為片面,不能全面概括子公司發(fā)展的實際情況。數(shù)據(jù)挖掘技術能在最大程度上對子公司業(yè)績進行評價,綜合多方面的因素進行考慮,通過對利潤進行分析,將利潤增長概率與同行業(yè)進行比較等數(shù)據(jù)進行組合,從而對某一個地區(qū)內(nèi)的子公司經(jīng)營情況進行分析。同時,利用最為直觀的方式將分析結果進行展示,比如圖表,更加方便領導人員對子公司的業(yè)績進行最終評估。
近幾年來,我國電力行業(yè)的發(fā)展較為緊張,電力企業(yè)電力供應情況不能很好地滿足社會對電力資源的基本需求,出現(xiàn)這樣的問題主要是因為電力企業(yè)沒有掌握好市場發(fā)展的基本趨勢,無論是電站建設,還是電網(wǎng)建設都沒有很好地跟隨時代發(fā)展的趨勢。而針對這樣的情況數(shù)據(jù)挖掘技術就能發(fā)揮出良好的作用,通過對新增用戶、現(xiàn)有用戶、用戶位置、用電情況以及國家建設規(guī)劃等方面的數(shù)據(jù)進行分析,能夠對電力企業(yè)未來的發(fā)展和建設提供指導,更好地保證電力企業(yè)供電的實際效果,在滿足市場基本需求的基礎上,更好地促進電力企業(yè)的穩(wěn)定發(fā)展,在電廠和電網(wǎng)中安裝更大容量的電力設備等。
自從我國提出電力企業(yè)改革的相關方案,為電力企業(yè)的改革與發(fā)展奠定更好的基礎,隨著電力企業(yè)改革的逐漸完善,許多全新的問題出現(xiàn)在電力企業(yè)發(fā)展的過程中。比如對電力設備的購買,傳統(tǒng)的電廠和電網(wǎng)都屬于一個集團企業(yè),電網(wǎng)和電廠的實際發(fā)電效率都會進行上報[6]??墒窃诟母镏螅娏Φ奶厥庑院凸╇姷男识际呛軓碗s的情況。因此,數(shù)據(jù)挖掘技術能夠給電力企業(yè)的發(fā)展提供更多幫助,通過對數(shù)據(jù)進行挖掘,解決設備采購和電力生產(chǎn)的相關問題,同時也能對電力企業(yè)的生產(chǎn)規(guī)劃進行指導。
電力設備的檢修工作主要分為日常檢修和故障檢修,日常檢修主要是檢修人員定期對電力設備進行檢查,及時發(fā)現(xiàn)設備存在的問題,不同檢修工作人員對設備檢修的效果存在偏差。故障檢修可以分為意外故障檢修和設備老化損失檢修,設備故障檢修可以通過監(jiān)控系統(tǒng)及時對問題進行發(fā)現(xiàn)并快速處理;設備老化檢修主要還是依靠檢修人員的專業(yè)知識和設備使用年限來進行判斷,這樣的判斷也會存在失誤的情況,造成設備的浪費。通過使用檢測設備和數(shù)據(jù)挖掘診斷技術,對設備出現(xiàn)的故障進行分析,挖掘設備中存在的各項參數(shù)問題,然后及時發(fā)出警報提醒檢修技術人員對設備進行檢查,這樣才能夠及時發(fā)現(xiàn)設備存在的故障問題。針對故障問題的類型安排專業(yè)的檢修人員對設備進行檢修,從而有效降低設備檢修的成本投入,提升電力設備實際使用的效率、效果和質量。
電網(wǎng)設備的選址工作是電網(wǎng)規(guī)劃中最為重要的規(guī)劃內(nèi)容,根據(jù)現(xiàn)階段國家電網(wǎng)建設計劃、地區(qū)城鄉(xiāng)發(fā)展規(guī)劃來對建設場地進行選擇,但是設備選址依舊存在不合理、不科學、重復建設及設備利用效率較低等問題。有效地使用數(shù)據(jù)挖掘技術,將國建電網(wǎng)建設規(guī)劃、污染、地形地質以及用戶信息進行全面整理和組合,針對不同地區(qū)的情況進行分析,不同時間段的國家建設規(guī)劃,需要根據(jù)地區(qū)發(fā)展規(guī)劃和電量使用情況進行劃分,從而更好地對設備運行情況進行分析,為電網(wǎng)規(guī)劃建設提供全面的參考信息[7]。
電網(wǎng)調(diào)度的主要目的是對電網(wǎng)內(nèi)部電力設備的基本能力進行充分挖掘,在滿足電網(wǎng)負荷要求的基礎上,確保電網(wǎng)設備安全穩(wěn)定的運行,數(shù)據(jù)挖掘技術能對電網(wǎng)變壓器符合效率進行分析,這些數(shù)據(jù)資料都能為電網(wǎng)高峰調(diào)度提供數(shù)據(jù)參考和數(shù)據(jù)支持。電力交易的主要目的是減少電力企業(yè)的支出,提升電力企業(yè)的經(jīng)濟效益。數(shù)據(jù)挖掘技術將電價信息、煤電聯(lián)動信息以及地區(qū)用電情況等數(shù)據(jù)進行組合,為電力交易提供決策,制定具有全面性和完善性的決策數(shù)據(jù)信息,為電力企業(yè)后續(xù)的發(fā)展奠定更加扎實的基礎,更好地促進電力企業(yè)的發(fā)展和進步,確保電力企業(yè)能夠符合市場發(fā)展的實際需求[8]。
隨著電網(wǎng)體制的不斷深化改革,在互聯(lián)網(wǎng)信息技術快速發(fā)展的背景下,數(shù)據(jù)挖掘技術有著更加良好的應用前景和發(fā)展?jié)摿?。將?shù)據(jù)挖掘技術有效地應用在電力企業(yè)各項工作中,能充分挖掘信息中含有的更多價值和更好的數(shù)據(jù)信息,對電力資源進行優(yōu)化配置,提升電力企業(yè)實際的競爭能力和經(jīng)濟效益,進一步推動電力企業(yè)的長久穩(wěn)定發(fā)展。