(1.北京清大華康電子技術(shù)有限責(zé)任公司,北京 100083;2.華北電力大學(xué)(北京)控制與計(jì)算機(jī)工程學(xué)院,北京 102206)
摘要:數(shù)據(jù)挖掘技術(shù)是一門跨學(xué)科的綜合研究領(lǐng)域,集計(jì)算機(jī)機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)管理、數(shù)據(jù)倉(cāng)庫(kù)、可視化、并行計(jì)算、決策支持為一體,利用數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)存儲(chǔ)和管理數(shù)據(jù),利用機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方法分析數(shù)據(jù)。在當(dāng)前社會(huì)節(jié)能減排的大環(huán)境下,電力從業(yè)者利用數(shù)據(jù)挖掘技術(shù)對(duì)機(jī)組發(fā)電過(guò)程中所產(chǎn)生的各種數(shù)據(jù)進(jìn)行深入的分析和研究,并以此來(lái)采取相關(guān)措施,可以更有效利用現(xiàn)有電力資源,優(yōu)化整合大型發(fā)電設(shè)備,不斷提高發(fā)電的可靠性和經(jīng)濟(jì)性。本文將對(duì)數(shù)據(jù)挖掘技術(shù)在機(jī)組能效分析中的具體應(yīng)用加以歸納和總結(jié)。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);能效測(cè)評(píng);數(shù)據(jù)倉(cāng)庫(kù);OLAP聯(lián)機(jī)分析處理;決策樹(shù)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 23-0000-02
伴隨著中國(guó)經(jīng)濟(jì)的快速騰飛,各工業(yè)、企業(yè)、居民對(duì)電力的依賴性越來(lái)越強(qiáng),電器設(shè)備及產(chǎn)品在日常工作與生活中隨處可見(jiàn)。據(jù)國(guó)際能源署在“全球能源展望報(bào)告”中預(yù)計(jì):中國(guó)的電力需求將在2030年內(nèi),每年增長(zhǎng)4.5%。為了擺脫持續(xù)的電力緊缺局面,國(guó)家近年來(lái)對(duì)電力行業(yè)投入了高達(dá)數(shù)千億的巨額資金,改造與新建了大批的發(fā)電廠與變電站,逐步緩解了用電緊張的局面。但是隨著用電負(fù)荷的節(jié)節(jié)攀升,對(duì)能源的依賴與消耗也飛速發(fā)展。當(dāng)前國(guó)家已經(jīng)把節(jié)能減排作為調(diào)整經(jīng)濟(jì)結(jié)構(gòu)、轉(zhuǎn)變發(fā)展方式的重要抓手,加大了資金投入與責(zé)任考核,完善了政策機(jī)制與綜合協(xié)調(diào)。發(fā)改委在《關(guān)于進(jìn)一步做好當(dāng)前節(jié)能減排工作的緊急通知》中要求實(shí)施節(jié)能減排預(yù)警調(diào)控要科學(xué)、合理、有序,加強(qiáng)“十二五”規(guī)劃研究,努力構(gòu)建節(jié)能減排長(zhǎng)效機(jī)制。
在日益緊張的供電需求壓力和市場(chǎng)經(jīng)濟(jì)發(fā)展必然規(guī)律的驅(qū)使下,電力企業(yè)體制改革不斷向縱深方向發(fā)展[1]。目前,廠網(wǎng)分開(kāi),競(jìng)價(jià)上網(wǎng)的方式已在全國(guó)范圍內(nèi)進(jìn)行推廣。而電廠燃料價(jià)格的持續(xù)上漲以及國(guó)家對(duì)節(jié)能減排政策的不斷加強(qiáng),所有這些都對(duì)各發(fā)電企業(yè)提出了嚴(yán)峻的挑戰(zhàn),\"用電需求\"和\"節(jié)能目標(biāo)\"兩大考題是擺在電力從業(yè)者面前不能回避的任務(wù),一方面要充分考慮滿足用電需求的不斷增長(zhǎng),另一方面更要做好電廠內(nèi)部的節(jié)能工作,提高能源利用效率,做到能源消耗穩(wěn)中有降。而要達(dá)到此目的,就需要對(duì)發(fā)電廠中的重要組成部分-發(fā)電機(jī)組的日常能效進(jìn)行全面的分析與調(diào)控,從而為各大電廠能夠在市場(chǎng)經(jīng)濟(jì)中不斷的完善自己和向前發(fā)展提供有利可靠的后勤保障。
在我國(guó),電廠生產(chǎn)過(guò)程監(jiān)控信息系統(tǒng)經(jīng)歷了近十年的發(fā)展,已經(jīng)開(kāi)發(fā)出了一些成熟的軟件,如華北電力大學(xué)研制的“機(jī)組經(jīng)濟(jì)性在線監(jiān)測(cè)診斷指導(dǎo)系統(tǒng)”、“控制系統(tǒng)分析、建模與優(yōu)化整定系統(tǒng)”、“鍋爐受熱面積灰結(jié)渣檢測(cè)系統(tǒng)”、“熱力設(shè)備應(yīng)力計(jì)算與壽命管理系統(tǒng)”、“設(shè)備故障檢測(cè)與診斷系統(tǒng)”、“全廠負(fù)荷優(yōu)化分配系統(tǒng)”等。這些產(chǎn)品已經(jīng)經(jīng)受了生產(chǎn)實(shí)踐的考驗(yàn),產(chǎn)生了良好的經(jīng)濟(jì)效益。但是由于數(shù)據(jù)源不統(tǒng)一和安裝布置的分散,以及不能數(shù)據(jù)共享等因素導(dǎo)致不能有效地、宏觀地得出電廠機(jī)組能效的評(píng)價(jià)和比較。
數(shù)據(jù)倉(cāng)庫(kù)(DataWarehouse)和數(shù)據(jù)挖掘(DataMining)技術(shù)的飛速發(fā)展為這種決策分析能力的實(shí)現(xiàn)提供了可能,同時(shí)也為電廠機(jī)組能效分析打開(kāi)了新的大門,成為評(píng)測(cè)機(jī)組性能的有效途徑之一[2]。我們可以在提供的機(jī)組數(shù)據(jù)的基礎(chǔ)上,通過(guò)創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù),利用OLAP聯(lián)機(jī)分析處理技術(shù)和數(shù)據(jù)挖掘技術(shù),比較各大電廠機(jī)組的能效情況,預(yù)測(cè)各大電廠機(jī)組的能效測(cè)評(píng)得分。并運(yùn)用這些數(shù)據(jù)分析技術(shù)形成一個(gè)電廠機(jī)組能效分析模型,提供多維分析功能、從而提高電廠機(jī)組發(fā)電效率,為電力企業(yè)提供一個(gè)高效、可靠的分析系統(tǒng)。
1 數(shù)據(jù)倉(cāng)庫(kù)的概念
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的且隨時(shí)間變化的數(shù)據(jù)集合。它以大型機(jī)組日常運(yùn)行數(shù)據(jù)為數(shù)據(jù)源,如煤質(zhì)、爐溫、蒸汽參數(shù)、機(jī)組容量等。
2 OLAP聯(lián)機(jī)分析處理技術(shù)
建立在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上的聯(lián)機(jī)分析處理技術(shù)通過(guò)對(duì)多維數(shù)據(jù)的聚合計(jì)算和聚合結(jié)果的預(yù)存儲(chǔ),支持對(duì)數(shù)據(jù)多角度、多側(cè)面的統(tǒng)計(jì)和觀察,從而達(dá)到對(duì)數(shù)據(jù)更為全面的把握和理解的目的。OLAP技術(shù)主要對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行表層的聚合統(tǒng)計(jì),力圖以統(tǒng)一的應(yīng)用邏輯和數(shù)據(jù)模型,在短時(shí)間內(nèi)響應(yīng)非數(shù)據(jù)處理專業(yè)人員的復(fù)雜查詢要求。
3 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘也叫數(shù)據(jù)開(kāi)采,數(shù)據(jù)采掘等,就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。一般來(lái)說(shuō),數(shù)據(jù)挖掘是利用各種分析方法和分析工具,在大規(guī)模海量數(shù)據(jù)中建立模型和發(fā)現(xiàn)數(shù)據(jù)間關(guān)系的過(guò)程,這些模型和關(guān)系可以用來(lái)進(jìn)行決策和預(yù)測(cè)。作為一門處理數(shù)據(jù)的新興技術(shù),它有許多的新特征。首先,數(shù)據(jù)挖掘面對(duì)的是海量的數(shù)據(jù),可能是GB或者TB級(jí),這也是數(shù)據(jù)挖掘產(chǎn)生的原因。其次,數(shù)據(jù)可能是不完全的、有噪聲的、隨機(jī)的、有復(fù)雜的數(shù)據(jù)結(jié)構(gòu)、維數(shù)大等特點(diǎn)。最后,數(shù)據(jù)挖掘是許多學(xué)科的交叉,運(yùn)用了統(tǒng)計(jì)學(xué),計(jì)算機(jī),數(shù)學(xué)等學(xué)科的知識(shí)。在較淺的層次上,它利用現(xiàn)有數(shù)據(jù)庫(kù)管理系統(tǒng)的查詢、檢索及報(bào)表功能,與多維分析、統(tǒng)計(jì)分析方法相結(jié)合、進(jìn)行聯(lián)機(jī)分析處理(OLAP),從而得出可供決策參考的統(tǒng)計(jì)分析數(shù)據(jù)。在深層次上,則從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)前所未有的、隱含的知識(shí)。
數(shù)據(jù)挖掘的算法主要有:(1)傳統(tǒng)統(tǒng)計(jì)方法:抽樣技術(shù)、多元統(tǒng)計(jì)分析、因子分析、聚類分析等;統(tǒng)計(jì)預(yù)測(cè)方法,如回歸分析、時(shí)間序列分析等。(2)可視化技術(shù):用圖表等方式把數(shù)據(jù)特征用直觀地表述出來(lái),如直方圖等,這其中運(yùn)用的許多描述統(tǒng)計(jì)的方法,可視化技術(shù)面對(duì)的一個(gè)難題是高維數(shù)據(jù)的可視化。(3)決策樹(shù):利用一系列規(guī)則劃分,建立樹(shù)狀圖,可用于分類和預(yù)測(cè),常用的算法有CART、CHAID、ID3、C4.5、C5.0等。(4)神經(jīng)網(wǎng)絡(luò):模擬人的神經(jīng)元功能,經(jīng)過(guò)輸入層、隱藏層、輸出層等,對(duì)數(shù)據(jù)進(jìn)行調(diào)整,計(jì)算,最后得到結(jié)果,用于分類和回歸。(5)遺傳算法:基于自然進(jìn)化理論,模擬基因聯(lián)合、突變、選擇等過(guò)程的一種優(yōu)化技術(shù)。(6)關(guān)聯(lián)規(guī)則挖掘算法:關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)之間存在關(guān)系的規(guī)則。(7)國(guó)外數(shù)據(jù)挖掘主要有對(duì)知識(shí)發(fā)現(xiàn)方法的研究,如近年來(lái)注重對(duì)Bayes(貝葉斯)方法以及Boosting方法的研究和提高;傳統(tǒng)的統(tǒng)計(jì)學(xué)回歸法在KDD中的應(yīng)用;KDD與數(shù)據(jù)庫(kù)的緊密結(jié)合。
4 數(shù)據(jù)挖掘在機(jī)組能效分析中的應(yīng)用
目前,數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中的應(yīng)用,還處于起步階段??蓢L試選用大型機(jī)組日常運(yùn)行數(shù)據(jù)為數(shù)據(jù)源,創(chuàng)建以機(jī)組能效測(cè)評(píng)為主題的數(shù)據(jù)倉(cāng)庫(kù)。在所建立的數(shù)據(jù)倉(cāng)庫(kù)模型上,對(duì)機(jī)組日常運(yùn)行數(shù)據(jù)進(jìn)行有目的的分析,主要是利用數(shù)據(jù)挖掘工具,通過(guò)關(guān)聯(lián)分析來(lái)挖掘煤質(zhì)與燃燒率之間、蒸汽參數(shù)與熱效率之間、短時(shí)啟停與煤耗之間、機(jī)組容量與發(fā)電效率之間的關(guān)系等內(nèi)容;用聚類分析挖掘哪些鍋爐熱效率更高、哪些汽輪機(jī)損耗更小、哪些機(jī)組在負(fù)荷分配、短時(shí)啟停上更具有優(yōu)勢(shì)等內(nèi)容,并利用OLAP工具創(chuàng)建與主題相關(guān)的維度和立方;選擇決策樹(shù)挖掘算法分析各項(xiàng)指標(biāo)對(duì)機(jī)組發(fā)電效率、節(jié)能情況的影響,預(yù)測(cè)各大電廠機(jī)組的能效測(cè)評(píng)得分情況以及各大電廠機(jī)組的能效分析結(jié)果,并對(duì)分析和挖掘結(jié)果進(jìn)行解釋和評(píng)價(jià),形成一個(gè)電廠機(jī)組能效分析評(píng)價(jià)的解決方案。
5 結(jié)束語(yǔ)
數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘技術(shù)從一開(kāi)始就是面向應(yīng)用的。隨著這些技術(shù)在理論上的日漸成熟,在實(shí)踐中的不斷發(fā)展。將為電力企業(yè)提高大型發(fā)電機(jī)組的經(jīng)濟(jì)性能和安全性能提供數(shù)據(jù)上強(qiáng)有力的保障,為管理者決策提供參考。
參考文獻(xiàn):
[1]付中廣,王同宇,付玲.電站機(jī)組運(yùn)行優(yōu)化[R].全國(guó)電力行業(yè)CFB機(jī)組技術(shù)交流服務(wù)協(xié)作網(wǎng)技術(shù)交流論文集,2006:148-155.
[2]申鵬飛.基于數(shù)據(jù)倉(cāng)庫(kù)的汽輪機(jī)性能分析預(yù)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:華北電力大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,2005.
[3]蒙祖強(qiáng),龔濤.Oracle10g數(shù)據(jù)庫(kù)Java開(kāi)發(fā)[M].北京:中國(guó)水利水電出版社,2005.
[作者簡(jiǎn)介]韓磊,男,北京人,本科學(xué)歷,工程師,北京清大華康電子技術(shù)有限責(zé)任公司,華北電力大學(xué)控制與計(jì)算機(jī)學(xué)院在職碩士研究生,從事電力技術(shù),數(shù)據(jù)挖掘方向的研究;鄭玲,女,華北電力大學(xué)控制與計(jì)算機(jī)學(xué)院碩士生導(dǎo)師。
計(jì)算機(jī)光盤軟件與應(yīng)用2012年23期