劉炳含, 付忠廣, 王永智, 王鵬凱, 高學(xué)偉
(華北電力大學(xué) 電站設(shè)備狀態(tài)監(jiān)測與控制教育部重點(diǎn)實(shí)驗(yàn)室,北京 102206)
隨著信息數(shù)字化時代的迅速發(fā)展,電力行業(yè)信息化也得到快速發(fā)展。廠級監(jiān)控信息系統(tǒng)(SIS,Supervisory Information System)和分布式控制系統(tǒng)(DCS,Distributed Control System)在電廠得到廣泛應(yīng)用,使得電廠海量運(yùn)行數(shù)據(jù)得以保存,數(shù)據(jù)挖掘技術(shù)在電力行業(yè)迅速崛起,很多學(xué)者開始運(yùn)用數(shù)據(jù)挖掘技術(shù)研究解決電站機(jī)組中遇到的問題[1-6]。數(shù)據(jù)挖掘聚類分析方法被廣泛應(yīng)用于解決電站鍋爐效率和NOx排放等優(yōu)化問題。趙歡等[7]提出一種基于模糊C-均值聚類算法實(shí)現(xiàn)多參量同步聚類,以確定鍋爐監(jiān)控參數(shù)基準(zhǔn)值的方法。錢瑾等[8]利用K-means算法分析實(shí)時運(yùn)行數(shù)據(jù),挖掘出再熱器壓損和鍋爐排煙溫度的基準(zhǔn)值。
聚類分析[9]作為數(shù)據(jù)挖掘中的經(jīng)典分析算法已經(jīng)被廣泛應(yīng)用于生物信息、網(wǎng)絡(luò)、圖像分析、智能推薦等許多領(lǐng)域。K-means(均值)[10]算法是一種經(jīng)典的聚類算法,具有算法簡單、收斂速度快等優(yōu)點(diǎn),在對數(shù)據(jù)進(jìn)行挖掘聚類時得到廣泛應(yīng)用。但在實(shí)際運(yùn)用中,K-means算法也存在不足之處,該算法依賴初始聚類數(shù)目,在聚類結(jié)果中容易出現(xiàn)局部最優(yōu)解,隨著迭代總次數(shù)的增加,聚類耗時增加。同時,面對海量數(shù)據(jù)聚類會產(chǎn)生大量候選集及冗余數(shù)據(jù)集,降低聚類效率及準(zhǔn)確率。為此,筆者首先引入粗糙集屬性約簡方法和Canopy聚類算法對K-means算法進(jìn)行改進(jìn),并利用粗糙集屬性約簡方法對源數(shù)據(jù)進(jìn)行簡化,剔除冗余數(shù)據(jù);結(jié)合Canopy算法,利用其不需設(shè)定聚類數(shù)目的特點(diǎn),對原始數(shù)據(jù)進(jìn)行聚類分析,以確定初始聚類中心及聚類數(shù)目,再通過K-means算法進(jìn)行迭代計(jì)算,得到最后的聚類結(jié)果,K-means算法的不足因此得到一定程度的彌補(bǔ)。
隨著智能電網(wǎng)的建設(shè)與普及,電廠DCS控制系統(tǒng)中儲存的發(fā)電數(shù)據(jù)量呈指數(shù)增加,使得傳統(tǒng)的數(shù)據(jù)挖掘算法無法滿足數(shù)據(jù)量、數(shù)據(jù)類型不斷增多的需求,落后的數(shù)據(jù)分析處理能力與數(shù)據(jù)快速增長之間的矛盾突顯。K-means算法在聚類過程中迭代總數(shù)增加,使得聚類效率降低、耗時增加,面對海量數(shù)據(jù)已經(jīng)不能滿足需求。尋求大數(shù)據(jù)分析挖掘的高級方法成為亟需解決的問題。
云計(jì)算的出現(xiàn)適應(yīng)了這種海量數(shù)據(jù)挖掘需求,云計(jì)算技術(shù)通過建立集群將儲存和計(jì)算能力分到集群中的多個儲存和計(jì)算節(jié)點(diǎn)上,從而實(shí)現(xiàn)了對大數(shù)據(jù)集的儲存和計(jì)算[11]。Hadoop是一個用于構(gòu)建云平臺的Apache開源項(xiàng)目,其核心構(gòu)件是分布式文件系統(tǒng)(HDFS)和MapReduce,HDFS對大文件實(shí)現(xiàn)儲存和容錯,MapReduce編程模式實(shí)現(xiàn)并行計(jì)算[12]。將Hadoop與傳統(tǒng)數(shù)據(jù)挖掘相結(jié)合的一個關(guān)鍵問題是傳統(tǒng)數(shù)據(jù)挖掘算法并行化的實(shí)現(xiàn),并行化計(jì)算是現(xiàn)階段處理海量數(shù)據(jù)最有效的方法[13-16]。
面對電站機(jī)組海量、高維度數(shù)據(jù),筆者引入粗糙集理論和Canopy算法對K-means算法進(jìn)行改進(jìn),通過MapReduce編程模式對改進(jìn)K-means算法實(shí)現(xiàn)并行化,以處理海量數(shù)據(jù)的計(jì)算,形成基于大數(shù)據(jù)技術(shù)的高效聚類算法,即RCK-means算法。與傳統(tǒng)K-means算法相比,新算法避免了出現(xiàn)局部最優(yōu)解,提高了聚類準(zhǔn)確率,剔除了冗余數(shù)據(jù)集,并極大地提高了聚類效率。
粗糙集理論是由波蘭數(shù)學(xué)家Pawlak于1982年提出的一種處理不確定性和不精確性問題的數(shù)據(jù)分析理論,其以信息系統(tǒng)為主要研究對象,在保持信息系統(tǒng)中數(shù)據(jù)分類能力不變的前提下,通過知識約簡確定問題的分類規(guī)則或決策[17]。與其他處理不確定問題的理論相比,粗糙集理論最顯著的區(qū)別在于其不需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)知識,對其他理論有很強(qiáng)的互補(bǔ)性。目前,粗糙集理論在臨床醫(yī)療診斷、預(yù)測與控制、模糊識別與分類等很多領(lǐng)域得到廣泛應(yīng)用[18]。
定義2設(shè)一個信息系統(tǒng)S=(U,A,V,f),C∪D=A,C∩D=φ,若屬性集A由條件屬性集C和決策屬性集D構(gòu)成,則稱S為一個決策信息系統(tǒng)。
定義3設(shè)一個信息系統(tǒng)S=(U,A,V,f),?R?A,論域U上關(guān)于R的不可分辨關(guān)系(等價關(guān)系)定義為:
(1)
定義4設(shè)一個信息系統(tǒng)S=(U,A,V,f),?X?U,R?A,則X基于等價關(guān)系IND(R)的上、下近似集分別定義為:
R*(X)={x∈U|[x]R∩X≠φ}
(2)
R*(X)={x∈U|[x]R?X}
(3)
集合PR=R*(X)稱為X基于等價關(guān)系IND(R)的正域;集合NR(X)=U-R*(X)稱為X基于等價關(guān)系IND(R)的負(fù)域;集合BR(X)=R*(X)-R*(X)稱為X基于等價關(guān)系IND(R)的邊界域。
當(dāng)BR(X)≠φ,即R*(X)≠R*(X)時,則X為R的粗糙集。
定義5設(shè)P是論域U上的一個等價關(guān)系簇,R∈P,若IND(P-{R})≠IND(P),則稱R為P的必需,否則不必需。若等價關(guān)系簇P中的每一門知識在P中都是必需的,則稱等價關(guān)系簇P是獨(dú)立的,否則是相關(guān)的。
定義6設(shè)P是論域U上的一個等價關(guān)系簇,Q?P且Q≠φ,若IND(Q)=IND(P)且Q是獨(dú)立的,則稱Q為P的一個約簡。而等價關(guān)系簇P的所有約簡形成的子簇稱為RED(P),P中所有必需知識形成的子簇稱為P的核,記為CORE(P)。
定義7設(shè)P和G為論域U上的2個等價關(guān)系簇,G的P正域定義為:
Pp(G)=PIND(P)(IND(G))
(4)
定義8設(shè)P和G為論域U上的2個等價關(guān)系簇,且R∈P,若PP(G)≠PP-(R)(G),則稱R為P中G相對必需的;否則稱R為P中G相對可約的。如果每一個R∈P都是G相對必需的,則稱P相對于G獨(dú)立;否則,稱P為G相關(guān)的。
定義9設(shè)P和G為論域U上的2個等價關(guān)系簇,若Q是P的G相對獨(dú)立子簇,且PQ(G)=PP(G),則稱Q為P的一個G相對約簡。
屬性約簡是粗糙集理論的核心內(nèi)容,其從原始特征中進(jìn)行最佳子集選擇,在眾多特征中選擇最重要的特征,剔除冗余數(shù)據(jù),降低數(shù)據(jù)維度,提高分析效率。筆者采用基于Pawlak屬性重要度的決策表屬性約簡算法進(jìn)行屬性約簡,屬性約簡的基本框架如圖1[19]所示。
圖1 屬性約簡的基本框架
Canopy算法思想:對于海量數(shù)據(jù),將輸入的數(shù)據(jù)點(diǎn)使用距離測量方法劃分為一些重疊的簇,稱為Canopy,然后對處于Canopy中的點(diǎn)采用精度較高的計(jì)算方法進(jìn)行聚類[20-21]。
K-means算法[10]是一種基于劃分聚類的經(jīng)典無監(jiān)督學(xué)習(xí)算法,其基本思想是:在原始數(shù)據(jù)集合中,隨機(jī)選擇k個數(shù)據(jù)點(diǎn),其初始值作為各個簇的中心。計(jì)算剩余非中心點(diǎn)的數(shù)據(jù)到各個簇中心的距離,將其分配到距離最近的聚類簇,然后重新計(jì)算每個簇的平均值,重新選取簇類中心點(diǎn),不斷重復(fù),直至目標(biāo)準(zhǔn)則函數(shù)收斂[21]。準(zhǔn)則函數(shù)的定義為:
(5)
準(zhǔn)則函數(shù)可以保證生成的簇盡可能緊湊,不同的簇之間盡可能獨(dú)立。
Hadoop具有吞吐量大、效率高、可靠性好及自動容錯等優(yōu)點(diǎn),近年來在處理海量數(shù)據(jù)方面應(yīng)用廣泛。HDFS作為Hadoop的數(shù)據(jù)儲存管理框架,由一個負(fù)責(zé)文件控制管理的主節(jié)點(diǎn)NameNode和若干個負(fù)責(zé)文件儲存的從節(jié)點(diǎn)DataNode聚合成一個單一的全局文件系統(tǒng)。系統(tǒng)中的文件被分成數(shù)據(jù)塊,并被復(fù)制儲存在若干個從節(jié)點(diǎn)中,默認(rèn)數(shù)據(jù)塊大小為64 MB。HDFS框架的可靠性體現(xiàn)在其將每一個數(shù)據(jù)塊分別復(fù)制儲存在3個獨(dú)立的從節(jié)點(diǎn)中,如果一個數(shù)據(jù)塊數(shù)據(jù)丟失,額外的副本數(shù)據(jù)仍可調(diào)用。
MapReduce是Hadoop的數(shù)據(jù)計(jì)算框架,適用于并行處理海量數(shù)據(jù)的分布式模型。Map(映射)函數(shù)和Reduce(歸約)函數(shù)是該框架的2大主要操作。將源數(shù)據(jù)文件按需求分成若干數(shù)據(jù)塊,以
圖2 MapReduce工作流程
RCK-means算法采用基于MapReduce的順序組合編程模型,對源數(shù)據(jù)屬性約簡后,按順序采用MapReduce將算法分成2個子框架(即Canopy框架和K-means框架)完成。如圖3所示,具體算法流程如下:
(1) 根據(jù)粗糙集屬性約簡需求建立初始決策表,確定條件屬性和決策屬性,依據(jù)決策屬性與條件屬性的依賴度進(jìn)行屬性約簡,剔除冗余數(shù)據(jù),形成新數(shù)據(jù)集。
(2) Canopy算法Map階段,將屬性約簡的新數(shù)據(jù)集轉(zhuǎn)化成
(3) Canopy算法Reduce階段,將Map階段輸出結(jié)果并集計(jì)算,生成數(shù)據(jù)集合Q。對集合Q進(jìn)行Canopy處理,不斷重復(fù)直至數(shù)據(jù)集合為空,得到聚類簇K及其中心點(diǎn),作為K-means框架的輸入值。
(4) K-means算法Map階段,根據(jù)Canopy框架得到的聚類簇,將聚類簇以
(5) Combine函數(shù)對Map函數(shù)的輸出值進(jìn)行劃分處理,在本地完成同一簇?cái)?shù)據(jù)的合并,將簇中數(shù)據(jù)所對應(yīng)的維度值求和,并計(jì)算數(shù)據(jù)對象個數(shù),以
(6) K-means算法Reduce階段,接收Combine函數(shù)輸出值,解析各簇中數(shù)據(jù)對應(yīng)維度值之和以及數(shù)據(jù)對象的總個數(shù),得到新的聚類中心,并進(jìn)行下一輪迭代,直至收斂。
圖3 RCK-means算法工作流程
電站鍋爐的節(jié)能降耗一直以來都是電站機(jī)組優(yōu)化控制的關(guān)鍵,鍋爐效率作為反映機(jī)組經(jīng)濟(jì)性、環(huán)保性的重要參數(shù),其優(yōu)化問題備受關(guān)注。目前,鍋爐效率優(yōu)化技術(shù)主要分為2類[23]:一類是通過改造燃燒器和受熱面來提高鍋爐效率,或是通過安裝先進(jìn)檢測設(shè)備實(shí)時精確控制鍋爐運(yùn)行重要參數(shù)。這類方法技術(shù)成熟、效果明顯,但耗費(fèi)大量人力和財(cái)力。另一類是在DCS基礎(chǔ)上,利用人工智能、數(shù)據(jù)挖掘等方法尋找最優(yōu)運(yùn)行參數(shù),實(shí)現(xiàn)鍋爐效率優(yōu)化。 這類優(yōu)化方法依賴于建立精確優(yōu)化模型和科學(xué)方便的優(yōu)化算法,通常優(yōu)化模型方法存在建模復(fù)雜、泛化能力差及樣本獲取困難等缺點(diǎn),實(shí)用效果不佳。
大數(shù)據(jù)挖掘技術(shù)以電站DCS系統(tǒng)積累的海量運(yùn)行數(shù)據(jù)為基礎(chǔ),以嚴(yán)謹(jǐn)?shù)倪\(yùn)算邏輯為依據(jù),從熱力系統(tǒng)自身運(yùn)行數(shù)據(jù)中分析挖掘影響鍋爐效率的因素,雖然挖掘得到的最優(yōu)運(yùn)行參數(shù)值與理論最優(yōu)值存在一定偏差,但其詮釋了運(yùn)行參數(shù)的歷史最優(yōu)可達(dá)值。筆者基于改進(jìn)的K-means聚類算法結(jié)合Hadoop大數(shù)據(jù)處理框架,在海量運(yùn)行數(shù)據(jù)中利用各數(shù)據(jù)集(簇)聚類中心點(diǎn)尋找影響鍋爐效率的最優(yōu)數(shù)據(jù)集(簇),經(jīng)過詳實(shí)的理論依據(jù)和數(shù)學(xué)驗(yàn)證對海量運(yùn)行數(shù)據(jù)進(jìn)行挖掘,得到的挖掘結(jié)果具有極強(qiáng)代表性和可靠實(shí)際應(yīng)用性,可對現(xiàn)場運(yùn)行提供指導(dǎo)作用。
以某600 MW燃煤機(jī)組鍋爐為研究對象,該鍋爐采用擺動四角切圓燃燒器,選取2013-03-01—2013-05-31的運(yùn)行數(shù)據(jù)129 600條,采樣周期為60 s。
筆者將鍋爐效率作為挖掘目標(biāo),通過RCK-means算法確定影響鍋爐效率的可調(diào)控運(yùn)行參數(shù),在典型負(fù)荷下,利用各聚類中心點(diǎn)與鍋爐效率的對應(yīng)關(guān)系挖掘最優(yōu)性能參數(shù),用于指導(dǎo)實(shí)際運(yùn)行。鍋爐效率的影響因素眾多,以下分析各運(yùn)行可調(diào)參數(shù)對鍋爐效率的影響,以此為基礎(chǔ)選取相關(guān)參數(shù)。
(1) 排煙氧量。
排煙氧量即過量空氣系數(shù),在燃燒過程中,過量空氣系數(shù)過小,會使鍋爐未完全燃燒損失增加,燃燒不充分,鍋爐效率降低;過量空氣系數(shù)過大,可減少不完全燃燒損失,但會增加排煙損失,鍋爐效率降低。因此,選取適當(dāng)?shù)倪^量空氣系數(shù)范圍,對提高鍋爐效率與經(jīng)濟(jì)運(yùn)行至關(guān)重要。
(2) 磨煤機(jī)給煤量。
鍋爐負(fù)荷在一定范圍內(nèi),磨煤機(jī)組合差異及不同的煤量分配比會使火焰中心高度發(fā)生變化?;鹧嬷行母叨冗^高,將造成爐膛出口溫度升高及對流換熱量增加,各段工質(zhì)吸熱量發(fā)生變化,從而影響鍋爐效率。
(3) 一、二次風(fēng)參數(shù)。
一次風(fēng)對鍋爐爐膛溫度有著極其重要的影響,爐膛溫度高,燃燒著火快,燃燒速度快,使燃燒更加完全;但爐膛溫度過高,會使燃燒逆反應(yīng)加快,造成燃燒不完全。此外,一次風(fēng)提高煤粉氣流溫度,可使煤粉著火提前,燃料燃燒時間充分,飛灰含碳量減少。二次風(fēng)對著火穩(wěn)定性和燃燒燃盡過程起著重要作用。一、二次風(fēng)的配合為爐內(nèi)提供良好的空氣動力場,使得煤粉與空氣充分混合,保證煤粉完全燃燒。同時,二次風(fēng)可加強(qiáng)擾動混合,破壞煤粉表層的燃盡灰層,有利于燃燒完全。
在鍋爐正常運(yùn)行工況下,鍋爐一次風(fēng)由燃料量按比例控制,即在實(shí)際運(yùn)行過程中,一次風(fēng)量與相應(yīng)的燃料量線性相關(guān),故一次風(fēng)不作為選用參數(shù)。
(4) 燃燒器擺角。
對于四角切圓燃燒器鍋爐而言,燃燒器的擺動不但會造成火焰中心偏移,還會使切圓直徑發(fā)生變化,因此燃燒器擺角會對鍋爐效率產(chǎn)生影響。
(5) 排煙溫度和飛灰含碳量。
鍋爐排煙溫度和飛灰含碳量同樣是影響鍋爐效率的重要參數(shù)。鍋爐排煙熱損失過高或過低都會對鍋爐的經(jīng)濟(jì)性和安全性產(chǎn)生影響。飛灰含碳量增加將造成鍋爐效率降低。排煙溫度和飛灰含碳量屬于燃燒狀態(tài)監(jiān)測參數(shù),反映燃燒效率和燃燒狀態(tài),因此不作為運(yùn)行可調(diào)參數(shù)。
綜上所述,排煙氧量、磨煤機(jī)煤量、燃燒器擺角、一次風(fēng)及二次風(fēng)參數(shù)等都是影響鍋爐效率的重要因素,同時煤種質(zhì)量和環(huán)境溫度等外界條件也對鍋爐效率影響很大。在選取確定煤種(準(zhǔn)格爾煙煤)和冷風(fēng)溫度(10~20 ℃)的情況下,通過選取與鍋爐效率密切相關(guān)、可實(shí)際調(diào)控的運(yùn)行參數(shù)作為大數(shù)據(jù)挖掘?qū)ο?,挖掘影響鍋爐效率的最優(yōu)目標(biāo)值。表1為大數(shù)據(jù)挖掘的運(yùn)行參數(shù)對象。
表1 鍋爐可調(diào)運(yùn)行參數(shù)
大數(shù)據(jù)預(yù)處理作為大數(shù)據(jù)挖掘技術(shù)至關(guān)重要的一環(huán),主要包括下面幾個步驟:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)歸約[24]。
由于DCS中歷史數(shù)據(jù)在收集過程中含有異常和噪聲數(shù)據(jù)較多,因此數(shù)據(jù)清洗過程格外重要。筆者采用的大數(shù)據(jù)處理方法本質(zhì)是通過數(shù)據(jù)區(qū)間劃分來進(jìn)行大數(shù)據(jù)分析和最優(yōu)解挖掘的,因此采用凝聚層次聚類等相關(guān)操作剔除離散點(diǎn)數(shù)據(jù)。
粗糙集理論屬性約簡的不可分辨關(guān)系決定了其只可處理離散型數(shù)據(jù),而在DCS中采集的數(shù)據(jù)一般被認(rèn)為是連續(xù)型數(shù)據(jù),因此在屬性約簡前需對數(shù)據(jù)進(jìn)行離散化。數(shù)據(jù)離散化方法多種多樣,傳統(tǒng)的離散化方法對區(qū)間分割點(diǎn)的選取十分困難,而區(qū)間劃分結(jié)果對粗糙集分析也會產(chǎn)生很大影響,離散差異容易造成有價值數(shù)據(jù)丟失。筆者采用模糊集與粗糙集相結(jié)合的模糊粗糙集離散方法[25],利用模糊性和粗糙性2種不確定性數(shù)學(xué)方法形成的數(shù)據(jù)相似度對數(shù)據(jù)集合進(jìn)行“柔化分”和屬性約簡。這種方法可有效克服粗糙集對邊界值過于苛刻的缺點(diǎn),同時避免了有價值數(shù)據(jù)的丟失。
首先在服務(wù)器上安裝Linux Centos 6.5操作系統(tǒng),并設(shè)置root用戶自動訪問,再下載解壓Hadoop-1.2.1及JDK-1.6.0并安裝,其間要保證服務(wù)器上Hadoop和JDK的安裝路徑HADOOP_HOME和JAVA_HOME一致。然后設(shè)置SSH免密碼登錄以實(shí)現(xiàn)各節(jié)點(diǎn)間的無密碼訪問,同時保障數(shù)據(jù)傳輸?shù)陌踩?。Hadoop平臺的配置主要是對conf/core-site.xml、conf/mapred-site.xml和conf/hdfs-site.xml 3個文件進(jìn)行配置。其中,conf/core-site.xml文件設(shè)置Hadoop的全局屬性參數(shù),conf/mapred-site.xml文件設(shè)置MapReduce的運(yùn)行任務(wù)參數(shù),conf/hdfs-site.xml文件設(shè)置HDFS的數(shù)據(jù)備份參數(shù)。完成Hadoop基本配置后,在Hadoop根目錄下對HDFS執(zhí)行格式化命令,查看各節(jié)點(diǎn)運(yùn)行狀況并運(yùn)行Hadoop環(huán)境。
用第2.1節(jié)所示基于Pawlak屬性重要度的決策表屬性約簡算法對所選數(shù)據(jù)進(jìn)行屬性約簡,將12個運(yùn)行參數(shù)作為條件屬性,鍋爐效率作為決策屬性,其中每一個運(yùn)行參數(shù)均被作為屬性約簡的一個屬性。采用依賴度增量最大的啟發(fā)式快速約簡方法,設(shè)置依賴度增量閾值Δγ=0.005,當(dāng)依賴度增量大于閾值時,則該屬性歸于約簡中。由于A送風(fēng)機(jī)動葉開度與B送風(fēng)機(jī)動葉開度呈近似線性關(guān)系,其依賴度增量變化值小于Δγ,故將A送風(fēng)機(jī)動葉開度作為一個約簡,其他屬性約簡亦如此。經(jīng)計(jì)算得到與原數(shù)據(jù)集具有相同分類能力且依賴度增量最大的屬性約簡集結(jié)果RED(P)={a3,a4,a12},其中各約簡的屬性依賴度如表2所示。
應(yīng)用RCK-means算法對約簡后的數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘。設(shè)置Hadoop平臺最小支持度為2%(即某負(fù)荷區(qū)間數(shù)據(jù)聚類個數(shù)不小于數(shù)據(jù)總數(shù)量的2%)。將鍋爐負(fù)荷采用K-means聚類分為290~326 MW,327~357 MW,358~387 MW,388~415 MW,416~441 MW,442~477 MW,478~512 MW,513~544 MW,545~579 MW,580~603 MW等10個負(fù)荷段。根據(jù)算法流程對已約簡數(shù)據(jù)集進(jìn)行大數(shù)據(jù)挖掘,尋找各聚類中心點(diǎn)與鍋爐效率對應(yīng)關(guān)系的最優(yōu)解?,F(xiàn)以負(fù)荷388~415 MW的聚類結(jié)果為例進(jìn)行分析,聚類結(jié)果如表3所示。表3中,第8類的鍋爐效率最高,且類中有足夠多的數(shù)據(jù)元組,可將其定為一個樣本點(diǎn)。依此方法,選取其他各負(fù)荷區(qū)間聚類結(jié)果樣本點(diǎn),得到如表4所示的樣本點(diǎn)集。
表2 約簡屬性依賴度
由表4可以得出負(fù)荷與各可調(diào)參數(shù)在確定煤種和冷風(fēng)溫度(10~20 ℃)下的優(yōu)化曲線,現(xiàn)以排煙氧量的優(yōu)化曲線和設(shè)計(jì)曲線為例進(jìn)行對比。如圖4所示,鍋爐排煙氧量只給定了機(jī)組300 MW、450 MW和600 MW負(fù)荷工作點(diǎn)的設(shè)計(jì)數(shù)值,可以發(fā)現(xiàn)排煙氧量的設(shè)計(jì)值與優(yōu)化值存在很大偏差。在低負(fù)荷時,排煙氧量優(yōu)化值高于設(shè)計(jì)值,由于低負(fù)荷時鍋爐著火及燃燒條件差,適當(dāng)?shù)卦黾优艧熝趿坑欣跍p少不完全燃燒熱損失,提高鍋爐效率;在負(fù)荷增加至約550 MW及以上時,鍋爐燃燒趨于穩(wěn)定,排煙氧量優(yōu)化值逐漸減小,直至低于設(shè)計(jì)值,由于高負(fù)荷時鍋爐燃燒穩(wěn)定,適當(dāng)?shù)亟档团艧熝趿坑欣跍p少排煙熱損失。因此,在機(jī)組實(shí)際運(yùn)行中,為保證不同運(yùn)行工況下達(dá)到較高的效率,不能采用設(shè)計(jì)值,應(yīng)分別對機(jī)組不同工況簇下的運(yùn)行數(shù)據(jù)進(jìn)行優(yōu)化,選取各參數(shù)的最優(yōu)目標(biāo)值。圖5和圖6分別給出了燃燒器擺角及B送風(fēng)機(jī)動葉開度的優(yōu)化曲線以及機(jī)組300 MW、400 MW、500 MW和600 MW負(fù)荷工作點(diǎn)的習(xí)慣運(yùn)行數(shù)值組成的運(yùn)行曲線。由圖5可知,燃燒器擺角的優(yōu)化曲線與運(yùn)行曲線存在一定差異,從優(yōu)化曲線可以看出,隨著負(fù)荷的增加,燃燒器擺角逐漸減小;當(dāng)負(fù)荷達(dá)到400 MW時,燃燒器擺角呈增大趨勢,由于負(fù)荷的增加,上層磨煤機(jī)啟動,給煤量增加,火焰中心位置上升,二次風(fēng)量增加,為防止?fàn)t膛出口煙氣溫度升高及對流受熱面結(jié)渣,燃燒器擺角增大;隨著負(fù)荷的不斷增加,火焰中心位置上升,燃燒器擺角逐漸減小。由圖6可知,送風(fēng)機(jī)動葉開度的優(yōu)化曲線與運(yùn)行曲線大致趨勢相同,但也存在一定差異。由優(yōu)化曲線可知,在低負(fù)荷時,送風(fēng)機(jī)動葉開度較小,當(dāng)負(fù)荷達(dá)到375 MW時,送風(fēng)機(jī)動葉開度逐漸增大,其原因是在高負(fù)荷時,為了控制污染物排放和防止燃燒器噴口結(jié)焦及總風(fēng)量的限制,需要提高一、二次風(fēng)配比,因此送風(fēng)機(jī)動葉開度變大。
表3 第4負(fù)荷區(qū)間鍋爐效率聚類分析結(jié)果
表4 各負(fù)荷區(qū)間對應(yīng)鍋爐效率最高的樣本點(diǎn)
圖4 排煙氧量的優(yōu)化和設(shè)計(jì)曲線
圖5 燃燒器擺角的優(yōu)化曲線
圖6 B送風(fēng)機(jī)動葉開度優(yōu)化曲線
但應(yīng)注意的是,得到的各個參數(shù)的優(yōu)化曲線值不可單獨(dú)考慮,各優(yōu)化參數(shù)值是一個整體共存的關(guān)系,為使鍋爐效率達(dá)到較高水平,應(yīng)設(shè)置各優(yōu)化參數(shù)均在最優(yōu)值區(qū)間。鍋爐效率的優(yōu)化曲線與設(shè)計(jì)標(biāo)準(zhǔn)曲線的關(guān)系如圖7所示。由圖7可知,鍋爐效率優(yōu)化曲線的效率值較設(shè)計(jì)曲線提高很多,隨著負(fù)荷的增加,優(yōu)化值與設(shè)計(jì)值的差值變小。采用RCK-means算法選取影響鍋爐效率的可調(diào)控運(yùn)行參數(shù)進(jìn)行鍋爐效率大數(shù)據(jù)挖掘優(yōu)化,經(jīng)優(yōu)化后鍋爐效率可以達(dá)到歷史較佳水平。
圖7 鍋爐效率的優(yōu)化和設(shè)計(jì)曲線
合理確定運(yùn)行參數(shù)優(yōu)化目標(biāo)值是火電機(jī)組優(yōu)化運(yùn)行的核心問題?;诖髷?shù)據(jù)技術(shù)處理方法,挖掘出影響鍋爐效率的最優(yōu)運(yùn)行參數(shù)。RCK-means新算法避免了出現(xiàn)局部最優(yōu)解,提高了聚類準(zhǔn)確率,剔除了冗余數(shù)據(jù)集,并極大地提高了聚類效率。同時,利用并行算法解決了傳統(tǒng)數(shù)據(jù)處理方法無法勝任海量數(shù)據(jù)處理的不足。通過對電站機(jī)組實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行挖掘,得到典型負(fù)荷下可調(diào)運(yùn)行參數(shù)的最優(yōu)目標(biāo)值。在機(jī)組實(shí)際運(yùn)行中,為保證不同運(yùn)行工況下達(dá)到較高的鍋爐效率,不能采用設(shè)計(jì)值,應(yīng)設(shè)置各優(yōu)化參數(shù)均在最優(yōu)值區(qū)間,分別對機(jī)組不同工況簇下的運(yùn)行數(shù)據(jù)進(jìn)行優(yōu)化,選取各參數(shù)的最優(yōu)目標(biāo)值。
參考文獻(xiàn):
[1] 齊敏芳, 付忠廣, 景源, 等. 基于信息熵與主成分分析的火電機(jī)組綜合評價方法[J].中國電機(jī)工程學(xué)報(bào), 2013, 33(2): 58-64.
QI Minfang, FU Zhongguang, JING Yuan, et al. A comprehensive evaluation method of power plant units based on information entropy and principal component analysis[J].ProceedingsoftheCSEE, 2013, 33(2): 58-64.
[2] 付文峰, 侯艷峰, 王藍(lán)婧, 等. 基于自適應(yīng)粒子群算法的燃煤-捕碳機(jī)組熱力系統(tǒng)優(yōu)化設(shè)計(jì)[J].動力工程學(xué)報(bào), 2016, 36(9): 746-752.
FU Wenfeng, HOU Yanfeng, WANG Lanjing, et al. Optimized design for thermodynamic system of coal-fired power plants with CO2capture based on AWPSO algorithm[J].JournalofChineseSocietyofPowerEngineering, 2016, 36(9): 746-752.
[3] 崔超, 劉吉臻, 楊婷婷. 基于GA和模糊關(guān)聯(lián)規(guī)則的鍋爐脫硝經(jīng)濟(jì)性優(yōu)化[J].動力工程學(xué)報(bào), 2016, 36(4): 300-306.
CUI Chao, LIU Jizhen, YANG Tingting. Economical optimization of a boiler denitration system based on GA and fuzzy association rules[J].JournalofChineseSocietyofPowerEngineering, 2016, 36(4): 300-306.
[4] 付忠廣, 齊敏芳. 基于最大熵投影尋蹤耦合的燃煤機(jī)組節(jié)能減排評價方法研究[J].中國電機(jī)工程學(xué)報(bào), 2014, 34(26): 4476-4482.
FU Zhongguang, QI Minfang. Study on the evaluation method of energy-saving and emission reduction of coal-fired units based on projection pursuit method coupled with maximum entropy[J].ProceedingoftheCSEE, 2014, 34(26): 4476-4482.
[5] 余廷防, 耿平, 霍二光, 等. 基于智能算法的燃煤電站鍋爐燃燒優(yōu)化[J].動力工程學(xué)報(bào), 2016, 36(8): 594-599.
YU Tingfang, GENG Ping, HUO Erguang, et al. Combustion optimization of a coal-fired boiler based on intelligent algorithm[J].JournalofChineseSocietyofPowerEngineering, 2016, 36(8): 594-599.
[6] 高芳, 翟永杰, 卓越, 等. 基于共享最小二乘支持向量機(jī)模型的電站鍋爐燃燒系統(tǒng)的優(yōu)化[J].動力工程學(xué)報(bào), 2012, 32(12): 928-933, 940.
GAO Fang, ZHAI Yongjie, ZHUO Yue, et al. Combustion optimization for utility boilers based on sharing LSSVM model[J].JournalofChineseSocietyofPowerEngineering, 2012, 32(12): 928-933, 940.
[7] 趙歡, 王培紅, 錢瑾, 等. 基于模糊C-均值聚類的鍋爐監(jiān)控參數(shù)基準(zhǔn)值建模[J].中國電機(jī)工程學(xué)報(bào), 2011, 31(32): 16-22.
ZHAO Huan, WANG Peihong, QIAN Jin, et al. Modeling for target-value of boiler monitoring parameters based on fuzzy C-means clustering algorithm[J].ProceedingsoftheCSEE, 2011, 31(32): 16-22.
[8] 錢瑾, 王培紅, 李琳. 聚類算法在鍋爐運(yùn)行參數(shù)基準(zhǔn)值分析中的應(yīng)用[J].中國電機(jī)工程學(xué)報(bào), 2007, 27(23): 71-74.
QIAN Jin, WANG Peihong, LI Lin. Application of clustering algorithm in target-value analysis for boiler operating parameter[J].ProceedingsoftheCSEE, 2007, 27(23): 71-74.
[9] QIAN Weining, ZHOU Aoying. Analyzing popular clustering algorithms from different viewpoints[J].JournalofSoftware, 2002, 13(8): 1382-1394.
[10] MACQUEEN J. Some methods for classification and analysis of multivariate observations[C]//Proceedingsofthe5thBerkeleySymposiumonMathematicalStatisticsandProbability. Berkeley, USA: University of California Press, 1967.
[11] 王意潔, 孫衛(wèi)東, 周松, 等. 云計(jì)算環(huán)境下的分布存儲關(guān)鍵技術(shù)[J].軟件學(xué)報(bào), 2012, 23(4): 962-986.
WANG Yijie, SUN Weidong, ZHOU Song, et al. Key technologies of distributed storage for cloud computing[J].JournalofSoftware, 2012, 23(4): 962-986.
[12] 王彥明, 奉國和, 薛云. 近年來Hadoop國內(nèi)外研究綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用, 2013, 22(6): 1-5, 28.
WANG Yanming, FENG Guohe, XUE Yun. Summary of Hadoop research in recent years in foreign countries[J].ComputerSystems&Applications, 2013, 22(6): 1-5, 28.
[13] 趙莉, 侯興哲, 胡君, 等. 基于改進(jìn)K-means算法的海量智能用電數(shù)據(jù)分析[J].電網(wǎng)技術(shù), 2014, 38(10): 2715-2720.
ZHAO Li, HOU Xingzhe, HU Jun, et al. Improved K-means algorithm based analysis on massive data of intelligent power utilization[J].PowerSystemTechnology, 2014, 38(10): 2715-2720.
[14] 王德文, 孫志偉. 電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測[J].中國電機(jī)工程學(xué)報(bào), 2015, 35(3): 527-537.
WANG Dewen, SUN Zhiwei. Big data analysis and parallel load forecasting of electric power user side[J].ProceedingsoftheCSEE, 2015, 35(3): 527-537.
[15] 宋亞奇, 周國亮, 朱永利, 等. 云平臺下并行總體經(jīng)驗(yàn)?zāi)B(tài)分解局部放電信號去噪方法[J].電工技術(shù)學(xué)報(bào), 2015, 30(18): 213-222.
SONG Yaqi, ZHOU Guoliang, ZHU Yongli, et al. Research on parallel ensemble empirical mode decomposition denoising method for partial discharge signals based on cloud platform[J].TransactionsofChinaElectrotechnicalSociety, 2015, 30(18): 213-222.
[16] 萬祥, 胡念蘇, 韓鵬飛, 等. 大數(shù)據(jù)挖掘技術(shù)應(yīng)用于汽輪機(jī)組運(yùn)行性能優(yōu)化的研究[J].中國電機(jī)工程學(xué)報(bào), 2016, 36(2): 459-467.
WAN Xiang, HU Niansu, HAN Pengfei, et al. Research on application of big data mining technology in performance optimization of steam turbines[J].ProceedingsoftheCSEE, 2016, 36(2): 459-467.
[17] PAWLAK Z. Rough sets[J].InternationalJournalofComputer&InformationSciences, 1982, 11(5): 341-356.
[18] 胡可云, 陸玉昌, 石純一. 粗糙集理論及其應(yīng)用進(jìn)展[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2001, 41(1): 64-68.
HU Keyun, LU Yuchang, SHI Chunyi. Advances in rough set theory and its appliations[J].JournalofTsinghuaUniversity(ScienceandTechnology), 2001, 41(1): 64-68.
[19] 李天瑞, 羅川, 陳紅梅, 等. 大數(shù)據(jù)挖掘的原理與方法——基于粒計(jì)算與粗糙集的視角[M]. 北京: 科學(xué)出版社, 2016: 24-31.
[20] 孫吉貴, 劉杰, 趙連宇. 聚類算法研究[J].軟件學(xué)報(bào), 2008, 19(1): 48-61.
SUN Jigui, LIU Jie, ZHAO Lianyu. Clustering algorithms research[J].JournalofSoftware, 2008, 19(1): 48-61.
[21] 高榕, 李晶, 肖雅夫, 等. 基于云環(huán)境K-means聚類的并行算法[J].武漢大學(xué)學(xué)報(bào)(理學(xué)版), 2015, 61(4): 368-374.
GAO Rong, LI Jing, XIAO Yafu, et al. Parallel algorithm based on K-means clustering in cloud environment[J].JournalofWuhanUniversity(NaturalScienceEdition), 2015, 61(4): 368-374.
[22] 王德文, 劉曉建. 基于MapReduce的電力設(shè)備并行故障診斷方法[J].電力自動化設(shè)備, 2014, 34(10): 116-120.
WANG Dewen, LIU Xiaojian. Parallel fault diagnosis based on MapReduce for electric power equipments[J].ElectricPowerAutomationEquipment, 2014, 34(10): 116-120.
[23] 楊婷婷. 基于數(shù)據(jù)的電站節(jié)能優(yōu)化控制研究[D]. 北京: 華北電力大學(xué), 2010.
[24] 方洪鷹. 數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理的方法研究[D]. 重慶: 西南大學(xué), 2009.
[25] WU Weizhi, MI Jusheng, ZHANG Wenxiu. Generalized fuzzy rough sets[J].InformationSciences, 2003, 151: 263-282.