王濤 吳強(qiáng)
(紹興文理學(xué)院計(jì)算機(jī)科學(xué)與工程系,浙江紹興 312000)
極端天氣頻現(xiàn)表示地球環(huán)境已達(dá)到某種臨界狀態(tài),環(huán)境污染和各方面的能耗是造成極端天氣的主要原因。各個(gè)行業(yè)的節(jié)能減排迫在眉睫。大型燃煤機(jī)組的性能改善對(duì)節(jié)能減排具有十分重要的研究意義。
本文以某火電廠1000MW超超臨界燃煤機(jī)組大量的運(yùn)行數(shù)據(jù)為原始分析資源[1],該機(jī)組標(biāo)準(zhǔn)輸入輸出設(shè)計(jì)點(diǎn)近20000個(gè),33000多個(gè)數(shù)據(jù)庫(kù)標(biāo)簽,機(jī)組運(yùn)轉(zhuǎn)中的監(jiān)測(cè)點(diǎn)6500多個(gè),實(shí)時(shí)產(chǎn)生大量的數(shù)據(jù)。通過大數(shù)據(jù)分析技術(shù),對(duì)燃煤機(jī)組運(yùn)行過程中的眾多參數(shù)指標(biāo)進(jìn)行分析挖掘,通過模糊粗糙集對(duì)各項(xiàng)能耗指標(biāo)約簡(jiǎn)后[2-3],得到對(duì)燃煤性能有重要影響的多個(gè)指標(biāo)。經(jīng)過模糊C 均值聚類算法分析[4-5],準(zhǔn)確將重要屬性劃分成不同的類別,同時(shí)計(jì)算各屬性指標(biāo)的模糊隸屬度。這些數(shù)據(jù)挖掘分析處理能客觀清晰、全面有效地描述燃煤機(jī)組能耗特性的指標(biāo)數(shù)據(jù),對(duì)優(yōu)化改善燃煤機(jī)組的性能有重要的意義。
聚類分析可將燃煤機(jī)組的各項(xiàng)性能指標(biāo)分類成各個(gè)子集,每個(gè)性能指標(biāo)子集作為一個(gè)單獨(dú)的簇,這些性能指標(biāo)對(duì)燃煤機(jī)組的影響程度近似。而不同子集對(duì)于燃煤機(jī)組性能影響較大。
模糊集是美國(guó)專家L.A Zadeh于1965年提出的數(shù)學(xué)理論[6]。該理論把方法與對(duì)象作為一種模糊集合,建立不同的隸屬函數(shù),采用相關(guān)運(yùn)算對(duì)數(shù)據(jù)進(jìn)行分析。粗糙集理論是波蘭科學(xué)家Z.pawlak在1982年提出的解決不確定性問題的數(shù)學(xué)方法[7]。核心思想是在保證原有分類效率的條件下,借助知識(shí)約簡(jiǎn),求解分類規(guī)則。屬性約簡(jiǎn)是粗糙集理論的重要組成部分[8]。廣泛應(yīng)用于數(shù)據(jù)挖掘、智能決策等領(lǐng)域。
大型燃煤機(jī)組的運(yùn)轉(zhuǎn)時(shí)刻產(chǎn)生大量的各方面的指標(biāo)數(shù)據(jù),這些數(shù)據(jù)受到環(huán)境溫度濕度的改變、煤質(zhì)的變化甚至水溫的變化而產(chǎn)生很多不確定性。因此,針對(duì)如此繁雜、不確定性的數(shù)據(jù)采用模糊粗糙集理論來處理從而提取相關(guān)重要指標(biāo)參數(shù)就顯得尤為重要[9-10]。
燃煤發(fā)電機(jī)組性能指標(biāo)相關(guān)的數(shù)據(jù)項(xiàng)目非常繁雜,每一項(xiàng)指標(biāo)對(duì)于節(jié)能優(yōu)化的重要性不同,在節(jié)能分析時(shí)需要剔除部分不重要的指標(biāo),重點(diǎn)分析對(duì)燃煤發(fā)電性能影響較大的指標(biāo)。這需要對(duì)屬性進(jìn)行約簡(jiǎn)。為了實(shí)現(xiàn)屬性約簡(jiǎn),本文嘗試采用模糊粗糙集算法來實(shí)現(xiàn)并進(jìn)行最終燃煤機(jī)組各項(xiàng)指標(biāo)的對(duì)比。屬性約簡(jiǎn)的目的是減少計(jì)算的復(fù)雜度,約簡(jiǎn)的原則是約簡(jiǎn)前后屬性值所包含的燃煤信息不能丟失。要保持信息的貼近度。下面對(duì)貼近度的定義說明。
定義1:
設(shè)映射關(guān)系M:F(X)×F(X)→[0,1]滿足如下這些約束:
(1)對(duì)屬于F(X)的任意A,滿足M(A,A)=1;
(2)對(duì)屬于F(X)任意A,B,滿足M(A,B)=M(B,A);
(3)如果對(duì)屬于F(X)的任意A,B,C,屬于X的任意x,滿足:
|(A(x)-C(x))|≥|A(x)-B(x) |
那么存在M(A,C)≤M(A,B)。稱呼映射M是F(X)上的近度,定義M(A,B)為A和B的貼近度。
定義2:
設(shè)(U,R)為一個(gè)模糊系統(tǒng),即R屬于U范圍內(nèi)的自反的模糊關(guān)系。
如果{x∈U│x X}= ,那么表示X=U,這時(shí) (U)(x)≡1,即 (U)=U。
依據(jù)定義1和定義2,設(shè)計(jì)了如下模糊屬性指標(biāo)決策表的約簡(jiǎn)算法。
算法:首先,化簡(jiǎn)R= ,接著把使γR∪{ai}(d)取得最大值的指標(biāo)ai添加到約簡(jiǎn)R之中,當(dāng)γR(d)/γA(d)的值高于某個(gè)事先預(yù)設(shè)的閾值,此時(shí)輸出這個(gè)決策表的一個(gè)約簡(jiǎn)項(xiàng)R。
算法輸入:模糊決策表(U,A,d),其中A={a1,a2,…,an},閾值設(shè)定為λ。
算法輸出:A的約簡(jiǎn)R。
(1)令R= ;(2)對(duì)于屬于A-R的任意ai,計(jì)算當(dāng)γR∪{ai}(d)取最大值時(shí)的ai,且讓R=R∪{ai};(3)假如λAR=γR(d)/γA(d)≥λ,表示R就是所求。不然跳往第二步繼續(xù)求解。
在燃煤機(jī)組各項(xiàng)能耗指標(biāo)初步分析的基礎(chǔ)上,建立能耗參數(shù)決策表。并對(duì)其進(jìn)行簡(jiǎn)單的預(yù)處理,確定各項(xiàng)指標(biāo)的模糊相似度,同時(shí)選擇合理的模糊算子對(duì)下近似值進(jìn)行求解。依據(jù)下近似求解參數(shù)貼近度,定量分析各指標(biāo)的重要度。
根據(jù)模糊粗糙集的屬性表項(xiàng)目約簡(jiǎn)算法,對(duì)大型燃煤機(jī)組影響能耗的重要指標(biāo)參數(shù)進(jìn)行分析,可用圖表形式劃分為如圖1所示。
圖1 FRS 算法示意圖Fig.1 Schematic diagram of FRS algorithm
FCM(Fuzzy C Mean,模糊C均值聚類)算法是由Bezkek于1981年提出的。是眾多模糊聚類算法中算法效率較高且被廣泛采用的算法之一。能實(shí)現(xiàn)各個(gè)樣本對(duì)于各種聚類的隸屬度。FCM算法是兩個(gè)算法的精髓融合,由兩部分構(gòu)成: 一部分是模糊理論, 另一部分是算法C/Kmean。與硬聚類算法k-means相比較,模糊C均值聚類的結(jié)果更加靈活多變。可以在無監(jiān)督環(huán)境中分析出數(shù)據(jù)的分布情況,根據(jù)眾多樣本相似度的不同,將其聚合到多個(gè)不同的集合,聚合為有限的幾個(gè)集合。
FCM算法步驟如下:
(1)初始化U=[uij]矩陣,U(0);
(2)在k步:計(jì)算質(zhì)心。
(4)如果||U(k+1)-Uk||<ε則終止;否則執(zhí)行第2步。
模糊C 均值聚類算法在將樣本數(shù)據(jù)分成有限數(shù)量部分的同時(shí),還可以依據(jù)上述定義2中計(jì)算出的隸屬度定量計(jì)算出各個(gè)樣本屬于不同類別的數(shù)量上的指標(biāo)。從而保證燃煤機(jī)組的性能指標(biāo)在分類后保證類內(nèi)的相似性比較大,而類之間的耦合度相對(duì)較低。
本文選取某火電廠6號(hào)的1000MW超臨界燃煤機(jī)組2020年10月5日至2020年12月5日合計(jì)60天的發(fā)電運(yùn)轉(zhuǎn)數(shù)據(jù)。該大型燃煤機(jī)組的主要參數(shù)如表1所示[11]:
表1 燃煤機(jī)組參數(shù)表Tab.1 Parameter table of coal-fired unit
將采集的大量穩(wěn)態(tài)性質(zhì)的數(shù)據(jù)項(xiàng)分為6組數(shù)據(jù)集。如表2所示。具體包含數(shù)據(jù)項(xiàng)的采用時(shí)間、負(fù)荷段、樣本數(shù)量和特征變量數(shù)。
表2 采集數(shù)據(jù)集描述Tab.2 Collection dataset description
表3 所示中的優(yōu)化前后的數(shù)據(jù)對(duì)比分析:本次優(yōu)化前、后額定負(fù)荷下的高壓缸效率為89.78%、89.88%,中壓缸效率為92.95%、93.11%,從數(shù)據(jù)上看該文選擇的算法對(duì)于燃煤機(jī)組性能的優(yōu)化還是具有一定的提示效果。
表3 各項(xiàng)指標(biāo)對(duì)比Tab.3 Comparison of various indicators
本文首先介紹了研究的背景及借助的燃煤機(jī)組狀況,接著分析了模糊粗糙集算法和模糊C均值聚類算法的算法思路及應(yīng)用方法。采用模糊粗糙集算法對(duì)燃煤機(jī)組的各項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行數(shù)據(jù)指標(biāo)的約簡(jiǎn),同時(shí)保證數(shù)據(jù)的信息量不變,以保證數(shù)據(jù)分析的正確性和高效率。然后采用模糊C均值聚類算法對(duì)樣本所屬的類別進(jìn)行分門別類的處理。根據(jù)得出的模糊隸屬度數(shù)據(jù)詳細(xì)描述各個(gè)樣本所屬類別程度的大小。因此能最大限度的保證獲取具備相似度最大的各種簇內(nèi)樣本,且各個(gè)不一樣的簇間存在最小的相似度。最后,采用基于模糊粗糙集和模糊C均值聚類算法對(duì)大型燃煤機(jī)組的各項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行分析挖掘,在燃煤機(jī)組各項(xiàng)指標(biāo)數(shù)據(jù)信息完整保存的條件下,針對(duì)大型燃煤機(jī)組的性能有重要影響的指標(biāo)數(shù)據(jù)進(jìn)行了高效率壓縮處理。通過某火電廠1000MW超臨界機(jī)組的數(shù)據(jù)驗(yàn)證分析,該算法組合具備高效、動(dòng)態(tài)優(yōu)化等優(yōu)點(diǎn)。