韓義,張奇月,王研凱,于英利,付旭晨,榮俊,段倫博*
(1.內(nèi)蒙古電力(集團(tuán))有限責(zé)任公司內(nèi)蒙古電力科學(xué)研究院分公司,呼和浩特010020;2.東南大學(xué)能源熱轉(zhuǎn)換及其過(guò)程測(cè)控教育部重點(diǎn)實(shí)驗(yàn)室,南京210096)
蒙西電網(wǎng)[1]網(wǎng)架結(jié)構(gòu)復(fù)雜、駕馭難度大,電網(wǎng)統(tǒng)調(diào)裝機(jī)6.599 GW,500 kV 變電站26 座,220 kV 變電站146 座,110 kV 及以下變電站932 座,系統(tǒng)較復(fù)雜;承擔(dān)大量的西電東送、蒙電外送任務(wù),若大量負(fù)荷不就近消納,將對(duì)關(guān)鍵線路造成巨大壓力。因此,為了便于電網(wǎng)做出更好的調(diào)度安排,保證電網(wǎng)穩(wěn)定運(yùn)行,進(jìn)行出力預(yù)測(cè)變得尤為重要。
隨著機(jī)器學(xué)習(xí)技術(shù)的不斷進(jìn)步,各種行業(yè)均開(kāi)始應(yīng)用機(jī)器學(xué)習(xí)來(lái)解決實(shí)際問(wèn)題,通過(guò)大數(shù)據(jù)技術(shù)解決傳統(tǒng)數(shù)據(jù)解決不了的問(wèn)題。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)在數(shù)量、多樣化、價(jià)值以及更新速度上具有明顯的優(yōu)勢(shì)[2]。隨著分散控制系統(tǒng)(DCS)、廠級(jí)實(shí)時(shí)監(jiān)控信息系統(tǒng)(SIS)、管理信息系統(tǒng)(MIS)以及其他輔助控制系統(tǒng)[3]的廣泛應(yīng)用及不斷改進(jìn),各電廠及電力集團(tuán)公司存儲(chǔ)了大量的運(yùn)行數(shù)據(jù)及化驗(yàn)數(shù)據(jù),形成了覆蓋電站機(jī)組生產(chǎn)全過(guò)程的數(shù)據(jù)庫(kù),這些數(shù)據(jù)包含大量的隱含信息,以數(shù)據(jù)為中心的信息化理念將極大地變革電力信息化方式[4-8]。
煤質(zhì)變化等原因造成機(jī)的組出力不穩(wěn)定不利于電網(wǎng)調(diào)度。因此,提供合適的出力預(yù)測(cè)方案可以方便電網(wǎng)做出合適的調(diào)度安排,避免不必要的風(fēng)險(xiǎn)?;趶念^計(jì)算的機(jī)組負(fù)荷預(yù)測(cè)自然可以有較高的準(zhǔn)確性,但其需要輸入的參數(shù)太多,且大多不能在線測(cè)量。以本文研究的循環(huán)流化床機(jī)組為例,如果通過(guò)在線測(cè)量煤質(zhì)、飛灰含碳量等參數(shù)來(lái)準(zhǔn)確計(jì)算鍋爐熱效率,自然可以實(shí)現(xiàn)負(fù)荷的預(yù)測(cè),但是技術(shù)難度大且計(jì)算量可觀,難以實(shí)現(xiàn)實(shí)時(shí)應(yīng)用。如果采用大數(shù)據(jù)理論,則可以避免直接測(cè)量這些數(shù)據(jù),直接尋找關(guān)鍵參數(shù)和機(jī)組出力的關(guān)系。同時(shí),通過(guò)這一關(guān)系,也能反饋機(jī)組出力對(duì)關(guān)鍵參數(shù)的范圍要求,從而界定機(jī)組的邊界出力。
徐游波[9]提出汽輪機(jī)的運(yùn)行狀態(tài)隨著蒸汽流量、溫度及壓力等因素的變化而變化,通過(guò)對(duì)歷史運(yùn)行數(shù)據(jù)的分析,得出機(jī)組出力與主蒸汽流量大致成正比例變化趨勢(shì)的結(jié)論。通過(guò)擬合機(jī)組出力與主汽流量的關(guān)系計(jì)算出力,實(shí)現(xiàn)汽輪機(jī)側(cè)基于歷史運(yùn)行數(shù)據(jù)的機(jī)組負(fù)荷預(yù)測(cè)。該研究雖然可以解決出力預(yù)測(cè)問(wèn)題,但隨著時(shí)間的推移,擬合函數(shù)的計(jì)算精確度會(huì)不斷降低。
本文提出通過(guò)搭建BP 神經(jīng)網(wǎng)絡(luò)模型并利用大數(shù)據(jù)來(lái)進(jìn)行出力預(yù)測(cè)。利用滑動(dòng)窗口法,當(dāng)有新的數(shù)據(jù)樣本進(jìn)入模型時(shí),直接剔除最舊樣本,更新模型參數(shù),解決了隨著機(jī)組的狀態(tài)改變,原有模型的準(zhǔn)確性和精度降低、泛化性能下降的缺點(diǎn)[10-12]。相比于模型重構(gòu),大大減少了計(jì)算量及模型更新所用時(shí)間。本文以相關(guān)參數(shù)數(shù)據(jù)為網(wǎng)絡(luò)的輸入層,以機(jī)組出力為輸出層,訓(xùn)練網(wǎng)絡(luò)模型,通過(guò)調(diào)節(jié)相關(guān)參數(shù)值進(jìn)行仿真試驗(yàn),最后得到最優(yōu)網(wǎng)絡(luò)模型。
本文針對(duì)某300 MW 循環(huán)流化床機(jī)組,該機(jī)組鍋爐為單汽包、自然循環(huán)、循環(huán)流化床燃燒方式,由1個(gè)膜式水冷壁爐膛,3臺(tái)汽冷式旋風(fēng)分離器和汽冷包墻包覆的尾部豎井組成。汽輪機(jī)為亞臨界、高中壓合缸、一次中間再熱、單軸、雙缸雙排汽、直接空冷凝汽式,配有2個(gè)主蒸汽閥門(mén)、6個(gè)高壓調(diào)節(jié)閥門(mén)、2個(gè)中壓主蒸汽閥門(mén)、2個(gè)中壓調(diào)節(jié)閥門(mén)。鍋爐設(shè)計(jì)汽水參數(shù)及汽輪機(jī)設(shè)計(jì)參數(shù)見(jiàn)表1—2。
選用來(lái)自此電站系統(tǒng)中存放的海量歷史數(shù)據(jù),主要包括發(fā)電機(jī)有功功率、主蒸汽流量和其他管道測(cè)點(diǎn)共計(jì)48 個(gè)不同參數(shù)的信息。選取了其中一段時(shí)間,每分鐘一個(gè)參數(shù)取一個(gè)數(shù)據(jù),即便只有5 d 時(shí)間,總數(shù)據(jù)量仍然十分巨大。如果要靠傳統(tǒng)的人為分析,困難系數(shù)是相當(dāng)大的。以主蒸汽流量及其他相關(guān)參數(shù)為輸入,發(fā)電機(jī)有功功率為輸出,建立基于BP神經(jīng)網(wǎng)絡(luò)的機(jī)組出力預(yù)測(cè)模型,從而對(duì)機(jī)組出力進(jìn)行預(yù)測(cè)。
表1 鍋爐設(shè)計(jì)汽水參數(shù)Tab.1 Design steam-water parameters of the boiler
表2 汽輪機(jī)設(shè)計(jì)參數(shù)Tab.2 Design parameters of the steam turbine
BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋型神經(jīng)網(wǎng)絡(luò),可以實(shí)現(xiàn)從輸入到輸出的任意非線性映射[13]。典型的BP網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示:輸入層具有R個(gè)輸入;隱層具有S個(gè)神經(jīng)元,采用S型傳遞函數(shù)。
隱層的非線性傳遞函數(shù)神經(jīng)元的作用為學(xué)習(xí)輸入與輸出的線性及非線性關(guān)系,由于在進(jìn)行訓(xùn)練之前一般都會(huì)進(jìn)行數(shù)據(jù)的歸一化處理,所以一般會(huì)通過(guò)線性輸出層拓寬網(wǎng)絡(luò)輸出。BP 神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力、高度的自學(xué)習(xí)和自適應(yīng)能力、一定的容錯(cuò)能力,在局部神經(jīng)元受到破壞后,對(duì)全局的訓(xùn)練結(jié)果不會(huì)造成大的影響。
圖1 BP網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 BP network structure
BP神經(jīng)網(wǎng)絡(luò)在應(yīng)用方面主要用于函數(shù)逼近、模式識(shí)別、分類(lèi)、數(shù)據(jù)壓縮4方面。本文主要通過(guò)相應(yīng)的輸入與輸出來(lái)訓(xùn)練一個(gè)網(wǎng)絡(luò)以逼近一個(gè)函數(shù),達(dá)到預(yù)測(cè)出力的目的。
大型燃煤發(fā)電機(jī)組所包含的系統(tǒng)眾多,數(shù)據(jù)復(fù)雜,且大量的數(shù)據(jù)中必然存在錯(cuò)誤數(shù)據(jù)。為了提高模型的精確度,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理是十分必要的。
1.3.1 異常數(shù)據(jù)的剔除
對(duì)于大數(shù)據(jù)建模而言,需要的數(shù)據(jù)量很大。但是,在實(shí)際的測(cè)量過(guò)程中,儀表的精確性、外界的干擾、測(cè)點(diǎn)的選擇、傳感器的故障等均會(huì)導(dǎo)致其中部分?jǐn)?shù)據(jù)受到污染。如果在建模之前不對(duì)這些污染數(shù)據(jù)進(jìn)行剔除,模型的精確性就會(huì)受到影響。譚浩藝[14]等人曾經(jīng)通過(guò)拉依達(dá)準(zhǔn)則(即3σ 準(zhǔn)則)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將明顯誤差較大的數(shù)據(jù)剔除。拉依達(dá)準(zhǔn)則是指先假設(shè)一組檢測(cè)數(shù)據(jù)只含有隨機(jī)誤差,對(duì)其進(jìn)行計(jì)算處理得到標(biāo)準(zhǔn)偏差,按一定概率確定一個(gè)區(qū)間,認(rèn)為凡超過(guò)這個(gè)區(qū)間的誤差,就不屬于隨機(jī)誤差而是粗大誤差,含有該誤差的數(shù)據(jù)應(yīng)予以剔除。在測(cè)量次數(shù)充分多的情況下,數(shù)據(jù)的誤差必然趨于正態(tài)分布,因此,電廠大數(shù)據(jù)剛好適合用來(lái)剔除異常數(shù)據(jù)。
1.3.2 數(shù)據(jù)的歸一化處理
該模型涉及的參數(shù)很多,不同參數(shù)之間、同參數(shù)之間的樣本數(shù)據(jù)也可能存在較大差距。例如,主蒸汽流量數(shù)值最高達(dá)到1 000 t∕h 以上,而各類(lèi)換熱器進(jìn)出口的蒸汽壓力數(shù)值卻只有10 MPa 左右。如果樣本數(shù)據(jù)之間的數(shù)值差距過(guò)大,神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練時(shí)間會(huì)變長(zhǎng),訓(xùn)練后的模型精準(zhǔn)度也不夠。因此,在確定了各個(gè)參數(shù)之后,在輸入數(shù)據(jù)之前,最好對(duì)數(shù)據(jù)進(jìn)行歸一化處理[15]。假設(shè)參數(shù)原值為a,歸一化處理后的值為b,同類(lèi)型參數(shù)最大值為amax、最小值為amin,則兩者之間的關(guān)系用公式表示為
1.3.2 PCA降維
選擇合理的模型變量對(duì)于建模來(lái)說(shuō)十分重要。燃煤發(fā)電機(jī)組包含眾多的子系統(tǒng),如給煤系統(tǒng)、燃燒系統(tǒng)、給水系統(tǒng)、送風(fēng)系統(tǒng)等,每個(gè)子系統(tǒng)都與眾多的參數(shù)相關(guān)聯(lián)。從所有可能對(duì)機(jī)組出力有影響的參數(shù)中選出關(guān)系較為密切的特征參數(shù)作為模型的輸入量,可以獲得近似或是更好的模型性能。通常研究人員選擇模型變量都是依據(jù)長(zhǎng)期的經(jīng)驗(yàn)。然而有時(shí)候并沒(méi)有完備的理論依據(jù),如果選擇了一些不重要的自變量,模型的精度會(huì)降低。本文選用Matlab軟件中自帶的PCA降維函數(shù)對(duì)大數(shù)據(jù)進(jìn)行主成分分析[16-17],在新的參數(shù)坐標(biāo)下獲取每個(gè)主成分所占的影響值,直觀地選擇所需要降的維數(shù)。
本研究選取了連續(xù)960 個(gè)時(shí)間點(diǎn)的樣本數(shù)據(jù),訓(xùn)練時(shí)選取所有時(shí)間點(diǎn)的數(shù)據(jù),測(cè)試驗(yàn)證選用后460 個(gè)時(shí)間點(diǎn)的數(shù)據(jù)。基于BP 神經(jīng)網(wǎng)絡(luò)的機(jī)組出力預(yù)測(cè)流程如圖2所示。
圖2 機(jī)組出力預(yù)測(cè)流程Fig.2 Flow of power unit output prediction
首先對(duì)主蒸汽流量及其他相關(guān)特征參數(shù)進(jìn)行異常數(shù)據(jù)剔除、歸一化,以及降維預(yù)處理。利用PCA 函數(shù)對(duì)所有相關(guān)參數(shù)進(jìn)行處理之后,可以得到輸出影響值,即每一個(gè)主成分所貢獻(xiàn)的比例,可以更直觀地選擇所需要降維的組數(shù)。經(jīng)過(guò)數(shù)據(jù)處理發(fā)現(xiàn)僅主汽流量所占的比例就達(dá)到了96.33%,其次依次是高溫過(guò)熱器出口蒸汽壓力、高溫過(guò)熱器出口蒸汽溫度、屏式再熱器出口蒸汽壓力、屏式再熱器出口蒸汽溫度、鍋爐給水溫度、有效床溫,分別占比1.78%,0.80%,0.37%,0.20%,0.11%,0.08%。這與徐游波[9]結(jié)論相接近。因此,綜合考慮將輸入層數(shù)據(jù)維數(shù)降到7,這樣整個(gè)影響比例之和便超過(guò)99.90%,其他因素可以忽略不計(jì)。
BP 神經(jīng)網(wǎng)絡(luò)通過(guò)誤差信號(hào)不斷反向傳播來(lái)減小輸出值與期望值的誤差,達(dá)到訓(xùn)練網(wǎng)絡(luò)的目的。在該過(guò)程中,隱層神經(jīng)元數(shù)量會(huì)影響誤差大小。因此,確定BP神經(jīng)網(wǎng)絡(luò)的隱層神經(jīng)元數(shù)量很重要。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型一般選用均方根誤差[18-19]和相對(duì)誤差[20]作為評(píng)價(jià)指標(biāo)。均方根誤差和相對(duì)誤差的計(jì)算公式如下所示
式中:RMSE 為均方根誤差,MW;ypredict為預(yù)測(cè)值,MW;yreal為期望值,MW;n為總預(yù)測(cè)時(shí)間點(diǎn)數(shù)。
通過(guò)統(tǒng)計(jì)各神經(jīng)元數(shù)量下BP 神經(jīng)網(wǎng)絡(luò)模型輸出值與期望輸出值的相對(duì)誤差Error 及均方根誤差RMSE,選取最合適的神經(jīng)元數(shù)量。隱層神經(jīng)元數(shù)量從1 到9 進(jìn)行試驗(yàn)后,輸出值與期望輸出值的平均相對(duì)誤差以及均方根誤差如圖3所示。
圖3 輸出值與期望值的相對(duì)誤差Fig.3 Relative error between the output value and its expected value
由圖3 中可以看出,當(dāng)隱層神經(jīng)元的數(shù)量增加到7 的時(shí)候,BP 神經(jīng)網(wǎng)絡(luò)模型的輸出值與期望值的平均相對(duì)誤差低于1%,此時(shí)的均方根誤差約為13.4 MW,再增加神經(jīng)元數(shù)量模型的精確度也不會(huì)得到大的改善。因此,隱層神經(jīng)元的數(shù)量選擇為7。
當(dāng)隱層神經(jīng)元數(shù)量為7 時(shí),機(jī)組出力的預(yù)測(cè)值與實(shí)際的期望值的曲線如圖4 所示,預(yù)測(cè)值與期望值的相對(duì)誤差如圖5所示。
圖4 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與期望值的對(duì)比Fig.4 Comparison of the predicted value and the expected value made by BP neural network
圖5 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與期望值的相對(duì)誤差Fig.5 Relative error between the predicted value and the expected value made by BP neural network
應(yīng)用BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型預(yù)測(cè)得到的預(yù)測(cè)值曲線與實(shí)際的期望值曲線接近重合,驗(yàn)證BP神經(jīng)網(wǎng)絡(luò)模型有良好的預(yù)測(cè)精確度。預(yù)測(cè)值與期望值的相對(duì)誤差除了極個(gè)別點(diǎn)以外,都在±2%的范圍內(nèi)。因此,模型的預(yù)測(cè)穩(wěn)定性也較高,可以滿足需求。
選用訓(xùn)練數(shù)據(jù)外別的時(shí)間點(diǎn)的樣本數(shù)據(jù)來(lái)檢驗(yàn)?zāi)P偷木?,為了保證模型精度的覆蓋范圍,選用6個(gè)不同范圍的數(shù)據(jù),原始數(shù)據(jù)見(jiàn)表3。
表3 BP神經(jīng)網(wǎng)絡(luò)的各項(xiàng)輸入值Tab.3 Inputs of the BP neural network
將下列變量作為輸入量,經(jīng)過(guò)模型預(yù)測(cè)獲得的預(yù)測(cè)值與期望值的對(duì)比見(jiàn)表4。經(jīng)過(guò)預(yù)測(cè),可以發(fā)現(xiàn)誤差基本都在1%以內(nèi),模型的精度較高,值得信賴(lài)。
表4 預(yù)測(cè)值與期望值的對(duì)比Tab.4 Comparison of predicted and expected values
采用BP 神經(jīng)網(wǎng)絡(luò)結(jié)合數(shù)據(jù)預(yù)處理和PCA 降維,以某300 MW 循環(huán)流化床機(jī)組為對(duì)象建立機(jī)組出力預(yù)測(cè)模型。經(jīng)過(guò)主成分分析發(fā)現(xiàn),主蒸汽流量是影響機(jī)組出力的最主要因素,其影響程度達(dá)到了96.33%。
高溫過(guò)熱器出口蒸汽壓力、高溫過(guò)熱器出口蒸汽溫度、屏式再熱器出口蒸汽壓力、屏式再熱器出口蒸汽溫度、鍋爐給水溫度、有效床溫也有一定影響,分 別 占 比1.78%,0.80%,0.37%,0.20%,0.11%,0.08%。誤差分析表明,隱層含有7 個(gè)神經(jīng)元即可達(dá)到較高的模擬精度。
利用BP 神經(jīng)網(wǎng)絡(luò)機(jī)組出力預(yù)測(cè)模型對(duì)460 個(gè)時(shí)間點(diǎn)的數(shù)據(jù)進(jìn)行驗(yàn)證試驗(yàn),結(jié)果表明,該模型與實(shí)際運(yùn)行數(shù)據(jù)吻合良好,相對(duì)誤差在±2%以內(nèi),使用訓(xùn)練樣本外時(shí)間點(diǎn)的數(shù)據(jù)進(jìn)行預(yù)測(cè),相對(duì)誤差也在±1%以內(nèi),精度較高。
該研究為循環(huán)流化床機(jī)組出力預(yù)測(cè)提供了方法。在電網(wǎng)面對(duì)電力調(diào)度問(wèn)題時(shí),通過(guò)該出力方法可以有效預(yù)測(cè)各個(gè)火電機(jī)組的出力,從而對(duì)調(diào)度提供有力指導(dǎo)。