唐鳳珍 顧圣平 張佳丹 鄭斯水 馬志鵬



摘?要:為加強梯級水電站優(yōu)化調(diào)度和經(jīng)濟運行的管理,針對梯級水電站效益考核中各水電站之間經(jīng)濟效益關系復雜的問題,采用數(shù)據(jù)挖掘模型進行梯級水電站效益關聯(lián)性探索。首先,選取各電站相關效益指標的長序列監(jiān)測統(tǒng)計資料,建立數(shù)據(jù)倉庫;其次,根據(jù)關聯(lián)規(guī)則的基本原理,選擇合適的最小支持度和最小置信度,建立數(shù)據(jù)挖掘模型;再次,采用適當?shù)臄?shù)據(jù)挖掘算法Apriori算法對模型求解,得到梯級水電站經(jīng)濟效益之間的關聯(lián)規(guī)則;最后,對模型應用效果進行分析和驗證。結(jié)果表明:基于數(shù)據(jù)挖掘模型進行梯級水電站效益關聯(lián)性分析,可快速有效地獲得梯級水電站的經(jīng)濟效益關系,為梯級水電站的效益考核研究提供了新思路。
關鍵詞:梯級水電站;關聯(lián)規(guī)則;數(shù)據(jù)挖掘模型;Apriori算法;效益考核
中圖分類號:TV-9文獻標志碼:A
doi:10.3969/j.issn.1000-1379.2020.06.029
Research on Benefit Relevance of Cascade Hydropower Stations Based on Data Mining Model
TANG Fengzhen1, GU Shengping1, ZHANG Jiadan1, ZHENG Sishui1, MA Zhipeng2
(1.College of Water Conservancy and Hydropower Engineering, Hohai University, Nanjing 210098, China;
2.Pearl River Hydraulic Research Institute, Guangzhou 510611, China)
Abstract:In order to strengthen the cascade hydropower station management on reservoir optimal operation and economic operation, Data Mining Model was applied to study the benefit relevance of cascade hydropower stations, because of complicated benefit distribution of cascade hydropower stations in benefit evaluation. This method was divided into four steps: selected long-term data of benefit indicators to establish data warehouse; chose appropriate Tmins and Tminc to establish a data mining model according to the principle of association rules; applied Apriori algorithm to calculate the data mining model and obtained quantitive relations between the benefits of cascade hydropower stations; verified and analyzed the feasibility of this model. The results suggest that applying Data Mining Model to research the benefit relevance of cascade hydropower stations can get profit distribution relations between each station quickly and efficiently. These relations give reference to the benefit evaluation of cascade hydropower stations. This model provides new thought for research on the benefit evaluation of cascade hydropower stations.
Key words: cascade hydropower stations; association rules; Data Mining Model; Apriori algorithm; benefit evaluation
1?引?言
為加強水電站優(yōu)化調(diào)度和經(jīng)濟運行的管理,2017年國家能源局印發(fā)了《流域梯級工程特性及運行情況資料報表(試行)》,水力發(fā)電企業(yè)大多也制定了相應的運行考核制度,對運行效益考核提出了更為明確具體的要求。常規(guī)意義上的水電站效益考核主要是指發(fā)電經(jīng)濟效益考核,單一水電站的效益通常僅需對水電站自身所產(chǎn)生的經(jīng)濟效益進行考核[1-3]。但是,梯級水電站在聯(lián)合調(diào)度過程中效益是相互影響的,龍頭水電站對下游水電站具有蓄豐補枯的作用[4],下游水電站對上游水電站也有效益補償?shù)淖饔肹5],一個水電站運行效益的提高既有可能促進其他水電站效益的提高,也有可能導致其他電站效益的降低,梯級水電站經(jīng)濟效益相互影響的機理比較復雜。因此,在梯級水電站效益考核中如何考慮各電站效益之間的關聯(lián)性是一個至關重要的問題。
目前,關聯(lián)性分析的方法主要有回歸分析方法、層次分析法、神經(jīng)網(wǎng)絡方法等[6-8],這些關聯(lián)分析方法雖然在各個領域里應用比較廣泛,但是依舊存在局限性,其中回歸分析方法比較適用于變化趨勢較為明顯的數(shù)據(jù)序列,層次分析法太過于依賴專家學者的主觀判斷,神經(jīng)網(wǎng)絡方法計算結(jié)果的穩(wěn)定性與網(wǎng)絡參數(shù)的設置具有較為密切的關系。筆者嘗試采用數(shù)據(jù)挖掘方法進行梯級水電站效益關聯(lián)性探索。數(shù)據(jù)挖掘方法是在大量的數(shù)據(jù)中提取有用的信息,從而建立關聯(lián)并且給出定量關系的過程[9]。該方法首次是在購物籃分析問題中被提出,后來在金融、醫(yī)學等領域得到了良好的應用[10],但是其在梯級水電站的效益關聯(lián)性探索上鮮少應用。近年來隨著智慧水利的發(fā)展,水電站效益的監(jiān)測數(shù)據(jù)以及統(tǒng)計數(shù)據(jù)不斷增多,使得采用數(shù)據(jù)挖掘方法探索梯級水電站效益的關聯(lián)性成為可能。筆者將數(shù)據(jù)挖掘方法應用到梯級水電站效益的關聯(lián)性分析當中,建立梯級水電站效益關聯(lián)性分析的數(shù)據(jù)挖掘模型,在以往較長的梯級水電站發(fā)電效益序列數(shù)據(jù)基礎上,挖掘出各電站經(jīng)濟效益之間的關聯(lián)規(guī)則并進行驗證,再將得到的關聯(lián)規(guī)則應用到今后的電站效益考核當中,旨在提高考核的公平性和水電站運行管理的積極性,進而提高梯級水電站的綜合效益。
3.1?數(shù)據(jù)預處理
選擇Apriori算法進行數(shù)據(jù)挖掘,將數(shù)據(jù)庫中存在的變量S1水電站年發(fā)電量、S2水電站年發(fā)電量進行離散化,本案例中采用等寬離散化的方法對數(shù)據(jù)進行預處理,離散規(guī)則見表2、表3。
將數(shù)據(jù)庫中25條數(shù)據(jù)所涉變量均按照上述方法進行離散化,離散結(jié)果見表4,然后將數(shù)據(jù)輸入Apriori數(shù)據(jù)挖掘算法進行建模。
3.2?效益關聯(lián)分析模型應用與分析
模型參數(shù)中的最小支持度Tmins和最小置信度Tminc目前還沒有明確的計算方法和規(guī)定,通常采用試算法來進行確定。本模型中最小支持度和最小置信度分別取10%和50%。在此基礎上采用數(shù)據(jù)挖掘模型進行梯級水電站效益關聯(lián)性分析。滿足10%最小支持度和50%最小置信度要求的關聯(lián)規(guī)則主要有兩條,見表5。
表5中E12、E13表示S1水電站的年發(fā)電量范圍為[330 259,452 780) MW·h、[452 780,575 301) MW·h,E21、E22表示S2水電站的年發(fā)電量范圍是[456 860,663 524) MW·h、[663 524,870 188) MW·h。
(1)由關聯(lián)規(guī)則E12E21可知:當S1水電站的年實際發(fā)電量在[330 259,452 780) MW·h區(qū)間時,S2水電站的年實際發(fā)電量在[456 860,663 524) MW·h區(qū)間內(nèi)。
(2)由關聯(lián)規(guī)則E13E22可知:當S1水電站的年實際發(fā)電量在[452 780,575 301) MW·h區(qū)間時,S2水電站的年實際發(fā)電量在[663 524,870 188) MW·h區(qū)間內(nèi)。
3.3?模型驗證與結(jié)果應用
采用2001—2007年S1、S2兩水電站的年實際發(fā)電量數(shù)據(jù)來驗證上述得到的兩個水電站發(fā)電效益關聯(lián)規(guī)則,2001—2007年S1、S2兩水電站的年實際發(fā)電量數(shù)據(jù)見表6。
由表6可見,2002年S1水電站的年實際發(fā)電量373 194 MW·h,處于[330 259,452 780) MW·h區(qū)間內(nèi),屬于E12等級,此時S2水電站的年實際發(fā)電量為636 200 MW·h,處于[456 860, 663 524) MW·h區(qū)間內(nèi),屬于E21等級,驗證關聯(lián)規(guī)則E12E21;2003年和2005年S1水電站的年實際發(fā)電量分別為534 262 MW·h和564 525 MW·h,均處于[452 780,575 301) MW·h區(qū)間內(nèi),屬于E13等級,此時S2水電站的年實際發(fā)電量分別為731 180 MW·h和800 023 MW·h,均處于[663 524, 870 188) MW·h區(qū)間內(nèi),屬于E22等級,驗證關聯(lián)規(guī)則E13E22。由此可見,采用該數(shù)據(jù)挖掘模型求解得到的梯級水電站效益之間的上述兩條關聯(lián)規(guī)則是有效的。
據(jù)此,本文提出在梯級水電站發(fā)電效益考核當中,為提高考核結(jié)果的公平性,可依據(jù)這兩條關聯(lián)規(guī)則,按以下方法處理梯級水電站之間的發(fā)電效益補償問題:
(1)當S1水電站年實際發(fā)電量在E12等級時,若S2水電站的年實際發(fā)電量在E21等級,則兩水電站之間不需要進行發(fā)電效益的補償;若S2水電站年實際發(fā)電量高于E21等級,則S2水電站需要對S1水電站進行一定額度的發(fā)電效益補償;若S2水電站年實際發(fā)電量低于E21等級,則S1水電站需要對S2水電站進行一定額度的發(fā)電效益補償。
(2)當S1水電站年實際發(fā)電量在E13等級時,若S2水電站的年實際發(fā)電量在E22等級,則兩水電站之間不需要進行發(fā)電效益的補償;若S2水電站年實際發(fā)電量高于E22等級,則S2水電站需要對S1水電站進行一定額度的發(fā)電效益補償;若S2水電站年實際發(fā)電量低于E22等級,則S1水電站需要對S2水電站進行一定額度的發(fā)電效益補償。
(3)若不屬于以上兩種情況時,記在當年來水情況下S1、S2兩水電站在梯級調(diào)節(jié)方式下的年發(fā)電量分別為EA和EB,在聯(lián)合運行方式下的年實際發(fā)電量分別為Ea、Eb,且聯(lián)合運行方式下梯級水電站群的總發(fā)電量應不低于梯級調(diào)節(jié)方式下的總發(fā)電量,即Ea+Eb≥EA+EB,則兩電站之間發(fā)電效益補償問題可按以下方式處理:
①當Ea>EA時,若Eb≥EB,則S1、S2兩電站之間不需要進行發(fā)電效益的補償;若Eb ②當Ea 3.4?與其他關聯(lián)分析方法的比較 為說明應用數(shù)據(jù)挖掘方法探索梯級水電站經(jīng)濟效益關系的優(yōu)越性,采用回歸分析方法和神經(jīng)網(wǎng)絡方法分別計算本文案例并進行結(jié)果比較,見表7。 運用回歸分析方法來探索S1、S2兩電站年實際發(fā)電量的關系,由于從以往的25條監(jiān)測數(shù)據(jù)中無法找到S1、S2兩水電站年實際發(fā)電量之間的線性關系,因此采用MATLAB編程進行高階擬合,結(jié)果發(fā)現(xiàn)采用五階多項式擬合效果最好,但是殘差模依舊高達130.27,可見采用回歸分析方法對S1、S2兩水電站年實際發(fā)電量進行關聯(lián)分析的效果并不良好。神經(jīng)網(wǎng)絡方法與數(shù)據(jù)挖掘模型方法得到的計算結(jié)果相近,也與實際較為相符,但是神經(jīng)網(wǎng)絡方法得到的結(jié)果與設置的訓練參數(shù)密切相關,計算結(jié)果并不穩(wěn)定。 4?結(jié)?論 (1)在影響機理比較復雜的情況下,運用數(shù)據(jù)挖掘模型探索梯級水電站經(jīng)濟效益之間的關聯(lián)性,可以快速有效地獲得梯級水電站發(fā)電效益之間的定量關系,且與回歸分析、神經(jīng)網(wǎng)絡等方法相比,結(jié)果更準確、更穩(wěn)定。 (2)將關聯(lián)規(guī)則應用到梯級水電站效益考核中,給出了各電站之間經(jīng)濟效益補償問題的處理原則,為梯級水電站的經(jīng)濟效益考核提供參考。若在梯級水電站綜合考核中還要考慮安全效益和生態(tài)效益,則可以將安全效益和生態(tài)效益相關指標數(shù)據(jù)補充到數(shù)據(jù)倉庫中,并進行更加深入的關聯(lián)規(guī)則挖掘。 (3)采用數(shù)據(jù)挖掘模型進行梯級水電站效益關聯(lián)規(guī)則挖掘,需要大量的監(jiān)測統(tǒng)計數(shù)據(jù)為依據(jù),因此應重視對梯級水電站實際運行調(diào)度管理過程的監(jiān)測和相關數(shù)據(jù)資料的收集、整理和積累。 參考文獻: [1]?粟運華.新安江水電站綜合利用效益調(diào)查報告[J].水電能源科學,1991,9(1):65-69. [2]?陳大鵬,周歧方.陳村水電站綜合效益分析[J].水利水電技術,1994(1):52-55. [3]?樊啟祥,汪志林,吳關葉.金沙江白鶴灘水電站工程建設的重大作用[J].水力發(fā)電,2018,44(6):1-6,12. [4]?王琨,歐陽碩,邵駿.上游水電站梯級調(diào)度對龍頭石水電站效益的影響[J].水力發(fā)電,2018,44(11):104-108. [5]?曲家峰.Shapley值熵權法在梯級水電站效益補償分攤中的應用[J].水利規(guī)劃與設計,2016(9):39-42. [6]?金保明.多元線性回歸分析方法在計算閩江十里庵洪水流量中的應用[J].水利科技,2007(1):18-19,38. [7]?于永強,沙曉軍,劉俊,等.基于模糊層次分析法的大型水利樞紐效益評估[J].水資源與水工程學報,2016,27(3):154-159. [8]?程芳,陳守倫.水利水電規(guī)劃方案優(yōu)選的人工神經(jīng)網(wǎng)絡方法[J].水電能源科學,2002,20(1):48-50. [9]?AFSHARI M H,DEHKORDI M N,AKBARI M.Association Rule Hiding Using Cuckoo Optimization Algorithm[J].Expert Systems with Application,2016,64:340-351. [10]?商桑,趙春菊,周宜紅,等.溪洛渡拱壩施工期混凝土中期降溫速率與通水冷卻參數(shù)關系的數(shù)據(jù)挖掘模型[J].長江科學院院報,2019,36(6):116-120. [11]?崔妍,包志強.關聯(lián)規(guī)則挖掘綜述[J].計算機應用研究,2016,33(2):330-334. [12]?林倩瑜.關聯(lián)規(guī)則挖掘算法研究綜述[J].軟件導刊,2012,11(6):27-29. 【責任編輯?趙宏偉】