劉曉彤,遲海龍,楊廷勇
(1.中國水利水電科學研究院 北京中水科水電科技開發(fā)有限公司,北京 100038;2.中國長江電力股份有限公司白鶴灘水力發(fā)電廠,云南 昆明 650000)
隨著智能水電站技術的迅猛發(fā)展,大數(shù)據(jù)和人工智能技術在水電站安全穩(wěn)定運行的決策過程中作用愈加重要,而大數(shù)據(jù)是開展人工智能的重要前提。水電站各個專業(yè)生產系統(tǒng)的數(shù)據(jù)量大、復雜度高、快速多變,現(xiàn)地采集后需要跨安全區(qū)、跨地域傳輸和匯聚到大數(shù)據(jù)平臺,數(shù)據(jù)跨區(qū)跨地域安全可靠的采集與傳輸,成為限制大數(shù)據(jù)技術應用的關鍵因素。
主要采集調速器、勵磁、計算機監(jiān)控系統(tǒng)等實時系統(tǒng),以及機組狀態(tài)監(jiān)測、局部放電監(jiān)測、油色譜監(jiān)測等非實時數(shù)據(jù)。采集方式主要取決于現(xiàn)地各專業(yè)系統(tǒng),并統(tǒng)籌考慮,選擇最合適的采集方式。
水電站各專業(yè)系統(tǒng)的數(shù)據(jù)種類眾多,按實時性分有實時數(shù)據(jù)、非實時性數(shù)據(jù)、歷史數(shù)據(jù)、時間序列數(shù)據(jù)。按類型分有文本數(shù)據(jù)、多媒體數(shù)據(jù)。按結構分有各類結構化、半結構化數(shù)據(jù)以及非結構化數(shù)據(jù),數(shù)據(jù)的采集和傳輸方式隨之不同。
調速器和勵磁系統(tǒng)均需與其PLC設備通信,通信協(xié)議需與電廠采用的PLC品牌和型號適配,如PLC有備用通信接口,通信協(xié)議限于其備用接口支持的協(xié)議。若沒有備用通信接口,則需增加通信模塊,需根據(jù)其PLC品牌和型號選擇合適的通信模塊,因為Modbus TCP/IP和Modbus RTU協(xié)議比較通用而優(yōu)先選擇[1],其次根據(jù)實際情況選擇PROFINET協(xié)議[2]、SRTP TCP/IP協(xié)議(Service Request Transport Protocol)[3]、EGD(Ethernet Global Data)協(xié)議[4]、Modbus Plus(MB+)協(xié)議等。
計算機監(jiān)控系統(tǒng)分為上位機系統(tǒng)和下位機系統(tǒng),部分電廠已接入到集控中心,因此其數(shù)據(jù)可從3個數(shù)據(jù)源采集。由集控中心到電廠上位機系統(tǒng)再到電廠下位機系統(tǒng),數(shù)據(jù)采集方案的可行性、可靠性、可維護性依次降低,難度和工作量依次升高,因此數(shù)據(jù)源優(yōu)先級依次降低。
若數(shù)據(jù)源選擇集控中心和上位機系統(tǒng),通信協(xié)議可選擇方式較多,通常可采用IEC60870-5-104規(guī)約、消息隊列中間件技術、RPC技術、私有TCP/UDP通信協(xié)議等。
若將下位機作為數(shù)據(jù)源,則因其PLC品牌和型號不同,通信方式和協(xié)議均不同,情況與調速器、勵磁系統(tǒng)類似,并且通信協(xié)議為各監(jiān)控系統(tǒng)廠家私有協(xié)議,需要深入研究和定制開發(fā),接入調試需在機組停機檢修階段進行,開發(fā)和實施難度大,實施周期長,維護難度大,所以此方案在其他方案均無法實施時才考慮。
機組狀態(tài)監(jiān)測系統(tǒng)的數(shù)據(jù)分為穩(wěn)態(tài)常規(guī)數(shù)據(jù)和暫態(tài)波形數(shù)據(jù),目前國內主流系統(tǒng)可提供TCP/UDP私有通信協(xié)議、消息隊列、中間數(shù)據(jù)庫等接口方式。
局部放電、油色譜監(jiān)測系統(tǒng)數(shù)據(jù)變化緩慢,數(shù)據(jù)量不大,數(shù)據(jù)采集周期可適當設置。
水電站的調速器、勵磁、計算機監(jiān)控系統(tǒng)等屬于控制區(qū),機組狀態(tài)監(jiān)測、局部放電、油色譜監(jiān)測等系統(tǒng)屬于非控制區(qū),水電大數(shù)據(jù)平臺屬于管理信息大區(qū),一般大型水電站可能建設有大數(shù)據(jù)平臺,中小型水電站作為大數(shù)據(jù)平臺的邊緣側,而大數(shù)據(jù)中心多建設在發(fā)電集團總部,根據(jù)《電力監(jiān)控系統(tǒng)安全防護總體方案》,需要在控制區(qū)、非控制區(qū)和管理信息大區(qū)部署隔離裝置,管理信息大區(qū)與大數(shù)據(jù)平臺之間部署防火墻[5]。因此數(shù)據(jù)采集匯聚后需要跨安全區(qū)、超遠距離、安全可靠的傳輸。
因控制區(qū)和非控制區(qū)均有多套系統(tǒng)數(shù)據(jù)需要接入,故在控制區(qū)和非控制區(qū)均設置有匯聚交換機,多系統(tǒng)數(shù)據(jù)匯聚后接入防火墻。計算機監(jiān)控系統(tǒng)、機組狀態(tài)監(jiān)測系統(tǒng)和局部放電、油色譜監(jiān)測等數(shù)據(jù)一般均采集其上位機系統(tǒng)數(shù)據(jù),故上述各系統(tǒng)均可直接接入匯聚交換機。
調速器和勵磁系統(tǒng)的數(shù)據(jù),需要從每臺機組的調速、勵磁系統(tǒng)的PLC采集,若其只支持串口通信,考慮到串口信號傳輸距離與其可能受到的干擾等因素,可在每臺機組處部署串口聯(lián)網設備,轉換成RJ45網絡接口,機組與采集平臺位置較遠時,還要考慮光電轉換接口。
一般發(fā)電集團公司的大數(shù)據(jù)平臺采集系統(tǒng)網絡拓撲可參考圖1,若電站自建大數(shù)據(jù)平臺,則不需要防火墻和專用通道。
圖1 水電站大數(shù)據(jù)分布式采集系統(tǒng)網絡拓撲
數(shù)據(jù)采集匯聚后,需要穿越正向隔離裝置傳輸?shù)焦芾硇畔⒋髤^(qū),如果還需向外傳輸,而后再經過防火墻,傳輸?shù)酱髷?shù)據(jù)平臺。因而,在數(shù)據(jù)采集、非控制區(qū)與管理信息大區(qū)之間、管理信息大區(qū)與大數(shù)據(jù)中心之間存在3個故障點。在上述3個故障點處需要具備數(shù)據(jù)的緩存、存儲和斷點續(xù)傳的功能,因數(shù)據(jù)類型不同而有不同的解決方案。
為提高數(shù)據(jù)傳輸?shù)目煽啃?,需要在?shù)據(jù)采集和傳輸過程中根據(jù)數(shù)據(jù)特點選擇合適的通信方式。
若采用傳統(tǒng)通信方式,如IEC60870-5-104規(guī)約、私有TCP、MODBUS等通信協(xié)議的方式,則通信出現(xiàn)故障,數(shù)據(jù)就會中斷,無法實現(xiàn)數(shù)據(jù)的斷點續(xù)傳。
計算機監(jiān)控系統(tǒng)、機組狀態(tài)監(jiān)測、局部放電監(jiān)測、油色譜監(jiān)測等數(shù)據(jù)源一般均為各自的上位機系統(tǒng),因而可考慮使用緩存技術,為數(shù)據(jù)的斷點續(xù)傳打好基礎。
機組狀態(tài)監(jiān)測系統(tǒng)的顯著特點是數(shù)據(jù)量巨大,其穩(wěn)態(tài)常規(guī)數(shù)據(jù)幾乎與電站計算機監(jiān)控系統(tǒng)的模擬量數(shù)據(jù)規(guī)模持平,其暫態(tài)波形數(shù)據(jù)規(guī)模更大。采用TCP協(xié)議方式,無法實現(xiàn)斷點續(xù)傳。
采用消息系統(tǒng)和中間數(shù)據(jù)庫的方式,可以實現(xiàn)斷點續(xù)傳,但在實際應用中存在一些需要注意的問題,以Kafka為例,目前機組狀態(tài)監(jiān)測系統(tǒng)多采用Windows操作系統(tǒng),而Kafka在Windows平臺上的穩(wěn)定性欠佳,官方僅提供Java API,支持其他編程語言的第三方接口雖多,但穩(wěn)定性難以保障。
若采用中間數(shù)據(jù)庫的方式,跨安全區(qū)數(shù)據(jù)復制技術問題是其難點。
計算機監(jiān)控系統(tǒng)、調速器、勵磁等系統(tǒng)的數(shù)據(jù)、機組狀態(tài)監(jiān)測系統(tǒng)穩(wěn)態(tài)數(shù)據(jù)、局部放電監(jiān)測數(shù)據(jù)、油色譜監(jiān)測數(shù)據(jù)等均可視為實時數(shù)據(jù),實時更新到實時數(shù)據(jù)庫。
平臺可從實時數(shù)據(jù)庫中獲取數(shù)據(jù)轉存到歷史數(shù)據(jù)庫。同時,機組狀態(tài)監(jiān)測系統(tǒng)的暫態(tài)數(shù)據(jù)、局部放電監(jiān)測系統(tǒng)和油色譜監(jiān)測系統(tǒng)的圖譜文件和診斷報告等二進制文件均可視為歷史數(shù)據(jù),可直接存儲到歷史數(shù)據(jù)庫。
跨隔離裝置傳輸數(shù)據(jù),包括實時數(shù)據(jù)、歷史數(shù)據(jù)、文件以及第三方綜合數(shù)據(jù)等。隔離裝置包括正向隔離和反向隔離。正向隔離裝置具有單向傳輸?shù)奶攸c,反向只能傳輸1字節(jié)報文用于狀態(tài)確認。跨反向隔離裝置采用文本文件傳輸方式。跨區(qū)數(shù)據(jù)同步簡要示意圖見圖2所示。
圖2 跨區(qū)數(shù)據(jù)同步和緩存簡要示意圖
UDP協(xié)議其不可靠的特點,在對關鍵數(shù)據(jù)的實時性和質量要求日益提高的今天,被更少的采用。采用符合正向隔離安全要求的TCP協(xié)議同步數(shù)據(jù),具有斷點續(xù)傳功能,如果傳輸中斷,可使用數(shù)據(jù)緩存技術,選擇內存、硬盤、數(shù)據(jù)庫、消息隊列中間件等緩存介質。
基于標準TCP的數(shù)據(jù)傳輸基于雙向通信,無法穿越隔離裝置,需要通過跨區(qū)同步代理實現(xiàn)報文轉發(fā)??鐓^(qū)同步代理需要在隔離裝置兩側均代理,部署內網代理發(fā)送數(shù)據(jù),若內外網通信故障,則將數(shù)據(jù)緩存。外網代理接收數(shù)據(jù),并及時回復1字節(jié)報文進行確認。
需要設計好緩存的最大空間和清空策略等,比如64 MB以內的數(shù)據(jù)緩存在內存,長時間中斷緩存數(shù)據(jù)在硬盤。
機組狀態(tài)監(jiān)測系統(tǒng)的暫態(tài)波形數(shù)據(jù)和局部放電監(jiān)測系統(tǒng)、油色譜監(jiān)測系統(tǒng)生成的圖譜文件和診斷報告多為二進制文件,需要有專業(yè)的軟件才能使用和展示。在大數(shù)據(jù)平臺無法完備各專業(yè)系統(tǒng)功能的情況下,部署各專業(yè)系統(tǒng)軟件,不失為目前較好的現(xiàn)實選擇。這就需要部署各專業(yè)系統(tǒng)的數(shù)據(jù)庫。因此可通過中間數(shù)據(jù)庫的方式,采用臨時公用交換數(shù)據(jù)表的形式實現(xiàn)數(shù)據(jù)交換。
分布式數(shù)據(jù)庫同步有多種技術可供選擇,Databus、canal、Maxwell、yugong、DRD等均可實現(xiàn),使用上述技術結合跨區(qū)數(shù)據(jù)同步功能,可解決數(shù)據(jù)庫跨區(qū)同步的技術難點。
管理信息大區(qū)數(shù)據(jù)緩存和上送到大數(shù)據(jù)平臺,可使用消息隊列中間件技術,它可以在分布式環(huán)境下提供應用解耦、彈性伸縮、冗余存儲、流量削峰、異步通信、數(shù)據(jù)同步等功能,作為分布式系統(tǒng)架構中的一個重要組件,有著舉足輕重的地位。開源的消息中間件很多,比如ActiveMQ,RabbitMQ,Kafka,RocketMQ,ZeroMQ等。目前在電力領域使用較多的消息系統(tǒng)是Kafka。
Kafka可以充當中間數(shù)據(jù)的存儲系統(tǒng)。在海量消息堆積的情況下,Kafka始終保持消息收、發(fā)的高吞吐能力,不影響隊列性能。使用Kafka可以高效可靠地實現(xiàn)斷點續(xù)傳[6]。
計算機監(jiān)控系統(tǒng)、調速器、勵磁等系統(tǒng)的數(shù)據(jù)、機組狀態(tài)監(jiān)測系統(tǒng)的穩(wěn)態(tài)數(shù)據(jù)、局部放電監(jiān)測數(shù)據(jù)、油色譜監(jiān)測數(shù)據(jù)等可按照介紹的通信方式采集數(shù)據(jù),更新到實時數(shù)據(jù)庫,并由隔離通信服務經隔離裝置傳輸至管理信息大區(qū),平臺按照寫歷史庫策略轉存到歷史數(shù)據(jù)庫,并由發(fā)布實時數(shù)據(jù)的程序輪詢實時數(shù)據(jù)庫,采用“不變不送,定時全送”的策略將實時數(shù)據(jù)發(fā)布到Kafka。
機組狀態(tài)監(jiān)測系統(tǒng)的暫態(tài)數(shù)據(jù)、局部放電監(jiān)測系統(tǒng)和油色譜監(jiān)測系統(tǒng)的圖譜文件和診斷報告等二進制文件,通過隔離通信服務傳輸至管理信息大區(qū),存儲到歷史數(shù)據(jù)庫,并發(fā)布到管理信息大區(qū)的Kafka。大數(shù)據(jù)平臺以訂閱方式獲取數(shù)據(jù)。
機組狀態(tài)監(jiān)測系統(tǒng)、油色譜監(jiān)測系統(tǒng)、局部放電監(jiān)測系統(tǒng)等亦可采用數(shù)據(jù)庫同步的方式實現(xiàn)數(shù)據(jù)采集和傳輸。