岳峰,史志偉,董金才,牟晉力
(南京國電南自電網自動化有限公司,南京 211153)
隨著智能電網、智能電廠、分布式能源的快速發(fā)展,對于繼電保護控制設備的處理能力、通信能力、擴展能力等提出了更高的要求,從而導致系統(tǒng)軟硬件集成度和復雜度日益提高,對設備可靠性提出了更大的挑戰(zhàn)[1-3];另外,繼電保護控制設備運行環(huán)境復雜多樣,常見的諸如戶外柜、匯控柜、預制艙、保護小室等,隨著層次化保護控制系統(tǒng)逐步推進,要求設備就地化[4-9]靠近一次電氣設備安裝運行的趨勢越發(fā)明顯,設備運行的溫度和電磁兼容環(huán)境將更為惡劣,這就要求設備必須具備廣泛的環(huán)境適應性和高可靠性。同時針對電力設備的運維和投資周期特點,要求設備在長達12年甚至更長時間內連續(xù)無故障穩(wěn)定運行[10]。針對上述種種需求和挑戰(zhàn),提供堅強可靠的繼電保護控制設備至關重要。
繼電保護控制設備系統(tǒng)構成如圖1所示。對于傳統(tǒng)站應用(常規(guī)采樣/常規(guī)跳閘方式),中央處理器(CPU)模件采集AC模件通過母板傳輸?shù)男‰妷盒盘?,獲取采樣值,并從IO總線接收DI模件采集的開關量輸入。對于光差線路保護,還通過通信模件(帶光纖接口)接入對側線路數(shù)據,匯總成設備的輸入量。CPU模件對輸入量計算和分析,并根據定值判斷設備應該做出的動作行為,通過IO總線把命令發(fā)送到TRIP模件執(zhí)行。對于220 kV以上電壓等級智能站應用,通常為常規(guī)采樣/數(shù)字跳閘方式,則由CPU模件發(fā)送通用面向對象變電站事件(goose)跳閘命令,由通信模件轉發(fā)給智能終端來跳閘。
圖1 繼電保護控制設備系統(tǒng)架構
模擬量采樣系統(tǒng)作為繼電保護設備中極為重要的組成部分,直接關乎保護設備是否能夠正確獲取一次電壓、電流值,影響算法判據和動作正確性,嚴重時將會帶來保護誤動或拒動風險,因此其可靠性設計首當其沖。
對于可靠性要求高的場合,保護設備中通常配置雙CPU插件,主從CPU分別完成模擬量采樣,實現(xiàn)復采冗余,且主從CPU之間交互采樣數(shù)據,當一個CPU插件上采樣系統(tǒng)異常,會判定主從CPU采樣不一致,閉鎖出口避免誤動。硬件原理框圖如圖2所示。
圖2 雙CPU采樣系統(tǒng)框圖
對于有些場合保護設備中只配置1塊CPU插件,則由單CPU實現(xiàn)主采和復采,為了實現(xiàn)最大程度的硬件冗余,主采和復采回路的模/數(shù)轉換(ADC)、參考電壓、運放電源等采用雙套配置。硬件原理框圖如圖3所示。
圖3 單CPU采樣系統(tǒng)框圖
為了進一步提高采樣可靠性,避免由于某個采樣電路電源軌故障導致的采樣數(shù)據整體出錯,設計中增加了額外的采樣電源軌監(jiān)視電路,該電路獨立于ADC采樣電路,主要用來監(jiān)視運放雙極性供電電源、ADC芯片供電電源、ADC外部參考電壓等多個電源軌是否正常,當發(fā)現(xiàn)某個電源軌電壓異常超出設定門檻時,將發(fā)出告警并閉鎖保護,可有效避免由于設備內部模擬量采樣電路異常造成的誤動。
繼電保護設備必須保證可靠、正確的跳閘控制,不能出現(xiàn)單一故障導致的誤動。為了避免設備誤動,跳閘繼電器出口需要啟動信號和跳閘控制信號的共同作用方能真正出口。如圖4所示,當保護設備配置雙CPU時,從CPU負責發(fā)啟動信號/QD_EN(低電平有效),主CPU通過設備內部IO總線發(fā)跳閘命令,開出模件收到跳閘命令后控制出口使能信號/DO_EN(低電平有效)并且發(fā)出相應的跳閘控制信號DOn_DRV,這樣跳閘繼電器K線圈通電,觸點閉合。當保護設備配置單CPU時,啟動信號、跳閘命令均由主CPU負責發(fā)出。
圖4 告警及啟動閉鎖邏輯框圖
如圖4所示,為了防止設備在故障情況下出現(xiàn)誤動,增加了CPU告警信號/CPU_GJ、開出模件告警信號/IO_GJ和開出模件復位信號/RESET對啟動進行閉鎖控制,即當CPU模件發(fā)告警信號或開出模件告警或復位時,啟動信號被拉為非有效狀態(tài),閉鎖出口。
告警系統(tǒng)工作原理如下。
(1)CPU檢測到故障會發(fā)出告警信號,該信號為開漏形式輸出,有告警時輸出低電平。多個CPU的告警信號在母板上為“線與”關系。有一個CPU發(fā)告警,該告警總線則拉低為有效狀態(tài)。
(2)開出模件對告警輸入信號進行如下處理:
1)與開出模件本身的告警信號合并,提供一體輸出;
2)如果存在告警信號有效,則閉鎖啟動信號,跳閘繼電器無法出口,避免誤動;
3)驅動告警繼電器。即有告警時,告警繼電器觸點閉合,無告警時,告警繼電器觸點分開。
2.3.1 開入回路
繼電保護設備開入回路較為簡單,主要實現(xiàn)常見220/110 V等額定電壓開關量信號的采集。通常采用的原理如圖5所示。
圖5 采用光耦的開入回路原理
Fig.5 Block diagram of input circuit with optocoupler
對于可靠性要求非常高的場合,可采用冗余回路的設計方法,如雙路冗余或正反碼輸入的方式,但缺點是占用較大的印制板面積,單模件可實現(xiàn)的采樣通道數(shù)目降低為一半。另一種簡化的方法如圖6所示,為每一組開入增加一路用于校驗的開入通道(最后一路),當組內DI1~DIn中只要有一路開入為“1”時,開入校驗回路應該為“1”;當組內DI1~DIn中所有開入均為“0”時,開入校驗回路應該為“0”。但該方法只能用于輔助校驗,無法校驗每個通道。
圖6 開入校驗回路原理
為了能實現(xiàn)同一硬件電路適應多種額定電壓(如24,48,110,220,125,250 V等)的開關量信號采集,且為了避免上述方案中光耦長期工作產生的老化問題,提出了另一種開關量輸入實現(xiàn)原理,如圖7所示。
圖7 采用ADC+隔離的自適應開入回路原理
Fig.7 Principle of adaptive input circuit using ADC and isolator
2.3.2 開出回路
對于開出回路,設備上電和正常運行過程中定期進行自檢。通過增加反饋自檢回路,配合相應的自檢程序,可發(fā)現(xiàn)啟動回路短路、斷路及驅動短路、繼電器線圈短路等異常情況。當自檢到上述異常,則發(fā)出告警并閉鎖保護。
隨著繼電保護設備就地化以及戶外安裝等需求的提出,對設備的電磁兼容(EMC)性能提出了更高的要求。EMC性能是一個復雜的問題,它的解決必須是在設計之前就要各環(huán)節(jié)全面分析,往往不可能通過一個措施解決全部問題,必須對影響設備EMC性能的各個環(huán)節(jié)嚴格管控,下面列出一些有效的設計方法[11-13]。
2.4.1 物料選型階段
(1)分析物料的各種電氣參數(shù),如物料的抗靜電放電(ESD)性能、自鎖效應(Latch-up)、安規(guī)性能等。
(2)CPU系統(tǒng)選用集成度更高的系統(tǒng)級芯片SOC(system on a chip),如ARM+FPGA的集成芯片,可簡化核心處理系統(tǒng)內部高速信號的連接,提高系統(tǒng)集成度。同時,通過優(yōu)化布局及走線,提高CPU系統(tǒng)的抗擾度,并減少對外輻射干擾。
(3)開入回路選用抗浪涌和耐高溫性能的金屬氧化膜電阻,開出回路選用DK系列繼電器提升抗浪涌和抗沖擊性能。
2.4.2 硬件設計階段
(1)優(yōu)化設備機箱本體的屏蔽性能。采用金屬密閉機箱,機箱表面做導電氧化處理,機箱蓋板搭接處使用導電簧片或導電泡棉,插件之間采用簧片接觸減少縫隙等一系列措施提高機箱的導電連續(xù)性,確保設備具有良好的靜電防護和電磁屏蔽性能。
(2)確保設備外引強電回路的絕緣距離和空氣間隙符合GB 14598.27—2017《量度繼電器和保護裝置 第27部分:產品安全要求》[14]要求,提高回路與大地以及回路之間的絕緣性能。
(3)設備所有外引端口設計完善的隔離和防護電路;所有內部接插件端口進行良好的ESD防護。
(4)優(yōu)化設備內插件的配置,帶有強電信號的插件(如開出模件、跳閘模件、電源模件、交流模件等)與CPU類處理模件分區(qū)布置,避免強電回路引入的傳導和輻射干擾影響CPU類模件通信或其他功能。
隨著繼電保護設備的集成度和性能需求的提高,以及多光模塊的應用需求越來越多,設備功耗和溫升隨之增加,設備的熱控制以及熱設計已經成為了一個新難點。
繼電保護設備穩(wěn)定性、可靠性的要求限制了一些常用的散熱設計,比如設備內禁止采用風扇;較高的防護等級要求(IP42,IP67)則限制了機箱開孔散熱。通常情況下,只能采用自然對流及傳導的方式控制設備內部環(huán)境溫度滿足運行要求。因此,在板級熱耗不斷提高,部分傳統(tǒng)散熱方法又受標準所限的情況下,要對設備進行有效的散熱設計具有較高的難度,需要行之有效的設備類產品熱設計方法,并探求新材料新工藝的引入。
針對熱設計,控制保護設備需從器件級、板卡級、裝置級綜合考慮熱設計方案[15]:
(1)在元器件選型上,選擇低電壓、低功耗、帶功耗管理功能的器件,可關閉芯片內部未使用硬件功能以降低功耗;功耗較大的器件,如處理器、光模塊、電源等,采用貼裝簡單實用的散熱片方式進行散熱,條件允許情況下,可將設備殼體當作“巨大”的散熱片進行有效的散熱,如就地化設備。權衡性能和功耗,選擇合適頻率的處理器和內存。
(2)對于板卡級設計,提高電源電路轉換效率;優(yōu)化發(fā)熱器件布局及印制電路板PCB(printed circuit board)散熱銅箔設計;首選通過傳導方式傳熱到模件小面板或機箱壁。
(3)對于裝置級設計,合理規(guī)劃插件位置和槽位寬度,功耗較大的電源模件、光口通信模件等靠近機箱側壁布置;機箱結構上進行創(chuàng)新設計,如機箱蓋板涂覆新型材料,提高上下蓋板的熱傳導和輻射效率;仿真優(yōu)化散熱器翅片高度、間距、鰭厚,使其散熱能力最優(yōu);條件允許情況下,可以將機箱殼體局部設計為類似散熱翅片的方式提高散熱性能。
(4)整個設計過程中,借助專業(yè)的電子產品熱分析軟件icepak進行仿真和方案評估。另外,軟件上通過程序優(yōu)化、算法優(yōu)化等方面進一步降低整體功耗。
為了提高運行的可靠性,繼電保護設備應集成完備的自檢和在線故障檢測功能[16-18]。常見的功能如下。
2.6.1 工作電源監(jiān)測
保護設備運行時,對內部主要工作電源軌電壓進行監(jiān)測,并在電源超過設定的閾限時產生設備內部告警。這樣可有效地避免由于設備的內部工作電源長時間異常造成的設備損壞,并可避免由于設備內部的電源異常造成的設備錯誤動作。
2.6.2 工作環(huán)境監(jiān)測
保護設備通過板載的溫度和濕度傳感器實時監(jiān)視機箱內的溫濕度。當出現(xiàn)溫度/濕度超出告警閾值、系統(tǒng)溫升速率過快或濕度變化異常等現(xiàn)象時,設備可輸出告警信息,提醒對設備進行檢查,從而進一步提高系統(tǒng)的穩(wěn)定性。
另外,保護設備還針對內部的核心器件的工作溫度進行實時檢測,有效通過統(tǒng)計計算設備內部核心器件的工作歷史,從而當核心器件工作溫度過高時進行告警。
2.6.3 通信狀態(tài)監(jiān)視
保護設備內部通常均由多個不同的處理單元(或插件)構建,而不同處理單元(或插件)的協(xié)同工作嚴重地依賴于設備內部的通信總線。通過對設備內部通信總線的實時監(jiān)測,判斷是否有丟幀、誤碼、中斷、網絡風暴等情況出現(xiàn),如有異常,及時給出告警。
另外,智能變電站正常運行依賴大量的光纖通信,故而加強光接口通道發(fā)送、接收功率的實時監(jiān)測,當檢測到發(fā)送、接收功率異常,及時給出告警。除此之外,設備內部還集成了光接口器件的溫度監(jiān)測,從而可以在光接口器件溫度異常時給出狀態(tài)指示,進而可以提前對光纖接口的工作可靠性進行評判。
2.6.4 處理器負載監(jiān)測
當處理器的負載過高時將嚴重影響保護功能的正常運行。在極端的100%負載下,保護邏輯的計算以及動作等均將被延時,嚴重影響正常的保護功能。因此,對設備的CPU負荷進行監(jiān)視,并根據負荷程度給出正常、異常、告警等不同等級的狀態(tài)信息。對設備的內存占用率進行監(jiān)視,并根據內存占用程度給出正常、異常、告警等不同等級的狀態(tài)信息。
為了驗證設備的可靠性,保證其具有足夠的設計裕度,研發(fā)測試過程中會采用超過電力行業(yè)標準[19-20]最高等級試驗要求開展型式摸底試驗。對于常規(guī)設備、就地化設備,建議摸底測試標準見表1。
高加速壽命試驗(HALT)是一種可靠性試驗技術[21-23],通過對產品逐步施加超過規(guī)范應力的外力(如溫度、振動、快速溫變及振動綜合應力等),快速激發(fā)產品故障,盡可能快地找到產品設計的缺陷或薄弱環(huán)節(jié),從而采取措施予以糾正,最大限度地提高產品的可靠性?;诖耍瑖鴥炔簧傩袠I(yè)已經開展了相關產品的HALT。鑒于保護設備對于可靠性要求極高,故而須在開發(fā)階段引入HALT。HALT試驗包含如下測試項目。
3.2.1 溫度步進試驗
溫度步進分為2個階段,低溫步進和高溫步進。
低溫步進試驗曲線示意如圖8所示,試驗方法如下:
(1)設備處于通電運行狀態(tài),施加額定值。
(2)試驗從設備的產品規(guī)范規(guī)定的低溫工作溫度開始。
(3)以10 ℃的溫度步進對設備進行降溫。
表1 摸底試驗推薦測試條件
注:就地化設備還有一些特殊的測試項目,如太陽光輻射試驗、
低氣壓試驗、浸水試驗、跌落試驗、錘擊試驗等。
圖8 低溫步進試驗曲線示意
(4)設備在各溫度點駐留時間設定為20 min,同時對設備進行開關機3次的試驗,試驗中檢查設備運行和各項性能指標是否正常。
(5)重復步驟(3)和(4),直至設備失效,停止步進試驗。
(6)在設備失效后,將溫度應力降低至操作極限值,檢查設備恢復正常運行。
(7)若能恢復正常運行則重復步驟(3)和(4),若不能恢復正常則將該溫度記為設備低溫破壞極限溫度。
高溫步進試驗方法同低溫步進試驗,示意圖如圖9所示。
3.2.2 快速溫變循環(huán)試驗
快速溫變循環(huán)試驗曲線示意如圖10所示,試驗方法如下:
圖9 高溫步進試驗曲線示意
(1)設備處于通電運行狀態(tài),施加額定值;
(2)設定低溫限值=低溫操作極限溫度+5℃;
(3)設定高溫限值=高溫操作極限溫度-5℃;
(4)以60 ℃/min的溫度變化速率進行高低溫循環(huán)試驗;
(5)設備在各溫度極值點的駐留時間設定為20 min,同時對設備進行開關機3次的試驗,試驗中檢查設備運行和各項性能指標是否正常;
(6)試驗執(zhí)行5個循環(huán)周期。
圖10 快速溫變循環(huán)試驗曲線示意
3.2.3 振動步進試驗
振動步進試驗曲線示意如圖11所示,試驗方法如下:
(1)設備處于通電運行狀態(tài),施加額定值;
(2)試驗初始振動量級為10 Grms,頻率在10~500 Hz之間。在每個振動量級駐留以及試品功能測試完成后,再以10 Grms的振動量級遞增進行試驗;
(3)試驗在每個振動量級的駐留時間應設定為20 min,同時對設備進行開關機3次的試驗,然后再對試品進行基本功能和性能測試,檢查設備運行和各項性能指標是否正常;
(4)直至找到試品的操作極限,停止試驗;
(5)確定試品的操作極限后,振動步進試驗應該繼續(xù)進行,振動應力步進等級按照上面的等級設置,直至確認試品的振動破壞極限。
圖11 振動步進試驗曲線示意
3.2.4 綜合應力試驗
快速溫變循環(huán)與振動步進試驗曲線示意如圖12所示,綜合應力試驗方法如下:
(1)設備處于通電運行狀態(tài),施加額定值;
(2)試驗中設置的溫度循環(huán)曲線的極值應在試品的操作極限上、下限值之內,設備在每個溫度極值點駐留時間為20 min,同時對設備進行開關機3次的試驗;
(3)組合試驗中的初始振動量級是振動步進試驗中破壞極限的1/5,此后每個循環(huán)中振動量級遞增,遞增量為初始振動量級;
(4)在每個試驗量級駐留一段時間后,都應對被測物進行功能/性能測試;
(5)試驗執(zhí)行5個循環(huán)周期。
圖12 快速溫變循環(huán)與振動步進試驗曲線示意
3.3.1 高加速應力篩選(HASS)
HASS[21-23]應用于產品的生產階段,是產品通過HALT試驗得出操作或破壞極限值后在生產線上做高加速應力篩選,一般要求100%的產品參加篩選。其目的是為了使生產的產品不存在任何隱含的缺陷或者至少在產品還沒有出廠前找到并解決這些缺陷,HASS就是通過加速應力方式以期在短時間內找到有缺陷的產品,縮短糾正措施的周期,并找到具有同樣問題的產品。
3.3.2 可靠性驗證測試(RDT)
由于電力設備的運維和投資周期特點,用戶要求設備需在長達12年,甚至更長時間連續(xù)無故障穩(wěn)定運行。如何快速科學地評估產品壽命?在開發(fā)過程中,可采用RDT以加速對產品壽命的評估。
RDT通常采用恒定應力加速壽命試驗的方法,通過對產品施加一定的環(huán)境應力(溫度和濕度)[24-27],通過較長時間的試驗得到產品在一定置信度下的平均故障間隔時間(MTBF),同時可發(fā)現(xiàn)產品的潛在缺陷,以便進一步改進設計,以保證產品的壽命滿足設計要求。
在繼電保護控制設備的開發(fā)過程中,參照文中提出的硬件回路設計方法,綜合EMC設計、熱設計、在線故障檢測等措施,可有效提升設備的硬件可靠性。針對設備,研發(fā)階段可采用高裕度摸底測試、HALT、RDT等可靠性測試方法來驗證其可靠性,并有針對性地進行改進。這種從需求、設計到驗證的閉環(huán)開發(fā)流程,對于提升繼電保護控制設備可靠性具有一定的指導價值。