陳森 梁爽 陳晨 于士謙 侯俊飛
(許繼電氣股份有限公司,河南 許昌 461000)
目前,國(guó)內(nèi)電力生產(chǎn)運(yùn)行、經(jīng)營(yíng)管理所使用的繼電保護(hù)電力專用芯片依賴于進(jìn)口。隨著芯片和信息安全的重要性日益突出,一旦出現(xiàn)類似華為芯片禁令事件,就無(wú)法保證電網(wǎng)所需的繼電保護(hù)裝置等電力設(shè)備的正常供應(yīng)。為此,加快推進(jìn)國(guó)產(chǎn)化的自主可控新一代繼電保護(hù)裝置的研制進(jìn)度,并盡快成熟應(yīng)用,著力解決核心技術(shù)的“卡脖子”問(wèn)題就顯得尤為重要[1]。
繼電保護(hù)裝置在電網(wǎng)系統(tǒng)或設(shè)備出現(xiàn)故障后,能及時(shí)反應(yīng)并發(fā)出故障信號(hào),并以斷路器跳閘的方式將故障位置進(jìn)行隔離,從而對(duì)電網(wǎng)其他系統(tǒng)和設(shè)備進(jìn)行保護(hù)[2]。繼電保護(hù)裝置一旦投入正式運(yùn)行,就要不間斷工作10 年以上,且要受到極端自然環(huán)境的考驗(yàn),極易導(dǎo)致繼電保護(hù)裝置出現(xiàn)功能受損等問(wèn)題,從而引起電力系統(tǒng)的連鎖反應(yīng),因繼電保護(hù)裝置本身出現(xiàn)異?;蚬收蠈?dǎo)致系統(tǒng)無(wú)法正常運(yùn)行,嚴(yán)重時(shí)會(huì)導(dǎo)致重大的財(cái)產(chǎn)損失和人員傷亡等[3]。
繼電保護(hù)裝置出現(xiàn)的故障有以下5種[4]。①繼電保護(hù)裝置供電電源輸出功率不穩(wěn)定,從而導(dǎo)致保護(hù)裝置判斷不準(zhǔn)確。②繼電保護(hù)裝置插件上的零部件損壞導(dǎo)致裝置出現(xiàn)故障,最終導(dǎo)致保護(hù)裝置失靈。③繼電保護(hù)裝置長(zhǎng)期處于強(qiáng)電磁環(huán)境中,導(dǎo)致保護(hù)邏輯出現(xiàn)誤動(dòng)作。④站用直流系統(tǒng)出現(xiàn)故障。如電壓降低將導(dǎo)致保護(hù)裝置異常,直流接地會(huì)導(dǎo)致保護(hù)裝置誤動(dòng)或拒動(dòng)等。⑤斷路器控制回路故障。如斷路器控制回路斷線造成斷路器無(wú)法正常分閘、合閘,從而出現(xiàn)故障不能切除、越級(jí)跳閘等問(wèn)題。
某型號(hào)110 kV 變壓器保護(hù)裝置為自主可控新一代智能變電站的繼電保護(hù)裝置,該裝置從軟件到硬件已全部實(shí)現(xiàn)國(guó)產(chǎn)化。
繼電保護(hù)裝置在中試測(cè)試模擬現(xiàn)場(chǎng)發(fā)生低壓1分支復(fù)壓過(guò)流故障,保護(hù)裝置的低壓1 分支復(fù)壓過(guò)流保護(hù)可靠動(dòng)作,但不出口。為了查看保護(hù)裝置的采樣值是否符合檢測(cè)標(biāo)準(zhǔn)的精度要求,通過(guò)繼電保護(hù)測(cè)試儀給該裝置施加穩(wěn)定的電壓和電流,分別查看裝置的就地保護(hù)板和啟動(dòng)板的采樣值,發(fā)現(xiàn)保護(hù)板的采樣值均正常,但啟動(dòng)板的低壓側(cè)電壓和電流采樣數(shù)據(jù)均為0,繼續(xù)查看零漂菜單,低壓側(cè)電壓電流零漂值均為非0。
發(fā)現(xiàn)問(wèn)題后要及時(shí)向設(shè)計(jì)人員及項(xiàng)目負(fù)責(zé)人進(jìn)行反饋。為了便于查清問(wèn)題產(chǎn)生的原因,采取保留問(wèn)題現(xiàn)場(chǎng)的措施,未對(duì)問(wèn)題裝置進(jìn)行斷電重啟、插拔插件等操作,決定在另一個(gè)同型號(hào)的裝置上復(fù)現(xiàn)該問(wèn)題,驗(yàn)證該問(wèn)題是否與預(yù)想問(wèn)題的產(chǎn)生原因一致,待故障現(xiàn)象復(fù)現(xiàn)后,才能對(duì)問(wèn)題進(jìn)行正確的定位、解決以及驗(yàn)證。
繼電保護(hù)裝置的硬件核心架構(gòu)的示意圖見(jiàn)圖1。
圖1 裝置硬件核心架構(gòu)示意圖
啟動(dòng)CPU 插件和保護(hù)CPU 插件都擁有獨(dú)立的內(nèi)存、Flash、FPGA 及ADC 模塊,保護(hù)邏輯完全相同。2 套系統(tǒng)并行運(yùn)行,啟動(dòng)CPU 控制啟動(dòng)繼電器,保護(hù)CPU 控制出口繼電器,啟動(dòng)CPU 和保護(hù)CPU 的保護(hù)邏輯同時(shí)滿足的情況下才能出口跳閘,雙CPU架構(gòu)極大地提高繼電保護(hù)裝置的可靠性。
通過(guò)閱讀源碼程序、調(diào)試、實(shí)時(shí)仿真、日志分析等方法,首先排除該問(wèn)題是因程序設(shè)計(jì)所導(dǎo)致的,最終確定有可能是硬件故障導(dǎo)致的。
該裝置在中試測(cè)試過(guò)程中,低壓1 分支復(fù)壓過(guò)流保護(hù)可靠動(dòng)作但不出口的根本原因是啟動(dòng)板采樣出現(xiàn)問(wèn)題。因繼電保護(hù)的保護(hù)出口邏輯采用“啟動(dòng)+跳閘”的串聯(lián)控制邏輯,只有啟動(dòng)CPU、保護(hù)CPU 同時(shí)動(dòng)作時(shí),裝置才會(huì)動(dòng)作。其中,啟動(dòng)板所屬的低壓側(cè)電壓、電流采樣數(shù)據(jù)均為0,可進(jìn)一步推斷故障發(fā)生在啟動(dòng)CPU 板上,尤其是啟動(dòng)CPU 板上的相關(guān)采樣電路。由于故障過(guò)程中的采樣數(shù)據(jù)均為0,打開(kāi)啟動(dòng)CPU 板的硬件電路,其中FPGA 與AD 芯片示意圖見(jiàn)圖2。
由圖2 可知,啟動(dòng)CPU 插件共有9 片AD7656(AD 芯片型號(hào))。其中,1 片AD7656 用來(lái)采集5 V和2 組±15 V 電源,并用于電源的自檢,其余8 片用來(lái)采集模擬量,2 個(gè)±15 V 電源作為電源輸出模塊,分別為2 個(gè)4 片的AD7656 供電,且這4 片AD7656由同一個(gè)±15 V電源進(jìn)行供電。
圖2 FPGA與AD芯片示意圖
因低壓側(cè)采樣數(shù)據(jù)為0,極有可能是其中的4片AD 芯片無(wú)法采集到的模擬量,啟動(dòng)CPU 插件的AD芯片供電部分,其原理圖見(jiàn)圖3、圖4。
圖3 1~24路供電部分原理圖
圖4 25~48路供電部分原理圖
通過(guò)測(cè)試分析,初步確定±15 V電源供電的AD芯片采集異常,使用萬(wàn)用表分別測(cè)量1~24 路AD電源芯片供電電壓±15.0 VCC1 和25~48 路AD 電源芯片的供電電壓±15.0 VCC2。其中,+15.0 VCC2實(shí)測(cè)約為1.2 V、-15.0 VCC2 實(shí)測(cè)約為0.1 V,即25~48 路AD 電源芯片的供電電壓±15.0 VCC2 出現(xiàn)異常。將25~48 路AD 電源芯片L5 和L6 電感去掉,U14 的輸出±15 V 均正常,使用萬(wàn)用表測(cè)量+15.0 VCC2、-15.0 VCC2之間的電阻,測(cè)量值為0。因此,初步判定是因?yàn)锳D芯片或電容短路。
AD芯片的原理圖見(jiàn)圖5,將與±15.0 VCC2連接的電容C32、C33、C37、C38、C711、C712、C713、C714逐個(gè)去掉(其他電容保留),經(jīng)排查后發(fā)現(xiàn),將C714(0603-25 V-10 μF-X5R)電容去掉后,裝置出現(xiàn)的現(xiàn)象與問(wèn)題現(xiàn)場(chǎng)保留的裝置現(xiàn)象完全一致。將更換新電容的啟動(dòng)CPU插件插入裝置,給低壓側(cè)模擬量施加額定電壓和額定電流,啟動(dòng)板的低壓側(cè)采樣數(shù)據(jù)恢復(fù)正常。由此最終確定采樣故障發(fā)生的原因。
圖5 AD芯片原理圖
對(duì)失效電容進(jìn)行失效分析,其中外觀檢查、紋波電壓測(cè)試、紋波電流測(cè)試等均正常,而電性能測(cè)試、破壞性物理分析(DPA)、電容溫度測(cè)試出現(xiàn)異常現(xiàn)象。
4.1.1 外觀檢查。未發(fā)現(xiàn)樣品的瓷體有裂紋、缺損等。
4.1.2 電性能測(cè)試。送檢電容型號(hào)為0603/25 V/10 μF、實(shí)驗(yàn)室溫度為25.3 ℃、濕度為55%,使用HP 4284A LRC 電容器測(cè)試儀和HP 4239A 絕緣電阻測(cè)試儀對(duì)電容進(jìn)行電性能測(cè)試,測(cè)試條件為C/DF 為1 kHz、1.0V,IR 為25 V,測(cè)試時(shí)間為1 min。電性能測(cè)試結(jié)果見(jiàn)表1。
表1 常溫電性能測(cè)試結(jié)果
4.1.3 破壞性物理分析(DPA)。對(duì)失效電容進(jìn)行DPA 研磨,內(nèi)部存在過(guò)載擊穿現(xiàn)象,擊穿后裂紋向兩邊延伸,如圖6所示。
圖6 樣品研磨局部放大圖
經(jīng)外觀檢查、電性能測(cè)試和破壞性物理分析(DPA),并結(jié)合片式多層瓷介電容器典型失效模式、類似失效案例和積累的失效產(chǎn)品圖片資料,此次失效可能是電容器在使用或測(cè)試過(guò)程中遭受異常大電壓或大電流沖擊,從而導(dǎo)致電容器內(nèi)部被擊穿,擊穿后形成的裂紋向內(nèi)電極方向兩端延伸,并穿過(guò)內(nèi)電極,導(dǎo)致電容器絕緣電阻下降。
紋波電流或電壓是指電流中的高次諧波成分帶來(lái)的電流或電壓幅值的變化,可能會(huì)導(dǎo)致?lián)舸?。由于使用的是交流電,?huì)在電容上發(fā)生耗散。如果電流的紋波成分過(guò)大,超過(guò)電容的最大容許紋波電流,會(huì)導(dǎo)致電容被燒毀。
4.2.1 紋波電壓測(cè)試。U40A(AD芯片AD7656)電源管腳VDD和VSS處電容C606、C608安裝了不同容值的電容(0603-25 V-10 μF-X5R、0603-50 V-1 μF-X7R),U40A 電源管腳VDD 和VSS 處的紋波電壓相差不大。U40A電源管腳如圖7所示。
4.2.2 紋波電流測(cè)試。將圖7 中與U40A 電源管腳相通的電容C608 的一個(gè)管腳直接與焊盤連接,另一個(gè)管腳經(jīng)導(dǎo)線與焊盤連接,瞬態(tài)電流僅為3 mA。將D16 去掉,改成導(dǎo)線連接,其紋波電流約為32 mA。流經(jīng)D29 的總電流(-15 VCC1)約為31 mA,其紋波電流約為5 mA。
圖7 U40A電源管腳
在電容溫度測(cè)試中,將智能IO 插件的11 路硬壓板開(kāi)入接DC220V,為解決測(cè)試電容溫度時(shí)熱耦接觸不可靠問(wèn)題,用北極銀導(dǎo)熱硅脂均勻涂抹在熱耦上,以盡可能接近電容本體溫度,電容本體溫度如圖8 所示。
圖8 電容本體溫度
從溫度測(cè)試結(jié)果可知,電容溫度最高可達(dá)84.4 ℃,接近運(yùn)行工作溫度的上限,考慮到環(huán)境溫度和熱耦接觸緊密程度帶來(lái)的誤差,電容本體溫度可能超過(guò)85 ℃。
在未經(jīng)失效分析測(cè)試前,懷疑電容短路是由大電壓、大電流擊穿造成的,但通過(guò)紋波電流測(cè)試,AD啟動(dòng)數(shù)模轉(zhuǎn)換所需的瞬態(tài)電流約為32 mA,此瞬態(tài)電流即使全部由電容(0603-25 V-10 μF-X5R,以下簡(jiǎn)稱X5R)提供,也不足以損壞電容。因此,可初步排除大電流沖擊損壞,考慮是電壓擊穿。X5R 電容的工作溫度為-55~85 ℃。在85℃時(shí),X5R 電容的額定電壓降額至70%,廠家推薦工作溫度不應(yīng)超過(guò)85 ℃,超過(guò)85 ℃后,電壓和溫度曲線不再是線性關(guān)系。其中,X5R 電容的電壓和溫度線性關(guān)系圖見(jiàn)圖9。
圖9 電壓和溫度線性關(guān)系圖
將啟動(dòng)CPU插件上的AD電源回路中燒壞的電容(0603-25 V-10 μF-X5R)更換成工作溫度范圍更廣、可靠性更高的電容(0603-50 V-1 μF-X7R)后,再對(duì)該裝置的可靠性進(jìn)行測(cè)試,該裝置再未出現(xiàn)低壓側(cè)啟動(dòng)板無(wú)法采樣的現(xiàn)象。
對(duì)繼電保護(hù)裝置,尤其是自主可控新一代繼電保護(hù)裝置進(jìn)行試驗(yàn)具有重要意義。通過(guò)模擬繼電保護(hù)裝置在自然環(huán)境中正常運(yùn)行所遇到的各種復(fù)雜狀況,盡可能找到設(shè)計(jì)中存在的缺陷,從而消除缺陷。從整機(jī)散熱到元器件選型,任何一個(gè)瑕疵都有可能成為引起整個(gè)裝置系統(tǒng)崩潰的元兇,所以選擇可靠的元器件是最基礎(chǔ)的,也是最不容忽視的關(guān)鍵一步。