徐建云,李 飛,張 琳,王鴻璽,馬紅明
(國(guó)網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
Xu Jianyun,Li Fei,Zhang Lin,Wang Hongxi,Ma Hongming
(State Grid Hebei Electric Power Research Institute, Shijiazhuang 050021,China)
?
基于Linux系統(tǒng)的集中器故障分析及處理
徐建云,李 飛,張 琳,王鴻璽,馬紅明
(國(guó)網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
針對(duì)現(xiàn)場(chǎng)運(yùn)行低壓電力集中器死機(jī),無(wú)法正常啟動(dòng)的問(wèn)題,通過(guò)對(duì)故障集中器進(jìn)行檢查,確定集中器Linux系統(tǒng)數(shù)據(jù)區(qū)溢出,程序運(yùn)行空間不足導(dǎo)致死機(jī),提出程序優(yōu)化方案及處理措施,并試驗(yàn)驗(yàn)證了其可行性。
用電信息采集系統(tǒng);集中器;Linux;故障
Xu Jianyun,Li Fei,Zhang Lin,Wang Hongxi,Ma Hongming
(State Grid Hebei Electric Power Research Institute, Shijiazhuang 050021,China)
用電信息采集系統(tǒng)集電能表數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理及供電控制等功能于一體,可以使供電部門(mén)及時(shí)掌握用戶用電情況,監(jiān)測(cè)有無(wú)竊電行為;根據(jù)需要進(jìn)行供電控制;通過(guò)遠(yuǎn)程抄表,節(jié)省抄表的人力物力。低壓電力集中器作為低壓電力用戶電能數(shù)據(jù)采集、存儲(chǔ)、管理、上傳的重要設(shè)備,對(duì)用電信息采集起著至關(guān)重要的作用[1]。
隨著智能電表的推廣應(yīng)用和用電信息采集系統(tǒng)的完善,低壓電力集中器在河北南網(wǎng)廣泛應(yīng)用。近期河北南網(wǎng)應(yīng)用用電信息采集系統(tǒng)主站時(shí)發(fā)現(xiàn),某廠家生產(chǎn)的11臺(tái)集中器陸續(xù)無(wú)法通信,召測(cè)無(wú)應(yīng)答,主站狀態(tài)變?yōu)椴辉诰€,檢查發(fā)現(xiàn)11臺(tái)集中器運(yùn)行時(shí)發(fā)生死機(jī)現(xiàn)象,集中器無(wú)法下行與電能表通信,按鍵可以喚醒顯示屏,集中器斷電后重新上電也無(wú)法正常啟動(dòng),現(xiàn)場(chǎng)連接RS485也無(wú)法正常抄讀信息。且隨著運(yùn)行時(shí)間的延長(zhǎng),同類故障的集中器數(shù)量大幅增長(zhǎng),嚴(yán)重影響用電信息采集和臺(tái)區(qū)線損統(tǒng)計(jì)。
對(duì)故障集中器進(jìn)行檢查,發(fā)現(xiàn)現(xiàn)場(chǎng)環(huán)境正常,電壓電流符合技術(shù)規(guī)范要求,無(wú)硬件損壞。進(jìn)一步對(duì)集中器軟件運(yùn)行檢測(cè),通過(guò)測(cè)試工具軟件檢查集中器Linux系統(tǒng)內(nèi)部存儲(chǔ)區(qū),為了模擬現(xiàn)場(chǎng)環(huán)境,保證使集中器滿足實(shí)際運(yùn)行情況,在實(shí)驗(yàn)室搭建試驗(yàn)裝置,檢測(cè)集中器存儲(chǔ)區(qū)運(yùn)行狀況,確立了以下檢測(cè)試驗(yàn)方案:
a. 搭建1個(gè)采集環(huán)境,1臺(tái)集中器下掛10臺(tái)電能表通過(guò)RS485接口進(jìn)行抄表,通過(guò)RS485接口可保證通訊的速率和可靠性。
b. 修改集中器程序,改為每30 s對(duì)交采數(shù)據(jù)及下掛電能表數(shù)據(jù)進(jìn)行抄讀,集中器30 s內(nèi)抄完所有數(shù)據(jù),模擬出現(xiàn)場(chǎng)真實(shí)情況,縮短正常存儲(chǔ)數(shù)據(jù)時(shí)間,使集中器存儲(chǔ)快速達(dá)到飽和狀態(tài)。
c. 延長(zhǎng)運(yùn)行時(shí)間,并使用Liunx系統(tǒng)存儲(chǔ)查詢軟件,查看集中器存儲(chǔ)區(qū)使用情況。
在實(shí)驗(yàn)室對(duì)現(xiàn)場(chǎng)故障集中器相同批次的新集中器進(jìn)行試驗(yàn),試驗(yàn)測(cè)試情況如下所示:
運(yùn)行1 h存儲(chǔ)情況見(jiàn)表1。
表1 試驗(yàn)1 h集中器Linux系統(tǒng)存儲(chǔ)情況
文件系統(tǒng)存儲(chǔ)空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲(chǔ)區(qū)19.4M6.4M13.0M33%程序存儲(chǔ)區(qū)20.0M5.4M14.6M27%數(shù)據(jù)存儲(chǔ)區(qū)92.0M24.5M67.5M27%
運(yùn)行3 h存儲(chǔ)情況見(jiàn)表2。
表2 試驗(yàn)3 h集中器Linux系統(tǒng)存儲(chǔ)情況
文件系統(tǒng)存儲(chǔ)空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲(chǔ)區(qū)19.4M6.4M12.9M33%程序存儲(chǔ)區(qū)20.0M5.4M14.6M27%數(shù)據(jù)存儲(chǔ)區(qū)92.0M91.1M932.0K99%
運(yùn)行4.5 h存儲(chǔ)情況見(jiàn)表3。
表3 試驗(yàn)4.5 h集中器Linux系統(tǒng)存儲(chǔ)情況
文件系統(tǒng)存儲(chǔ)空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲(chǔ)區(qū)19.4M6.4M12.9M33%程序存儲(chǔ)區(qū)20.0M5.4M14.6M27%數(shù)據(jù)存儲(chǔ)區(qū)92.0M92.0M36.0K100%
運(yùn)行4.5 h后集中器出現(xiàn)死機(jī)現(xiàn)象,現(xiàn)象同現(xiàn)場(chǎng)故障集中器情況相同。用測(cè)試工具軟件查看數(shù)據(jù)存儲(chǔ)區(qū)使用率為100%。由該試驗(yàn)可見(jiàn),隨著時(shí)間的延長(zhǎng)和存儲(chǔ)數(shù)據(jù)量增加,系統(tǒng)數(shù)據(jù)存儲(chǔ)區(qū)占用比逐漸增高,當(dāng)已使用空間占比達(dá)到100%寫(xiě)滿后,終端無(wú)法完成數(shù)據(jù)存儲(chǔ),造成終端死機(jī)。
針對(duì)現(xiàn)場(chǎng)集中器運(yùn)行情況,分析故障原因?yàn)椋夯贚inux系統(tǒng)的集中器數(shù)據(jù)存儲(chǔ)區(qū),隨著運(yùn)行時(shí)間和存儲(chǔ)數(shù)據(jù)的增加,可用有效存儲(chǔ)空間越來(lái)越小,不能進(jìn)行存儲(chǔ)數(shù)據(jù)的自動(dòng)刪除,最終導(dǎo)致存儲(chǔ)區(qū)數(shù)據(jù)溢出,沒(méi)有有效的數(shù)據(jù)存儲(chǔ)空間可供程序運(yùn)行,導(dǎo)致現(xiàn)場(chǎng)集中器程序無(wú)法正常運(yùn)行,進(jìn)而導(dǎo)致發(fā)生死機(jī),失去上行下行通信功能,重新上電也無(wú)法正常啟動(dòng)。
針對(duì)集中器故障原因,對(duì)軟件程序進(jìn)行修改,優(yōu)化數(shù)據(jù)存儲(chǔ)策略,增加數(shù)據(jù)存儲(chǔ)空間回收機(jī)制,當(dāng)數(shù)據(jù)存儲(chǔ)區(qū)剩余空間小于20%時(shí),及時(shí)清除最早的數(shù)據(jù)文件,保證剩余數(shù)據(jù)空間充裕,避免由于沒(méi)有數(shù)據(jù)存儲(chǔ)空間而導(dǎo)致寫(xiě)數(shù)據(jù)失敗以致死機(jī);使用升級(jí)程序?qū)ΜF(xiàn)場(chǎng)取回的故障終端和故障分析試驗(yàn)時(shí)發(fā)生死機(jī)的終端分別進(jìn)行升級(jí);重復(fù)上述故障發(fā)生時(shí)使用的試驗(yàn)方案進(jìn)行試驗(yàn),運(yùn)行時(shí)間增加到24 h。試驗(yàn)測(cè)試情況如下:
運(yùn)行1 h存儲(chǔ)情況見(jiàn)表4。
表4 試驗(yàn)1 h集中器Linux系統(tǒng)存儲(chǔ)情況
文件系統(tǒng)存儲(chǔ)空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲(chǔ)區(qū)19.4M11.4M7.9M59%程序存儲(chǔ)區(qū)20.0M8.9M11.1M45%數(shù)據(jù)存儲(chǔ)區(qū)92.0M30.0M62.0M33%
運(yùn)行4 h存儲(chǔ)情況見(jiàn)表5。
表5 試驗(yàn)4 h集中器Linux系統(tǒng)存儲(chǔ)情況
文件系統(tǒng)存儲(chǔ)空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲(chǔ)區(qū)19.4M11.8M7.6M61%程序存儲(chǔ)區(qū)20.0M8.9M11.1M44%數(shù)據(jù)存儲(chǔ)區(qū)92.0M74.7M17.3M81%
運(yùn)行24 h存儲(chǔ)情況見(jiàn)表6。
表6 試驗(yàn)24 h集中器Linux系統(tǒng)存儲(chǔ)情況
文件系統(tǒng)存儲(chǔ)空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲(chǔ)區(qū)19.4M11.8M7.5M61%程序存儲(chǔ)區(qū)20.0M8.9M11.1M44%數(shù)據(jù)存儲(chǔ)區(qū)92.0M74.8M17.2M81%
可以看出,運(yùn)行4 h數(shù)據(jù)區(qū)存儲(chǔ)占比達(dá)到81%,運(yùn)行24 h后數(shù)據(jù)區(qū)存儲(chǔ)占比仍然為81%,說(shuō)明通過(guò)程序的優(yōu)化升級(jí),當(dāng)可用空間小于20%時(shí),清除了部分?jǐn)?shù)據(jù)文件,騰出存儲(chǔ)空間,試驗(yàn)用集中器程序運(yùn)行正常,未發(fā)生死機(jī)現(xiàn)象。
針對(duì)出現(xiàn)故障的同一廠家集中器提出對(duì)集中器程序進(jìn)行升級(jí),增加集中器數(shù)據(jù)區(qū)存儲(chǔ)空間回收機(jī)制,當(dāng)數(shù)據(jù)存儲(chǔ)區(qū)剩余空間小于20%時(shí),及時(shí)清除最早的數(shù)據(jù)文件,保證剩余數(shù)據(jù)空間充裕,消除故障隱患?,F(xiàn)場(chǎng)運(yùn)行集中器通過(guò)數(shù)據(jù)區(qū)空間回收機(jī)制升級(jí),長(zhǎng)時(shí)間運(yùn)行不再發(fā)生故障,現(xiàn)場(chǎng)集中器運(yùn)行狀況說(shuō)明了故障原因和處理措施的有效性。
隨著用電信息采集技術(shù)的深入發(fā)展,集中器應(yīng)用程序的科學(xué)設(shè)計(jì)和持續(xù)改進(jìn)具有重要意義。根據(jù)實(shí)際現(xiàn)場(chǎng)運(yùn)行中出現(xiàn)的集中器故障,分析了故障原因?yàn)榛贚inux系統(tǒng)的數(shù)據(jù)區(qū)溢出,沒(méi)有回收機(jī)制,導(dǎo)致存儲(chǔ)空間不足,提出了程序優(yōu)化方案,并用試驗(yàn)驗(yàn)證了故障原因和優(yōu)化方案的可行性。通過(guò)集中器運(yùn)行中發(fā)現(xiàn)的問(wèn)題,用電信息采集技術(shù)的可靠性將進(jìn)一步提高。
[1] 李 飛.低壓電力集中器故障原因分析及處理[J].河北電力技術(shù),2014,33(4):49-50.
本文責(zé)任編輯:羅曉曉
Analysis and Treatment of Concentrator Fault Based on Linux System
Low voltage power concentrator crashes, can not start properly, through the experimental analysis of the failure causes, concentrator Linux system data overflow, lack of space to run the program lead to crashes, puts forward the treatment measures, effective measures is proved by experiment.
concentrator; Linux; fault; electric power
2016-06-27
徐建云(1987-),男,工程師,主要從事電能計(jì)量及采集方面工作。
TM769
B
1001-9898(2016)05-0061-02