[莊丹 郭向榮 鄧金榮 許學(xué)研 曹海山 陳慶專 黃偉群]
隨著網(wǎng)絡(luò)強國戰(zhàn)略的不斷深入,邊遠地區(qū)手機基本普及,人民對5G 的需求不斷增加,移動通信運營商每年投入大量的資金建設(shè)5G 基站,基本遍布全國各區(qū)域。移動網(wǎng)絡(luò)站點廣泛分布在各處,基站用電無人看管,用電異常問題隨著基站數(shù)量的增加也日趨嚴重,偷漏電現(xiàn)象時有發(fā)生。
通信運營商每年支出大量的電費費用,通信基站偷漏電嚴重侵害了通信運營商的合法權(quán)益,給國家?guī)砹司薮蠼?jīng)濟損失,而且電壓不穩(wěn)對機房設(shè)備造成較大的安全隱患。
因此,探究基于高精度、低成本的用電異常檢測方法勢在必行。針對基站用電異常問題,本文通過電表大數(shù)據(jù)、基站設(shè)備數(shù)據(jù)、網(wǎng)管能耗數(shù)據(jù)、用戶行為等多維數(shù)據(jù),研究一種精細化、多維度、場景化關(guān)聯(lián)的用電異常檢測方法,輸出用電異常站點清單,高效支撐現(xiàn)場排查取證。
通信基站用電量短期內(nèi)相對平穩(wěn),且總用電量受限于機房內(nèi)設(shè)備總額定功率。不同類型竊電用戶有不同的用電規(guī)律,主要用于工廠生產(chǎn)、家庭作坊、樓房出租照明、辦公樓用電、普通家庭日用等5 類場景。不同場景對應(yīng)用電特征如下。
2.1.1 工廠生產(chǎn)、家庭作坊、辦公樓用電
日常用電量大,但重要節(jié)假日停止生產(chǎn),用電量急劇下降,假期結(jié)束后恢復(fù)生產(chǎn),用電量又急劇上升。用電特征呈現(xiàn)“凹”字形。
2.1.2 樓房出租照明
與工廠類型類似,在春節(jié)、中秋節(jié)、國慶節(jié)等重要節(jié)日人員返鄉(xiāng)或外出旅游,該段時間用電量減少,臨近假期結(jié)束,人員返回出租屋,用電量呈現(xiàn)上升趨勢。用電特征呈現(xiàn)“凹”字形。
2.1.3 普通家庭日常用電
整體用電量小,由于使用習(xí)慣,每天的用電量難以精準控制,每天用電波動性大。
在電力賬戶下4 500 個直供電電表每天產(chǎn)生用電數(shù)據(jù),每月大概14 萬條數(shù)據(jù),累積形成用電基礎(chǔ)信息庫。
提取每個網(wǎng)絡(luò)機房每臺設(shè)備、空調(diào)的每天功率數(shù)據(jù),計算對應(yīng)機房的額定功耗上限,形成機房每天額定功率信息庫。
提取網(wǎng)管系統(tǒng)設(shè)備的每天能耗數(shù)據(jù),和相關(guān)業(yè)務(wù)量數(shù)據(jù),形成設(shè)備能耗信息庫。
2.3.1 工廠、辦公偷電場景
工廠生產(chǎn)、家庭作坊、辦公樓用電和樓房出租照明用電特征均與節(jié)假日人流擴散相關(guān),節(jié)假日的日均用電量低于非節(jié)假日電量,用電特征呈現(xiàn)“凹”字形,與基站在節(jié)假日期間的平穩(wěn)或上升的用電趨勢相背離。
取放假前電表每天平均耗電量為P1,假日期間電表每天平均耗電量為P2,假期結(jié)束后電表每天平均耗電量為P3,左側(cè)下降值D1=(P1-P2)/P2,右側(cè)上升值D1=(P3-P2)/P2,設(shè)置凹陷閾值N,當(dāng)D1>N同時D2>N時,說明用電趨勢呈現(xiàn)“凹”字,N值為凹陷深度,當(dāng)N值設(shè)置越大,凹陷越深,用電異??赡苄栽酱?。
對節(jié)假日期間與放假前后進行電量比對,控制凹陷閾值,輸出異常用電清單,建立“節(jié)假日場景用電異常模型”,專攻工廠、辦公偷電場景。
2.3.2 普通家庭日常用電場景
普通家庭日常用電用電波動大,利用波動特性建立3種模型。
(1)額定功率超標模型
通過每天用電能耗與該電表下所有設(shè)備的最大理論功耗相比對,應(yīng)用pandas 進行數(shù)列快速計算,假設(shè)電表每天能耗數(shù)據(jù)為P1,該電表下帶機房里所有設(shè)備的最大理論功耗為P2,機房數(shù)據(jù)準確、正常用電情況下,不可能突破所有設(shè)備的最大理論功耗。以天為顆粒度進行檢測,只要出現(xiàn)某一天P1≥P2時,則站點可能存在用電異常現(xiàn)象。對超過最大理論功耗的站點進行定位,建立“額定功率超標模型”,專攻居民偷電場景。
(2)電表數(shù)據(jù)高偏離度模型
利用基站用電的穩(wěn)定性,應(yīng)用中心極限定理,隨機對電表大數(shù)據(jù)隨機m次抽取n個樣本求出平均值,按照EP校驗理論,平均值的分布應(yīng)接近正態(tài)分布。在我國國標《GB/T4882-2001數(shù)據(jù)的統(tǒng)計處理和解釋:正態(tài)性檢驗》中,在有方向的檢驗方法中,推薦了偏度和峰度檢驗;在無方向的檢驗方法中,推薦了Shapiro-Wilk檢驗和Epps-Pulley檢驗。本文選用EP 檢驗,假設(shè)H0 為正態(tài)分布,計算T,如果T落入拒絕域,則認為H0 為假:
其中,n為樣本的個數(shù),為樣本方差(除以n),為樣本均值,為具體的樣本取值。統(tǒng)計量通常用計算機編程得到,其拒絕域為:
α為顯著性水平,衡量犯第一類錯誤(棄真錯誤)的概率。原假設(shè)H0是正態(tài)分布的,但是通過樣本估計總體后,錯誤的拒絕了原假設(shè)。錯誤的概率是α。
相應(yīng)的數(shù)據(jù),如表1 所示。
表1 顯著性檢驗表
隨機抽樣的用電均值數(shù)量大概在50 左右,因此假設(shè)超過50 的,再隨機抽50 個進行計算,如果低于50,則隨機抽30 個進行測算,超過100 則按照100 測算,以此類推。
對原有的4 474個電表,取1~3月份的每天用電數(shù)據(jù),得到統(tǒng)計結(jié)果如表2 所示。
表2 電表正態(tài)性檢驗結(jié)果信息表
從表2 可知,大約有8 成的電表符合正太分布的特征。
因此,可對電表進行偏離處理,當(dāng)出現(xiàn)了讀數(shù)明顯偏離了正態(tài)分布期望之外,大于3 倍樣本標準差值的平均值,輸出為疑似異常站點。建立“電表數(shù)據(jù)高偏離度模型”,專攻電表不正常波動高偏離場景。
(3)日耗電偏離設(shè)備能耗模型
通過在后臺采集到的射頻及基帶能耗數(shù)據(jù),考慮業(yè)務(wù)量、空調(diào)能耗、線路損耗等因素,當(dāng)每天用電數(shù)據(jù)超過后臺設(shè)備能耗N倍時,輸出為疑似異常站點。建立“日耗電偏離設(shè)備能耗模型”,專攻設(shè)備用電異常場景。
如圖1 所示,通過建立多維度檢測模型,4 種模型同時檢測,加強用電異常檢測精度。
圖1 多維模型建立思路
2021年2月11日至2月17日為春節(jié)假期,用2.8~2.17春節(jié)期間各直供站點的用電量,與1.1~1.10(停工前)、3.14~3.24(復(fù)工后)日均用電比對,凹陷閾值取-30%,共輸出4 個疑似異常站點。經(jīng)現(xiàn)場排查,4 個站點均發(fā)現(xiàn)存在搭線行為,偷電線路均用于生產(chǎn),每天偷電數(shù)額較大。
如圖2 所示,以龍湖1 匯聚機房為例,站點建設(shè)在工廠樓房上,1.1~1.10 平均每天電表耗電量620 度,春節(jié)期間急劇下降至358 度,3.14~3.24 恢復(fù)生產(chǎn)后,平均每天電表耗電量500 度,現(xiàn)場取證發(fā)現(xiàn)業(yè)主從我司基站電表處偷搭電線,用于工廠生產(chǎn)。
圖2 節(jié)假日場景用電異常模型部分典型異常站點
反過來,利用模型顯示的用電特征,可以指導(dǎo)現(xiàn)場排查取證。以龍湖2 基站為例,現(xiàn)場可發(fā)現(xiàn)在基站電表處被偷搭電線,現(xiàn)場測試搭線電流為12 A,因站點所屬城中村樓宇密集線路復(fù)雜,通過摸查線路無法確認偷電用戶。該站點節(jié)日期間異常用電特征明顯,結(jié)合偷電線路電流情況,初步判斷為工廠、作坊類用電。經(jīng)逐戶排查,排除春節(jié)不停工的餐飲類商鋪,發(fā)現(xiàn)不遠處有一家服裝制作類家庭作坊,通過現(xiàn)場蹲守+電表拉閘斷電方式,確認該家庭作坊為偷電用戶,以特征反向確認場景,從而制止相關(guān)偷電行為。閾值為30%時,異常用電特征明顯,但輸出數(shù)量有限,為進一步優(yōu)化模型,將凹陷閾值由30%調(diào)整為10%,凹陷敏感度有所降低,總共輸出10 個站點。經(jīng)過現(xiàn)場排查驗證,7個站點存在偷電行為,偷電用于家庭作坊、出租屋等,與預(yù)測基本一致;2個站點春節(jié)期間故障導(dǎo)致用電下降,1 個站點空調(diào)功率大經(jīng)多次排查無問題,判定為正常波動。
用1~5 月份的每日電表能耗數(shù)據(jù)與設(shè)備最大理論功耗數(shù)據(jù)進行比對,共38 個站點出現(xiàn)某天電表用電量超過機房設(shè)備額定功率的現(xiàn)像。將檢測顆粒度由以前的“月”,精細化到“天”,相當(dāng)于加了“放大鏡”作用。38 個站點經(jīng)現(xiàn)場排查,9 個存在用戶搭線行為,29 個經(jīng)現(xiàn)場確認存在綜資后臺設(shè)備錄入型號、數(shù)量、功率等與現(xiàn)場不一致的情況,修正綜資數(shù)據(jù)后已正常。
如圖3 所示,以潮南1 基站為例,基站最大理論功耗為每天72 度,但有部分時間電表的用電量接近90 度,經(jīng)現(xiàn)場驗證,用戶在基站線路中間搭線,偷電用于家庭的日常使用,導(dǎo)致基站電表用電出現(xiàn)異常。
圖3 額定功率超標模型部分典型異常站點
每個電表從1~3 月份共90 個采樣點中,隨機抽取10個采樣點,取200 組,由于離散的關(guān)系,每組平均能耗值理論上應(yīng)較為集中,呈現(xiàn)正太分布,取與期望值偏離誤差較大(大于5%)作為異常站點。如圖4 所示,模型共輸出18 個異常站點,經(jīng)現(xiàn)場排查,核實搭線偷電站點6 個,12 個站點經(jīng)鉗制電流、摸查線路等手段驗證無偷電現(xiàn)象。
圖4 電表數(shù)據(jù)高偏離度模型部分輸出清單
取1~5 月份每日電表能耗數(shù)據(jù),無線機房采集1~5月份設(shè)備的能耗數(shù)據(jù),匯聚機房采集1~5 月份動環(huán)數(shù)據(jù),無線機房N1=每日電表能耗數(shù)據(jù)/設(shè)備能耗數(shù)據(jù),N1>3時輸出為異常清單;匯聚機房N2=每日電表能耗數(shù)據(jù)/動環(huán)數(shù)據(jù),N2>1.1 時輸出為異常清單。共輸出24 個疑似異常站點。
經(jīng)現(xiàn)場驗證,核實搭線偷電站點12 個,3 個為源數(shù)據(jù)問題,9 個站點經(jīng)鉗制電流、摸查線路等手段驗證無偷電現(xiàn)象。
本文針對通信機房用電異常問題,將用戶行為場景化并提煉相關(guān)用電行為特征,構(gòu)建了多模型的通信機房偷電偵查方法,通過4 種模型的層層卡控,實現(xiàn)精準、高效、場景化打擊基站偷電行為,有助于營造不敢偷不想偷的良好運營環(huán)境,保護國有資產(chǎn)的合法權(quán)益。