(1.國網(wǎng)四川省電力公司電力科學(xué)研究院,四川 成都 610041;2.國網(wǎng)四川省電力公司,四川 成都 610041)
隨著互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)的不斷推廣和應(yīng)用,發(fā)展智能經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì)已成為大勢所趨。在電力物聯(lián)網(wǎng)建設(shè)進(jìn)程不斷深入過程中,數(shù)字化轉(zhuǎn)型已經(jīng)上升為電網(wǎng)企業(yè)的重要戰(zhàn)略,激活數(shù)據(jù)價值、挖掘數(shù)據(jù)應(yīng)用場景、開發(fā)數(shù)據(jù)產(chǎn)品、服務(wù)社會發(fā)展成為熱點[1-2]。
人員流動情況摸查是電力數(shù)據(jù)應(yīng)用于提質(zhì)增效的重要場景。尤其是自新冠肺炎疫情發(fā)生以來,由于疫情時值春節(jié),走親訪友的情況較多,加之城市社區(qū)人口密集,給工作人員本來就有限的社區(qū)排查、管控工作帶來極大的困難,導(dǎo)致人員摸排周期長、摸排不準(zhǔn)確?;诤A坑秒姅?shù)據(jù)把握用戶的用電規(guī)律和用電特性從而辨別居民人口流動情況,可以及時有效地解決上述問題。
然而,在用戶行為分析方面,當(dāng)前研究主要集中在基于電力數(shù)據(jù)的用戶用電行為解析[3-5],基于用電信息的人員流動情況評估方法較少。文獻(xiàn)[6]提出了一種基于細(xì)粒度用能數(shù)據(jù)的居民家庭活動人口評估方法,評估結(jié)果具有較高的可行度。但上述方法數(shù)據(jù)要求較高,需要獲取采樣間隔為15 min的居民分項電器用電數(shù)據(jù)、空調(diào)和電熱負(fù)荷詳細(xì)數(shù)據(jù)。對于大部分小區(qū)尤其是老舊小區(qū)而言,分時、分項數(shù)據(jù)獲取基本無法實現(xiàn),嚴(yán)重限制了方法的應(yīng)用場景,也難以滿足實際需求。
鑒于此,提出了一種基于居民日電量數(shù)據(jù)的人口流動情況評估方法。首先,通過歷史用電數(shù)據(jù)聚類挖掘居民的穩(wěn)定用電水平;然后,基于日電量變化情況和穩(wěn)定用電水平提出了人口流動判據(jù);最后,基于上述判據(jù)對小區(qū)居民流動情況進(jìn)行分析和研判,為社區(qū)疫情排查工作提供依據(jù),并以成都市某小區(qū)居民實際數(shù)據(jù)為例驗證了所提方法的有效性。
在線采集上傳的日電量,真實反映客戶當(dāng)日生產(chǎn)生活用電情況,具有實時性強的特點;但受到信號干擾、軟硬件故障、通信異常等情況的影響,數(shù)據(jù)可能會出現(xiàn)缺失、異常等情況。數(shù)據(jù)質(zhì)量直接關(guān)系到分析的結(jié)果,因此,需要對采集的數(shù)據(jù)進(jìn)行校核和清洗等預(yù)處理。
日電量是一個累積值,因此,對于缺失數(shù)據(jù)的處理有兩種方法。
1)用缺失日后1日的日電量作為平均值。計算方法為:
(1)
式中:N為數(shù)據(jù)缺失日期;Wnew(N)為更新數(shù)值;W(N+1)為數(shù)據(jù)缺失日的后一日的日電量采集數(shù)值;ε為隨機噪聲信號。該方法適用于對歷史數(shù)據(jù)的處理。
2)用前一段時間日電量均值代替。計算方法為
(2)
該方法適用于最新日電量的處理。
對于異常數(shù)據(jù)的校正,主要用于超出合理范圍的數(shù)據(jù)。一般而言,居民日用電量在0至允許容量之間,若日電量小于0,則用0替代;若日電量大于允許容量,則該日電量用最大容量或歷史均值替代,計算方法與式(2)相同。
聚類是樣本分類的常用算法[7],聚類分析的主要目的是通過分析數(shù)據(jù)的分布特征實現(xiàn)將數(shù)據(jù)對象劃分為若干數(shù)據(jù)子集,保證每個子集中數(shù)據(jù)的相似性。其中,k-means聚類方法因其簡單高效而廣泛應(yīng)用于電力系統(tǒng)負(fù)荷分類中[8-9]。
考慮到居民用電情況可分為當(dāng)日不在家、當(dāng)日部分時間在家和當(dāng)日全天在家3種場景,可以通過聚類算法將居民歷史日電量分為3類,分別代表3種場景的用電量樣本。這里主要采用k-means算法對不同居民用電場景的電量進(jìn)行聚類。
假設(shè)在同一季節(jié),居民的用電量與在家時長呈現(xiàn)正相關(guān),求取各類數(shù)據(jù)均值,均值數(shù)據(jù)由大到小分別對應(yīng)全天在家Wpart、部分時間在家Wfull和不在家Wno3類情況的穩(wěn)定用電量值。分別統(tǒng)計各類中的樣本數(shù)量,獲取各類場景的出現(xiàn)概率,從而了解居民的生活習(xí)慣。
由于歷史數(shù)據(jù)不足,部分用戶用電場景不一定齊全,因此,需要對模型進(jìn)行校正。校正判據(jù)為
(3)
式中:dmin為類間距離,是3類樣本均值之間的距離;Wmax為歷史日電量最大值,表示所選樣本中最大值,樣本一般為同一季節(jié)的日電量數(shù)據(jù)集合。
若上述判據(jù)滿足,則將距離最近的兩類合為一類。
由于日電量信息顆粒度較大,無法反映實時人口活動情況,因此,日電量信息難以反應(yīng)具體的人數(shù)信息。對于居民流動情況,這里重點關(guān)注人口流出后住房空置、由空置到入住的人口流入兩種情況。
考慮到居民離開家當(dāng)天用電量可能介于全天在家場景和全天不在家場景,因此,居民用電變化量考慮次日電量變化和隔日電量變化兩個層次進(jìn)行指標(biāo)設(shè)計,其計算方法為:
(4)
(5)
式中:W(t)為當(dāng)日日電量;W(t-1)為前一日日電量;W(t-2)為隔日日電量;Wmax為歷史日電量最大值。
若某居民用戶的日電量突變率滿足式(6)中的兩個判據(jù)之一,則該戶居民為用能突變用戶。
(6)
對于用能突變用戶而言,若突變率大于0,則居民為用能激增用戶;若突變率小于0,則該居民為用能驟減用戶。
考慮到居民流入、流出前后用電狀態(tài)的變化,對于用電量可劃分為3類的情況,定義底值系數(shù)為
(7)
式中,k2和k1分別為兩個系數(shù),其關(guān)系滿足k2+k1=1,且k1>2k2,這里取k1=5/6,k2=1/6。
對于模型校正后只有兩類的樣本,底值系數(shù)為
(8)
底值系數(shù)主要用于區(qū)分用戶的居家狀態(tài),若該日日電量與歷史日電量最大值的比值小于或等于底值系數(shù),則判定用戶不在家的概率較大。
1)疑似人口流入的判據(jù)
判據(jù)1:該用戶為用能驟增用戶。
判據(jù)2:電量激增前的日電量小于WmaxKcut。
同時滿足判據(jù)1和判據(jù)2,則認(rèn)為該戶為人口流入客戶,標(biāo)志位記為1。
2)人口流出的判定判據(jù)
判據(jù)3:該用戶為用能驟減用戶。
判據(jù)4:電量驟減后的日電量小于WmaxKcut。
同時滿足判據(jù)3和判據(jù)4,則認(rèn)為該戶為人口流出客戶,標(biāo)志位記為-1。
值得注意的是,若隔日突變率和次日突變率均大于1/3時,可能存在連續(xù)兩天判定外出的情況。因此,需要對上述情況進(jìn)行校核,選取中間一天作為流入或流出的時間,保證流入和流出的準(zhǔn)確性。
由于在流出到流入之間的時段,房間處于空置狀態(tài),用電量變化一般很小,利用該特征可以進(jìn)一步校核判定結(jié)果的有效性。即:人口流出后到下一次人口流入前,(日電量變化量/歷史日電量最大值)小于0.01,則認(rèn)為該戶短時空置,人流測算有效。
根據(jù)流入流出判據(jù)標(biāo)記位按日累加,可以獲得該戶居民居家狀況曲線。若居民居家狀況的最小值為-1,則該曲線整體加1。居家狀況為1,代表該戶當(dāng)日非空置,否則代表該戶當(dāng)日空置。
小區(qū)總體居民人口流動狀況可以反映總體的人口流動狀態(tài),為社區(qū)防疫工作提供參考信息。具體包括:
1)小區(qū)持續(xù)空置戶數(shù)
持續(xù)空置客戶包含兩類:1)電表表底數(shù)據(jù)持續(xù)為空的未開戶用戶;2)表計已開戶但變化量持續(xù)為零的空置住房用戶。定義兩類用戶戶數(shù)的總和為持續(xù)空置戶數(shù)。
2)居民用電量突變戶數(shù)
定義除持續(xù)空置用戶外的居民中,居民次日電量突變率或隔日電量突變率絕對值大于1/3的居民戶數(shù),為當(dāng)日居民用能突變戶數(shù)。其中,次日突變率數(shù)值為正的居民戶數(shù)為用戶用電驟增戶數(shù),突變率數(shù)值為負(fù)的居民戶數(shù)為用戶用電驟減戶數(shù)。
3)穩(wěn)定用能戶數(shù)
當(dāng)日穩(wěn)定用能戶數(shù)定義為除持續(xù)空置用戶外的居民中,居民次日電量突變率或隔日電量突變率絕對值小于1/3的居民戶數(shù)。
4)短期空置戶數(shù)
小區(qū)內(nèi)短時空置的用戶數(shù)目。
5)非空置住宅數(shù)目
小區(qū)內(nèi)當(dāng)日有人居住的住宅數(shù)目。
以成都市某小區(qū)2020年1月14日至2月13日一個月的電量數(shù)據(jù)為例進(jìn)行分析。該小區(qū)總電表戶數(shù)為180戶,其中,表計未計數(shù)用戶數(shù)為48戶,統(tǒng)計期間未入住空置住宅戶數(shù)為36戶,空置率為46.67%。由于該小區(qū)為成都市內(nèi)的新小區(qū),入住率不高。
剩余96戶的用能曲線如圖1所示。由于該小區(qū)為別墅區(qū),部分負(fù)荷較高。從負(fù)荷曲線可以看出,當(dāng)人員離開時負(fù)荷特征明顯。
居民的典型判定曲線如圖2所示。其中,居家情況為0表示該戶不在家,為1表示該戶在家。如圖2(a)所示,該居民2020年2月3日返回家中,居民電量在當(dāng)日出現(xiàn)上升,但次日上升電量較小,不滿足用能突變判據(jù),但隔日突變率滿足要求,可判定該戶用能突變。可見,僅利用次日突變率判據(jù)可能出現(xiàn)漏判。根據(jù)居家情況判定結(jié)果可知,該算法能準(zhǔn)確反映人口流動情況。圖2(b)所示為居民1月24日離開,1月28日返回;圖2(c)所示為居民1月23日返回,2月1日離開,居家判定結(jié)果準(zhǔn)確。
圖1 居民用能曲線
圖2 居民居家情況典型判定
從小區(qū)整體來看,用能驟增和用能驟減的居民戶數(shù)隨時間的變化曲線如圖3所示,其中圖3(a)為次日用能驟變居民戶數(shù),圖3(b)為隔日用能驟變居民戶數(shù)。
(a)
(b)圖3 小區(qū)用能驟變戶數(shù)
小區(qū)疑似人口流動的戶數(shù)如圖4所示。由圖可見,1月22日(春節(jié)前)疑似流出人口居民戶數(shù)大于當(dāng)日用能驟變數(shù)目或隔日用能驟變數(shù)目,說明所采用的兩個指標(biāo)結(jié)合的方法性能更好。
圖4 小區(qū)疑似人口流動戶數(shù)
該小區(qū)非空置住宅戶數(shù)如圖5所示。由圖可見,1月15日至1月22日(春節(jié)前)流出戶數(shù)略大于流入戶數(shù),非空置住房數(shù)持續(xù)下降,整個小區(qū)人口流出明顯。1月23日(除夕)有所回升,但隨后繼續(xù)下降,至1月25日達(dá)到最低點。隨后,非空置住房數(shù)持續(xù)上升,到2月1日后基本保持穩(wěn)定。分析結(jié)果與實際情況基本相符。1月28日后非空置住房數(shù)回落疑似與國家將復(fù)工時間由1月30日調(diào)整至2月3日有關(guān)。
圖5 小區(qū)非空住宅數(shù)
由上述分析可知,雖然日電量數(shù)據(jù)顆粒度不高,但采用所提出的算法后仍能較好地監(jiān)測人口流動情況。
鑒于城市社區(qū)人口密集,采用人工排查人口情況的方式工作量大、工作周期長,且受節(jié)假日等因素的影響其數(shù)據(jù)準(zhǔn)確性不高等問題,提出了一種基于電力大數(shù)據(jù)的居民人口流動情況評估方法,通過構(gòu)建用能突變判據(jù)和人口流動判據(jù)實現(xiàn)了居民人口流入、流出情況的動態(tài)監(jiān)測。利用所提方法應(yīng)用于某小區(qū)的人口流動分析,得到結(jié)論如下:
1)根據(jù)居民數(shù)據(jù)分析結(jié)果與實際流入流出情況的對比可知,采用居民日電量數(shù)據(jù)可以較好地反映居民人口流動情況。
2)采用隔日突變率和次日突變率相結(jié)合的方法,可以更好地反映用戶的實際用能變化情況,有效提高算法的準(zhǔn)確性。
3)由算例分析結(jié)果可知,小區(qū)居民流動情況和非空置戶數(shù)情況受節(jié)假日(春節(jié))影響很大,假期前半段流出數(shù)量較多,后半段流入較多。分析結(jié)果與實際相符。
由于日電量維度較低,載有的信息量較少,因此,在用戶用能習(xí)慣變化極大的情況下,所提方法可能出現(xiàn)誤判或漏判。因此,未來將進(jìn)一步研究在有限信息下精確挖掘用戶習(xí)慣、提高算法準(zhǔn)確性的方法。