鄒云峰,鄧君華,徐 超,季 聰
(1.國網(wǎng)江蘇省電力有限公司電力科學(xué)研究院,江蘇 南京 210000;2.江蘇方天電力技術(shù)有限公司,江蘇 南京 211102)
電費(fèi)能否及時(shí)回收,直接影響到電網(wǎng)公司經(jīng)營與發(fā)展。高壓企業(yè)客戶用電量大,電費(fèi)占比多,逾期或欠費(fèi)對總體電費(fèi)回收情況影響巨大。近年來,受國家供給側(cè)結(jié)構(gòu)性改革不斷推進(jìn)、國際貿(mào)易保護(hù)主義抬頭等多種因素影響,企業(yè)生產(chǎn)經(jīng)營不確定性增加,尤其是高耗能及環(huán)保不達(dá)標(biāo)企業(yè)經(jīng)營壓力大幅提升,關(guān)停風(fēng)險(xiǎn)加大,電費(fèi)回收風(fēng)險(xiǎn)不斷攀升。因此,如何準(zhǔn)確預(yù)測高壓企業(yè)客戶電費(fèi)回收風(fēng)險(xiǎn),提前采取針對性防控措施,是破解“電費(fèi)回收難題”的關(guān)鍵。
現(xiàn)有研究多是基于用電、交費(fèi)等電力內(nèi)部數(shù)據(jù),對客戶電費(fèi)回收風(fēng)險(xiǎn)進(jìn)行評價(jià)[1-12],無法全面分析企業(yè)客戶的經(jīng)營情況,難以評估其實(shí)際履約能力,預(yù)測電費(fèi)回收風(fēng)險(xiǎn),給電費(fèi)回收工作帶來很大困難。
針對上述問題,基于高壓企業(yè)客戶,融合工商、銀行、司法、稅務(wù)等社會(huì)數(shù)據(jù),建立電費(fèi)回收風(fēng)險(xiǎn)篩查模型,從企業(yè)電力信用、經(jīng)營、輿情等7 個(gè)方面,對各類潛在風(fēng)險(xiǎn)因素進(jìn)行全面的辨別,實(shí)現(xiàn)企業(yè)客戶電費(fèi)回收風(fēng)險(xiǎn)提前預(yù)警。
傳統(tǒng)電費(fèi)風(fēng)險(xiǎn)預(yù)測局限于從單一企業(yè)用電數(shù)據(jù)角度分析企業(yè)電費(fèi)回收風(fēng)險(xiǎn),而企業(yè)電費(fèi)回收是企業(yè)經(jīng)營狀態(tài)的外在表現(xiàn),企業(yè)經(jīng)營環(huán)境變化、外部政策、股權(quán)組成調(diào)整等都可能直接或間接地影響企業(yè)電費(fèi)回收風(fēng)險(xiǎn)的形成。因此,考慮融合了政府、金融機(jī)構(gòu)、數(shù)據(jù)公司、媒體平臺等渠道獲取的工商、司法、銀行、稅務(wù)等12 類社會(huì)數(shù)據(jù),涉及422 個(gè)字段、15 億條記錄,累計(jì)數(shù)據(jù)量達(dá)120 GB,部分?jǐn)?shù)據(jù)內(nèi)容如表1所示。
表1 社會(huì)數(shù)據(jù)信息
進(jìn)行風(fēng)險(xiǎn)篩查建模時(shí),首先開展業(yè)務(wù)分析,從海量數(shù)據(jù)字段中,篩選影響電費(fèi)回收的關(guān)鍵因子;隨后利用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)預(yù)處理與特征提取,利用隨機(jī)森林算法、熵值法等算法構(gòu)建電費(fèi)回收風(fēng)險(xiǎn)篩查模型;最后,通過貝葉斯深度學(xué)習(xí)等方法實(shí)現(xiàn)模型自優(yōu)化。
首先對全量數(shù)據(jù)進(jìn)行業(yè)務(wù)分析,將電力數(shù)據(jù)和社會(huì)數(shù)據(jù)歸納為電力數(shù)據(jù)、企業(yè)經(jīng)營數(shù)據(jù)、企業(yè)關(guān)聯(lián)關(guān)系和政策事件信息4 類。通過支持向量機(jī)、Xgboost 等方法,進(jìn)行關(guān)鍵因子提取,并分為電力信用、用電異常、經(jīng)營異常等7 個(gè)分析維度。關(guān)鍵因子選取如圖1 所示。
圖1 關(guān)鍵因子選取示意
采用模式演化、關(guān)聯(lián)聚類等技術(shù),從電力信用、用電異常、經(jīng)營異常、失信處罰、政策事件、關(guān)聯(lián)風(fēng)險(xiǎn)和輿情風(fēng)險(xiǎn)7 個(gè)維度進(jìn)行企業(yè)風(fēng)險(xiǎn)評分,7 個(gè)維度的總分為100 分,各維度評分采用加權(quán)的方式,加和后得到企業(yè)風(fēng)險(xiǎn)評分,各維度評分權(quán)重如表2 所示。
表2 風(fēng)險(xiǎn)評分各維度權(quán)重
根據(jù)評分結(jié)果,劃分風(fēng)險(xiǎn)等級。具體風(fēng)險(xiǎn)等級劃分標(biāo)準(zhǔn)如表3 所示。
表3 篩查模型中風(fēng)險(xiǎn)等級劃分標(biāo)準(zhǔn)
圖2 電力信用分計(jì)算
2.2.1 電力信用
電力信用維度,在傳統(tǒng)用電行為、交費(fèi)行為的基礎(chǔ)上,增加用電價(jià)值、電網(wǎng)互動(dòng)價(jià)值、服務(wù)互動(dòng)行為和電力市場交易誠信分析維度,借鑒芝麻信用計(jì)算方法,全面客觀對客戶電力信用進(jìn)行評分[13],計(jì)算步驟如圖2 所示。
根據(jù)信用評分結(jié)果和權(quán)重,得到該用戶電力信用維度風(fēng)險(xiǎn)分值。
2.2.2 用電異常
用電異常維度,通過深度挖掘電力數(shù)據(jù),感知企業(yè)用電異常,預(yù)測電費(fèi)回收風(fēng)險(xiǎn)。采用卷積神經(jīng)網(wǎng)絡(luò)和軌跡演化技術(shù),利用行業(yè)歷史用電數(shù)據(jù),對鋼鐵、光伏、水泥等20 個(gè)典型行業(yè),從正常、異常兩個(gè)方面構(gòu)建160 類行業(yè)典型用電模式,企業(yè)用電模式與行業(yè)正常、異常用電模式的對比分別如圖3、圖4 所示。通過計(jì)算企業(yè)用電模式特征與行業(yè)典型用電模式偏離度,量化企業(yè)用電異常風(fēng)險(xiǎn)分值。
圖3 企業(yè)用電與行業(yè)正常模式對比
圖4 企業(yè)用電與行業(yè)異常模式對比
2.2.3 經(jīng)營異常
經(jīng)營異常維度是指通過綜合分析企業(yè)人員變動(dòng)、工資發(fā)放等數(shù)據(jù),判斷企業(yè)自身經(jīng)營是否正常。經(jīng)營異常維度風(fēng)險(xiǎn)評估如圖5 所示,利用聚類分析法,分析量化司法凍結(jié)、工商異常、不動(dòng)產(chǎn)抵押、生產(chǎn)情況等因素對企業(yè)的影響程度(見表4),通過企業(yè)半年內(nèi)發(fā)生經(jīng)營異常事件次數(shù),結(jié)合影響程度,量化經(jīng)營異常維度風(fēng)險(xiǎn)分值。
2.2.4 失信處罰
失信處罰維度風(fēng)險(xiǎn)評估是指利用結(jié)構(gòu)熵權(quán)法,量化銀行、稅務(wù)、環(huán)保等失信、處罰信息對企業(yè)風(fēng)險(xiǎn)的影響程度,失信處罰事件影響程度如表5 所示,失信處罰維度風(fēng)險(xiǎn)評估如圖6 所示。通過企業(yè)半年內(nèi)發(fā)生失信處罰事件次數(shù),結(jié)合影響程度,量化失信處罰維度風(fēng)險(xiǎn)分值。
表4 經(jīng)營事件影響程度
圖5 經(jīng)營異常維度風(fēng)險(xiǎn)評估流程
表5 失信處罰事件影響程度
圖6 失信處罰維度風(fēng)險(xiǎn)評估流程
2.2.5 政策事件
政策事件維度,基于歷史數(shù)據(jù)構(gòu)建各類產(chǎn)業(yè)政策、國際貿(mào)易事件對行業(yè)的影響模型。政策事件維度風(fēng)險(xiǎn)評估如圖7 所示,分析了光伏行業(yè)受反傾銷、補(bǔ)貼、產(chǎn)業(yè)政策、經(jīng)貿(mào)摩擦等政策事件的影響程度和起效時(shí)間,其中,光伏行業(yè)受政策事件影響情況如表6所示。通過篩查企業(yè)所處行業(yè)近期的政策事件情況,根據(jù)影響程度和起效時(shí)間,預(yù)測量化企業(yè)政策事件風(fēng)險(xiǎn)分值。
圖7 政策事件維度風(fēng)險(xiǎn)評估流程
表6 光伏行業(yè)受政策事件影響情況
2.2.6 關(guān)聯(lián)風(fēng)險(xiǎn)
關(guān)聯(lián)風(fēng)險(xiǎn)維度,用于分析企業(yè)間關(guān)系傳導(dǎo)風(fēng)險(xiǎn)。關(guān)聯(lián)風(fēng)險(xiǎn)維度風(fēng)險(xiǎn)評估流程如圖8 所示,基于知識圖譜技術(shù),對企業(yè)間的股東關(guān)系、業(yè)務(wù)關(guān)系和投資關(guān)系進(jìn)行關(guān)聯(lián)分析,構(gòu)建了企業(yè)關(guān)聯(lián)風(fēng)險(xiǎn)模型。根據(jù)企業(yè)上游股東和下游投資企業(yè)的風(fēng)險(xiǎn)情況,計(jì)算關(guān)聯(lián)風(fēng)險(xiǎn)維度風(fēng)險(xiǎn)分值。企業(yè)關(guān)聯(lián)風(fēng)險(xiǎn)傳導(dǎo)如圖9 所示。
圖8 關(guān)聯(lián)風(fēng)險(xiǎn)維度風(fēng)險(xiǎn)評估流程
圖9 企業(yè)關(guān)聯(lián)風(fēng)險(xiǎn)傳導(dǎo)示意
2.2.7 輿情風(fēng)險(xiǎn)
輿情風(fēng)險(xiǎn)維度,通過網(wǎng)站、微博等公眾平臺獲取企業(yè)輿情信息。輿情風(fēng)險(xiǎn)維度風(fēng)險(xiǎn)評估流程如圖10所示,利用自然語言處理技術(shù),進(jìn)行文本分詞和關(guān)鍵詞提取,實(shí)現(xiàn)負(fù)面輿情統(tǒng)計(jì)分析和輿情風(fēng)險(xiǎn)評估。輿情風(fēng)險(xiǎn)詞云如圖11 所示。
圖10 輿情風(fēng)險(xiǎn)維度風(fēng)險(xiǎn)思路
圖11 輿情風(fēng)險(xiǎn)詞云
7 個(gè)分析維度從不同角度、全面揭示了企業(yè)客戶電費(fèi)風(fēng)險(xiǎn),充分發(fā)揮了融合社會(huì)數(shù)據(jù)的威力。最后,對各維度風(fēng)險(xiǎn)得分進(jìn)行綜合計(jì)算,得到企業(yè)風(fēng)險(xiǎn)評分。
模型優(yōu)化部分,利用卷積神經(jīng)網(wǎng)絡(luò)和貝葉斯深度學(xué)習(xí)等方法,實(shí)現(xiàn)各維度參數(shù)權(quán)重自適應(yīng)優(yōu)化調(diào)整,如圖12 所示。
圖12 模型自適應(yīng)學(xué)習(xí)示意
以某省級電網(wǎng)3 個(gè)地市共45 427 戶的高壓企業(yè)客戶為例,對構(gòu)建的風(fēng)險(xiǎn)篩查模型進(jìn)行驗(yàn)證。
為了更清晰地驗(yàn)證模型篩查效果,定義了逾期用戶遺漏率和命中率作為主要考核指標(biāo)。遺漏率用以表征模型篩查的識別能力,考核指標(biāo)遺漏率計(jì)算公式為
式中:R1為遺漏率,即利用本文風(fēng)險(xiǎn)篩查模型預(yù)測為中低風(fēng)險(xiǎn)但實(shí)際發(fā)生逾期的客戶在所有發(fā)生逾期客戶中的占比;T2為建立的模型預(yù)測結(jié)果為中、低風(fēng)險(xiǎn)且實(shí)際發(fā)生了逾期的客戶數(shù)量;F2為模型預(yù)測結(jié)果為高風(fēng)險(xiǎn)且實(shí)際發(fā)生了逾期的客戶數(shù)量。
命中率用以表征模型篩查的識別效率,考核指標(biāo)命中率為
式中:R2為命中率,即利用本文風(fēng)險(xiǎn)篩查模型預(yù)測為高風(fēng)險(xiǎn)且實(shí)際也發(fā)生逾期的用戶在所有預(yù)測為高風(fēng)險(xiǎn)客戶中的占比;F1為建立的模型預(yù)測結(jié)果是高風(fēng)險(xiǎn)并且實(shí)際未發(fā)生逾期的客戶數(shù)量。
遺漏率越低,電費(fèi)回收風(fēng)險(xiǎn)越低,命中率越高,預(yù)測更精準(zhǔn),電費(fèi)回收工作開展的效率越高。
利用近5年歷史數(shù)據(jù)對以上建立的模型進(jìn)行了驗(yàn)證,遺漏率為7.2%,命中率35.7%。為檢測建立的風(fēng)險(xiǎn)篩查模型在線預(yù)測效果,利用表7 樣本數(shù)據(jù),對2018年11月、12月兩個(gè)月的客戶電費(fèi)回收風(fēng)險(xiǎn)分別開展預(yù)測,電費(fèi)回收周期結(jié)束后,驗(yàn)證模型預(yù)測結(jié)果。選取隨機(jī)森林算法[14]、LSTM[15]進(jìn)行模型優(yōu)劣對比,3 種模型得到的預(yù)測結(jié)果如表8 所示。
表7 樣本數(shù)據(jù)
表8 模型預(yù)測結(jié)果
遺漏率方面。算例中45 427 戶高壓企業(yè)客戶,2018年11月份、12月份分別發(fā)生逾期3 335 戶、1 833 戶,本文模型分別遺漏了301 戶、182 戶,遺漏率最低。隨機(jī)森林和LSTM 模型預(yù)測結(jié)果相近,2018年11月份、12月份,隨機(jī)森林和LSTM 模型遺漏率分別在50%、30%左右,遠(yuǎn)高于本文模型遺漏率。
命中率方面。2018年11月份、12月份,本文模型命中率分別為30.94 和21.65,隨機(jī)森林模型命中率分別 為28.26 和19.47,LSTM模型命中率為29.07和20.36,本文模型命中率略優(yōu)于隨機(jī)森林和LSTM 模型。
驗(yàn)證過程中,還發(fā)現(xiàn)了一些典型案例。例如,用電異常方面。2016年9月某商業(yè)綜合體用電走勢與行業(yè)典型模式偏離如圖13 所示,11月發(fā)生電費(fèi)逾期。
圖13 用電異常典型案例
建立的融合社會(huì)數(shù)據(jù)的電費(fèi)回收風(fēng)險(xiǎn)篩查模型預(yù)測結(jié)果,遺漏率遠(yuǎn)低于傳統(tǒng)風(fēng)險(xiǎn)預(yù)測模型,命中率方面也表現(xiàn)優(yōu)異,證明了模型的有效性。
融合工商、司法、稅務(wù)等企業(yè)社會(huì)數(shù)據(jù),利用卷積神經(jīng)網(wǎng)絡(luò)、決策樹等大數(shù)據(jù)技術(shù),從電力信用、用電異常、經(jīng)營異常等7 個(gè)維度構(gòu)建了企業(yè)電費(fèi)回收風(fēng)險(xiǎn)篩查模型,解決了傳統(tǒng)電費(fèi)回收風(fēng)險(xiǎn)評估中對企業(yè)信息掌握不全面、履約能力預(yù)判不足的問題,實(shí)現(xiàn)高壓企業(yè)客戶電費(fèi)回收風(fēng)險(xiǎn)科學(xué)評分、評級和模型參數(shù)自適應(yīng)調(diào)整,通過算例驗(yàn)證了風(fēng)險(xiǎn)篩查模型的科學(xué)有效性,對指導(dǎo)供電公司開展電費(fèi)回收風(fēng)險(xiǎn)防控,提高電費(fèi)回收工作針對性具有重要意義。下一階段,將持續(xù)擴(kuò)展社會(huì)數(shù)據(jù)維度,優(yōu)化電費(fèi)回收風(fēng)險(xiǎn)篩查模型,不斷提升預(yù)測的科學(xué)性和準(zhǔn)確性。