陳羽中 郭松榮 陳宏 李婉華 郭昆 黃啟成
摘 要:針對(duì)供電企業(yè)“先消費(fèi)后付款”的經(jīng)營(yíng)模式可能造成用電客戶因失信引發(fā)的欠費(fèi)風(fēng)險(xiǎn),需要在用電客戶欠費(fèi)行為發(fā)生之前實(shí)時(shí)快速地分析海量的用電用戶的數(shù)據(jù),給出潛在的欠費(fèi)客戶名單的問(wèn)題,提出一種基于并行分類算法的電力客戶欠費(fèi)預(yù)警方法。首先,該方法使用基于Spark的隨機(jī)森林(RF)分類算法對(duì)欠費(fèi)用戶進(jìn)行建模;其次,根據(jù)用戶以往歷史用電行為和繳費(fèi)記錄使用時(shí)間序列進(jìn)行預(yù)測(cè)得到其未來(lái)用電和繳費(fèi)行為特征;最后,使用之前得到的模型對(duì)用戶進(jìn)行分類得到未來(lái)潛在高危險(xiǎn)欠費(fèi)用戶。將該方法與并行化后的支持向量機(jī)(SVM)算法和在線序列極限學(xué)習(xí)機(jī)(OSELM)算法進(jìn)行對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,所提方法相對(duì)于對(duì)比算法在準(zhǔn)確率上有較大提高,便于電費(fèi)回收管理人員進(jìn)行提前催繳,確保電費(fèi)回收的及時(shí)性,有利于電力企業(yè)進(jìn)行客戶欠費(fèi)風(fēng)險(xiǎn)管理。
關(guān)鍵詞:欠費(fèi)預(yù)警;隨機(jī)森林;并行算法;時(shí)間序列;海量數(shù)據(jù)
中圖分類號(hào): TP311.5 文獻(xiàn)標(biāo)志碼:A英文標(biāo)題