慕 曉,高建宏
(1.華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 102206;2.煙臺(tái)供電公司,山東 煙臺(tái) 264001 )
我國各地電力客戶拖欠電費(fèi)、違章用電、竊電現(xiàn)象時(shí)有發(fā)生。加強(qiáng)用電客戶信用管理,才能確保應(yīng)收賬款的回收和資產(chǎn)保全,有效控制不良應(yīng)收賬款,降低企業(yè)壞賬比例,縮短業(yè)務(wù)流程,跟蹤分析單個(gè)客戶或行業(yè)客戶的付款歷史和習(xí)慣,為未來的交易提供風(fēng)險(xiǎn)防范,有效降低電力公司的經(jīng)營風(fēng)險(xiǎn),保護(hù)供電企業(yè)的合法利益。
首先研究人工免疫系統(tǒng)聚類分析原理,提出實(shí)數(shù)編碼的人工免疫系統(tǒng)聚類分析過程。然后確定用電客戶信用分析指標(biāo),最后根據(jù)電力公司客戶數(shù)據(jù),采用人工免疫系統(tǒng)聚類分析方法對(duì)用電客戶進(jìn)行聚類,探討人工免疫系統(tǒng)應(yīng)用于電力客戶信用分析的可行性。
人工免疫系統(tǒng)是一種全局隨機(jī)概率搜索方法,具有多樣性、耐受性、免疫記憶、分布式并行處理、自組織、自學(xué)習(xí)、自適應(yīng)和魯棒性等特點(diǎn)[1]。通過用抗體代表問題的可行解,抗原代表問題的約束條件和目標(biāo)函數(shù),采用能體現(xiàn)抗體促進(jìn)和抑制的期望繁殖率來選擇父?jìng)€(gè)體,從而達(dá)到快速收斂到全局最優(yōu)解的目的。人工免疫系統(tǒng)一般由以下幾個(gè)部分構(gòu)成:編碼、產(chǎn)生初始抗體群體、計(jì)算親和力和期望繁殖率、遺傳進(jìn)化操作和終止條件。
實(shí)數(shù)編碼的人工免疫系統(tǒng)聚類分析計(jì)算步驟描述如下:
第1步,輸入n個(gè)抗原。在算法中假定把n個(gè)數(shù)據(jù)對(duì)象 Xj(j=1,2,…,n)作為 n 個(gè)被捕獲的抗原輸入。
第2步,形成父代群體??贵w的產(chǎn)生可以根據(jù)問題的具體特點(diǎn)和性質(zhì),用經(jīng)驗(yàn)的辦法確定類別數(shù),從數(shù)據(jù)中找出從直觀上看來是比較合適的代表點(diǎn)作為初始抗體;也可以將全部數(shù)據(jù)隨機(jī)地分成c類,計(jì)算每個(gè)類的質(zhì)心,將這些質(zhì)心作為初始抗體;最簡(jiǎn)單的辦法是隨機(jī)地抽取c個(gè)數(shù)據(jù)作為初始抗體。
第3步,對(duì)初始抗體進(jìn)行評(píng)價(jià),評(píng)價(jià)標(biāo)準(zhǔn)采用期望繁殖率ev。其計(jì)算方法如下[1]:
1)計(jì)算抗體v的濃度。
其中 ayvw≥Tac時(shí),acvw=1;否則,acvw=0,Tac是已確定的濃度閾值??贵wv和抗體w間的相似度為
實(shí)數(shù)編碼的人工免疫系統(tǒng)在計(jì)算兩個(gè)抗體相似度時(shí)采用歐式空間二次泛數(shù)Hv,w;
式中,m為數(shù)據(jù)對(duì)象中決策變量的個(gè)數(shù),wiv和wiw代表抗體v和w中第i個(gè)決策變量值。axv為抗原與抗體的親和力,用于表明抗體對(duì)抗原的識(shí)別程度??贵wv和抗原w的親和力為
其中,J(u,c)表示抗原和抗體之間的結(jié)合度[1-2],一般情況下采用目標(biāo)函數(shù)值來表示[3]。
這里 uij是向量 Xj屬于組 ci(i=1,2,3…,c)的程度,它的值介于0和1之間。每一次分組時(shí),n個(gè)對(duì)象按親和力的大小,分屬與不同 ci(i=1,2,3…,c),其中:
對(duì)每個(gè) k≠i,如果 Xj-ci2≤Xj-ck2,uij=1,否則,uij=0。
2)計(jì)算抗體v的期望繁殖率。
抗體的期望繁殖率同時(shí)體現(xiàn)出了免疫系統(tǒng)對(duì)高親合度抗體的促進(jìn)和對(duì)高濃度抗體的抑制,這樣可以維持抗體的多樣性,避免過早陷入局部最優(yōu)[1]。
第4步,形成父代群體。將初始群體按ev的降序排列,并取前c個(gè)個(gè)體構(gòu)成父代群體;再按照axv降序排序同時(shí)取前n個(gè)個(gè)體存入記憶庫中。
第6步,新群體的產(chǎn)生?;诘?步的計(jì)算結(jié)果對(duì)抗體群體按照其評(píng)價(jià)結(jié)果進(jìn)行交叉和變異處理,得到新群體。再從記憶庫中取出記憶的個(gè)體,共同構(gòu)成新一代群體。之后,轉(zhuǎn)去執(zhí)行第3步。
國際上對(duì)企業(yè)信用傳統(tǒng)的評(píng)估要素主要有品格、能力、資本、擔(dān)保、經(jīng)營狀況5個(gè)要素[4],基于我國用電客戶的基本情況,并依據(jù)相關(guān)文獻(xiàn)資料[4-8],認(rèn)為對(duì)用電客戶的信用分析主要應(yīng)立足于客戶的綜合素質(zhì)上,具體應(yīng)包括:1)上門遞交停電通知單。2)上門遞交催收通知單。3)商業(yè)信用。用電客戶的商業(yè)信用是客戶履行各種經(jīng)濟(jì)承諾的能力及可信度。由企業(yè)形象、法人代表的品德、經(jīng)營業(yè)務(wù)市場(chǎng)前景、資產(chǎn)負(fù)債率、盈利額、付電費(fèi)比率、凈資產(chǎn)收益率、總資產(chǎn)凈利率等指標(biāo)構(gòu)成。4)安全信用。5)法律追討。6)違規(guī)用電或竊電。
以某電力公司分析用電客戶信用為例進(jìn)行用電客戶信用分析,有關(guān)數(shù)據(jù)見表1。
在分析時(shí),把 A、B、C、D、E、F 企業(yè)的數(shù)據(jù)作為被捕獲的抗原輸入,將全部數(shù)據(jù)隨機(jī)地分成3類。
設(shè)定濃度閾值Tac為0.8,聚類種類c為3,即以c1類表示用電客戶信用高、c2類表示用電客戶信用中等、c3類表示用電客戶信用低。得到如下結(jié)果:
表1 用電客戶信用指標(biāo)值
人工免疫系統(tǒng)聚類分析并行完成計(jì)算,算法實(shí)現(xiàn)相對(duì)簡(jiǎn)單,只要確定了濃度閾值和聚類個(gè)數(shù)就可得到結(jié)果,該方法能夠適用于大數(shù)據(jù)量,使對(duì)專業(yè)知識(shí)的要求降到最低,對(duì)于數(shù)據(jù)不同的順序不敏感。在獲得最優(yōu)解方面具有優(yōu)越性,人工免疫系統(tǒng)用于電力客戶信用分析是非??尚械模珴舛乳撝档拇笮⒂绊懢垲惖慕Y(jié)果。