張俊超,馬曉琴,嚴(yán)嘉正
(國網(wǎng)青海省電力公司信息通信公司,青海 西寧 810008)
為了適應(yīng)國內(nèi)外復(fù)雜的經(jīng)濟(jì)環(huán)境,加快發(fā)展方式的轉(zhuǎn)變,國網(wǎng)公司積極探索建立電子憑證管理平臺,統(tǒng)一原始憑證管理標(biāo)準(zhǔn)。以往依據(jù)人工統(tǒng)計(jì)方式,結(jié)合經(jīng)驗(yàn)預(yù)測電子憑證售電收入資金,該方式受人為因素影響較大,無法有效地為資金預(yù)測提供精準(zhǔn)數(shù)據(jù)。為此,有學(xué)者提出了基于視覺傳達(dá)的電子憑證圖像識別方法,通過閾值處理圖像,獲取憑證特征,以灰度變換為核心進(jìn)行局部識別,能夠最大限度保留局部圖像信息[1];還有學(xué)者提出了基于神經(jīng)網(wǎng)絡(luò)的電子憑證圖像識別方法,通過構(gòu)建神經(jīng)網(wǎng)絡(luò)圖像分類模型,對圖像進(jìn)行詳細(xì)分類,結(jié)合誤差反向傳播算法實(shí)現(xiàn)圖像識別[2]。然而,上述這些方法對售電收入資金預(yù)測研究內(nèi)容較少,難以支撐當(dāng)下企業(yè)戰(zhàn)略制定的需要,導(dǎo)致使用這兩種方法獲取的數(shù)據(jù)與實(shí)際數(shù)據(jù)對比相差較大。
為解決上述方法中存在的問題,提出了基于特征提取的電力電子憑證圖像識別系統(tǒng)。
基于特征提取的電力電子憑證圖像識別系統(tǒng),核心器件為FPGA 器件、采集板卡、多端口SDRAM控制器,硬件結(jié)構(gòu)如圖1 所示。
圖1 中將CMOS 圖像傳感器和液晶顯示器與開發(fā)面板相連。當(dāng)電源加載后,通過SDATA 串行總線,由SCLK 時(shí)鐘構(gòu)成傳感器I2C 組態(tài)傳輸?shù)綀D像傳感器中。該系統(tǒng)攝像控制模塊也將25 MHz 的主時(shí)鐘信號發(fā)送給圖像傳感器。然后圖像傳感器將獲取的數(shù)據(jù)轉(zhuǎn)換為RAW 的RGB 格式,并將其轉(zhuǎn)移到RAM中。利用多端口SDRAM控制器建立完整的幀緩存[3]。將從SDRAM 裝置所得到的數(shù)據(jù)傳送到影像處理與辨識模組,以便處理。最終,LCD 控制器及數(shù)據(jù)請求模塊向多端口SDRAM 控制模塊傳送數(shù)據(jù)請求[4]。
FPGA 是一種可編程邏輯器件,應(yīng)用范圍很廣。該產(chǎn)品具有可編程功能,可根據(jù)FPGA 器件進(jìn)行具體的數(shù)字電路設(shè)計(jì)。在FPGA 器件中,線路資源與FPGA 中的每一個單元連接,而線路長度和技術(shù)水平將直接影響到FPGA 器件中的信號傳輸能力和傳輸速度[5-6]。
FPGA 器件根據(jù)電力網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),自動選取與電子憑證相關(guān)的區(qū)域進(jìn)行布線,導(dǎo)致網(wǎng)絡(luò)資源被浪費(fèi)[7]。因此,在裝置中設(shè)置積分時(shí)鐘和積分重置/設(shè)定模式,其結(jié)構(gòu)如圖2 所示。
圖2 FPGA器件結(jié)構(gòu)
FPGA 器件采用串口收發(fā)技術(shù),滿足通信總線與接口要求。
采集板卡采用IEEE1394 數(shù)字接口,利用數(shù)字變換技術(shù),可獲得與原始圖像一樣的非破壞性數(shù)據(jù)。采集板卡通過攝像機(jī)將采集光信號輸入到計(jì)算機(jī)中,通過核心模塊將其轉(zhuǎn)換為數(shù)字信號的形式,并進(jìn)行采集、存儲、回放[8-10]。
SDRAM 是一種具有同步隨機(jī)存儲的芯片,能夠隨意讀取和寫入指定數(shù)據(jù),并更新存儲陣列,以保證數(shù)據(jù)的安全[11]。該芯片內(nèi)部是多Bank 結(jié)構(gòu),當(dāng)一個Bank 在充電過程時(shí),另一個Bank 能立刻讀取數(shù)據(jù)。在數(shù)據(jù)讀取過程中,有效地提高了芯片存取速度[12]。
圖像傳感器設(shè)計(jì)中使用CMOS 器件結(jié)合CCD 技術(shù),將器件芯片置于光刻表面,使每一像素塊成為一種微透鏡,再由入射光線共同構(gòu)成感光元件,從而增加有效填充因子[13]。COMS 圖像傳感器是利用光電轉(zhuǎn)換技術(shù)實(shí)現(xiàn)光像轉(zhuǎn)換的裝置,該方法可把光學(xué)圖像分解成若干個微小的單元,并轉(zhuǎn)換成有用的電子信號。
以電子憑證售電收入資金為主要指標(biāo),利用隨機(jī)森林算法對指標(biāo)進(jìn)行預(yù)測,并將其用于特征提取,為電子憑證圖像識別提供依據(jù)。月售電收入資金計(jì)算公式為:
式中,P總表示年度售電收入資金;T總表示年度天數(shù);T分表示當(dāng)年需調(diào)整天數(shù)。
在隨機(jī)森林預(yù)測中,引入式(1)的計(jì)算結(jié)果,可防止由于預(yù)測過程的錯誤而影響預(yù)測的準(zhǔn)確性[14]。通過對樣本進(jìn)行隨機(jī)取樣,共獲取N個樣本,重復(fù)以上步驟,得出M個獨(dú)立的決策樹,以獲得新的分類效果。基于隨機(jī)森林預(yù)測過程如下所示:
步驟一:從抽樣空間中隨機(jī)抽取K個特征,并依據(jù)所選擇的樣本特征構(gòu)造決策樹;
步驟二:獲取M個獨(dú)立決策樹,并形成隨機(jī)森林;
步驟三:對于待預(yù)測數(shù)據(jù),經(jīng)過M個獨(dú)立決策樹進(jìn)行決策后,以確定用戶歷史用電行為、交費(fèi)行為、資金到賬規(guī)律[15];
步驟四:給定分類集合R1(α)、R2(α)、R3(α)、…Rn(α),根據(jù)輸入的變量構(gòu)建預(yù)測模型:
式中,α表示用戶的歷史用電行為、交費(fèi)行為、資金到賬規(guī)律特征變量的集合;β表示輸入變量的正確電子憑證標(biāo)簽集合;χ表示預(yù)測結(jié)果出現(xiàn)錯誤的電子憑證標(biāo)簽集合;g(Rn(α)=β)表示輸入變量α正確分類的平均分類數(shù)量;g(Rn(α)=χ)表示輸入變量α錯誤分類的平均分類數(shù)量。
步驟五:為度量隨機(jī)森林算法對輸入變量預(yù)測結(jié)果出現(xiàn)的誤差,可用如下公式來表示:
利用隨機(jī)森林算法預(yù)測售電收入資金,提高預(yù)測數(shù)據(jù)的精準(zhǔn)度,為電子憑證圖像識別流程設(shè)計(jì)提供有效的資金預(yù)算支撐依據(jù)。
將基于特征提取的電子憑證售電收入資金預(yù)測結(jié)果應(yīng)用到電子憑證圖像識別過程中,不僅能夠優(yōu)化憑證流程,實(shí)現(xiàn)憑證自動化管理,詳細(xì)過程如圖3所示。
圖3 基于特征提取的識別流程
由圖3 可知,在認(rèn)證業(yè)務(wù)處理過程中輸入用戶歷史用電行為、交費(fèi)行為、資金到賬規(guī)律特征變量后,由請求受理器根據(jù)輸入的變量查詢數(shù)據(jù)庫,獲取相應(yīng)的憑證數(shù)據(jù)。如果數(shù)據(jù)庫中不存在相應(yīng)數(shù)據(jù),則向輸送端發(fā)起反饋申請并存儲到數(shù)據(jù)庫中[16]。系統(tǒng)根據(jù)提交的圖像數(shù)據(jù)和返回?cái)?shù)據(jù)進(jìn)行識別,設(shè)定閾值,根據(jù)閾值判斷兩種數(shù)據(jù)是否相似。如果相似則說明匹配成功,電子憑證結(jié)果有效,將該結(jié)果輸出到認(rèn)證處理階段。否則匹配失敗,電子憑證結(jié)果無效,無須輸出識別結(jié)果[17-18]。
為了驗(yàn)證提出的基于特征提取的電力電子憑證圖像識別系統(tǒng)設(shè)計(jì)的合理性,進(jìn)行了實(shí)驗(yàn)驗(yàn)證分析。
以某省一年的用戶用電量為研究對象,分析不同時(shí)間段下用戶用電量情況,并獲取電子憑證。用戶在網(wǎng)上進(jìn)行用電繳費(fèi)的詳細(xì)過程如下所示:進(jìn)入繳費(fèi)界面時(shí),再點(diǎn)擊【電費(fèi)】,再點(diǎn)擊右上角的【繳費(fèi)記錄】,點(diǎn)擊繳費(fèi)記錄后看到【繳費(fèi)賬單】,找到想要開發(fā)票的具體時(shí)間,點(diǎn)擊【電費(fèi)】。點(diǎn)擊電費(fèi)后看到賬單詳情,再點(diǎn)擊【查看繳費(fèi)詳情】。在繳費(fèi)詳情里面,點(diǎn)擊【繳費(fèi)憑證】,該繳費(fèi)憑證是電子繳費(fèi)的發(fā)票,也是回單。
將服務(wù)系統(tǒng)部署在阿里云服務(wù)器中,通過該服務(wù)器統(tǒng)計(jì)近1 年的售電收入資金,如圖4 所示。
圖4 近1年月售電收入資金時(shí)序圖
由圖4 可知,在近1 年中,9-10 月份為用電低谷,8-9 月份為用電高峰。
抽取2020 年9-10 月份10 個用戶的月售電收入資金情況進(jìn)行詳細(xì)分析,電子憑證如圖5 所示。
圖5 9-10月份月售電收入資金電子憑證
由圖5 可知,通過用戶電費(fèi)電子憑證,能夠精準(zhǔn)掌握每個用戶的用電量。
基于上述實(shí)際數(shù)據(jù),分別使用基于視覺傳達(dá)的電子憑證圖像識別方法、基于神經(jīng)網(wǎng)絡(luò)的電子憑證圖像識別方法和基于特征提取的電力電子憑證圖像識別系統(tǒng),對比分析用戶電費(fèi)電子憑證圖像識別結(jié)果,如圖6 所示。
圖6 三種方法電子憑證圖像識別結(jié)果對比
由圖6(a)可知,在序號3、4、5、6、7、8 處的圖像識別效果不佳,尤其在5、6 處的圖像識別效果較差,識別不出任何數(shù)據(jù)。在序號4、7 處出現(xiàn)了與實(shí)際用戶繳費(fèi)資金不一致的識別結(jié)果,分別相差2.5元和1.5 元。
由圖6(b)可知,在序號5、6 處的圖像識別效果不佳,尤其在5 處的圖像識別效果較差,識別不出任何數(shù)據(jù)。在序號6 處出現(xiàn)了與實(shí)際用戶繳費(fèi)資金不一致的識別結(jié)果,相差2.0 元。
由圖6(c)可看出,在序號4、5、6、7 處的圖像識別效果一般,尤其在序號5、6 處出現(xiàn)了與實(shí)際用戶繳費(fèi)資金不一致的識別結(jié)果,均差1.0 元,其余識別結(jié)果與實(shí)際繳費(fèi)資金一致。
通過上述分析結(jié)果可知,使用基于特征提取的電力電子憑證圖像識別系統(tǒng),能夠精準(zhǔn)識別電子憑證中的數(shù)據(jù)。
該文提出的基于特征提取的電力電子憑證圖像識別系統(tǒng),利用隨機(jī)森林算法預(yù)測售電收入資金,改變以往人工預(yù)測模式,使預(yù)測結(jié)果不會受到人工因素影響,具有精準(zhǔn)的識別結(jié)果,且科學(xué)性更強(qiáng),能夠有效支撐售電收入資金預(yù)算的計(jì)劃安排。同時(shí),對現(xiàn)有營銷系統(tǒng)模塊改造、對電力電子憑證圖像識別流程進(jìn)行優(yōu)化,實(shí)現(xiàn)憑證自動化管理。