周 莽,李國(guó)華,李晨光,姜辰龍,郭騏翔
(國(guó)網(wǎng)長(zhǎng)春供電公司,長(zhǎng)春 130021)
2020年初爆發(fā)的“新型冠狀病毒肺炎”(簡(jiǎn)稱:“新冠肺炎”)成為舉國(guó)關(guān)心的焦點(diǎn)。文獻(xiàn)[1]中由于其存在人傳人的特性,加上春節(jié)期間返潮高峰,在短期內(nèi)來(lái)看,“新冠肺炎”疫情對(duì)我國(guó)社會(huì)經(jīng)濟(jì)發(fā)展產(chǎn)生了較大的影響。由于電力作為國(guó)民經(jīng)濟(jì)發(fā)展的“預(yù)警器”和“晴雨表”,通過(guò)客觀、真實(shí)地反映當(dāng)前生產(chǎn)生活的電能消耗情況,能夠準(zhǔn)確地反映社會(huì)經(jīng)濟(jì)發(fā)展?fàn)顩r,因此,在“新冠肺炎”疫情期間,基于電力數(shù)據(jù)開展企業(yè)復(fù)工復(fù)產(chǎn)監(jiān)控及預(yù)測(cè),對(duì)穩(wěn)經(jīng)濟(jì)、保民生至關(guān)重要。在此背景下,構(gòu)建企業(yè)復(fù)工復(fù)產(chǎn)狀態(tài)識(shí)別方法具有重要實(shí)踐意義。
當(dāng)前,學(xué)術(shù)界關(guān)于“新冠肺炎”疫情對(duì)企業(yè)復(fù)工復(fù)產(chǎn)影響的研究相對(duì)較少,主要集中在:文獻(xiàn)[1]中疫情對(duì)就業(yè)、文獻(xiàn)[2]中疫情對(duì)供應(yīng)鏈等方面的影響。另外,文獻(xiàn)[3]中對(duì)疫情后復(fù)工的影響,研究了緩疫策略執(zhí)行力和依從性??傮w來(lái)看,“新冠肺炎”疫情對(duì)企業(yè)復(fù)工復(fù)產(chǎn)產(chǎn)生了重要的影響,如何從電網(wǎng)角度助力企業(yè)復(fù)工復(fù)產(chǎn)成為重要的研究課題。以往企業(yè)復(fù)工復(fù)產(chǎn)運(yùn)行狀態(tài)監(jiān)測(cè)主要依賴于人為主觀判斷,缺乏科學(xué)依據(jù),并且監(jiān)測(cè)效率及預(yù)測(cè)準(zhǔn)確度較低,企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)方法缺少推廣性,導(dǎo)致疫情防控決策缺少準(zhǔn)確的方法支持。近年來(lái),利用電力大數(shù)據(jù)進(jìn)行預(yù)測(cè)的研究一直受到國(guó)內(nèi)外學(xué)者的重視,并展開了大量的研究。學(xué)者們主要采用線性和非線性兩種方式進(jìn)行預(yù)測(cè),其中線性預(yù)測(cè)模型主要包括文獻(xiàn)[4]中自回歸滑動(dòng)平均(ARMA)模型和文獻(xiàn)[5]中差分整合移動(dòng)平均自回歸(ARIMA)模型;文獻(xiàn)[6]中非線性預(yù)測(cè)模型包括灰色模型(GM)、文獻(xiàn)[7]中支持向量機(jī)(SVM)和文獻(xiàn)[8]中神經(jīng)網(wǎng)絡(luò)(NN)等預(yù)測(cè)模型。根據(jù)以往電力領(lǐng)域預(yù)測(cè)的研究表明,在大數(shù)據(jù)背景下,文獻(xiàn)[9]中提出神經(jīng)網(wǎng)絡(luò)因其結(jié)構(gòu)簡(jiǎn)單等特點(diǎn),使其被廣泛應(yīng)用?;诩质∧呈械钠髽I(yè)用戶電力數(shù)據(jù),借鑒較成熟的人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)理論和方法,對(duì)企業(yè)是否復(fù)工復(fù)產(chǎn)情況進(jìn)行預(yù)測(cè)。首先,確定企業(yè)復(fù)工復(fù)產(chǎn)的基本特征,提煉相應(yīng)的指標(biāo)體系;其次,通過(guò)電話訪談及網(wǎng)絡(luò)調(diào)研等方式,獲得企業(yè)復(fù)工復(fù)產(chǎn)的實(shí)測(cè)數(shù)據(jù);最后,基于BP神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建企業(yè)復(fù)工復(fù)產(chǎn)狀態(tài)識(shí)別模型,通過(guò)訓(xùn)練參數(shù),得到接近于實(shí)際結(jié)果的識(shí)別模型,因此,利用BP神經(jīng)網(wǎng)絡(luò)算法,準(zhǔn)確、高效識(shí)別企業(yè)復(fù)工復(fù)產(chǎn)狀態(tài),提高模型預(yù)測(cè)準(zhǔn)確度,為政府決策、電網(wǎng)公司穩(wěn)定運(yùn)行、企業(yè)生產(chǎn)經(jīng)營(yíng)提供數(shù)據(jù)支撐。
人工神經(jīng)網(wǎng)絡(luò)區(qū)別于生物學(xué)上的神經(jīng)網(wǎng)絡(luò),擁有如BP神經(jīng)網(wǎng)絡(luò)、遺傳算法等分支,文獻(xiàn)[10]中BP神經(jīng)網(wǎng)絡(luò)算法是當(dāng)前電力領(lǐng)域應(yīng)用較多的一種機(jī)器學(xué)習(xí)算法。因此,構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)模型,解決企業(yè)用電特征的非線性映射問(wèn)題。
BP神經(jīng)元是神經(jīng)網(wǎng)絡(luò)的最小數(shù)據(jù)處理單位,其中存在大量數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn),其模仿生物神經(jīng)元的特征:加權(quán)、求和與轉(zhuǎn)移。設(shè)x1、x2、x3…xn為神經(jīng)元的輸入項(xiàng);wj1、wj2、wj3…wjn為權(quán)系數(shù);bj為判斷閾值;Sj為凈輸入值;f(·)為激勵(lì)函數(shù);yj為第j個(gè)神經(jīng)元的輸出項(xiàng)。那么,BP神經(jīng)網(wǎng)絡(luò)在第j個(gè)神經(jīng)元的凈輸入值為:
(1)
式中:X=[x1,x2,…,xi,…,xn]T,W=[wj1,wj2,…,wji,…,wjn]。
凈輸入通過(guò)激勵(lì)函數(shù)測(cè)算得到第j個(gè)神經(jīng)元的輸出值為:
(2)
f(·)反映了BP神經(jīng)網(wǎng)絡(luò)中的非線性映射能力。另外,f(·)分為單極性激勵(lì)函數(shù)(log-sigmoid函數(shù))和雙極性激勵(lì)函數(shù)(tan-sigmoid函數(shù))。由于tan-sigmoid激勵(lì)函數(shù)延遲了飽和期,因此,選擇tan-sigmoid激勵(lì)函數(shù)進(jìn)行學(xué)習(xí)。tan-sigmoid激勵(lì)函數(shù)公式為:
(3)
式中f(x)的范圍為(-1,1)。
采用BP神經(jīng)網(wǎng)絡(luò)方法對(duì)企業(yè)復(fù)工復(fù)產(chǎn)進(jìn)行預(yù)測(cè),訓(xùn)練并調(diào)優(yōu)模型參數(shù)。神經(jīng)網(wǎng)絡(luò)算法流程見圖1。
圖1 BP神經(jīng)網(wǎng)絡(luò)流程
以吉林省某市的企業(yè)用戶為例,除去居民用戶外,所有電壓等級(jí)為380 V及以上,日均平均電量不小于10 kW·h的用戶。樣本數(shù)據(jù)主要來(lái)源于電力營(yíng)銷系統(tǒng),按照農(nóng)林漁牧業(yè)、礦業(yè)、制造業(yè)、物流倉(cāng)儲(chǔ)業(yè)、批發(fā)和零售業(yè)、住宿和餐飲業(yè)、金融業(yè)七個(gè)行業(yè),每個(gè)行業(yè)隨機(jī)抽取400戶,共獲得2 800個(gè)樣本作為模型數(shù)據(jù),其中樣本變量主要包括行業(yè)分類、運(yùn)行容量、電量等。由于訓(xùn)練數(shù)據(jù)不能再用于模型測(cè)試,因此將樣本數(shù)的80%用于訓(xùn)練模型,調(diào)整模型結(jié)構(gòu),提高模型擬合度,其余20%樣本數(shù)據(jù)測(cè)試訓(xùn)練后的模型,驗(yàn)證模型擬合結(jié)果的正確性。通過(guò)電話訪談及網(wǎng)絡(luò)調(diào)研的方式,明確企業(yè)復(fù)工復(fù)產(chǎn)情況,將企業(yè)實(shí)際的復(fù)工復(fù)產(chǎn)狀態(tài)作為模型訓(xùn)練樣本的輸入數(shù)據(jù)。
2.2.1 指標(biāo)選定
為了提高模型預(yù)測(cè)效果,降低模型估計(jì)誤差,需要獲取更多輸入指標(biāo)的特征,界定輸入指標(biāo)的概念。主要包括2019年全年平均日電量(q1)、過(guò)年期間(除夕、初一、初二)的平均電量(q2)、當(dāng)前日電量(q3)及用戶運(yùn)行容量(D)??紤]到企業(yè)用電量一般規(guī)律,針對(duì)當(dāng)前日用電量小于5 kW·h的企業(yè)直接視為未復(fù)工復(fù)產(chǎn)企業(yè)。另外,D用于控制同行業(yè)內(nèi)不同企業(yè)用電規(guī)模的差異對(duì)計(jì)算結(jié)果偏差的影響。上述4項(xiàng)作為網(wǎng)絡(luò)學(xué)習(xí)樣本中的輸入項(xiàng),輸出項(xiàng)為企業(yè)復(fù)工復(fù)產(chǎn)的實(shí)測(cè)值。為了降低樣本數(shù)據(jù)的隨機(jī)誤差,對(duì)學(xué)習(xí)樣本數(shù)據(jù)先進(jìn)行歸一化,降低模型訓(xùn)練的隨機(jī)誤差。
2.2.2 訓(xùn)練過(guò)程
BP神經(jīng)網(wǎng)絡(luò)模型由輸入層、隱藏層及輸出層組成,其中只有輸入層和隱藏層才有偏置調(diào)節(jié)。鑒于企業(yè)復(fù)工復(fù)產(chǎn)狀態(tài)屬于客觀事實(shí),訓(xùn)練模型時(shí)需要提前判斷其真實(shí)狀態(tài),因此,選擇有導(dǎo)師信號(hào)的神經(jīng)網(wǎng)絡(luò)。其結(jié)構(gòu)見圖2。
圖2 復(fù)工復(fù)產(chǎn)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程
圖中輸入節(jié)點(diǎn)[x1,x2,x3,x4]分別表示用戶運(yùn)行用量、全年平均日電量、過(guò)年期間平均日電量和當(dāng)年日電量,隱含層表示權(quán)重判斷[wj1,wj2,…,wjn],輸出層表示輸出節(jié)點(diǎn)。最終輸出值是通過(guò)一系列非線性函數(shù)運(yùn)算之后得出,即:
(4)
式中:xi為第i個(gè)維度的輸入;n取4;m為對(duì)應(yīng)的輸出端的節(jié)點(diǎn)個(gè)數(shù)。
根據(jù)BP神經(jīng)網(wǎng)絡(luò)正向傳播得到模型輸出值,如果期望值與測(cè)算值存在較大偏差,則將誤差結(jié)果進(jìn)行反向傳播測(cè)算,即實(shí)現(xiàn)誤差值最小化。均方誤差(EMS)為:
(5)
測(cè)算全局的誤差主要目的是為了改變BP神經(jīng)網(wǎng)絡(luò)的連接權(quán)系數(shù),在最大程度上減小全局誤差,調(diào)整全局連接權(quán)系數(shù)的公式為:
(6)
式中:η表示學(xué)習(xí)速率,主要影響連接權(quán)系數(shù)在循環(huán)過(guò)程中產(chǎn)生變化量的大小,考慮到η過(guò)小會(huì)影響運(yùn)行速度和系統(tǒng)穩(wěn)定性,文獻(xiàn)[10]中η一般取值在0.01~0.8之間。
通過(guò)訓(xùn)練樣本數(shù)據(jù),當(dāng)模型的均方誤差處于穩(wěn)定狀態(tài)后,即不再修改模型的權(quán)值和閾值,只需改變輸入節(jié)點(diǎn)數(shù)和輸出節(jié)點(diǎn)數(shù),即可直接用于測(cè)試樣本的訓(xùn)練,對(duì)計(jì)算結(jié)果進(jìn)行反復(fù)修正,從而使網(wǎng)絡(luò)輸出的最后結(jié)果具有誤差最小、精度最高。首先,在訓(xùn)練過(guò)程中將訓(xùn)練樣本數(shù)據(jù)輸入模型,并根據(jù)訓(xùn)練樣本數(shù)據(jù)的誤差調(diào)整模型結(jié)構(gòu);其次,用驗(yàn)證數(shù)據(jù)測(cè)量模型的優(yōu)化程度,當(dāng)模型優(yōu)化程度穩(wěn)定時(shí)即停止訓(xùn)練;最后,測(cè)試訓(xùn)練后的模型預(yù)測(cè)效果,判斷模型優(yōu)劣。神經(jīng)元的內(nèi)部函數(shù)采用S型函數(shù)進(jìn)行計(jì)算。根據(jù)神經(jīng)網(wǎng)絡(luò)算法及用于判別的六大指標(biāo),構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型。D、q1、q2、q3作為輸入變量,企業(yè)復(fù)工與否為期望輸出信號(hào)。將指標(biāo)數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)模型,通過(guò)增加迭代次數(shù)與神經(jīng)元,不斷調(diào)整其權(quán)值和閾值,使預(yù)測(cè)準(zhǔn)確率達(dá)到最大,此時(shí)的神經(jīng)網(wǎng)絡(luò)模型結(jié)果為最優(yōu)。
將企業(yè)復(fù)工復(fù)產(chǎn)相關(guān)數(shù)據(jù)輸入模型進(jìn)行訓(xùn)練,得到訓(xùn)練曲線見圖3。由圖中可知,在對(duì)樣本進(jìn)行了246次訓(xùn)練后,均方誤差處于較低水平,且基本沒(méi)有變化,表明BP神經(jīng)網(wǎng)絡(luò)模型擬合度較好。另外,當(dāng)隱藏層神經(jīng)元個(gè)數(shù)達(dá)到48個(gè)時(shí),均方誤差基本處于穩(wěn)定狀態(tài),表明BP神經(jīng)網(wǎng)絡(luò)具有較快的收斂速度及較高的預(yù)測(cè)精度。
圖3 復(fù)工復(fù)產(chǎn)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練曲線
基于最優(yōu)的BP神經(jīng)網(wǎng)絡(luò)模型,將20%的樣本進(jìn)行測(cè)試,采用S型函數(shù)進(jìn)行計(jì)算,其中將各行業(yè)實(shí)際復(fù)工企業(yè)數(shù)與其中預(yù)測(cè)正確復(fù)工企業(yè)數(shù)進(jìn)行比較,得出預(yù)測(cè)準(zhǔn)確率。表1為BP神經(jīng)網(wǎng)絡(luò)模型測(cè)試樣本得到的不同行業(yè)的企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)正確率。總體來(lái)看,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)企業(yè)復(fù)工復(fù)產(chǎn)的準(zhǔn)確率較高,總體準(zhǔn)確率達(dá)到了92.3%,其中金融業(yè)企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)準(zhǔn)確率達(dá)到了97.5%,表明BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)測(cè)值的偏差較小,模型預(yù)測(cè)效果較好。
表1 各行業(yè)企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)準(zhǔn)確率情況 %
通過(guò)綜合考慮企業(yè)生產(chǎn)經(jīng)營(yíng)用電特征、能耗使用情況、節(jié)日期間用電特性和冬季用電特性等因素對(duì)企業(yè)復(fù)工復(fù)產(chǎn)的影響,構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)模型。研究結(jié)果表明:企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)模型訓(xùn)練迭代次數(shù)及隱藏層神經(jīng)元個(gè)數(shù)均達(dá)到了模型均方誤差的穩(wěn)定狀態(tài),模型預(yù)測(cè)效果較佳;同時(shí)企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)準(zhǔn)確率達(dá)到了92.3%,模型預(yù)測(cè)準(zhǔn)確度較高。構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)模型具有較高的實(shí)際推廣應(yīng)用價(jià)值,但從模型預(yù)測(cè)準(zhǔn)確率來(lái)看,在預(yù)測(cè)精確上仍存在7.7%的提升空間,因此,下一步將在改進(jìn)模型結(jié)構(gòu)、完善指標(biāo)體系等角度入手,進(jìn)一步提高企業(yè)復(fù)工復(fù)產(chǎn)預(yù)測(cè)的準(zhǔn)確性。