修夢菲
(1.浙江浙能技術(shù)研究院有限公司,浙江 杭州 310000;2.浙江省火力發(fā)電高效節(jié)能與污染物控制技術(shù)研究重點實驗室,浙江 杭州 310000)
電力技術(shù)革命以來,電能供給和使用給人們生產(chǎn)和生活帶來了極大的便利,也成為人們?nèi)粘I畈豢苫蛉钡闹匾茉垂┙o方式[1]。目前,電能產(chǎn)生可以依賴多種模式,例如火力發(fā)電、風(fēng)力發(fā)電、太陽能發(fā)電以及核能發(fā)電等。電能使用的最大問題就是避免浪費,因此電能節(jié)能控制成為電力領(lǐng)域最重要的課題[2]。從理論上來說,電能的節(jié)約控制關(guān)鍵在于供給側(cè)和需求側(cè)的對應(yīng)和匹配,盡可能避免需求側(cè)對能源需求總量的無限制增加。在供給側(cè),能夠?qū)Πl(fā)電數(shù)據(jù)進(jìn)行準(zhǔn)確監(jiān)測,及時發(fā)現(xiàn)異常數(shù)據(jù)并進(jìn)行處理,這也是電能節(jié)能控制的關(guān)鍵。從現(xiàn)有的方法來看,已經(jīng)形成了基于監(jiān)督模式的異常數(shù)據(jù)檢測、無監(jiān)督模式的異常數(shù)據(jù)檢測等方法[3]。在神經(jīng)網(wǎng)絡(luò)技術(shù)出現(xiàn)后,基于學(xué)習(xí)機(jī)制的異常數(shù)據(jù)識別成為更有效的方法,尤其是深度學(xué)習(xí)網(wǎng)絡(luò)的出現(xiàn),進(jìn)一步提高了異常數(shù)據(jù)檢測的效果。因此,該文以YOLO 網(wǎng)絡(luò)作為深度學(xué)習(xí)的基礎(chǔ)模型,對發(fā)電側(cè)異常數(shù)據(jù)進(jìn)行檢測,并通過試驗進(jìn)行驗證。
該文對發(fā)電側(cè)的異常數(shù)據(jù)進(jìn)行檢測,數(shù)據(jù)量比圖像識別、視頻監(jiān)控等任務(wù)少,因此選擇最小型YOLO 深度網(wǎng)絡(luò),可以將其看作常規(guī)YOLO 網(wǎng)絡(luò)的簡化模型。在該模型中,一共采用了7 個DBL 單元和6 個Pooling 單元,從而形成了更容易組建的特征提取層。最小型YOLO 深度網(wǎng)絡(luò)的結(jié)構(gòu)框架如圖1 所示。
圖1 最小型 YOLO 網(wǎng)絡(luò)的異常數(shù)據(jù)檢測框架
在深度學(xué)習(xí)的過程中,發(fā)電側(cè)數(shù)據(jù)的屬性作為第一層級,各個屬性類別之間的差異用距離表示并作為第二層級,這樣就可以將發(fā)電側(cè)數(shù)據(jù)形成一個S×S的空間網(wǎng)格結(jié)構(gòu)。這個數(shù)據(jù)空間的寬度和長度分別為w和h,每個數(shù)據(jù)空間對應(yīng)1 個置信度,如公式(1)所示。
式中:C為每個數(shù)據(jù)空間對應(yīng)的置信度;ρ為數(shù)據(jù)空間中發(fā)電側(cè)數(shù)據(jù)為正常情況的概率;IoUT P為真實情況與預(yù)測情況的交并比計算結(jié)果。
當(dāng)對發(fā)電側(cè)異常數(shù)據(jù)進(jìn)行檢測時,如果置信度C低于設(shè)定的閾值,就可以判斷該數(shù)據(jù)異常。
該文在YOLO 深度網(wǎng)絡(luò)中引入的SENet 結(jié)構(gòu)如圖2 所示。
圖2 YOLO 網(wǎng)絡(luò)中引入的SENet 的結(jié)構(gòu)
由圖2 可知,在存在一個特定輸入X的情況下,數(shù)據(jù)空間的高度、寬度和通道數(shù)量分別為H、W和Q。
首先,對輸入的數(shù)據(jù)或特征進(jìn)行全局均值池化處理,形成一個可以表達(dá)全局信息的向量,該向量是一維的。其次,2 個具有全局信息的向量通過全連接層以及ReLU 函數(shù)的激活處理形成降維簡化的效果。再次,對已經(jīng)降維的信息進(jìn)行Sigmoid 函數(shù)激活處理,從而得到復(fù)原后的數(shù)據(jù)。最后,通過執(zhí)行標(biāo)定處理,將處理后的數(shù)據(jù)信息復(fù)原回原有的數(shù)據(jù)空間。
在這個過程中,多個尺度的池化處理體現(xiàn)為金字塔結(jié)構(gòu)。在發(fā)電側(cè)數(shù)據(jù)的金字塔池化過程中,使用了3 個尺度的池化處理,分別是5×5、9×9 和13×13,這種結(jié)構(gòu)的處理效果如圖3 所示(抽象的結(jié)果)。
圖3 該文采用的池化結(jié)構(gòu)
由圖3 可知,發(fā)電側(cè)數(shù)據(jù)的特征已開始被抽象成n×n×m的尺寸,然后開始進(jìn)入該文設(shè)定的3 個不同層級的池化單元進(jìn)行處理,這3 個不同層級的池化單元構(gòu)成了金字塔。雖然這3個池化單元的尺度并不相同,但是形成的輸出均需與輸入保持相同的維度。最終的輸出與最初的輸入效果結(jié)合,從而形成了n×n×4m的擴(kuò)維特征。
針對數(shù)據(jù)網(wǎng)格邊界定位不準(zhǔn)確的問題,采用GIoU損失函數(shù)來界定數(shù)據(jù)網(wǎng)格邊界,以進(jìn)一步提高識別發(fā)電側(cè)異常數(shù)據(jù)的準(zhǔn)確度。
當(dāng)預(yù)測邊界與真實邊界不重合時,GIoU函數(shù)可以解決IoU無法衡量兩邊界距離遠(yuǎn)近的問題。同時,GIoU函數(shù)也可以解決IoU為0 時無法優(yōu)化的問題。GIoU利用IoU的尺度不變性,可以更準(zhǔn)確地計算邊界回歸。IoU函數(shù)和GIoU函數(shù)分別如公式(2)、公式(3)所示。
式中:A為數(shù)據(jù)網(wǎng)格的真實邊界;B為數(shù)據(jù)網(wǎng)格的預(yù)測邊界;C為包圍預(yù)測邊界與真實邊界之間的最小外接矩形。
用GIoU替換IoU并將其作為邊界距離的衡量標(biāo)準(zhǔn),得到邊界損失函數(shù)Lbox如公式(4)所示。
針對發(fā)電過程供給端的異常數(shù)據(jù)檢測問題,該文在YOLO 深度學(xué)習(xí)網(wǎng)絡(luò)的基礎(chǔ)上,在特征提取階段加入SENet結(jié)構(gòu),在特征提取階段后加入多尺度池化操作,形成了一種新的異常數(shù)據(jù)檢測算法。為了驗證該文提出的異常數(shù)據(jù)檢測算法的有效性,需要進(jìn)行相關(guān)試驗。
在試驗過程中,選擇AAA 發(fā)電站發(fā)電側(cè)供給的10 000組實際數(shù)據(jù)作為試驗對象。因此,該文的數(shù)據(jù)樣本由AAA發(fā)電站后臺數(shù)據(jù)庫提供。每組數(shù)據(jù)都包括5 個屬性維度,分別是電壓、電流、功率、回路和時間。10 000 組數(shù)據(jù)中包括329 個異常數(shù)據(jù),其他為正常數(shù)據(jù),異常數(shù)據(jù)和正常數(shù)據(jù)隨機(jī)分布。在試驗過程中,選取全部數(shù)據(jù)的60%作為樣本數(shù)據(jù),30%作為測試數(shù)據(jù),10%作為檢測數(shù)據(jù)。
在試驗過程中,對比基于YOLO 深度網(wǎng)絡(luò)的檢測方法和引入SENet 結(jié)構(gòu)的YOLO 檢測方法的損失曲線,結(jié)果如圖4 所示。在試驗中,共選擇3 000 組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。
圖4 SENet 結(jié)構(gòu)引入前后的對比
由圖4 可知,隨著迭代步數(shù)不斷增加,2 種檢測方法的損失率都不斷下降,表明2 種算法對異常數(shù)據(jù)的檢出率不斷提高。從2 條曲線的對比結(jié)果可以看出,基于YOLO 深度網(wǎng)絡(luò)檢測方法的損失率變化并不平穩(wěn),雖然總體趨勢在不斷下降,但是中間出現(xiàn)了很多脈沖型突起,表明基于YOLO 深度網(wǎng)絡(luò)檢測方法對數(shù)據(jù)特征提取的效果存在一定偏差。雖然該文提出的SENet 結(jié)構(gòu)的YOLO 檢測方法的損失率變化曲線也有波動,但是波動幅度小,表明在引入SENet 結(jié)構(gòu)后,YOLO檢測方法提取的數(shù)據(jù)特征更準(zhǔn)確。
對比基于YOLO 深度網(wǎng)絡(luò)的檢測方法和引入多尺度池化的YOLO 檢測方法的損失曲線,結(jié)果如圖5 所示。在試驗中,共選擇7 000 組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。
圖5 多尺度池化引入前后的對比
由圖5 可知,隨著迭代步數(shù)不斷增加,2 種檢測方法的損失率都不斷下降,表明2種算法對異常數(shù)據(jù)的檢出率不斷提高。從2 條曲線的對比結(jié)果可以看出,基于YOLO 深度網(wǎng)絡(luò)檢測方法的損失率下降幅度比該文提出的引入多尺度池化的YOLO檢測方法小。同時,該文提出的引入多尺度池化的YOLO 檢測方法的收斂速度也更快,大概在180 次迭代后即達(dá)成了穩(wěn)定。而基于YOLO 深度網(wǎng)絡(luò)的檢測方法在310 次迭代后才達(dá)成穩(wěn)定。
最后一項試驗是測試該文提出的異常數(shù)據(jù)檢測方法的精度。在試驗過程中,選擇基于CNN 深度網(wǎng)絡(luò)的檢測方法、基于RNN 深度網(wǎng)絡(luò)的檢測方法和基于YOLO 深度網(wǎng)絡(luò)的檢測方法作為參照方法。從1 000 組數(shù)據(jù)開始逐步增加數(shù)據(jù)數(shù)量,觀察4 種方法對發(fā)電側(cè)供給異常數(shù)據(jù)的檢測精度,結(jié)果見表1。
表1 4 種方法的異常數(shù)據(jù)檢測精度
由表1 可知,隨著檢測數(shù)據(jù)量不斷增大,4 種方法對異常數(shù)據(jù)的檢測精度都不斷提高。其原因是數(shù)據(jù)量越多,樣本信息的特征越豐富,基于深度學(xué)習(xí)的異常檢測方法可以獲得更準(zhǔn)確的檢測結(jié)果。從4 種方法的對比結(jié)果也可以看出,基于CNN 深度網(wǎng)絡(luò)的檢測方法的檢測精度最低,該文提出的方法對異常數(shù)據(jù)的檢測精度更高。相比之下,基于YOLO 深度網(wǎng)絡(luò)的檢測方法與該文提出方法的檢測精度差距最小。但是隨著數(shù)據(jù)量不斷增大,這種差距也被不斷拉大。這也再次證明了該文在YOLO 深度網(wǎng)絡(luò)上采取的改進(jìn)措施的有效性,其更適合對發(fā)電側(cè)異常數(shù)據(jù)進(jìn)行檢測。
針對發(fā)電側(cè)異常數(shù)據(jù)的檢測問題,該文在YOLO 深度網(wǎng)絡(luò)檢測方法的基礎(chǔ)上提出了一種改進(jìn)的異常數(shù)據(jù)檢測方法。在YOLO 網(wǎng)絡(luò)的特征提取階段引入SENet 結(jié)構(gòu),通過壓縮、激勵和重標(biāo)定3 個操作使數(shù)據(jù)信息的特征提取更準(zhǔn)確。在YOLO 網(wǎng)絡(luò)的特征層后加入多尺度池化處理,使深度網(wǎng)絡(luò)的學(xué)習(xí)和訓(xùn)練效率更高,進(jìn)一步提高檢測準(zhǔn)確性。試驗結(jié)果表明,通過引入SENet 結(jié)構(gòu)和多尺度池化處理,該文提出的異常數(shù)據(jù)檢測方法可以獲得更準(zhǔn)確的特征提取結(jié)果。