虢 韜 沈 平 王 偉 時 磊 楊 淵 張 磊 陳 玥* 胡 有 羅 飛
1(貴州電網(wǎng)有限責(zé)任公司輸電運行檢修分公司 貴州 貴陽 550005)2(國網(wǎng)電力科學(xué)研究院武漢南瑞有限責(zé)任公司 湖北 武漢 430074)3(武漢大學(xué)計算機學(xué)院 湖北 武漢 430074)
雷電是一種常見的自然現(xiàn)象,它會對人們的日常生活及公共財產(chǎn)造成安全影響。尤其是一些重點設(shè)施,如輸電網(wǎng),雷電現(xiàn)象伴隨的熱效應(yīng)和過電壓會對電力線路產(chǎn)生破壞[1]。我國人口生活的稠密地區(qū)多屬于季風(fēng)帶,每年都有較多的雷電發(fā)生,這也增加了雷電對電網(wǎng)影響的機率。為了盡可能地降低雷電災(zāi)害造成的經(jīng)濟損失,需要對雷電進行監(jiān)測。目前主流的雷電監(jiān)測設(shè)備包括了地基雷電定位儀、氣象雷達(dá)、氣象衛(wèi)星,大氣電場儀等。這些設(shè)備通過監(jiān)測雷電發(fā)生的伴隨信號,能夠識別或預(yù)報雷電的發(fā)生。這些設(shè)備在使用成本和效果上有所差別,氣象雷達(dá)和氣象衛(wèi)星造價成本較高[2],而雷電定位儀是記錄雷電發(fā)生的儀器并不能預(yù)報雷電發(fā)生。
大氣電場儀由定片和動片組成,利用導(dǎo)體在電場中產(chǎn)生感應(yīng)電荷的原理,動片的旋轉(zhuǎn)使定片的感應(yīng)電荷轉(zhuǎn)換為和大氣電場成正比的電壓量,從而測量大氣電場數(shù)據(jù)[3]。當(dāng)大氣中有雷雨、大風(fēng)、冰雹、大氣湍流等強對流活動發(fā)生時,大氣中的電荷會被不斷地分離和聚集,尤其是將要有雷電發(fā)生時,地面電場強度的變化尤為明顯。因此可以通過監(jiān)測地面大氣電場強度的變化來預(yù)測雷電的發(fā)生。目前已有基于大氣電場儀數(shù)據(jù)進行雷電預(yù)警與雷電識別的相關(guān)研究。在預(yù)警雷電方面,有基于大氣電場幅值的雷電預(yù)警方法[4-7]。在雷電識別方面,多是以電場幅值作為識別指標(biāo),或利用快速傅里葉變換提取電場信號在頻域的特征。傅里葉變換通過識別信號中頻率的成分來對信號進行識別,對于雷電的0.5小時預(yù)警有著較好的識別能力。但是傅里葉變換作為全局性的變換忽略了信號在時域上的變化,對于在時域上變化的雷電過程,有著很大的局限性。文獻[8]利用大氣電場數(shù)據(jù)結(jié)合小波包分解和BP神經(jīng)網(wǎng)絡(luò)分類器來區(qū)分不同天氣現(xiàn)象,但BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要有大量的數(shù)據(jù)并且可解釋性差。
為了提高對由雷電引起大氣電場波動識別的準(zhǔn)確性,降低假陽性率,本文提出了一種基于小波包提取特征并以隨機森林作為分類器的識別方法。相對其他的工作,本文有三大優(yōu)勢:一是小波包可以提取大氣電場數(shù)據(jù)完整的時頻數(shù)據(jù)。二是應(yīng)用隨機森林作為分類器,隨機森林可對分類特征有更好的解釋性,可比較各個特征的區(qū)分權(quán)重,輔助優(yōu)化模型。三是在區(qū)分度更加精細(xì)??陀^上,不同雷電過程的雷電發(fā)生數(shù)量差異很大,在一個等長時段內(nèi)可從幾次到上百次變化。本文以雷電頻次對雷電數(shù)量強度進行分級,分為弱、中、強三個等級,區(qū)分實驗在三個級別上進行,更清楚地揭示在不同雷電強度下,本方法用大氣電場值區(qū)分真假雷電現(xiàn)象的能力。
從雷電形成原理上,當(dāng)天氣變化導(dǎo)致大氣中存在可以擊穿空氣介質(zhì)的電勢差超過臨界值時產(chǎn)生放電現(xiàn)象,即大氣電場強度的變化確實與雷電現(xiàn)象存在聯(lián)系。但是這種聯(lián)系的量化關(guān)系依然沒有準(zhǔn)確的描述,而且如前所述雷電不是唯一引起大氣電場值變化的原因,當(dāng)大氣電場值有波動時,也會出現(xiàn)雷電假陽性發(fā)生情況,如圖1所示。
圖1 在假陽性雷電發(fā)生情形下的大氣電場值波形
從信號形式角度,大氣電場在時域上是等時間間隔連續(xù)采樣信號,本文以s(t)代表;而雷電發(fā)生在時域上是隨機離散值,本文以g(t)代表?;诖髿怆妶鲋祬^(qū)分雷電真假發(fā)生的情況,本質(zhì)上是以雷電發(fā)生的事件頻次劃分大氣電場值的類別,提取構(gòu)建大氣電場連續(xù)時頻信號的分類特征,進而用這些特征區(qū)分雷電事件發(fā)生的真假陽性情況。為此,本文提出使用小波包技術(shù)提取大氣電場值的時頻特征,然后用隨機森林作為分類器的方法,在雷電發(fā)生數(shù)量弱、中、強三個強度上(如圖2所示,左側(cè)Y軸對應(yīng)柱狀表示雷電數(shù)量,右側(cè)Y軸對應(yīng)曲線圖表示大氣電場值的波形),進行大氣電場區(qū)分雷電發(fā)生的真假陽性情況。
圖2 不同雷電發(fā)生情形下的大氣電場值波形
小波理論可以對時頻信號進行多種目的的處理。有工作對雷電條件下的大氣電場值進行小波多尺度分析達(dá)到降噪的目的[9-10]。與它們不同,本文不過濾任何時頻信息,相反需要從任何細(xì)微的信息中提取特征,因此本文選擇使用小波理論中的小波包進行特征提取。
小波包適于提取信號的分類特征主要基于其具有的兩個特性。
(1) 信號頻帶分解是完整的。
(2) 滿足能量守恒性。
以Mallat[11]為代表的多尺度分析的尺度函數(shù)是按二進制變換的,在逐層細(xì)分的過程中,每次都只將低頻部分帶入下一層繼續(xù)分解。因此在高頻段其頻率分辨率較差,而在低頻頻段其時間分辨率較差。但是小波包在每個層次的分解時,對高頻部分的信息進行保留,這樣小波包對信號進行分解得到的是一顆完全二叉樹(圖3-圖4),包含各個子帶的全部信息,這樣不會損失用于區(qū)分樣本真假陽性的頻帶信息。
圖3 Mallat多尺度分析的分解樹
圖4 小波包的分解樹
對于待分解的信號s(t),小波包設(shè)置分解層次深度k和小波基函數(shù)un(t)后可以分解為2k個小波分量之和:
(1)
(2)
(3)
并且:
(4)
小波包的能量守恒性使得對于第k層的能量Ek等于該層各子頻帶能量的總和,即:
(5)
同時,s(t)無論分解到第幾層,各層總能量保持不變。對于原始信號的能量E以及第k層的能量Ek有:
E=E1=E2=…=Ek
(6)
(7)
(8)
(9)
除了上節(jié)大氣電場值變化的頻率特征外,大氣電場值的強度幅值在雷電預(yù)警相關(guān)研究中也使用過。如宋佳軍等[12]設(shè)定2 kV/m,5 kV/m,8 kV/m,12 kV/m,15 kV/m五級預(yù)警。為此,引入s(t)的均值和方差描述其強度幅值特征??紤]到電場值有正負(fù)性,如以下情況:
如圖5所示,給定sin(x/100)和2sin(x/100)兩個信號,其幅值的均值在一個周期內(nèi)均為0,出現(xiàn)正負(fù)極性能量相互抵消的情況,兩信號不能區(qū)分。但這兩個信號在能量絕對大小上不同。如對大氣電場值的均值做絕對化處理后|sin(x/100)|和|2sin(x/100)|,幅值的均值能很好地區(qū)分開兩個信號。所以,本文選擇大氣電場強度幅值經(jīng)過絕對化處理后的均值和方差作為分類特征的一部分。
圖5 幅值能量絕對值化對區(qū)分影響的對比
最終,本文構(gòu)建表1所列舉的指標(biāo)作為分類特征。所有的特征在使用之前都進行歸一化處理。
表1 分類特征
隨機森林是一種基于統(tǒng)計學(xué)習(xí)理論的組合分類器,相對于其他分類器,隨機森林有分類精度高,模型泛化能力強,可以在分類過程中給出特征重要性等優(yōu)點。
隨機森林將bootstrap重抽樣方法和決策樹算法相結(jié)合,算法的本質(zhì)是構(gòu)建一個樹型分類器{h(X,θk);k=1,2,…}的集合,然后使用該集合通過投票進行分類和預(yù)測。
一個隨機森林分類器具有多棵決策樹。對于第k棵樹,引進隨機變量θk,它與森林中的任意一棵樹的隨機變量θj都是獨立同分布的。利用訓(xùn)練集合θk來生成第k棵樹,等價于產(chǎn)生一個分類器h(X,θk),其中X是一個輸入向量。Θ由介于0到N之間某些的隨機整數(shù)組成。Θ的性質(zhì)和維度(量綱)依賴樹的構(gòu)造過程。在生成大量的樹之后,讓這些樹進行投票選出最流行的類,其結(jié)果即為分類器分類結(jié)果:
(10)
式中:H(x)表示組合分類模型,hi是單個決策樹的分類模型,Y表示輸出變量(或稱目標(biāo)變量),I(·)為示性函數(shù)。式(10)說明了使用多數(shù)投票決策的方法來確定最終的分類。
本實驗選用大氣電場數(shù)據(jù)為江蘇利港的大氣電場儀(120.079 E,31.991 N)于2016年2月至12月測量所得,采樣頻率為每秒一次。該數(shù)據(jù)集的基本數(shù)值特征為全年的電場強度平均絕對值約為0.19 kV,場強絕對值方差為0.1。同時,雷電監(jiān)測網(wǎng)提供該地區(qū)同期的雷電發(fā)生定位數(shù)據(jù),考慮到大氣電場儀的探測有效距離為20千米,將以大氣電場儀為中心半徑20千米內(nèi)的所有雷電記錄視為可檢測記錄,匹配大氣電場儀數(shù)據(jù)。
由于該數(shù)據(jù)時間跨度大,大氣電場數(shù)據(jù)采樣密度高,特別是提取負(fù)樣本時,必須先從時間軸掃描大氣電場儀數(shù)據(jù),找到有波動的時段,所以對電場數(shù)據(jù)進行預(yù)處理:大部分情況下電場值在0附近,以場強絕對值超過0.3 kV定位波動點,并將間隔5分鐘內(nèi)的相鄰波動點間的數(shù)據(jù)相連,組成最長波動時間段。將時間段內(nèi)平均場強絕對值超過0.4 kV的情況結(jié)合同時期的雷電定位數(shù)據(jù)劃分正負(fù)樣本。某個時期大氣電場值有波動而無雷電發(fā)生,則為負(fù)樣本(如圖1);反之大氣電場值波動有對應(yīng)的雷電匹配則為正樣本(如圖2)。
雷電從發(fā)生、發(fā)展、高潮到結(jié)束有一個時間過程。因此,每一個樣本按7 200秒時間跨度對齊,小于7 200秒的波動時間段,兩端擴展;大于7 200秒的兩端截斷。
獲取正負(fù)樣本之后,因為正樣本之間的雷電頻次數(shù)量相差很大(從1次到1 700余次),對正樣本進一步細(xì)分。即存在電場波動且發(fā)生雷電的樣本,分成弱、中和強3組,分別按以下三個數(shù)量區(qū)間劃分:4~18次、18~100次、100次以上(排除4次以下的突發(fā)特殊情況)。經(jīng)統(tǒng)計,一共提取了符合標(biāo)準(zhǔn)的樣本430個,其中包括389個負(fù)樣本、16個弱樣本、14個中等樣本和11個強樣本。
本研究目的是為區(qū)分負(fù)樣本和正樣本,所以使用后面兩個指標(biāo)對分類結(jié)果進行評估:真陽性率TPR(True Positive Rate)和假陽性率FPR(False Positive Rate)。即:
TPR=TP/P
FPR=FP/N
式中:TP為被分類為陽性的陽性樣本數(shù)量;FP為被分類器錯分為陽性的陰性樣本數(shù)量;P為測試集中陽性樣本的數(shù)量;N為測試集中陰性樣本的數(shù)量。
由于提取出的正樣本數(shù)量相對較少,在對方法進行評估時,選擇留一法驗證進行性能評估:每次將樣本分為兩部分,每次取一個樣本作為測試用例,其余樣本作為訓(xùn)練集。假設(shè)有K個樣本,則輪流將其中的每個樣本作為測試其他作為訓(xùn)練集,循環(huán)K次。留一法交叉驗證樣本利用率最高,適合于小樣本的情況。
由于強雷電樣本的數(shù)量為11個。為保證正負(fù)兩類樣本對分類器訓(xùn)練的樣本平衡性和各個正樣本之間的訓(xùn)練強度相等性,每次訓(xùn)練均從389個負(fù)樣本隨機抽選11個負(fù)樣本和11個正(弱和中是隨機抽11個)樣本使用留一法交叉驗證。小波包提取層次為3層。實驗程序在MATLAB和Python環(huán)境實現(xiàn)。
對每種情況均進行3次訓(xùn)練-測試過程,其結(jié)果如表2所示。
表2 分類結(jié)果
從結(jié)果上,負(fù)樣本與弱正樣本的區(qū)分難度大于中和強等級情況。但是總體上,三個等級的準(zhǔn)確率以及誤報率都非常好,證明本方法對于雷電的正負(fù)樣本識別在不同雷電級別下均有很好的分類效果。
雷電現(xiàn)象的成因與雷云中電荷分布、電場變化有著因果關(guān)系。大氣電場儀通過測量大氣電場值可用于雷電識別與預(yù)警。本文針對大氣電場識別雷電發(fā)生時會出現(xiàn)假陽性結(jié)果的問題,提出了基于小波包和隨機森林的方法。在三個雷電數(shù)量等級上與負(fù)樣本進行區(qū)分實驗,實驗結(jié)果的優(yōu)良性證明本方法的有效性。
[1] 田鋒濤.雷電對電力線路的危害以及雷擊計算方法探討[J].機電信息,2012(18):158-159.
[2] 張義軍,孟青,馬明,等.閃電探測技術(shù)發(fā)展和資料應(yīng)用[J].應(yīng)用氣象學(xué)報,2006,17(5):611-620.
[3] 張淑霞,吳安坤,丁旻,等.大氣電場儀的工作原理淺析[J].電子世界,2014(22):399-399,400.
[4] 潘家利,王明亮,吳海,等.基于大氣電場的雷電監(jiān)測預(yù)警技術(shù)研究[J].氣象研究與應(yīng)用,2012,33(3):94-97.
[5] 郭鈞天,曾瑜,田浩,等.基于大氣電場動態(tài)自適應(yīng)閾值的雷電預(yù)警方法研究[C]//第30屆中國氣象學(xué)會年會論文集.2013:1-5.
[6] 王振會,徐棟璞,曾慶鋒,等.利用地面大氣電場和雷達(dá)資料進行雷電臨近預(yù)報方法[J].科技導(dǎo)報,2012,30(14):42-48.
[7] 丁德平,李迅,鄧長菊,等.北京地區(qū)大氣電場的特征及雷電預(yù)警中的訂正分析[J].沙漠與綠洲氣象,2012,6(4):68-73.
[8] 康海龍,劉成,姜秀杰,等.基于大氣電場特征的天氣現(xiàn)象識別算法研究[J].計算機仿真,2014,31(12):312-315,324.
[9] 余蓉,杜牧云,杜九三,等.大氣電場儀資料的小波去噪研究[J].成都信息工程大學(xué)學(xué)報,2016,31(2):175-179.
[10] 李艷,王振會,陳紅兵,等.基于小波技術(shù)的地面大氣電場數(shù)據(jù)處理[J].氣象科學(xué),2012,32(2):177-181.
[11] Mallat S G.A Theory for Multiresolution Signal Decomposition:The Wavelet Representation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,1989,11(7):674-693.
[12] 宋佳軍.DNDY地面電場儀的研制及電場數(shù)據(jù)融合閃電數(shù)據(jù)進行雷電監(jiān)測預(yù)警的研究[D].中國科學(xué)院研究生院,2008.