文剛,高孟平,高振宇,周仿榮,潘浩,李志棟,張濤,羅繼強,劉星星
(1.電力遙感技術(shù)聯(lián)合實驗室(云南電網(wǎng)有限責任公司電力科學研究院),云南 昆明 650217;2.云南電網(wǎng)有限責任公司,云南 昆明 650200;3.北京空間飛行器總體設(shè)計部,北京 100094;4.廣東工業(yè)大學,廣東 廣州 510006)
云南省的大部分架空輸電線路處于環(huán)境復(fù)雜的崇山峻嶺中,輸電線路遇風很容易擺動,與樹木或山體坡面頻繁接觸,引起短路放電造成山火[1]。一旦有山火發(fā)生,火勢很容易在架空線路走廊周邊蔓延,使輸電線路暫停運作,同時由于山火持續(xù)時間一般較長,導(dǎo)致絕大部分重合閘失敗,進而造成停電事故。當山火蔓延影響到電網(wǎng)區(qū)域中多條輸電線路時,很可能會造成大范圍停電事故,嚴重影響電網(wǎng)的安全穩(wěn)定運行[2]。為了盡可能減少山火隱患,防止電網(wǎng)的安全穩(wěn)定運行受到山火威脅,有必要開展山火風險評估的研究。
山火的發(fā)生受植被類型、植被狀態(tài)(含水率)、氣象因素、地形、人為因素等影響,山火風險預(yù)測系統(tǒng)是受多種誘導(dǎo)因子作用的復(fù)雜系統(tǒng)。目前,山火評估預(yù)測的方法主要分為傳統(tǒng)方法和模擬法。
傳統(tǒng)方法包括相關(guān)關(guān)系法、統(tǒng)計分析法、以火報火法。H.t.Gisborne在1936年提出了多因子預(yù)測火險等級的相關(guān)關(guān)系預(yù)測方法[3]。統(tǒng)計分析法是通過收集歷史火災(zāi)相關(guān)氣象資料資料,統(tǒng)計分析歷史火災(zāi)的天氣狀況、時間、地形、次數(shù)等氣象因子,確定火災(zāi)與各個氣象因子的相關(guān)性,總結(jié)火災(zāi)發(fā)生的規(guī)律。但是氣象因子對火災(zāi)發(fā)生的影響機制十分復(fù)雜,同時火災(zāi)發(fā)生也與人類活動有一定關(guān)系,因而統(tǒng)計分析法對火災(zāi)的評估預(yù)測可靠性比較低[4]。以火報火法通過建立不同森林可燃物的點火燃燒實驗與氣象要素之間的關(guān)系來預(yù)測火災(zāi)的危險性,具有代表性的是澳大利亞曾進行點火試驗800次,建立了森林火災(zāi)預(yù)報模型,該系統(tǒng)由McArthur設(shè)計,不僅能預(yù)測林火的可能性,還能輸出定量的火行為參數(shù),例如林火蔓延速度、火險強度、飛火距離等[5]。該方法預(yù)測火災(zāi)的危險性較為準確,但需要進行大量的野外試驗,建立模型需要花費大量的時間。
隨著計算機技術(shù)的迅猛發(fā)展及其在火災(zāi)評估中的應(yīng)用,模擬法利用衛(wèi)星監(jiān)測技術(shù)和地理信息系統(tǒng)(geographic information system,GIS)技術(shù),使山火預(yù)測更為準確。其中Logistic回歸是應(yīng)用最為廣泛的模型。文獻[6]基于Logistic回歸模型對浙江省2000—2016年林火發(fā)生的主要影響因素進行分析,確定驅(qū)動因子,建立林火預(yù)測模型并劃分火險等級,模型總體預(yù)測準確率達到79.1%。文獻[7]以江西省為研究對象,利用Logistic回歸模型對高程、坡度、距道路最近距離、可燃物含水率、陸地表面溫度、歸一化植被指數(shù)、全局植被濕度指數(shù)進行訓(xùn)練,接受者操作特征(receiver operating characteristic,ROC)曲線下面積(area under ROC curve,AUC)值達到0.757。文獻[8]基于衛(wèi)星火點數(shù)據(jù)和氣象數(shù)據(jù),用Logistic回歸模型對浙江省林火變化趨勢和影響因子進行研究。文獻[9]運用加權(quán)Logistic回歸建立廣東省輸電走廊林火預(yù)警模型。另外,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)也在該領(lǐng)域得到應(yīng)用。文獻[10]收集歷史氣候數(shù)據(jù),采用BP神經(jīng)網(wǎng)絡(luò)進行預(yù)測。文獻[11]采用中分辨率成像光譜儀(moderate-resolution imaging spectroradiometer,MODIS)數(shù)據(jù),以西班牙加利西亞為研究對象,比較ANN和Logistic回歸模型在森林火災(zāi)評估中的優(yōu)劣,結(jié)果顯示二者的評估精度接近。
ANN本質(zhì)是一種擬合技術(shù),由于山火訓(xùn)練數(shù)據(jù)樣本只有0和1,所以模型評估結(jié)果大多落在0和1附近,而落在0.4~0.6之間的值很少[12]。Logistic回歸模型在山火評估領(lǐng)域中的應(yīng)用更加廣泛,因此本文基于Logistic回歸模型選取更加全面的山火評價因子對山火進行評估,并進行Person相關(guān)性分析,剔除冗余的評價因子。最后,將本文所提協(xié)同多因子山火風險評估方法與文獻[7,13-14]的方法對比,以驗證所提方法的優(yōu)越性。
云南省位于中國西南地區(qū),介于北緯21°8′~29°15′、東經(jīng)97°31′~106°11′之間。地形以山地、高原為主,山地面積占全省總面積的88.64%,森林覆蓋率達到65.04%。云南氣候基本屬于亞熱帶和熱帶季風氣候,這種氣候年溫差小、日溫差大,降水在空間和時間上分布也極不均勻。云南省的森林面積分布廣泛,而且氣候很容易引起山火,導(dǎo)致省內(nèi)山火頻繁,給電網(wǎng)設(shè)備等人民財產(chǎn)造成了重大損失。本文以云南省為研究區(qū)域,進行山火風險評估研究。
本文通過文獻調(diào)研,選取直接或間接的山火影響因子,數(shù)據(jù)集屬性見表1。
表1 數(shù)據(jù)集屬性Tab.1 Data set attributes
本文從地形、氣象、植被和人為因素4個方面選取山火影響因子,各個因子的詳細說明如下。
a)歷史火點數(shù)據(jù)來源于NASA網(wǎng)站MODIS傳感器偵測到的火點(https://firms.modaps.eosdis.nasa.gov/map/),根據(jù)云南省每天的歷史火點提取火點位置的17個山火評價因子,同時隨機選擇非火點,并提取非火點位置的17個山火評價因子。
b)地表溫度數(shù)據(jù)來源于3級水平MODIS地表溫度數(shù)據(jù)MOD11A1,此數(shù)據(jù)是具有1 km空間分辨率的正弦投影數(shù)據(jù)。地表溫度高的區(qū)域土壤水分少,植被干燥,容易發(fā)生山火;反之,地表溫度低的區(qū)域土壤水分相對多,不容易發(fā)生山火。
c)歸一化紅外指數(shù)(NDII7)來源于MODIS表面反射率數(shù)據(jù)系列,選取500 m空間分辨率、8 d時間分辨率的3級正弦投影數(shù)據(jù)。該數(shù)據(jù)具有7個波段,通過波段2和波段7計算得到NDII7遙感影像。NDII7小的區(qū)域植被含水率低,容易引起火災(zāi);反之,NDII7大的區(qū)域植被含水率高,不容易引起火災(zāi)。文獻[15]通過實驗和科學研究發(fā)現(xiàn),NDII7較小的干燥植被比NDII7較大的新鮮植被更容易發(fā)生燃燒。因此,本文用NDII7來表征可燃物的含水率。
d)歸一化指標指數(shù)(NDVI)采用全球MODIS植被指數(shù)數(shù)據(jù)提供的時空連續(xù)的植被監(jiān)測數(shù)據(jù)[16-17]。采用正弦投影和16 d合成的500 m空間分辨率的植被數(shù)據(jù),用于檢測植被狀態(tài)和土地覆蓋率變化情況。
e)高程數(shù)據(jù)描述一個地方的海拔高度,不同高程對山火發(fā)生的影響程度不一樣。高海拔的地方溫度比較低,空氣濕度大,發(fā)生山火的可能性比較低;反之,低海拔的地方溫度比較高,空氣濕度小,發(fā)生山火的可能性大[18]。
f)坡度描述地面的傾斜程度,受重力等因素的影響,坡度大的地方植被的保水能力小,水土流失比較嚴重,更容易發(fā)生山火。坡向描述一個地方的朝向,不同坡向決定著對陽光照射的接受程度,接受陽光多的坡向發(fā)生山火的可能性更高。根據(jù)高程,利用ARCGIS軟件的3D分析功能可得到研究區(qū)域的坡度和坡向。
g)距道路距離和距離居民的距離反映人為因素對山火的影響關(guān)系。距離道路和居民地近的地方,人類活動頻繁,容易引起山火;距離水體近的區(qū)域土壤濕度高,不容易引發(fā)山火[19]。
h)不同的土地類型對山火發(fā)生的影響程度不同,森林、灌木叢和覆蓋度高的草原更容易引發(fā)山火。
i)氣象對于山火的發(fā)生有重要的影響,選取降水量、空氣濕度、平均溫度、最小溫度、最大溫度、最大陣風風速、最大陣風風向7個氣象因子。氣象要素的精度對于山火評估有重要影響,文獻[20]使用基于ANUSPLIN的樣條插值方法對全國667個氣象站數(shù)據(jù)進行插值,利用1 667個加密站點對氣象插值結(jié)果進行準確性檢驗,并與反向距離權(quán)重法和普通克里金插值方法進行實驗對比,結(jié)果表明基于ANUSPLIN的樣條插值方法誤差最小。因此,本文選擇該方法對研究區(qū)域的125個氣象站獲得的氣象資料進行插值,得到整個研究區(qū)域的氣象數(shù)據(jù)。
本文提出的山火評估流程如圖1所示,評估模型為Logistic回歸模型,系統(tǒng)性能指標為AUC。
圖1 山火評估流程Fig.1 Wildfire assessment flow chart
Logistic回歸模型是線性回歸分析模型,常用于數(shù)據(jù)分析、金融、醫(yī)學等領(lǐng)域。通過Logistic回歸分析可以得到自變量的權(quán)重,輸出0~1之間概率值,模型根據(jù)結(jié)果是否大于0.5分類為0或1。本文基于山火影響因子,通過Logistic回歸模型計算山火風險概率,計算公式為:
(1)
z=β0+β1x1+β2x2+…+βnxn.
(2)
式(1)、(2)中:Pz為發(fā)生山火風險概率;β0為模型中常數(shù),表示方程的截距;n為自變量的個數(shù),這里表示山火影響因子個數(shù);xi(i=1,2,…,n)為山火影響因子種類,βi為模型中與xi對應(yīng)的變量參數(shù)。
ROC曲線可用于揭示敏感性(真正率)與特異性(假正率)之間的相互關(guān)系。通過設(shè)置連續(xù)變量的閾值,計算出敏感性a和b,以a為縱坐標、以(1-b)為橫坐標繪制而成的曲線即為ROC曲線。AUC可以評估預(yù)測模型的質(zhì)量,其值介于0.5~1:當AUC為0.5時,說明模型的預(yù)測效果很差,相當于隨機分類;當AUC接近1時,說明模型的預(yù)測效果很好。
相關(guān)性分析是研究模型自變量之間相關(guān)程度的分析,衡量2個自變量因素的相關(guān)密切程度,目的在于發(fā)掘自變量間的相關(guān)特性,是描述客觀事物相互間關(guān)系的密切程度并用適當?shù)慕y(tǒng)計指標表示出來的過程。
利用統(tǒng)計產(chǎn)品與服務(wù)解決方案(statistical product service solutions,SPSS)軟件分析火點評價因子的Person相關(guān)性,Person系數(shù)接近1時表示有強正相關(guān),接近-1時表示有強負相關(guān)。地表溫度與平均氣溫的相關(guān)性系數(shù)為0.607,平均氣溫與最低氣溫、最高氣溫的相關(guān)性系數(shù)分別為0.931、0.943,最低氣溫與最高氣溫的相關(guān)性系數(shù)為0.822。一般認為,相關(guān)性系數(shù)絕對值達到0.6即為高度相關(guān)[12],可利用逐步回歸剔除相關(guān)性系數(shù)高的其中一個因子。本文通過相關(guān)性分析,剔除平均氣溫、最低氣溫2個因子。
3.2.1 評價指標比較
本文提取MODIS和NPP信息中2018年和2019年所有遙感偵測到的植被大火火點的17個特征,整理得到29 442個樣本火點,同時選取相同數(shù)量的非火點樣本,最終數(shù)據(jù)集包含58 884個樣本,其中70%的樣本用于訓(xùn)練集,30%的樣本用于測試集。
用高程、坡度、坡向、植被覆蓋類型、距最近道路距離,距最近水體距離、距最近居民點距離、地表溫度、可燃物含水率、歸一化植被指數(shù)、降水量、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向15個因子來評估云南省山火,與文獻[7,13-14]的山火評估方法進行實驗對比,結(jié)果見表2。
表2 幾種山火評估方法AUC的對比Tab.3 AUC comparisons of different wildfire assessment methods
文獻[13]采用高程、坡度、坡向、植被覆蓋類型、距最近道路距離、距最近水體距離、距最近居民點距離7個評價因子來評估山火。本文方法計算得到的AUC達到0.80,與文獻[13]方法相比提升了0.16,說明地表溫度、可燃物含水率、歸一化植被指數(shù)、降水量、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向等因子能夠顯著提升評估效果。
文獻[14]采用高程、坡度、坡向、植被覆蓋類型、距最近道路距離,距最近水體距離、距最近居民點距離、地表溫度、可燃物含水率、歸一化植被指數(shù)10個評價因子來評估山火。與文獻[14]方法相比,本文方法計算得到的AUC提升了0.10,說明降水量、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向是評估山火的有效指標。
對比文獻[13]和文獻[14],文獻[14]方法考慮地表溫度、植被含水率和歸一化植被指數(shù)這3個影響因子,其AUC相比文獻[13]提升了0.06,說明這3個遙感特征用于評估云南省山火并不會出現(xiàn)冗余特征的現(xiàn)象。
文獻[7]在較大的時間尺度和省級空間尺度上進行森林火災(zāi)風險分區(qū)研究,基于Logistic回歸建立火災(zāi)風險評估模型,實驗結(jié)果顯示火災(zāi)分布與火災(zāi)影響因素之間具有很好的擬合度。但是文獻[7]只采用海拔、土地利用類型、土地表面溫度、歸一化植被指數(shù)和全局植被水分指數(shù)對火災(zāi)進行預(yù)測評估。本文雖然缺少全局植被水分指數(shù)數(shù)據(jù),但是引入了歸一化紅外指數(shù)來表征植被水分狀態(tài)。與文獻[7]方法相比,本文方法計算得到的AUC提升了0.11,可見氣象要素對于云南省山火評估有著重要作用。
測試集混淆矩陣見表3。從混淆矩陣可以得到:本文方法非火點的錯誤率為0.21,火點的錯誤率為0.19;文獻[13]方法非火點的錯誤率為0.34,火點的錯誤率為0.38;文獻[14]方法非火點的錯誤率為0.28,火點的錯誤率為0.33;文獻[7]方法非火點的錯誤率為0.28,火點的錯誤率為0.34。從預(yù)測準確性來看,本文選取的評價因子更具有優(yōu)勢。
表3 測試集混淆矩陣Tab.4 Test set confusion matrix
3.2.2 風險圖比較
選取不同評價因子,制作2018年1月17日的山火風險概率圖,并將概率按等區(qū)間劃分的原則劃分為極低、低、中等、高、極高5個等級,如圖2所示。0~0.2為山火發(fā)生概率極低;0.2~0.4為山火發(fā)生概率低;0.4~0.6為山火發(fā)生概率中;0.6~0.8為山火發(fā)生概率高;0.8~1為山火發(fā)生概率極高。從圖2來看,雖然大部分火點落在高風險的紅色區(qū)域和黃色區(qū)域,但是文獻[13]、文獻[14]和文獻[7]的山火風險概率圖中,云南省大部分區(qū)域都預(yù)測為紅色和黃色的高風險區(qū)域,與實際情況不符合。根據(jù)本文選取的15個評價因子預(yù)測得到的云南省山火風險概率圖中,大部分區(qū)域為低風險區(qū)域,而且大部分火點也處于山火發(fā)生概率高和極高的高風險區(qū)域,與實際情況相符。因此,可以采用本文的15個評價因子評估云南省的山火風險狀況,結(jié)合相應(yīng)的消防設(shè)施資源,做好撲救山火的準備。
圖2 選取不同評價因子時,云南省2018年1月17日的山火風險概率圖Fig.2 Wildfire risk probability in January 17, 2018 in Yunnan when selecting different evaluation factors
云南省的許多輸電線路工程需要穿越山嶺地帶,輸電線路容易受到山火的影響,引發(fā)電力事故,因此有必要進行山火風險評估的研究。為了有效進行山火風險評估,本文基于Logistic回歸模型,從地形、人為因素、遙感和氣象4個方面選取山火評價因子,選取高程、坡度、坡向、植被覆蓋類型、距最近道路距離,距最近水體距離、距最近居民點距離、地表溫度、可燃物含水率、歸一化植被指數(shù)、降水量、平均氣溫、最低氣溫、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向17個山火影響因子,并通過相關(guān)性分析剔除平均氣溫和最低氣溫2個冗余因子。實驗結(jié)果顯示,所選15個因子能全面、準確地評估云南省的山火狀況。本文選取的15個山火因子實質(zhì)上是針對山火的空間規(guī)律進行評估,未來可以研究從時間序列的角度出發(fā)進行山火評估。