張燁方 劉冰 馮真禎 朱彪2,
(1 福建省災(zāi)害天氣重點(diǎn)實(shí)驗(yàn)室,福州 350001; 2 中國(guó)氣象科學(xué)研究院災(zāi)害天氣國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100081;3 福建省氣象災(zāi)害防御技術(shù)中心,福州 350001)
雷電災(zāi)害的發(fā)生包含兩個(gè)組成部分,一是所在區(qū)域要有雷電閃絡(luò)發(fā)生,二是所在區(qū)域具有一定的承災(zāi)體,在荒無(wú)人煙的山區(qū)中,即使雷電閃絡(luò)再頻繁,其發(fā)生雷電災(zāi)害事件的概率比直接閃絡(luò)在居民區(qū)、工廠(chǎng)等人員活動(dòng)區(qū)域要低得多。福建省地形以山地為主,素有“八山一水一分田”之稱(chēng)[1],即福建省實(shí)際上只有2/10的區(qū)域是有人員活動(dòng)的地方,人類(lèi)活動(dòng)意味著雷電在這里的可能引起人員傷亡事故的發(fā)生,人類(lèi)活動(dòng)意味著該區(qū)域存在人類(lèi)生活、社會(huì)運(yùn)轉(zhuǎn)所必須的電氣、電子等雷電災(zāi)害敏感設(shè)備,也只有這些地方才有可能出現(xiàn)雷電災(zāi)害事件,在資源有限的環(huán)境下,應(yīng)該更注重對(duì)這些有人員活動(dòng)的區(qū)域有的放矢地開(kāi)展“靶向”型雷電災(zāi)害風(fēng)險(xiǎn)預(yù)警工作,避免一些不必要的預(yù)警信號(hào)或防御行動(dòng),可有效地降低雷電災(zāi)害防御成本,提高雷電災(zāi)害的防御效率。
在雷電災(zāi)害的防御領(lǐng)域,研究最多的是結(jié)合歷史雷電、雷災(zāi)、承災(zāi)體屬性等數(shù)據(jù),采用風(fēng)險(xiǎn)度模型和層次分析法等方法,建立雷電災(zāi)害風(fēng)險(xiǎn)區(qū)劃,再根據(jù)區(qū)劃結(jié)果進(jìn)行雷電災(zāi)害的風(fēng)險(xiǎn)管理,如顧媛等選用地閃密度和強(qiáng)度作為致災(zāi)要素,對(duì)浙江省地閃特征及致災(zāi)危險(xiǎn)性進(jìn)行評(píng)估和分析[2];馬虹旭等人結(jié)合遼寧省GDP及人口數(shù)據(jù),采用AHP法、風(fēng)險(xiǎn)矩陣等方法分析了遼寧省閃電活動(dòng)時(shí)空特征,得出10 km×10 km網(wǎng)格區(qū)域雷電易發(fā)等級(jí)及應(yīng)對(duì)等級(jí)[3]; 趙生昊等利用閃電監(jiān)測(cè)資料及該區(qū)域數(shù)字高程模型,研究了雷電災(zāi)害兩種主要致災(zāi)因子(閃電密度、強(qiáng)度)與3類(lèi)地形因素(海拔高度、坡度、坡向)之間的關(guān)系[4];馬明等研究認(rèn)為重大雷災(zāi)傷亡事件直接與承災(zāi)體的脆弱性有關(guān)[5]。本文結(jié)合致災(zāi)體(雷電)的密度分布規(guī)律,使用高分辨率的遙感影像瓦片作為判斷某個(gè)區(qū)域是否屬于人員活動(dòng)的基礎(chǔ),采用卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,對(duì)大批量的遙感影像瓦片進(jìn)行有、無(wú)人員活動(dòng)的類(lèi)別劃分,以福建省為例對(duì)該方法進(jìn)行了例算,得到可應(yīng)用于實(shí)際業(yè)務(wù)的精細(xì)化雷電承災(zāi)體地理信息圖層,通過(guò)圖層的疊加分析,得出實(shí)際可能導(dǎo)致雷電災(zāi)害的有效致災(zāi)雷電的分布規(guī)律。
以谷歌地圖開(kāi)放的最新遙感影像圖片為這個(gè)圖片區(qū)域是否有人員活動(dòng)的識(shí)別依據(jù),下載福建省L17級(jí)別的所有遙感影像瓦片,每張瓦片大小為256×256像素,實(shí)際長(zhǎng)寬約500~600 m,三通道彩色圖片,空間分辨率2.39 m/像素,共754722張圖片,約150 GB,瓦片時(shí)間為2016年左右,規(guī)定以瓦片中心點(diǎn)的經(jīng)緯度值代表該瓦片的坐標(biāo)信息,具體示例如圖1所示。
圖1 遙感影像瓦片圖片示例:(a)典型有人員活動(dòng),(b)典型無(wú)人員活動(dòng)1,(c)典型無(wú)人員活動(dòng)2
谷歌地圖的歷史數(shù)據(jù)為2016年,距離現(xiàn)在的區(qū)域變動(dòng)情況在瓦片精度范圍內(nèi)(500~600 m)大致可以忽略,考慮論文研究的內(nèi)容與精度,采用谷歌地圖的歷史遙感影像可以滿(mǎn)足研究需求。
對(duì)于人員活動(dòng)屬性圖層的獲取,雖然可以使用鄉(xiāng)(鎮(zhèn))級(jí)別的地理信息地圖替代,但由于鄉(xiāng)(鎮(zhèn))級(jí)別的地理信息數(shù)據(jù)為點(diǎn)或面的矢量格式,精度較差(粗略按每個(gè)鄉(xiāng)鎮(zhèn)面積70 km2計(jì)算,假設(shè)鄉(xiāng)鎮(zhèn)為正方形形狀,取其邊長(zhǎng)≈8.4 km為精度。),且一個(gè)鄉(xiāng)鎮(zhèn)的行政區(qū)劃內(nèi)并非所有區(qū)域都有人員活動(dòng),因此要保證承災(zāi)體具有較好的識(shí)別效果,選取一定大小(邊長(zhǎng)≈0.5 km)的遙感影像瓦片進(jìn)行識(shí)別是較好的途徑。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種專(zhuān)門(mén)用來(lái)處理類(lèi)似網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)[6],是當(dāng)前發(fā)展和應(yīng)用最為迅速和廣泛的人工智能圖像處理模型,它采用具有一定大小、包含權(quán)重矩陣的格點(diǎn)網(wǎng)(卷積核,也有稱(chēng)過(guò)濾器)對(duì)輸入圖像逐個(gè)位置進(jìn)行掃描和卷積,利用卷積實(shí)變函數(shù)運(yùn)算實(shí)現(xiàn)對(duì)圖像局部特征的信息提取并保存在權(quán)重矩陣中,加上中間添加的非線(xiàn)性激活函數(shù),使整個(gè)神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)和非線(xiàn)性處理能力,實(shí)踐表明該計(jì)算方式可以很好地獲取到圖片的總體與局部特征[7-10],其一般流程是對(duì)輸入的多通道圖像經(jīng)過(guò)多次的卷積、池化操作,提取到圖像深層次的高維特征,再將卷積、池化操作后的矩陣展開(kāi)、拼接成獨(dú)立列向量,經(jīng)過(guò)一定層數(shù)的神經(jīng)網(wǎng)絡(luò)層計(jì)算后,根據(jù)需求輸出對(duì)輸入圖像某一種類(lèi)別屬性的預(yù)測(cè)結(jié)論,例如判斷輸入的圖像是哪一種動(dòng)物、哪一個(gè)數(shù)字等,其模型示意如圖2所示。
圖2 卷積神經(jīng)網(wǎng)絡(luò)模型示意
根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn),將遙感影像瓦片作為卷積神經(jīng)網(wǎng)絡(luò)的待預(yù)測(cè)圖像,經(jīng)過(guò)一定層數(shù)的卷積神經(jīng)網(wǎng)絡(luò)后輸出對(duì)該遙感影像瓦片是否屬于人員活動(dòng)區(qū)域的屬性進(jìn)行分類(lèi)和判斷。754722張遙感影像瓦片,隨機(jī)抽取任意一張瓦片,由人工對(duì)瓦片是否屬于人員活動(dòng)區(qū)域進(jìn)行辨識(shí)(典型圖片如圖1所示)??紤]安全最大化原則,規(guī)定只要瓦片內(nèi)有出現(xiàn)人員活動(dòng)的區(qū)域,不管該區(qū)域大小,都認(rèn)為該瓦片屬于人員活動(dòng)區(qū)域;規(guī)定一些無(wú)法完全確認(rèn)的瓦片,也按該瓦片屬于人員活動(dòng)區(qū)域的原則進(jìn)行判定。循環(huán)重復(fù)上述操作,最后得到3000張人員活動(dòng)區(qū)域瓦片、3000張無(wú)人員活動(dòng)區(qū)域瓦片,由于卷積神經(jīng)網(wǎng)絡(luò)在處理圖片時(shí)是將圖片轉(zhuǎn)換成二維矩陣來(lái)處理的,所有同一張圖片、經(jīng)過(guò)角度旋轉(zhuǎn)后得到的矩陣是不一樣的,因此可以通過(guò)對(duì)圖片的旋轉(zhuǎn)來(lái)實(shí)現(xiàn)訓(xùn)練樣本擴(kuò)容,即對(duì)得到的6000張瓦片進(jìn)行批量90°、180°、270°的旋轉(zhuǎn),得到18000張旋轉(zhuǎn)后的瓦片,與原6000張瓦片組合一起,作為訓(xùn)練樣本數(shù)據(jù),即最終有24000張的樣本圖片。
針對(duì)本文涉及的遙感影像瓦片雷電承災(zāi)體屬性識(shí)別問(wèn)題,采用谷歌人工智能深度學(xué)習(xí)類(lèi)庫(kù)(tensorflow)為框架,設(shè)計(jì)如圖3所示的CNN網(wǎng)絡(luò)結(jié)構(gòu),整個(gè)CNN網(wǎng)絡(luò)包含了11層卷積、5層池化、2層全連接,最后以一個(gè)0、1二分類(lèi)結(jié)果表示輸出,其中每個(gè)卷積、全連接層的后面使用RELU激活函數(shù)進(jìn)行一次的非線(xiàn)性激活函數(shù)計(jì)算,每個(gè)卷積濾波器設(shè)計(jì)網(wǎng)格為3×3,步長(zhǎng)為1,邊界自動(dòng)填充模式,每層的通道數(shù)設(shè)計(jì)如圖3所示,兩個(gè)全連接層神經(jīng)單元個(gè)數(shù)分別為1000、500,模型參數(shù)選擇與設(shè)計(jì)如表1所示,設(shè)定模型訓(xùn)練過(guò)程中準(zhǔn)確率最好的參數(shù)矩陣保存作為最終訓(xùn)練結(jié)果。
表1 訓(xùn)練模型參數(shù)(方法)取值表
圖3 遙感影像雷電承災(zāi)體屬性識(shí)別CNN模型示意
按上述方法與規(guī)則對(duì)模型進(jìn)行訓(xùn)練,繪制整個(gè)訓(xùn)練過(guò)程的損失(loss)與準(zhǔn)確率(accu)曲線(xiàn),如圖4所示。由圖4可知,損失曲線(xiàn)下降的速度適均,沒(méi)有出現(xiàn)損失急轉(zhuǎn)下降或損失下降曲線(xiàn)過(guò)于平緩的情況,說(shuō)明模型設(shè)計(jì)的初始學(xué)習(xí)率可行;經(jīng)過(guò)100次訓(xùn)練后,測(cè)試準(zhǔn)確率就已基本達(dá)到并保持在98.9%,測(cè)試集與訓(xùn)練集的損失、準(zhǔn)確率曲線(xiàn)基本貼合,訓(xùn)練后期也沒(méi)有出現(xiàn)明顯分開(kāi)的表明過(guò)擬合的現(xiàn)象,也說(shuō)明按論文設(shè)計(jì)的訓(xùn)練數(shù)據(jù)提取、遴選方法可行,模型具有一定的穩(wěn)定性和準(zhǔn)確性。
圖4 模型訓(xùn)練損失(a)、準(zhǔn)確率(b)曲線(xiàn)
使用訓(xùn)練得到的模型對(duì)福建省754722張遙感瓦片逐張進(jìn)行是否屬于人員活動(dòng)區(qū)域預(yù)測(cè),將得到數(shù)據(jù)加載在A(yíng)rcGis上,并格式化為柵格格式,按福建省行政邊界裁剪后繪圖如圖5所示,為了檢驗(yàn)本文設(shè)計(jì)及訓(xùn)練的CNN模型準(zhǔn)確率是否能達(dá)到精度要求(令CNN錯(cuò)誤率p0不得高于0.001%),對(duì)總體754722張遙感瓦片及其預(yù)測(cè)結(jié)論進(jìn)行如下的數(shù)理假設(shè)檢驗(yàn):
圖5 福建省人員活動(dòng)區(qū)域
H0:p≤p0
H1:p>p0
隨機(jī)抽取120張瓦片,由人工對(duì)該瓦片的屬性按論文2.2的規(guī)則進(jìn)行辨識(shí),將辨識(shí)結(jié)果與CNN卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)得到的結(jié)果進(jìn)行比對(duì),經(jīng)查驗(yàn)在120張的瓦片樣本中CNN有1張瓦片預(yù)測(cè)錯(cuò)誤,設(shè)Xi為第i次抽取的樣本,i=1,2,…,120,Xi=1為預(yù)測(cè)錯(cuò)誤,Xi=0為預(yù)測(cè)準(zhǔn)確,取顯著性水平α=0.01,有:
查標(biāo)準(zhǔn)正態(tài)分布表得
u1-α=u0.99=2.326>1.003
接受假設(shè),即認(rèn)為本文設(shè)計(jì)的基于CNN卷積神經(jīng)網(wǎng)絡(luò)的遙感影像人員活動(dòng)屬性的分類(lèi)模型在顯著性水平α=0.01時(shí),預(yù)測(cè)錯(cuò)誤率低于0.001%。
根據(jù)福建省CNN卷積神經(jīng)網(wǎng)絡(luò)的遙感影像人員活動(dòng)屬性的預(yù)測(cè)結(jié)果,福建省行政區(qū)域范圍內(nèi)共有190724張遙感瓦片被識(shí)別為無(wú)人員活動(dòng)區(qū)域,114208張瓦片被識(shí)別為人員活動(dòng)區(qū)域,無(wú)人員活動(dòng)的瓦片比為63.55%,由圖5可看出,福建省沿海地區(qū)的人員活動(dòng)密度較大,而其他區(qū)域特別是西北位置人員活動(dòng)密度較小,這與文獻(xiàn)[1]介紹福建省75%為中、低山地形較為一致(福建省海拔800 m以上的中山和500~800 m的低山,占全省面積的75%,主要分布于閩西、閩中和閩東北地區(qū)。)也從另一個(gè)角度證明本文設(shè)計(jì)模型的可行性。
對(duì)福建省2004—2019年的閃電定位監(jiān)測(cè)數(shù)據(jù)按遙感瓦片的柵格位置進(jìn)行年均頻次統(tǒng)計(jì)(圖6),根據(jù)圖5中有無(wú)人員活動(dòng)區(qū)域的柵格對(duì)圖6進(jìn)行分離剖析,得到雷電落在在無(wú)人員活動(dòng)區(qū)域(圖7)和雷電落在有人員活動(dòng)區(qū)域(圖8)的頻次分布情況,結(jié)果表明,共有291770次閃電閃絡(luò)在無(wú)人的區(qū)域,有351482次閃電閃絡(luò)在人員活動(dòng)的地方,也就是說(shuō)有45.36%的閃電是雷電災(zāi)害的“無(wú)用功”,在圖8中,人員活動(dòng)區(qū)域雷電密度較大的地方主要集中在福建省中部、中東部,這與歷福建省雷電災(zāi)害事故的地區(qū)分布情況較為一致[11-13]。
圖6 2004—2012年福建省年均閃電密度
圖7 2004—2012年福建省閃絡(luò)在非人員活動(dòng)區(qū)域的閃電密度
圖8 2004—2012年福建省閃絡(luò)在人員活動(dòng)區(qū)域的閃電密度
以福建省縣級(jí)行政區(qū)劃為單位,分別統(tǒng)計(jì)福建省各個(gè)縣2004—2012年雷擊人員傷亡數(shù)除以2012年各個(gè)縣人口總數(shù)(萬(wàn)人)、福建省各個(gè)縣2004—2012年年均雷擊密度、福建省各個(gè)縣2004—2012年年均有效致災(zāi)雷擊密度(即只統(tǒng)計(jì)閃絡(luò)在有人員活動(dòng)格點(diǎn)的雷擊數(shù)),部分結(jié)果如表2所示。
分別計(jì)算雷擊人員傷亡數(shù)與年均雷擊密度、年均有效致災(zāi)雷擊密度的線(xiàn)性相關(guān)性,得相關(guān)系數(shù)分別為0.073、0.116,有效致災(zāi)雷擊密度與雷擊人員傷亡的相關(guān)程度明顯高于常規(guī)意義年均雷擊密度與雷擊人員傷亡的相關(guān)性,可見(jiàn)一個(gè)地區(qū)有效致災(zāi)雷擊次數(shù)對(duì)該地區(qū)雷電災(zāi)害風(fēng)險(xiǎn)具有更科學(xué)的指示意義,特別在福建這樣的多山區(qū)、丘陵省份,一些人員活動(dòng)較少的縣市常規(guī)雷擊密度與有效致災(zāi)雷擊密度的差值較大,如表2中仙游縣常規(guī)年均雷擊密度12.4766次/(a·km2),經(jīng)處理后的年均有效致災(zāi)雷擊密度僅4.75853次/(a·km2),有很大一部分雷電并沒(méi)有落在人員活動(dòng)區(qū)域,對(duì)雷擊人員傷亡事件的關(guān)聯(lián)性也相應(yīng)降低或消失,因此采用有效致災(zāi)雷擊密度可以更好地反映和預(yù)測(cè)雷擊人員傷亡事件的發(fā)生。
表2 2004—2012年福建省部分縣雷擊人員傷亡/區(qū)域人口總數(shù)、年均雷擊密度、年均有效致災(zāi)雷擊密度
上述的討論的結(jié)果表明,在探測(cè)到所有雷電中,只有一半左右的落雷是可能引起雷電災(zāi)害事故的情況,氣象部門(mén)和政府相關(guān)防汛救援機(jī)構(gòu)應(yīng)更注重于對(duì)這些落在人員活動(dòng)區(qū)域“有效”雷電的預(yù)警和救援,同理于其他的致災(zāi)天氣(如暴雨、臺(tái)風(fēng)等),關(guān)注人員活動(dòng)區(qū)域與災(zāi)害性天氣的結(jié)合點(diǎn)是提高氣象預(yù)警、政府決策服務(wù)效果的可行性途徑,也有助于有限的救災(zāi)資源(例如精準(zhǔn)區(qū)域、時(shí)間發(fā)送短信對(duì)比大面積發(fā)送短信所帶來(lái)時(shí)效性提高與費(fèi)用降低的效果)能及時(shí)、有效地、精準(zhǔn)地投放到必要的區(qū)域[14]。
本文所得到的人員活動(dòng)屬性格點(diǎn)化數(shù)據(jù)作為新開(kāi)發(fā)的雷電災(zāi)害影響預(yù)警產(chǎn)品的承災(zāi)體信息,將雷電臨近預(yù)警的格點(diǎn)化產(chǎn)品與雷電承災(zāi)體屬性網(wǎng)格進(jìn)行柵格乘積計(jì)算,得到未來(lái)可能發(fā)生雷電、且該位置存在人員活動(dòng)的柵格圖層,可認(rèn)為是未來(lái)可能發(fā)生雷電災(zāi)害的柵格集合,已作為雷電影響預(yù)警產(chǎn)品進(jìn)入業(yè)務(wù)使用,相比常規(guī)提供雷電臨近預(yù)警的產(chǎn)品而言,疊加了人員活動(dòng)屬性的雷電影響預(yù)警在災(zāi)害防御方面更具有指向性,是當(dāng)前嘗試開(kāi)展氣象災(zāi)害影響預(yù)警工作的一次有益探索。
本文利用卷積神經(jīng)網(wǎng)絡(luò)建立、訓(xùn)練了遙感影像人員活動(dòng)屬性識(shí)別的數(shù)學(xué)模型,對(duì)福建省L17級(jí)的所有遙感影像瓦片利用該模型進(jìn)行了預(yù)測(cè)、假設(shè)檢驗(yàn)和繪圖,將得到的結(jié)果與福建省歷史雷電數(shù)據(jù)進(jìn)行了疊加分析,得到福建省雷電災(zāi)害有效影響雷電的次數(shù)和分布情況以及有效雷擊密度相比常規(guī)雷擊密度在雷電災(zāi)害事故發(fā)生上具有更好的相關(guān)性和指示意義,利用福建省人員活動(dòng)屬性的格點(diǎn)圖層結(jié)合雷電預(yù)警、預(yù)警結(jié)果開(kāi)發(fā)了雷電災(zāi)害影響預(yù)警產(chǎn)品,為開(kāi)展精細(xì)化、靶向服務(wù)的雷電災(zāi)害預(yù)警服務(wù)提供必要的基礎(chǔ)研究和數(shù)據(jù)支撐。
采用卷積神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)遙感影像瓦片進(jìn)行的有效致災(zāi)雷電分析是當(dāng)前“人工智能+大數(shù)據(jù)”浪潮背景下應(yīng)用“人工智能+大數(shù)據(jù)”開(kāi)展災(zāi)害風(fēng)險(xiǎn)分析、精細(xì)化預(yù)警及靶向救援服務(wù)的嘗試性研究,隨著“人工智能+大數(shù)據(jù)”技術(shù)及計(jì)算機(jī)硬件設(shè)備的不斷發(fā)展,探索基于大數(shù)據(jù)的氣象預(yù)警、應(yīng)急救援、災(zāi)害分析研究是目前提升綜合防災(zāi)減災(zāi)能力的有效途徑,采用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別遙感影像瓦片來(lái)提取災(zāi)害天氣下墊面屬性的方法除了用于分析有效致災(zāi)雷電的分布情況外,實(shí)際業(yè)務(wù)工作中也逐步被應(yīng)用到雷電災(zāi)害影響預(yù)警及其他災(zāi)害性天氣應(yīng)急減災(zāi)支持上[15]。
要提取遙感影像瓦片中更多有效信息,需要使用到更高等級(jí)的影像瓦片和分析模型,這將需要龐大的硬盤(pán)空間、數(shù)據(jù)索引、模型結(jié)構(gòu),從目前的情況來(lái)看,L17級(jí)的瓦片識(shí)別有無(wú)人員活動(dòng)屬性是比較折中的處理結(jié)果。