謝非凡 張世濤 黃威
摘? 要: 通過C#編程語言與ArcEngine開發(fā)引擎編寫一種BP神經(jīng)網(wǎng)絡(luò)的滑動窗口算法,實(shí)現(xiàn)活躍火頻次預(yù)測。對中南半島五國活躍火進(jìn)行建模,預(yù)測2020年活躍火頻次并與實(shí)際對比。經(jīng)過多次迭代實(shí)驗(yàn),結(jié)果表明,模型程序在誤差小于0.8或?qū)W習(xí)訓(xùn)練次數(shù)大于8000作為單次結(jié)束條件時具有優(yōu)良的預(yù)測效果。
關(guān)鍵詞: 神經(jīng)網(wǎng)絡(luò); 活躍火; 機(jī)器學(xué)習(xí); 中南半島
中圖分類號:TP399.4? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ?文章編號:1006-8228(2023)09-124-05
Research and implementation of BP neural network sliding window algorithm
in active fire spatiotemporal prediction model
Xie Feifan, Zhang Shitao, Huang Wei
(Faculty of Land and Resources, Kunming University of Science and Technology, Kunming, Yunnan 650000, China)
Abstract: A sliding window algorithm for BP neural networks is developed using C# programming language and ArcEngine development engine to predict active fire frequency. Active fires in five countries on Indochina Peninsula are modeled to predict the frequency of active fires in 2020 and compare with the actual situation. The results of several iterations show that the model program has a good prediction effect when the error is less than 0.8 or the number of learning training is more than 8000 as a single end condition.
Key words: neural network; active fire; machine learning; Indochina Peninsula
0 引言
活躍火(Active fire)是全球生態(tài)系統(tǒng)碳循環(huán)的重要因素,亦是影響大氣污染、公共安全、生物多樣性等重要因素之一。活躍火在地球表面的大部分地區(qū)均產(chǎn)生重要的生態(tài)作用,是全球氣候變化與森林生態(tài)系統(tǒng)反饋的關(guān)鍵因子[1-2]。熱帶活躍火在全球的發(fā)生頻率日益加劇,已對全球陸生、水生和大氣系統(tǒng)造成重大影響[3]。 在微觀尺度上,活躍火通過植被燃燒、溫度升高改變土壤的理化性質(zhì),直接影響植被生長[4-5],從而改變植被和土壤的結(jié)構(gòu)和組成[6]。全球每年由火災(zāi)引起的碳排放量可達(dá)2~4Pa,是每年化石燃料的50%。因此,預(yù)估和預(yù)測活躍火,對大氣環(huán)境治理及檢測評估等具有重要的參考價值[7]。中南半島山區(qū)歷來有刀耕火種的農(nóng)業(yè)耕作傳統(tǒng),且山地移民的增加又進(jìn)一步提高了刀耕火種的利用強(qiáng)度,從而加劇了植被焚燒與森林野火的發(fā)生概率[8-9]。美國火災(zāi)信息資源管理系統(tǒng)(FIRMS)提供了近乎實(shí)時的活躍火位置矢量產(chǎn)品數(shù)據(jù),已被各個領(lǐng)域研究者廣泛應(yīng)用[10]。其數(shù)據(jù)質(zhì)量得到了廣泛的認(rèn)可,但在挖掘此矢量數(shù)據(jù)信息時,研究人員更多的是在統(tǒng)計分析層面來解析數(shù)據(jù),缺乏更為深層次的數(shù)據(jù)挖掘方法與技術(shù)手段[11-15]。因此從時間和空間上建模進(jìn)而預(yù)測是非常有意義和有必要的。
目前BP神經(jīng)網(wǎng)絡(luò)已經(jīng)在許多領(lǐng)域得到應(yīng)用,理論上BP神經(jīng)網(wǎng)絡(luò)可以逼近任何復(fù)雜的函數(shù)[16-17]。技術(shù)人員和研究人員設(shè)計的神經(jīng)網(wǎng)絡(luò)算法模型對火災(zāi)的預(yù)測需要大量的火災(zāi)影響因子數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)[18-19],小區(qū)域研究范圍內(nèi)的研究取得了不錯的預(yù)測效果,但針對大區(qū)域面積的研究時,獲取各種相關(guān)因素數(shù)據(jù)存在許多困難。因此本文提出一種次優(yōu)的基于BP神經(jīng)網(wǎng)絡(luò)的滑動窗口算法對東南亞活躍火頻次進(jìn)行預(yù)測。本文相關(guān)研究成果可以對大尺度空間范圍活躍火進(jìn)行預(yù)測評估,希望能為同行提供參考,為活躍火相關(guān)因子評估分析提供科學(xué)的啟發(fā)與思考。
1 源數(shù)據(jù)整理
從NASA FIRMS分別下載了中南半島五國(柬埔寨,老撾、緬甸、泰國、越南)2000年至2020年的MODIS與VIIRS活躍火矢量數(shù)據(jù)。MODIS的歷史數(shù)據(jù)更加充足,更加的有利于下文的神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)建模,剔除MODIS數(shù)據(jù)缺失的時間段,最終選用MODIS產(chǎn)品2010年至2020年的數(shù)據(jù)作為我們的研究源數(shù)據(jù),通過GIS軟件強(qiáng)大的空間數(shù)據(jù)統(tǒng)計分析能力做了初步的統(tǒng)計處理,統(tǒng)計表如表1所示。
據(jù)統(tǒng)計,2010年至2020年間柬埔寨活躍火頻次總數(shù)達(dá)3.80591×105次,老撾達(dá)4.42116×105次,緬甸達(dá)6.97154×105次,泰國達(dá)3.04636×105次,越南達(dá)2.09489×105次。緬甸活躍火每年頻次總數(shù)均大于其他四國,且走勢較為陡峭,在2010年達(dá)到峰值,其他四國數(shù)據(jù)波動較為平緩,越南每年活躍火頻次均低于其他四國。在2010至2011年中南半島各國活躍火頻次均在降低,在2018年至2019年均在上升,我們認(rèn)為可能是某種大環(huán)境因素導(dǎo)致其同步變化(圖1)。11年間柬埔寨活躍火總頻次密度約為1.4074次/km2,老撾約為1.3527次/km2,緬甸約為0.8469次/km2,泰國約為0.4364次/km2,越南約為0.4198次/km2。在密度分布上柬埔寨、老撾、緬甸走勢較為陡峭,越南與泰國較為平緩,其數(shù)據(jù)的平滑性更有利于下文神經(jīng)網(wǎng)絡(luò)在時間序列的函數(shù)擬合(圖2)。
通過整理發(fā)現(xiàn)柬埔寨活躍火頻次密集時間段在每年的1月、2月、3月、12月,老撾活躍火頻次密集時間段在3月和4月,緬甸集中在2月、3月、4月,泰國集中在1月、2月、3月、4月、12月較為平滑,泰國集中在2月、3月、4月。根據(jù)這一數(shù)據(jù)特征,可以將每個國家的數(shù)據(jù)按此特征分為兩組作為滑動窗口神經(jīng)網(wǎng)絡(luò)算法的處理數(shù)據(jù)集,目的是為了訓(xùn)練的數(shù)據(jù)集在數(shù)據(jù)上更加的平滑,為BP算法計算各參數(shù)值時減輕負(fù)擔(dān)。
2 數(shù)據(jù)構(gòu)型
火災(zāi)的發(fā)生有人為因素和自然因素,火災(zāi)是一個復(fù)雜的物理過程,選用具有處理復(fù)雜非線性問題的BP神經(jīng)網(wǎng)絡(luò)模型建立其預(yù)測模型是非常必要的。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),在小尺度空間范圍時,據(jù)有關(guān)實(shí)驗(yàn)表明,其在諸多領(lǐng)域具有良好的預(yù)測效果,但面對大尺度空間范圍時,往往會因?yàn)閿?shù)據(jù)的收集困難導(dǎo)致實(shí)驗(yàn)難以繼續(xù),或因數(shù)據(jù)不足導(dǎo)致訓(xùn)練效果較差,實(shí)驗(yàn)誤差大。因此我們采用本文提出的次優(yōu)的基于滑動窗口神經(jīng)網(wǎng)絡(luò)算法,分別對中南半島的柬埔寨,老撾、緬甸、泰國、越南五個國家數(shù)據(jù)進(jìn)行了總量的預(yù)測和分網(wǎng)格的預(yù)測,采用局部和整體混合驗(yàn)證模型,以保其精確度。
2.1 BP神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是對人腦神經(jīng)工作過程進(jìn)行抽取模擬出的,類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型。BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)包括輸入層、輸出層和多個隱層,BP算法的學(xué)習(xí)過程,由信息的正向傳播和誤差的反向傳播兩個過程組成。理論上隱層只要足夠多就可以逼近任意復(fù)雜的非線性函數(shù)。三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
神經(jīng)網(wǎng)絡(luò)中的訓(xùn)練或者學(xué)習(xí),旨在求解所要解決問題的網(wǎng)絡(luò)模型中的參數(shù),這些參數(shù)包括神經(jīng)元之間的連接權(quán)重(w1,w2..wxm)以及偏置等,偏置的存在可以更好的擬合數(shù)據(jù)。根據(jù)不同的實(shí)際問題,設(shè)計者所構(gòu)造出來的網(wǎng)絡(luò)模型是不同的,為了求出這些參數(shù),往往需要算法進(jìn)行學(xué)習(xí)和訓(xùn)練來迭代找出最優(yōu)的參數(shù),BP算法就是現(xiàn)在應(yīng)用最為廣泛的和成功的算法之一[20]。
2.2 數(shù)據(jù)設(shè)計
本實(shí)驗(yàn)首先對柬埔寨,老撾、緬甸、泰國五個國家活躍火數(shù)據(jù)按月進(jìn)行統(tǒng)計標(biāo)記,統(tǒng)計完成后按時間序列進(jìn)行滑動窗口數(shù)據(jù)設(shè)計,以此形成一種次優(yōu)的基于滑動窗口神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練學(xué)習(xí)。訓(xùn)練數(shù)據(jù)組織排列方式如下:
[x1x2x3x4x5x2x3x4x5x6……………xn-4xn-3xn-2xn-1xn] ⑴
X1至Xn為每個國家按月統(tǒng)計的活躍火頻次數(shù)據(jù),按照以上數(shù)據(jù)排列方式進(jìn)行訓(xùn)練,值得注意的是此處的滑動窗口設(shè)計的數(shù)據(jù)列數(shù)可以根據(jù)實(shí)際需求調(diào)整,未來輸出的個數(shù)來決定。研究區(qū)按(10km×10km)劃分格網(wǎng),每個格網(wǎng)里以月為單位統(tǒng)計活躍火頻次,以每個格網(wǎng)為單位進(jìn)行訓(xùn)練學(xué)習(xí),預(yù)測出每個格網(wǎng)的結(jié)果,對每個國家的結(jié)果進(jìn)行累加,與整體的預(yù)測結(jié)果進(jìn)行對比驗(yàn)證小于閾值時輸出結(jié)果。
3 模型
3.1 模型設(shè)計
本預(yù)測模型需要通過GIS軟件進(jìn)行初步的數(shù)據(jù)統(tǒng)計與整理,篩選出時間與空間數(shù)據(jù)序列,其次將統(tǒng)計后的數(shù)據(jù)作為預(yù)測模型的輸入數(shù)據(jù),預(yù)測模型核心利用.NET Framework框架通過c#(sharp)編程語言與ArcEngine開發(fā)引擎編寫而成,神經(jīng)網(wǎng)絡(luò)搭配使用AForge.NET庫。AForge.NET主要用于計算機(jī)視覺、人工智能、機(jī)器學(xué)習(xí)、圖像處理、機(jī)器人等領(lǐng)域。一種次優(yōu)的基于滑動窗口神經(jīng)網(wǎng)絡(luò)算法對東南亞活躍火頻次進(jìn)行預(yù)測,極大的降低了對多元數(shù)據(jù)的要求,擴(kuò)大了其應(yīng)用場景與廣度。通過以上數(shù)據(jù)的整理構(gòu)建東南亞活躍火頻次預(yù)測模型,通過交叉驗(yàn)證的方法對網(wǎng)絡(luò)訓(xùn)練進(jìn)行進(jìn)一步的控制以提高預(yù)測精度。中南半島活躍火頻次預(yù)測模型包含對原始數(shù)據(jù)整體的時間序列整理,對劃分網(wǎng)格后的各網(wǎng)格內(nèi)活躍火頻次按時間序列整理,對神經(jīng)網(wǎng)絡(luò)模型的建立,對兩次預(yù)測模型的閾值設(shè)置與評判。BP神經(jīng)網(wǎng)絡(luò)的建立包括對原始數(shù)據(jù)的歸一化處理、初始化權(quán)重、激活函數(shù)的選擇、網(wǎng)絡(luò)模型的構(gòu)建、網(wǎng)絡(luò)訓(xùn)練。中南半島活躍火頻次預(yù)測模型構(gòu)架圖如圖4所示。
3.2 模型實(shí)驗(yàn)與結(jié)果
本文通過中南半島活躍火頻次預(yù)測模型在時間上以時間序列月為單位組織數(shù)據(jù)結(jié)構(gòu),在空間上通過格網(wǎng)10km*10km進(jìn)行劃分,在統(tǒng)計數(shù)據(jù)的基礎(chǔ)上應(yīng)用模型對2020年實(shí)際數(shù)據(jù)與模型的輸出數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)對比。數(shù)據(jù)每個格網(wǎng)的時間尺度序列數(shù)據(jù)為輸入,將結(jié)果和實(shí)際值及誤差數(shù)據(jù)通過GIS軟件可視化出圖。統(tǒng)計每個格網(wǎng)的實(shí)際值,根據(jù)2020年活躍火頻次數(shù)量填充格網(wǎng)顏色得到活躍火頻次圖(圖5),通過模型預(yù)測的頻次數(shù)量統(tǒng)計得2020年活躍火預(yù)測頻次圖、誤差圖(圖6、圖7),實(shí)驗(yàn)表明該模型有較好的穩(wěn)定性、準(zhǔn)確性??蔀榇蟪叨鹊幕钴S火預(yù)測評估提供科學(xué)的數(shù)據(jù)支撐。
4 結(jié)束語
本文對中南半島五國2020年活躍火進(jìn)行建模預(yù)測并與實(shí)際對比,單格網(wǎng)內(nèi)誤差絕對最大為8。經(jīng)過多次迭代實(shí)驗(yàn)測試結(jié)果表明,單個格網(wǎng)模型程序在誤差小于0.8或者學(xué)習(xí)訓(xùn)練次數(shù)大于8000作為單次結(jié)束條件具有優(yōu)良的預(yù)測效果。值得注意的是,在做參數(shù)優(yōu)化時誤差不能設(shè)定的太小,作者在參考其他學(xué)者的研究時發(fā)現(xiàn),有學(xué)者將其設(shè)置為很小,這可能會導(dǎo)致程序假死陷入無線循環(huán)導(dǎo)致無法結(jié)束。一種次優(yōu)的基于滑動窗口神經(jīng)網(wǎng)絡(luò)算法設(shè)計目的是在沒有相關(guān)因子情況下,科學(xué)的對數(shù)據(jù)未來趨勢進(jìn)行預(yù)測評估,是一種適用于空間大尺度區(qū)域的預(yù)測算法,是一種適應(yīng)于實(shí)際生產(chǎn)需求的次優(yōu)的算法。本文通過編程語言合理的設(shè)計模型并對中南半島2020年活躍火頻次進(jìn)行了預(yù)測,實(shí)驗(yàn)效果良好。此模型雖然減少了數(shù)據(jù)的輸入量,但是與多因子模型相比精度會低一些。
參考文獻(xiàn)(References):
[1] 李鵬,李文君,封志明,等.基于FIRMS MODIS與VIIRS的東南亞活躍火頻次時空動態(tài)分析[J].資源科學(xué),2019,41(8):1526-1540.
[2] 劉穎,李鵬,肖池偉,等.中南半島旱季VIIRS活躍火的空間特征與國別差異[J].地理科學(xué)進(jìn)展,2021,40(8):1406-1418.
[3] Leigh B. Lentile,Zachary A. Holden,Alistair M. S. Smith,el al.Remote sensing techniques to assess active fire characteristics and post-fire effects[J]. International Journal of Wildland Fire,2006,15(3).
[4] U. Choromanska,T.H. DeLuca. Microbial activity andnitrogen mineralization in forest mineral soils following heating: evaluation of post-fire effects[J]. Soil Biology and Biochemistry,2002,34(2).
[5] He Han,ChangYu,LiuZhihua,et al. Evaluations on theConsequences of Fire Suppression and the Ecological Effects of Fuel Treatment Scenarios in a Boreal Forest of the Great Xing'an Mountains, China[J]. Forests,2023,14(1).
[6] Charles W. McHugh,Thomas E. Kolb. Ponderosa pinemortality following fire in northern Arizona[J]. International Journal of Wildland Fire,2003,12(1).
[7] 劉怡媛,李鵬,肖池偉,等.老撾VIIRS活躍火的主要自然地理要素特征[J].地理研究,2020,39(3):749-760.
[8] 廖諶婳,封志明,李鵬,等.緬老泰交界地區(qū)刀耕火種農(nóng)業(yè)的時空變化格局[J].地理研究,2014,33(8):1529-1541.
[9] 李文君,肖池偉,封志明,等.2015年厄爾尼諾年東南亞主要國家活躍火發(fā)生類型與影響分析[J].自然資源學(xué)報,2020,35(10):2539-2552.
[10] 薛乃婷,張震,杜志恒,等.北極地區(qū)活躍火的時空分布格局分析[J].極地研究,2020,32(4):555-564.
[11] 李軍,張志東,喬元健,等.基于自適應(yīng)集成神經(jīng)網(wǎng)絡(luò)的火災(zāi)預(yù)測方法[J].消防科學(xué)與技術(shù),2020,39(12):1727-1731.
[12] 薛乃婷,張震,杜志恒,等.北極地區(qū)活躍火的時空分布格局分析[J].極地研究,2020,32(4):555-564.
[13] 楊偉,姜曉麗.森林火災(zāi)火燒跡地遙感信息提取及應(yīng)用[J].林業(yè)科學(xué),2018,54(5):135-142.
[14] 丁青,馮險峰.歐亞北方森林MODIS14數(shù)據(jù)的林火變化分析——以俄羅斯歐洲地區(qū)為例[J].地球信息科學(xué)學(xué)報,2013,15(3):476-482.
[15] 胡超.基于BP人工神經(jīng)網(wǎng)絡(luò)的區(qū)域森林火災(zāi)預(yù)測研究[D].浙江:浙江海洋學(xué)院,2015.
[16] 史一通.基于BP神經(jīng)網(wǎng)絡(luò)的城市區(qū)域火災(zāi)風(fēng)險評估模型研究[D].四川:西南交通大學(xué),2018.
[17] 汪文野,劉靜,賈南.基于神經(jīng)網(wǎng)絡(luò)的森林火災(zāi)預(yù)測分析[J].武警學(xué)院學(xué)報,2020,36(6):15-20.
[18] 李曉明,顧鈺培,張俊濤.一種滑動窗口的GPS軌跡點(diǎn)地圖匹配算法[J].西安工業(yè)大學(xué)學(xué)報,2017,37(6):459-462.
[19] 南虎,路璐,麻曉晶,等.基于卷積神經(jīng)網(wǎng)絡(luò)的滑動窗口算法在高分辨電鏡圖像中的應(yīng)用[J].電子顯微學(xué)報,2021,40(3):242-250.
[20] 王亞琴,王耀力,郭學(xué)斌,等.基于直連BP神經(jīng)網(wǎng)絡(luò)模型的森林火險預(yù)測[J].森林防火,2018(2):41-45,54.