梁慧玲,王文輝,郭福濤,林芳芳,林玉蕊,*
1 福建農(nóng)林大學(xué)計算機與信息學(xué)院,福州 350002 2 福建農(nóng)林大學(xué)林學(xué)院,福州 350002 3 漳州理工職業(yè)學(xué)院,漳州 363000
?
比較邏輯斯蒂與地理加權(quán)邏輯斯蒂回歸模型在福建林火發(fā)生的適用性
梁慧玲1,2,3,王文輝2,郭福濤2,林芳芳1,林玉蕊1,*
1 福建農(nóng)林大學(xué)計算機與信息學(xué)院,福州 350002 2 福建農(nóng)林大學(xué)林學(xué)院,福州 350002 3 漳州理工職業(yè)學(xué)院,漳州 363000
林火預(yù)測預(yù)報是科學(xué)有效進行林火管理的前提,是林業(yè)管理部門和科研工作者的廣泛關(guān)注的領(lǐng)域。邏輯斯蒂回歸(Logistic Regression, LR)是目前國內(nèi)外廣泛應(yīng)用于森林火災(zāi)預(yù)測的模型方法,然而近年來有學(xué)者發(fā)現(xiàn)該方法沒有充分考慮林火影響因子的空間相關(guān)性和異質(zhì)性,從而導(dǎo)致模型擬合結(jié)果偏差。地理加權(quán)邏輯斯蒂回歸(Geographically weighted logistic regression, GWR)模型考慮到了模型變量之間的空間相關(guān)性,有效提高的模型的擬合能力。為探討GWLR模型在福建林火預(yù)測上的適用性,本研究應(yīng)用LR和GWLR兩種方法分別建立福建省森林火災(zāi)與氣象因子的預(yù)測模型,通過模型擬合能力對比,判斷在GWLR的適用性。研究以2000—2005年福建地區(qū)森林火災(zāi)衛(wèi)星火點數(shù)據(jù)和每日氣象因子為基礎(chǔ),將全樣本分為60%的建模數(shù)據(jù)和40%的校驗數(shù)據(jù),并重復(fù)5次,建立5個樣本組。選擇在5個樣本組中3個及以上表現(xiàn)顯著的變量進入最終模型。研究結(jié)果表明GWLR在模型擬合度、模型殘差、空間自相關(guān)性以及預(yù)測準確率等方面均優(yōu)于LR模型,說明充分考慮模型變量的空間異質(zhì)性有助于提高模型的預(yù)測精度,同時也驗證了GWLR在福建地區(qū)林火預(yù)測上的適應(yīng)性。此外,模型參數(shù)結(jié)果顯示,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“24小時降水量”、“日最高本站氣壓”、“日照時數(shù)”、“日最高氣溫”和“日最小相對濕度”8個因子對福建省林火發(fā)生有顯著影響,研究結(jié)論為福建地區(qū)林火預(yù)測預(yù)報提供了新的方法。
林火預(yù)測;空間異質(zhì)性;邏輯斯蒂回歸;地理加權(quán)邏輯斯蒂回歸
林火是是森林生態(tài)系統(tǒng)的重要影響因子,對森林資源與環(huán)境造成破壞也會威脅人類生命財產(chǎn)安全[1- 3]。判定林火發(fā)生的影響因子,建立準確的林火預(yù)測預(yù)報模型對林火管理工作至關(guān)重要。目前,國內(nèi)外有關(guān)林火發(fā)生的預(yù)測模型和影響因子分析已大量開展,主要模型方法為人工神經(jīng)網(wǎng)絡(luò)[4]、最大熵算法[5,6]、分類樹[7]、泊松回歸、負二項回歸、零膨脹泊松、零膨脹負二項以及邏輯斯蒂回歸模型[8- 11]等,其中邏輯斯蒂模型應(yīng)用最為廣泛。然而以上所有模型均假設(shè)因變量與自變量之間的關(guān)系是空間平穩(wěn)的,即模型參數(shù)在整個研究區(qū)域上是一個不變的常數(shù),通常建模的結(jié)果是一套模型參數(shù)應(yīng)用于整個研究區(qū)域,也稱之為全局模型。然而,隨著研究的深入,很多學(xué)者發(fā)現(xiàn)區(qū)域的空間異質(zhì)性是不容忽略的。林火與影響因子之間的關(guān)系在空間上是非平穩(wěn)的,具有很強的異質(zhì)性[12- 14],因此,以往的全局模型在林火預(yù)測預(yù)報上可能會產(chǎn)生較大誤差。
地理加權(quán)回歸模型(GWR)考慮了地理空間因素的影響,該模型將一個大的數(shù)據(jù)集分成了若干小區(qū)域,減少了各個模型間的差異性,有助于提高模型精度,可以用來解決空間的平穩(wěn)性問題。目前,地理加權(quán)回歸模型主要應(yīng)用在生態(tài)學(xué)、經(jīng)濟學(xué)和社會科學(xué)等領(lǐng)域[15- 19]。近年來,國外已有少數(shù)學(xué)者將該模型的拓展模型即地理加權(quán)邏輯斯蒂模型(GWLR)應(yīng)用于森林火災(zāi)的預(yù)測預(yù)報及林火影響因子的空間分析上,并且表現(xiàn)出較好的擬合效果[12- 14]。由于該模型強調(diào)自變量與因變量關(guān)系的空間異質(zhì)性,因此模型在不同區(qū)域的適用性可能有較大差異。為了探討GWLR模型對我國亞熱帶地區(qū)林火預(yù)測預(yù)報的適用性,且由于2000—2005年福建省的林火發(fā)生既不是太多,也不是很少,比較有代表性,因此本文以福建省2000—2005年衛(wèi)星火點數(shù)據(jù)為基礎(chǔ),選取每日氣象數(shù)據(jù)為自變量因子,對模型的擬合能力進行分析,并與傳統(tǒng)全局邏輯斯蒂回歸模型進行對比,探討地理加權(quán)回歸模型在林火預(yù)測預(yù)報上的適用性。
1.1 研究區(qū)域概況
圖1 研究區(qū)域示意圖Fig.1 The study area
福建省位于我國東南沿海地區(qū),介于北緯23°33′—28°20′、東經(jīng)115°50′—120°40′之間(圖1)。根據(jù)第八次全國森林資源清查結(jié)果顯示,福建省林業(yè)用地面積926.82萬hm2,森林面積801.27萬hm2,人工林面積377.69萬hm2,森林覆蓋率65.95%,森林蓄積量60796.15萬m3[20],是我國南方重點林區(qū)的省份之一。但是,也是我國森林火災(zāi)的高發(fā)區(qū)。1951—1987年,全省共發(fā)生6.2萬次的森林火災(zāi),受害山林面積有150萬hm2,平均每年森林火災(zāi)0.1萬次,受害山林面積4萬hm2,占全省年平均造林面積的25%—33.3%[21];1998—2007年間,福建省共發(fā)生森林火災(zāi)4504起,火場面積累計達79,572hm2,受害森林面積累計達55485.6 hm2,共損失了97萬m3的林木蓄積量,其中2004年發(fā)生了1164次火災(zāi),1998年林火發(fā)生次數(shù)最少,為156次;僅10年就發(fā)生了40次重大火災(zāi)[22]。福建省森林火災(zāi)問題尤為嚴峻。
1.2 數(shù)據(jù)來源與處理
1.2.1 數(shù)據(jù)來源
福建省2000—2005年的林火發(fā)生數(shù)據(jù)(包括起火時間、起火原因、起火地理坐標等)來源于林業(yè)科學(xué)數(shù)據(jù)中心(http://www.cfsdc.org/indexAction.action?classId=1)提供的衛(wèi)星火點解譯數(shù)據(jù);歷史氣象數(shù)據(jù)來源于中國氣象數(shù)據(jù)共享網(wǎng)絡(luò)(http://cdc.cma.gov.cn/),為2000—2005年福建省內(nèi)22個國家級氣象站的每日氣象數(shù)據(jù),一共包22個氣象因子。由于儀器設(shè)備和氣象站點變化等原因,造成部分數(shù)據(jù)缺失,且無法修補。因此,本研究對氣象數(shù)據(jù)進行預(yù)處理,剔除部分缺失數(shù)據(jù),剩下的氣象因子包括日平均地表氣溫(℃),日最高地表氣溫(℃),日最低地表氣溫(℃),日平均風速(m/s),日最大風速(m/s),24小時降水量(mm),日平均本站氣壓(hPa),日最高本站氣壓(hPa),日最低本站氣壓(hPa),日照時數(shù)(hour),日平均氣溫(℃),日最高氣溫(℃),日最低氣溫(℃),日平均相對濕度(%),日最小相對濕度(%)共15個氣象因子。
1.2.2 數(shù)據(jù)處理
本文以2000—2005年的衛(wèi)星火點數(shù)據(jù)為基礎(chǔ),從中隨機選取60%的訓(xùn)練樣本(5210個林火數(shù)據(jù))來構(gòu)建模型,剩下40%的測試樣本(3473個林火數(shù)據(jù))用來檢驗?zāi)P?。同時,為了避免樣本分布對試驗結(jié)果的影響,本文重復(fù)5次試驗,即重復(fù)5次訓(xùn)練樣本和測試樣本的隨機劃分,選擇5次試驗中出現(xiàn)3次或以上的顯著變量進入全樣本數(shù)據(jù)擬合。
本文分別應(yīng)用SPSS 19.0和GWR4軟件對邏輯斯蒂回歸模型和地理加權(quán)邏輯斯蒂回歸模型進行擬合,并應(yīng)用Rookcase軟件對模型殘差進行空間自相關(guān)分析。
1.3 研究方法
1.3.1 二項邏輯斯蒂回歸模型
(1)多重共線性(Multicollinearity)是指在線性回歸模型中,自變量之間存在精確的相關(guān)關(guān)系或者高度相關(guān)關(guān)系的現(xiàn)象。
本文運用方差膨脹因子(the variance inflation factor,VIF)診斷法對林火發(fā)生的驅(qū)動因子進行共線性檢驗。方差膨脹因子最早是由Marquardt于1960年引入的,第i個變量的方差膨脹系數(shù)的表達式為
(3)
(2)邏輯斯蒂回歸模型屬于廣義線性回歸模型,對于只有兩種分類結(jié)果的分類因變量,可以應(yīng)用二元邏輯斯蒂回歸模型進行建模分析,其預(yù)測值為在[0,1]之間的預(yù)測概率。邏輯斯蒂模型是目前國內(nèi)外應(yīng)用最廣的用于預(yù)測林火發(fā)生概率的模型。設(shè)有林火發(fā)生(Y=1)的概率為P,則無林火發(fā)生(Y=0)的概率為(1-P),則有林火發(fā)生的概率
(1)
式中,z為解釋變量x1,x2,...,xn的線性函數(shù),
z=α0+α1x1+α2x2+...+αnxn
(2)
式中,α0,α1,α2,...,αn為各個解釋變量的回歸系數(shù)。
對P進行Logit變換,即將P變換為ln[P/(1-P)],則有
(3)
最后,運用極大似然估計法可求得模型的參數(shù)估計系數(shù)α0,α1,α2,...,αn[23- 25]。
1.3.2 地理加權(quán)邏輯斯蒂回歸模型
由于地理位置的不同而引起變量之間的關(guān)系或者結(jié)構(gòu)發(fā)生變化的現(xiàn)象稱為空間非平穩(wěn)性(spatialnonstationarity)。地理加權(quán)邏輯斯蒂回歸模型是傳統(tǒng)邏輯斯蒂回歸模型的擴展,考慮了空間位置因素,利用加權(quán)最小二乘法對每一個坐標點進行參數(shù)估計,對參數(shù)的估計是局部而非全局的,每一個位置均有相應(yīng)的參數(shù)估計系數(shù)[26-27]。地理加權(quán)邏輯斯蒂回歸模型(GWLR)的表達式為:與邏輯斯蒂模型相同,位置i有林火發(fā)生(Y=1)的概率為P,則無林火發(fā)生(Y=0)的概率為(1-P),則位置i有林火發(fā)生概率
式中,z=α0(ui,vi)+α1(ui,vi)xi1+α2(ui,vi)xi2+...+αn(ui,vi)xin。
經(jīng)Logit變換,有
最后,運用加權(quán)最小二乘法可求得位置i的局部回歸模型的參數(shù)估計系數(shù),即
1.3.3 模型預(yù)測準確率計算
本文根據(jù)ROC曲線分析法所計算出來的敏感性值和特異性值,可求得約登指數(shù),即約登指數(shù)=敏感性值+特異性值-1,進而計算出福建省林火發(fā)生的最佳臨界值(cut-off值),如果林火發(fā)生的預(yù)測概率大于該臨界值則認為有林火發(fā)生,小于該臨界值則認為無林火發(fā)生,從而根據(jù)模型所計算出來的林火發(fā)生次數(shù)與實際值進行比較,進而計算出LR模型和GWLR模型模型對林火發(fā)生與否的正確判別率。
1.3.4 模型空間自相關(guān)檢驗Moran′sI
本文應(yīng)用全局Moran′sI指數(shù)計算殘差(殘差=觀測值-預(yù)測值)的空間自相關(guān)來對模型進行評價,全局Moran′sI指數(shù)的值越小,說明殘差的空間依賴程度越低,模型考慮了更多的空間結(jié)構(gòu)問題,模型的效果越好。
全局Moran′sI指數(shù)的計算公式為:
2.1 模型擬合結(jié)果與分析
2.1.1 多重共線性診斷結(jié)果
多重共線性診斷結(jié)果顯示,變量“日平均地表氣溫”、“日平均本站氣壓”、“日最低本站氣壓”、“日平均氣溫”、“日最低氣溫”等5個變量均存在共線性關(guān)系,將這5個變量剔除之后,用剩下的10個自變量構(gòu)建LR模型和GWLR模型。
2.1.2 LR模型擬合結(jié)果
本文應(yīng)用LR模型和“wald向前”原則對5個訓(xùn)練樣本進行擬合計算,得到5個不同的特征變量子集,然后在5個特征變量子集中選擇出現(xiàn)3次或3次以上的特征變量進入全樣本數(shù)據(jù)的擬合計算(表1)。
表1 LR模型特征變量選擇結(jié)果
+表示變量在模型里面;-表示變量不在模型里面
由表1可知,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“日降水量”、“日最高本站氣壓”、“日照時數(shù)”、“日最高氣溫”和“日最小相對濕度”等8個變量進入了全樣本數(shù)據(jù)的擬合階段,且除了“日最高本站氣壓”和“日最小相對濕度”在5個中間模型特征變量選擇結(jié)果中出現(xiàn)4次以外,其他6個變量均出現(xiàn)了5次。表2為8個顯著變量的全樣本數(shù)據(jù)擬合結(jié)果,結(jié)果顯示各變量與林火發(fā)生具有顯著相關(guān)性。其中“日最高地表氣溫”、“日平均風速”、“日最高本站氣壓”、“日照時數(shù)”和“日最高氣溫”等5個氣象因子與森林火災(zāi)呈正相關(guān)關(guān)系,“日最低地表氣溫”、“日降水量”和“日最小相對濕度”3個氣象因子與森林火災(zāi)呈負相關(guān)關(guān)系,且這8個氣象因子對林火發(fā)生均有顯著的影響。
表2 全樣本數(shù)據(jù)的LR模型參數(shù)擬合結(jié)果
2.1.3 GWLR模型擬合結(jié)果
首先假設(shè)模型的數(shù)據(jù)結(jié)構(gòu)是空間非平穩(wěn)的,對5個訓(xùn)練樣本進行模型擬合,然后對因變量與解釋變量之間的關(guān)系的空間非平穩(wěn)性進行檢驗。如果“某解釋變量的估計系數(shù)的四分位數(shù)范圍大于LR模型中該解釋變量的估計系數(shù)的±1標準差范圍”[13,29],則認為該解釋變量是顯著空間非平穩(wěn)變量(以樣本1為例,LR模型和GWLR模型系數(shù)估計結(jié)果見附表1)。最后在5個訓(xùn)練樣本中選擇出現(xiàn)3次或3次以上的非平穩(wěn)變量進入全樣本數(shù)據(jù)的擬合階段,并作為全樣本數(shù)據(jù)模型的非平穩(wěn)項,而其他平穩(wěn)變量則作為全樣本數(shù)據(jù)模型的平穩(wěn)項。檢驗結(jié)果顯示除了“日最低相對濕度”在5個中間模型中有1次被檢驗為空間平穩(wěn)變量之外,其他9個氣象因子在5個中間模型中均被檢驗為空間非平穩(wěn)變量(附表2)。全樣本數(shù)據(jù)的GWLR模型參數(shù)擬合結(jié)果如表3所示。
表3 全樣本數(shù)據(jù)的GWLR模型參數(shù)估計
注:系數(shù)的最大和最小值若符號相同表示該變量在整個研究區(qū)域上與林火的相關(guān)性一致,反之表示變量在整個區(qū)域上與林火的相關(guān)性具有正負差異
表3顯示,除“日最低地表氣溫”在整個研究區(qū)域上均與林火發(fā)生呈負相關(guān)關(guān)系之外,其他9個氣象因子在整個研究區(qū)域上均在正相關(guān)和負相關(guān)之間變化。為更好體現(xiàn)GWLR模型各變量系數(shù)的局部變化,本文運用ArcGIS 10.2對各變量模型估計系數(shù)進行空間插值(圖2)。圖2表明GWLR模型的估計系數(shù)隨空間位置變化而變化,具有明顯的空間異質(zhì)性。
圖2 變量系數(shù)分布圖Fig.2 Variable coefficient distribution
此外,對各變量估計系數(shù)的t檢驗值進行空間插值,若估計系數(shù)t檢驗值的絕對值小于1.96,則表示估計系數(shù)在研究區(qū)域上不顯示,若t檢驗值小于-1.96或大于1.96,說明估計系數(shù)顯著。圖3表明模型變量的估計系數(shù)的顯著性也具有很強的空間異質(zhì)性。
圖2,圖3綜合顯示“日最低地表氣溫”在整個研究區(qū)域上均與林火發(fā)生呈負相關(guān)關(guān)系,且該因子的估計系數(shù)在整個研究區(qū)域上均顯著;“24小時降水量”與林火發(fā)生呈顯著負相關(guān)系數(shù);“日照時數(shù)”和“日最高氣溫”與林火發(fā)生呈顯著正相關(guān)關(guān)系;“日最高本站氣壓”與林火發(fā)生存在正負兩種相關(guān)性,但以正相關(guān)為主,主要分布在福建北部和南部地區(qū);“日平均相對濕度”在南平市北部地區(qū)和龍巖市大部分地區(qū)與林火呈顯著的負相關(guān)關(guān)系,僅在三明與南平市交界處存在小塊正相關(guān)區(qū)域;“日最小相對濕度”在龍巖市西南地區(qū)存在顯著正相關(guān)系數(shù),在三明市和永安市交界處及廈門市和漳州市的小部分沿海地區(qū)存在顯著的負相關(guān)系數(shù);“日平均風速”在福建省西部和中部地區(qū)與林火發(fā)生呈顯著正相關(guān),而“日最大風速”在西部和中部地區(qū)與林火發(fā)生則呈顯著負相關(guān)。
2.2 模型評價
本文將全樣本分成60%的訓(xùn)練樣本(用于建模)和40%的測試樣本(模型檢驗)。應(yīng)用最小信息準則(AIC)、殘差平方和(SSE)和ROC曲線(ROC)下的面積AUC值(AUC)等統(tǒng)計量和模型的預(yù)測準確率對LR和GWLR模型進行對比評價。
模型擬合統(tǒng)計結(jié)果表明,對比傳統(tǒng)邏輯斯蒂回歸模型,地理加權(quán)邏輯斯蒂回歸模型具有更小的AIC和SSE值,和更大的AUC值以及更高的模型預(yù)測準確率(表4)。表4顯示,LR模型的預(yù)測準確率為74.2%—76.2%小于GWLR模型(77.1%—78.6%)。
圖3 變量系數(shù)顯著性分布圖Fig.3 Significant distribution of variable coefficient正顯著相關(guān)性用暖色調(diào)表示,負顯著相關(guān)性用冷色調(diào)表示
樣本Sample模型Model赤池信息準則Akaikeinformationcriterion(AIC)殘差平方和SumofSquaresforError(SSE)ROC曲線下的面積AreaunderCurve(AUC)臨界值Cut-off預(yù)測正確率Predictionaccuracy/%訓(xùn)練樣本(60%)Trainingdata(60%)測試樣本(40%)Validation(40%)樣本1LR5256.368872.6790.8220.50103075.574.7Sample1GWLR4999.887785.6560.8570.52458778.676.8樣本2LR5307.347883.8820.8220.50108075.275.2Sample2GWLR5054.525795.8510.8550.46660878.576.9樣本3LR5304.786883.6940.8190.47923075.175.9Sample3GWLR5116.377822.7630.8430.51395377.677.3樣本4LR5342.380891.8130.8150.50312574.975.5Sample4GWLR5072.533800.3210.8530.54029177.877.1樣本5LR5401.440905.1020.8100.50197574.276.2Sample5GWLR5172.060820.5540.8450.52282777.679.0全樣本LR8792.5251464.8120.8210.50231075.1CompletesampleGWLR8323.4961328.2740.8530.50520578.4
2.3 殘差分析
根據(jù)兩個模型對5樣本和全樣本數(shù)據(jù)的擬合結(jié)果,分別繪制模型的殘差圖(圖4)。圖4表明GWLR模型具有更小的殘差。
圖4 模型殘差箱形圖Fig.4 Box figure the model residuals
全樣本模型的殘差空間自相關(guān)(圖5)結(jié)果顯示GWLR模型的Moran′s I值比LR模型小,說明與LR模型相比,GWLR模型在福建省林火發(fā)生與否的判別問題中考慮了更多的空間自相關(guān)問題,GWLR模型對福建省林火發(fā)生的擬合效果較好。
圖5 全樣本模型的殘差空間自相關(guān)Fig.5 Final sample of residual spatial autocorrelation
氣候條件的變化對森林火災(zāi)的發(fā)生具有重要的影響,因此,本文基于氣象因子應(yīng)用傳統(tǒng)的邏輯斯蒂回歸模型和地理加權(quán)邏輯斯蒂回歸模型對福建省2000—2005年的林火數(shù)據(jù)進行分析,對兩種模型的預(yù)測能力以及對模型在森林火災(zāi)應(yīng)用方面的適用性進行分析。模型變量選擇結(jié)果顯示,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“24小時降水量”、“日最高本站氣壓”、“日照時數(shù)”、“日最高氣溫”和“日最低相對濕度”等8個變量均是LR模型和GWLR模型的全樣本特征變量,說明這8個氣象因子是福建省森林火災(zāi)的主要影響因子。氣溫的變化會使可燃物的濕度發(fā)生變化,改變火災(zāi)的氣候條件,從而對森林火災(zāi)產(chǎn)生影響。我們的研究結(jié)果顯示,“氣溫”對森林火災(zāi)的發(fā)生具有重要的影響,這與Liu[32]和Hu和Zhou[33]的研究結(jié)果一致;相對濕度是反應(yīng)林內(nèi)可燃物含水量的一個重要指標,對林火發(fā)生有重要影響。我們的研究結(jié)果表明“相對濕度”對林火發(fā)生有重要的影響,與Zhang[24]的研究結(jié)果一致。通常一個地區(qū)重特大火災(zāi)的發(fā)生,與最大風速是相關(guān),但是,本文在對氣象因子進行分析時,邏輯斯蒂回歸模型卻將“日最大風速”剔除,而地理加權(quán)邏輯斯蒂回歸模型回歸模型則顯示“日最大風速”是一個空間非平穩(wěn)變量,因此,模型變量的選擇是否理想與模型的選擇相關(guān)。此外,本研究并沒有考慮地形、植被類型、人為活動等條件對森林火災(zāi)的影響,因此可能會對研究結(jié)果產(chǎn)生偏差。
傳統(tǒng)的邏輯斯蒂回歸模型假設(shè)空間變量都是平穩(wěn)變量,忽略了模型變量的空間異質(zhì)性,模型的擬合結(jié)果無法全面反映變量的空間關(guān)系,而本文的研究結(jié)果顯示,影響福建省林火發(fā)生的氣象因子具有明顯的空間異質(zhì)性,且模型評價結(jié)果顯示與傳統(tǒng)的邏輯斯蒂回歸模型相比,地理加權(quán)邏輯斯蒂回歸模型的擬合效果較好,這與Saefuddin[31]、Koutsias[12]、Wu和Zhang[28]等前人的研究結(jié)果一致,表明在對具有空間結(jié)構(gòu)的數(shù)據(jù)進行擬合分析時,應(yīng)考慮空間地理位置變化對因變量結(jié)果的影響。
本文應(yīng)用邏輯斯蒂回歸模型和地理加權(quán)邏輯斯蒂回歸模型對福建省森林火災(zāi)空間格局和氣象影響因子進行分析,并對兩種模型的擬合效果進行研究,結(jié)果表明:(1)“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“24小時降水量”、“日最高本站氣壓”、“日照時數(shù)”、“日最高氣溫”和“日最低相對濕度”等8個變量是3個模型的共同變量,是影響福建省林火發(fā)生的主要氣象因子;(2)在福建省林火發(fā)生的分類判別中,與傳統(tǒng)的邏輯斯蒂回歸模型相比,地理加權(quán)邏輯斯蒂回歸模型的擬合效果更好,更適合福建省森林火災(zāi)的數(shù)據(jù)結(jié)構(gòu)。
[1] Grogan P, Burns T D, Chapin F S. Fire effects on ecosystem nitrogen cycling in a Californian bishop pine forest. Oecologia, 2000, 122(4): 537- 544.
[2] Liu H P, Rerson J T, Lindfors J, Chapin F S. Changes in the surface energy budget after fire in boreal ecosystems of interior Alaska: An annual perspective. Journal of Geophysical Research Atmospheres, 2005, 110(D13): D13101.
[3] Chas-Amil M L, Touza J, Prestemon P. Spatial distribution of human-caused forest fires in Galicia (NW Spain). Ecology and the Environment, 2010, 137: 247- 258.
[4] Bisquert M, Caselles E, Sánchez J M, Caselles. Application of artificial neural networks and logistic regression to the prediction of forest fire danger in Galicia using MODIS data. International Journal of Wildland Fire, 2012, 21(8): 1025- 1029.
[5] Parisien M A, Snetsinger S, Greenberg J A, Nelson C R, Schoennagel T, Dobrowski S Z, Moritz M A. Spatial variability in wildfire probability across the western United States. International Journal of Wildland Fire, 2012, 21(4): 313- 327.
[6] Renard Q, Pélissier R, Ramesh B R, Kodandapani N. Environmental susceptibility model for predicting forest fire occurrence in the Western Ghats of India. International Journal of Wildland Fire, 2012, 21(4): 368- 379.
[7] Lozano F J, Suárez-Seoane S, Kelly M, Luis E. A multi-scale approach for modeling fire occurrence probability using satellite data and classification trees: A case study in a mountainous Mediterranean region. Remote Sensing of Environment, 2008, 112(3): 708- 719.
[8] 郭福濤, 蘇漳文, 馬祥慶, 宋禹輝, 孫龍, 胡海清, 楊婷婷. 大興安嶺塔河地區(qū)雷擊火發(fā)生驅(qū)動因子綜合分析. 生態(tài)學(xué)報, 2015, 35(19): 6439- 6448.
[9] 郭福濤, 胡海清, 金森, 馬志海, 張揚. 基于負二項和零膨脹負二項回歸模型的大興安嶺地區(qū)雷擊火與氣象因素的關(guān)系. 植物生態(tài)學(xué)報, 2010, 34(5): 571- 577.
[10] 秦凱倫, 郭福濤, 邸雪穎, 孫龍, 宋禹輝, 吳瑤, 潘建峰. 大興安嶺塔河地區(qū)林火發(fā)生的優(yōu)勢預(yù)測模型選擇. 應(yīng)用生態(tài)學(xué)報, 2014, 25(3): 731- 737.
[11] 郭福濤, 胡海清, 馬志海, 張揚. 不同模型對擬合大興安嶺林火發(fā)生與氣象因素關(guān)系的適用性. 應(yīng)用生態(tài)學(xué)報, 2010, 21(1): 159- 164.
[12] Koutsias N, Martínez J, Chuvieco E, Allig?wer B. Modeling wildland fire occurrence in southern europe by a geographically weighted regression approach // Proceedings of the 5th International Workshop on Remote Sensing and GIS Applications to Forest Fire Management: Fire Effects Assessment. Spain: Universidad de Zaragoza, 2005: 57- 60.
[13] Martínez-Fernández J, Chuvieco E, Koutsias N. Modelling long-term fire occurrence factors in Spain by accounting for local variations with geographically weighted regression. Natural Hazards and Earth System Sciences, 2013, 13(2): 311- 327.
[14] Rodrigues M, De La Riva J, Fotheringham S. Modeling the spatial variation of the explanatory factors of human-caused wildfires in Spain using geographically weighted logistic regression. Applied Geography, 2014, 48: 52- 63.
[15] Wang Q, Ni J, Tenhunen J. Application of a geographically-weighted regression analysis to estimate net primary production of Chinese forest ecosystems. Global Ecology and Biogeography, 2005, 14(4): 379- 393.
[16] Tu J. Spatially varying relationships between land use and water quality across an urbanization gradient explored by geographically weighted regression. Applied Geography, 2011, 31(1): 376- 392.
[17] Propastin P. Modifying geographically weighted regression for estimating aboveground biomass in tropical rainforests by multispectral remote sensing data. International Journal of Applied Earth Observation and Geoinformation, 2012, 18: 82- 90.
[18] Freedman R, Roy S S. Spatial patterning ofMantabirostrisin United States east coast offshore habitat. Applied Geography, 2012, 32(2): 652- 659.
[19] Aguilar G D, Farnworth M J. Stray cats in Auckland, New Zealand: discovering geographic information for exploratory spatial analysis. Applied Geography, 2012, 34: 230- 238.
[20] 國家林業(yè)局. 第八次全國森林資源清查結(jié)果. 林業(yè)資源管理, 2014, (1): 1- 2.
[21] 李兆明, 高兆蔚. 福建森林火險天氣等級預(yù)測預(yù)報方法. 福建林學(xué)院學(xué)報, 1989, 9(2): 172- 176.
[22] 朱學(xué)平, 何東進, 丁福立, 洪偉, 游巍斌, 紀志榮. 基于突變級數(shù)法的福建省森林火災(zāi)評價分析. 福建林學(xué)院學(xué)報, 2011, 31(4): 295- 299.
[23] Garcia C V, Woodard P M, Titus S J, Adamowicz W L, Lee B S. A logit model for predicting the daily occurrence of human caused forest-fires. International Journal of Wildland Fire, 1995, 5(2): 101- 111.
[24] Zhang Z X, Zhang H Y, Zhou D W. Using GIS spatial analysis and logistic regression to predict the probabilities of human-caused grassland fires. Journal of Arid Environments, 2010, 74(3): 386- 393.
[25] del Hoyo L V, Isabel M P M, Vega F J M. Logistic regression models for human-caused wildfire risk estimation: analysing the effect of the spatial accuracy in fire occurrence data. European Journal of Forest Research, 2011, 130(6): 983- 996.
[26] 郭含茹, 張茂震, 徐麗華, 袁振花, 陳田閣. 基于地理加權(quán)回歸的區(qū)域森林碳儲量估計. 浙江農(nóng)林大學(xué)學(xué)報, 2015, 32(4): 497- 508.
[27] 肖燕婷, 田錚, 魏岳嵩. 時空地理加權(quán)回歸模型的時空非平穩(wěn)性檢驗. 系統(tǒng)工程理論與實踐, 2013, 33(6): 1537- 1542.
[28] Wu W, Zhang L J. Comparison of spatial and non-spatial logistic regression models for modeling the occurrence of cloud cover in northeastern Puerto Rico. Applied Geography, 2013, 37: 52- 62.
[29] Zhang H J, Qi P C, Guo G M. Improvement of fire danger modelling with geographically weighted logistic model. International Journal of Wildland Fire, 2014, 23(8): 1130- 1146.
[30] Rodrigues M, De La Riva J. An insight into machine-learning algorithms to model human-caused wildfire occurrence. Environmental Modelling & Software, 2014, 57: 192- 201.
[31] Saefuddin A, Setiabudi N A, Fitrianto A. On comparison between logistic regression and geographically weighted logistic regression: with application to Indonesian poverty data. World Applied Sciences Journal, 2012, 19(2): 205- 210.
[32] Liu Z H, Yang J, Chang Y, Weisberg P J, He H S. Spatial patterns and drivers of fire occurrence and its future trend under climate change in a boreal forest of Northeast China. Global Change Biology, 2012, 18(6): 2041- 2056.
[33] Hu T Y, Zhou G S. Drivers of lightning-and human-caused fire regimes in the Great Xing′an Mountains. Forest Ecology and Management, 2014, 329: 49- 58.
附表:
Comparing the application of logistic and geographically weighted logistic regression models for Fujian forest fire forecasting
LIANG Huiling1,2,3, WANG Wenhui2, GUO Futao2, LIN Fangfang1, LIN Yurui1,*
1CollegeofComputerandInformationScience,FujianAgricultureandForestryUniversity,Fuzhou350002,China2CollegeofForestry,FujianAgricultureandForestryUniversity,Fuzhou350002,China3ZhangzhouInstituteOfScience&Engineering,Zhangzhou363000,China
Forest fire forecasting is a key component of effective and science-based forest management and has been comprehensively addressed in the scientific literature. The logistic regression (LR) technique has been used in forest fire prediction models. However, some scholars have recently reported that the technique does not adequately consider the spatial correlation and heterogeneity of fire impact factors, which results in poorly fitting models. In contrast, geographically weighted logistic regression (GWR) models consider the spatial correlation of model variables, which improves the model′s goodness of fit. In order to explore the applicability of the GWLR model in Fujian forest fire forecasting, the present study used both the LR and GWLR methods to establish forecast model for forest fires and meteorological factors in Fujian Province, and the model fitting ability of two models were compared. Based on the forest fire and meteorological data for Fujian from 2000 to 2005, the original dataset was randomly divided into training (60%) and validation (40%) samples, with five replications and five sample groups, and predictors that were significant (ɑ=0.05) for at least three of the five sample groups were included in the final models. The goodness of fit, residual error, spatial autocorrelation, and prediction accuracy of the GWLR model were all better than those of the LR model, and the GWLR comprehensively explained the spatial heterogeneity of model variables and helped to improve the prediction accuracy of the model. The study also verified the suitability of the GWLR model on the forest fire forecasting in Fujian area. In addition, the results also indicated that the occurrence of Fujian forest fires is significantly affected by eight parameters, including minimum and maximum surface temperature, daily average wind speed, daily precipitation, highest station pressure, hours of sunshine, daily maximum temperature, and daily minimum relative humidity. Therefore, the GWLR model may provide a new technique for the prediction of forest fires in Fujian Province.
forest fire forecast; spatial heterogeneity; logistic regression; geographically weighted logistic regression(GWLR)
附表1 LR模型和GWLR模型的系數(shù)估計(樣本1)
附表2 GWLR模型空間(非)平穩(wěn)變量檢驗結(jié)果
+表示該變量是空間非平穩(wěn)變量;-表示該變量是空間平穩(wěn)變量
國家自然科學(xué)基金(31400552);福建省自然科學(xué)基金(2015J05049);福建省教育廳資助省屬高校專項(JK2014012)
2016- 05- 01;
2017- 01- 16
10.5846/stxb201605010828
*通訊作者Corresponding author.E-mail: yrlin@fafu.edu.cn
梁慧玲,王文輝,郭福濤,林芳芳,林玉蕊.比較邏輯斯蒂與地理加權(quán)邏輯斯蒂回歸模型在福建林火發(fā)生的適用性.生態(tài)學(xué)報,2017,37(12):4128- 4141.
Liang H L, Wang W H,Guo F T, Lin F F, Lin Y R.Comparing the application of logistic and geographically weighted logistic regression models for Fujian forest fire forecasting.Acta Ecologica Sinica,2017,37(12):4128- 4141.