亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apache Spark 機(jī)器學(xué)習(xí)的生態(tài)安全格局構(gòu)建方法

        2019-08-27 07:01:06袁少雄宮清華尹小玲黃光慶羅新權(quán)
        生態(tài)學(xué)報(bào) 2019年13期
        關(guān)鍵詞:柵格格局分類

        袁少雄,陳 軍,宮清華,尹小玲,劉 通,王 鈞,黃光慶,*,羅新權(quán)

        1 廣州地理研究所,廣東省地理空間信息技術(shù)與應(yīng)用公共實(shí)驗(yàn)室,廣州 510070 2 廣東省生態(tài)環(huán)境技術(shù)研究所,廣東省農(nóng)業(yè)環(huán)境綜合治理重點(diǎn)實(shí)驗(yàn)室, 廣州 510650

        區(qū)域生態(tài)安全格局的構(gòu)建涉及了重要閾值設(shè)定、有效性評(píng)價(jià)、多尺度關(guān)聯(lián)、生態(tài)過程耦合等系列復(fù)雜的分析研究[1- 2],通過對(duì)關(guān)鍵性的點(diǎn)、線、局部(面)或其他空間組合規(guī)劃設(shè)計(jì),從而保護(hù)和恢復(fù)生物多樣性、維持生態(tài)系統(tǒng)結(jié)構(gòu)和過程的完整性、實(shí)現(xiàn)對(duì)區(qū)域生態(tài)環(huán)境問題有效控制和持續(xù)改善[3- 4]。生態(tài)安全格局的構(gòu)建主要有基于源地識(shí)別和生態(tài)阻力面分析構(gòu)建法[5- 7]、基于生態(tài)系統(tǒng)服務(wù)供需分析構(gòu)建法[8- 12]、基于景觀結(jié)構(gòu)優(yōu)化和風(fēng)險(xiǎn)分析規(guī)劃法[13- 14]和基于人類生存安全和理想人居環(huán)境目標(biāo)的多因素疊加分析規(guī)劃法[15]等。不管采用哪一種方法,其前提均是假設(shè)生態(tài)安全格局與該區(qū)域生境中的各個(gè)環(huán)境因子是相互關(guān)聯(lián)的,通過對(duì)環(huán)境因子不同層次、不同深度的分析,進(jìn)一步對(duì)其生態(tài)安全格局進(jìn)行規(guī)劃,然而卻少有學(xué)者直接對(duì)生態(tài)安全格局與環(huán)境因子之間的關(guān)系進(jìn)行分析研究。

        大數(shù)據(jù)是大量、高速、多變的信息資產(chǎn),它需要新型的處理方式去促成更強(qiáng)的決策能力、洞察力與最優(yōu)化處理[16]。Apache Spark是一個(gè)圍繞速度、易用性和復(fù)雜分析構(gòu)建的大數(shù)據(jù)處理框架,支持機(jī)器學(xué)習(xí)[17]。機(jī)器學(xué)習(xí)使用統(tǒng)計(jì)技術(shù)為計(jì)算機(jī)系統(tǒng)提供利用數(shù)據(jù)“學(xué)習(xí)”的能力,而不需要明確編程[18- 19]。在城市規(guī)劃方面,機(jī)器學(xué)習(xí)被用以檢測城市環(huán)境變化的本質(zhì)[20]、城市建筑的識(shí)別[21- 22]、城市用地分類[23- 25]、模擬城市擴(kuò)張[26- 29]等。但目前利用機(jī)器學(xué)習(xí)算法構(gòu)建生態(tài)安全格局的嘗試還相對(duì)較少。

        基于大數(shù)據(jù)的機(jī)器學(xué)習(xí),通常是不問為什么,而只是檢測模式模型[30]。本文擬利用大數(shù)據(jù)處理框架SPARK機(jī)器學(xué)習(xí)對(duì)生態(tài)安全格局與環(huán)境因子之間的關(guān)系進(jìn)行模擬分析,構(gòu)建通用模型用以預(yù)測生態(tài)安全格局的分布情況,從而簡化繁瑣的分析過程、減少閾值設(shè)定中主觀因素的影響、提升生態(tài)安全格局規(guī)劃的效率、拓展生態(tài)安全格局研究途徑。本文假設(shè)已實(shí)施的廣東省佛山市高明區(qū)、三水區(qū)和順德區(qū)的生態(tài)安全格局規(guī)劃是符合當(dāng)?shù)貙?shí)際情況的科學(xué)合理的方案。通過搭建Apache Spark處理框架,利用其機(jī)器學(xué)習(xí)庫中的邏輯斯蒂回歸對(duì)已有方案中的生態(tài)安全格局?jǐn)?shù)據(jù)與其環(huán)境因子(巖性、土壤質(zhì)地、土壤類型、用地類型、植被歸一化指數(shù)、海拔、坡度、陰陽坡向、曲率、斷層距離、道路距離、河流距離、建設(shè)用地距離、年均降雨量、年均氣溫、年均風(fēng)速、人口密度)之間相互關(guān)系進(jìn)行學(xué)習(xí)與訓(xùn)練,檢測兩者的關(guān)系模型,進(jìn)而利用該模型預(yù)測其他區(qū)域的生態(tài)安全格局。

        1 研究方法

        1.1 模型簡介

        1.1.1邏輯回歸模型

        邏輯回歸(Logistic Regression,下稱LR),在機(jī)器學(xué)習(xí)中既可以用來回歸,亦可以用來分類,由于算法的簡單和高效,在實(shí)際中應(yīng)用非常廣泛。其作為二分類模型,對(duì)因變量數(shù)據(jù)假設(shè)要求不高[31],是統(tǒng)計(jì)學(xué)習(xí)中的經(jīng)典分類方法。本文中利用Apache Spark的機(jī)器學(xué)習(xí)庫(MLlib)中的Logistic Regression模型(下稱Spark-LR),計(jì)算生態(tài)安全格局構(gòu)建中各環(huán)境變量的權(quán)值向量,以構(gòu)建生態(tài)安全格局通用模型。

        對(duì)于環(huán)境變量中的分類變量,如巖性、土壤質(zhì)地、土壤類型、土地利用、坡向、陰陽坡和曲率分類后的離散變量等,需要使用啞變量(dummy variable)[32]。因?yàn)榉诸愖兞康母黝愔g不存在大小等級(jí)關(guān)系,它們之間的差距無法準(zhǔn)確衡量,需要將原來的多分類變量轉(zhuǎn)化為多個(gè)啞變量,每個(gè)啞變量只代表某兩個(gè)級(jí)別或若干級(jí)別之間的差別,才能使回歸的結(jié)果有明確而合理的意義,啞變量代表的是等級(jí)間的比較結(jié)果[32]。

        1.1.2模型的參數(shù)設(shè)置

        在Apache Spark機(jī)器學(xué)習(xí)庫中,邏輯回歸模型的主要參數(shù)包括數(shù)據(jù)(本文為含生態(tài)安全格局樣點(diǎn)及建設(shè)用地點(diǎn)的SVM格式數(shù)據(jù))、訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)比例(部分用以模型訓(xùn)練,部分用以模型精度測試)、邏輯回歸最大迭代次數(shù)(較小的值將導(dǎo)致更高的精度與更多的迭代的成本)、正則化參數(shù)(值>=0,應(yīng)設(shè)置合適的值以防止過度擬合或欠擬合)、Elastic Net混合參數(shù)(設(shè)置0,懲罰為L2范數(shù);設(shè)置1,為L1范數(shù);設(shè)置0—1之間,懲罰為L1和L2組合)。本文設(shè)置訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)比例為0.75∶0.25,其他參數(shù)經(jīng)過多次反復(fù)模擬后選擇最佳擬合精度參數(shù)組合(更理想的狀態(tài)下可做蒙特卡洛模擬,以測試模型的穩(wěn)健性)。

        1.1.3生態(tài)安全格局分布圖計(jì)算

        在沒有分類變量的情況下,邏輯回歸模型計(jì)算的權(quán)值向量,可以直接用在arcgis柵格計(jì)算工具中,公式如下:

        (1)

        式中,R為目標(biāo)柵格,Vi為第i個(gè)變量,Ci為第i個(gè)變量對(duì)應(yīng)的權(quán)值向量。

        本文采用了多個(gè)分類變量,LR模型對(duì)各分類變量的啞變量進(jìn)行權(quán)值向量計(jì)算,在GIS中對(duì)單個(gè)分類變量柵格計(jì)算需要按各亞變量分別進(jìn)行權(quán)值向量計(jì)算賦值,方法是按柵格值與對(duì)應(yīng)的權(quán)值向量相乘,得到相應(yīng)柵格的新值,利用柵格計(jì)算的Con語句對(duì)分類變量柵格進(jìn)行賦值運(yùn)算,公式如下:

        vR=Con(iR=v1,nv1,Con(iR=v2,nv2,Con(…)))

        (2)

        式中,vR為分類變量目標(biāo)柵格,iR為分類變量柵格,v1、v2為分類變量柵格值,nv1、nv2為新的變量柵格值,新的變量柵格值是該分類變量原柵格值與權(quán)值向量的積。所有的分類變量目標(biāo)柵格計(jì)算出來后,利用公式1計(jì)算目標(biāo)柵格R。按以下公式計(jì)算生態(tài)安全格局可能性分布圖:

        (3)

        式中,P為生態(tài)安全格局可能性分布圖,b為LR模型截距。

        1.1.4模型精度

        應(yīng)用受試者工作特征曲線(Receiver operating characteristic curve,ROC)分析法對(duì)預(yù)測的結(jié)果進(jìn)行精度檢驗(yàn)。Spark-LR模型運(yùn)行后自動(dòng)計(jì)算出AUC值(即ROC曲線下面的面積)。AUC值取值范圍為0.5—1,越接近1說明預(yù)測的結(jié)果越好,其模型預(yù)測的結(jié)果就越準(zhǔn)確。AUC值為0.50—0.60(失敗),0.60—0.70(較差),0.70—0.80(一般),0.80—0.90(好),0.90—1.00(非常好)[33]。

        1.2 研究區(qū)域

        1.2.1模型構(gòu)建

        采用佛山市高明區(qū)、三水區(qū)和順德區(qū)作為模型構(gòu)建的基礎(chǔ)數(shù)據(jù)。數(shù)據(jù)主要為2009年廣東省佛山市高明區(qū)生態(tài)安全格局[15]、2011年佛山市三水區(qū)生態(tài)安全格局、2014年佛山市順德區(qū)生態(tài)安全格局(圖1A,下稱“三區(qū)生態(tài)安全格局”)等規(guī)劃的成果。

        在GIS中根據(jù)三區(qū)生態(tài)安全格局的范圍隨機(jī)生成2923個(gè)數(shù)據(jù)點(diǎn),提取每個(gè)數(shù)據(jù)點(diǎn)所在位置的生態(tài)安全格局屬性(圖1B),以保障生態(tài)安全格局(Guaranteed security pattern, GSP)、緩沖生態(tài)安全格局(Buffered security pattern, BSP)和最優(yōu)生態(tài)安全格局(Optimal security pattern, OSP)等3個(gè)等級(jí)安全格局?jǐn)?shù)據(jù)作為事件(即需要保護(hù)的生態(tài)資源)發(fā)生值(取值1),以建設(shè)用地作為事件不發(fā)生值(取值0)。每類再分別提取環(huán)境變量屬性,形成GSP、BSP和OSP 3個(gè)二維數(shù)值矩陣。將數(shù)值矩陣轉(zhuǎn)換為SVM格式數(shù)據(jù),在Apache Spark平臺(tái)中分別利用三類數(shù)據(jù)構(gòu)建相應(yīng)模型GSPM、BSPM和OSPM。

        圖1 廣東省佛山市高明區(qū)、三水區(qū)、順德區(qū)生態(tài)安全格局規(guī)劃(A)及樣點(diǎn)分布圖(B)Fig.1 Ecological security pattern plans (A) and sample distribution (B) of Gaoming district, Sanshui district and Shunde district, Foshan, Guangdong

        1.2.2模型應(yīng)用

        模型應(yīng)用以廣東省作為研究區(qū)域,分別利用GSPM、BSPM和OSPM預(yù)測廣東省全省生態(tài)安全格局,分析3個(gè)模型之間、預(yù)測結(jié)果與已有規(guī)劃之間以及預(yù)測結(jié)果與常規(guī)GIS疊加方法的結(jié)果之間的差異。

        1.3 環(huán)境變量

        1.3.1變量選擇

        目前關(guān)于利用機(jī)器學(xué)習(xí)的方式探討生態(tài)安全格局構(gòu)建的研究較少,可參考的文獻(xiàn)不多,本文的變量選擇以地質(zhì)災(zāi)害安全格局[15]、生物保護(hù)安全格局等相關(guān)環(huán)境變量作為參考,采用巖性(E01)、土壤質(zhì)地(E02)、土壤類型(E03)、用地類型(E04)、植被歸一化指數(shù)(E05)、海拔(E06)、坡度(E07)、陰陽坡向(E08)、曲率(E09)、斷層距離(E10)、道路距離(E11)、河流距離(E12)、建設(shè)用地距離(E13)、年均降雨量(E14)、年均氣溫(E15)、年均風(fēng)速(E16)、人口密度(E17)等17個(gè)變量作為生態(tài)安全格局預(yù)測的環(huán)境變量,所有變量均處理成120米分辨率柵格數(shù)據(jù)。

        1.3.2數(shù)據(jù)來源及分類變量處理

        巖性數(shù)據(jù)來源于中國國家地質(zhì)資料數(shù)據(jù)中心(http://geodata.ngac.cn/)廣東省1∶50萬地質(zhì)圖。該變量為分類變量,以各地層的終止年代作為分類依據(jù),各分類的屬性如表1。

        土壤質(zhì)地與土壤類型數(shù)據(jù)來源于中國廣東省生態(tài)環(huán)境與土壤研究所廣東省數(shù)字土壤V2.0(http://digital.soil.cn/),數(shù)據(jù)精度為1∶100萬。兩者都為分類變量,土壤質(zhì)地分類見表2,土壤類型分類見表3。

        用地類型數(shù)據(jù)是利用GIS對(duì)Landsat7數(shù)據(jù)(2015—2016年度,原始精度為30 m,數(shù)據(jù)來源于中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心地理空間數(shù)據(jù)云平臺(tái)http://www.gscloud.cn)進(jìn)行監(jiān)督分類,將土地利用類型分為林地、園地、草地、耕地、濕地、建設(shè)用地、其他用地和水域(表4)。

        NDVI數(shù)據(jù)來源于中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心地理空間數(shù)據(jù)云平臺(tái)(http://www.gscloud.cn)250 m植被指數(shù)16天合成產(chǎn)品。

        海拔數(shù)據(jù)為數(shù)據(jù)來源于中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心地理空間數(shù)據(jù)云平臺(tái)(http://www.gscloud.cn)30 m分辨率數(shù)字高程數(shù)據(jù),坡度、坡向、平面曲率數(shù)據(jù)由DEM經(jīng)過空間分析獲得。陰陽坡向由坡向按平面、陽坡、陰坡進(jìn)行重分類后獲得(表5)。平面曲率分為凹、平、凸三類(表6)。

        表1 巖性分類及屬性

        E,環(huán)境變量 Environmental variables

        表2 土壤質(zhì)地分類及屬性

        表3 土壤類型及屬性

        斷層數(shù)據(jù)來源于中國國家地質(zhì)資料數(shù)據(jù)中心(如前地質(zhì)數(shù)據(jù)源,1∶50萬),廣東省道路及河流數(shù)據(jù)來源于自有數(shù)據(jù)(精度1∶100萬),建設(shè)用地?cái)?shù)據(jù)為用地類型數(shù)據(jù)中的一類。利用GIS歐氏距離工具計(jì)算各距離因子,獲得斷層距離、道路距離、河流距離和建設(shè)用地距離。

        表4 用地類型及屬性

        年均降雨量、年均氣溫、年均風(fēng)速由廣東省氣象局多年氣象數(shù)據(jù)通過GIS的Kriging插值生成(分辨率:120 m)。人口密度來源于歐洲人類居住區(qū)任務(wù)(http://ghsl.jrc.ec.europa.eu/,分辨率:250 m)。

        1.4 構(gòu)建流程

        Spark-LR模型生態(tài)安全格局構(gòu)建流程見圖2。

        2 結(jié)果分析

        本研究中GSPM的平均AUC值達(dá)到90.58%,模型精度非常好;BSPM的平均AUC值為86.49%,模型精度較好;而OSPM平均AUC值71.11%,模型精度一般。由于GSP、BSP和OSP在本質(zhì)都是“生態(tài)資源(生態(tài)用地)”,三者之間只是景觀破碎化程度的高低,資源集中程度高低的區(qū)別,因此本文僅給出模型精度高的GSPM結(jié)果供參考。

        表5 陰陽坡向?qū)傩?/p>

        表6 平面曲率屬性

        2.1 GSPM變量權(quán)值與精度

        Spark-LR的結(jié)果顯示,基于GSP數(shù)值矩陣的訓(xùn)練模型,偏置向量b為0.5235±0.0079,各變量對(duì)應(yīng)的分類及其權(quán)值向量見表7。

        表7 GSPM變量、亞變量及相應(yīng)權(quán)值向量

        圖2 Spark-LR模型生態(tài)安全格局構(gòu)建流程Fig.2 Spark-LR model ecological security pattern construction processE:環(huán)境變量 Environmental variables;SVM:支持向量機(jī) Support vector machine;LR:邏輯斯蒂回歸 Logistic regression;ROC:受試者工作特征曲線 Receiver operating characteristic curve

        圖3 GSPM預(yù)測精度Fig.3 GSPM prediction accuracyAUC:ROC曲線下面的面積Area under the curve of ROC

        GSPM的平均AUC值為0.9058(圖3),說明模型擬合的精度非常好,預(yù)測準(zhǔn)確性高。

        2.2 GSPM預(yù)測結(jié)果

        利用公式1、2、3對(duì)GSPM的主要變量及相應(yīng)權(quán)值在GIS里進(jìn)行計(jì)算,得到GSPM預(yù)測的廣東省生態(tài)安全格局概率分布圖4。結(jié)果顯示珠江三角洲地區(qū)、韓江流域下游地區(qū)是基本保障生態(tài)安全格局可能性最低的區(qū)域,亦是廣東省人類活動(dòng)最活躍、城市建設(shè)最強(qiáng)烈的區(qū)域。而南嶺的各向余脈、青云山脈、蓮花山脈及云霧山脈是基本保障安全格局可能性最高的區(qū)域,是廣東省生態(tài)系統(tǒng)最重要的源和關(guān)鍵點(diǎn),是廣東省生態(tài)安全格局的“核心區(qū)”,保障這些區(qū)域的生態(tài)系統(tǒng)的完整性,是維護(hù)廣東省生態(tài)安全的基本低線。

        圖4 GSPM廣東省生態(tài)安全格局概率分布圖Fig.4 Probability distribution of ecological security pattern of GSPM in Guangdong Province

        2.3 GSPM、BSPM和OSPM的異同

        GSP、BSP和OSP本質(zhì)上都包含有生態(tài)系統(tǒng)中較重要的生態(tài)斑塊,在景觀水平生態(tài)過程中起著關(guān)鍵性的作用,是物種擴(kuò)散和維持的主要區(qū)域,是同一個(gè)類型中不同的3個(gè)層次。三者的區(qū)別在于,GSP是生態(tài)系統(tǒng)功能維持、生物多樣性保護(hù)的關(guān)鍵區(qū)域,是生態(tài)系統(tǒng)服務(wù)功能最強(qiáng)的區(qū)域;而BSP則次之;OSP內(nèi)的景觀破碎化程度較高,區(qū)域內(nèi)物種的擴(kuò)散有較高的阻力,是社會(huì)與自然交融度較高的區(qū)域。景觀一致性高的GSP,其數(shù)據(jù)的一致性高,相應(yīng)模型預(yù)測的精度也高,而BSP和OSP數(shù)據(jù)的離散度逐漸增高,模型的精度也因此而降低。

        3個(gè)模型都可預(yù)測類似的廣東省生態(tài)安全格局,但分布范圍不一樣的。將預(yù)測結(jié)果分別利用Nature breaks(jenks)[34]方式重新分類進(jìn)行對(duì)比,可以發(fā)現(xiàn):GSPM預(yù)測結(jié)果中保障安全格局占比達(dá)50.56%(圖5),而BSPM和OSPM中該類分別占42.40%和34.63%;GSPM預(yù)測結(jié)果中緩沖安全格局占比為25.21%,而BSPM和OSPM中該類分別占了31.64%和35.61%。

        圖5 GSPM、BSPM和OSPM預(yù)測結(jié)果概率區(qū)分布對(duì)比 Fig.5 Comparison of probability distributions of GSPM, BSPM, and OSPM predictionsGSPM:保障生態(tài)安全格局模型 Guaranteed security pattern model;BSPM:緩沖生態(tài)安全格局Buffered security pattern model;OSPM:最優(yōu)生態(tài)安全格局 Optimal security pattern model

        2.4 預(yù)測結(jié)果與已有規(guī)劃的異同

        Spark-LR模型的主要數(shù)據(jù)來源是佛山市高明區(qū)、三水區(qū)和順德區(qū)三區(qū)的生態(tài)安全格局已有規(guī)劃。GSPM預(yù)測的高明區(qū)生態(tài)安全格局總體上與已有規(guī)劃同區(qū)域的情況類似(圖6)。在已有規(guī)劃中,高明區(qū)東部區(qū)域緩沖安全格局占有較大比例,但在預(yù)測結(jié)果中,則是最優(yōu)安全格局占了較大比例。預(yù)測結(jié)果中,三水區(qū)的保障生態(tài)安全格局僅少量分布在北部山區(qū)較小的范圍內(nèi),與已有規(guī)劃差距較大,而順德區(qū)的預(yù)測結(jié)果沒有保障生態(tài)安全格局分布,亦跟已有規(guī)劃不一致。

        但與佛山市三區(qū)的生態(tài)安全格局對(duì)比,模型預(yù)測的廣東省生態(tài)安全格局區(qū)域尺度更大,其柵格數(shù)據(jù)在三級(jí)格局的區(qū)分中將以最優(yōu)的自然斷點(diǎn)作為依據(jù),因此預(yù)測結(jié)果中基本特征與全省特征相似的高明區(qū)與已有規(guī)劃會(huì)更接近。而如果將預(yù)測結(jié)果中三水區(qū)或順德區(qū)的數(shù)據(jù)單獨(dú)切分出來,利用自然斷點(diǎn)法進(jìn)行分類,其結(jié)果與已有規(guī)劃也會(huì)更加接近(圖7)。因此,在不同區(qū)域尺度上,生態(tài)安全格局的分布是不同的。將模型預(yù)測的結(jié)果縮小到區(qū)縣尺度,其與已有規(guī)劃亦同樣是類似的。

        圖7B箭頭指向處實(shí)際為水域,已有規(guī)劃非常注意水域的保護(hù),將其劃為保障生態(tài)安全格局(圖7A),但是在模型預(yù)測中水域的重要性并沒有體現(xiàn)出來(圖7C),圖8已有規(guī)劃中高明河兩邊的保障型生態(tài)用地,在預(yù)測結(jié)果中同樣沒有體現(xiàn)出來,這說明水域的重要性被模型忽略了。原因可能是隨機(jī)生成的樣點(diǎn)中,位于水域部分的保障生態(tài)安全格局樣點(diǎn)太少,以至于模型認(rèn)為河流在生態(tài)安全格局中的比重較低。

        在已有規(guī)劃中,規(guī)劃者有意保護(hù)高明河兩岸一定范圍內(nèi)的區(qū)域,但是GSPM預(yù)測的該區(qū)域則是建設(shè)用地,與城市擴(kuò)張的實(shí)際情況相比,城市建設(shè)用地似乎是與模型預(yù)測結(jié)果更加切合(圖8箭頭指示位置)??紤]已有規(guī)劃的時(shí)限問題,我們不能就此說明GSPM比已有規(guī)劃能更準(zhǔn)確地表達(dá)某一區(qū)域的生態(tài)安全格局,但是由此可以看到模型對(duì)城市擴(kuò)張的分布區(qū)域預(yù)測具有一定優(yōu)勢。

        圖6 已有規(guī)劃與Spark-LR模型預(yù)測生態(tài)安全格局對(duì)比Fig.6 ESP Comparison of existing plans and Spark-LR model prediction results

        圖7 三水區(qū)已有規(guī)劃與Spark-LR模型預(yù)測生態(tài)安全格局對(duì)比Fig.7 ESP comparison of existing plan and Spark-LR model prediction results in Sanshui districtA. 佛山三水區(qū)安全格局已有規(guī)劃;B. 2016年遙感影像;C. Spark-LR模型預(yù)測結(jié)果,Nature breaks(jenks)分類

        2.5 預(yù)測結(jié)果與GIS疊加法的異同

        將Spark-LR預(yù)測結(jié)果與GIS疊加分析法進(jìn)行對(duì)比(結(jié)果均采用Nature breaks(jenks)分類),可以發(fā)現(xiàn)兩個(gè)結(jié)果中的生態(tài)安全格局有一定的相似性(圖9),各類安全格局的分布都與廣東省地形比較切合,廣東省各大主要山脈是保障安全格局分布區(qū),而珠江三角洲、韓江下游和雷州半島等沿海地區(qū)是最優(yōu)安全格局分布區(qū)。然而兩種結(jié)果中保障、緩沖、最優(yōu)安全格局的分布面積卻明顯不同,常規(guī)方法的結(jié)果中廣東省保障及緩沖生態(tài)安全格局比例分別為27.09%和34.03%,而Spark-LR預(yù)測的結(jié)果中相應(yīng)的比例分別為50.56%和25.21%。盡管我們不能因此斷定Spark-LR模型預(yù)測結(jié)果在規(guī)劃上的準(zhǔn)確性,但不難發(fā)現(xiàn)機(jī)器學(xué)習(xí)預(yù)測的結(jié)果可能更加切合生態(tài)資源保護(hù)和人類社會(huì)長期發(fā)展需求,而GIS疊加結(jié)果或許需要進(jìn)一步優(yōu)化才能作為規(guī)劃結(jié)果。

        圖8 已有規(guī)劃及預(yù)測生態(tài)安全格局在高明河兩岸與城市擴(kuò)張實(shí)際情況對(duì)比Fig.8 ESP comparison of existing plan, Spark-LR prediction results and actual urban expansion on the two sides of Gaoming RiverA.已有規(guī)劃;B.2016年遙感影像;C.預(yù)測結(jié)果

        圖9 GIS疊加分析與Spark-LR預(yù)測生態(tài)安全格局對(duì)比Fig.9 Comparison of GIS overlay Analysis and Spark-LR prediction ESP

        3 結(jié)論與討論

        1)利用大數(shù)據(jù)處理框架Apache Spark中的Logistic Regression機(jī)器學(xué)習(xí)模型,通過對(duì)現(xiàn)有規(guī)劃中生態(tài)安全格局里保障生態(tài)安全格局(GSP)、緩沖生態(tài)安全格局(BSP)和最優(yōu)生態(tài)安全格局(OSP)數(shù)據(jù)與巖性、土壤質(zhì)地、土壤類型、用地類型、植被歸一化指數(shù)、海拔、坡度、陰陽坡向、曲率、斷層距離、道路距離、河流距離、建設(shè)用地距離、年均降雨量、年均氣溫、年均風(fēng)速、人口密度等環(huán)境變量之間關(guān)系的訓(xùn)練學(xué)習(xí),可以得到相應(yīng)的回歸模型,利用該模型在GIS中對(duì)環(huán)境變量的回歸重構(gòu),可以預(yù)測出其他區(qū)域的生態(tài)安全格局分布情況。

        2)保障生態(tài)安全格局模型(GSPM)預(yù)測精度達(dá)到90.58%,模型擬合的精度非常好,對(duì)生態(tài)安全格局的預(yù)測準(zhǔn)確性高;以Nature breaks (jenks)方式重新分類之后,得到的保障安全格局高概率區(qū)比例高達(dá)50.56%,在實(shí)際應(yīng)用中,有一定的參考價(jià)值。而緩沖安全格局模型和最優(yōu)安全格局模型的預(yù)測精度分別只有86.49%和71.11%,前者的保障安全格局高概率區(qū)比例為42.40%,后者的只有34.36%。

        3)對(duì)區(qū)域尺度進(jìn)行劃分后,Spark-LR對(duì)生態(tài)安全格局的預(yù)測結(jié)果與已有規(guī)劃成果非常接近,但是模型容易受到樣點(diǎn)分布均衡性的影響;模型預(yù)測與GIS疊加分析的生態(tài)安全格局有一定的相似性,但預(yù)測的結(jié)果更加切合生態(tài)資源保護(hù)和人類社會(huì)長期發(fā)展需求,而GIS疊加結(jié)果則需要進(jìn)一步優(yōu)化才能作為規(guī)劃結(jié)果。

        4)Spark-LR機(jī)器學(xué)習(xí)模型對(duì)生態(tài)安全格局中城市擴(kuò)張的分布區(qū)域預(yù)測具有一定的客觀優(yōu)勢。

        機(jī)器學(xué)習(xí)的研究不僅是人工智能研究的重要問題,而且已成為計(jì)算機(jī)科學(xué)與技術(shù)的核心問題之一[35]。我們嘗試?yán)么髷?shù)據(jù)計(jì)算框架Apache Spark下的機(jī)器學(xué)習(xí)對(duì)生態(tài)安全格局進(jìn)行了模擬分析,向地理人工智能(GEOAI)探出了一小步,同時(shí)也遇到許多值得我們進(jìn)一步探討的問題。GIS本身與大數(shù)據(jù)是密不可分的,國內(nèi)外都有學(xué)者在研究空間大數(shù)據(jù)的分析處理[36],但如何用大數(shù)據(jù)平臺(tái)的機(jī)器學(xué)習(xí)自動(dòng)構(gòu)建生態(tài)安全格局仍需要進(jìn)一步探索。機(jī)器學(xué)習(xí)在生態(tài)安全格局構(gòu)建過程中環(huán)境變量選擇,是模型是否準(zhǔn)確的關(guān)鍵問題之一,模型中到底該選擇哪些變量值得深入探討。雖然Logistic Regression模型是較常用的模型,但是在Spark-LR中,正則化參數(shù)和ElasticNet混合參數(shù)的設(shè)置都會(huì)影響到模型的精度,如何設(shè)置調(diào)優(yōu)模型亦有一定的探討空間。關(guān)于大數(shù)據(jù)機(jī)器學(xué)習(xí)與生態(tài)安全格局構(gòu)建及其相關(guān)領(lǐng)域的結(jié)合,仍有較多的未知領(lǐng)域,隨著大數(shù)據(jù)的發(fā)展及我國對(duì)生態(tài)環(huán)境更進(jìn)一步的重視,機(jī)器學(xué)習(xí)與生態(tài)系統(tǒng)服務(wù)、生物多樣性保護(hù)、生態(tài)環(huán)境規(guī)劃、城市空間優(yōu)化等領(lǐng)域的結(jié)合將會(huì)有更多契機(jī)。

        致謝:廣東省氣象局災(zāi)害中心劉尉博士幫助氣象數(shù)據(jù)分析,華南理工大學(xué)建筑學(xué)院袁奇峰老師對(duì)研究提供幫助,特此致謝。

        猜你喜歡
        柵格格局分類
        基于鄰域柵格篩選的點(diǎn)云邊緣點(diǎn)提取方法*
        分類算一算
        格局
        分類討論求坐標(biāo)
        聯(lián)手共建 努力打造大調(diào)解工作格局
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        小人物的大格局
        小說月刊(2015年12期)2015-04-23 08:51:10
        不同剖面形狀的柵格壁對(duì)柵格翼氣動(dòng)特性的影響
        基于CVT排布的非周期柵格密度加權(quán)陣設(shè)計(jì)
        97久人人做人人妻人人玩精品| 亚洲一区二区三区在线| 一区二区三区一片黄理论片| 国产av无码专区亚洲av麻豆| 亚洲国产成人久久综合下载| 免费一区啪啪视频| 国产自产自现在线视频地址| 国产自拍视频在线观看免费| 男女高潮免费观看无遮挡| 99re这里只有热视频| 日韩精品极品视频在线免费| 亚洲综合一区二区三区天美传媒| 蜜桃久久精品成人无码av| 国产精品开放小视频| 永久免费在线观看蜜桃视频| 亚洲免费国产中文字幕久久久| 日韩成人无码| 91人妻无码成人精品一区91| 69久久精品亚洲一区二区| 亚洲最大成人网站| 亚洲av无码一区二区三区四区 | 精品一区二区三区在线观看l| 麻豆成人久久精品一区| 24小时日本在线视频资源| 亚洲自偷自偷偷色无码中文| 国产精品自在在线午夜出白浆| 人妻少妇精品视频一区二区三区l| 在线成人一区二区| 欧美成人a在线网站| 国产大屁股白浆一区二区三区| 国产亚州精品女人久久久久久| 竹菊影视欧美日韩一区二区三区四区五区| 久久99久久99精品观看| 亚洲国产一区二区三区精品| 日韩国产成人无码av毛片蜜柚| 久久一区二区三区四区| 日本一区二区免费看片| 天天摸夜夜摸摸到高潮| 国产2021精品视频免费播放| 久久夜色精品亚洲天堂| 丰满熟妇乱又伦精品|