亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori算法的沿海地區(qū)洪澇災害成因分析

        2023-05-26 12:25:38吳嘉欣林凱榮劉梅先黃利燕
        中國農村水利水電 2023年5期
        關鍵詞:關聯(lián)規(guī)則

        吳嘉欣,林凱榮,2,3,劉梅先,2,3,黃利燕

        (1.中山大學 土木工程學院,廣東 珠海 519082; 2.廣東省海洋土木工程重點實驗室,廣東 珠海 519082;3.廣東省華南地區(qū)水安全調控工程技術研究中心,廣東 珠海 519082)

        0 引 言

        近幾十年以來,隨著全球氣候變化以及不斷加快的城鎮(zhèn)化進程,城市洪澇災害愈加頻繁,造成了巨大損失[1,2]。因此,研究城市洪澇災害的成災機理以及相關防災減災技術,在當前氣候與城鎮(zhèn)變化條件下顯得尤為重要。目前,評估洪澇災害的方法主要包括物理模型、數(shù)值模型和經驗方法[3]。物理模型運算復雜且需要大量觀測數(shù)據(jù)驗證,在應用中受到較大的限制[4],數(shù)值模型則可通過大量水文、地形等數(shù)據(jù)來模擬實際過程,因此很大程度上已取代物理模型[5],隨著GIS和遙感的發(fā)展,經驗模型開始應用于在洪澇災害評價中[6]。定量的方法依賴于數(shù)據(jù),定性的方法受限于專家,半定量的多準則決策方法(Multi-Cri‐teria Decision-Making,MCDM)由于結合兩者的優(yōu)點得到廣泛的應用[3],MCDM主要分為層次分析法、網絡分析方法、模糊邏輯法、逼近理想值排序法等[7],它可以從致災因子、孕災環(huán)境以及城市本身的承載能力[8]的角度進行綜合分析。如Zhong等[9]結合云信息擴散模型與層次分析法,建立山洪災害風險評估模型;Lin[10]等提出一種基于改進層次分析法和最大似然聚類的山洪綜合風險評估法,以廣東省為例驗證了該方法的可靠性;黃國如等[1]從危險性、易損性角度選取指標建構評估體系,對珠三角地區(qū)城鎮(zhèn)化前后城市洪澇風險進行分析。

        需要指出的是,經驗模型評估的準確性取決于洪澇影響因子的選取。然而,在選取影響因子和構建指標體系時,經常依賴于專家知識和專業(yè)文獻。由于不同學者對災害的認知和定義不同[8],相關評估方法尚未形成統(tǒng)一的標準,指標評估體系的客觀性和一致性均受到限制。降雨作為洪澇災害最直接的驅動因素,洪災的發(fā)生與一定時段內降雨總量有關,時段內的降雨量對災害評估起決定性作用,但目前尚未確定哪個指標是評估洪澇災害的最佳指標?;诖?,本文以沿海城市——廣東省湛江市赤坎區(qū)為例,提出了一個基于k-means聚類和Apriori算法的城市洪澇災害成因分析框架,采用Apriori算法來分析洪澇災害的成災機制,選取降雨、高程、坡度、不透水率和距河距離等因素作為指標[11,12],探索赤坎區(qū)洪澇災害成災機制。

        1 研究區(qū)域與數(shù)據(jù)來源

        1.1 研究區(qū)域

        以廣東省湛江市赤坎區(qū)為研究區(qū)域(圖1)。湛江市位于廣東省西南部,赤坎區(qū)是湛江市的中心城區(qū),區(qū)域面積6 205 hm2,地勢由西北向東南傾斜,最高海拔43 m,平均海拔19 m,西部、北部為崗丘起伏的臺地地區(qū),東南部為低平的海積平原和島嶼。區(qū)境內有8條河溪,多年平均降雨量為1 596 mm。赤坎區(qū)作為湛江市中心城區(qū),城鎮(zhèn)建設用地多,占全區(qū)土地總面積的63.16%,加之其地處湛江灣西北岸,屬于臺風、風暴潮多發(fā)地,極易引發(fā)洪澇災害。如2015年10月4日臺風“彩虹”從湛江坡頭區(qū)登陸,赤坎區(qū)降雨量達300 mm,多處遭遇洪水侵襲,直接經濟損失0.64億元。

        圖1 研究區(qū)域Fig.1 Maps of the study area

        1.2 數(shù)據(jù)來源

        不同持續(xù)時間降雨數(shù)據(jù)來源于廣東省水文站、雨量站共440站的長序列雨量資料。DEM數(shù)據(jù)來源于中國科學院資源環(huán)境科學數(shù)據(jù)中心的遙感影像數(shù)據(jù),分辨率為30 m×30 m。土地利用數(shù)據(jù)來自地理檢測云平臺土地資源類數(shù)據(jù)集(分辨率30 m)。歷史洪水資料來自廣東省洪災調查數(shù)據(jù)。1、3、6、12和24 h多年平均最大降雨通過ArcGIS克里金插值得到,不透水率基于土地利用類型重新賦值[13],距河距離的指標使用歐幾里得公式計算。

        2 研究方法

        2.1 k-means聚類

        采用k-means聚類方法對各風險指標進行分組,其作用是將大數(shù)據(jù)劃分成有意義的幾組(簇),具有“組內差異小,組外差異大”的特點。使用Apriori算法對數(shù)據(jù)庫進行挖掘之前,需將連續(xù)指標進行離散。k-means聚類算法是根據(jù)觀測距離將x劃分為k個維度,具體步驟為:

        (1)隨機抽取k個樣本作為初始質心g=1,2,…,k)。

        (2)將每個樣本點分配到離它們最近的質心,生成k個簇。

        (3)對于每個簇,計算所有被分到該簇的樣本點xi的平均值作為新的質心,目的是樣本點到其所在簇的質心距離最小。對于離散指標,如不透水率,則按原屬性分為4類。對于連續(xù)指標,如降雨指標、高程、坡度等,使用歐幾里得距離作為計算公式將其分成4類:

        (4)重復以上步驟,當質心的位置不再發(fā)生變化時,迭代停止,聚類完成。

        各風險指標按以上流程進行聚類,洪澇災害等級圖根據(jù)赤坎區(qū)收集的洪澇災害清單,通過不同淹沒深度對市民日常生活的影響[14],將其劃為4個等級(表1),其空間分布見圖2,各指標分類結果見表2,風險指標空間分布見圖3。

        表1 赤坎區(qū)城市洪澇等級劃分Tab.1 Classification of urban flood in Chikan district

        表2 洪澇災害等級與風險指標分類Tab.2 Classification of flood hazards and the risk indicators

        圖2 赤坎區(qū)洪澇災害分布圖Fig.2 Distribution of urban flood in Chikan district

        圖3 各風險指標空間分布Fig.3 Spatial distribution of the risk indictors

        2.2 Apriori算法

        關聯(lián)規(guī)則已在商業(yè)、醫(yī)學和災害管理等領域得到廣泛應用,關聯(lián)規(guī)則挖掘是一種重要的數(shù)據(jù)挖掘方式[15],如基于多候選項集的Apriori算法,基于模式增長的FP-growth算法和基于垂直格式的Eclat算法。關聯(lián)規(guī)則暗示兩個事件之間可能存在的很強關系,是一種非監(jiān)督學習算法。關聯(lián)規(guī)則表示為:“A→B”,假設I為數(shù)據(jù)庫中所有項的集合,D為數(shù)據(jù)庫中所有事務的集合,其中A∈I,B∈I,且A∩B=?,即事務集D是I的一個非空子集,并且A、B均包含于D中;其中,A是關聯(lián)規(guī)則的前件,B是關聯(lián)規(guī)則的后件,“A→B”稱為強關聯(lián)規(guī)則?!癆→B”是否構成強關聯(lián)規(guī)則主要取決于支持度和置信度。

        支持度是A和B在數(shù)據(jù)集I中出現(xiàn)的次數(shù)占總數(shù)據(jù)集的比重P(A∪B),它可以表示為:

        置信度是A發(fā)生的條件下,B發(fā)生的概率,是一種條件概率P(B|A),A對B的置信度為:

        Apriori算法采用一種水平搜索的迭代方法來縮小搜索空間,通過設置一組最小支持度(minSup)和最小置信度(min‐Conf),從而生成頻繁項集和強關聯(lián)規(guī)則,主要分為兩個步驟:

        (1)頻繁項集的產生。

        這一步的目標是發(fā)現(xiàn)滿足minSup的所有項集,稱為頻繁項集。

        (2)關聯(lián)規(guī)則的產生。

        從第一步產生的頻繁項集中提取所有滿足minConf的規(guī)則,稱為強關聯(lián)規(guī)則。

        2.3 風險挖掘流程

        研究所提出的流程(圖4)主要分為3個過程:數(shù)據(jù)收集、數(shù)據(jù)預處理和關聯(lián)規(guī)則挖掘,其中關鍵在于關聯(lián)規(guī)則挖掘。首先,整理降雨、高程和洪澇災害等數(shù)據(jù),初步獲取各風險指標;將風險指標進行離散化處理并分組;設置一組合適的關聯(lián)規(guī)則閾值(minSup和minConf)進行關聯(lián)規(guī)則挖掘,先識別最佳降雨指標,再提取洪澇成因強關聯(lián)規(guī)則。由于部分災害等級事件發(fā)生較少,原閾值無法獲取各等級災害的強關聯(lián)規(guī)則,需要對小概率事件進行抽樣,重新設置關聯(lián)規(guī)則閾值,對其進行深層次的分析,獲得研究區(qū)域洪澇成災機制。

        圖4 基于Apriori算法和k-means聚類的分析框架Fig.4 Framework based on Apriori algorithm and k-means clustering

        3 結果與討論

        3.1 降雨指標的識別

        根據(jù)表1各指標構建數(shù)據(jù)庫(database 1),初設關聯(lián)規(guī)則閾值進行規(guī)則提取,多次試驗并調整閾值[16,17],直至提取到滿意的結果,剔除明顯不存在因果關系的關聯(lián)規(guī)則。當minSup=0.19,minConf=0.42時,可挖掘到較為滿意的結果,如表3所示。

        表3 多降雨指標的關聯(lián)規(guī)則 %Tab.3 Association rules for multiple rainfall indices

        其中,規(guī)則1支持度為33.29%,置信度為55.35%,表明包含PD-2(多年平均最大24 h降雨為167.50~167.87 mm)和H2(中度內澇)的洪澇事件占33.29%,在PD-2的前提下,發(fā)生H2的概率為55.35%;對于規(guī)則2~11,關于H2的強關聯(lián)規(guī)則中,在支持度相近的情況下,包含PD的關聯(lián)規(guī)則置信度大于55.35%,均高于不含PD的規(guī)則,H2的出現(xiàn)通常伴隨著PD,這表明H2的發(fā)生與PD有著緊密的聯(lián)系。關于H3(重度內澇)的關聯(lián)規(guī)則12~14前件也均包含PD項集,表明大多數(shù)洪澇災害與PD有較高的關聯(lián)性。

        由于中度內澇和重度內澇的發(fā)生率較高,初次挖掘只提取到關于H2或H3的關聯(lián)規(guī)則,對數(shù)據(jù)庫進行抽樣,提取H1(輕度內澇)、H4(極重度內澇)事件,構建新的數(shù)據(jù)庫(database 2),minSup=0.37,minConf=0.80,生成16條強關聯(lián)規(guī)則,見表4。

        表4 深層挖掘多降雨指標的關聯(lián)規(guī)則 %Tab.4 Association rules based on multiple rainfall indices after sampling

        由表4可見,這些規(guī)則的前件均包含PD,且置信度均達98%;規(guī)則9~16意味著H4的出現(xiàn),必然伴隨著PD的發(fā)生。然而值得注意的是,規(guī)則前件的降雨指標中,災害更嚴重的“H4”相比“H1”,降雨量級反而更小,降雨對于災害的發(fā)生固然重要,但推動H4的發(fā)生可能還存在其他關鍵因素。這一結論與前人的研究成果相符[18],洪澇與一定時間內降雨總量有關,幾小時的短歷時強降雨,由于總量較小,一般難以形成大洪水;此外,降雨閾值對于洪水產生至關重要[19],不同區(qū)域成災的降雨歷時不同。結合表3分析,與其他降雨指標相比,PD是分析赤坎區(qū)洪澇災害成災機制最適合的降雨指標。

        3.2 洪澇成災機制分析

        不同研究區(qū)域的地形地貌、水文氣象和社會經濟條件不同,造成洪澇災害發(fā)生的機制也不同,單風險因素對一個地區(qū)的洪澇發(fā)生影響可能較小,與其他因素耦合則可能產生重要影響。將上一節(jié)最適降雨指標PD與環(huán)境因素、歷史洪澇災害數(shù)據(jù)結合構成新的數(shù)據(jù)庫(database 3),按照同樣的方法調試出關聯(lián)規(guī)則閾值,minSup=0.10,minConf=0.50,如表5所示生成風險指標的頻繁項集。

        表5 風險指標的頻繁項集 %Tab.5 Frequent item sets for risk indicators

        如表5所示,赤坎區(qū)洪澇災害的等級主要為中度和重度,結合圖3可知,赤坎地勢較為平緩,整體起伏不大,城鎮(zhèn)居民用地居多,徑流系數(shù)大導致坡面匯流增加,坡度大小又影響匯流時間,坡度緩容易積水,在臺風、風暴潮等極端事件的驅使下,洪澇災害發(fā)生的機率將大幅提高。以IR(不透水率)為例,(IR-4,H2)和(IR-4,H3)均為頻繁項集,支持度分別為32.60%和24.13%,表明洪澇災害常發(fā)生在不透水率高的地方。

        當minSup=0.10,minConf=0.50,database 3挖掘到關于H2的17條關聯(lián)規(guī)則;為獲取其他等級災害的關聯(lián)規(guī)則,對其抽樣構成數(shù)據(jù)庫database 4,新閾值當minSup=0.12,minConf=0.55,提取到關于H3的30條強關聯(lián)規(guī)則,多指標的關聯(lián)規(guī)則風險分布見圖5。圖5(a)規(guī)則前件大部分包含PD-2,其中{PD-2}→{H2}支持度最高,sup=33.29%,conf=55.35%,表明PD-2作為前因與H2一同出現(xiàn)的可能性是最高的,再次證明PD是洪澇事件發(fā)生的最直接驅動要素;{PD-2,DR-1}→{H2}置信度最高,conf=76.34%,說明環(huán)境因素中,DR-1致中度內澇災害的作用最大。如圖6所示,設minSup=0.10,minConf=0.37,獲取的14條關于H2關聯(lián)規(guī)則,支持度相差不大的情況下,前件包含PD-2的規(guī)則置信度均有不同程度的提升,提升幅度為7.65%~25.74%,其中DR-1的提升幅度最大,印證PD是中度洪澇事件發(fā)生的最直接驅動要素,環(huán)境因素中DR-1的致災效果最顯著。

        圖5 多指標關聯(lián)規(guī)則分布Fig.5 Distribution of multi-factor association rules

        圖6 降雨對單指標關聯(lián)規(guī)則的影響Fig.6 Effects of rainfall on association rules for single factors

        圖5(b)相較于(a),PD-2作為H2的最直接驅動要素,在關于H3的規(guī)則中,其地位有所下降,PD-1和PD-2作為規(guī)則前件,出現(xiàn)的頻數(shù)分別為6次和8次,意味著重度內澇發(fā)生機制更為復雜;規(guī)則{PD-2,DE-1}→{H3}和{PD-2,SD-1}→{H3}置信度較高,分別為86.8%和80.71%,重度內澇發(fā)生機制中,DE-1(高程-7~8 m)和SD-1(坡度≤1.72°)更為敏感;由圖5(b)可知,前件無PD的規(guī)則{SD-1}→{H3}和{SD-2}→{H3}支持度相近,隨著坡度的平緩,置信度提高12%,且前件包含SD-1的規(guī)則置信度均超過70%。

        總的來說,赤坎區(qū)城鎮(zhèn)居民地區(qū)多,離河距離≤284.61 m是中度內澇高發(fā)地,坡度≤1.72°或高程-7~8 m的區(qū)域是重度災害的易發(fā)地。究其原因,PD是造成當?shù)睾樗闹苯釉颍瑢τ谘睾^(qū)域,持續(xù)時間長的強降雨和風暴潮的都是誘發(fā)洪水的重要因素[20],離河較近的地方自然更易受到兩者耦合作用,直接導致沿海洪水。加上赤坎區(qū)內部地勢低洼平緩,容易積水,外部潮位影響排水系統(tǒng)[21],海水倒灌,在多因素耦合情況下,易引發(fā)嚴重的洪澇災害。

        4 結 論

        以沿海地區(qū)——廣東省湛江市赤坎區(qū)為例,構建了基于kmeans聚類和Apriori算法的城市洪澇災害成因分析框架,提取強關聯(lián)規(guī)則,探索風險因素與洪澇災害的因果關系。主要結論如下:

        (1)多年平均最大24 降雨(PD)是分析赤坎區(qū)洪澇災害成因最合適的降雨指標。降雨作為洪澇災害最直接的驅動因素,關聯(lián)規(guī)則挖掘發(fā)現(xiàn),與其他降雨強度指標相比,各等級災害均與PD指標有緊密聯(lián)系。

        (2)災害多發(fā)生于不透水率高的居民區(qū),沿海區(qū)域由于風暴潮原因,更易發(fā)生沿海洪水,潮位影響海水倒灌,地勢平緩低洼地區(qū)容易引發(fā)更嚴重的洪澇災害。

        (3)PD-2作為中度洪澇事件發(fā)生的最直接驅動要素,在重度內澇成災機制中其地位有所下降,環(huán)境因素的重要性可能提升。由于受到資料的限制,數(shù)據(jù)庫未考慮排水管網密度、潮汐等重要因子,后續(xù)的研究可以此進行深入分析,Apriori算法挖掘出的結論可為城市洪澇成因分析提供參考。

        猜你喜歡
        關聯(lián)規(guī)則
        撐竿跳規(guī)則的制定
        不懼于新,不困于形——一道函數(shù)“關聯(lián)”題的剖析與拓展
        “苦”的關聯(lián)
        當代陜西(2021年17期)2021-11-06 03:21:36
        數(shù)獨的規(guī)則和演變
        “一帶一路”遞進,關聯(lián)民生更緊
        當代陜西(2019年15期)2019-09-02 01:52:00
        規(guī)則的正確打開方式
        幸福(2018年33期)2018-12-05 05:22:42
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對我國的啟示
        jjzz日本护士| 性无码专区无码| 国自产偷精品不卡在线| 在线视频中文字幕乱人伦| 白嫩少妇在线喷水18禁| 久久99热国产精品综合| 国产精品久久久久影院| 免费av在线国模| 日本熟妇视频在线中出| 国产乱人伦偷精品视频免观看| 人人妻人人澡人人爽人人精品97| 狠狠色综合播放一区二区| 日韩人妻免费一区二区三区| 我和丰满妇女激情视频| 欧美成人午夜精品久久久| 国产系列丝袜熟女精品视频| 国内揄拍国内精品久久| 日产精品99久久久久久| 囯产精品一品二区三区| 成人午夜免费福利| 久久久亚洲av成人乱码| 日韩精品视频一区二区三区| 亚洲人成网站77777在线观看| 青青草一级视频在线观看| 亚洲综合偷自成人网第页色| 骚片av蜜桃精品一区| 国产亚洲精品日韩综合网| 中国黄色偷拍视频二区| 日本天堂免费观看| 97久久久久人妻精品专区| 亚洲免费视频一区二区三区| 久久中文字幕人妻淑女| 久久久久久久岛国免费观看| 国产桃色在线成免费视频| 国产午夜福利小视频在线观看| 少妇久久久久久人妻无码| 久久久无码一区二区三区| 国产精品一区二区日韩精品| 一区二区精品国产亚洲 | 亚洲av无码乱观看明星换脸va| 亚洲日韩AV无码美腿丝袜 |