亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進的三層機器學習搜索法極端降雨區(qū)域頻率估計

        2023-02-19 09:03:34左惠強尹建明
        中國防汛抗旱 2023年1期
        關鍵詞:同質置信區(qū)間時間尺度

        楊 哲 楊 昆 呂 娟 左惠強 尹建明

        (1.中國再保險(集團)股份有限公司博士后工作站,北京 100033;2.中國水利水電科學研究院,北京 100038;3.水利部防洪抗旱減災工程技術研究中心,北京 100038;4.中國財產再保險有限責任公司,北京 100033;5.中再巨災風險管理股份有限公司,重慶 400020)

        1 研究背景

        受氣候變化影響,極端降雨事件日漸頻繁,并對現(xiàn)今社會造成嚴重影響[1-2]。Mondal 等[3]將ENSO(El Ni?o-Southern Oscillation)指數(shù)、全球平均地表氣溫和印度平均氣溫作為指標,發(fā)現(xiàn)100年回歸期的極端降雨頻率在局部地區(qū)呈上升趨勢。Simonovic 等[4]分析了加拿大各地的極端降雨事件的頻率和強度,發(fā)現(xiàn)中西部地區(qū)和東海岸地區(qū)存在相反變化趨勢。Fernandes等[5]比較了1979—1999年和2000—2015年兩個時期巴西的極端降雨事件,在年降雨量和極端降雨的形成機制上都發(fā)現(xiàn)顯著的變化。Ma等[6]分析了中國東南部632個觀測站1969—2013年的日降雨量記錄,發(fā)現(xiàn)高強度的降雨事件頻率在有上升趨勢,而中小強度降雨事件頻率呈減少趨勢。

        強度-歷時-頻率(IDF)曲線用于描述某一站點不同重現(xiàn)期、不同歷時的降雨強度量級。站點的頻率分析法通常分為兩大類:單站點序列分析法,僅用目標站點的歷史數(shù)據(jù)進行IDF曲線的擬合;區(qū)域頻率分析法,利用相似因子,收集大量擁有相似降雨特征的站點資料,用這些資料進行IDF 曲線的擬合[7]。相比于單站點的頻率分析,使用大量樣本的區(qū)域頻率分析法能降低降雨強度估計值的不確定性。在區(qū)域頻率分析中,收集的與目標站點擁有相似降雨特征的站點的集合被稱為同質群體。

        同質群體的組建直接影響降雨強度估計值的不確定性。選取的相似因子作為衡量標準,其中包括站點的地理位置特征,或通過其歷史氣象資料計算得到的年平均降水量、年平均降雨天數(shù)等[7-10]。相比于站點的地理位置特征,氣象特征更易受氣候變化的影響,可以更有效揭示氣候變化下不同時期降雨事件頻率的變化[11-16]。為考慮在氣候變化對不同地點上極端降雨事件頻率的影響,以及極端降雨事件的空間差異性,Yang等[17]提出了一種基于機器學習的三層搜索算法,其使用了禁忌搜索法為擁有不同地理和氣象特征的目標站點選擇出不同的相似性因子,通過這些相似因子進行站點的聚類,進而得到最優(yōu)的同質群體。為了減少相似因子之間的相關性對站點聚類過程中的影響,三層搜索算法使用拉格朗日乘數(shù)法進行。

        為進一步降低降雨強度估計值的不確定性,本文從兩個方面對現(xiàn)有的三層搜索法進行改進:①提高算法對非線性相似因子中非冗余信息提取的有效性。本文將用特征提取法取代特征加權法進行相似因子間有效信息的提取。②減少同質群體組建過程中對原始輸入的依賴。本文將在三層搜索法的框架中添加一種監(jiān)督站收集技術作為組成同質群體的另一種方法。

        2 研究區(qū)域和數(shù)據(jù)

        本文選擇加拿大不列顛哥倫比亞省作為研究區(qū)域。由于靠近海洋和山區(qū),其獨特的地理位置使得該地區(qū)主要呈太平洋海洋和科迪勒拉山系氣候類型,層狀降雨將是該地區(qū)主要的降雨類型。本文選取了不列顛哥倫比亞省內現(xiàn)有的86 個站點的雨量數(shù)據(jù)進行試驗,其過程所需要的數(shù)據(jù)如下:

        (1)降雨年最大值序列。分別在86個站點上,收集歷時分別為5 min、10 min、15 min、30 min、1 h、2 h、6 h和12 h的降雨年最大值序列。這些數(shù)據(jù)有兩個特點:一是時間跨度不統(tǒng)一,最長可達到40 a;二是時間上重復度最高的時段是1985—2004年。

        (2)特征因素的提取。從美國國家海洋和大氣管理局(NOAA)測繪產品數(shù)據(jù)庫、全球集合預報系統(tǒng)再分析數(shù)據(jù)產品(GEFS/R)和歐洲中期天氣預報中心的全球預報再分析數(shù)據(jù)產品(ERA-interim)中,在不同的層級高度上提取了1985—2004 年的氣象相似因子年序列,其時間分辨率為6 h。提取的相似因子如表1所示。

        表1 三層結構中可能的相似因子

        3 研究方法

        3.1 基于三層機器學習搜索法的極端降雨區(qū)域頻率估計

        3.1.1 區(qū)域頻率分析法

        在區(qū)域頻率估計法中,假設同質群體內所有站點的降雨序列具有相同的頻率分布,則不同回歸期的降雨強度估計可用以下指數(shù)方程求得[7]:

        式中:D表示降雨歷時,h;?T,D是重現(xiàn)期為T年降雨歷時為D的降雨強度估計值;是單個站點在降雨歷時為D情況下的歷史年平均強度值,?T,D是無量綱的分布函數(shù)曲線。其具體實施步驟(圖1)如下[7]:

        圖1 區(qū)域頻率估計法框架圖

        (1)站點篩選。通過Pettitt 檢驗或Mann-Kendall 非參數(shù)檢驗,檢查現(xiàn)有站點的降雨年時間序列,選著擁有平穩(wěn)時間序列的雨量站。

        (2)相似因子的選擇。在傳統(tǒng)的區(qū)域頻率分析法中,選擇相似站點與目標站點的地理距離作為相似因子。

        (3)形成同質群體。設定相似因子的上限值,收集范圍內特征相似的站點,組成可能的同質群體。

        (4)同質群體的評估。對上一步得到的同質群體組進行異質性檢驗,對不符合同質性標準的同質群體組進行調整,即減少其群體內已有的相似站點,直至滿足同質性標準為止。

        (5)不同回歸期的降雨強度估計。根據(jù)步驟(4)得到的同質群體中的降雨序列,識別合適的分布函數(shù),進而估計目標站點不同回歸期下的降雨強度。

        (6)量化分位點的置信區(qū)間。利用同質群體中的降雨序列中得到的線性矩,進行1 000次的參數(shù)抽樣,模擬對不同降雨強度分位數(shù)的置信區(qū)間進行估計。

        作為整個估計過程中最重要的一步,同質群體的組成直接影響降雨強度分位點估計的不確定性。為了形成更優(yōu)的同質群體,Yang等提出了一種基于機器學習的三層搜索算法[17]。

        3.1.2 基于機器學習的三層搜索算法

        三層搜索算法將極端降雨的形成過程分為:行星邊界層以外云的形成,城市混合層中降雨的產生,以及城市表層降雨強度受地面影響而變化[17-19]。

        第一層:為了區(qū)分兩種極端降雨誘導云(積雨云或雨層云),選擇了對流有效勢能指數(shù)以及其他在300 hPa 和700 hPa 氣壓高度之間的氣象相關特征為可能的相似因子作為搜索的輸入[20-21],以用來確定目標站點上極端降雨誘導云影響的空間范圍作為最初的同質群體[17]。此層中最能影響極端降雨云形成的相似因子為對流有效勢能。

        第二層:在第一層輸出的同質群體的基礎上,為進一步考慮區(qū)域尺度上的氣象和地理特征,選取了氣壓高度在850 hPa以上的氣象和地理要素為可能的相似因子作為搜索法的輸入,以確定區(qū)域尺度上目標站點的同質群體。此層中最能影響區(qū)域極端降雨的相似因子為水汽通量散度的垂直積分[20-21]。

        第三層:在第二層輸出的同質群體的基礎上,為考慮城市化效應對降雨的影響,選擇能反映城市熱島效應、冠層效應和氣溶膠效應相關特征要素為可能的相似因子作為搜索法的輸入,進而形成最終的同質群體[13,18,22]。

        原始三層搜索法的步驟如圖2所示。

        圖2 原始三層搜索法框架圖

        (1)相似因子的初選。在第一層中,選著合適的相似性指標作為同質群體形成的衡量標準。

        (2)非冗余信息的提取。在選取的相似因子上應用特征權重即拉格朗日乘數(shù)法,得到每個相似指標相應權重。

        (3)同質群體的形成。采用乘以權重后的相似因子作為衡量標準,使用模糊C 均值聚類法,形成同質群體,并采用區(qū)域頻率法計算不同分位點對應的置信區(qū)間寬度。

        (4)得到第一層最優(yōu)的同質群體及其對應相似因子組合。運用禁忌搜索法,以步驟(3)得出置信區(qū)間的寬度為指引,選擇下一個可能較優(yōu)的相似因子組合。重復使用步驟(1)~(3)直至達到預設的搜索次數(shù)上限,得到最優(yōu)的相似因子組合。

        (5)得到最終的同質群體。分別在第二、第三層中,重復步驟(1)~(4)。在層與層的銜接中,上一層輸出的同質群體會被作為輸入的測試區(qū)域進人下一層,直至得到最終的同質群體。

        本文將針對上述步驟中(2)和(3)中所用到的非冗余信息的提取和形成同質群體所用到的聚類方法進行改進。

        3.2 改進的三層搜索法

        3.2.1 等距特征映射

        作為特征權重法,拉格朗日乘數(shù)法適用于線性相關因子之間非冗余信息的提取,但不適用于非線性因子間的信息提取??紤]相似因子之間的非線性相關,為了提高非冗余信息的有效率,本文采用了非線性特征提取方法等距特征映射(ISOMAP)進行因子相關性的處理。

        歐式空間并不能較好地描述非線性相關數(shù)據(jù)點之間的相對關系。在傳統(tǒng)的機器學習方法中,數(shù)據(jù)點之間的距離和映射函數(shù)都是定義在歐式空間上的。然而在實際情況中,傳統(tǒng)歐式空間的度量難以用于真實世界的非線性數(shù)據(jù)點,因此需要對數(shù)據(jù)的空間分布引入新的假設。等距特征映射使用了流形假設,其認為數(shù)據(jù)點分布在嵌入于外維歐式空間的一個潛在的流形上,或者說這些數(shù)據(jù)點可以構成這樣一個潛在的流形體。

        等距特征映射是一種圖形演算法,通過使用點之間的最短路徑的距離對加權圖上的相互關系進行重新構建,在此過程中保留點的原始幾何結構[23],其大致做法可總結為:

        (1)組建相鄰區(qū)域。根據(jù)目標流形上所有兩點之間的距離,通過選擇與目標點距離低于設定閾值的數(shù)據(jù)點或收集特定數(shù)目的鄰近點組成相鄰區(qū)域。然后使用加權圖G來表示相鄰區(qū)域之內數(shù)據(jù)點的關系。

        (2)最短路徑的計算?;诹餍紊闲纬傻募訖鄨D,計算每個鄰域中所有兩點之間的最短距離,并將該最短距離用作測地距離形成的距離矩陣

        此處采用了Floyd 算法或Dijkstra 算法進行最短路徑的計算。

        (3)在新維度上構建降維數(shù)據(jù)。對從獲得的距離矩陣使用多維尺度變換法。通過將數(shù)據(jù)嵌入d維歐氏空間Y,以保持目標流形上原始的幾何結構[24]。使用以下等式得到數(shù)據(jù)在歐氏空間Y下的新分布:

        從相關特征中提取的非冗余信息將用作同質群體形成的相似因子。

        3.2.2 影響區(qū)域法

        為了進一步降低降雨強度估計值的不確定性,在改進的三層搜索的框架中,加入影響區(qū)域法(ROI)作為另一種形成同質群體的方法。作為一種監(jiān)督算法,當輸入組中有足夠數(shù)量與目標站點擁有相似降雨特征的站點時,影響區(qū)域法通常優(yōu)于模糊均值聚類法找到最優(yōu)的同質群體。通過使用相似因子來計算與目標站點的歐幾里德距離,并采用異質性估量指標,去衡量該站點是否屬于目標站點的同質群體[25-26]。本文使用的異質性度量指標為[27]:

        其中

        式中:μ為提取序列的均值;Vk為選用的計算指標;σ為提取序列的方差;tˉ2、tˉ3、tˉ4為L-均值(L- mean)、L-變差系數(shù)(L-Cv)和L-偏態(tài)系數(shù)的區(qū)域值;t2(i)、t3(i)、t4(i)為單個測站的0 階、一階、二階的線性矩;ni為站點i降雨序列中的樣本數(shù)目;R代表同質群體中的站點數(shù)目。當異質性度量指標Hk小于1 時,此同質群體可認為是均勻同質的,當1<Hk<2 時,此同質群體被認為可能是均勻同質的[7]。

        3.2.3 改進的流程

        在原始三層搜索法的基礎上,加入上述兩種方法,得到改進版的三層搜索法框架如圖3所示。與原始方法相比,新框架將在以下幾個步驟中進行改進:

        (1)非冗余信息的提取。用等距特征映射替換原始拉格朗日乘數(shù)法,對選擇的相似因子進行非冗余信息的提取。

        (2)同質群體的形成。影響區(qū)域法作為輔助法所形成的同質群體,會與用模糊C 均值聚類法所得的同質群體進行比較,取置信度區(qū)間較窄的同質群體為最優(yōu)。

        圖3 改進的三層搜索法框架圖

        4 結果分析

        4.1 基礎數(shù)據(jù)分析

        根據(jù)三層搜索法的層結構描述,各層的相似因子會受到不同時間尺度的氣象條件影響。為了更好地描述不同層的降雨相關特征,需要分析各層相似因子不同時間尺度下提取值,以選擇最優(yōu)時間尺度上的特征提取值。

        為了選取每層相似因子提取值的最優(yōu)時間尺度,本文采用每層最能影響降雨過程的相似因子與其他因子的相關系數(shù)作為時間尺度的衡量標準。每層因子在不同時間尺度上的提取值通過使用離散小波變換而得到。在第一層,所有站點提取值的相關系數(shù)在128 d的時間尺度上達到最高值。這128 d的長時間尺度可被認為是合理的:①雖然降水過程是一個中尺度大氣過程,但它可能會受到大尺度現(xiàn)象的影響,包括云的形成、冷暖鋒碰撞等。②在三層設計中,第一層中的因子被用作收集在大尺度上具有相似極端降雨相關大氣特性的站點。③研究表明,與極端事件相關的大氣運動、或對流有效勢能相關的特征,都與西非和印度季風的季節(jié)性遷移具有強烈的季節(jié)性相關性[28-29]。在第二層,對于大多數(shù)的站點而言,相關系數(shù)在時間尺度為64 d 達到最大值,則64 d 被用作在第二層的時間尺度。在第三層中,由于同質群體的形成主要是依靠24 h的降雨序列作為判斷,第三層的特征提取值采用24 h 作為時間尺度。不同時間尺度上的特征值提取值的相關分析只在第一層和第二層中進行。

        圖4 和圖5 顯示了各站點相似因子之間的相關系數(shù)存在空間差異。盡管在每個站點,其在第一層或第二層的相似因子分別在128 d 或64 d 的時間尺度取得與最能影響降雨過程的相似因子最高的相關系數(shù)值,但這些相關值在不同站點上仍存在重大差異。這一結果在另一方面也證明,不同站點上的降雨相似性指標存在空間差異。

        圖4 第一層不同站點上可能相似因子間的相關系數(shù)

        圖5 第二層不同站點上可能相似因子間的相關系數(shù)

        4.2 對比分析

        在研究區(qū)域,本文通過趨勢檢驗法,篩選出75個站點具有平穩(wěn)序列特征,提取不同時間尺度上的特征值,用其進行同質群體組建,得出以下結論:

        (1)模糊聚類法和影響區(qū)域法同樣有效的。對兩種方法得到的在不列顛哥倫比亞省中的75 個雨量站里,49 個站點使用模糊聚類法所得到置信區(qū)間會比使用影響區(qū)域法得到的要窄。

        (2)改進三層搜索算法較原始算法產生更優(yōu)的同質群體。本文使用區(qū)域分位點估計值與真值的均方根誤差(RMSE)作為同質群體的比較。此處的真值指用單站點頻率估計法得到的不同回歸期下的降雨強度分位點。單站點頻率估計法通常適用于擁有長序列資料的站點[30]。分別在2 a、5 a、10 a、25 a、50 a 和100 a 的重現(xiàn)期得到對應的區(qū)域估計值和單點估計值,最終取這6個回歸期的均方根誤差的平均值作為判斷標準。較優(yōu)的同質群體會具有較低的均方根誤差值。采用同質群體間的對比方法進行均方根誤差值的比較,改進算法在研究區(qū)域的75 個站點中的63 個站點能產生更優(yōu)的同質群體。

        (3)改進三層搜索算法較傳統(tǒng)區(qū)域頻率分析法產生更優(yōu)的同質群體。傳統(tǒng)的區(qū)域頻率分析法通常采用距目標站點的地理距離作為收集同質群體的相似指標。此處同樣將區(qū)域分位點估計值與真值的均方根誤差作為同質群體的比較。圖6顯示了在6個回歸期上,分別由改進方法和傳統(tǒng)地理方法得出的同質群體的均方根誤差值之間的比率。其中由于在改進算法的搜索過程,均方根誤差在6個回歸期的平均值被作為指引,導致圖6中處于低回歸期均方根誤差比值在1以上,但在其他回歸期上改進法所提供的同質群體都會產生較低的均方根誤差。

        圖6 傳統(tǒng)區(qū)域頻率分析法和改進三層搜索法在均方根誤差值上的對比(4)改進三層搜索算法較單站點頻率分析法提供的結果不確定性更低。此處使用分位點的置信區(qū)間寬度作為衡量標準進行比較。對于分位點的置信區(qū)間寬度估計,區(qū)域頻率分析法通過對線性矩的大樣本模擬而進行估計,單站點頻率分析則假設其置信區(qū)間的寬度服從正態(tài)分布并使用非參數(shù)抽樣法進行估計[7]。圖7表明,在高回歸期,所有臺站的置信區(qū)間的寬度比中值均低于1,因此改進算法產生的大多數(shù)同質群體在6個重現(xiàn)期上產生較低的不確定性,即較窄的置信區(qū)間的寬度。

        圖6 傳統(tǒng)區(qū)域頻率分析法和改進三層搜索法在RMSE值上的對比

        圖7 原三層搜索法和改進三層搜索法在置信區(qū)間寬度上的對比

        為了進一步證明改進算法的有效性,本文對75個站點得到的相似因子組合進行了聚類分析,并得到以下結論:

        (1)對于第一、二層的75個站點的相似因子組合,聚類分析得到的有效群體數(shù)都為2。此結論與前兩層改進算法的設計目的一致:在第一層,區(qū)分積雨云或雨云引起的極端降雨事件;在第二層,區(qū)分對流降雨和層狀降雨的目的。

        (2)第一、二層中的聚類分析中,各群體中心的相似因子組合之間存在相同因子,如表2所示。對于第一、二層,從宏觀和區(qū)域尺度上看,相近的地理位置意味著相似的氣候特性,進而導致不同群體中云和雨的形成機制存在一定程度的相似性。

        表2 第一層、第二層群體中心相似因子組合

        5 結 論

        考慮到氣候變化和城市化的影響,改進的三層搜索算法,能夠進一步考慮極端降雨強度在空間上的差異性,形成最優(yōu)的同質群體,降低降雨強度分位點的不確定性。本文提出了兩點改進:①考慮相似因子之間非線性相關性,等距特征映射取代特征加權方法,提取相似因子間的非冗余信息,作為目標站點的降雨相似性指標。②影響區(qū)域法作為一種額外的同質群體形成方法,提高同質群體的形成結果。

        改進后的版本已經在加拿大的不列顛哥倫比亞省中的兩種氣候進行了大量的測試。與傳統(tǒng)的地理方法相比,改進法提高了同質群體的組成,降低了區(qū)域頻率估計值的不確定性。但此法的最大弊端在于搜索過程需要大量計算,耗時較長。

        猜你喜歡
        同質置信區(qū)間時間尺度
        時間尺度上非完整系統(tǒng)的Noether準對稱性與守恒量
        定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
        時間尺度上Lagrange 系統(tǒng)的Hojman 守恒量1)
        力學學報(2021年10期)2021-12-02 02:32:04
        p-范分布中參數(shù)的置信區(qū)間
        交直流混合微電網多時間尺度協(xié)同控制
        能源工程(2021年1期)2021-04-13 02:06:12
        多個偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
        列車定位中置信區(qū)間的確定方法
        “形同質異“的函數(shù)問題辨析(上)
        大連市暴雨多時間尺度研究分析
        同質異構交聯(lián)法對再生聚乙烯的改性研究
        中國塑料(2016年11期)2016-04-16 05:26:02
        国产无人区码一码二码三mba| 亚洲无av码一区二区三区| 国产三级不卡在线观看视频| 亚洲精品无人区一区二区三区| 亚洲av免费看一区二区三区| 少妇被黑人嗷嗷大叫视频| 亚洲午夜成人精品无码色欲| 亚洲乱亚洲乱妇无码麻豆| 国产女主播喷水视频在线观看| 女的把腿张开男的猛戳出浆 | 国产网友自拍亚洲av| 日本不卡不二三区在线看| 草草影院ccyy国产日本欧美| 欧美怡春院一区二区三区| 忘忧草社区www日本高清| 成人天堂资源www在线| 日韩精品精品一区二区三区| 久久一区二区视频在线观看| 国产成人av无码精品| 尤物网址在线观看| 亚洲AV一二三四区四色婷婷| av亚洲在线一区二区| 亚洲一区二区三区激情在线观看| 上海熟女av黑人在线播放| 亚洲中文字幕一区精品自拍| 国产午夜福利小视频合集| 2021国产最新在线视频一区| 精品熟女少妇免费久久| 琪琪av一区二区三区| 后入丝袜美腿在线观看| 国产激情一区二区三区| 欧美日韩国产一区二区三区不卡| 国产三级黄色在线观看| 青青草绿色华人播放在线视频| 日本最新一区二区三区视频观看| 国产无遮挡又黄又爽高潮| 男受被做哭激烈娇喘gv视频| 久久91精品国产91久| 久久精品国产一区老色匹| 亚洲精品成人无限看| 无码人妻丰满熟妇片毛片|