趙緒言 重慶交通大學(xué)
本文的思路主要分為兩個(gè)環(huán)節(jié),第一個(gè)環(huán)節(jié)是依次計(jì)算選擇相應(yīng)的指標(biāo),首先選擇氣候影響的直接指標(biāo),在對氣候影響的直接指標(biāo)進(jìn)行擬合。第二個(gè)環(huán)節(jié)是對脆弱性等級進(jìn)行評估,首先用PCA提取主成分,在基于MLP模型進(jìn)行訓(xùn)練得到相應(yīng)結(jié)果。
主成分分析(PCA)是一種分析,簡化數(shù)據(jù)集的技術(shù)。常用于減少數(shù)據(jù)集的維數(shù),同時(shí)保持?jǐn)?shù)據(jù)集中的對方差貢獻(xiàn)最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。
多層感知機(jī)(MLP)是一種前向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò),映射一組輸入向量到一組輸出向量。MLP可以被看作是一個(gè)有向圖,由多個(gè)的節(jié)點(diǎn)層所組成,每一層都全連接到下一層。除了輸入節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)都是一個(gè)帶有非線性激活函數(shù)的神經(jīng)元(或稱處理單元)??梢杂糜诜诸惡皖A(yù)測。由于原始數(shù)據(jù)的多樣性和復(fù)雜性,選擇多層感知機(jī)解決問題能提高結(jié)果的準(zhǔn)確率。
氣候變化的影響在地域上是有差異的,這些變化導(dǎo)致了干旱,冰川融化,海平面上升等等一系列問題。氣候變化主要由降雨量和溫度這兩個(gè)指標(biāo)反映。
基于世界銀行的數(shù)據(jù),擬合氣候變化和直接指標(biāo)之間的關(guān)系,可以看到洪水發(fā)生的概率隨著降雨量的增加而增加,服從傅里葉函數(shù):
擬合的各項(xiàng)參數(shù)為:SSE=135.2, R-square=0.9922,Adjust R-square=0.9907, RMSE=3.002??傻贸鼋Y(jié)論降雨量與洪水發(fā)生概率聯(lián)系密切。
而耕地面積則是隨著降雨量的增加,先增加后減少。服從高斯分布:
擬合的各項(xiàng)參數(shù)為:SSE= 51.21, R-square=0.9731,Adjust Rsquare=0.9698, RMSE=1.789??傻贸鼋Y(jié)論降雨量與耕地面積的多少關(guān)系密切。
從WUWT上的數(shù)據(jù)可得,一方面,隨著時(shí)間的增長,全球的溫度和海平面高度普遍呈上升趨勢。另一方面,海平面曲線與溫度曲線的變化基本相同。可得出結(jié)論海平面與溫度聯(lián)系密切。
由于原始數(shù)據(jù)維數(shù)較多,使用主成份分析從12個(gè)因素中提取主成份。其過程如下:
(1) 定義為 氣候特征因素和 直接影響的分?jǐn)?shù)。由于直接因素是自然災(zāi)害,海平面高度,耕地面積,它們的量綱各不相同,對其進(jìn)行標(biāo)準(zhǔn)化處理。
(2) 計(jì)算原始數(shù)據(jù)變準(zhǔn)化后數(shù)據(jù)的相關(guān)系數(shù)矩陣。
(3) 選擇重要的成分,并寫出主成份表達(dá)式。根據(jù)各個(gè)主成份累計(jì)貢獻(xiàn)率達(dá)到85%時(shí),能確保綜合量包括原始變量的絕大多數(shù)信息。
多層感知機(jī)是監(jiān)督學(xué)習(xí)算法。它很適合學(xué)習(xí)非線性的模型且可以實(shí)時(shí)學(xué)習(xí)。在Anaconda Jupyter Notebook環(huán)境中,使用Scikit-Learn工具包,步驟如下:
(1)標(biāo)準(zhǔn)化各項(xiàng)指標(biāo),包括之間因素和間接因素。
(2)設(shè)置MLP的各項(xiàng)參數(shù)。最大迭代次數(shù)1000次,隱含層(16,16,16,16),學(xué)習(xí)率 0.001,alpha 為 0.0001。
(4)感知層接收輸入,并乘以權(quán)重,然后傳給激活函數(shù)產(chǎn)生輸出結(jié)果。
(5)選擇10年內(nèi)的300個(gè)訓(xùn)練樣本,系統(tǒng)調(diào)整輸出權(quán)重以此減少計(jì)算誤差。
(6)通過迭代,模型降低誤差并提高準(zhǔn)確率。輸入測試,其模型準(zhǔn)確率可達(dá)到93.75%。
材料中給出的12個(gè)因素作為氣候變化的過渡指標(biāo),間接影響國家的脆弱性。利用MATLAB計(jì)算主成份分析,得到4個(gè)主成份,在接下來的模型中用這個(gè)4個(gè)主成份作為氣候變化的間接指標(biāo)來衡量國家脆弱性。
基于MLP模型,使用178個(gè)國家的數(shù)據(jù),將脆弱性劃為3級,分別為非常脆弱1,脆弱2,穩(wěn)定3。將其作為樣本進(jìn)行訓(xùn)練。逐漸增加國家的年平均溫度和降雨量,并將其帶入公式(1)和公式(2)中。它們通過影響這個(gè)5個(gè)因素,來影響氣候,從而決定國家的脆弱性。通過計(jì)算得到?jīng)]有氣候影響的結(jié)果如表1所示:
表1 沒有氣候影響因素時(shí)的部分結(jié)果
當(dāng)只考慮4個(gè)主成份而不考慮氣候影響時(shí),MLP訓(xùn)練得出的結(jié)果表明,有的國家脆弱性從1級到了2級,有的從2級到了3級。這說明這個(gè)國家在氣候穩(wěn)定時(shí),將會更加的穩(wěn)定。