亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)的Adaboost-BP模型在降水中的預(yù)測(cè)

        2017-11-15 06:02:46軍,費(fèi)凱,程
        計(jì)算機(jī)應(yīng)用 2017年9期
        關(guān)鍵詞:分類(lèi)器降水神經(jīng)網(wǎng)絡(luò)

        王 軍,費(fèi) 凱,程 勇

        (1.南京信息工程大學(xué) 計(jì)算機(jī)與軟件學(xué)院, 南京 210044; 2.南京信息工程大學(xué) 信息化建設(shè)與管理處,南京 210044)(*通信作者電子郵箱feikainiust@163.com)

        基于改進(jìn)的Adaboost-BP模型在降水中的預(yù)測(cè)

        王 軍1,2,費(fèi) 凱1*,程 勇2

        (1.南京信息工程大學(xué) 計(jì)算機(jī)與軟件學(xué)院, 南京 210044; 2.南京信息工程大學(xué) 信息化建設(shè)與管理處,南京 210044)(*通信作者電子郵箱feikainiust@163.com)

        針對(duì)目前分類(lèi)算法對(duì)降水預(yù)測(cè)過(guò)程存在著泛化能力低、精度不足的問(wèn)題,提出改進(jìn)Adaboost算法集成反向傳播(BP)神經(jīng)網(wǎng)絡(luò)組合分類(lèi)模型。該模型通過(guò)構(gòu)造多個(gè)神經(jīng)網(wǎng)絡(luò)弱分類(lèi)器,賦予弱分類(lèi)器權(quán)值,將其線性組合為強(qiáng)分類(lèi)器。改進(jìn)后的Adaboost算法以最優(yōu)化歸一化因子為目標(biāo),在提升過(guò)程中調(diào)整樣本權(quán)值更新策略,以此達(dá)到最小化歸一化因子的目的,從而確保增加弱分類(lèi)器個(gè)數(shù)的同時(shí)降低誤差上界估計(jì),通過(guò)最終集成的強(qiáng)分類(lèi)器來(lái)提高模型的泛化能力和分類(lèi)精度。選取江蘇境內(nèi)6個(gè)站點(diǎn)的逐日氣象資料作為實(shí)驗(yàn)數(shù)據(jù),建立7個(gè)降水等級(jí)的預(yù)報(bào)模型,從對(duì)降雨量有影響的眾多因素中,選取12個(gè)與降水相關(guān)性較大的屬性作為預(yù)報(bào)因子。通過(guò)多次實(shí)驗(yàn)統(tǒng)計(jì),結(jié)果表明基于改進(jìn)的Adaboost-BP組合模型具有較好的性能,尤其對(duì)58259站點(diǎn)的適應(yīng)性較好,總體分類(lèi)精度達(dá)到81%,在7個(gè)等級(jí)中,對(duì)0級(jí)降雨的預(yù)測(cè)精度最好,對(duì)其他等級(jí)的降雨預(yù)測(cè)有不同程度的精度提升,理論推導(dǎo)及實(shí)驗(yàn)結(jié)果證明該種改進(jìn)可以提高預(yù)測(cè)精度。

        分類(lèi)器;改進(jìn)Adaboost;BP神經(jīng)網(wǎng)絡(luò);組合模型;權(quán)值調(diào)整;歸一化因子

        0 引言

        隨著社會(huì)經(jīng)濟(jì)發(fā)展以及人類(lèi)本身對(duì)氣象服務(wù)要求不斷提升,氣象領(lǐng)域的氣象數(shù)據(jù)采集渠道日益豐富,數(shù)據(jù)規(guī)模不斷增加,且其具有的空間屬性、高維性、不穩(wěn)定性,為研究傳統(tǒng)氣象預(yù)報(bào)模式增加巨大難度,尤其在研究各氣象要素之間內(nèi)部聯(lián)系時(shí),尤為乏力,從而導(dǎo)致獲取到的大量氣象資料并未有效利用,對(duì)于推動(dòng)氣象模式預(yù)報(bào)發(fā)展并未有實(shí)質(zhì)性作用。

        氣象數(shù)據(jù)是典型的時(shí)間序列數(shù)據(jù),天氣系統(tǒng)的內(nèi)部相互影響條件錯(cuò)綜復(fù)雜,對(duì)于大量的采集數(shù)據(jù)進(jìn)行分析處理時(shí),傳統(tǒng)的氣象研究模式無(wú)法發(fā)現(xiàn)其隱含的價(jià)值,而數(shù)據(jù)挖掘技術(shù)為研究大量氣象數(shù)據(jù)提供了新途徑,為氣象領(lǐng)域中發(fā)現(xiàn)各屬性聯(lián)系發(fā)揮著重要作用,分類(lèi)挖掘技術(shù)通過(guò)有監(jiān)督的學(xué)習(xí)探索歷史氣象數(shù)據(jù)中潛在的規(guī)律,可以提高氣象預(yù)報(bào)模式的準(zhǔn)確率[1]。

        近些年,多種分類(lèi)挖掘技術(shù)被應(yīng)用于氣象領(lǐng)域,如決策樹(shù)、關(guān)聯(lián)規(guī)則、貝葉斯等[2-3]。文獻(xiàn)[4]將支持向量機(jī)(Support Vector Machine, SVM)分類(lèi)方法應(yīng)用于降水預(yù)測(cè)中,結(jié)合多個(gè)相關(guān)因子,利用四川盆地降水量數(shù)據(jù)建立分類(lèi)預(yù)測(cè)模型,在短氣候預(yù)測(cè)中有著不錯(cuò)的性能。文獻(xiàn)[5]研究通過(guò)決策樹(shù)對(duì)與降水密切相關(guān)的濕度、溫度、大氣壓、風(fēng)速和露點(diǎn)溫度等眾多氣象要素的采集數(shù)據(jù)進(jìn)行預(yù)報(bào)建模,改進(jìn)后的模型具有較好的適應(yīng)性;文獻(xiàn)[6]將樸素貝葉斯分類(lèi)器與降雨量問(wèn)題相結(jié)合,將貝葉斯模型用于降雨量分類(lèi)預(yù)測(cè)研究,以鄭州市34年氣象數(shù)據(jù)建立分類(lèi)預(yù)測(cè)模型,預(yù)測(cè)精度略好于短期氣候中常用的回歸分析;文獻(xiàn)[7]提出一種改進(jìn)SVM算法的二進(jìn)制分類(lèi)核函數(shù)(BInary and ORdinal classification Kernel method, BIORK)模型,將該模型用于降雨等級(jí)預(yù)測(cè),并且證明該模型在氣象要素合適的情況下有較好的預(yù)測(cè)精度,尤其是無(wú)降雨天氣預(yù)測(cè)。但是該些模型共同點(diǎn)是基于較小的數(shù)據(jù)集為前提才獲取到較好的效果,不適用于規(guī)模較大和多站點(diǎn)的數(shù)據(jù)集。文獻(xiàn)[8]運(yùn)用SVM分類(lèi)算法研究局部氣象數(shù)據(jù),提出基于Adaboost算法集成SVM分類(lèi)器的多分類(lèi)模型,通過(guò)多個(gè)分類(lèi)器的協(xié)同組合多個(gè)基分類(lèi)器,以此提高單分類(lèi)模型在降雨中的分類(lèi)預(yù)測(cè)精度;文獻(xiàn)[9]提出以Adaboost算法集成BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)了湖北某風(fēng)場(chǎng)風(fēng)速,對(duì)每個(gè)弱學(xué)習(xí)器賦予權(quán)值,最終線性組合成強(qiáng)預(yù)測(cè)器對(duì)風(fēng)速預(yù)測(cè),通過(guò)該多集成方法提高了學(xué)習(xí)器的預(yù)測(cè)能力。相對(duì)單個(gè)弱學(xué)習(xí)器而言,數(shù)據(jù)集較大時(shí),Adaboost集成弱學(xué)習(xí)器模型具有一定的優(yōu)勢(shì),但隨著迭代次數(shù)的增加,分類(lèi)器的性能開(kāi)始下降,出現(xiàn)了性能退化問(wèn)題,很難達(dá)到理想中的要求。

        針對(duì)上述問(wèn)題,本文提出一種改進(jìn)Adaboost-BP(可簡(jiǎn)寫(xiě)為Ada-BP)算法,該算法集成BP神經(jīng)網(wǎng)絡(luò),使得最終的強(qiáng)分類(lèi)預(yù)測(cè)模型泛化能力增強(qiáng),通過(guò)破壞樣本分布的均勻性緩解性能退化問(wèn)題。該算法核心是在Adaboost算法中線性組合多個(gè)神經(jīng)網(wǎng)絡(luò)分類(lèi)器得到強(qiáng)分類(lèi)器,并利用該分類(lèi)器完成分類(lèi)預(yù)測(cè),通過(guò)在迭代過(guò)程中改變權(quán)值分布策略,以?xún)?yōu)化歸一化因子,降低誤差上界,從而提高強(qiáng)分類(lèi)器的分類(lèi)能力[10]。

        1 BP神經(jīng)網(wǎng)絡(luò)

        BP神經(jīng)網(wǎng)絡(luò)是誤差反向傳播算法,可以逼近任意連續(xù)的函數(shù),具有很強(qiáng)的非線性映射能力,它由輸入層、隱含層、輸出層構(gòu)成,隱含層是介于輸入層和輸出層之間[11]。隱含層可以由多層構(gòu)成,但隱含層的增加導(dǎo)致模型的復(fù)雜性增加,文獻(xiàn)[12]研究發(fā)現(xiàn)三層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)可以近似任何多元多項(xiàng)式函數(shù),因此,在本文研究過(guò)程中使用只包含一層隱含層的BP神經(jīng)網(wǎng)絡(luò)來(lái)建立模型,其模型拓?fù)浣Y(jié)構(gòu)如圖1所示,其中BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程分為兩個(gè)部分:正向傳播和反向傳播。當(dāng)正向傳播的時(shí)候,信號(hào)通過(guò)神經(jīng)元傳遞到下一層,如果輸出層不能獲得所需的輸出,誤差信號(hào)由各神經(jīng)元反向傳播來(lái)調(diào)整各神經(jīng)元參數(shù)。通過(guò)這兩個(gè)交替的過(guò)程完成信息提取和存儲(chǔ),使得輸出層值逼近期望的值。

        其中x1,x2,…,xq是網(wǎng)絡(luò)輸入層各神經(jīng)元的輸入值,wij為輸入層到隱含層神經(jīng)元間的連接權(quán)值,wjk為隱含層到輸出層的連接權(quán)值,yi為神經(jīng)網(wǎng)絡(luò)的輸出值。

        圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)

        2 基于改進(jìn)的Adaboost-BP模型

        Adaboost算法是一種迭代算法,常用于解決分類(lèi)問(wèn)題。其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的弱分類(lèi)器,后將多個(gè)弱分類(lèi)器集成,構(gòu)成最終的強(qiáng)分類(lèi)器[13]。該算法迭代的過(guò)程是一個(gè)對(duì)弱分類(lèi)算法提升過(guò)程,重視被錯(cuò)誤分類(lèi)的樣本和性能較高的分類(lèi)器,提高訓(xùn)練中錯(cuò)誤樣本的權(quán)值和性能較好的分類(lèi)器權(quán)值,反之則降低,分類(lèi)的結(jié)果由多個(gè)性能較好的弱分類(lèi)器決定;同時(shí),在訓(xùn)練中,對(duì)訓(xùn)練效果較好的樣本降低權(quán)重,而訓(xùn)練效果較差的增加其權(quán)重,通過(guò)多次訓(xùn)練迭代,得到由多個(gè)弱分類(lèi)器線性組合的強(qiáng)分類(lèi)器,以此提高對(duì)數(shù)據(jù)的分類(lèi)精度。

        本文將BP神經(jīng)網(wǎng)絡(luò)作為弱分類(lèi)器,選取神經(jīng)網(wǎng)絡(luò)中的合適的激勵(lì)函數(shù)與神經(jīng)元參數(shù)來(lái)構(gòu)造BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器,利用Adaboost算法多次提升訓(xùn)練,最終獲得強(qiáng)分類(lèi)器,其模型結(jié)構(gòu)如圖2。

        圖2 Adaboost-BP模型結(jié)構(gòu)

        通過(guò)研究分析系列Adaboost算法以及原理推導(dǎo),每次迭代過(guò)程中,算法會(huì)對(duì)錯(cuò)誤樣本進(jìn)行加權(quán),隨著迭代次數(shù)的增加,當(dāng)多個(gè)易錯(cuò)樣本被多次錯(cuò)誤分類(lèi)后,易錯(cuò)樣本具有較大的權(quán)值,反之樣本的總體誤差的出現(xiàn)了上升趨勢(shì)。對(duì)于該種退化問(wèn)題,只能選取弱分類(lèi)器空間中的唯一參照標(biāo)準(zhǔn)Zt作分析[14]。對(duì)Zt作如式(1)推導(dǎo):

        Z1*Z2*Z3*Z4*…*ZT=

        (1)

        由此可知,歸一化因子雖然具有使樣本呈現(xiàn)概論分布的同時(shí),還可以左右整個(gè)分類(lèi)器的誤差上界,如上面公式推導(dǎo),實(shí)質(zhì)上歸一化因子的積就是整個(gè)分類(lèi)器的誤差上界。理論上隨著分類(lèi)器的增加誤差上界將應(yīng)該下降,但實(shí)際上隨著迭代的增加,歸一化因子在后期在持續(xù)增長(zhǎng)趨勢(shì),從而導(dǎo)致隨著分類(lèi)器數(shù)量的增加性能反而降低的情況。對(duì)強(qiáng)分類(lèi)器的性能優(yōu)化實(shí)質(zhì)上可以回歸到是對(duì)歸一化因子Zt優(yōu)化,Zt的大小決定著誤差下降的速度,對(duì)Zt的優(yōu)化使得其在每次迭代中都小于1,當(dāng)分類(lèi)器的個(gè)數(shù)達(dá)到無(wú)窮時(shí),分類(lèi)器的誤差上界理論值可以達(dá)到無(wú)限接近0。對(duì)于分類(lèi)器而言,歸一化因子Zt的公式分解為如式(2):

        (2)

        (3)

        (4)

        算法詳細(xì)步驟如下:

        步驟1 設(shè)置初始化神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值。

        步驟2 數(shù)據(jù)歸一化處理,使樣本值分布在[0,1]。

        步驟3 訓(xùn)練神經(jīng)網(wǎng)絡(luò)調(diào)整隱含層節(jié)點(diǎn)數(shù),設(shè)定學(xué)習(xí)率。

        步驟4 給出氣象數(shù)據(jù)樣本集(xi,yi),…,(xm,ym)(y1,y2,…,ym是樣本的期望輸出)。

        步驟5 初始化氣象數(shù)據(jù)樣本權(quán)值D(i)=1/N(N是樣本的數(shù)量)。

        步驟6 fort=1,2,…,T(T是提升的次數(shù))。

        步驟8 ifεt>0.5 then 轉(zhuǎn)步驟5

        步驟10 通過(guò)式(4)更新樣本權(quán)值 。

        步驟11 跳轉(zhuǎn)第步驟6,直至結(jié)束迭代。

        3 實(shí)驗(yàn)及分析

        降水形成過(guò)程涉及的因素眾多,其中基本氣象要素包括溫度、高度、緯向風(fēng)、經(jīng)向風(fēng)、垂直速度等。利用這些基本氣象要素通過(guò)動(dòng)力診斷獲取與降水相關(guān)的平流項(xiàng)、梯度項(xiàng)、渦度、水汽通量、水汽通量散度等近100多個(gè)的氣象物理量,在眾多的物理量中選擇與降水相關(guān)因子,將直接決定降水分類(lèi)模型的性能效果,將降水所涉及的所有因子作為屬性將大大削弱模型的性能且增加模型的復(fù)雜度,選取與區(qū)域降水相關(guān)性較大的因子作為降水樣本的屬性集有利于提高分類(lèi)預(yù)報(bào)效果。

        一般對(duì)降水因子的選擇通過(guò)逐步回歸的方法,利用Pearson相關(guān)系數(shù)法對(duì)屬性重要性進(jìn)行排序,在眾多因子中選擇與降水相關(guān)性最好的屬性。本文從眾多因子排序中,選擇包括最小相對(duì)濕度、平均相對(duì)濕度、極大風(fēng)速、最大風(fēng)速、日照時(shí)數(shù)、平均水氣壓、日最低溫度、平均風(fēng)速、平均氣溫、蒸發(fā)量、相對(duì)濕度、露點(diǎn)溫度作為樣本屬性中的重要因子,所以在降水分類(lèi)預(yù)測(cè)中只選擇12個(gè)相關(guān)性較大因子。

        3.1 降水模型建立

        本研究的內(nèi)容是對(duì)降水等級(jí)預(yù)測(cè),將所選的12個(gè)屬性作為網(wǎng)絡(luò)的輸入向量,通過(guò)所選的重要屬性對(duì)降水等級(jí)分析,將降水的等級(jí)作為網(wǎng)絡(luò)的輸出向量,按國(guó)家氣象局頒布的降水等級(jí)劃分標(biāo)準(zhǔn),建立7個(gè)等級(jí)區(qū)域降雨預(yù)報(bào)模型,表1為樣本降水等級(jí)統(tǒng)計(jì)表。

        表1 降水等級(jí)劃分

        實(shí)驗(yàn)數(shù)據(jù)來(lái)源于江蘇省氣象局,該數(shù)據(jù)集為2001年—2010年10年間的實(shí)況觀測(cè)數(shù)據(jù),實(shí)驗(yàn)中選取江蘇境內(nèi)包括南通(58259)、徐州(58027)、鹽城(58154)、淮安(58141)、泰州(58246)、揚(yáng)州(58245)共6個(gè)站點(diǎn)逐日降水資料作為降水實(shí)驗(yàn)數(shù)據(jù),實(shí)況數(shù)據(jù)數(shù)據(jù)集共包含19 863條記錄,將實(shí)驗(yàn)數(shù)據(jù)按比例分為訓(xùn)練數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù),同時(shí)對(duì)降水?dāng)?shù)據(jù)中各類(lèi)別按比例劃分訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)。由于氣象數(shù)據(jù)存在的特點(diǎn),經(jīng)過(guò)預(yù)處理后的各個(gè)站點(diǎn)的數(shù)據(jù)量并不相同,各等級(jí)間的數(shù)據(jù)非均勻分布。

        其中整個(gè)網(wǎng)絡(luò)采用12-N-7的三層網(wǎng)絡(luò)結(jié)構(gòu) ,輸入層分別將上述的12個(gè)特征因子作為網(wǎng)絡(luò)輸入的特征向量,其中的N為隱含層神經(jīng)元數(shù)目,N的值結(jié)合經(jīng)驗(yàn)公式,在一定的范圍內(nèi)采取試算的原則,輸出層設(shè)置7個(gè)神經(jīng)元,將輸出層中7個(gè)降水等級(jí)作為神經(jīng)網(wǎng)絡(luò)的輸出向量,神經(jīng)網(wǎng)絡(luò)選用的傳遞函數(shù)為tansig函數(shù),學(xué)習(xí)規(guī)則采用梯度下降法,在神經(jīng)網(wǎng)絡(luò)訓(xùn)練前,通常會(huì)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,在訓(xùn)練模型時(shí)先將數(shù)據(jù)預(yù)處理歸一化到0~1[15]。

        3.2 實(shí)驗(yàn)結(jié)果分析

        為了驗(yàn)證本算法的先進(jìn)性,通過(guò)Matlab編制程序,將本文提出的改進(jìn)Ada-BP與傳統(tǒng)Ada-BP算法作實(shí)驗(yàn)對(duì)比,說(shuō)明改進(jìn)的Ada-BP優(yōu)于傳統(tǒng)的Ada-BP;同時(shí),與性能較好的文獻(xiàn)[7]中所用的BIORK算法做對(duì)比分析來(lái)說(shuō)明本文提出的方法先進(jìn)性。為保證實(shí)驗(yàn)可比性,實(shí)驗(yàn)中采用相同的數(shù)據(jù)集,將實(shí)驗(yàn)獲得的結(jié)果作統(tǒng)計(jì)分析。

        經(jīng)過(guò)對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練最終確定單個(gè)性能較好的神經(jīng)網(wǎng)絡(luò)參數(shù),選擇較好的BP神經(jīng)網(wǎng)絡(luò)模型作為訓(xùn)練過(guò)程中的弱分類(lèi)器。首先,對(duì)比改進(jìn)后的Adaboost算法與改進(jìn)前的Adaboost算法提升不同次數(shù)準(zhǔn)確率之間的統(tǒng)計(jì)比較,如圖3所示,隨著弱分類(lèi)器個(gè)數(shù)的增加,強(qiáng)分類(lèi)器對(duì)樣本的分類(lèi)精度也隨之提高,改進(jìn)后的Adaboost算法弱分類(lèi)器個(gè)數(shù)達(dá)到20~30時(shí),性能趨于穩(wěn)定,當(dāng)T=20時(shí),性能達(dá)到最高,改進(jìn)后的Adaboost算法的分類(lèi)精度穩(wěn)定地高于傳統(tǒng)Adaboost算法3%,但兩者在隨著弱分類(lèi)器數(shù)量增加以后同時(shí)出現(xiàn)性能飽和情況。

        圖3 弱分類(lèi)器上精度比較

        圖4分別統(tǒng)計(jì)了改進(jìn)后Ada-BP、Ada-BP、BIORK三種模型在不同樣本集容量下的性能:改進(jìn)后的Ada-BP分類(lèi)器性能隨著樣本的增加而上升,最終性能達(dá)到飽和,穩(wěn)定在77%~79%;Ada-BP模型隨著樣本的增加,性能呈上升趨勢(shì),最終也到達(dá)飽和水平,但隨著樣本數(shù)量的增加,傳統(tǒng)Adaboost集成的強(qiáng)分類(lèi)器模型性能出現(xiàn)退化,低于性能峰值較多,最終穩(wěn)定在74%~76%;BIORK 單分類(lèi)器模型的性能在樣本集較少時(shí),擁有明顯的優(yōu)勢(shì),隨著樣本的增加,BIORK模型的分類(lèi)性能逐漸趨于穩(wěn)定,最終飽和于75%左右。從統(tǒng)計(jì)結(jié)果看,隨著樣本集數(shù)量的增加,改進(jìn)后Ada-BP算法在總體分類(lèi)精度上具有明顯優(yōu)勢(shì)。

        圖4 樣本容量與性能關(guān)系比較

        圖5統(tǒng)計(jì)了三種算法對(duì)每個(gè)類(lèi)樣本的分類(lèi)預(yù)測(cè)精度,從總體趨勢(shì)顯示:改進(jìn)的Ada-BP算法對(duì)所有等級(jí)的分類(lèi)預(yù)測(cè)性能都好于傳統(tǒng)Ada-BP和BP兩種算法;與其他等級(jí)相比,三種算法對(duì)0級(jí)降水同時(shí)表現(xiàn)出較好的性能,對(duì)6級(jí)的降水表現(xiàn)的性能最差,但改進(jìn)后的Ada-BP算法在降水為量0級(jí)優(yōu)勢(shì)較明顯,降水等級(jí)為2、3時(shí)略低于BIORK分類(lèi)模型。由于樣本集數(shù)據(jù)所占比重不同,導(dǎo)致分類(lèi)器對(duì)每個(gè)等級(jí)呈現(xiàn)不同的性能,但三種模型同時(shí)表現(xiàn)出對(duì)0級(jí)的樣本預(yù)測(cè)精度最高,6級(jí)的預(yù)測(cè)精度最低,由于等級(jí)為6的數(shù)據(jù)占比最少,且大暴雨級(jí)別及以上等級(jí)的降雨形成原因復(fù)雜,不能僅僅根據(jù)十幾個(gè)相關(guān)性較強(qiáng)的因子作為判斷依據(jù),從而導(dǎo)致樣本預(yù)測(cè)效果較差。

        圖5 各降水等級(jí)樣本預(yù)測(cè)性能對(duì)比

        圖6統(tǒng)計(jì)了三種算法對(duì)各區(qū)站點(diǎn)的預(yù)測(cè)精度:改進(jìn)的Ada-BP在各個(gè)站點(diǎn)中的預(yù)測(cè)準(zhǔn)確率較為穩(wěn)定,總體性能在78%以上,其中主要對(duì)南通站(58259)的預(yù)測(cè)精度較高,對(duì)揚(yáng)州站(58245)的預(yù)測(cè)精度略低;BIORK模型在淮安站(58141)與揚(yáng)州站(58245)略高于改進(jìn)的Ada-BP模型;但改進(jìn)的Ada-BP模型對(duì)其余站點(diǎn)的適應(yīng)性?xún)?yōu)于其他兩種模型,所有站點(diǎn)的預(yù)測(cè)精度有一定程度的提高,其中改進(jìn)的模型在南通站(58259)與徐州站的優(yōu)勢(shì)最大,明顯高于Ada-BP與BIORK兩種模型。從各站點(diǎn)實(shí)驗(yàn)結(jié)果表明,改進(jìn)的Ada-BP模型優(yōu)于其他兩種模型。

        圖6 各區(qū)站預(yù)測(cè)精度對(duì)比

        通過(guò)上述實(shí)驗(yàn)表明,本文提出的改進(jìn)Adaboost-BP算法性能高于另外兩種算法,在降水等級(jí)預(yù)測(cè)中取得良好效果,但在不同的站點(diǎn)和降水等級(jí)中表現(xiàn)出差異性,在一定程度上改進(jìn)了傳統(tǒng)Adaboost算法集成BP神經(jīng)網(wǎng)絡(luò)和現(xiàn)有的分類(lèi)預(yù)測(cè)算法對(duì)氣象數(shù)據(jù)挖掘的局限性。

        4 結(jié)語(yǔ)

        本文提出的改進(jìn)Adaboost-BP模型,在集成迭代過(guò)程中調(diào)整樣本權(quán)值更新方式,以最小化歸一化因子為目標(biāo),減輕強(qiáng)分類(lèi)器的性能退化現(xiàn)象。實(shí)驗(yàn)結(jié)果表明,該模型優(yōu)于現(xiàn)有的降雨預(yù)測(cè)模型,一定程度上克服氣象分類(lèi)挖掘算法精度較低的缺陷,提高了對(duì)不同樣本的分類(lèi)預(yù)測(cè)能力,但對(duì)復(fù)雜的、降雨量大的天氣預(yù)測(cè)精度較低。對(duì)算法作改進(jìn)來(lái)提高其預(yù)測(cè)的精度有較大難度,將成為以后降水預(yù)測(cè)模型的研究方向。但總體而言,本文提出的模型確實(shí)提高了預(yù)報(bào)的準(zhǔn)確率,具有較高的工程價(jià)值。

        References)

        [1] OLAIYA F, ADEYEMO A B. Application of data mining techniques in weather prediction and climate change studies [J]. International Journal of Information Engineering & Electronic Business, 2012, 4(1): 304-310.

        [2] GUO Z Y, DAI X Y, LIN H. Application of association rule in disaster weather forecasting [J]. Geographic Information Sciences, 2004, 10(1): 68-72.

        [3] CANO R, SORDO C, GUTIéRREZ J M. Applications of Bayesian networks in meteorology [M]// Advances in Bayesian Networks. Berlin: Springer, 2004: 309-328.

        [4] 楊淑群,芮景析,馮漢中.支持向量機(jī)(SVM)方法在降水分類(lèi)預(yù)測(cè)中的應(yīng)用[J].西南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,28(2):252-257.(YANG S Q, RUI J X, FENG H Z. Application of Support Vector Machine (SVM) in rainfall categorical forecast [J]. Journal of Southwest Agricultural University (Natural Science), 2006, 28(2): 252-257.)

        [5] PRASAD N, KUMAR P, NAIDU M. An approach to prediction of precipitation using Gini index in SLIQ decision tree [C]// Proceedings of the 2013 4th International Conference on Intelligent Systems, Modelling and Simulation. Washington, DC: IEEE Computer Society, 2013: 56-60.

        [6] 何偉,孔夢(mèng)榮,趙海青.基于貝葉斯分類(lèi)器的氣象預(yù)測(cè)研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(15):3780-3782.(HE W, KONG M R, ZHAO H Q. Research on meteorological prediction with Bayesian classifier [J]. Computer Engineering and Design, 2007, 28(15): 3780-3782.)

        [8] 滕少華,樊繼慧,陳瀟,等.SVM多分類(lèi)器協(xié)同挖掘局域氣象數(shù)據(jù)[J].廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(5):1131-1137.(TENG S H, FAN J H, CHEN X, et al. Application of SVM-based muti-classifiers in mining cooperatively local area meteorological data [J]. Journal of Guangxi University (Natural Science Edition), 2014(5): 1131-1137.)

        [9] 吳俊利,張步涵,王魁.基于Adaboost的BP神經(jīng)網(wǎng)絡(luò)改進(jìn)算法在短期風(fēng)速預(yù)測(cè)中的應(yīng)用[J].電網(wǎng)技術(shù),2012,36(9):221-225.(WU J L,ZHANG B H,WANG K. Application of Adaboost-based BP neural network for short-term wind speed forecast [J]. Power System Technology, 2012, 36(9): 221-225).

        [10] ZHU J, ROSSET S, ZOU H, et al. Multi-class AdaBoost [EB/OL]. [2017- 01- 03]. https://web.stanford.edu/~hastie/Papers/samme.pdf.

        [11] 張丹,韓勝菊,李建,等.基于改進(jìn)粒子群算法的BP算法的研究[J].計(jì)算機(jī)仿真,2011,28(2):147-150.(ZHANG D, HAN S J, LI J, et al. BP algorithm based on improved particle swarm optimization [J]. Computer Simulation, 2011, 28(2): 147-150.)

        [12] JIANG C. Review of back propagation neural network applied to athletics [C]// Proceedings of the 2012 24th Chinese Control and Decision Conference. Piscataway, NJ: IEEE, 2012: 2371-2375.

        [13] LI X, WANG L, SUNG E. AdaBoost with SVM-based component classifiers [J]. Engineering Applications of Artificial Intelligence, 2008, 21(5): 785-795.

        [14] 廖紅文,周德龍.AdaBoost及其改進(jìn)算法綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,21(5):240-244.(LIAO H W, ZHOU D L. Review of AdaBoost and its improvement [J]. Computer System & Applications, 2012, 21(5): 240-244.)

        [15] LI J, WU X H, QIN C H, et al. The design of image compression with BP neural network based on the dynamic adjusting hidden layer nodes [J]. Advanced Materials Research, 2012, 433/434/435/436/437/438/439/440: 3797-3801.

        PredictionofrainfallbasedonimprovedAdaboost-BPmodel

        WANG Jun1,2, FEI Kai1*, CHENG Yong2

        (1.CollegeofComputerandSoftware,NanjingUniversityofInformationScienceandTechnology,NanjingJiangsu210044,China;2.InformationConstructionandManagementDepartment,NanjingUniversityofInformationScienceandTechnology,NanjingJiangsu210044,China)

        Aiming at the problem that the current classification algorithm has low generalization ability and insufficient precision, a combination classification model combining Adaboost algorithm and Back-Propagation (BP) neural network was proposed. Multiple neural network weak classifiers were constructed and weighted, which were linearly combined into a strong classifier. The improved Adaboost algorithm aimed to optimize the normalization factor. The sample weight update strategy was adjusted during the lifting process, to minimize the normalization factor, increasing the number of weak classifiers while reducing the error upper bound estimate was ensured, and the generalization ability and classification accuracy of the final integrated strong classifier was improved. A daily precipitation model of 6 sites in Jiangsu province was selected as the experimental data, and 7 precipitation models were established. Among the many factors influencing the rainfall, 12 attributes with large correlation with precipitation were selected as the forecasting factors. The results show that the improved Adaboost-BP combination model has better performance, especially for the site 58259, and the overall classification accuracy is 81%. Among the 7 grades, the prediction accuracy of class-0 rainfall is the best, and the accuracy of other types of rainfall forecast is improved. The theoretical derivation and experimental results show that the improvement can improve the prediction accuracy.

        classifier; improved Adaboost; BP neural network; combined model; weight adjustment; normalization parameter

        2017- 03- 17;

        2017- 05- 18。

        國(guó)家自然科學(xué)基金資助項(xiàng)目(61402236, 61373064);江蘇省農(nóng)業(yè)氣象重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金資助項(xiàng)目(KYQ1309);江蘇省“六大人才高峰”項(xiàng)目(2015-DZXX-015,2013-DZXX-019);江蘇省產(chǎn)學(xué)研前瞻性聯(lián)合研究項(xiàng)目(BY2014007-2);公益性行業(yè)(氣象)科研專(zhuān)項(xiàng)(GYHY201106037)。

        王軍(1970—),男,安徽銅陵人,教授,碩士,CCF會(huì)員,主要研究方向:無(wú)線傳感網(wǎng)、大數(shù)據(jù); 費(fèi)凱(1990—),男,江蘇連云港人,碩士研究生,主要研究方向:大數(shù)據(jù)氣象領(lǐng)域應(yīng)用; 程勇(1980—),男,重慶人,高級(jí)工程師,博士,CCF會(huì)員,主要研究方向:無(wú)線傳感網(wǎng)、大數(shù)據(jù)。

        1001- 9081(2017)09- 2689- 05

        10.11772/j.issn.1001- 9081.2017.09.2689

        TP399

        A

        This work is partially supported by the National Natural Science Foundation of China (61402236, 61373064), Opening Foundation of Jiangsu Key Laboratory of Agricultural Meteorology (KYQ1309), Six Talent Peaks Project in Jiangsu Province (2015-DZXX-015, 2013-DZXX-019), the Prospective Joint Research Project of Jiangsu Province (BY2014007-2), Special Fund for Meteorological Research in Public Interest (GYHY201106037).

        WANGJun, born in 1970, M. S., professor. His research interests include wireless sensor network, big data.

        FEIKai, born in 1990, M. S. candidate. His research interests include application of big data in meteorological field.

        CHENGYong, born in 1980, Ph. D., senior engineer. His research interests include wireless sensor network, big data.

        猜你喜歡
        分類(lèi)器降水神經(jīng)網(wǎng)絡(luò)
        黑龍江省玉米生長(zhǎng)季自然降水與有效降水對(duì)比分析
        黑龍江氣象(2021年2期)2021-11-05 07:07:00
        神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        為什么南極降水很少卻有很厚的冰層?
        家教世界(2018年16期)2018-06-20 02:22:00
        BP-GA光照分類(lèi)器在車(chē)道線識(shí)別中的應(yīng)用
        加權(quán)空-譜與最近鄰分類(lèi)器相結(jié)合的高光譜圖像分類(lèi)
        結(jié)合模糊(C+P)均值聚類(lèi)和SP-V-支持向量機(jī)的TSK分類(lèi)器
        降水現(xiàn)象儀模擬軟件設(shè)計(jì)與實(shí)現(xiàn)
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        99久久久无码国产精品9| 45岁妇女草逼视频播放| 特级做a爰片毛片免费看| 午夜精品久久久久成人| 狠狠色噜噜狠狠狠狠米奇777| 色综合久久天天综线观看| 无码视频一区=区| 国产一区二区av在线免费观看| 97色偷偷色噜噜狠狠爱网站| 日韩av高清无码| 国产在线观看免费一级| 顶级高清嫩模一区二区| 国产精品亚洲av无人区一区香蕉| 久久不见久久见中文字幕免费| 一区二区三区日韩亚洲中文视频| 亚洲高清国产拍精品熟女| 中国亚洲一区二区视频| 久久人人爽人人爽人人片av东京热| 2022Av天堂在线无码| 日韩中文字幕乱码在线| 真实夫妻露脸自拍视频在线播放| 亚洲熟妇无码八av在线播放| 国产AV无码专区亚洲AV桃花庵| 亚洲精品av一区二区日韩| 国产99久久久国产精品~~牛| 韩国19禁无遮挡啪啪无码网站| 午夜国产精品久久久久| 国产性色av一区二区| 久久久久99精品成人片直播| 无码不卡高清毛片免费| 国产熟女精品一区二区| 亚洲国产精品激情综合色婷婷| 成人免费无码视频在线网站 | 国产成人综合久久三区北岛玲 | 文字幕精品一区二区三区老狼 | 亚洲精品成人片在线观看| 国产高清亚洲精品视频| 一本大道道久久综合av| 日本成本人三级在线观看| 成人无码无遮挡很H在线播放| 日韩美腿丝袜三区四区|