亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)策略的短時(shí)雷電預(yù)報(bào)

        2016-11-01 18:26:27孫麗華嚴(yán)軍峰徐健鋒
        計(jì)算機(jī)應(yīng)用 2016年9期
        關(guān)鍵詞:約簡(jiǎn)雷電分類器

        孫麗華 嚴(yán)軍峰 徐健鋒

        摘要:

        傳統(tǒng)的雷電數(shù)據(jù)預(yù)測(cè)方法往往采用單一最優(yōu)機(jī)器學(xué)習(xí)算法,較少考慮氣象數(shù)據(jù)的時(shí)空變化等現(xiàn)象。針對(duì)該現(xiàn)象,提出一種基于集成策略的多機(jī)器學(xué)習(xí)短時(shí)雷電預(yù)報(bào)算法。首先,對(duì)氣象數(shù)據(jù)進(jìn)行屬性約簡(jiǎn),降低數(shù)據(jù)維度;其次,在數(shù)據(jù)集上訓(xùn)練多種異構(gòu)機(jī)器學(xué)習(xí)分類器,并基于預(yù)測(cè)質(zhì)量篩選最優(yōu)基分類器;最后,通過(guò)對(duì)最優(yōu)基分類器訓(xùn)練權(quán)重,并結(jié)合集成策略產(chǎn)生最終分類器。實(shí)驗(yàn)表明,該方法優(yōu)于傳統(tǒng)單最優(yōu)方法,其平均預(yù)測(cè)準(zhǔn)確率提高了9.5%。

        關(guān)鍵詞:

        雷電預(yù)報(bào);屬性約簡(jiǎn);集成學(xué)習(xí);機(jī)器學(xué)習(xí)

        中圖分類號(hào):

        TP181

        文獻(xiàn)標(biāo)志碼:A

        Abstract:

        The traditional lightning data forecasting methods often use single optimal machine learning algorithm to forecast, not considering the spatial and temporal variations of meteorological data. For this phenomenon,an ensemble learning based multimachine learning model was put forward. Firstly, attribute reduction was conducted for meteorological data to reduce dimension; secondly, multiple heterogeneous machine learning classifiers were trained on data set and optimal base classifier was screened based on predictive quality; finally, the final classifier was generated after weighted training for optimal base classifier by using ensemble strategy. The experimental results show that,compared with the traditional single optimal algorithm, the prediction accuracy of the proposed model is increased by 9.5% on average.

        英文關(guān)鍵詞Key words:

        lightning forecast;attribute reduction;ensemble learning;machine learning

        0引言

        雷電是人類面臨的最嚴(yán)重的自然災(zāi)害之一,以江西省為例,6~8月為江西省雷電活動(dòng)頻發(fā)月份,1~2月和10~12月雷電活動(dòng)少發(fā)月份。根據(jù)文獻(xiàn)[1]統(tǒng)計(jì),過(guò)去幾年當(dāng)中,江西省雷電活動(dòng)比例在冬季最高,秋季次之,午后為雷電活動(dòng)最頻發(fā)時(shí)刻,12~21時(shí)是江西省雷電活動(dòng)最頻繁的時(shí)間段,約占總雷電活動(dòng)數(shù)的79.4%。另?yè)?jù)文獻(xiàn)[2]統(tǒng)計(jì),江西省2005—2013年總共發(fā)生2808次雷電災(zāi)害,造成437人死亡,246人受傷,直接經(jīng)濟(jì)損失達(dá)到21697萬(wàn)元,間接經(jīng)濟(jì)損失達(dá)到22430萬(wàn)元。因此,必須加強(qiáng)雷電災(zāi)害監(jiān)測(cè)及雷電防御工作。

        國(guó)內(nèi)外雷電預(yù)報(bào)是在篩選出與雷電發(fā)生相關(guān)性高的大氣不穩(wěn)定參數(shù)作為預(yù)報(bào)因子的基礎(chǔ)上,構(gòu)建雷電發(fā)生的概率預(yù)報(bào)方程,并區(qū)分強(qiáng)雷電與弱雷電。雷電預(yù)報(bào)所利用的資料主要有探空、雷達(dá)和衛(wèi)星等觀測(cè)資料及雷電探測(cè)資料。當(dāng)前業(yè)內(nèi)主要的預(yù)報(bào)研究方法有:

        1)常規(guī)預(yù)報(bào)方法,預(yù)報(bào)員利用天氣學(xué)方法制作出來(lái)的,但準(zhǔn)確度不高。

        2)利用衛(wèi)星云圖和天氣雷達(dá)資料預(yù)報(bào)對(duì)流性天氣,在衛(wèi)星云圖和雷達(dá)回波圖上,通過(guò)對(duì)流云團(tuán)的動(dòng)態(tài)顯示,以及對(duì)流天氣的預(yù)報(bào),從而確定雷電發(fā)生和落區(qū)的預(yù)報(bào)。

        3)數(shù)值預(yù)報(bào)方法,利用強(qiáng)對(duì)流天氣數(shù)值模式,對(duì)歷史數(shù)據(jù)建模,從而模擬各個(gè)區(qū)域出現(xiàn)雷電的情況。

        4)閃電定位儀監(jiān)測(cè)是目前對(duì)雷電天氣的最佳監(jiān)測(cè)手段,要求不斷地把監(jiān)測(cè)的閃電強(qiáng)度、頻數(shù)、閃電性質(zhì)、落區(qū)、時(shí)間顯示在雷電預(yù)報(bào)系統(tǒng)中,應(yīng)用雷電發(fā)生發(fā)展理論和引導(dǎo)氣流方法對(duì)閃電的未來(lái)強(qiáng)度作出預(yù)報(bào),顯示未來(lái)可能影響本地的雷電。

        目前采用機(jī)器學(xué)習(xí)較成功的預(yù)報(bào)方法有:用決策樹方法制作的,為機(jī)場(chǎng)提供自動(dòng)雷電探測(cè)和嚴(yán)格導(dǎo)航系統(tǒng)的美國(guó)AWIPS雷電產(chǎn)品;澳大利亞氣象局結(jié)合數(shù)值預(yù)報(bào)產(chǎn)品制作的雷電預(yù)報(bào)決策樹方法;印度德里地區(qū)用點(diǎn)聚圖方法、多元線性回歸方程法制作的季風(fēng)爆發(fā)前雷電客觀預(yù)報(bào),均取得了較好的效果。

        相對(duì)而言,目前國(guó)內(nèi)外對(duì)高分辨率短時(shí)臨近雷電預(yù)報(bào)研究較少。2012年,靳小兵等[3]采用決策樹法,提出結(jié)合T213模式資料和地面探空資料算法,建立了雷電預(yù)報(bào)業(yè)務(wù)系統(tǒng)。2013年,劉達(dá)新等[4]為了滿足應(yīng)用的要求,提出一種能夠抵抗粗差干擾的定位方法,該方法能夠有效地抵抗粗差的干擾,提高了雷電定位精度。劉沖等[5]提出了一種基于粗糙集正域?qū)傩约s簡(jiǎn)的雷電預(yù)報(bào)因子提取方法,該方法采用基數(shù)排序方法快速求解決策表的正域,引入可分辨概念度量屬性的重要性,提出了基于可分辨度的核屬性與非核屬性的提取方法,設(shè)計(jì)了相應(yīng)的面向雷電預(yù)報(bào)因子提取的屬性約簡(jiǎn)算法。彭永供等[6]在2013年,針對(duì)非平衡特征數(shù)據(jù)集中采用基于歐式距離的采樣算法低效率問(wèn)題,提出一種基于哈夫曼樹的雷電數(shù)據(jù)采樣算法,有效的提升了采樣效率。

        2014年,滕少華等[7]基于SVM的多組合器協(xié)同分析方法,提出了一個(gè)具有較高預(yù)測(cè)準(zhǔn)確性和分類穩(wěn)定性的多組合器協(xié)同分析算法,該算法在氣象預(yù)測(cè)中起到了很好的預(yù)測(cè)效果。此外,針對(duì)傳統(tǒng)的決策樹分類算法不能有效解決海量氣象數(shù)據(jù)中的知識(shí)挖掘問(wèn)題。2015年,周浩等[8]用二進(jìn)制表示來(lái)構(gòu)建屬性的二進(jìn)制信息粒向量,提出了屬性信息增益的計(jì)算方法,并結(jié)合并行處理模型MapReduce,研究了基于粒計(jì)算的ID3(Iterative Dichotomiser 3)決策樹分類的并行化處理新方法,該方法在氣象領(lǐng)域的預(yù)測(cè)也取得了很好的效果。

        現(xiàn)有算法雖然從不同角度來(lái)提高雷電預(yù)測(cè)準(zhǔn)確率,但往往采用單一預(yù)測(cè)算法。在實(shí)際應(yīng)用中,由于地域的不同,不同時(shí)空和不同季節(jié)對(duì)數(shù)據(jù)處理的要求也是不同的。這種單一的算法預(yù)報(bào)模型不能反映出數(shù)據(jù)的動(dòng)態(tài)變化特征,預(yù)報(bào)的穩(wěn)定性一般較差。

        集成學(xué)習(xí)也可以稱為提升方法[9]是提高分類準(zhǔn)確性和穩(wěn)定性的重要策略。該方法的基本思想是:對(duì)于一個(gè)相對(duì)復(fù)雜的系統(tǒng)來(lái)說(shuō),單個(gè)弱分類器的分類效果可能表現(xiàn)不佳,將多個(gè)弱分類器的分類結(jié)果進(jìn)行適當(dāng)綜合,就能得出比單個(gè)弱分類器更精確的分類結(jié)果。在眾多的提升算法[10-11]中AdaBoost(Adaptive Boosting)[12]算法最具代表性,算法采用加權(quán)多數(shù)表決的方法,在每次訓(xùn)練過(guò)程中,通過(guò)更新所有樣本權(quán)值的方式來(lái)增加在上一次分類中被錯(cuò)誤分類的樣本權(quán)值,使其在下一次訓(xùn)練中被著重考慮。最終結(jié)果是加大各弱分類誤差率小的分類器權(quán)值,使其在表決中起較大作用,減少分類誤差率大的弱分類器的權(quán)值,使其在表決中起較小的作用,從而提升算法性能。

        粗糙集理論越來(lái)越多地應(yīng)用到了數(shù)據(jù)挖掘之中,粗糙集的屬性約簡(jiǎn)不需要屬性分布的任何先驗(yàn)信息,因此其應(yīng)用結(jié)果更為客觀??紤]到粗糙集屬性約簡(jiǎn)的客觀性、有效性、尤其是連續(xù)型變量的情形,本文將應(yīng)用粗糙集方法對(duì)原始數(shù)據(jù)集進(jìn)行屬性約簡(jiǎn)[13-14]。

        本文針對(duì)傳統(tǒng)雷電預(yù)測(cè)中存在的問(wèn)題,結(jié)合集成學(xué)習(xí)的思想,提出一個(gè)具有個(gè)性化的多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)策略的混合雷電預(yù)測(cè)算法框架模型(Personal MultiMachine Learning Competitive Strategy, PMML)。通過(guò)將本模型應(yīng)用于實(shí)際預(yù)測(cè),取得了較好的預(yù)測(cè)效果。

        1氣象數(shù)據(jù)

        氣象觀測(cè)資料為江西省83個(gè)氣象站2010—2014年雷電觀測(cè)資料,雷電監(jiān)測(cè)定位資料為2010—2014年江西省氣象局雷電監(jiān)測(cè)定位網(wǎng)監(jiān)測(cè)資料。

        研究采用的數(shù)據(jù)來(lái)源于江西氣象局業(yè)務(wù)運(yùn)行的局地分析預(yù)報(bào)系統(tǒng)(Local Analysis Prediction System,LAPS)資料數(shù)據(jù)。該系統(tǒng)垂直層從100hPa開始每間隔50hPa劃分為一層共劃分了21 層,第一層為第0層。水平格距為5km×5km,系統(tǒng)分析區(qū)域的以31.0°N,115.0°E為中心。系統(tǒng)不僅提供一些常用的基本物理量的分析場(chǎng)資料數(shù)據(jù),同時(shí)還提供由某些分析量導(dǎo)出的衍生產(chǎn)品資料,系統(tǒng)的資料產(chǎn)品包括風(fēng)、溫度、垂直速度、高度、比濕、云量、液態(tài)水含量、相對(duì)濕度、云分類、云水含量、雪含量、反射率、雨水含量、云底高度、云頂高度、云冰、可降水量、抬升指數(shù)、對(duì)流抑制能量、肖沃特指數(shù)、對(duì)流有效位能、抬升凝結(jié)高度、K 指數(shù)等33 種產(chǎn)品。LAPS每天輸出8個(gè)時(shí)次(00、03、06、09、12、15、18、21 時(shí))間隔3小時(shí)的分析量資料。

        2多機(jī)器學(xué)習(xí)雷電預(yù)測(cè)算法模型

        本文提出的多機(jī)器學(xué)習(xí)雷電預(yù)測(cè)算法模型如圖1所示。該模型包括:數(shù)據(jù)約簡(jiǎn)模塊(含數(shù)據(jù)清洗、數(shù)據(jù)離散化)、多機(jī)器競(jìng)爭(zhēng)模塊、集成學(xué)習(xí)模塊。

        其主要學(xué)習(xí)過(guò)程是:

        首先,訓(xùn)練數(shù)據(jù)集經(jīng)屬性約簡(jiǎn)后,導(dǎo)入多機(jī)器學(xué)習(xí)模塊,對(duì)M個(gè)備選機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。

        然后,在多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)模塊中,這些訓(xùn)練后的機(jī)器學(xué)習(xí)分類器,會(huì)通過(guò)多測(cè)試集進(jìn)行預(yù)測(cè)準(zhǔn)確性與預(yù)測(cè)穩(wěn)定性的競(jìng)爭(zhēng),并推選出N個(gè)最優(yōu)基分類器(N

        最后,在集成學(xué)習(xí)模塊,多最優(yōu)基分類器被提取出來(lái),按照集成策略分別對(duì)實(shí)際氣象數(shù)據(jù)進(jìn)行預(yù)測(cè)并且統(tǒng)計(jì)出最優(yōu)預(yù)測(cè)結(jié)果。

        2.1多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)模塊

        多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)過(guò)程的分類器競(jìng)爭(zhēng)過(guò)程如圖2所示。

        首先,將數(shù)據(jù)集隨機(jī)劃分為80%的訓(xùn)練集和20%的測(cè)試集,再將20%的測(cè)試集采用隨機(jī)抽樣方式劃分為多個(gè)(K個(gè))測(cè)試數(shù)據(jù)集,然后應(yīng)用粗糙集進(jìn)行屬性約簡(jiǎn)。

        然后,經(jīng)過(guò)約簡(jiǎn)后的訓(xùn)練集數(shù)據(jù)分別導(dǎo)入M個(gè)不同算法進(jìn)行有指導(dǎo)的機(jī)器學(xué)習(xí)訓(xùn)練。

        最后,通過(guò)約簡(jiǎn)后的K個(gè)測(cè)試數(shù)據(jù)集對(duì)M個(gè)學(xué)習(xí)后的算法分類器進(jìn)行測(cè)試,分別得到各個(gè)算法的K個(gè)預(yù)測(cè)準(zhǔn)確率的均值及方差(即預(yù)測(cè)穩(wěn)定性)。

        根據(jù)上述訓(xùn)練和測(cè)試的結(jié)果,通過(guò)平均預(yù)測(cè)準(zhǔn)確性的排序和比對(duì),保留N個(gè)預(yù)測(cè)準(zhǔn)確性最高分類器作為最終分類器。

        多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)模塊中的關(guān)鍵算法步驟介紹如下:

        1)預(yù)測(cè)準(zhǔn)確性算法(Prediction Accuracy, Ca_Accuracy)。

        算法思想:訓(xùn)練后的算法(After Training Algorithm, Alg)導(dǎo)入約簡(jiǎn)后的氣象測(cè)試數(shù)據(jù)集信息系統(tǒng)(Meteorological Information System, MIS*)的每條記錄,進(jìn)行分類預(yù)測(cè)。其中MIS=(U,C*,D,V, f)。U={x1,x2,…,xi}代表雷電氣象數(shù)據(jù)記錄對(duì)象(元組)集合,其中xi為第i條雷電記錄(元組)。C*和D是雷電數(shù)據(jù)的所有屬性集合,分為兩個(gè)不相交的子集,即條件屬性C*和決策屬性D。條件屬性C*包括表1中提到的所有屬性,決策屬性D的值域:D{0,1},1代表發(fā)生雷電,0代表未發(fā)生雷電。V:是條件屬性C*的取值集合,Va是屬性a的值域。 f是U×(C*×D)→V的一個(gè)信息函數(shù),它為任一個(gè)對(duì)象x∈U對(duì)應(yīng)的任一屬性a∈C*的屬性取值,即fa(x)∈Va。其預(yù)測(cè)結(jié)果與MIS*決策值進(jìn)行比對(duì),可以統(tǒng)計(jì)出該算法的預(yù)測(cè)準(zhǔn)確率。

        算法輸入:訓(xùn)練后的算法Alg(),測(cè)試數(shù)據(jù)MIS=(U,C*,D,V, f)。

        算法輸出:算法Alg在測(cè)試集MIS*中的預(yù)測(cè)準(zhǔn)確性γ。

        算法步驟流程:

        3實(shí)驗(yàn)與結(jié)果分析

        3.1實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集

        1)實(shí)驗(yàn)環(huán)境。

        本次實(shí)驗(yàn)環(huán)境在Windows7系統(tǒng)中使用Matlab 7.1,GrADS 1.9 為實(shí)驗(yàn)平臺(tái)進(jìn)行實(shí)驗(yàn)。

        2)實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備。

        本文從2010—2014年江西省境內(nèi)及周邊的雷電定位資料中提取出南昌市、九江市、上饒市、鷹潭市等4個(gè)城市的閃電定位數(shù)據(jù)。由于南昌和九江相鄰等問(wèn)題,因此該鄰近區(qū)域雷電產(chǎn)生次數(shù)統(tǒng)計(jì)使用粗糙集來(lái)處理。此外,因江西省一年的閃電基本集中在5—10月,故本文從中取出5—8月份對(duì)應(yīng)的閃電數(shù)據(jù),以構(gòu)建本實(shí)驗(yàn)數(shù)據(jù)集,共計(jì)820761條記錄,其中雷電樣本539324條,非閃電樣本281437條。

        3.2實(shí)驗(yàn)設(shè)置

        為了驗(yàn)證該框架中多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)算法策略在不同地域的有效性,本文選擇南昌市、九江市、上饒市、鷹潭市等4個(gè)城市在2010年—2014年的5—10月份的氣象數(shù)據(jù)作為研究對(duì)象。算法集合選擇了支持向量機(jī)(Support Vector Machine, SVM) 、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)、 決策樹(Decision Tree, DTree)、貝葉斯分類器(Naive Bayes, Bayes)、K最近鄰算法(KNearest Neighbor, KNN)作為備選算法。采用本PMML模型與文獻(xiàn)[8]中算法分別進(jìn)行學(xué)習(xí)與預(yù)報(bào)。

        3.3實(shí)驗(yàn)結(jié)果

        如圖3所示,PMML實(shí)驗(yàn)結(jié)果可以看出,4個(gè)地區(qū)獲得的最優(yōu)基分類器算法各不相同。在對(duì)南昌市和九江市兩個(gè)不同地區(qū)的雷電數(shù)據(jù)進(jìn)行預(yù)報(bào)時(shí),決策樹在南昌的預(yù)測(cè)平均準(zhǔn)確率為93.3%,ANN在九江地區(qū)的平均預(yù)測(cè)準(zhǔn)確率為94.4%。對(duì)比上饒、鷹潭可以看出,決策樹在上饒地區(qū)的預(yù)測(cè)平均準(zhǔn)確率為77.6%,而在鷹潭地區(qū)有較高的88.7%的預(yù)測(cè)平均準(zhǔn)確率??梢钥闯?,在不同地域中,預(yù)測(cè)準(zhǔn)確率最高的算法并不總是相同,可見PMML算法在不同地域具有不唯一的最優(yōu)預(yù)測(cè)算法。

        為了進(jìn)一步驗(yàn)證本模型預(yù)測(cè)算法的有效性,將本文提出的PMML算法與文獻(xiàn)[8]提出的基于粒計(jì)算的決策樹算法分別在四個(gè)不同的地區(qū)進(jìn)行對(duì)比實(shí)踐。此次對(duì)比實(shí)踐當(dāng)中,由于發(fā)生雷電的次數(shù)并不是每天都在發(fā)生,故以下實(shí)驗(yàn)有針對(duì)性的對(duì)2014年8月發(fā)生雷電的某一天進(jìn)行實(shí)際預(yù)測(cè)。由于篇幅所限,本文只選取了南昌、九江、上饒、鷹潭等4個(gè)地區(qū)的實(shí)驗(yàn)結(jié)果作為展示。實(shí)驗(yàn)在4個(gè)不同地區(qū)不同時(shí)段各自取了10000條氣象數(shù)據(jù),不同地區(qū)發(fā)生雷電次數(shù)不同。如圖4~7顯示的是部分的實(shí)驗(yàn)結(jié)果。

        從圖4~7可以看出,PMML算法與文獻(xiàn)[8]的預(yù)測(cè)準(zhǔn)確條數(shù)隨預(yù)測(cè)區(qū)域的不同而不同。在南昌、九江和鷹潭三個(gè)地區(qū),PMML算法與文獻(xiàn)[8]算法預(yù)測(cè)準(zhǔn)確性出現(xiàn)不同層次的交替。同時(shí)也可以看出,PMML算法曲線始終隨著實(shí)際雷電數(shù)曲線的變化而變化,而文獻(xiàn)[8]曲線變化與實(shí)際打雷數(shù)曲線關(guān)聯(lián)度不大。說(shuō)明PMML算法在處理具有不同數(shù)據(jù)特征的數(shù)據(jù)集時(shí)比一般算法效果更好??傮w來(lái)看,PMML算法的預(yù)測(cè)準(zhǔn)確性比文獻(xiàn)[8]算法高。

        從地域來(lái)看,不同地區(qū)同一時(shí)間段內(nèi)PMML算法與文獻(xiàn)[8]算法的預(yù)測(cè)效果差異性不大。但PMML算法的預(yù)測(cè)結(jié)果具有一定穩(wěn)定性,文獻(xiàn)[8]算法在不同地區(qū)僅使用單一算法,不能滿足不同地區(qū)不同氣候條件下的數(shù)據(jù)需要,因而其預(yù)測(cè)結(jié)果不穩(wěn)定。不論從不同地區(qū)還是不同時(shí)間段分析, PMML算法在處理不同地區(qū)的不同數(shù)據(jù)時(shí)的平均預(yù)測(cè)準(zhǔn)確性都在90%以上,具有較高的預(yù)測(cè)準(zhǔn)確性,因此實(shí)踐取得了較好的效果。

        為了對(duì)實(shí)驗(yàn)結(jié)果作進(jìn)一步分析,本文通過(guò)k折交叉驗(yàn)證(kfold crossValidation)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比分析。具體如下:在上文實(shí)驗(yàn)場(chǎng)景下,在不同規(guī)模數(shù)據(jù)集中,分別將數(shù)據(jù)集隨機(jī)劃分為k等分(本文k取5)。取出其中4份作為訓(xùn)練集,剩余1份作測(cè)試集進(jìn)行實(shí)驗(yàn),交叉驗(yàn)證重復(fù)5次,直到每個(gè)子樣本都驗(yàn)證一次,從而得到5次結(jié)果的平均預(yù)測(cè)誤差大小。在不同數(shù)據(jù)集規(guī)模進(jìn)行交叉驗(yàn)證后,得到表3所示結(jié)果對(duì)比。

        從表3可以看出,本文所提算法在大規(guī)模數(shù)據(jù)集中具有良好的低錯(cuò)誤率,而對(duì)比文獻(xiàn)算法由于預(yù)測(cè)使用的算法單一,在面對(duì)大規(guī)模數(shù)據(jù)集時(shí),預(yù)測(cè)效果表現(xiàn)不佳。當(dāng)數(shù)據(jù)集較大時(shí),數(shù)據(jù)的特征分布也會(huì)發(fā)生變化,單一預(yù)測(cè)算法將不再適用。而本文所提算法由于使用多種經(jīng)典算法,結(jié)合集成策略思想,能夠在不同數(shù)據(jù)集上適應(yīng)具有不同特征分布的數(shù)據(jù)預(yù)測(cè)變化。

        4結(jié)語(yǔ)

        本文針對(duì)傳統(tǒng)雷電預(yù)測(cè)當(dāng)中預(yù)測(cè)算法單一,不能很好地考慮數(shù)據(jù)集全局的數(shù)據(jù)特征問(wèn)題,提出了一種基于多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)策略的混合框架模型。模型首先對(duì)氣象數(shù)據(jù)應(yīng)用粗糙集進(jìn)行屬性約簡(jiǎn),再通過(guò)多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)策略競(jìng)爭(zhēng)產(chǎn)生一定數(shù)量的最優(yōu)基分類器,再應(yīng)用集成學(xué)習(xí)的思想,對(duì)多個(gè)最優(yōu)基分類器進(jìn)行集成,最后產(chǎn)生最終分類器。通過(guò)在江西省多個(gè)不同地區(qū)進(jìn)行實(shí)際預(yù)測(cè),結(jié)果表明該模型比傳統(tǒng)預(yù)測(cè)方法具有較好的預(yù)測(cè)準(zhǔn)確性。由于氣象數(shù)據(jù)具有典型的時(shí)間序列特征,例如:頻率、波形、方差等,都可充分利用,下一步的研究將著重考慮氣象數(shù)據(jù)的時(shí)序特性,從時(shí)間維度來(lái)進(jìn)一步提高預(yù)測(cè)準(zhǔn)確率。

        參考文獻(xiàn):

        [1]

        李準(zhǔn),楊慧民,林春.南昌地區(qū)雷電災(zāi)害易損性分析及區(qū)劃[J].氣象研究與應(yīng)用,2013,34(3):78-82.(LI Z, YANG H M, LIN C. Regionalization and analysis of lighting disaster vulnerability in Nanchang [J]. Journal of Meteorological Research and Application, 2013, 34(3): 78-82.)

        [2]

        呂振東,李玉塔,王懷清.江西省雷電時(shí)空分布特征及其區(qū)域易損性分析[J].能源研究與管理,2016(1):51-57.(LYU Z D, LI Y T, WANG H Q. Analysis of temporal and spatial distribution characteristics of lighting activity and vulnerability in Jiangxi [J]. Energy Research and Management, 2016(1): 51-57.)

        [3]

        靳小兵,卜俊偉,李一丁,等.四川省雷電監(jiān)測(cè)預(yù)警預(yù)報(bào)系統(tǒng)及其應(yīng)用研究[J].高原山地氣象研究,2012,32(3):54-57.(JIN X B, BU J W, LI Y D, et al. The research of lightning monitoring and early warning forecast system of Sichuan province and its application [J]. Plateau and Mountain Meteorology Research, 2012, 32(3): 54-57.)

        [4]

        劉達(dá)新,來(lái)志云,吉平,等.能抵抗粗差的雷電定位算法研究與仿真[J].科學(xué)技術(shù)與工程,2013,13(28):8399-8403.(LIU D X, LAI Z Y, JI P, et al. Algorithms and simulation for robust lightning location [J]. Science Technology and Engineering, 2013, 13(28): 8399-8043.)

        [5]

        劉沖,李向軍,沈華,等.基于基數(shù)排序及屬性約簡(jiǎn)的雷電預(yù)報(bào)因子提取方法[J].南昌大學(xué)學(xué)報(bào)(理科版),2013,37(4):344-349.(LIU C, LI X J, SHENG H, et al. Extraction method of lightning forecast factors based on radix sort and attribute reduction [J]. Journal of Nanchang University (Natural Science), 2013, 37(4): 344-349.)

        [6]

        彭永供,邱桃榮,林于淵,等.基于哈夫曼樹的雷電數(shù)據(jù)采樣算法[J].計(jì)算機(jī)工程,2013,39(5):174-177.(PENG Y G, QIU T R, LIN Y Y, et al. Lightning data sampling algorithm based on Huffman tree [J]. Computer Engineering, 2013, 39(5): 174-177.)

        [7]

        滕少華,樊繼慧,陳瀟,等.SVM多分類器協(xié)同挖掘局域氣象數(shù)據(jù)[J].廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,39(5):1131-1137.(TENG S H, FAN J H, CHEN X, et al. Application of SVMbased multiclassifiers in miningcooperatively local area meteorological data [J]. Journal of Guanxi University (Natural Science Edition), 2014, 39(5): 1131-1137.)

        [8]

        周浩,劉萍,邱桃榮,等.基于粒計(jì)算的決策樹并行算法的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(6):1504-1509.(ZHOU H, LIU P, QIU T R, et al. Parallel decision tree algorithm based on granular computing [J]. Computer Engineering and Design, 2015, 36(6): 1504-1509.)

        [9]

        VALIANT L G. A theory of the learnable [J]. Communications of the ACM, 1984, 27(11): 1134-1142.

        [10]

        NAKAMURA M, NOMIYA H, UEHARA K. Improvement of boosting algorithm by modifying the weighting rule [J]. Annals of Mathematics and Artificial Intelligence, 2004, 41(1): 95-109.

        [11]

        LOZANO A C, ABE N. Multiclass costsensitive boosting with pnorm loss functions [C]// KDD 08: Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2008: 506-514.

        [12]

        廖紅文,周德龍.AdaBoost及其改進(jìn)算法綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,21(5):240-244.(LIAO H W, ZHOU D L. Review of AdaBoost and its improvement [J]. Computer System and Applications, 2012, 21(5): 240-244.)

        [13]

        劉宏杰,馮博琴,李文捷,等.粗糙集屬性約簡(jiǎn)判別分析方法及其應(yīng)用[J].西安交通大學(xué)學(xué)報(bào),2007,41(8):939-943.(LIU H J, FENG B Q, LI W J, et al. Discrimination method of rough set attribute reduction and its applications [J]. Journal of Xian JiaoTong University, 2007, 41(8): 939-943.)

        [14]

        PAWLAK Z. Rough sets [J]. International Journal of Computer and Information Sciences, 1982, 11(5): 341-356.

        猜你喜歡
        約簡(jiǎn)雷電分類器
        雨天防雷電要選對(duì)雨傘
        中老年保健(2021年5期)2021-08-24 07:08:30
        基于二進(jìn)制鏈表的粗糙集屬性約簡(jiǎn)
        雷電
        BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
        實(shí)值多變量維數(shù)約簡(jiǎn):綜述
        基于模糊貼近度的屬性約簡(jiǎn)
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        計(jì)算機(jī)機(jī)房的雷電防護(hù)
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
        亚欧免费无码aⅴ在线观看| 日韩一区中文字幕在线| 中文字幕人妻日韩精品| 亚洲av成人无码一区二区三区在线观看| 看全色黄大色大片免费久久| 亚洲欧洲日产国码无码AV一 | 色拍拍在线精品视频| 亚洲日韩AV无码美腿丝袜| 午夜少妇高潮在线观看视频| 亚洲av午夜福利精品一区| 亚洲国产精品sss在线观看av | 亚洲av调教捆绑一区二区三区| 欧美噜噜久久久xxx| 色婷婷久久综合中文久久蜜桃av| 怡红院av一区二区三区| av无码精品一区二区三区四区| 2020最新国产激情| 日韩中文字幕不卡在线| 国产一区二区黄色录像| 樱桃视频影视在线观看免费| 国模精品二区| 亚洲一区二区三区高清视频| 日韩人妻无码精品一专区二区三区| 撕开奶罩揉吮奶头视频| 欧美人与物videos另类xxxxx| 亚洲青青草视频在线播放| 国产亚洲91精品色在线| 久久精品国产亚洲av高清热| 最新亚洲人成网站在线| 色优网久久国产精品| 亚洲在线精品一区二区三区| 国内女人喷潮完整视频| 国产女在线| 欧洲亚洲色一区二区色99| 亚洲av手机在线播放| 久久久亚洲精品一区二区三区 | 777国产偷窥盗摄精品品在线 | 99久久亚洲国产高清观看| 丰满人妻一区二区三区免费| 国产精品18久久久白浆| 三年片免费观看大全国语|