亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用

        2017-02-15 17:49:06李磊牟少敏林中琦
        安徽農(nóng)學(xué)通報 2017年1期
        關(guān)鍵詞:氣象因子棉蚜隨機(jī)森林

        李磊+牟少敏+林中琦

        摘 要:棉蚜是棉區(qū)的主要農(nóng)業(yè)害蟲之一,對于棉花的產(chǎn)量和質(zhì)量影響較大。為了準(zhǔn)確地對棉蚜蟲害的等級進(jìn)行分類預(yù)測,以便采取科學(xué)的防治措施,該研究對山東省濱州地區(qū)1990—2009年的20年中5—9月的平均氣溫、降水量、相對濕度、日照時數(shù)等氣象數(shù)據(jù)、棉蚜天敵數(shù)據(jù)與棉蚜蟲害數(shù)據(jù)進(jìn)行了相關(guān)性分析,篩選后保留的影響因子數(shù)據(jù)構(gòu)建隨機(jī)森林棉蚜蟲害等級預(yù)測模型。結(jié)果表明:隨機(jī)森林模型的OOB為5.7%,等級的誤分率為0.09和0.019,經(jīng)測試集檢驗,模型預(yù)測的準(zhǔn)確率為82.2%。模型泛化性好,等級的誤分率低。

        關(guān)鍵詞:隨機(jī)森林;棉蚜;氣象因子;等級預(yù)測

        中圖分類號 TP391;S431 文獻(xiàn)標(biāo)識碼 A 文章編號 1007-7731(2017)01-0018-03

        Abstract:Cotton aphid is one of the main agricultural pests of cotton,for greater effects on the yield and quality of cotton. In order to accurately classify the level of cotton aphid pest forecast,through the acquisition of Binzhou area of Shandong Province region from May to September in 1990-2009,average temperature,precipitation,relative humidity,sunshine hours and other meteorological data and cotton aphid enemies and Aphis gossypii pest data correlation analysis,screening of meteorological data to build a random forest pests and Aphis gossypii level prediction model.Experimental results show that the random forest model of OOB was 5.7%,the level of point error rate was 0.09 and 0.019,have examined the test set and model prediction accuracy is 82.2%.The generalization of the model is good,and the rate of misclassification is low.

        Key words:Random forest;Cotton aphid;Meteorological factors;level Prediction

        棉花是我國重要的經(jīng)濟(jì)作物之一,山東省濱州地區(qū)棉花種植面積廣泛。棉蚜是造成棉花減產(chǎn)的主要害蟲之一,由于其發(fā)生時間長,繁殖速度快,危害嚴(yán)重且防治困難,在一定程度上制約了濱州地區(qū)棉花的優(yōu)質(zhì)和高產(chǎn)。而氣象條件和天敵數(shù)量均對棉蚜產(chǎn)生直接的影響,為有效防治棉蚜的危害,學(xué)者們對棉蚜蟲害的預(yù)測進(jìn)行了大量的研究。如張金[1]等采用逐步判別分析法分析了氣候條件和棉蚜蟲害等級的關(guān)系,構(gòu)建了新疆石河子地區(qū)棉蚜多元線性回歸預(yù)測模型。吳昊[2]等對九江鄱陽湖地區(qū)棉蚜發(fā)生規(guī)律和預(yù)報方法進(jìn)行了研究,以豐富該地區(qū)的棉蚜預(yù)報方法。慕彩云[3]等對東疆地區(qū)的棉蚜預(yù)測構(gòu)建了日預(yù)測、月預(yù)測及旬預(yù)測的線性回歸模型。目前,在棉蚜預(yù)測模型的構(gòu)建中多運用線性回歸,但是在線性回歸分析中采用何種因子進(jìn)行表達(dá)只是一種推測,從而影響了因子的多樣性和不可測性,使得回歸分析在某些情況下的使用受到限制。

        隨機(jī)森林在運算量沒有顯著提高的前提下提高了預(yù)測精度,并且對于多元共線性不敏感,對缺失數(shù)據(jù)和非平衡數(shù)據(jù)比較穩(wěn)健[4],而且模型訓(xùn)練速度快,樣本選擇具有隨機(jī)性,不易產(chǎn)生過擬合。為此,本實驗將隨機(jī)森林用于棉蚜蟲害等級的短期預(yù)測中,提高了棉蚜預(yù)測的效率和準(zhǔn)確率,從而可以及時地為農(nóng)業(yè)生產(chǎn)者提供準(zhǔn)確的預(yù)警信息,提前采取防治措施,降低棉蚜對棉花的危害。

        1 隨機(jī)森林算法

        隨機(jī)森林算法[5]是2001年加利福尼亞大學(xué)的Leo Breiman提出的,是一種由多個決策樹組成的集成分類算法。集成學(xué)習(xí)現(xiàn)已成為國際機(jī)器學(xué)習(xí)界研究的熱點機(jī)器學(xué)習(xí)范式[6]。隨機(jī)森林中引入了2個隨機(jī)化過程,使得不同的分類樹具有不同的分類能力,當(dāng)輸入待分類樣本時,隨機(jī)森林輸出的結(jié)果由每個決策樹的分類結(jié)果進(jìn)行投票決定[7-8]。

        隨機(jī)森林是一個樹型分類器的集合。該算法中的元分類器是由CART算法組成但沒有剪枝的分類回歸樹。參數(shù)X是輸入向量;是獨立分布的隨機(jī)向量,決定單棵決策樹的生長過程。隨機(jī)森林中最重要的是如何構(gòu)造一個隨機(jī)森林。隨機(jī)森林的算法步驟如下:

        (1)假設(shè)數(shù)據(jù)的樣本數(shù)為N,那么每棵決策樹采樣的樣本數(shù)就是N。在這N個樣本中有放回的隨機(jī)選擇n(n

        (2)每個樣本有M個屬性,每棵決策樹的節(jié)點需要分裂時,從這M個屬性中隨機(jī)的選取m(m

        (3)每棵決策樹的每個節(jié)點分裂都是按照步驟(2)進(jìn)行,使每個節(jié)點的不純度達(dá)到最小,直到節(jié)點不能分裂為止,不對樹進(jìn)行剪枝。

        (4)根據(jù)生成的多個樹分類器對新的測試數(shù)據(jù)進(jìn)行測試,分類結(jié)果按每個樹分類器的投票而決定,即分類公式為:

        公式(1)中用majority vote表示多數(shù)投票,Ntree表示隨機(jī)森林樹的個數(shù)。隨機(jī)森林的隨機(jī)性體現(xiàn)在樣本的隨機(jī)選擇和屬性的隨機(jī)選擇,有了這兩個因素,即使每棵樹沒有進(jìn)行剪枝也不會出現(xiàn)過擬合。隨機(jī)森林中兩個參數(shù)n和m的設(shè)置:隨機(jī)森林樹的數(shù)量n一般取值比較大,m值一般選取M的平方根。在訓(xùn)練過程中每次抽樣生成了自助樣本集,全樣本集中約有37%的樣本不會出現(xiàn)在每一份自助樣本集中,我們稱這37%的樣本為袋外數(shù)據(jù)(Out Of Bag,OOB)。OOB可以用來估計組合分類器的泛化誤差和預(yù)測分類的正確率。

        2 實驗對象及數(shù)據(jù)來源

        2.1 棉蚜數(shù)據(jù) 棉蚜是棉區(qū)的主要害蟲之一,本實驗中棉蚜的數(shù)據(jù)來源于濱州市植保站對1990—2009年20年棉蚜百株蚜量動態(tài)監(jiān)測的統(tǒng)計。棉蚜的動態(tài)監(jiān)測從每年的5月開始進(jìn)行,直到棉田的棉蚜完全消失。棉田調(diào)查為隨機(jī)取樣,通過對取樣點每株棉花上棉蚜記數(shù),最后換算為百株蚜量,為棉蚜蟲害等級分類提供劃分依據(jù)。棉蚜的發(fā)生程度分級標(biāo)準(zhǔn)按照2010中國農(nóng)業(yè)出版社出版的《主要農(nóng)作物病蟲害測報技術(shù)規(guī)范應(yīng)用手冊》進(jìn)行劃分等級。棉蚜發(fā)生程度分級標(biāo)準(zhǔn)見表1。

        2.2 氣象和天敵數(shù)據(jù) 濱州市位于山東省北部、黃河三角洲腹地、渤海灣西南岸,屬暖溫帶亞濕潤季風(fēng)氣候。棉蚜發(fā)育繁殖所需要的適宜溫度逐步的提高,因此發(fā)生時間為每年的5—9月份,所以實驗所用的氣象數(shù)據(jù)為5—9月份采集到的數(shù)據(jù)。采集到的氣象數(shù)據(jù)包括平均氣溫、平均相對濕度、平均水汽壓、日最高氣溫、日最低氣溫、日照時數(shù)等因子。棉蚜天敵數(shù)據(jù)來源于濱州市測報站5—9月份的動態(tài)監(jiān)測數(shù)據(jù)。

        3 棉蚜等級預(yù)測隨機(jī)森林模型

        3.1 影響因子的相關(guān)性分析 從濱州市采集到的數(shù)據(jù)中,包含了15個影響因子數(shù)據(jù):20-20時降水量(X1),極大風(fēng)速(X2),平均本站氣壓(X3),平均風(fēng)速(X4),平均氣溫(X5),平均水汽壓(X6),平均相對濕度(X7),日照時數(shù)(X8),日最低本站氣壓(X9),日最低氣溫(X10),日最高本站氣壓(X11),日最高氣溫(X12),最大風(fēng)速(X13),最小相對濕度(X14),天敵數(shù)據(jù)(X15)。為了減少變量的冗余,提高因子的獨立性,對這15個影響因子用R進(jìn)行皮爾遜相關(guān)性分析,求得影響因子與等級的相關(guān)系數(shù)。用R語言進(jìn)行因子相關(guān)性分析后得到的相關(guān)系數(shù)如表2。通過表2中的相關(guān)系數(shù)可以看出,因子中的20-20時的降水量,平均風(fēng)速,日照時數(shù),最大風(fēng)速這4個氣象因子的相關(guān)系數(shù)偏小,說明這4個氣象因子對于等級的分類預(yù)測影響較弱。棉蚜的增長受相對濕度影響較大,雨量會影響相對濕度,對20-20時降水量因子進(jìn)行了保留。篩選后的部分?jǐn)?shù)據(jù)集如表3所示,表中的一條記錄表示5—9月份采集到的1d的數(shù)據(jù)。

        3.2 棉蚜等級預(yù)測隨機(jī)森林模型 基于隨機(jī)森林的棉蚜短期預(yù)測模型如下:(1)有放回的隨機(jī)抽樣。隨機(jī)森林對訓(xùn)練集中的樣本有放回的隨機(jī)選擇,選擇的樣本數(shù)小于訓(xùn)練集總的樣本數(shù)。(2)設(shè)置模型參數(shù)。隨機(jī)森林預(yù)測模型中樹的個數(shù)n取100[9],通過計算得出節(jié)點m為4。(3)模型訓(xùn)練。通過訓(xùn)練集中選取的樣本對模型進(jìn)行訓(xùn)練,得到模型的OOB和模型內(nèi)分類的誤差率。(4)預(yù)測。使用構(gòu)建的隨機(jī)森林預(yù)測模型對測試集進(jìn)行分類預(yù)測,結(jié)合表1得到棉蚜的發(fā)生程度。

        3.3 實驗結(jié)果與分析 用在濱州市采集到的樣本數(shù)據(jù)(表3)構(gòu)建隨機(jī)森林模型,使用OOB和分類準(zhǔn)確率對模型進(jìn)行評價。實驗得到模型的OOB為5.7%。模型的泛化誤差不大,說明隨機(jī)森林預(yù)測模型的泛化性比較好。隨機(jī)森林的混淆矩陣顯示等級分類誤差如表4所示。從表4可以看出,對于等級1的分類錯誤率為0.095,對于等級2的分類錯誤率為0.019。模型中每一類的分類錯誤率都比較小,說明棉蚜蟲害等級判別的準(zhǔn)確率比較高。

        測試樣本的分類準(zhǔn)確率為82.2%,實驗結(jié)果的混淆矩陣如表5所示。隨機(jī)森林的結(jié)果內(nèi)含有判別函數(shù),輸入采集到的樣本數(shù)據(jù)可以判別棉蚜的等級,部分棉蚜等級預(yù)測結(jié)果如表6所示。結(jié)合表1得到棉蚜的發(fā)生程度,可以提前對棉區(qū)采取相應(yīng)的防治措施。

        4 結(jié)論

        將隨機(jī)森林用于分類預(yù)測中,幾乎不需要輸入準(zhǔn)備,模型訓(xùn)練速度快,樣本選擇具有隨機(jī)性,而且隨機(jī)森林不易產(chǎn)生過擬合,從而有更好的效率和準(zhǔn)確率。本次實驗將隨機(jī)森林用于棉蚜等級的短期預(yù)測中,結(jié)果表明,該模型泛化性好,誤分類率低。隨機(jī)森林為棉蚜蟲害等級預(yù)測提供了一種新的方法。

        通過采集更多的影響棉蚜生長的影響因子數(shù)據(jù)以及棉蚜數(shù)據(jù)訓(xùn)練模型,提高隨機(jī)森林模型的預(yù)測準(zhǔn)確率,從而準(zhǔn)確及時地對棉蚜等級作出預(yù)測,降低棉蚜的危害,實現(xiàn)棉花生產(chǎn)的高產(chǎn)和優(yōu)產(chǎn)。

        參考文獻(xiàn)

        [1]張金,王佩玲.新疆石河子地區(qū)棉蚜發(fā)生程度預(yù)測模型研究[J].新疆農(nóng)業(yè)科學(xué),2008,45(3):438-441.

        [2]吳昊,徐梅珍,劉定忠.九江鄱陽湖區(qū)棉蚜發(fā)生規(guī)律與預(yù)報方法研究[J].安徽農(nóng)業(yè)科學(xué),2013,41(1):113-116.

        [3]慕彩蕓,車罡,道然·加帕依,朱曉華.新疆東疆棉蚜發(fā)生發(fā)展氣象等級預(yù)報模型[J].干旱氣象,2010,28(4):489-493.

        [4]Iverson L R,Prasad A M,Matthews S N,et al.Estimating potential habitat for 134 eastern US tree species under six climate scenarios[J].Forest Ecology & Management,2008,254(3):390–406.

        [5]Breiman L.Random forests[J].Machine Learning,2001,45(1):5-32.

        [6]溫廷新,張波,邵良杉.煤與瓦斯突出預(yù)測的隨機(jī)森林模型[J].計算機(jī)工程與應(yīng)用,2014,50(10):233-237.

        [7]董師師,黃哲學(xué).隨機(jī)森林理論淺析[J].集成技術(shù),2013,2(1):1-7.

        [8]楊帆,林琛,周綺鳳,等.基于隨機(jī)森林的潛在 k 近鄰算法其在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用[J].系統(tǒng)工程理論與實踐,2012,32(4):815-825.

        [9]劉敏,郎榮玲,曹永斌.隨機(jī)森林中樹的數(shù)量[J].計算機(jī)工程與應(yīng)用,2015,51(5):126-131.

        (責(zé)編:張宏民)

        猜你喜歡
        氣象因子棉蚜隨機(jī)森林
        Hap1型棉蚜在5種春季雜草上的生長發(fā)育情況
        低劑量啶蟲脒和雙丙環(huán)蟲酯對棉蚜繭蜂寄生功能的影響
        棉蚜取食被棉長管蚜危害棉花后其相關(guān)酶的活性
        遵義烤煙種植區(qū)氣候因子分析
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        橡膠產(chǎn)量與氣象因子的灰色關(guān)聯(lián)性及逐步回歸分析研究
        拱壩變形監(jiān)測預(yù)報的隨機(jī)森林模型及應(yīng)用
        基于隨機(jī)森林算法的飛機(jī)發(fā)動機(jī)故障診斷方法的研究
        呼吸道疾病與氣象因子的相關(guān)分析
        楊樹葉紋斑病與氣象因子的關(guān)系
        亚洲国产精品综合久久20 | 国产成人8x视频网站入口| 国产亚洲AV片a区二区| 国产三级一区二区三区在线观看| 久久蜜桃资源一区二区| 国产免费又色又爽粗视频| 日韩精品内射视频免费观看| 久久中文精品无码中文字幕| 国产精品成人无码久久久久久| 国产一区二区三区特区| 精品粉嫩av一区二区三区| 无码av不卡一区二区三区| 性一交一乱一伦一色一情孩交| 人妻AV无码一区二区三区奥田咲| 黄色三级视频中文字幕| 男人天堂亚洲一区二区| 国语自产视频在线| 又长又大又粗又硬3p免费视频| 热久久这里只有| 亚洲av乱码一区二区三区女同| 亚洲中字幕永久在线观看| 日本激情久久精品人妻热| 国内精品亚洲成av人片| 亚洲欧美色一区二区三区| 日韩毛片无码永久免费看| 欧美aaaaaa级午夜福利视频| 国产91吞精一区二区三区 | 最新中文字幕乱码在线| 亚洲综合一区二区三区天美传媒| 四虎永久在线精品免费网址| 免费看黄a级毛片| 国产午夜精品一区二区三区视频| 一区二区三区免费观看在线视频| 蜜桃成人精品一区二区三区| 国产精品亚洲三级一区二区三区| 久久综合亚洲色hezyo国产 | 老熟女重囗味hdxx70星空| 国产精品99久久国产小草| 一级a免费高清免在线| 日韩精品免费视频久久| 天天躁夜夜躁狠狠是什么心态|