亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘回歸樹算法預(yù)測河流海藻富氧化的分析與比較

        2015-06-27 01:23:10段俊陽佘春華
        城市地理 2015年12期
        關(guān)鍵詞:藻類海藻數(shù)據(jù)挖掘

        段俊陽 佘春華

        (銅仁學(xué)院,貴州 銅仁 554300)

        一、引言

        某些高濃度的有害藻類嚴(yán)重破壞著河流的生態(tài)環(huán)境,因此,能夠監(jiān)測并及早對(duì)海藻的繁殖進(jìn)行預(yù)測對(duì)提高河流的質(zhì)量是很有必要的。在約一年時(shí)間內(nèi),在不同的時(shí)間收集了多條不同河流的水樣。每個(gè)水樣測定了它們不同的化學(xué)性質(zhì)和7種有害藻類的存在頻率。還記錄了如收集的季節(jié)、河流大小和水流速度。

        案例研究動(dòng)機(jī):化學(xué)監(jiān)測相對(duì)人工檢測價(jià)格便宜,且易于自動(dòng)化更好地了解藻類的頻率和水樣的某些化學(xué)性質(zhì)以及其他特性 (如季節(jié)、河流類型等)是如何相關(guān)的。

        二、R軟件

        R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲(chǔ)和處理系統(tǒng);數(shù)組運(yùn)算工具 (其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大)[2];完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡便而強(qiáng)大的編程語言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。R在語義上是函數(shù)設(shè)計(jì)語言。它允許在“語言上計(jì)算”。這使得它可以把表達(dá)式作為函數(shù)的輸入?yún)?shù),而這種做法對(duì)統(tǒng)計(jì)模擬和繪圖非常有用。R是一個(gè)免費(fèi)的自由軟件。本案例使用的是R的3.0版。

        三、回歸樹模型

        我們考慮使用回歸樹預(yù)測。建立回歸樹:

        library(rpart)

        data(algae)

        algae< -algae[-manyNAs(algae),]

        rt.a1< -rpart(a1~.,data=algae [,1:12])

        我們第一步讀入數(shù)據(jù):說明我們的數(shù)據(jù)集中首行并不是變量的名稱,col.names是給這些變量一個(gè)名稱,na.strings=c("XXXXXXX")是說數(shù)據(jù)中缺失的變量是用XXXXXXX表示的。

        數(shù)據(jù)集中的season表示采集樣本所在的季節(jié),size表示河流的規(guī)模,speed是流速,mxPH之類的是河流的一些化學(xué)屬性,后面的a1,a2,……,a7是我們需要預(yù)測的一些變量。是對(duì)于水藻生長集中程度的一種度量。algae[1:5,]##這個(gè)表示顯示數(shù)據(jù)集的前五行,結(jié)果如下圖1:

        函數(shù)的形式是用數(shù)據(jù)中其他所有變量來預(yù)測a1,data是用來設(shè)定建模所用的數(shù)據(jù)集。

        回歸樹 rt.a1 的圖形表示的兩種方法:[1]plot(rt.a1),text(rt.a1)或 prettyTree(rt.a1)

        建立回歸樹通常分兩步。最初,生成一棵較大的樹,然后通過統(tǒng)計(jì)估計(jì)刪除底部的一些結(jié)點(diǎn)來對(duì)樹進(jìn)行修剪。這樣是為了防止過度擬合。[4]用已有的訓(xùn)練數(shù)據(jù)獲得模型的性能指標(biāo)是不可靠的,因?yàn)檫@些計(jì)算是有偏的。實(shí)際上,有的模型可以很容易獲得訓(xùn)練數(shù)據(jù)的零誤差預(yù)測。然而,這一優(yōu)秀性能很難推廣到目標(biāo)變量值未知的新樣本上。這種現(xiàn)象我們通常稱為過度擬合訓(xùn)練數(shù)據(jù)。我們需要一個(gè)模型,使它在未知數(shù)據(jù)上有可靠的預(yù)測性能。

        1、查看比較結(jié)果的摘要:summary(res),首先我們得到這個(gè)數(shù)據(jù)集的一個(gè)描述性統(tǒng)計(jì):我們用的函數(shù)是summary截圖是從R的工作臺(tái)中直接復(fù)制過來的,給出了所有變量的基本的描述統(tǒng)計(jì)量,對(duì)于控制變量 (季節(jié)之類的),給出的是頻數(shù)統(tǒng)計(jì),對(duì)于數(shù)值變量,給出的是最小值,均值,中位數(shù),最大值,25%分位數(shù),75%分位數(shù)這些最常用的統(tǒng)計(jì)量。

        2、可通過以下代碼查看模型所對(duì)應(yīng)的參數(shù):得到一棵完整的回歸樹如下圖生成回歸樹:

        四、模型的應(yīng)用過程分析

        1、函數(shù)來證實(shí)組合方法的優(yōu)勢

        bestScores(res.all)

        對(duì)于某些問題,隨機(jī)森林給出很好的結(jié)果。但像海藻7,結(jié)果還不能令人滿意。

        2、為每種藻類選擇最優(yōu)的預(yù)測模型。funcs保存最優(yōu)模型的函數(shù)名;函數(shù)strsplit()提取模型名稱;parSetts接受每個(gè)最優(yōu)模型的參數(shù);getVariant()返回模型類對(duì)象;"@"操作符用來訪問對(duì)象的屬性;最后,調(diào)用do.call()得到相應(yīng)的7個(gè)最優(yōu)模型,并賦給bestModels。

        3、填補(bǔ)測試集中的缺失值。遵守預(yù)測模型的黃金法則“不要應(yīng)用測試集中的任何信息來建立預(yù)測模型”,[4]應(yīng)該使用訓(xùn)練集數(shù)據(jù)的關(guān)系來填補(bǔ)測試集中的缺失值。

        4、獲取預(yù)測值矩陣

        5、預(yù)測值與真實(shí)值的比

        五、總結(jié)

        這里以目標(biāo)變量的均值作為基準(zhǔn)模型的預(yù)測值,然后通過計(jì)算NMSE值評(píng)估預(yù)測結(jié)果的質(zhì)量。最終得到的結(jié)果與前面交叉驗(yàn)證的估計(jì)結(jié)果相一致。它再次確認(rèn)很難得到海藻7的較好的預(yù)測,而其他海藻的估計(jì)結(jié)果相對(duì)較好,海藻1的估計(jì)結(jié)果為最佳。

        [1]朱迪茨.實(shí)用教據(jù)挖掘 [M].北京:電子工業(yè)出版社,2004.

        [2]魏萍萍,王翠茹,王保義,張振興.數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)工程,2003(7).

        [3](英)漢德 (Hand,D.)著.數(shù)據(jù)挖掘原理 [M].張銀奎,等譯.北京:機(jī)械工業(yè)出版社,2003.

        [4]于承敏.數(shù)據(jù)挖掘技術(shù)運(yùn)用ff-4t育領(lǐng)域之探討[J].聊城大學(xué)學(xué)報(bào),2005(6).

        猜你喜歡
        藻類海藻數(shù)據(jù)挖掘
        海藻保鮮膜:來自海洋的天然“塑料”
        軍事文摘(2023年18期)2023-10-31 08:10:50
        海藻球
        藻類水華控制技術(shù)及應(yīng)用
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        細(xì)菌和藻類先移民火星
        軍事文摘(2020年20期)2020-11-16 00:31:40
        海藻與巖石之間
        吃蔬菜有個(gè)“321模式” 三兩葉菜類,二兩其他類,一兩菌藻類
        歐盟:海藻酸、海藻酸鹽作為食品添加劑無安全風(fēng)險(xiǎn)
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        浮游藻類在水體PAHs富集與降解中的研究
        亚洲精品国偷拍自产在线| 日韩一二三四区在线观看| 麻豆av毛片在线观看| 91最新免费观看在线| 亚洲欧洲国无码| 一级做a爱视频在线播放| 中文字幕亚洲视频三区| 国产乱淫h侵犯在线观看| 国产日产韩国av在线| 成年美女黄的视频网站| 伊人色综合视频一区二区三区| 免费无码肉片在线观看| 亚洲国产A∨无码影院| 中文字幕高清无码不卡在线| 高清亚洲成av人片乱码色午夜| 亚洲av天堂一区二区| 国产流白浆视频在线观看| 特黄 做受又硬又粗又大视频 | 国产精品午夜福利天堂| av天堂免费在线播放| 又硬又粗进去好爽免费| 亚洲加勒比久久88色综合| 野花社区视频www官网| 精品免费福利视频| 国产丝袜精品丝袜一区二区| 蜜桃视频网站在线免费观看| 男女做那个视频网站国产| 男人边做边吃奶头视频| 国产美女久久精品香蕉69| 欧美一欧美一区二三区性| 久久丁香花综合狼人| 一本色道久久亚洲精品| 人妻丰满熟妇av无码区| 欧美mv日韩mv国产网站| 美女在线国产| 国产精品又黄又爽又色| 偷拍一区二区盗摄视频| 又大又粗又爽18禁免费看| 性饥渴艳妇性色生活片在线播放| 久久亚洲AV无码精品色午夜| 日韩精品人妻一区二区三区蜜桃臀|