亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關(guān)聯(lián)規(guī)則算法的水體污染預(yù)警研究

        2014-10-20 06:04:54董文倩張麒彭佳紅
        電腦知識(shí)與技術(shù) 2014年25期
        關(guān)鍵詞:Apriori算法數(shù)據(jù)挖掘預(yù)警

        董文倩 張麒 彭佳紅

        摘要:關(guān)聯(lián)規(guī)則是一種重要的數(shù)據(jù)挖掘技術(shù),結(jié)合水體污染的特點(diǎn),應(yīng)用關(guān)聯(lián)挖掘中的Apriori算法,分析水體污染排放量和水體中重金屬含量之間的關(guān)系,同時(shí)分析工業(yè)、生活分別與水體重金屬含量之間的關(guān)系,對(duì)水體重金屬污染物有一定的預(yù)警作用。

        關(guān)鍵詞:數(shù)據(jù)挖掘;Apriori算法;水體污染;重金屬;預(yù)警

        中圖分類號(hào): TP301 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)25-5985-03

        1 概述

        隨著社會(huì)經(jīng)濟(jì)的迅猛發(fā)展和工業(yè)化程度的不斷提高,污染物的排放已使環(huán)境日趨惡化,直接或間接給生物的生存帶來威脅,并危及人類健康。重金屬污染與其他有機(jī)化合物的污染不同,具有富集性,很難在環(huán)境中降解。近年來,工礦業(yè)廢水、生活污水等未經(jīng)適當(dāng)處理即向外排放,污染土壤和廢棄物堆置場(chǎng)受流水作用,以及富含重金屬的大氣沉降物輸入, 城市生活污水、工業(yè)廢水和礦山開采、金屬冶煉等所產(chǎn)生的污染物通過不同方式進(jìn)入水中, 使水體中的重金屬含量急劇升高,如隨廢水排出的重金屬汞(Hg)、銅(Cu)、鉻(Cr),導(dǎo)致水體受到重金屬污染[1]。我國各大江河湖庫普遍受到不同程度的重金屬污染,其底質(zhì)的污染率高達(dá)80.11%[2],而且已經(jīng)開始影響到水體的質(zhì)量,嚴(yán)重影響著人類及其它生物的健康與生存。

        數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又潛在的有用信息和知識(shí)的過程。數(shù)據(jù)挖掘得到的信息和知識(shí)的表現(xiàn)形式為規(guī)則、概念和模式等,它可以幫助決策者分析歷史數(shù)據(jù)以及當(dāng)前數(shù)據(jù)的特征和規(guī)律,以便進(jìn)一步預(yù)測(cè)未來。[3]關(guān)聯(lián)挖掘作為數(shù)據(jù)挖掘的一個(gè)重要研究分支,其主要研究目的就是從大型數(shù)據(jù)集中發(fā)現(xiàn)隱藏的、有趣的、屬性間的規(guī)律,即關(guān)聯(lián)規(guī)則。[4]本文采用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則技術(shù)從現(xiàn)有的生活、工業(yè)兩方面的廢水排放量、化學(xué)需氧量排放量、氨氮排放量以及水體中汞、鎘、鉛的含量數(shù)據(jù)進(jìn)行處理,并用關(guān)聯(lián)規(guī)則中的Apriori算法獲取相應(yīng)的關(guān)聯(lián)規(guī)則,形成水體污染預(yù)警知識(shí),便于水體重金屬污染的預(yù)防和治理。

        2 材料與方法

        2.1 數(shù)據(jù)來源

        本文數(shù)據(jù)來源于2011年環(huán)境統(tǒng)計(jì)年報(bào)[5]。選取六個(gè)對(duì)于水體重金屬污染有一定作用的影響因子:工業(yè)廢水排放量、生活廢水排放量、工業(yè)化學(xué)需氧量排放量、生活化學(xué)需氧量排放量、工業(yè)氨氮排放量、生活氨氮排放量,并選取了汞、鎘、鉛三種最具重金屬代表性的元素作為分析因子,具體數(shù)據(jù)如表1所示。

        2.2 關(guān)聯(lián)規(guī)則及Apriori算法描述

        1994年由R.Agrawal等人提出來的Apriori算法是關(guān)聯(lián)規(guī)則挖掘的一個(gè)經(jīng)典算法[6],關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。關(guān)聯(lián)規(guī)則側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的聯(lián)系,找出滿足給定支持度和置信度閾值的多個(gè)域之間的依賴關(guān)系[7]。關(guān)聯(lián)規(guī)則能夠從大量數(shù)據(jù)的項(xiàng)集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關(guān)聯(lián)和相關(guān)性。為了在數(shù)據(jù)挖掘任務(wù)中得到有用的和可靠的規(guī)則,需要通過支持度和置信度兩個(gè)閾值來保證。關(guān)聯(lián)規(guī)則 X=>Y 在 D 中的支持度是 D 中事務(wù)包含 XUY 的百分比,即概率 P(XUY),它是對(duì)關(guān)聯(lián)規(guī)則重要度的衡量,表示關(guān)聯(lián)規(guī)則的頻度。關(guān)聯(lián)規(guī)則X=>Y 在 D 中的置信度是包含 X 的事務(wù)中同時(shí)包含 Y的百分比,即條件概率 P(X=>Y),它是對(duì)關(guān)聯(lián)規(guī)則準(zhǔn)確度的衡量,表示關(guān)聯(lián)規(guī)則的強(qiáng)度[8]。Apriori算法的核心思想是把發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的工作分為兩步:第一步通過迭代檢索出事務(wù)數(shù)據(jù)庫中的所有頻繁項(xiàng)集,即頻繁項(xiàng)集的支持度不低于用戶設(shè)定的閾值;第二步從頻繁項(xiàng)集中構(gòu)造出滿足用戶最低信任度的規(guī)則[9]。對(duì)于滿足最小支持度和最小置信度要求的關(guān)聯(lián)規(guī)則稱為強(qiáng)規(guī)則[10]。

        2.3 數(shù)據(jù)處理

        利用Weka軟件,采用關(guān)聯(lián)規(guī)則中的Apriori算法,對(duì)表1的數(shù)據(jù)進(jìn)行處理,得到的關(guān)聯(lián)規(guī)則如所示:

        Apriori

        Minimum support: 0.25 (2 instances)

        Minimum metric: 0.9

        Number of cycles performed: 15

        Generated sets of large itemsets:

        Size of set of large itemsets L(1): 24

        Size of set of large itemsets L(2): 28

        Size of set of large itemsets L(3): 24

        Size of set of large itemsets L(4): 16

        Size of set of large itemsets L(5): 6

        Size of set of large itemsets L(6): 1

        Best rules found:

        1. Ammonia emissions from industrial='(-inf-29.82]' 3 ==> Mercury='(-inf-1.505]' 3 conf:(1)

        2. COD emissions of industrial='(-inf-452.07]' 2 ==> Lead='(482.96-525.73]' 2 conf:(1)

        3. Lead='(482.96-525.73]' 2 ==> COD emissions of industrial='(-inf-452.07]' 2 conf:(1)

        4.Industrial wastewater emissions='(233.43-237.82]' 2 ==> Ammonia emissions from industrial='(-inf-29.82]' 2 conf:(1)

        5. Industrial wastewater emissions='(233.43-237.82]' 2 ==> Mercury='(-inf-1.505]' 2 conf:(1)

        6. Cadmium='(-inf-38.14]' 2 ==> Industrial wastewater emissions='(233.43-237.82]' 2 conf:(1)

        7. Industrial wastewater emissions='(233.43-237.82]' 2 ==> Cadmium='(-inf-38.14]' 2 conf:(1)

        8. Lead='(-inf-183.57]' 2 ==> Industrial wastewater emissions='(233.43-237.82]' 2 conf:(1)

        9. Industrial wastewater emissions='(233.43-237.82]' 2 ==> Lead='(-inf-183.57]' 2 conf:(1)

        10. Wastewater discharge life='(-inf-245.25]' 2 ==> Ammonia emissions from industrial='(39.9-42.42]' 2 conf:(1)

        11. Cadmium='(102.46-inf)' 2 ==> Wastewater discharge life='(-inf-245.25]' 2 conf:(1)

        12. Wastewater discharge life='(-inf-245.25]' 2 ==> Cadmium='(102.46-inf)' 2 conf:(1)

        13. Lead='(482.96-525.73]' 2 ==> Wastewater discharge life='(-inf-245.25]' 2 conf:(1)

        14. Wastewater discharge life='(-inf-245.25]' 2 ==> Lead='(482.96-525.73]' 2 conf:(1)

        15. COD emissions of industrial='(-inf-452.07]' 2 ==> Mercury='(-inf-1.505]' 2 conf:(1)

        相應(yīng)的規(guī)則解釋如下:

        規(guī)則1:工業(yè)氨氮排放量<29.82萬噸時(shí),則汞排放量<1.505噸,置信度為100%;

        規(guī)則2.3:工業(yè)化學(xué)需氧量排放量<452.07萬噸時(shí),則鉛排放量<183.57噸,置信度為100%;

        規(guī)則4:工業(yè)廢水排放量為233.43-237.82億噸時(shí),則工業(yè)氨氮排放量<29.82萬噸,置信度為100%;

        規(guī)則5:工業(yè)廢水排放量為233.43-237.82億噸時(shí),則汞排放量<1.505噸 ,置信度為100%;

        規(guī)則6.7:工業(yè)廢水排放量為233.43-237.82億噸時(shí),則鎘排放量<38.14噸, 置信度為100%;

        規(guī)則8.9:工業(yè)廢水排放量為233.43-237.82億噸時(shí),則鉛排放量<183.57噸, 置信度為100%;

        規(guī)則10: 生活廢水排放量<245.25億噸,則工業(yè)氨氮排放量為39.9-42.42萬噸 置信度為100%;

        規(guī)則11.12:生活廢水排放量>245.25億噸時(shí), 則鎘排放量>102.46噸 置信度為100%;

        規(guī)則13.14:生活廢水排放量<245.25億噸時(shí),則鉛排放量為482.96-525.73噸 置信度為100%;

        規(guī)則15:工業(yè)化學(xué)需氧量排放量<452.07萬噸時(shí),則汞排放量<1.505噸 置信度為100%;

        3 結(jié)果分析

        由關(guān)聯(lián)規(guī)則Apriori算法得出的15條規(guī)則結(jié)果分析,可以得到如下結(jié)論:

        1) 重金屬與氨氮排放量關(guān)系。當(dāng)工業(yè)氨氮排放量<29.82萬噸時(shí),則汞排放量<1.505噸,說明工業(yè)氨氮排放量較低時(shí),重金屬元素汞的排放量低;

        2) 重金屬與廢水排放量關(guān)系。當(dāng)工業(yè)廢水排放量為233.43-237.82億噸時(shí),則汞排放量<1.505噸,鎘排放量<38.14噸,鉛排放量<183.57噸,說明工業(yè)廢水排放量較低時(shí),重金屬汞、鎘、鉛的排放量較少;當(dāng)生活廢水排放量>245.25億噸時(shí), 則鎘排放量>102.46噸,說明生活廢水排放量比較高時(shí),重金屬鎘的含量比較高。生活廢水排放量<245.25億噸時(shí),則鉛排放量為482.96-525.73噸,說明當(dāng)生活廢水排放量比較高時(shí),重金屬鉛的含量比較高。

        3) 重金屬與化學(xué)需氧量排放量關(guān)系。工業(yè)化學(xué)需氧量排放量<452.07萬噸時(shí),則汞排放量<1.505噸,說明當(dāng)工業(yè)化學(xué)需氧量排放量比較少時(shí),重金屬汞的含量比較低。工業(yè)化學(xué)需氧量排放量<452.07萬噸時(shí),則鉛排放量<183.57噸,說明化學(xué)需氧量排放量較少時(shí),鉛的排放量較少。

        4 結(jié)論

        水體中金屬污染具有富集性、不可降解性等特點(diǎn),已經(jīng)對(duì)我國各大江河湖庫造成了嚴(yán)重污染,影響人類和其他生物的健康和生存,因此,提高對(duì)水體中重金屬污染的成因認(rèn)識(shí),了解水體污染物排放對(duì)幾大重金屬的影響,加強(qiáng)對(duì)水體重金屬污染排放的控制,顯得尤為重要。采用數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則Apriori算法,對(duì)近十年來的全國污染物和重金屬排放量數(shù)據(jù)利用weka進(jìn)行離散化處理后,獲取相關(guān)的關(guān)聯(lián)規(guī)則知識(shí),分析了工業(yè)、生活兩方面的廢水排放量、氨氮排放量、化學(xué)需氧量與水體重金屬汞、鎘、鉛含量之間的關(guān)系 ,從而對(duì)水體重金屬污染進(jìn)行預(yù)警,對(duì)水體重金屬污染的預(yù)防和治理的決策上起到了一定的指導(dǎo)作用,幫助控制環(huán)境污染。

        參考文獻(xiàn):

        [1] 邱小香,朱海燕.水體重金屬的污染及其處理方法[J].湖南農(nóng)業(yè)科學(xué),2010(14):34-35.

        [2] 周啟艷,李國蔥,唐植成.我國水體重金屬污染現(xiàn)狀與治理方法研究[J].輕工科技,2013(4):98-99.

        [3] 李梅,張陽,蔡曉妍.關(guān)聯(lián)規(guī)則挖掘在學(xué)生成績分析中的應(yīng)用[J].中國電力教育,2014(20):94-95.

        [4] 司曉梅.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的研究及應(yīng)用[D].武漢:武漢理工大學(xué),2007.

        [5] 羅毅.中國環(huán)境統(tǒng)計(jì)年報(bào)2011[N].中國環(huán)境科學(xué)出版社,2012-12-1(1)

        [6] 秦亮曦,史忠植.關(guān)聯(lián)規(guī)則研究綜述[J].廣西大學(xué)學(xué)報(bào):自然科學(xué)版,2005,30(4):310-317.

        [7] 吳昊.基于關(guān)聯(lián)規(guī)則的道路交通事故數(shù)據(jù)挖掘的研究[D].長春:吉林大學(xué),2005.

        [8] 何兵.關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法的相關(guān)研究[D].成都:西南交通大學(xué),2001.

        [9] 羅鳳娥.基于Web的農(nóng)業(yè)數(shù)據(jù)挖掘平臺(tái)技術(shù)研究[D].長沙:湖南農(nóng)業(yè)大學(xué),2010.

        猜你喜歡
        Apriori算法數(shù)據(jù)挖掘預(yù)警
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        法國發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
        園林有害生物預(yù)警與可持續(xù)控制
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于Hadoop平臺(tái)的并行DHP數(shù)據(jù)分析方法
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于云平臺(tái)MapReduce的Apriori算法研究
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
        機(jī)載預(yù)警雷達(dá)對(duì)IFF 的干擾分析
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        一区二区三区字幕中文| 韩日无码不卡| 天堂a版一区二区av| 户外精品一区二区三区| 免费网站看av片| 国产成人无码aⅴ片在线观看| 国产精品nv在线观看| 日本在线观看一二三区| 亚洲av无一区二区三区久久| 装睡被陌生人摸出水好爽| 欧美破处在线观看| 国产在线精品观看一区二区三区| 国模精品一区二区三区| 无码h黄动漫在线播放网站| 亚洲AV秘 无套一区二区三区| 久久久精品国产亚洲av网麻豆| 亚洲va欧美va日韩va成人网 | 超碰国产精品久久国产精品99| ā片在线观看免费观看| 免费毛片性天堂| 国产av一区麻豆精品久久| 国产区女主播在线观看| 国产av电影区二区三区曰曰骚网| 久久久午夜毛片免费| 91乱码亚洲精品中文字幕| 无码一区二区三区中文字幕| 亚洲色偷偷色噜噜狠狠99| 宅男久久精品国产亚洲av麻豆| 国产偷国产偷亚洲综合av| 国产肥熟女视频一区二区三区| 色综合另类小说图片区| 久久精品久久精品中文字幕| 久久久久亚洲av无码专区首| 精品国产三级在线观看| 亚洲综合久久一本久道| 97超碰国产成人在线| 国产一极内射視颍一| 亚洲视频高清| 日本一区二区三区清视频| 久久精品国产亚洲av影院| 亚洲专区欧美|