亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)聯(lián)規(guī)則Apriori算法在玉米產(chǎn)量信息挖掘中的應(yīng)用

        2016-01-01 00:00:00王彥群高賢強(qiáng)
        湖北農(nóng)業(yè)科學(xué) 2016年3期

        摘要:應(yīng)用數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的Apriori算法對(duì)玉米產(chǎn)量信息進(jìn)行數(shù)據(jù)分析。利用最小支持度和最小置信度挖掘出頻繁項(xiàng)集,從而尋找其中存在的關(guān)系和規(guī)則。挖掘的信息為:玉米生育期內(nèi)降水量高,平均氣溫高,則產(chǎn)量高;反之,平均氣溫偏低,總降水量偏低,則產(chǎn)量低,十分可信。

        關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;玉米產(chǎn)量信息

        中圖分類號(hào):TP311;S513 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2016)03-0736-04

        DOI:10.14088/j.cnki.issn0439-8114.2016.03.047

        Abstract: The data analysis of corn yield information was analyzed through the application of Apriori algorithm of association rules in data mining. The minimum support and minimum confidence were used to dig frequent itemset mining, so as to find the existing relationships and rules. Mining information was as follows, during the growing period of the corn, if precipitation and average temperature were high, the corn yield would be high; conversely, the corn yield would be low, the results was very credible.

        Key words:data mining;association rules;Apriori algorithm;corn yield information

        隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,大量數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)隨之出現(xiàn),面對(duì)數(shù)據(jù)規(guī)模爆炸式的增長(zhǎng)趨勢(shì),傳統(tǒng)的小樣本專家驗(yàn)證式統(tǒng)計(jì)分析已不能適應(yīng)從大數(shù)據(jù)中發(fā)現(xiàn)知識(shí)為人類服務(wù)的要求。運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)農(nóng)業(yè)信息數(shù)據(jù)進(jìn)行挖掘,能有效地解決這個(gè)問(wèn)題。研究針對(duì)安徽省宿州市埇橋區(qū)農(nóng)業(yè)資源信息系統(tǒng),旨在分析降水量、積溫、氣溫變化、干濕特性、耕作土壤 pH、耕作土壤有機(jī)物含量、土壤養(yǎng)分含量等因素與玉米產(chǎn)量之間相關(guān)性的數(shù)據(jù)挖掘技術(shù),為該地區(qū)農(nóng)業(yè)生產(chǎn)提供決策依據(jù)。鑒于農(nóng)業(yè)資源信息的屬性均是數(shù)值型數(shù)據(jù),挖掘技術(shù)選用能有效處理數(shù)值型數(shù)據(jù)的關(guān)聯(lián)規(guī)則算法。

        關(guān)聯(lián)規(guī)則挖掘就是從大量的數(shù)據(jù)中挖掘出有價(jià)值的、描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識(shí)。關(guān)聯(lián)規(guī)則挖掘算法中最經(jīng)典的算法是Apriori算法,此算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),通過(guò)逐層搜索的迭代方法來(lái)查找頻繁項(xiàng)集。由于關(guān)聯(lián)規(guī)則形式簡(jiǎn)潔,易于解釋和理解并可以有效捕捉數(shù)據(jù)間的重要關(guān)系,因此從大型數(shù)據(jù)庫(kù)中挖掘關(guān)聯(lián)規(guī)則的問(wèn)題已經(jīng)成為近年來(lái)數(shù)據(jù)挖掘領(lǐng)域的一個(gè)熱點(diǎn)[1]。通過(guò)應(yīng)用數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的Apriori算法,對(duì)玉米產(chǎn)量信息進(jìn)行數(shù)據(jù)分析。利用最小支持度和最小置信度挖掘出頻繁項(xiàng)集,從而尋找其中存在的關(guān)系和規(guī)則,以用于指導(dǎo)今后的農(nóng)業(yè)生產(chǎn)和管理。

        1 Apriori算法

        Apriori算法使用逐層搜索的迭代方法: k-項(xiàng)集用于搜索(k+1)-項(xiàng)集。首先,找到頻繁1-項(xiàng)集的集合,記作L1,L1用于找到頻繁2-項(xiàng)集的集合L2,而L2用于找L3,如此類推,直到不能找到頻繁k-項(xiàng)集。關(guān)聯(lián)規(guī)則的基本概念和問(wèn)題描述如下:設(shè)I={i1,i2…in}是項(xiàng)的集合,事務(wù)T?奐I為數(shù)據(jù)項(xiàng)集I的一個(gè)子集,事務(wù)數(shù)據(jù)庫(kù)D={T1,T2…Tn}[2-4]。關(guān)聯(lián)規(guī)則是形如X?圯Y的蘊(yùn)含式,其中X?奐I,Y?奐I,且X∩Y為空集。

        規(guī)則X?圯Y在T中的支持度(support)是T中包含X∪Y的事務(wù)占事務(wù)總數(shù)的百分比,支持度表示X?圯Y在T中出現(xiàn)的普遍程度。大于給定支持度的模式稱為頻繁模式。

        規(guī)則X?圯Y在T中的置信度(confidence)是在T中包含X的事務(wù)中,Y也同時(shí)出現(xiàn)的概率,置信度表示規(guī)則的強(qiáng)度[5]。

        滿足最小支持度閾值(min_sup)和最小置信度閾值(min_conf)的關(guān)聯(lián)規(guī)則稱為強(qiáng)規(guī)則。這兩個(gè)閾值均在0%~100%之間,關(guān)聯(lián)規(guī)則挖掘的任務(wù)就是要挖掘出事務(wù)數(shù)據(jù)庫(kù)D中所有的強(qiáng)規(guī)則。

        Apriori算法具體描述如下:

        Input:事務(wù)數(shù)據(jù)庫(kù)D,最小支持度閾值min_sup;

        out: Result={事務(wù)數(shù)據(jù)庫(kù)中的頻繁項(xiàng)集及其支持度}

        Result:={ }; k:=1;

        C1:=所有的1-項(xiàng)集

        While(Ck不空)do

        Begin

        為每個(gè)Ck的項(xiàng)集生成一個(gè)計(jì)數(shù)器Compk[i]:=0;

        For(i=1;i≤|D|;i++)

        Begin if第i個(gè)記錄(TID=i)支持Ck中的第j個(gè)k-項(xiàng)集

        Then Compk[j]:=Compk[j]+1;

        End

        Lk:={Ck中滿足支持度大于min_sup的全體項(xiàng)集}

        Lk中頻繁項(xiàng)集的支持度保留;

        Result:= Result∪Lk;

        Ck+1:={所有的(k+1)-項(xiàng)集中滿足其子集都在Lk中的全體項(xiàng)集}

        K=k+1;

        End do

        2 利用Apriori算法挖掘關(guān)聯(lián)規(guī)則

        2.1 數(shù)據(jù)預(yù)處理

        關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。通過(guò)發(fā)現(xiàn)這個(gè)關(guān)聯(lián)的規(guī)則,可以更好地了解和掌握事物的發(fā)展動(dòng)向等[6],下面以挖掘玉米產(chǎn)量的信息為例。本研究數(shù)據(jù)來(lái)源于安徽省宿州市埇橋區(qū)6個(gè)鄉(xiāng)鎮(zhèn)的玉米生長(zhǎng)和產(chǎn)量數(shù)據(jù),主要研究氣候及降水量的變化對(duì)玉米生長(zhǎng)和產(chǎn)量的影響。其中,將鄉(xiāng)鎮(zhèn)平均產(chǎn)量(即鄉(xiāng)鎮(zhèn)總產(chǎn)量與總播種面積的比)作為衡量標(biāo)準(zhǔn),選取反映氣候和降水量變化的相關(guān)屬性構(gòu)建挖掘目標(biāo)數(shù)據(jù)庫(kù)[7]。

        玉米的生育期為6~8月,分別用T6、D6,T7、D7,T8、D8表示6、7、8月的平均氣溫和降水量,G表示地區(qū)的平均產(chǎn)量。玉米原始數(shù)據(jù)如表1所示。

        為了對(duì)數(shù)據(jù)進(jìn)行挖掘,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,相關(guān)約束和規(guī)定采用如下方式:

        將6月平均氣溫高于30 ℃的值設(shè)置為1,低于30 ℃的值設(shè)置為2;降水量大于200 mm的值設(shè)置為3,低于200 mm的值設(shè)置為4。將7月平均氣溫高于31 ℃的值設(shè)置為5,低于31 ℃的值設(shè)置為6;降水量大于200 mm的值設(shè)置為7,低于200 mm的值設(shè)置為8。將8月平均氣溫高于31 ℃的值設(shè)置為9,低于31 ℃的值設(shè)置為10;降水量大于200 mm的值設(shè)置為11,低于200 mm的值設(shè)置為12。將產(chǎn)量高于5 000 kg/hm2的值設(shè)置為13,低于5 000 kg/hm2的值設(shè)置為14,得到原數(shù)據(jù)表對(duì)應(yīng)的邏輯數(shù)據(jù)表(表2)。

        2.2 挖掘關(guān)聯(lián)規(guī)則

        將表2中的記錄作為Apriori關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù),設(shè)定最小支持度為50%,置信度為70%。

        在Eclipse軟件環(huán)境下,利用JAVA語(yǔ)言編寫實(shí)現(xiàn)Apriori算法的程序,運(yùn)行Apriori算法程序后,選擇項(xiàng)數(shù)最多的頻繁項(xiàng)集(即4項(xiàng)集),得到結(jié)果如圖1所示,試驗(yàn)結(jié)果數(shù)據(jù)整理后如表3所示。

        以下是JAVA語(yǔ)言實(shí)現(xiàn)Apriori算法的部分程序代碼:

        package item;

        import java.util.ArrayList;

        import java.util.Collections;

        import java.util.HashMap;

        import java.util.List;

        import java.util.Map;

        import java.util.Set;

        public class cc {

        private final static int SUPPORT = 3;//支持度閾值

        private final static double CONFIDENCE = 0.7;// 置信度閾值

        private final static String ITEM_SPLIT=\";\";//項(xiàng)之間的分隔符

        private final static String CON=\"->\";//項(xiàng)之間的分隔符

        privatefinalstaticList(); //定義所有記錄

        static{//初始化記錄

        transList.add(\"2;3;6;8;10;12;13;\");

        transList.add(\"1;4;5;7;9;12;14;\");

        transList.add(\"2;4;6;8;10;12;14;\");

        transList.add(\"2;3;6;7;10;11;13;\");

        transList.add(\"2;4;6;8;9;12;14;\");

        transList.add(\"1;4;5;7;9;11;13;\"); }

        public Map getFC(){

        Map frequentCollectionMap=new HashMap();//所有的頻繁集

        frequentCollectionMap.putAll(getItem1FC());

        Map itemkFcMap=new HashMap();

        itemkFcMap.putAll(getItem1FC());

        while(itemkFcMap!=1itemkFcMap.size()!=0){

        Map candidateCollection=getCandidateCollection(itemkFcMap);

        Set ccKeySet=candidateCollection.keySet();

        //對(duì)候選集項(xiàng)進(jìn)行累加計(jì)數(shù)

        for(String trans:transList){

        for(String candidate:ccKeySet){

        boolean flag=true;// 用來(lái)判斷記錄中是否出現(xiàn)該候選項(xiàng),如果出現(xiàn),計(jì)數(shù)加1

        String[]candidateItems=candidate.split(ITEM

        _SPLIT);

        for(String candidateItem:candidateItems)

        { if(trans.indexOf(candidateItem+ITEM_SPLIT)==-1)

        {flag=1; break;} }

        if(flag){

        Integer count=candidateCollection.get(candidate);

        candidateCollection.put(candidate, count+1); } }

        } //從候選集中找到符合支持度的頻繁集項(xiàng)

        itemkFcMap.clear();

        for(String candidate:ccKeySet){

        Integer count=candidateCollection.get(candidate);

        if(count>=SUPPORT){

        itemkFcMap.put(candidate, count); } } //合并所有頻繁集

        frequentCollectionMap.putAll(itemkFcMap); }

        return frequentCollectionMap;}

        private Map getCandidateCollection(Map itemkFcMap){

        Map candidateCollection=new HashMap();

        Set itemkSet1=itemkFcMap.keySet();

        Set itemkSet2=itemkFcMap.keySet();

        for(String itemk1:itemkSet1){

        for(String itemk2:itemkSet2){ //進(jìn)行連接

        String[] tmp1=itemk1.split(ITEM_SPLIT);

        String[] tmp2=itemk2.split(ITEM_SPLIT);

        Stringc=\"\";if(tmp1.length==1){

        if(tmp1[0].compareTo(tmp2[0])<0){

        c=tmp1[0]+ITEM_SPLIT+tmp2[0]+ITEM_SPLIT;}

        }else{ Boolean flag=true;

        for(int i=0;i

        if(!tmp1[i].equals(tmp2[i])){

        flag=1;

        break; } }

        運(yùn)行結(jié)果如下:

        并不是每個(gè)關(guān)聯(lián)規(guī)則都值得分析。選擇關(guān)聯(lián)規(guī)則中包含13或14并且有因果意義的項(xiàng)。例如,12;2;4;->14;1.00,說(shuō)明6月平均氣溫低于30 ℃,降水量低于200 mm,且8月降水量低于200 mm的地區(qū),其玉米產(chǎn)量低于5 000 kg/hm2,可信度為100%。14;->12;2;4;1.00,說(shuō)明玉米產(chǎn)量低于5 000 kg/hm2的地區(qū),其6月平均氣溫必低于30 ℃,降水量低于200 mm,且8月降水量低于200 mm,可信度為100%。

        經(jīng)過(guò)分析,可得出挖掘的信息為:玉米生育期內(nèi)降水量高,平均氣溫高,則產(chǎn)量高;反之,平均氣溫偏低,總降水量偏低,則產(chǎn)量低,十分可信。說(shuō)明在玉米生育期內(nèi)溫度和降水量是玉米產(chǎn)量的主要影響因素。氣溫增高和充沛的降水對(duì)玉米的產(chǎn)量提升提供了有利保障,這與本文研究結(jié)果一致。

        3 小結(jié)

        經(jīng)過(guò)研究關(guān)聯(lián)規(guī)則Apriori算法,將此算法應(yīng)用于玉米產(chǎn)量因素分析中。首先對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,然后使用Apriori算法挖掘降水量、平均氣溫與產(chǎn)量的關(guān)系,最終產(chǎn)生關(guān)聯(lián)規(guī)則。其他農(nóng)作物信息的挖掘可以采用與此相同的方法,關(guān)聯(lián)規(guī)則分析后得出的結(jié)論可用來(lái)指導(dǎo)今后的農(nóng)業(yè)生產(chǎn)與管理。

        Apriori算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),通過(guò)逐層搜索的迭代方法來(lái)查找頻繁項(xiàng)集,需要多次掃描事務(wù)數(shù)據(jù)庫(kù),運(yùn)算效率不高[8]。如何提高關(guān)聯(lián)規(guī)則算法執(zhí)行的效率,設(shè)計(jì)更有效、更實(shí)用的算法,是需要進(jìn)一步研究的課題。

        參考文獻(xiàn):

        [1] 譚 慶.關(guān)聯(lián)規(guī)則Apriori算法在試卷成績(jī)分析中的應(yīng)用研究[J].信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2009,22(2):300-302.

        [2] 張文靜,宋 雨,盧海霞.利用關(guān)聯(lián)規(guī)則建立專家系統(tǒng)的知識(shí)庫(kù)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,16(2):76-77.

        [3] HAN J W,KAMBER M.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2005.

        [4] 亓文娟,晏 杰.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則Apriori算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013,22(4):121-124.

        [5] 李 橋,陽(yáng)春華.關(guān)聯(lián)規(guī)則Apriori算法在教學(xué)評(píng)價(jià)中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2010(6):49-51,81.

        [6] 王 寧,王 波.基于Apriori算法關(guān)聯(lián)規(guī)則的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2011(10):70-72,75.

        [7] 張 超,魏三強(qiáng),朱 軍.一種農(nóng)業(yè)信息數(shù)據(jù)挖掘系統(tǒng)的研究與應(yīng)用[J].蘇州科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2013,30(1):75-80.

        [8] 張 圣.一種基于云計(jì)算的關(guān)聯(lián)規(guī)則Apriori算法[J].通信技術(shù),2011,44(6):141-143.

        久久精品成人免费观看97| 久久中文精品无码中文字幕下载| 麻豆成人久久精品一区| 精品国产免费一区二区久久| 一区二区三区极品少妇| 日本免费看片一区二区三区| av免费观看网站大全| 开心激情视频亚洲老熟女| 邻居美少妇张开腿让我爽了一夜| 国产亚洲精品97在线视频一| 精品无码一区二区三区的天堂| 人妻中文字幕乱人伦在线| 精品国产免费一区二区三区 | 人妻系列无码专区久久五月天| 日本老熟欧美老熟妇| 国产精品丝袜黑色高跟鞋| 99久久国内精品成人免费| 亚洲AV无码一区二区一二区色戒| 日本精品久久性大片日本| av成人资源在线播放| 亚洲乱熟妇一区二区三区蜜桃| 熟女人妻在线中文字幕| 亚洲人成网77777色在线播放| 久久亚洲日韩精品一区二区三区| 成人精品视频一区二区三区尤物| 欧美大肥婆大肥bbbbb| 久久亚洲精品无码va大香大香| 国内精品一区二区2021在线 | 国产乱人视频在线播放| 欧美疯狂性xxxxxbbbbb| 美女裸体无遮挡黄污网站| 农村国产毛片一区二区三区女| 亚洲综合新区一区二区| 国产中文色婷婷久久久精品| 伊人久久大香线蕉av波多野结衣| 中国老熟妇506070| 少妇人妻真实偷人精品视频| 亚洲AV无码精品色欲av| 亚洲国产成人资源在线桃色| 人成视频在线观看免费播放| 丝袜人妻中文字幕首页|