亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)聯(lián)規(guī)則Apriori算法在玉米產(chǎn)量信息挖掘中的應(yīng)用

        2016-01-01 00:00:00王彥群高賢強(qiáng)
        湖北農(nóng)業(yè)科學(xué) 2016年3期

        摘要:應(yīng)用數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的Apriori算法對(duì)玉米產(chǎn)量信息進(jìn)行數(shù)據(jù)分析。利用最小支持度和最小置信度挖掘出頻繁項(xiàng)集,從而尋找其中存在的關(guān)系和規(guī)則。挖掘的信息為:玉米生育期內(nèi)降水量高,平均氣溫高,則產(chǎn)量高;反之,平均氣溫偏低,總降水量偏低,則產(chǎn)量低,十分可信。

        關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;玉米產(chǎn)量信息

        中圖分類號(hào):TP311;S513 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2016)03-0736-04

        DOI:10.14088/j.cnki.issn0439-8114.2016.03.047

        Abstract: The data analysis of corn yield information was analyzed through the application of Apriori algorithm of association rules in data mining. The minimum support and minimum confidence were used to dig frequent itemset mining, so as to find the existing relationships and rules. Mining information was as follows, during the growing period of the corn, if precipitation and average temperature were high, the corn yield would be high; conversely, the corn yield would be low, the results was very credible.

        Key words:data mining;association rules;Apriori algorithm;corn yield information

        隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,大量數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)隨之出現(xiàn),面對(duì)數(shù)據(jù)規(guī)模爆炸式的增長(zhǎng)趨勢(shì),傳統(tǒng)的小樣本專家驗(yàn)證式統(tǒng)計(jì)分析已不能適應(yīng)從大數(shù)據(jù)中發(fā)現(xiàn)知識(shí)為人類服務(wù)的要求。運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)農(nóng)業(yè)信息數(shù)據(jù)進(jìn)行挖掘,能有效地解決這個(gè)問(wèn)題。研究針對(duì)安徽省宿州市埇橋區(qū)農(nóng)業(yè)資源信息系統(tǒng),旨在分析降水量、積溫、氣溫變化、干濕特性、耕作土壤 pH、耕作土壤有機(jī)物含量、土壤養(yǎng)分含量等因素與玉米產(chǎn)量之間相關(guān)性的數(shù)據(jù)挖掘技術(shù),為該地區(qū)農(nóng)業(yè)生產(chǎn)提供決策依據(jù)。鑒于農(nóng)業(yè)資源信息的屬性均是數(shù)值型數(shù)據(jù),挖掘技術(shù)選用能有效處理數(shù)值型數(shù)據(jù)的關(guān)聯(lián)規(guī)則算法。

        關(guān)聯(lián)規(guī)則挖掘就是從大量的數(shù)據(jù)中挖掘出有價(jià)值的、描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識(shí)。關(guān)聯(lián)規(guī)則挖掘算法中最經(jīng)典的算法是Apriori算法,此算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),通過(guò)逐層搜索的迭代方法來(lái)查找頻繁項(xiàng)集。由于關(guān)聯(lián)規(guī)則形式簡(jiǎn)潔,易于解釋和理解并可以有效捕捉數(shù)據(jù)間的重要關(guān)系,因此從大型數(shù)據(jù)庫(kù)中挖掘關(guān)聯(lián)規(guī)則的問(wèn)題已經(jīng)成為近年來(lái)數(shù)據(jù)挖掘領(lǐng)域的一個(gè)熱點(diǎn)[1]。通過(guò)應(yīng)用數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的Apriori算法,對(duì)玉米產(chǎn)量信息進(jìn)行數(shù)據(jù)分析。利用最小支持度和最小置信度挖掘出頻繁項(xiàng)集,從而尋找其中存在的關(guān)系和規(guī)則,以用于指導(dǎo)今后的農(nóng)業(yè)生產(chǎn)和管理。

        1 Apriori算法

        Apriori算法使用逐層搜索的迭代方法: k-項(xiàng)集用于搜索(k+1)-項(xiàng)集。首先,找到頻繁1-項(xiàng)集的集合,記作L1,L1用于找到頻繁2-項(xiàng)集的集合L2,而L2用于找L3,如此類推,直到不能找到頻繁k-項(xiàng)集。關(guān)聯(lián)規(guī)則的基本概念和問(wèn)題描述如下:設(shè)I={i1,i2…in}是項(xiàng)的集合,事務(wù)T?奐I為數(shù)據(jù)項(xiàng)集I的一個(gè)子集,事務(wù)數(shù)據(jù)庫(kù)D={T1,T2…Tn}[2-4]。關(guān)聯(lián)規(guī)則是形如X?圯Y的蘊(yùn)含式,其中X?奐I,Y?奐I,且X∩Y為空集。

        規(guī)則X?圯Y在T中的支持度(support)是T中包含X∪Y的事務(wù)占事務(wù)總數(shù)的百分比,支持度表示X?圯Y在T中出現(xiàn)的普遍程度。大于給定支持度的模式稱為頻繁模式。

        規(guī)則X?圯Y在T中的置信度(confidence)是在T中包含X的事務(wù)中,Y也同時(shí)出現(xiàn)的概率,置信度表示規(guī)則的強(qiáng)度[5]。

        滿足最小支持度閾值(min_sup)和最小置信度閾值(min_conf)的關(guān)聯(lián)規(guī)則稱為強(qiáng)規(guī)則。這兩個(gè)閾值均在0%~100%之間,關(guān)聯(lián)規(guī)則挖掘的任務(wù)就是要挖掘出事務(wù)數(shù)據(jù)庫(kù)D中所有的強(qiáng)規(guī)則。

        Apriori算法具體描述如下:

        Input:事務(wù)數(shù)據(jù)庫(kù)D,最小支持度閾值min_sup;

        out: Result={事務(wù)數(shù)據(jù)庫(kù)中的頻繁項(xiàng)集及其支持度}

        Result:={ }; k:=1;

        C1:=所有的1-項(xiàng)集

        While(Ck不空)do

        Begin

        為每個(gè)Ck的項(xiàng)集生成一個(gè)計(jì)數(shù)器Compk[i]:=0;

        For(i=1;i≤|D|;i++)

        Begin if第i個(gè)記錄(TID=i)支持Ck中的第j個(gè)k-項(xiàng)集

        Then Compk[j]:=Compk[j]+1;

        End

        Lk:={Ck中滿足支持度大于min_sup的全體項(xiàng)集}

        Lk中頻繁項(xiàng)集的支持度保留;

        Result:= Result∪Lk;

        Ck+1:={所有的(k+1)-項(xiàng)集中滿足其子集都在Lk中的全體項(xiàng)集}

        K=k+1;

        End do

        2 利用Apriori算法挖掘關(guān)聯(lián)規(guī)則

        2.1 數(shù)據(jù)預(yù)處理

        關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。通過(guò)發(fā)現(xiàn)這個(gè)關(guān)聯(lián)的規(guī)則,可以更好地了解和掌握事物的發(fā)展動(dòng)向等[6],下面以挖掘玉米產(chǎn)量的信息為例。本研究數(shù)據(jù)來(lái)源于安徽省宿州市埇橋區(qū)6個(gè)鄉(xiāng)鎮(zhèn)的玉米生長(zhǎng)和產(chǎn)量數(shù)據(jù),主要研究氣候及降水量的變化對(duì)玉米生長(zhǎng)和產(chǎn)量的影響。其中,將鄉(xiāng)鎮(zhèn)平均產(chǎn)量(即鄉(xiāng)鎮(zhèn)總產(chǎn)量與總播種面積的比)作為衡量標(biāo)準(zhǔn),選取反映氣候和降水量變化的相關(guān)屬性構(gòu)建挖掘目標(biāo)數(shù)據(jù)庫(kù)[7]。

        玉米的生育期為6~8月,分別用T6、D6,T7、D7,T8、D8表示6、7、8月的平均氣溫和降水量,G表示地區(qū)的平均產(chǎn)量。玉米原始數(shù)據(jù)如表1所示。

        為了對(duì)數(shù)據(jù)進(jìn)行挖掘,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,相關(guān)約束和規(guī)定采用如下方式:

        將6月平均氣溫高于30 ℃的值設(shè)置為1,低于30 ℃的值設(shè)置為2;降水量大于200 mm的值設(shè)置為3,低于200 mm的值設(shè)置為4。將7月平均氣溫高于31 ℃的值設(shè)置為5,低于31 ℃的值設(shè)置為6;降水量大于200 mm的值設(shè)置為7,低于200 mm的值設(shè)置為8。將8月平均氣溫高于31 ℃的值設(shè)置為9,低于31 ℃的值設(shè)置為10;降水量大于200 mm的值設(shè)置為11,低于200 mm的值設(shè)置為12。將產(chǎn)量高于5 000 kg/hm2的值設(shè)置為13,低于5 000 kg/hm2的值設(shè)置為14,得到原數(shù)據(jù)表對(duì)應(yīng)的邏輯數(shù)據(jù)表(表2)。

        2.2 挖掘關(guān)聯(lián)規(guī)則

        將表2中的記錄作為Apriori關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù),設(shè)定最小支持度為50%,置信度為70%。

        在Eclipse軟件環(huán)境下,利用JAVA語(yǔ)言編寫實(shí)現(xiàn)Apriori算法的程序,運(yùn)行Apriori算法程序后,選擇項(xiàng)數(shù)最多的頻繁項(xiàng)集(即4項(xiàng)集),得到結(jié)果如圖1所示,試驗(yàn)結(jié)果數(shù)據(jù)整理后如表3所示。

        以下是JAVA語(yǔ)言實(shí)現(xiàn)Apriori算法的部分程序代碼:

        package item;

        import java.util.ArrayList;

        import java.util.Collections;

        import java.util.HashMap;

        import java.util.List;

        import java.util.Map;

        import java.util.Set;

        public class cc {

        private final static int SUPPORT = 3;//支持度閾值

        private final static double CONFIDENCE = 0.7;// 置信度閾值

        private final static String ITEM_SPLIT=\";\";//項(xiàng)之間的分隔符

        private final static String CON=\"->\";//項(xiàng)之間的分隔符

        privatefinalstaticList(); //定義所有記錄

        static{//初始化記錄

        transList.add(\"2;3;6;8;10;12;13;\");

        transList.add(\"1;4;5;7;9;12;14;\");

        transList.add(\"2;4;6;8;10;12;14;\");

        transList.add(\"2;3;6;7;10;11;13;\");

        transList.add(\"2;4;6;8;9;12;14;\");

        transList.add(\"1;4;5;7;9;11;13;\"); }

        public Map getFC(){

        Map frequentCollectionMap=new HashMap();//所有的頻繁集

        frequentCollectionMap.putAll(getItem1FC());

        Map itemkFcMap=new HashMap();

        itemkFcMap.putAll(getItem1FC());

        while(itemkFcMap!=1itemkFcMap.size()!=0){

        Map candidateCollection=getCandidateCollection(itemkFcMap);

        Set ccKeySet=candidateCollection.keySet();

        //對(duì)候選集項(xiàng)進(jìn)行累加計(jì)數(shù)

        for(String trans:transList){

        for(String candidate:ccKeySet){

        boolean flag=true;// 用來(lái)判斷記錄中是否出現(xiàn)該候選項(xiàng),如果出現(xiàn),計(jì)數(shù)加1

        String[]candidateItems=candidate.split(ITEM

        _SPLIT);

        for(String candidateItem:candidateItems)

        { if(trans.indexOf(candidateItem+ITEM_SPLIT)==-1)

        {flag=1; break;} }

        if(flag){

        Integer count=candidateCollection.get(candidate);

        candidateCollection.put(candidate, count+1); } }

        } //從候選集中找到符合支持度的頻繁集項(xiàng)

        itemkFcMap.clear();

        for(String candidate:ccKeySet){

        Integer count=candidateCollection.get(candidate);

        if(count>=SUPPORT){

        itemkFcMap.put(candidate, count); } } //合并所有頻繁集

        frequentCollectionMap.putAll(itemkFcMap); }

        return frequentCollectionMap;}

        private Map getCandidateCollection(Map itemkFcMap){

        Map candidateCollection=new HashMap();

        Set itemkSet1=itemkFcMap.keySet();

        Set itemkSet2=itemkFcMap.keySet();

        for(String itemk1:itemkSet1){

        for(String itemk2:itemkSet2){ //進(jìn)行連接

        String[] tmp1=itemk1.split(ITEM_SPLIT);

        String[] tmp2=itemk2.split(ITEM_SPLIT);

        Stringc=\"\";if(tmp1.length==1){

        if(tmp1[0].compareTo(tmp2[0])<0){

        c=tmp1[0]+ITEM_SPLIT+tmp2[0]+ITEM_SPLIT;}

        }else{ Boolean flag=true;

        for(int i=0;i

        if(!tmp1[i].equals(tmp2[i])){

        flag=1;

        break; } }

        運(yùn)行結(jié)果如下:

        并不是每個(gè)關(guān)聯(lián)規(guī)則都值得分析。選擇關(guān)聯(lián)規(guī)則中包含13或14并且有因果意義的項(xiàng)。例如,12;2;4;->14;1.00,說(shuō)明6月平均氣溫低于30 ℃,降水量低于200 mm,且8月降水量低于200 mm的地區(qū),其玉米產(chǎn)量低于5 000 kg/hm2,可信度為100%。14;->12;2;4;1.00,說(shuō)明玉米產(chǎn)量低于5 000 kg/hm2的地區(qū),其6月平均氣溫必低于30 ℃,降水量低于200 mm,且8月降水量低于200 mm,可信度為100%。

        經(jīng)過(guò)分析,可得出挖掘的信息為:玉米生育期內(nèi)降水量高,平均氣溫高,則產(chǎn)量高;反之,平均氣溫偏低,總降水量偏低,則產(chǎn)量低,十分可信。說(shuō)明在玉米生育期內(nèi)溫度和降水量是玉米產(chǎn)量的主要影響因素。氣溫增高和充沛的降水對(duì)玉米的產(chǎn)量提升提供了有利保障,這與本文研究結(jié)果一致。

        3 小結(jié)

        經(jīng)過(guò)研究關(guān)聯(lián)規(guī)則Apriori算法,將此算法應(yīng)用于玉米產(chǎn)量因素分析中。首先對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,然后使用Apriori算法挖掘降水量、平均氣溫與產(chǎn)量的關(guān)系,最終產(chǎn)生關(guān)聯(lián)規(guī)則。其他農(nóng)作物信息的挖掘可以采用與此相同的方法,關(guān)聯(lián)規(guī)則分析后得出的結(jié)論可用來(lái)指導(dǎo)今后的農(nóng)業(yè)生產(chǎn)與管理。

        Apriori算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),通過(guò)逐層搜索的迭代方法來(lái)查找頻繁項(xiàng)集,需要多次掃描事務(wù)數(shù)據(jù)庫(kù),運(yùn)算效率不高[8]。如何提高關(guān)聯(lián)規(guī)則算法執(zhí)行的效率,設(shè)計(jì)更有效、更實(shí)用的算法,是需要進(jìn)一步研究的課題。

        參考文獻(xiàn):

        [1] 譚 慶.關(guān)聯(lián)規(guī)則Apriori算法在試卷成績(jī)分析中的應(yīng)用研究[J].信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2009,22(2):300-302.

        [2] 張文靜,宋 雨,盧海霞.利用關(guān)聯(lián)規(guī)則建立專家系統(tǒng)的知識(shí)庫(kù)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,16(2):76-77.

        [3] HAN J W,KAMBER M.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2005.

        [4] 亓文娟,晏 杰.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則Apriori算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013,22(4):121-124.

        [5] 李 橋,陽(yáng)春華.關(guān)聯(lián)規(guī)則Apriori算法在教學(xué)評(píng)價(jià)中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2010(6):49-51,81.

        [6] 王 寧,王 波.基于Apriori算法關(guān)聯(lián)規(guī)則的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2011(10):70-72,75.

        [7] 張 超,魏三強(qiáng),朱 軍.一種農(nóng)業(yè)信息數(shù)據(jù)挖掘系統(tǒng)的研究與應(yīng)用[J].蘇州科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2013,30(1):75-80.

        [8] 張 圣.一種基于云計(jì)算的關(guān)聯(lián)規(guī)則Apriori算法[J].通信技術(shù),2011,44(6):141-143.

        77777亚洲午夜久久多人| 国产亚洲一区二区三区| 国产精品538一区二区在线| 中文字幕爆乳julia女教师| 97精品国产91久久久久久久 | 精品国产一区二区三区九一色| 日韩av精品视频在线观看| 免费人成视频xvideos入口| 欧美一级在线全免费| 热热久久超碰精品中文字幕 | 天天做天天爱夜夜爽| 久久无码人妻精品一区二区三区| 九九九影院| 中文字幕乱码在线婷婷| 亚洲人成人无码www| 无码人妻丰满熟妇区毛片| 妞干网中文字幕| 黄片免费观看视频播放| 日日噜噜夜夜狠狠va视频v| 欧美成年黄网站色视频| 欧美黑人xxxx性高清版| 亚洲天码一区二区三区| 国产亚洲精品成人aa片新蒲金| 亚洲中久无码永久在线观看同| 无码专区无码专区视频网址| 91久久香蕉国产熟女线看| 狠狠噜狠狠狠狠丁香五月| 国产一区二区三区美女| 精品少妇后入一区二区三区| 亚洲第一幕一区二区三区在线观看 | 中文字幕亚洲综合久久| a亚洲va欧美va国产综合| 男人天堂AV在线麻豆| 亚洲中文字幕乱码一二三| 久久久久免费看成人影片| 国产啪精品视频网站丝袜| 无码丰满少妇2在线观看| 中文字幕一区,二区,三区| 五月天中文字幕日韩在线| 久久精品噜噜噜成人| 亚洲精品成人av观看 |