亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進Apriori算法的水政數(shù)據(jù)關聯(lián)規(guī)則分析研究

        2017-11-24 17:00:13陳瀟瀟蔡迎歸
        科技資訊 2017年27期
        關鍵詞:水政關聯(lián)規(guī)則

        陳瀟瀟+++蔡迎歸

        摘 要:數(shù)據(jù)挖掘中的關聯(lián)規(guī)則挖掘能夠發(fā)現(xiàn)大量數(shù)據(jù)中項集之間潛在的關聯(lián),運用關聯(lián)分析方法對水事違法案件數(shù)據(jù)進行挖掘分析,從而總結出水政執(zhí)法隊伍在監(jiān)察過程中存在的問題,以期提高水政執(zhí)法能力和水平,有效地預防、遏制涉水違法現(xiàn)象。

        關鍵詞:改進Apriori算法 水政 關聯(lián)規(guī)則

        中圖分類號:TP311 文獻標識碼:A 文章編號:1672-3791(2017)09(c)-0202-02

        隨著互聯(lián)網(wǎng)以及計算機相關技術的飛速發(fā)展,政務信息化的不斷推進,水政執(zhí)法部門積累了海量的水事違法案件數(shù)據(jù),而目前對于這些數(shù)據(jù)的使用多限于統(tǒng)計、查詢等傳統(tǒng)方式,其潛在的使用價值還遠沒能得到充分的挖掘和實用,對于隱藏在這些數(shù)據(jù)后的規(guī)律、產(chǎn)生的原因往往無法得知,從而不能有針對性地對水政監(jiān)察管理中已存在的問題進行相應的變革。傳統(tǒng)的處理數(shù)據(jù)方式,已經(jīng)難以適應于日益增長的數(shù)據(jù)規(guī)模,“信息爆炸”但“知識貧乏”,已成為一個現(xiàn)實問題。

        由此,應用數(shù)據(jù)挖掘中的關聯(lián)規(guī)則對水政數(shù)據(jù)進行分析,通過對所采集到的水事違法案件數(shù)據(jù)進行預處理、數(shù)據(jù)挖掘等步驟,從中總結出水政執(zhí)法隊伍在監(jiān)察過程中存在的問題,以期提高水政執(zhí)法能力和水平,有效地預防、遏制涉水違法現(xiàn)象。

        1 關聯(lián)規(guī)則Apriori算法

        Apriori算法是最經(jīng)典的關聯(lián)規(guī)則挖掘算法,是由Agrawal首次提出的,是基于計算候選集的遞推方法,其思想是利用已知的高頻數(shù)據(jù)集推導其他高頻數(shù)據(jù)項集,是一種寬度優(yōu)先算法。該算法的主要工作在于尋找頻繁項集,它利用了頻繁項集的向下封閉性(即頻繁項集的子集必須是頻繁項集),k-項集用于探索(k+1)-項集。Apriori通過K次掃描數(shù)據(jù)庫來發(fā)掘頻繁K項集,大量的時間浪費在IO上,并且以數(shù)據(jù)庫中各項目的重要程度相同以及各項目分布均勻為前提,容易忽略概率小但重要性高的項目。

        2 Apriori算法的改進

        本文從候選項目集的支持度計算過程和小候選項目集的規(guī)模兩個方面對原Apriori算法進行優(yōu)化。

        2.1 候選項目集的支持度計算過程

        在整個事務數(shù)據(jù)庫中,如果想要求得一條事務項的集合,可以將該事務項分解為單一的元素項,對單一元素項的集合在取交集的結果即是。根據(jù)這一定理,對Ck的計數(shù)工作,不需要再去頻繁的掃描數(shù)據(jù)庫,而是根據(jù)候選項集的集合可以分解為其項集元素在數(shù)據(jù)庫中的集合的交集這一規(guī)則,利用已經(jīng)生成的候選項集C1來推導得到。這樣,在計算支持度的計數(shù)的過程中,只掃描一遍數(shù)據(jù)庫,時間開銷會低于原算法。

        2.2 縮小候選項目集的規(guī)模

        在生成頻繁k-1項集后,對整個候選集進行檢查裁剪,判斷LK-1包含的項集數(shù)是否小于其項集的維度。若小于,則不能生成k項候選集的,算法即可終止。在候選集LK-1中的項集Ii和Ij連接生成X時,對于X的每一個項集元素同樣進行檢查,若項集元素個數(shù)小于候選集的維度,則該項集元素不會出現(xiàn)在生成k維的候選項目集中,可以刪除掉以減小候選集的規(guī)模。

        通過上述兩個方面的優(yōu)化,可以生成一個完整的基于支持度計數(shù)工作和候選項目集規(guī)則優(yōu)化的改進方案, 從而使算法效率有較大的提高。

        3 Apriori算法在水政數(shù)據(jù)分析中的應用

        3.1 水事違法案件信息的預處理

        在水政監(jiān)察管理系統(tǒng)的案件信息中,去除重復數(shù)據(jù),挑選出科學的、安全、適用于數(shù)據(jù)挖掘應用的屬性數(shù)據(jù)進行數(shù)據(jù)清洗。對于原始數(shù)據(jù)中某些屬性為空缺值的記錄,盡量補充缺失屬性。如用身份證件號碼填補年齡、籍貫的空缺、案件類型的空缺可以通過分析其他屬性獲得。數(shù)據(jù)清洗后,對某些原來沒有的屬性按需要進行生成,通過泛化、屬性離散化處理將數(shù)據(jù)轉換以構成一個適合數(shù)據(jù)挖掘的描述形式。如將案件類型泛化處理,取河道案、水工程案、水資源案、水土保持案和其他類案件五大類;年齡由出生日期轉化生成,并概化為少年(17歲以下)、青年(18~40歲)、中年(41~65歲)、老年(66歲以上)四個年齡段;將發(fā)案時間離散化處理為上午、下午、夜間、深夜;發(fā)案季節(jié)由發(fā)案時間轉化,離散化處理為春(3~5月)、夏(6~8月)、秋(9~11月)、冬(12~2月);發(fā)案地點劃分成對應水政監(jiān)察總隊所管轄的幾個地區(qū);經(jīng)濟損失泛化劃分為一般、較大、嚴重、重大;職業(yè)泛化為無業(yè)、事業(yè)、企業(yè)、個體四大類;文化程度泛化為小學及以下、初中、高職中專、專(本)科、碩士及以上五類;戶籍略去縣市、街道等細節(jié)信息,簡化為各個省份名稱。

        3.2 改進Apriori算法對水事違法案件信息進行關聯(lián)規(guī)則挖掘

        數(shù)據(jù)做好預處理工作之后,根據(jù)造成經(jīng)濟損失的不同程度,進行項目屬性權值的設置,如水事違法案件中造成重大經(jīng)濟損失的案件,其重要和危害程度明顯要高于其他案件,但它的發(fā)生概率通常較小而容易被忽略,需要增大其屬性權值。然后通過已經(jīng)由程序實現(xiàn)的優(yōu)化算法,找出相關屬性之間的強關聯(lián)規(guī)則,如案件類型、發(fā)案地點、發(fā)案時間段、發(fā)案季節(jié)、經(jīng)濟損失、違法人員年齡段、職業(yè)、文化程度以及戶籍等屬性之間的強關聯(lián)規(guī)則,并對結果進行解釋評估,為水政執(zhí)法部門制定重要決策,合理部署水政執(zhí)法工作提供宏觀決策依據(jù)。

        4 實驗結果及分析

        以經(jīng)過預處理后的水事違法案件信息作為數(shù)據(jù)源進行仿真實驗,案件信息記錄5400條,運用經(jīng)典關聯(lián)規(guī)則Apriori算法和改進后的Apriori算法,通過設置不同的事務數(shù)量、不同的支持度、不同的項目個數(shù),統(tǒng)計兩種算法的運行時間和生成強關聯(lián)規(guī)則數(shù)量,對比分析算法的性能和效率。實驗測試采用Matlab語言編寫程序,在Matlab平臺下進行調試,CPU采用的Intel(R)i3-3217U,內(nèi)存4G,操作系統(tǒng)為64位Windows7。挖掘結果得出了采用同樣最小支持度對于不同事務記錄條數(shù)進行比較時,兩種算法在執(zhí)行時間的區(qū)別。從實驗結果來看,改進的Apriori算法實現(xiàn)了預期的目標,與同類算法相比,改算法具有挖掘結果準確、速度快、運算量小、時間短、空間利用率高等特點。同時,也反映了這兩種算法的最小支持度與時間的關系:最小支持度最高,所需要的時間越多;對于不同的最小支持度,改進的Apriori算法所需時間比經(jīng)典Apriori算法所需要的時間短。通過以上分析,綜合關聯(lián)規(guī)則挖掘結果,得到如下結論,水事違法案件雖然類型多情況復雜,但是違法人員結構極其類似,年齡趨于兩極化,青少年和老年居多,而且文化素質低,特別是無業(yè)人員在違法人員中所占比重較大。水土保持案和水資源案較多的在A1地區(qū),在A2地區(qū)夜間多發(fā)盜竊設備的水工程案

        5 結語

        本文詳細說明了關聯(lián)規(guī)則算法Apriori在水事違法案件信息挖掘中的應用過程:首先簡述了關聯(lián)規(guī)則基本概念和Apriori算法原理;其次提出了一個完整的基于支持度計數(shù)工作和候選項目集規(guī)則優(yōu)化的改進方案,從而使算法效率有較大的提高;最后以經(jīng)過預處理后的水事違法案件信息作為數(shù)據(jù)源進行仿真實驗,對關聯(lián)規(guī)則挖掘結果進行分析,從而提高水政執(zhí)法能力和水平,有效地預防、遏制涉水違法現(xiàn)象。

        參考文獻

        [1] 苗苗苗,王玉英.基于矩陣壓縮的Apriori算法改進的研究[J].計算機工程與應用,2013,49(1):159-162.

        [2] 付沙,周航軍.關聯(lián)規(guī)則挖掘Apriori算法的研究與改進[J].微電子學與計算機,2013,30(9):110-114.endprint

        猜你喜歡
        水政關聯(lián)規(guī)則
        水政執(zhí)法隊伍建設及規(guī)范執(zhí)法思考
        法制博覽(2018年26期)2018-01-22 12:45:55
        水政監(jiān)察
        水政水資源管理
        水政執(zhí)法工作的探討
        基于Apriori算法的高校學生成績數(shù)據(jù)關聯(lián)規(guī)則挖掘分析
        基于關聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
        移動通信(2016年20期)2016-12-10 09:09:04
        關聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學質量評價體系中的應用
        關聯(lián)規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關聯(lián)規(guī)則的計算機入侵檢測方法
        日韩精品有码中文字幕| 午夜福利92国语| xxxx国产视频| 久久午夜伦鲁鲁片免费| 一区二区在线观看精品在线观看| 男人和女人做爽爽视频| 国产一区二区不卡老阿姨| 欧美手机在线视频| 亚洲一区二区精品在线| 中文字幕在线亚洲精品| 精品国产乱码久久久软件下载| 精品午夜一区二区三区久久| 久久精品国产亚洲av夜夜| 极品少妇xxxx精品少妇偷拍| 国产在线视频一区二区三区| 依依成人影视国产精品| 日本久久久精品免费免费理论| 国产乱人无码伦av在线a| 亚洲欧美日韩中文无线码| 欧美亚洲尤物久久综合精品| 各类熟女熟妇激情自拍| 国产偷久久久精品专区| 亚洲在AV极品无码天堂手机版 | 日本视频一区二区三区免费观看| 中文字幕视频一区懂色| 日本动漫瀑乳h动漫啪啪免费| 色悠久久久久综合欧美99| 久久精品视频按摩| 91偷拍与自偷拍亚洲精品86| 亚洲欧美日韩国产精品一区二区| 亚洲成人777| 97超碰中文字幕久久| 男人添女人囗交做爰视频| 伊人久久无码中文字幕| 少妇特殊按摩高潮惨叫无码| 亚洲精品在线免费视频| 肥臀熟女一区二区三区| 国产成人8x视频网站入口| 日本一区二区免费看片| 99精品国产丝袜在线拍国语| 精品2021露脸国产偷人在视频|