亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        起重機械檢驗數(shù)據(jù)挖掘系統(tǒng)的設計與實現(xiàn)

        2011-08-01 02:10:50劉少武張繼福高崇仁
        太原科技大學學報 2011年5期
        關鍵詞:數(shù)據(jù)挖掘關聯(lián)規(guī)則

        劉少武,張繼福,高崇仁

        (太原科技大學,太原030024)

        起重機械是一種應用廣泛的特種設備,其安全運行顯得非常重要。為此特檢院會對其進行安全檢驗,這樣會積累大量關于其安全性檢驗的故障、缺陷、失效相關數(shù)據(jù)。目前對起重機械的檢驗檢測還是采取人工拿儀器檢驗、人工記錄、人工判斷有無問題等比較原始的方法,效率非常低,對以前檢驗的數(shù)據(jù)也只是做了一些傳統(tǒng)的統(tǒng)計報表,沒有充分利用。隨著起重機械數(shù)量的增加,應用復雜性的增加,對其安全性檢驗的任務越來越多,檢驗要求越來越苛刻。因此快速、高效的找出起重機械的故障、缺陷、失效,分析它們之間的關聯(lián)性[1-2],并提出改進和預防措施,對保障起重機械的日常正常工作,提高運行的可靠性有著重要的意義。

        數(shù)據(jù)挖掘[3](Data Mining)是從存放在數(shù)據(jù)或其他信息庫中的大量的數(shù)據(jù)中,獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程。數(shù)據(jù)挖掘技術在起重機械檢驗中應用方向主要是檢修決策、故障診斷、部件管理等。本文介紹了利用決策樹分類和關聯(lián)規(guī)則等數(shù)據(jù)挖掘技術,開發(fā)出的起重機械檢驗數(shù)據(jù)挖掘系統(tǒng),包括系統(tǒng)的結(jié)構(gòu)及功能,數(shù)據(jù)庫的設計、數(shù)據(jù)的預處理、數(shù)據(jù)挖掘技術和運行的結(jié)果。在系統(tǒng)中用決策樹的C4.5算法實現(xiàn)對起重機械故障診斷,用關聯(lián)規(guī)則算法FP_growth實現(xiàn)缺陷、失效相關性分析、預測。開發(fā)系統(tǒng)的目的和意義在于為檢驗起重機械安全運行性提供了一種有效決策模型。

        1 系統(tǒng)用到的數(shù)據(jù)挖掘技術

        1.1 關聯(lián)規(guī)則簡介

        參照文獻[4],將關聯(lián)規(guī)則所要挖掘的數(shù)據(jù)集記作D,D={t1,t2,…,tk…tn},其中tk={i1,i2,…,ij…ip}(k=1,2,…n)為一事務;tk中的元素ij(j=1,2,…p)稱為Item。I={i1,i2,…,ij,…im}是由 D中所有項的集合,I的任何子集稱為D中的項集,若|X|=k,則稱集合X是k項集。

        D中包含項集X的事務數(shù)稱為項集X的支持數(shù),記為 σ.記項集 X的支持度為:support(X)=其中 |D|是數(shù)據(jù)集D的事務數(shù)。若support(X)不小于預先指定的最小支持度,則稱X為頻繁項集。

        若X,Y為項目集,且X∩Y=?,蘊涵式X?Y稱為關聯(lián)規(guī)則,X,Y分別為關聯(lián)規(guī)則X?Y的前提和結(jié)論,項目集(X∪Y)的支持度稱為關聯(lián)規(guī)則X?Y的支持度,記作:support(X?Y),其中support(X?Y)=support(X∪Y)關聯(lián)規(guī)則X?Y的置信度記作:

        一般情況用戶挖掘需要設定最小置信度記為minsup,支持度和置信度是關聯(lián)規(guī)則中重要的參數(shù),前一個用來衡量關聯(lián)規(guī)則在D中的統(tǒng)計重要性,后者用于衡量關聯(lián)規(guī)則的可信程度,而有用的關聯(lián)規(guī)則一般是支持度和置信度都較高的。挖掘關聯(lián)規(guī)則分為兩個子問題,STEP1找出存在于事務數(shù)據(jù)庫中支持度support(X)不小于用戶給定的最小支持度minsup的所有頻繁項目集。STEP2根據(jù)最小項目集和最小置信度產(chǎn)生關聯(lián)規(guī)則。參照文獻[4],在該系統(tǒng)中,挖掘FP-tree項目集采用了算法FP_growth(FP-tree,null).

        1.2 決策樹分類簡介

        決策樹分類是數(shù)據(jù)挖掘核心技術算法之一,它通過大量的訓練集得出規(guī)則,從中找出潛在的、對決策有價值的信息,用在一些分類模型中。決策樹分類的核心思想是采用信息論中的概念,用信息增益作為決策屬性分類判別能力的度量,進行決策節(jié)點屬性的選擇。決策樹算法中比較有影響的算法是ID3,后有其改進算法能處理連續(xù)屬性的C4.5,主要用途是提取分類規(guī)則,進行分類預測。

        設S是由s個數(shù)據(jù)樣本的組成的集合。假設類別標示屬性有m個不同的值,定義m個不同類Ci(i=1,2,…,m)。設si是類Ci中的樣本數(shù),對給定樣本分類所需期望信息為:I(s1,s2,…,sm) =-式中pi是樣本屬于Ci的概率,并且用si/s估計。設屬性Ai有k個不同值{a1,a2,…,ak},可以由Ai劃分為k個子集{S1,S2,…Sk},其中Sj包含S中這樣樣本,它們在Ai上具有值aj,1≤j≤k.如果Ai選作測試屬性,則這些子集對應于由包含集合S的節(jié)點生長出來的分枝。

        設si是子集Sj中類Ci的樣本數(shù),由A劃分成子集的熵給出:Esm),其中項充當?shù)趈個子集的權,并且等于子集中的樣本個數(shù)除以S中的樣本總數(shù)。熵值越小,子集純度越高。在Ai上分枝將獲得的編碼信息是Gain(Ai)=I(s1,s2,…,sm)-E(Ai),換句話說,Gain(Ai)是由屬性Ai的值而導致的熵的期望壓縮。產(chǎn)生一棵枝節(jié)較為豐富的樹之后,需要有選擇性地修剪,得到一個精簡的子樹。

        參照文獻[5],系統(tǒng)采用了C4.5決策樹分類算法。

        2 系統(tǒng)的結(jié)構(gòu)和功能

        系統(tǒng)在結(jié)構(gòu)上分為五個部分(他們之間的關系如圖1所示):原始MYSQY數(shù)據(jù)庫,一定意義上的數(shù)據(jù)倉庫,數(shù)據(jù)挖掘引擎(分為決策樹和關聯(lián)規(guī)則),規(guī)則庫,圖形用戶界面。用戶主要分三類:特檢院檢驗員、一般用戶、特檢院系統(tǒng)管理員。他們在系統(tǒng)的使用過程中扮演不同的角色。

        根據(jù)實際的需求分析,系統(tǒng)實現(xiàn)的主要功能有:特檢院檢驗員能夠存儲不同起重機械的檢驗數(shù)據(jù),并能方便有效地實現(xiàn)相應數(shù)據(jù)的操作和管理,主要包括檢驗信息的錄入、刪除和修改以及關鍵字的查詢;特檢院系統(tǒng)管理人員能夠?qū)z驗數(shù)據(jù)進行預處理并形成相應的預處理數(shù)據(jù)庫。當輸入相應的參數(shù),對數(shù)據(jù)進行分類挖掘,相關性挖掘。最終生成規(guī)則庫,并方便的對規(guī)則庫進行刪除修改以及查詢;一般用戶當輸入相應的參數(shù)時能夠根據(jù)規(guī)則庫里面的規(guī)則對故障進行分類,對缺陷、失效進行預測,最后顯示給用戶。系統(tǒng)還能夠提供一定的安全機制,提供數(shù)據(jù)信息授權訪問,防止隨意刪改。系統(tǒng)功能如圖2所示。

        圖2 系統(tǒng)功能Fig.2 System function

        系統(tǒng)開發(fā)的環(huán)境是集成的MyEclipse,采用Stucts框架設計出基于J2EE的Web應用系統(tǒng),服務器為Apache-tomcat-6.0.28,數(shù)據(jù)庫為Mysql-essential-5.1.48,系統(tǒng)運行在雙核1.3G內(nèi)存2G的Windows XP操作系統(tǒng)上。

        3 設計系統(tǒng)的關鍵技術

        3.1 數(shù)據(jù)庫設計

        好的數(shù)據(jù)庫是設計整個系統(tǒng)的基礎。由于關聯(lián)規(guī)則和決策樹用的預處理數(shù)據(jù)和得到的結(jié)果不同,所以在設計數(shù)據(jù)庫表時分別為其設計了表。系統(tǒng)在MYSQL中建立數(shù)據(jù)庫名為qizhongjixie,并創(chuàng)建和設計了六個表 qizhongjixie_admin、xcjy_data、ycl_data、ycljc_data、gz_data、gzjcs_data,分別存放用戶信息、檢驗數(shù)據(jù)、關聯(lián)規(guī)則預處理數(shù)據(jù),決策樹預處理數(shù)據(jù),關聯(lián)規(guī)則所得的規(guī)則以及決策樹所得的決策樹。

        3.2 起重機檢測數(shù)據(jù)預處理

        數(shù)據(jù)庫中的原始數(shù)據(jù)通常有一個共同特點,即存在大量的不完整、含噪聲和不一致的數(shù)據(jù)。數(shù)據(jù)預處理一般包括消除噪聲,推導計算缺值數(shù)據(jù),消除重復記錄等,數(shù)據(jù)預處理的目的是為數(shù)據(jù)挖掘過程提供干凈、準確、簡潔的數(shù)據(jù)。在所開發(fā)的系統(tǒng)中,提高數(shù)據(jù)挖掘效率和準確性是數(shù)據(jù)挖掘中非常重要的環(huán)節(jié),這個過程主要遵循以下參考原則:盡可能賦予屬性名明確的含義;統(tǒng)一多數(shù)據(jù)源的屬性值編碼;處理空缺值等。例如在原始數(shù)據(jù)中檢驗項有大車限位失靈和大小車制動失效這兩種情況,在處理過程中認為是同一種問題,一些對起重機械安全沒有影響的檢驗結(jié)果忽略,對結(jié)果影響不大的屬性沒有加以考慮。系統(tǒng)在對其進行預處理過程中根據(jù)預處理頁面提交的參數(shù)調(diào)用相應的算法對原始數(shù)據(jù)進行自動預處理,并將結(jié)果存到相應的數(shù)據(jù)庫表中。根據(jù)以上的原則,選取十個關鍵屬性:技術文件、作業(yè)環(huán)境和外觀、司機室檢驗、金屬結(jié)構(gòu)、軌道、主要零部件、電氣和控制系統(tǒng)、液壓系統(tǒng)、安全保護裝置、運行試驗。對十個屬性進行相關性分析時,一次檢驗作為一次事件Tid,當檢驗項中有缺陷、失效時記為1,否則為0;對其進行分類時,上述十個屬性作為決策屬性,每個屬性都有不同的故障取值,故障類別屬性作為決策屬性,其值最常見的有限期整改和重新改裝,在預處理時記為兩個值P1和P2.

        3.3 兩個算法在系統(tǒng)中的實現(xiàn)

        算法FP_growth(FP-Tree,null)在系統(tǒng)中的實現(xiàn)過程可以簡單描述為:對于給定的布爾數(shù)據(jù)集以及最小支持度和最小置信度,先用給定的算法找出頻繁項集,后列出滿足最小置信度的關聯(lián)規(guī)則。為實現(xiàn)這個過程,系統(tǒng)設計了以下的類和接口:DataSet(布爾數(shù)據(jù)集 )、DBReader(遍歷數(shù)據(jù)集的工具)、LargelternsetsFinder(數(shù)據(jù)挖掘方案的接口)、FPGrowth(數(shù)據(jù)挖掘方案的 FP-Tree實現(xiàn))、AssoeiationsFinder(關聯(lián)規(guī)則挖掘的接口)。最小支持度和最小置信度是由用戶任意設定傳入到類或者實現(xiàn)接口中,每一個類或者實現(xiàn)接口都會實現(xiàn)一定的功能,算法功能體現(xiàn)的是這幾個類和實現(xiàn)接口之間的相互協(xié)作的結(jié)果[6]。

        算法C4.5的實現(xiàn)與算法FP_growth的實現(xiàn)思路基本相同。只是設計的類和接口不同。

        4 系統(tǒng)運行的結(jié)果及分析

        用沈陽特檢院提供的檢驗數(shù)據(jù)作為訓練集數(shù)據(jù),分別對其進行了缺陷、失效的關聯(lián)規(guī)則分析和故障的決策樹分類。表1是關聯(lián)規(guī)則預處理的結(jié)果,表2是關聯(lián)規(guī)則挖掘的結(jié)果,表3是決策樹預處理結(jié)果。

        根據(jù)表3構(gòu)造出的決策樹為:A1,B1,A5,G1,A3,D1,A7,K1,A4,F1,A6,H1,P1,H2,A9,M1,P1,M2,P1,F2,P1,K2,P2,D2,P2,G2,P1,B2,P1.在表4所示的輸入故障參數(shù)界面中,輸入相應的參數(shù),點擊預測按鈕,就會得到起重機械的故障結(jié)果。

        運行結(jié)果分析:由關聯(lián)規(guī)則得出的結(jié)果,當輸入最小的置信度和支持度可以得出18個頻繁項集A9(安全保護裝置)一共出現(xiàn)244次,這說明起重機械在安全保護裝置方面做的非常不好;A6(主要零部件)和A9(安全保護裝置)一共出現(xiàn)98次,支持度和置信度分別為29.4和35.6,這說明主要零部件出現(xiàn)問題能知道安全保護裝置也出現(xiàn)問題;A7(電氣控制系統(tǒng))和A9(安全保護裝置)一共出現(xiàn)67次,支持度和置信度分別為20.1和27.3,他們之間的關聯(lián)度也相當大。對數(shù)據(jù)決策樹得出的結(jié)果分析如下:其中B1,B2代表A1(技術文件)有和沒有故障,依次類推C1,C2代表A2有沒有故障,一直到運行試驗用N1,N2表示有沒有故障,P1代限期整改,P2代表重新改裝。從其中A1出發(fā)到任意一個P1或者P2都是一條決策規(guī)則,例如由A1(技術文件),A5(軌道),A3(司機室檢驗),A7(電氣和控制系統(tǒng)),沒有故障以及A4(金屬結(jié)構(gòu))有故障,可以得出起重機械需要限期整改。

        表1 關聯(lián)規(guī)則預處理結(jié)果(部分)Tab.1 The preprocessed consequence from association rules(partly)

        表2 關聯(lián)規(guī)則挖掘結(jié)果(部分)Tab.2 The mining consequence from association rules(partly)

        表3 決策樹預處理結(jié)果(部分)Tab.3 The preprocessed consequence of decision tree(partly)

        表4 輸入?yún)?shù)界面Tab.4 The input parameter interface

        根據(jù)以上所形成的規(guī)則庫,普通用戶可以對起重機械做一些故障分類,即在十個檢驗項目中輸入故障參數(shù),系統(tǒng)就會自動給出起重機的故障類型。

        5 結(jié)語

        系統(tǒng)可以對起重機械檢驗數(shù)據(jù)進行編輯,建立一定意義上的數(shù)據(jù)倉庫,選取適當?shù)膮?shù)可對其進行預處理,最重要的是對其進行決策樹分類和關聯(lián)分析,對起重機械的故障分類和缺陷、失效預測具有積極的意義。系統(tǒng)具有自學習能力,隨著數(shù)據(jù)不斷地加入,系統(tǒng)分類和預測的準確性將會不斷提高,應用證明系統(tǒng)實用價值較高。

        [1]起重機械定期檢驗規(guī)程[EB/OL].(2007-03-01)[2011-02-28].http://wenku.baidu.com/view/9a451a454.html.

        [2]起重機械監(jiān)督檢驗規(guī)程[EB/OL].(2007-09-18)[2011-02-28].http://www.docin.com/p-9841244.html.

        [3]JIAWEI HAN,MICIHELINE KAMBER.數(shù)據(jù)挖掘——概念與技術[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2001.

        [4]陳玉婷,王斌,劉博,等.關聯(lián)規(guī)則挖掘算法介紹[J].計算機技術與發(fā)展,2006,16(5):21-25.

        [5]SUN WEIXIANG,CHEN JUN,LI JIAQING.Decision tree and PCA-based fault diagnosis of rotating machinery[J].Mechanical Systems and Signal Processing,2007,21(3):1300-1317.

        [6]房琳.基于FP-Tree算法頻繁模式挖掘的選課系統(tǒng)設計與實現(xiàn)[D].濟南:山東大學,2005.

        猜你喜歡
        數(shù)據(jù)挖掘關聯(lián)規(guī)則
        撐竿跳規(guī)則的制定
        “苦”的關聯(lián)
        當代陜西(2021年17期)2021-11-06 03:21:36
        數(shù)獨的規(guī)則和演變
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對我國的啟示
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        中文字幕日本韩国精品免费观看| 全球av集中精品导航福利| 欧美性猛交xxxx乱大交丰满| 粗大挺进尤物人妻一区二区 | 亚洲人成无码www久久久| 免费看欧美日韩一区二区三区| 最新国产一区二区三区| 人妻诱惑中文字幕在线视频| 国产一区二区波多野结衣| 色欲av一区二区久久精品| 国产中文字幕亚洲综合| 玖玖色玖玖草玖玖爱在线精品视频| 国产白嫩护士被弄高潮| 亚洲福利视频一区| 亚洲传媒av一区二区三区| 中文乱码字字幕在线国语| 亚洲熟女乱色综合亚洲av| 亚洲最新版无码AV| 国产日本精品一区二区| 国产成人无码av一区二区在线观看| 久久久精品人妻一区二区三区蜜桃| 色欲AV无码久久精品有码| 大香蕉视频在线青青草| 亚洲av无码一区二区三区网址| 成 人 网 站 免 费 av| 蜜桃av无码免费看永久 | 国产美女久久久亚洲综合| 亚洲国产精品一区二区成人av| 国产成人涩涩涩视频在线观看| 自拍 另类 综合 欧美小说| 日本中文字幕官网亚洲| 欧美老熟妇乱子| 亚洲深深色噜噜狠狠爱网站| 日本精品一区二区在线看| 国产夫妻自拍视频在线播放 | 欧美一片二片午夜福利在线快 | 亚洲av少妇一区二区在线观看| 亚洲精品久久7777777| 国产亚洲日韩欧美久久一区二区| 精品国产一品二品三品| 亚洲a无码综合a国产av中文|