亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進(jìn)的ID3算法在機(jī)車(chē)檢修作業(yè)流程中的應(yīng)用

        2010-05-08 08:44:02李建磊劉鳳娟
        鐵路計(jì)算機(jī)應(yīng)用 2010年10期
        關(guān)鍵詞:作業(yè)內(nèi)容

        李建磊,劉鳳娟

        (1.蘭州交通大學(xué) 機(jī)電技術(shù)研究所,蘭州 730070;2.西安鐵路職業(yè)技術(shù)學(xué)院 電氣工程系,西安 710014)

        隨著鐵路高速化、重載化、信息化的發(fā)展,機(jī)車(chē)檢修的任務(wù)變得越來(lái)越重,如何從龐大的故障數(shù)據(jù)中提取出有價(jià)值的檢修信息,顯得格外重要。機(jī)車(chē)檢修要嚴(yán)格按照鐵道部機(jī)務(wù)局頒布的標(biāo)準(zhǔn),如機(jī)統(tǒng)28、機(jī)統(tǒng)6等標(biāo)準(zhǔn),這樣才能夠全面掌握機(jī)車(chē)檢修作業(yè)情況。但是,面對(duì)繁重的檢修任務(wù),特別是針對(duì)一些頻繁發(fā)生的故障,就要通過(guò)合理的方法進(jìn)行分類(lèi),找到頻繁檢修路徑,予以重點(diǎn)關(guān)注,進(jìn)而提高檢修效率。

        在數(shù)據(jù)挖掘中,分類(lèi)挖掘技術(shù)的方法很多,其中ID3算法是決策樹(shù)方法中最常用的具體實(shí)現(xiàn)算法。最先由Quinlan[1]在1986年提出,后來(lái)許多研究者發(fā)現(xiàn)ID3算法具有“偏向于取值較多的屬性,產(chǎn)生了大數(shù)據(jù)掩蓋小數(shù)據(jù)的現(xiàn)象”的缺點(diǎn),為了克服這一缺點(diǎn), Konenko等人提出了“限制決策樹(shù)為二叉樹(shù)”的方法,曲開(kāi)社等[2]提出了添加“用戶(hù)興趣度”的方法,這些都是對(duì)ID3算法的改進(jìn)。文章結(jié)合機(jī)車(chē)檢修計(jì)劃中的“基本影響因子”和“檢修評(píng)定因子”來(lái)改進(jìn)ID3算法,對(duì)機(jī)車(chē)檢修作業(yè)流程進(jìn)行合理的優(yōu)化,達(dá)到在短時(shí)間內(nèi)獲得有價(jià)值的機(jī)車(chē)檢修作業(yè)內(nèi)容的目的。

        1 ID3算法

        1.1 ID3算法的概述

        ID3算法是決策樹(shù)生成最常用的具體實(shí)現(xiàn)算法。其算法采用信息論中熵的概念,用信息增益(Information Gain)作為決策屬性分類(lèi)判別能力的度量,進(jìn)行決策樹(shù)節(jié)點(diǎn)屬性的選擇。在決策樹(shù)的生成過(guò)程中選擇具有最大信息增益的決策屬性作為決策樹(shù)的當(dāng)前節(jié)點(diǎn)。通過(guò)這種方式選擇節(jié)點(diǎn)屬性可以保證決策樹(shù)具有最小的分支數(shù)量,使得到的決策樹(shù)冗余最小。但是,這種算法往往在樹(shù)節(jié)點(diǎn)分支階段趨向于取值較多的屬性,許多學(xué)者懷疑其分類(lèi)效果。例如,文獻(xiàn)[2]中指出的“穿衣指數(shù)”是一個(gè)主觀(guān)因素,相同的天氣情況下,老、弱、幼相對(duì)于年輕、健壯的人群來(lái)說(shuō),可能會(huì)穿的多一些。雖然“穿衣指數(shù)”的取值較多,信息增益較大,而依據(jù)實(shí)情不能作為決策樹(shù)的根節(jié)點(diǎn)。

        在機(jī)車(chē)檢修中,一般來(lái)說(shuō),存在繁多的檢修內(nèi)容,其取值最多,按照ID3算法,得到屬性“檢修內(nèi)容”的信息增益最大, 以此作為決策樹(shù)的根節(jié)點(diǎn)。實(shí)際機(jī)車(chē)檢修作業(yè)流程步驟是:(1)找到哪些部件有故障;(2)把檢修作業(yè)分配到相應(yīng)的班組;(3)班組的工長(zhǎng)再把具體的檢修任務(wù)下達(dá)到每個(gè)小組中??傊谡{(diào)度人員下達(dá)任務(wù)后,檢修作業(yè)流程是按照班組來(lái)具體施修的,而不是按照具體的施修內(nèi)容來(lái)進(jìn)行作業(yè)的。這是作業(yè)流程的具體步驟。

        1.2 機(jī)車(chē)檢修的影響因素

        通常決策者可以根據(jù)經(jīng)驗(yàn)知識(shí)來(lái)確定一些影響因素。而在機(jī)車(chē)檢修計(jì)劃的制定中,主要考慮:基本影響因子X(jué)、走行公里因素Y以及動(dòng)態(tài)因素Z對(duì)機(jī)車(chē)檢修規(guī)定的影響,即:檢修評(píng)定因子W= F(X,Y,Z)?,F(xiàn)假定一輛較好的機(jī)車(chē)運(yùn)行在中等路況下,機(jī)車(chē)的基本影響因子是0.5?;居绊懸蜃涌刹閳D1。根據(jù)基本影響因子、走行公里因素和動(dòng)態(tài)因素等,再加上機(jī)務(wù)段實(shí)際的狀況統(tǒng)計(jì),得出檢修評(píng)定因子。具體影響因素情況見(jiàn)表1。

        表1 某機(jī)務(wù)段中修的影響因素

        結(jié)合“基本影響因子”和“檢修評(píng)定因子”,對(duì)ID3算法進(jìn)行改進(jìn),目的是減少取值較多的屬性對(duì)決策樹(shù)形成的影響,進(jìn)而更加符合實(shí)際的機(jī)車(chē)檢修作業(yè)流程。

        1.3 改進(jìn)ID3算法的具體計(jì)算方法

        設(shè)S是數(shù)據(jù)訓(xùn)練集,S中類(lèi)別標(biāo)識(shí)屬性有n個(gè)不同取值,即定義了n個(gè)類(lèi)Ci, i =1,2,...,n,Ri為數(shù)據(jù)集S中屬于Ci類(lèi)的子集,用ri表示子集Ri中元組中數(shù)量。

        集合S中的類(lèi)別表示屬性的期望信息量:

        式中,Pi是表示任意樣本屬于Ci類(lèi)的概率。

        假設(shè)屬性A中共有m個(gè)不同的取值{a1,a2,...,am},則通過(guò)屬性A的取值可將數(shù)據(jù)集S劃分為m個(gè)子集,用sj表示數(shù)據(jù)集S中屬性A的取值為aj的子集,j=1,2,...,m。

        如果A被作為決策屬性,則這些子集將對(duì)應(yīng)點(diǎn)的不同分枝。用sij表示sj子集中屬于Ci類(lèi)元組的數(shù)量,則屬性A對(duì)于分類(lèi)Ci的熵:

        式中,加入基本影響因子α,來(lái)增大機(jī)車(chē)檢修中相關(guān)屬性因素的權(quán)重,減小取值較多屬性的影響。此為第1級(jí)的改進(jìn)。

        對(duì)于屬性A每個(gè)取值對(duì)分類(lèi)Ci期望信息量:

        式中,Pij表示在sj子集中屬于Ci類(lèi)的比重。

        通過(guò)上述可得到對(duì)屬性A作為決策分類(lèi)屬性的信息增益:

        式中,加入檢修評(píng)定因子β,來(lái)對(duì)每一個(gè)屬性進(jìn)行機(jī)車(chē)檢修的綜合評(píng)定。此為第2級(jí)的改進(jìn)。

        通過(guò)兩級(jí)改進(jìn),有效地避免ID3算法決策樹(shù)節(jié)點(diǎn)偏向于取值較多的屬性,從而能夠得到與實(shí)際機(jī)車(chē)檢修作業(yè)流程相符的較為合理的檢修步驟。

        表2 機(jī)車(chē)檢修數(shù)據(jù)集

        2 改進(jìn)的ID3算法在機(jī)車(chē)檢修中的實(shí)現(xiàn)

        2.1 實(shí)現(xiàn)方法

        (1)建立機(jī)車(chē)檢修的數(shù)據(jù)集,將數(shù)據(jù)編排小組,也就是建模的過(guò)程;(2)對(duì)數(shù)據(jù)集分析,確定類(lèi)別表示屬性和決策屬性集;(3)生成決策樹(shù),對(duì)決策樹(shù)進(jìn)行適當(dāng)?shù)募糁Α?/p>

        2.2 具體應(yīng)用

        取表2(數(shù)據(jù)集進(jìn)行了預(yù)整理)作為訓(xùn)練集,進(jìn)行決策樹(shù)的建立,將“無(wú)故障”視為正例集,“有故障”視為反例集。選取“故障狀態(tài)”為類(lèi)別表示屬性,進(jìn)行ID3算法的改進(jìn),探討機(jī)車(chē)檢修中頻繁發(fā)生的故障信息,找到重點(diǎn)關(guān)注的機(jī)車(chē)檢修路徑。

        2.2.1 第1級(jí)改進(jìn)

        通過(guò)計(jì)算得到每一屬性的信息增益為:

        “部件”的信息增益:

        IG(部件)=I(r1, r2)-E(部件)=0.0303

        “班組”的信息增益:

        IG(班組)=I(r1, r2)-E(班組)=0.0477

        “小組”的信息增益:

        IG(小組)=I(r1, r2)-E(小組)=0.1954

        “檢修內(nèi)容”的信息增益:

        IG(檢修內(nèi)容)=I(r1, r2)-E(檢修內(nèi)容)=0.9710

        對(duì)機(jī)車(chē)檢修中的相關(guān)屬性,且取值較多的屬性進(jìn)行改進(jìn),屬性“小組”相對(duì)于“部件”“班組”的取值較多,在“小組”熵值公式中加入基本影響因子α=0.5。

        這樣就減小了取值較多屬性對(duì)于生成目標(biāo)決策樹(shù)的影響,避免了大數(shù)據(jù)掩蓋小數(shù)據(jù)的現(xiàn)象。通過(guò)第1級(jí)的改進(jìn),避免了 ID3算法偏向于取值較多的屬性。

        2.2.2 第2級(jí)改進(jìn)

        屬性“檢修內(nèi)容”的信息增益最大,根據(jù)機(jī)車(chē)檢修作業(yè)流程的具體狀況,需要加以改進(jìn),符合實(shí)際情況。檢修評(píng)定因子,對(duì)每一個(gè)屬性的影響是不一樣的?!安考薄ⅰ鞍嘟M”、“小組”都對(duì)檢修作業(yè)有直接的影響,而“檢修內(nèi)容”是檢修的結(jié)果,對(duì)作業(yè)流程來(lái)說(shuō),不會(huì)產(chǎn)生影響。定義“檢修內(nèi)容”的檢修評(píng)定因子β=-∞,得到“檢修內(nèi)容”的信息增益:通過(guò)第2級(jí)改進(jìn),對(duì)屬性不能夠影響作業(yè)流程的環(huán)節(jié),從定義檢修評(píng)定因子上合理進(jìn)行篩選,提高了有效屬性對(duì)于機(jī)車(chē)檢修作業(yè)流程的重要度。

        2.2.3 機(jī)車(chē)檢修決策樹(shù)

        因?yàn)閷傩浴鞍嘟M”的信息增益最大,所以以此作為根節(jié)點(diǎn),建立決策樹(shù)。得到機(jī)車(chē)檢修決策樹(shù),如圖2。

        圖2 機(jī)車(chē)檢修決策樹(shù)

        2.2.4 頻繁故障的提取規(guī)則

        if( 部件為“牽引電動(dòng)機(jī)”、班組為“大電機(jī)”、小組為“組裝組” )then檢修內(nèi)容;

        if( 部件為“轉(zhuǎn)向架”、班組為“臺(tái)車(chē)”、小組為“分解組裝組” )then檢修內(nèi)容;

        if( 部件為“轉(zhuǎn)向架”、班組為“臺(tái)車(chē)”、小組為“輔件組” )then檢修內(nèi)容;

        if( 部件為“柴油機(jī)”、班組為“柴組裝”、小組為“左側(cè)組” )then檢修內(nèi)容;

        if( 部件為“柴油機(jī)”、班組為“柴組裝”、小組為“右側(cè)組” )then檢修內(nèi)容;

        if( 部件為“柴油機(jī)”、班組為“柴組裝”、小組為“底部組” )then檢修內(nèi)容;

        if( 部件為“柴油機(jī)”、班組為“柴組裝”、小組為“中部組” )then檢修內(nèi)容;

        if( 部件為“柴油機(jī)”、班組為“柴分解”、小組為“左側(cè)組” )then檢修內(nèi)容;

        if( 部件為“柴油機(jī)”、班組為“柴分解”、小組為“前后端” )then檢修內(nèi)容。

        2.2.5 頻繁的機(jī)車(chē)檢修路徑

        設(shè)定頻繁系數(shù)為0.2,進(jìn)行剪枝后,從提取規(guī)則中得出符合條件的頻繁機(jī)車(chē)檢修路徑:

        a.大電機(jī)→牽引電動(dòng)機(jī)→組裝組→檢修內(nèi)容;

        b.臺(tái)車(chē)→轉(zhuǎn)向架→組裝分解組→檢修內(nèi)容;

        c.柴組裝→柴油機(jī)→左側(cè)組→檢修內(nèi)容;

        d.柴組裝→柴油機(jī)→底部組→檢修內(nèi)容;

        e.柴分解→柴油機(jī)→前后端→檢修內(nèi)容。

        文章中所選的數(shù)據(jù)集中,這5條路徑是比較繁忙,是機(jī)車(chē)檢修作業(yè)流程中重點(diǎn)作業(yè)路徑,在有限的作業(yè)情況下,可以重點(diǎn)關(guān)注。

        3 結(jié)束語(yǔ)

        建立機(jī)車(chē)檢修數(shù)據(jù)集,找出頻繁發(fā)生的故障信息,達(dá)到“早預(yù)測(cè)、早報(bào)警、早檢修”的目的,使機(jī)車(chē)檢修便捷,提高鐵路運(yùn)輸?shù)陌踩?。本?lái)可以通過(guò)查找歷史數(shù)據(jù)來(lái)人工或計(jì)算機(jī)統(tǒng)計(jì)處理,但沒(méi)有一個(gè)相對(duì)合理的理論解釋?zhuān)ㄟ^(guò)數(shù)據(jù)挖掘的方法進(jìn)行合理分類(lèi),提供了一個(gè)理論性的支撐。

        文章在檢修歷史數(shù)據(jù)中,針對(duì)繁重的機(jī)車(chē)檢修任務(wù),從數(shù)據(jù)挖掘的角度考慮,找出繁忙路徑,特別是在時(shí)間緊張情況下,迅速調(diào)集人力、物力來(lái)完成檢修作業(yè)。這對(duì)機(jī)車(chē)檢修作業(yè)是一種新的探究。

        [1]Quinlan J R. Induction of decision tree[J].Machine Learning,Springer,1986,1(1):81-106.

        [2]曲開(kāi)社,成文麗,王俊紅. ID3算法的一種改進(jìn)算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2003(25):104-107.

        [3]武 森,高學(xué)東,M .巴斯蒂安.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:冶金工業(yè)出版社,2003.

        [4]王銳鋒,趙俊霞,齊金平,等. 鐵路機(jī)車(chē)檢修計(jì)劃生成系統(tǒng)的研究[J]. 計(jì)算機(jī)應(yīng)用與軟件,2009,26(2):175-177.

        [5]李賢鵬,何松華,趙孝敏,等. 改進(jìn)的ID3算法在客戶(hù)流失預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(10):242-244.

        [6]朱 明. 數(shù)據(jù)挖掘[M]. 2版 合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2008,11.

        猜你喜歡
        作業(yè)內(nèi)容
        內(nèi)容回顧溫故知新
        內(nèi)容回顧 溫故知新
        讓人羨慕嫉妒恨的“作業(yè)人”
        內(nèi)容回顧溫故知新
        作業(yè)聯(lián)盟
        快來(lái)寫(xiě)作業(yè)
        作業(yè)
        故事大王(2016年7期)2016-09-22 17:30:08
        主要內(nèi)容
        臺(tái)聲(2016年2期)2016-09-16 01:06:53
        我想要自由
        三十六計(jì)第七計(jì):無(wú)中生有
        国产亚洲精品成人aa片新蒲金| 国产亚洲一区二区三区成人| 亚洲成人中文| 视频二区精品中文字幕| sm免费人成虐漫画网站| 亚洲s色大片在线观看| 摸进她的内裤里疯狂揉她动视频 | 人妻在卧室被老板疯狂进入国产| 国产精品无码专区视频| 天堂在线观看av一区二区三区| 少妇我被躁爽到高潮在线影片 | 91免费国产高清在线| av天堂一区二区三区| 少妇被粗大猛进进出出男女片| 国产亚洲一区二区三区综合片| 亚洲av无码乱码国产一区二区| 无码手机线免费观看| 免费一级国产大片| 久久色悠悠亚洲综合网| 日本激情网站中文字幕| 日韩毛片免费无码无毒视频观看| 免费无码又爽又刺激网站| 在线a人片免费观看国产| 国产一区二区三区涩涩| 蜜桃视频在线免费观看| 日本理伦片午夜理伦片| 亚洲男人的天堂网站| 风流少妇一区二区三区| 少妇激情一区二区三区99| 国产亚洲精品久久久闺蜜| 免费人成再在线观看网站| 麻豆AⅤ精品无码一区二区| 青青草在线公开免费视频| 日韩久久无码免费毛片软件| 极品av麻豆国产在线观看| jlzzjlzz全部女高潮| 亚洲综合国产精品一区二区 | 亚洲日韩精品无码专区网站| 亚洲三级香港三级久久| 久久九九av久精品日产一区免费| 精品国产乱子伦一区二区三|