亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ID3算法的煤礦技術(shù)創(chuàng)新能力研究

        2014-06-09 12:33:05雷書彧趙學軍
        關(guān)鍵詞:決策樹增益數(shù)據(jù)挖掘

        王 瑛,雷書彧,趙學軍

        (中國礦業(yè)大學 (北京)機電與信息工程學院,北京 100083)

        基于ID3算法的煤礦技術(shù)創(chuàng)新能力研究

        王 瑛,雷書彧,趙學軍

        (中國礦業(yè)大學 (北京)機電與信息工程學院,北京 100083)

        煤礦的技術(shù)創(chuàng)新能力是評價綠色礦山的關(guān)鍵指標之一,對于完善礦產(chǎn)資源管理共同責任機制、全面規(guī)范礦產(chǎn)資源開發(fā)秩序、促進科學發(fā)展新機制具有重要意義。論文綜合綠色礦山建設(shè)與評價的煤礦企業(yè)數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)給出一個比較合理的評價規(guī)則,通過評價規(guī)則構(gòu)建煤礦技術(shù)創(chuàng)新能力評價模型。其主要方法及流程是計算技術(shù)創(chuàng)新能力評價指標的信息熵,以其數(shù)值大小作為分類節(jié)點排序依據(jù),通過合理剪枝形成決策樹,完整的決策樹便對應(yīng)完整的評價規(guī)則。將原始數(shù)據(jù)帶入決策規(guī)則,得出準確評價,并驗證了評價規(guī)則的正確性。

        技術(shù)創(chuàng)新能力;ID3算法;決策樹

        0 引言

        我國正處于工業(yè)化、城鎮(zhèn)化發(fā)展的關(guān)鍵階段,資源需求剛性上升,資源環(huán)境壓力日益增大,加強生態(tài)文明制度建設(shè),把資源消耗、環(huán)境損害、生態(tài)效益納入經(jīng)濟社會發(fā)展評價體系,建立體現(xiàn)生態(tài)文明要求的目標體系、考核辦法、獎懲機制是立足國內(nèi)提高能源資源保障能力的現(xiàn)實選擇,對我國經(jīng)濟社會發(fā)展具有十分重要的現(xiàn)實意義和深遠的戰(zhàn)略意義。

        然而多年來,綠色礦山評價缺乏統(tǒng)一標準,評價主管決策因素太大,有失公平。因此,國土資源部提出創(chuàng)建一個統(tǒng)一的綠色礦山評價標準,而礦山企業(yè)的技術(shù)創(chuàng)新能力作為重要的評價內(nèi)容列入其中。

        在此背景下,本文專門研究礦山企業(yè)中煤礦的技術(shù)創(chuàng)新能力評價體系,運用數(shù)據(jù)挖掘技術(shù)中的ID3決策樹算法,在很大程度上提高了評價準確度,為評選綠色礦山企業(yè)提供了可靠的依據(jù),同時也為煤礦企業(yè)在技術(shù)創(chuàng)新領(lǐng)域的效果做出分析,便于進一步改進提高。

        1 理論與方法

        1.1 ID3算法模型

        ID3算法是Quinlan于1979年提出的一種經(jīng)典的決策樹算法,此算法將屬性的信息增益作為各級結(jié)點的屬性選擇標準。在幾種決策樹算法中,ID3算法可以說是最有影響力的。為了實現(xiàn)達到以最小信息量最大程度對測試數(shù)據(jù)分類目的,樣本劃分的測試屬性要選擇信息增益最大的屬性。該算法內(nèi)容概括如下:

        樹從訓練樣本的某單個結(jié)點開始,若樣本都屬于同一類,那么該結(jié)點成為樹葉,分類結(jié)束,用該類標號。如果樣本屬性不屬于同一個類,算法使用信息增益度量作為啟發(fā)信息,來計算能將樣本最好地分類的屬性。計算出的屬性便是該節(jié)點的測試屬性。在此算法中,所有的屬性都是要分類的,即本算法只適用于離散值,如果是連續(xù)屬性的話必須進行離散化。對每個已知的測試屬性值都要創(chuàng)建一個分支,以此來劃分樣本。根據(jù)以上步驟,遞歸此算法形成樣本判定樹。每個分支上的屬性只會出現(xiàn)一次,一旦使用某屬性對樣本集劃分后,此屬性在這個分支上就不會出現(xiàn)了。

        遞歸劃分步驟只要出現(xiàn)下列條件便會停止:①所有屬性都以完成對樣本的劃分;②所有樣本屬于同一類;③某個測試屬性值上已經(jīng)沒有樣本。

        測試屬性的取值是樣本集的劃分依據(jù),樣本集將劃分為多少子樣本集取決于測試屬性有多少不同取值。以信息增益度量作為選擇測試屬性的依據(jù),屬性的信息增益越大就越重要,也就更靠近根節(jié)點,所以要選擇具有最高信息增益的屬性作為當前結(jié)點的測試屬性。由于采用此信息理論方法可以使一個對象分類的期望測試數(shù)目最小,以保證能找到一棵簡單的樹。

        設(shè)S是s個數(shù)據(jù)樣本的集合,類標號屬性有m個不同值,并定義 n個不同類 Ci(i=1,2,...,n)。設(shè)Si是類中的樣本數(shù),則對一個樣本分類所需的期望信息為:

        其中,pi—任意樣本屬于的概率,用Si/S表示。設(shè)屬性A具有v個不同值{a1,a2,...av},可以用屬性A將S劃分為v個子集{S1,S2,...,Sv},在屬性A上,Si中的樣本的取值為aj。設(shè)子集中類Ci的樣本數(shù)為sij,則屬性A的熵可以這樣計算:

        Gain(A)=I(s1,s2,...sm)-E(A)

        通過上述公式計算每個屬性的信息增益,選擇具有最高信息增益的屬性作為集第一個屬性,即根節(jié)點的決策屬性,當創(chuàng)建結(jié)點之后,對屬性的每個值分別創(chuàng)建分枝,劃分樣本。

        引入信息增益的概念是ID3算法的一大特點。該算法應(yīng)用簡單,基礎(chǔ)理論清晰。該算法的計算時間是結(jié)點個數(shù)、例子個數(shù)和特征個數(shù)之積的線性函數(shù)。由于目標函數(shù)一定在搜索空間中,而搜索空間又是完全的假設(shè)空間,所以此算法一定有解。該算法不是像候選剪除算法逐個地考慮訓練例,而是全盤使用訓練數(shù)據(jù),這樣的優(yōu)點是可以抵抗噪音,利用全部訓練例的統(tǒng)計性質(zhì)進行決策。

        總的來說,ID3算法是一種具有實用價值的學習算法,它的學習能力較強,基礎(chǔ)理論清晰,算法較簡單,是機器學習和數(shù)據(jù)挖掘領(lǐng)域中的一個經(jīng)典方法。

        1.2 ID3算法應(yīng)用

        構(gòu)建煤礦技術(shù)創(chuàng)新能力評價數(shù)據(jù)集。根據(jù)煤礦技術(shù)創(chuàng)新能力評價指標體系,選擇了11家煤礦的技術(shù)創(chuàng)新數(shù)據(jù),并將其整理,如表1所示。

        表1 煤礦技術(shù)創(chuàng)新基礎(chǔ)數(shù)據(jù)

        由于分類屬性太多,而當前的訓練集數(shù)據(jù)太少,若按照當前分類建模,準確率會很低,在實驗后得到的準確率為9.0909%,不符合要求。若根據(jù)指標權(quán)值合并劃分屬性,將原先的22個屬性合并到4個。并用等寬間距法將每個屬性五等分,由高到低劃分為5個級別,對原始數(shù)據(jù)進行數(shù)據(jù)處理,得到處理后的數(shù)據(jù)集如表2所示。

        對訓練集進行標準化后,用ID3算法進行分類并計算,得到結(jié)果如圖1所示。從圖中可以看到,通過對屬性的合并以及對原始訓練集數(shù)據(jù)進行相應(yīng)轉(zhuǎn)換后,再次運用ID3算法得到的分類模型比之前的分類準確率高出很多,達到63.6364%,這說明對于當前訓練集的劃分屬性改進是比較正確的,也得到了更為理想的結(jié)果。根據(jù)上圖中的分類規(guī)則創(chuàng)建對應(yīng)的決策樹。如圖2所示。

        表2 劃分為五個級別的處理數(shù)據(jù)

        圖1 計算結(jié)果

        圖2 數(shù)據(jù)決策樹

        解析上圖的決策規(guī)則為:

        以上為最終得到的分類規(guī)則,即評價模型,通過此模型可以對其他實例進行劃分,得到相應(yīng)的分類。

        2 結(jié)論

        本論文運用數(shù)據(jù)挖掘中ID3算法,通過對煤礦技術(shù)創(chuàng)新能力數(shù)據(jù)研究分析,產(chǎn)生決策規(guī)則,通過對決策規(guī)則進行驗證,正確率較高,基本能夠反映煤礦的技術(shù)創(chuàng)新能力。

        由于訓練集數(shù)據(jù)量小,采用了合并指標的辦法來減少劃分屬性,其中引入的專家權(quán)值造成了一定的主觀影響。

        [1]陳燕.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:清華大學出版社,2010.

        [2]王宏云.基于數(shù)據(jù)挖掘的煤礦安全監(jiān)測系統(tǒng)研究[D].遼寧工程技術(shù)大學,2009,12.

        [3]彭蓬.基于神經(jīng)網(wǎng)絡(luò)的煤礦企業(yè)技術(shù)創(chuàng)新能力評價及經(jīng)濟學分析[J].煤礦現(xiàn)代化,2008,87.

        [4]馮陳雷.基于決策樹方法的煤炭企業(yè)效績評價研究[D].山東科技大學,2007,5.

        [5]J Ciurana,G.Quintana,M.L.Garcia-Romeu.Estimating the cost of vertical high-speed machining centers,a comparison between multiple regression analysis and the neural networks approach[J].International Journal of Production Economics,2008,1.

        [6]王濤,李舟軍,顏躍進,陳火旺.數(shù)據(jù)流挖掘分類技術(shù)綜述[J].計算機研究與發(fā)展,2007,11.

        Research on Coal Mining Technological Innovative Ability Based on ID3 Algorithm

        WANG Ying,LEI Shu-Yu,ZHAO Xue-Jun
        (School of Mechanical Electronic&Information,China University of Mining&Technology(Beijing),Beijing 100083,China)

        The technological innovative ability of coal mine is one of the key indicators for green mine evaluation.It is of great significance to improving the shared responsibility mechanism of mineral resources management,total normalization on mineral resources development order and promoting scientific development new mechanisms.The paper give a reasonable evaluation rule through synthesis of the green mine construction and evaluation of coal mine enterprise data und using data mining.Then through the evaluation rule a coal mining technological innovation ability evaluation model can be built.Its main method process is that calculating the information entropy technology innovation ability evaluation indexes,according to the classification node order by the numerical size and through a decision tree’s reasonable pruning,finally a complete decision tree can correspond to the complete evaluation rule.Taking original data into the decision rule and obtaining the accurate evaluation,the correctness of the evaluation rule can be verified.

        technological innovative ability;ID3 algorithm;decision tree

        F4

        :Adoi:10.3969/j.issn.1002-6673.2014.03.002

        1002-6673(2014)03-003-03

        2014-03-31

        項目來源:2012年度國土資源公益性行業(yè)科研專項(綠色煤炭礦山標準研究-201211003)

        王瑛(1972-),女,工程師,畢業(yè)于北京師范大學,目前就職于中國礦業(yè)大學(北京)機電與信息工程學院。

        猜你喜歡
        決策樹增益數(shù)據(jù)挖掘
        基于增益調(diào)度與光滑切換的傾轉(zhuǎn)旋翼機最優(yōu)控制
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于單片機的程控增益放大器設(shè)計
        電子制作(2019年19期)2019-11-23 08:41:36
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        基于Multisim10和AD603的程控增益放大器仿真研究
        電子制作(2018年19期)2018-11-14 02:37:02
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于決策樹的出租車乘客出行目的識別
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        手机看片福利日韩国产| 亚洲熟妇av一区| 老熟妇仑乱视频一区二区| 一国产区在线观看| 亚洲av成人一区二区三区色 | 中美日韩在线一区黄色大片| 欧美日韩一区二区三区在线观看视频 | 亚洲一区二区在线视频播放 | 亚洲国产一区二区三区精品| 国产乡下三级全黄三级| 熟女俱乐部五十路二区av| 一区二区无码精油按摩| 日本按摩偷拍在线观看| 免费超爽大片黄| 黄 色 人 成 网 站 免 费| 国产日产亚洲系列av| 久久精品国产亚洲av大全相关| 国产熟妇一区二区三区网站| 日本在线观看一区二区三| 99精品国产一区二区三区a片| 久久亚洲国产中v天仙www| 国内精品久久人妻性色av| 亚洲精品中文字幕一二三区| 久久精品国产精品国产精品污| 四虎成人在线| 国产精品久久久看三级| 亚洲国产亚综合在线区| 麻豆高清免费国产一区| 久久国产精品免费一区六九堂| 中文字幕亚洲精品专区| 亚洲精品tv久久久久久久久久| 国内少妇自拍区免费视频| 玩弄极品少妇被弄到高潮| 中文字幕综合一区二区| 牛牛在线视频| 精品国产高清a毛片无毒不卡| 被驯服人妻中文字幕日本| 国产一区二区三区仙踪林| 在线综合亚洲欧洲综合网站| 日韩久久久黄色一级av| 久久99精品久久只有精品|