亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        樸素貝葉斯分類算法淺析

        2017-10-23 06:35:27
        福建質(zhì)量管理 2017年17期
        關(guān)鍵詞:樸素貝葉斯實例

        (山東科技大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院 山東 青島 266590)

        樸素貝葉斯分類算法淺析

        秦懷強

        (山東科技大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院山東青島266590)

        貝葉斯分類是一類分類算法的總稱,這類算法均以貝葉斯定理為基礎(chǔ),故統(tǒng)稱為貝葉斯分類。而樸素樸素貝葉斯分類是貝葉斯分類中最簡單和常見的一種分類方法。它之所以叫樸素貝葉斯分類,關(guān)鍵在于它的假設(shè)條件:一個實例的特征屬性值在給定類別值的條件下是相互獨立的。

        樸素貝葉斯;分類;訓(xùn)練集;特征屬性值1分類問題綜述

        一、對于分類問題可以做如下的定義

        已知集合C={y1,y2,…,yn}和I={x1,x2,…,xm,…},確定映射規(guī)則y=f(x),使得任意的xi∈I有且僅有一個yi∈C使得yj=f(xi)成立。其中C叫做類別集合,每一個元素是一個類別,而I叫做項集合,其中每一個元素是一個待分類項,f叫做分類器。分類算法的任務(wù)就是構(gòu)造分類器f。

        這里要著重強調(diào),分類問題往往采用經(jīng)驗性方法構(gòu)造映射規(guī)則,即一般情況下的分類問題缺少足夠的信息來構(gòu)造完全正確的映射規(guī)則,而是通過對經(jīng)驗數(shù)據(jù)的學(xué)習(xí)實現(xiàn)一定概率意義上正確的分類,因此所訓(xùn)練出的分類器并不是一定能將每個待分類項準(zhǔn)確映射到其分類,分類器的質(zhì)量與分類器構(gòu)造方法、待分類數(shù)據(jù)的特性以及訓(xùn)練樣本數(shù)量等諸多因素有關(guān)[1]。

        二、樸素貝葉斯分類的基礎(chǔ)-貝葉斯定理

        首先,P(A|B)表示事件B已經(jīng)發(fā)生的前提下,事件A發(fā)生的概率,其基本的求解公式為(1)。

        (1)

        貝葉斯定理之所以有用,是因為生活中經(jīng)常遇到這種情況:可以很容易直接得出P(A|B),而P(B|A)則很難直接得出,而有時后者則是需要的,貝葉斯定理就打通了從P(A|B)獲得P(B|A)的道路。下面給出貝葉斯定理如公式(2)所示。

        (2)

        三、樸素貝葉斯分類

        (一)樸素貝葉斯分類的原理

        樸素貝葉斯分類算法是貝葉斯分類算法的一種,之所以是樸素的很大程度上是因為它的假設(shè)條件:一個實例在給定類別值的條件下各特征屬性值間是相互獨立的[2]。樸素貝葉斯分類算法的定義如下所示:

        給定一個訓(xùn)練集D={X1,X2,…,Xt},它里面有t個訓(xùn)練實例,針對于每個訓(xùn)練實例X={a1,a2,…,an},它里面有n個屬性值,并且被類別標(biāo)簽y∈Y所標(biāo)記。則一個測試實例X,它的類別標(biāo)簽為y的概率為公式(3)。

        (3)

        又因為樸素貝葉斯定理的假設(shè)條件:一個訓(xùn)練實例在給定類別值的條件下特征屬性值間是相互獨立的??梢缘玫焦?4)。

        (4)

        結(jié)合公式(3)和(4)可以得到樸素貝葉斯分類器的公式如(5)所示。

        (5)

        (二)估計類別下特征屬性劃分的條件概率和拉普拉斯平滑

        由(一)節(jié)可以看出,計算各個劃分的條件概率

        P(ai|y)是樸素貝葉斯分類的關(guān)鍵性步驟,當(dāng)特征屬性為離散值時,只要很方便的統(tǒng)計訓(xùn)練樣本中各個劃分在每個類別中出現(xiàn)的頻率即可用來估計P(ai|y),下面重點討論特征屬性是連續(xù)值的情況。

        當(dāng)特征屬性為連續(xù)值時,通常假定其服從高斯分布即公式(6)。

        (6)

        因此只要計算出訓(xùn)練集中各個類別中此特征項劃分的各均值和標(biāo)準(zhǔn)差,代入公式(6)即可得到需要的估計值。

        另一個需要討論的問題是當(dāng)P(ai|y)=0時,這會令分類器質(zhì)量大大降低。為了解決這個問題,可以引入拉普拉斯校準(zhǔn),如公式(7)和(8)所示。

        (7)

        (8)

        其中F(ai,y)指的是訓(xùn)練集中,有特征屬性值ai和類別值y的訓(xùn)練實例的數(shù)目,N(Y)指的是類別值Y的種類數(shù)。

        [1]袁梅宇.數(shù)據(jù)挖掘與機器學(xué)習(xí)WEKA應(yīng)用技術(shù)與實踐[M].北京,清華大學(xué)出版社2014:64-64

        [2]Friedman N,Geiger D,Goldszmidt M.Bayesian network classifiers[J].Machine Learning,1997,29:131-163

        秦懷強(1992-),男,漢,山東省棗莊,碩士,山東科技大學(xué),方向數(shù)據(jù)挖掘。

        猜你喜歡
        樸素貝葉斯實例
        隔離樸素
        樸素的安慰(組詩)
        他是那樣“笨拙”和樸素——30多年后,我們?yōu)槭裁催€需要讀路遙?
        最神奇最樸素的兩本書
        貝葉斯公式及其應(yīng)用
        基于貝葉斯估計的軌道占用識別方法
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        完形填空Ⅱ
        完形填空Ⅰ
        IIRCT下負(fù)二項分布參數(shù)多變點的貝葉斯估計
        国产99页| 无码尹人久久相蕉无码| 国产一区二区av免费在线观看 | 天堂网在线最新版www| 精品无码久久久久成人漫画| 在线欧美精品二区三区| 国产成人亚洲合色婷婷| 国产精品一区二区三区免费视频| 久激情内射婷内射蜜桃| 人妻无码视频| 国产av一区二区内射| 色大全全免费网站久久| 在线看片免费人成视频电影| 国产欧美日韩a片免费软件| 国产成人精品cao在线| 女同恋性吃奶舌吻完整版| 正在播放强揉爆乳女教师| 精品欧美一区二区在线观看| 久久迷青品着产亚洲av网站| 大香蕉av一区二区三区| 性欧美老人牲交xxxxx视频| 久久九九有精品国产尤物| 无码天堂在线视频| 国产成人av区一区二区三| 隔壁老王国产在线精品| 精品人妻系列无码一区二区三区| 国产强伦姧在线观看| 成人av综合资源在线| 天天爽夜夜爱| 亚洲成av人片天堂网九九| 国产西西裸体一级黄色大片| 国产91成人精品高潮综合久久| 性高朝大尺度少妇大屁股| 中文字幕第八页| 最新国产精品国产三级国产av | 国产一区二区在三区在线观看| 国产人妻高清国产拍精品| www插插插无码免费视频网站| 国产粉嫩嫩00在线正在播放| 99久久99久久久精品蜜桃| 国产一卡2卡3卡四卡国色天香|