亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        隱變量對EM算法的影響

        2022-07-14 03:55:44劉芝秀呂鳳姣李運通
        關鍵詞:實驗模型

        劉芝秀,呂鳳姣,李運通

        (1.南昌工程學院 理學院,江西 南昌 330099;2.黃河科技學院 工學部,河南 鄭州 450063;3.陜西鐵路工程職業(yè)技術學院 基礎課部,陜西 渭南 714025)

        引言

        EM算法是由Dempester,Larid和Rubin于1977年提出的,它對含有隱變量的概率模型參數(shù)的估計往往非常有效,是一種改進的極大似然估計方法[1]。文獻[2]給出了EM算法收斂性的有關證明,彰顯了EM算法簡單穩(wěn)定的特點,Neal與Hinton又進一步給出了推廣的GEM算法[3],事實上,該算法引起了許多學者的關注,發(fā)展很快并被廣泛的應用[4-11],且在各種不同的具體應用上產(chǎn)生了許多新的有價值的問題,促使著人們對它的進一步研究。

        EM算法的具體步驟是[12]

        輸入:觀測變量數(shù)據(jù)Y,隱變量數(shù)據(jù)Z,聯(lián)合分布P(Y,Z|θ),條件分布P(Z|Y,θ);

        輸出:模型參數(shù)θ。

        (1)選擇參數(shù)的初值θ(0),開始迭代;

        (2)E步:記θ(i)為第i次迭代參數(shù)θ的估計值,在第i+1次迭代的E步,計算

        Q(θ,θ(i))=Ez[logP(Y,Z|θ)|Y,θ(i)]

        其中P(Z|Y,θ(i))是在給定觀測數(shù)據(jù)Y和當前的參數(shù)估計θ(i)下隱變量數(shù)據(jù)Z 的條件概率分布;

        (3)M步:求使Q(θ,θ(i))極大化的θ,確定第i+1次迭代的參數(shù)的估計值θ(i+1)

        (4)重復第(2)步和第(3)步,直到收斂。

        上述EM算法參數(shù)的初值可以任意選擇,在解決實際問題的過程中,應當注意初值的選擇,嘗試不同的初值,比較后擇優(yōu)取定。然而,在使用EM算法解決實際概率模型的參數(shù)估計問題時,不僅僅初值的選擇有多種,隱變量的選擇也并不是一成不變的,隱變量可以有多種選擇方式,它對EM算法的影響如何?本文通過一個具體的模型探討了這一問題。

        1 驗證模型與具體算法

        所用實驗模型可能產(chǎn)生四種結(jié)果,分別記為A、B、C、D,每種結(jié)果出現(xiàn)的概率分布和試驗多次后發(fā)生的次數(shù)如表1所示。

        其中θ∈(0,1)為分布模型的參數(shù),y1、y2、y3和y4是總共進行y1+y2+y3+y4次實驗后,結(jié)果分別出現(xiàn)A、B、C、D的次數(shù),試求θ的估計值[13-14]。

        表1 概率分布

        1.1 最大似然和牛頓算法

        這個模型的參數(shù)估計并不一定要用含隱變量的EM算法,直接采用極大似然法和牛頓法[15]即可給出估計參數(shù)θ的迭代算法。為便于與選擇不同隱變量的EM算法進行比較,下面先給出用最大似然法和牛頓法估計θ值的迭代公式。

        模型對應的最大似然函數(shù)為

        取對數(shù)似然函數(shù),去掉常數(shù),化簡得

        lnL(θ)=y1ln (2-θ)+y2ln (1-θ)+y3ln (1+θ)+y4ln (θ)

        求導并令導數(shù)等于0得

        (y1+y2+y3+y4)θ3+(-y2-3y3-2y4)θ2+(-y1-2y2+2y3-y4)θ+2y4=0

        使用牛頓法求解上述方程,記上述方程對應的函數(shù)為:

        f(θ)=(y1+y2+y3+y4)θ3+(-y2-3y3-2y4)θ2+(-y1-2y2+2y3-y4)θ+2y4

        則估計參數(shù)θ的迭代公式為

        (1)

        置初值為θ0。

        1.2 含隱變量的EM算法一

        上述z1,z3是為使用EM算法而引入的隱變量,是不可觀測的數(shù)據(jù)。那么,z1服從二項分布:

        (2)

        z3服從二項分布:

        (3)

        引入隱變量后模型對應的似然函數(shù)為

        取對數(shù)似然函數(shù),去掉常數(shù),化簡為

        ln [(1-θ)z1+y2θz3+y4]=(z3+y4)lnθ+(z1+y2)ln (1-θ)

        該結(jié)果中含有不能觀測的隱變量z1和z3,根據(jù)EM算法操作如下

        E步:取初始值θ0,這里的θ0是上述指二項分布中的參數(shù)θ?;喓蟮乃迫缓瘮?shù)(z3+y4)lnθ+(z1+y2)ln (1-θ)是關于z1和z3的隨機變量,且z1和z3服從(1.2)和(1.3)式的二項分布,取期望得

        E[(z3+y4)lnθ+(z1+y2)ln (1-θ)]=(Ez3+y4)lnθ+(Ez1+y2)ln (1-θ)

        (4)

        M步:求Q(θ)的最大值,令其導數(shù)為0得

        解方程得

        令θ0=θi,θ=θi+1,則得估計參數(shù)θ的EM迭代公式

        (5)

        1.3 含隱變量的EM算法二

        下面換一種新的隱變量,從而給出估計參數(shù)θ的EM算法的新迭代公式。

        (6)

        (7)

        則引入新隱變量后,模型對應的似然函數(shù)為

        取對數(shù)似然函數(shù),去掉常數(shù),化簡為

        (z1+y3-z3+y4)lnθ+(y1-z1+y2)ln (1-θ)-z1ln 2

        同樣的根據(jù)EM算法操作

        E步:取初始值θ0,求期望

        E[(z1+y3-z3+y4)lnθ+(y1-z1+y2)ln (1-θ)-z1ln 2]

        =(Ez1+y3-Ez3+y4)lnθ+(y1-Ez1+y2)ln (1-θ)-Ez1ln 2

        (8)

        M步:求Q(θ)的最大值,令其導數(shù)為0得

        解方程得

        則含新隱變量的EM迭代公式為

        (9)

        2 數(shù)據(jù)實驗

        下面我們通過兩組數(shù)據(jù)實驗說明EM算法的收斂性并具體觀察不同隱變量對EM算法的影響。

        2.1 數(shù)據(jù)實驗一

        設已經(jīng)進行了(y1+y2+y3+y4=)197次測試,四個實驗結(jié)果出現(xiàn)的次數(shù)分別為(y1=)75,(y2=)18,(y3=)70,(y4=)34,下面計算θ的估計值。

        將y1=75,y2=18,y3=70,y4=34代入(1)、(5)和(9)等迭代公式分別得

        (10)

        (11)

        (12)

        取不同初值分別按(10)-(12)式進行迭代,借助計算機執(zhí)行,迭代計算的結(jié)果如表2所示。

        2.2 數(shù)據(jù)實驗二

        設已經(jīng)進行了(y1+y2+y3+y4=)2081次測試,四個實驗結(jié)果出現(xiàn)的次數(shù)分別為(y1=)780,(y2=)263,(y3=)781,(y4=)257,下面計算θ的估計值。

        將y1=780,y2=263,y3=781,y4=257代入(1)、(5)和(9)等迭代公式分別得

        (13)

        (14)

        (15)

        取不同初值分別按(13)、(14)和(15)式進行迭代,借助計算機執(zhí)行,迭代計算的結(jié)果如表3所示。

        3 分析與結(jié)論

        從數(shù)據(jù)實驗的結(jié)果表2和表3可知,兩種不同隱變量所對應的EM算法都是穩(wěn)定可靠的,即使初值的選擇不同,亦能使得EM算法收斂(見表2和表3第三和四列);而通常的最大似然和牛頓法雖然比EM算法快4至12倍(見表2和表3第三列,34/5,63/5,33/5,61/5,33/5,63/5,34/8,65/8,32/5,62/5,29/3,54/3,32/5,61/5的平均值約為9.63),但卻對初值非常敏感,初值選擇不恰當,甚至會導致最大似然和牛頓法不收斂。

        表2 不同迭代的實驗結(jié)果

        表3 不同迭代的實驗結(jié)果

        另外,從(4)和(8)式可以看到,隱變量選擇的不同直接影響Q函數(shù)的形式,由此而得到的迭代公式自然不同,其收斂速度可能差別較大,服從(6)和(7)式分布的隱變量所對應的EM算法比服從(2)和(3)式的隱變量所對應的EM算法的收斂速度要將近慢一倍(見表2.1和2.2第三列,64/34,63/34,61/33,63/33,65/34,64/33,62/32,54/29,61/32,62/33的平均值約為1.86),因此可以推斷,隱變量的選擇對于EM算法的收斂速度有較大的影響。

        猜你喜歡
        實驗模型
        一半模型
        記一次有趣的實驗
        微型實驗里看“燃燒”
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        做個怪怪長實驗
        3D打印中的模型分割與打包
        NO與NO2相互轉(zhuǎn)化實驗的改進
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        99精品国产一区二区三区不卡| 久久精品国产亚洲av沈先生| 国产精品一区二区三区播放| 国产欧美亚洲精品第一页| 国产无遮挡又黄又爽又色| 国产精品久久中文字幕第一页| 亚洲天堂av路线一免费观看| 麻豆国产一区二区三区四区| 日本一卡2卡3卡四卡精品网站 | 欧美熟妇性xxx交潮喷| 人人妻人人澡人人爽人人精品电影| 欧美成人a视频免费专区| 一本大道久久a久久综合精品| 日韩av无码一区二区三区不卡| 欧美成a人片在线观看久| 无码国产日韩精品一区二区| 亚洲人成伊人成综合久久| 亚洲av成人无码一区二区三区在线观看 | 中文字幕乱码亚洲无限码| 日韩毛片无码永久免费看 | 99久久精品久久久| 亚州中文热码在线视频| 国产欧美一区二区三区在线看| 久久精品国产日本波多麻结衣| 熟女人妻中文字幕一区| 色熟妇人妻久久中文字幕 | 成人黄色网址| 中文字幕第一页亚洲观看| 国产尤物自拍视频在线观看 | 国产高清在线精品一区αpp| 蜜桃视频在线在线观看| 国产亚洲一区二区在线观看| 中文字幕+乱码+中文字幕无忧| 在线观看极品裸体淫片av| 91九色人妻精品一区二区三区| 精品水蜜桃久久久久久久| 久久精品国产亚洲一区二区| 成人水蜜桃视频在线观看| 国产美女精品视频线免费播放软件 | 亚洲中文字幕久久在线| 最近免费mv在线观看动漫|