亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        隱馬爾可夫多元線性回歸模型及其貝葉斯估計(jì)

        2019-04-22 11:22:58劉鶴飛
        統(tǒng)計(jì)與決策 2019年6期
        關(guān)鍵詞:模型

        劉鶴飛

        (曲靖師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,云南 曲靖 655011)

        0 引言

        回歸模型是最經(jīng)典的統(tǒng)計(jì)學(xué)模型,其廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、心理學(xué)、教育學(xué)、醫(yī)學(xué)等領(lǐng)域。從最簡單的一元線性回歸到多元線性回歸,再到非線性回歸、廣義線性回歸,眾多研究者對回歸模型進(jìn)行了深入的研究、探索和各種改進(jìn)。

        隱馬爾可夫模型是一種基于隨機(jī)過程的統(tǒng)計(jì)模型。近年來,隱馬爾可夫模型在各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用和發(fā)展。在經(jīng)濟(jì)管理領(lǐng)域,利用隱馬爾可夫模型處理異質(zhì)面板數(shù)據(jù),在生物醫(yī)學(xué)領(lǐng)域,利用隱馬爾可夫模型對DNA序列的分布進(jìn)行推斷[1];在人工智能領(lǐng)域,利用隱馬爾可夫模型進(jìn)行語音識別[2]、圖像處理等。

        隱馬爾可夫模型是由兩個(gè)隨機(jī)過程構(gòu)成[3]。一個(gè)是狀態(tài)轉(zhuǎn)移序列,它是一條單純的馬爾可夫鏈,另一條是與狀態(tài)對應(yīng)的觀測序列。在實(shí)際問題中,我們只能看到觀測變量的集合,無法看到觀測狀態(tài)序列的集合。隱馬爾可夫模型的研究內(nèi)容就是根據(jù)可觀測的序列集合去推斷不可觀測的狀態(tài)轉(zhuǎn)移特征以及每個(gè)狀態(tài)下的分布信息[4]。

        本文將隱馬爾可夫模型與回歸模型相結(jié)合,提出隱馬爾可夫回歸模型的概念。這種模型在許多領(lǐng)域都有實(shí)際的應(yīng)用,例如,在經(jīng)濟(jì)領(lǐng)域,由于股票指數(shù)與經(jīng)濟(jì)增速、CPI指數(shù)、銀行利率等指標(biāo)都有線性相關(guān)關(guān)系,并且可以建立這幾個(gè)自變量與因變量(股票價(jià)格指數(shù))之間的多元線性回歸模型。但是,股票市場處于牛市和熊市的不同狀態(tài)時(shí),因變量和自變量之間的回歸關(guān)系是不同的。此外,不同狀態(tài)之間也是可以相互轉(zhuǎn)化的,研究者還想了解不同的狀態(tài)之間相互轉(zhuǎn)化的關(guān)系。隱馬爾可夫多元線性回歸模型就是研究不同狀態(tài)之間的相互轉(zhuǎn)化規(guī)律以及每個(gè)狀態(tài)下因變量和自變量之間回歸關(guān)系的模型。

        本文將以多元線性回歸模型為例,詳細(xì)介紹隱馬爾可夫多元線性回歸模型的數(shù)學(xué)定義,推導(dǎo)用貝葉斯方法對模型的參數(shù)進(jìn)行估計(jì)的理論過程。最后利用MCMC算法模擬參數(shù)的后驗(yàn),用后驗(yàn)均值作為參數(shù)的估計(jì)值,并與模型參數(shù)的真值進(jìn)行比較,檢驗(yàn)該方法估計(jì)的可靠性。

        1 模型描述

        假設(shè)隱狀態(tài)的轉(zhuǎn)移過程滿足以下馬爾可夫鏈的條件:

        其中u=1,2,…,K;s=1,2,…,K;t=2,3,…,T。

        這里,aus是從前一個(gè)時(shí)間點(diǎn)的隱狀態(tài)u向后一個(gè)時(shí)間點(diǎn)的隱狀態(tài)s的轉(zhuǎn)移概率。我們稱所有可能的隱狀態(tài)轉(zhuǎn)移概率構(gòu)成的矩陣為隱狀態(tài)轉(zhuǎn)移概率矩陣,記為:

        在給定隱狀態(tài)的條件下,描述自變量與因變量關(guān)系的多元線性回歸模型定義為:

        其中,β是P維回歸系數(shù)向量,εk是模型的誤差,且:

        2 貝葉斯推斷原理

        將隱狀態(tài)轉(zhuǎn)移概率矩陣記為A;將多元線性回歸模型中的參數(shù)(βk,)記為θ;將隱狀態(tài)向量記為Z。則該模型的貝葉斯推斷問題為,其中D=(Y,X)。

        馬爾可夫鏈蒙特卡洛算法模擬過程的具體步驟如下:

        (1)更新隱狀態(tài)Z;

        (2)更新潛變量A;

        (3)更新模型參數(shù)θ。

        其中,更新模型參數(shù)θ又可以分為兩小步:

        (1)更新正態(tài)分布的方差;

        (2)更新多元線性回歸系數(shù)βk。

        每一步更新參數(shù),都是借助于Gibbs抽樣[6]和MH算法[7]。這需要對每個(gè)參數(shù)設(shè)定其先驗(yàn)分布,并推導(dǎo)出后驗(yàn)分布。

        3 先驗(yàn)分布

        貝葉斯理論認(rèn)為,每一個(gè)參數(shù)都是一個(gè)隨機(jī)變量[8]。因此,在進(jìn)行貝葉斯推斷時(shí),必須事先為每一個(gè)參數(shù)都選擇一個(gè)合適的先驗(yàn)分布。Robert[9]在研究隱馬爾可夫正態(tài)模型時(shí),選擇對稱的狄尼克萊分布作為轉(zhuǎn)移概率矩陣每一行的先驗(yàn)分布。Minka[10]在研究線性回歸模型參數(shù)的貝葉斯估計(jì)時(shí),選擇多元正態(tài)分布和倒伽瑪分布作為線性回歸模型參數(shù)的先驗(yàn)分布。借鑒以上經(jīng)驗(yàn),本文為模型中所有參數(shù)選擇的先驗(yàn)分布如下:

        其中,Ak表示轉(zhuǎn)移概率矩陣的第k行,D表示狄尼克萊分布,α是狄尼克萊分布的超參數(shù);μ0k,Λ0k是多元正態(tài)分布中的超參數(shù),Inv-Gamma表示倒伽瑪分布,是倒伽瑪分布中的超參數(shù)。

        4 后驗(yàn)推斷

        貝葉斯后驗(yàn)推斷的主要任務(wù)是利用樣本的觀測信息和參數(shù)的先驗(yàn)信息推導(dǎo)出參數(shù)的后驗(yàn)信息[11]。對于本文的隱馬爾可夫多元線性回歸模型來說,即也就是要根據(jù)觀測變量集合和模型參數(shù)的先驗(yàn)分布去推斷模型的隱狀態(tài)、概率轉(zhuǎn)移矩陣、多元回歸模型的參數(shù)。其中,轉(zhuǎn)移概率矩陣A、多元回歸模型的系數(shù)β是隱馬爾可夫多元線性回歸模型中的參數(shù),是需要進(jìn)行估計(jì)的對象。由于這個(gè)分布的復(fù)雜性,本文使用了MCMC方法來進(jìn)行后驗(yàn)?zāi)M,用后驗(yàn)均值作為相關(guān)參數(shù)的估計(jì)。這就需要相關(guān)參數(shù)的全條件后驗(yàn)分布。

        其中,πk是在轉(zhuǎn)移概率矩陣A的作用下,隱狀態(tài)達(dá)到穩(wěn)定時(shí),隱狀態(tài)k的穩(wěn)定概率;是觀測變量在隱狀態(tài)k下的似然函數(shù)。

        下面推導(dǎo)在隱狀態(tài)確定的條件下,多元線性回歸模型參數(shù)(βk,)的全條件后驗(yàn)分布。

        記所有隱狀態(tài)為k的觀測數(shù)據(jù)集合為Dk,所有隱狀態(tài)為k的因變量集合記為Yk,所有隱狀態(tài)為k的自變量的集合為Xk。

        在此記法下,Yk的似然函數(shù)可以表示為:

        根據(jù)條件概率的計(jì)算公式可得:

        于是,可以把參數(shù)(βk,的后驗(yàn)分布看成一個(gè)多元正態(tài)分布和一個(gè)倒伽瑪分布的乘積,它的具體形式為:

        為簡單起見,可將該后驗(yàn)分布看成如下兩部分:

        則βk和這兩個(gè)參數(shù)的后驗(yàn)分布分別為N,即參數(shù)為μn和的多元正態(tài)分布和參數(shù)為an和bn的倒伽瑪分布。其中:

        5 實(shí)證模擬

        為了檢驗(yàn)上文所推導(dǎo)的模型參數(shù)的貝葉斯估計(jì)方法,這里將事先給定模型參數(shù)A和θ的真實(shí)值。根據(jù)概率轉(zhuǎn)移矩陣A生成一個(gè)隱狀態(tài)序列集合,再根據(jù)每個(gè)觀測點(diǎn)的隱狀態(tài)取值和對應(yīng)于該隱狀態(tài)的多元線性模型參數(shù)的值,生成每一個(gè)觀測時(shí)間點(diǎn)的觀測向量。然后利用所有的觀測變量集合,根據(jù)所推導(dǎo)的后驗(yàn)分布,用MCMC算法對模型的參數(shù)進(jìn)行后驗(yàn)?zāi)M。取后驗(yàn)均值作為模型中參數(shù)的估計(jì)值。最后將參數(shù)的貝葉斯估計(jì)結(jié)果與事先給定的真實(shí)值進(jìn)行比較,觀察估計(jì)的效果。

        取隱狀態(tài)的個(gè)數(shù)K=2,則隱狀態(tài)的概率轉(zhuǎn)移矩陣是一個(gè)二階方陣,令:

        設(shè)每個(gè)隱狀態(tài)下的多元線性回歸模型都有3個(gè)自變量,具體為:

        模型中,取觀測時(shí)間點(diǎn)總數(shù)T=200,則生成的觀測變量集合是一個(gè)4×200的二維數(shù)組。先驗(yàn)分布中超參數(shù)的取值分別為:,其中I3表示三階單位矩陣

        使用MCMC算法進(jìn)行后驗(yàn)?zāi)M時(shí),取迭代總次數(shù)為5000,去掉前面3000次的迭代結(jié)果,用后面2000次的后驗(yàn)均值作為參數(shù)的估計(jì)。各參數(shù)的真實(shí)值與估計(jì)值如表1所示。

        表1 模型參數(shù)的真值與估計(jì)值

        6 結(jié)論

        本文介紹了隱馬爾可夫線性回歸模型,推導(dǎo)了隱馬爾可夫多元線性回歸模型參數(shù)的貝葉斯估計(jì)方法。并且通過實(shí)證模擬,將模型參數(shù)的貝葉斯估計(jì)結(jié)果與事先設(shè)定的模型參數(shù)的真實(shí)值進(jìn)行比較,發(fā)現(xiàn)估計(jì)效果良好,這說明本文給出的模型參數(shù)的貝葉斯估計(jì)方法是可靠的。可以用隱馬爾可夫多元線性回歸模型來研究含有多個(gè)狀態(tài)的自變量與因變量的關(guān)系模型,分析不同狀態(tài)之間的轉(zhuǎn)化關(guān)系,以及每個(gè)狀態(tài)下多個(gè)自變量與因變量之間的線性回歸關(guān)系。

        本文僅以簡單的多元線性回歸模型為例介紹了隱馬爾可夫線性回歸模型,未來還可以研究隱馬爾可夫非線性回歸模型等更復(fù)雜的模型。此外,還可以研究隱狀態(tài)個(gè)數(shù)未知情形下的隱馬爾可夫回歸模型,利用貝葉斯因子、可逆跳躍MCMC算法等方法對隱狀態(tài)個(gè)數(shù)進(jìn)行模型選擇。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        无码精品黑人一区二区三区| 国产在线一区二区av| 国产精品美女久久久免费| 国产成人精品123区免费视频| 亚洲精品第一页国产精品| 久久人妻av无码中文专区| 国产午夜精品久久精品| 伊人久久大香线蕉午夜av| 搡老熟女中国老太| 国产哟交泬泬视频在线播放| 亚洲精品区二区三区蜜桃| 久草视频这里只有精品| 午夜理论片yy44880影院| 欧韩视频一区二区无码| 国产精品日韩中文字幕| 校园春色日韩高清一区二区| 日韩av无码精品一二三区| 国产av影片麻豆精品传媒| 精品国产亚洲av麻豆尤物| 少妇爽到高潮免费视频| 青青国产揄拍视频| 国产久视频国内精品999| 日本道免费一区日韩精品| 极品人妻少妇av免费久久| 中国丰满熟妇xxxx性| 日韩中文在线视频| 亚洲一区二区日韩精品| 国产精品白浆在线观看免费| 中日av乱码一区二区三区乱码| 国产亚洲精品日韩香蕉网| 91九色中文视频在线观看| 最新国产福利在线观看精品| 一区二区三区日韩亚洲中文视频| 久久少妇呻吟视频久久久| 东北女人啪啪对白| 国产精品jizz视频| 亚洲熟妇av日韩熟妇av| 91九色中文视频在线观看| 中文乱码字慕人妻熟女人妻| 日韩中文在线视频| 国产日产韩国级片网站|