亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        半變系數(shù)伽馬脆弱模型懲罰部分似然估計

        2018-11-22 09:32:08文,
        大連理工大學(xué)學(xué)報 2018年6期
        關(guān)鍵詞:效應(yīng)模型

        張 中 文, 王 曉

        ( 1.大連理工大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 遼寧 大連 116024;2.濱州醫(yī)學(xué)院 公共衛(wèi)生與管理學(xué)院, 山東 煙臺 264003 )

        0 引 言

        脆弱模型是比例風(fēng)險模型的推廣,是考慮隨機效應(yīng)的生存分析模型.其中,隨機效應(yīng)(即脆弱)一般用于描述對應(yīng)于不同分類(例如個體或家庭)的額外風(fēng)險或者脆弱,其基本思想是不同的個體具有不同的脆弱,相對比較脆弱的個體與其他個體相比更容易發(fā)病或死亡.近年來,脆弱模型被廣泛應(yīng)用于研究對象之間存在不可觀測的組間異質(zhì)性的非獨立生存時間問題的研究;同時,多種脆弱模型以及擬合這些模型的數(shù)值技術(shù)被廣泛研究,例如:為了增加模型的靈活程度、擴大模型的應(yīng)用范圍,Du等提出了一種非參數(shù)帶脆弱項的危險率模型[1];Yu等將多元對數(shù)正態(tài)脆弱模型推廣到可加半?yún)?shù)情形用以描述協(xié)變量對于對數(shù)危險率的非線性影響,并提出了一種雙懲罰部分似然法用于模型的估計[2],該模型在增加了模型適應(yīng)性的同時,也避免了多元非參數(shù)函數(shù)的估計問題.

        變系數(shù)模型是近年來發(fā)展起來的具有廣泛應(yīng)用背景的回歸模型,該模型通過假設(shè)回歸系數(shù)是其他協(xié)變量的未知函數(shù)而增加模型的靈活性,因為系數(shù)函數(shù)通常被假設(shè)為某個協(xié)變量的一元函數(shù),所以維數(shù)災(zāi)難問題得到了有效避免.如Zhang等研究了半變系數(shù)多元脆弱模型的估計問題,用以描述某些協(xié)變量對于危險率的影響受其他協(xié)變量的影響,并通過數(shù)值模擬和實例分析說明了方法的有效性,其中脆弱的分布假定為對數(shù)多元正態(tài)分布[3].而在實際的脆弱模型應(yīng)用過程中,假定脆弱服從伽馬分布更為常見,這是因為伽馬分布的變量為正數(shù),十分適合脆弱分布無符號改變的特性;伽馬分布可以通過Laplace變換獲得導(dǎo)數(shù),從而使得整個模型求導(dǎo)具備相對的簡便性.本文提出一種半變系數(shù)伽馬脆弱模型,以進一步豐富脆弱模型的模型結(jié)構(gòu),用以描述聚集生存數(shù)據(jù)或者復(fù)發(fā)型生存數(shù)據(jù)分析中協(xié)變量效應(yīng)受其他協(xié)變量的影響,從而為分析生存時間與協(xié)變量更準確、更復(fù)雜的關(guān)系提供方法學(xué)支持.

        1 半變系數(shù)伽馬脆弱模型

        λij(t;xij,uij,wij,νi)=

        λ0(t)νiexp(βT(uij)xij+αTwij)

        (1)

        式中:λ0(t)是基準危險率函數(shù);同時νi(i=1,2,…,s)表示第i個聚類中的脆弱,并且服從單參數(shù)伽馬分布,其概率密度函數(shù)為

        (2)

        若令ri=logνi,可稱ri為隨機效應(yīng),則半變系數(shù)伽馬脆弱模型亦可改寫為

        λij(t;xij,uij,wij,ri)=

        λ0(t)exp(βT(uij)xij+αTwij+ri)

        (3)

        假設(shè)生存時間Tij與刪失時間Cij關(guān)于協(xié)變量、隨機效應(yīng)ri條件獨立,不同個體的生存時間關(guān)于隨機效應(yīng)條件獨立,同時假設(shè)隨機效應(yīng)與刪失時間相互獨立.

        2 模型估計方法

        2.1 B-樣條

        變系數(shù)函數(shù)向量β(u)可以通過基函數(shù)為{B1(u),B2(u),…,Bm(u)}的B-樣條進行估計,其中m指樣條基函數(shù)的個數(shù),樣條基函數(shù)的數(shù)量和形狀是由節(jié)點個數(shù)和位置決定的.本研究在模擬和實例分析過程中選擇m=5.

        η1,2…η1,mη2,1η2,2…η2,m…ηp1,1

        ηp1,2…ηp1,m)T,并將協(xié)變量取值與對應(yīng)的樣條基函數(shù)相乘記為gij=(x1,ijBT(uij)x2,ijBT(uij) …xp1,ijBT(uij))T,則第i個聚類中第j個個體在給定νi以及其他協(xié)變量條件下的風(fēng)險函數(shù)可以近似轉(zhuǎn)化為

        λij(t;xij,uij,wij,νi)≈λ0(t)νiexp(ηTgij+αTwij)=

        λ0(t)exp(ηTgij+αTwij+ri)

        (4)

        2.2 懲罰部分似然估計

        本文首先在假定θ已知的條件下,采用懲罰部分似然法給出協(xié)變量參數(shù)的估計,同時隨機效應(yīng)也假定為回歸參數(shù)進行估計[4].其中,懲罰函數(shù)選擇隨機效應(yīng)的負對數(shù)似然函數(shù),由νi的分布可知,ri服從對數(shù)伽馬分布,密度函數(shù)為

        (5)

        進一步可以給出半變系數(shù)伽馬脆弱模型的懲罰部分似然函數(shù):

        lPPL(α,η,r)=lpart-lpen=

        αTwij+logνi)-

        (6)

        類似于線性伽馬脆弱模型[5],對于固定的θ,可以通過最大化lPPL(α,η,r)獲得α、η、r的估計值.估計過程中,首先假定r為固定效應(yīng)的回歸系數(shù),然后分別關(guān)于α、η、r求lPPL(α,η,r)的得分方程:

        (7)

        (8)

        (9)

        其中h=1,2,…,s,且當(dāng)i=h時,zij,h=1,否則zij,h=0.通過調(diào)整各項的排列方式,式(9)可以改寫為

        αTwhj+rh)Λ0(yhj)+

        (10)

        其中

        (11)

        由牛頓迭代法求解得分方程,可以給出估計α、β、r,進而可以采用Nelson-Aalen法得到基準危險率的估計量λ0.

        2.3 隨機效應(yīng)參數(shù)的估計

        在假設(shè)α、η、r已知的條件下,本文采用近似輪廓似然法估計θ.首先,對于固定的α、η,建立邊際似然函數(shù)如下:

        αTwij))δijexp(-Λ0(tij)νiexp(ηTgij+

        (12)

        利用伽馬函數(shù)的性質(zhì)(或者應(yīng)用Laplace變換)[6],經(jīng)過適當(dāng)計算、整理,均可將邊際似然函數(shù)改寫為

        (13)

        (14)

        (15)

        利用黃金搜索算法可以得到式(15)的最大值,從而給出隨機效應(yīng)方差成分的估計θ.

        2.4 模型估計流程歸納

        現(xiàn)將整個估計流程歸納如下:第1步,運用B-樣條生成新的協(xié)變量Gi;第2步,在給定θ初始值的條件下,利用Newton-Raphson算法求解懲罰對數(shù)部分似然函數(shù)的最大值,從而給出α、θ、r;第3步,對于上一步得到的α、θ、r,通過極大化式(15)得到θ;接下來不斷重復(fù)第2步和第3步直到收斂,最后給出α、η、θ最終的估計.

        3 數(shù)值模擬

        本文通過數(shù)值模擬的方式對提出的模型及其估計方法進行評價.模擬分為2個部分:(1)所有協(xié)變量的系數(shù)均是常數(shù)系數(shù)情形生成的數(shù)據(jù)集;(2)協(xié)變量系數(shù)部分為變系數(shù)、部分為常數(shù)系數(shù)情形生成的數(shù)據(jù)集.考察的模型是半變系數(shù)伽馬脆弱模型,其模型結(jié)構(gòu)為

        λij(t;xij,uij,wij,νi)=λ0(t)νiexp(β(uij)·

        xij+α·wij);

        i=1,2,…,s,

        j=1,2,…,ni

        模擬中,每個聚類中個體的個數(shù)(ni)為5,樣本量分別設(shè)定為100、300、500,則對應(yīng)的聚類個數(shù)(s)分別為20、60、100;刪失率分別設(shè)定為10%、30%、50%,實際刪失率的誤差控制在0.5%以內(nèi);不同情形下,每種模擬的次數(shù)設(shè)定為500次;刪失時間被設(shè)定為服從指數(shù)分布,模擬中通過調(diào)整指數(shù)分布的參數(shù)控制刪失率;另設(shè)λ0(t)=t,脆弱項νi~Γ(1,1),即方差(θ)為1的伽馬分布,xij~exp(1),wij~N(1,1);常數(shù)系數(shù)α=1,協(xié)變量u在區(qū)間(1,3]內(nèi)按樣本量大小等距取點,在模擬1中β(u)=1,在模擬2中β(u)=cos(2u)+1.

        3.1 模擬1

        模擬1用于說明本文提出的方法是否適用于所有協(xié)變量系數(shù)均為常數(shù)的情形.不同條件下α、θ的模擬結(jié)果見表1.

        表1 β(u)=1條件下模型參數(shù)的模擬結(jié)果

        由表1可見,不同條件下α的估計誤差均非常小,即使在刪失率達到50%,而聚類個數(shù)僅為20個時,估計偏差也僅為0.034;α標(biāo)準誤的估計方面,經(jīng)驗標(biāo)準誤Semp均略高于估計標(biāo)準誤Sest,這與相關(guān)文獻中的研究結(jié)果一致[2-3,7].不同刪失率條件下,標(biāo)準誤均隨著樣本量的增大而減小,而相同樣本量條件下,標(biāo)準誤隨著刪失率的升高而增大.在樣本量較小時,θ的估計誤差相對較大,刪失率的提高會造成θ估計誤差的增大,在樣本量為500時,刪失率的提高對于θ估計的影響較小.

        模擬1中,β(u)的估計及其95%置信帶見圖1.篇幅原因,未將樣本量為300或者刪失率為30%的情況顯示,其各自的估計效果介于對應(yīng)的不同樣本量和刪失率之間.

        由圖1可見,不同條件下,β(u)的估計效果均較好,特別是當(dāng)樣本量為500時,β(u)和β(u)的曲線幾乎是重合的;95%置信帶的曲線形狀與β(u)基本一致,只是邊界有略大的波動,這與文獻結(jié)果一致[2-3,8],置信帶的寬度隨著樣本量的增大而變窄;β(u)的估計偏差同樣受樣本量的影響,樣本量越大,估計偏差越??;在模擬過程中考察的刪失率范圍內(nèi),即10%~50%,β(u)的估計偏差無明顯變化,這體現(xiàn)出了本文方法對于不同的刪失率具備一定的穩(wěn)健性.

        (a) 刪失率10%,樣本量100

        (b) 刪失率10%,樣本量500

        (c) 刪失率50%,樣本量100

        (d) 刪失率50%,樣本量500

        圖1β(u)=1時不同樣本量和刪失率條件下β(u)的估計

        Fig.1 Estimation ofβ(u) in the condition ofβ(u)=1 based on different sample number and censor rate

        3.2 模擬2

        模擬2用于評價本文提出的方法在半變系數(shù)伽馬脆弱模型條件下的擬合效果.不同條件下α、θ的模擬結(jié)果見表2.β(u)的估計及其95%置信帶見圖2.

        由表2可知,與模擬1的結(jié)果類似,不同條件下α的估計誤差仍然都比較小,即使在刪失率達到50%,而聚類個數(shù)僅為20個時,估計偏差仍舊不大;α標(biāo)準誤的估計方面,經(jīng)驗標(biāo)準誤也均略高于估計標(biāo)準誤,這與相關(guān)文獻中的研究結(jié)果一致[2-3,7].對于固定的刪失率水平,樣本量的增大可以帶來估計標(biāo)準誤和經(jīng)驗標(biāo)準誤的減小;與此同時,對于固定的樣本量,估計標(biāo)準誤和經(jīng)驗標(biāo)準誤也隨著刪失率的提高而略有增大.在樣本量較小同時刪失率又較高時,θ的估計誤差相對較大,模擬中最大平均誤差達到近0.14;在樣本量較小時,刪失率的提高會造成θ估計誤差較明顯的增大,而在樣本量較大時,刪失率的提高對于θ估計的影響不再顯著.

        表2 β(u)=cos(2u)+1條件下模型參數(shù)的模擬結(jié)果

        由圖2可知,對應(yīng)于不同的樣本量和刪失率,β(u)的平均估計均比較準確,尤其是在樣本量較大(500)時,β(u)和β(u)的圖像幾乎是重合的.與模擬1類似,95%置信帶的曲線形狀與β(u)基本一致,只是在邊界處有相對較大的波動,置信帶的寬度隨著樣本量的增大而變窄;β(u)的偏差同樣受樣本量的影響,樣本量越大,偏差越小;在模擬過程中考察的刪失率范圍內(nèi),即10%~50%,β(u) 偏差的變化并不顯著,模擬2和模擬1共同體現(xiàn)出了本文提出方法是比較穩(wěn)健的.

        (a) 刪失率10%,樣本量100

        (b) 刪失率10%,樣本量500

        (c) 刪失率50%,樣本量100

        (d) 刪失率50%,樣本量500

        圖2β(u)=cos(2u)+1時不同樣本量和刪失率條件下β(u)的估計

        Fig.2 Estimation ofβ(u) in the condition ofβ(u)=cos(2u)+1 based on different sample number and censor rate

        4 實例分析

        本文通過分析美國北部癌癥治療中心(North Central Cancer Treatment Group,NCCTG)的晚期肺癌數(shù)據(jù)來評價本文提出的模型與方法的應(yīng)用效果.調(diào)查涉及167名晚期肺癌患者,刪失率為28%,文獻中已經(jīng)有關(guān)于本數(shù)據(jù)集的一些分析[9-10],本研究重點考察病人Karnofsky自評分對于危險率的影響受其他因素的影響情況,了解晚期肺癌的預(yù)后因素,從而為醫(yī)師以及病人制訂更合理的治療方案提供參考.所謂預(yù)后是指預(yù)測疾病的可能病程和結(jié)局,它既包括判斷疾病的特定后果,如康復(fù),某種癥狀、體征和并發(fā)癥等其他異常的出現(xiàn)或消失及死亡,也包括提供時間線索,如預(yù)測某段時間內(nèi)發(fā)生某種結(jié)局的可能性.

        納入本研究的評價指標(biāo)包括機構(gòu)代碼(I)、生存時間(T)、刪失指標(biāo)(C)、病人年齡(U)、病人的Karnofsky自評分(X)、性別(W1)、ECOG得分(W2)、卡路里攝入量(W3).考慮到不同醫(yī)療機構(gòu)的治療水平存在差別,即考慮病人的生存時間在就醫(yī)機構(gòu)方面表現(xiàn)出聚集性,即具有不可觀測的隨機效應(yīng),因而將這些變量代入半變系數(shù)伽馬脆弱模型,模型結(jié)構(gòu)如下:

        λij(t;νi,uij,xij,w1,ij,w2,ij,w3,ij)=

        λ0(t)νiexp(β(uij)xij+α1w1,ij+

        α2w2,ij+α3w3,ij)

        (16)

        采用本文提出方法給出各協(xié)變量的估計,同時采用bootstrap方法給出95%置信帶的估計,結(jié)果顯示,性別以及ECOG得分對于危險率的影響具有統(tǒng)計學(xué)意義,男性相比女性危險率更高,ECOG得分越高,危險率也越高,詳見表3.

        表3 NCCTG數(shù)據(jù)回歸參數(shù)的估計

        圖3顯示,不同年齡段晚期肺癌患者的Karnofsky自評分對對數(shù)危險率的影響大小非常數(shù),而是一個非線性函數(shù).

        圖3 NCCTG數(shù)據(jù)分析中變系數(shù)函數(shù)及其置信帶的估計

        Fig.3 Estimation of the varying coefficient function and confidence belt of NCCTG data

        5 結(jié) 語

        經(jīng)模擬研究和實例分析發(fā)現(xiàn),在樣本量不大的條件下,本文提出的方法即可給出模型線性回歸系數(shù)非常準確的估計,刪失率的提高也不會對參數(shù)的估計效果造成明顯影響.在樣本量較小同時刪失率又較高的條件下,隨機效應(yīng)參數(shù)的估計誤差較大,這提示在實際的應(yīng)用過程中本方法有低估隨機效應(yīng)方差的傾向,當(dāng)樣本量較大時,隨機效應(yīng)參數(shù)的估計誤差則會明顯減?。疚奶岢龅姆椒梢越o出常數(shù)函數(shù)非常準確的估計,即適用于所有系數(shù)均為線性回歸系數(shù)的場合,也即本文的方法包含傳統(tǒng)的線性伽馬脆弱模型作為其特殊形式;同時,本文提出的模型可以給出非線性函數(shù)系數(shù)非常準確的估計,這也擴展了伽馬脆弱模型的適用范圍和應(yīng)用領(lǐng)域.

        綜上所述,本文提出的方法對傳統(tǒng)的伽馬脆弱模型進行了有效的擴展,方法穩(wěn)定、計算速度也較快,常數(shù)回歸系數(shù)以及函數(shù)回歸系數(shù)的估計對樣本量和刪失率的要求均不高,適宜在實際問題中推廣使用.當(dāng)然,本研究中也存在一些不足,例如:雖然在模擬研究中給出了變系數(shù)函數(shù)的置信帶,在實例分析中也應(yīng)用bootstrap方法給出了變系數(shù)函數(shù)的置信帶,但未能就函數(shù)系數(shù)的假設(shè)檢驗等問題進行探討,這也有待于接下來更深入的研究.

        猜你喜歡
        效應(yīng)模型
        一半模型
        鈾對大型溞的急性毒性效應(yīng)
        懶馬效應(yīng)
        場景效應(yīng)
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        應(yīng)變效應(yīng)及其應(yīng)用
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        偶像效應(yīng)
        国产精品美女久久久久久久| 国产禁区一区二区三区| 国产欧美日韩精品丝袜高跟鞋 | 日韩有码在线一区二区三区合集| 色偷偷888欧美精品久久久 | 一卡二卡三卡视频| 久久精品国产亚洲AV古装片| 精品国产中文久久久免费| 免费a级毛片无码a∨蜜芽试看| 天天躁日日躁狠狠躁av| 免费无码又爽又刺激高潮的视频网站| 日本一区二区在线看看| 国内精品少妇高潮视频| 护士人妻hd中文字幕| 国产一区二区精品尤物| 久久精品网站免费观看| 一区二区三区精品少妇| 人人澡人人澡人人看添av| 日韩av在线毛片| 午夜一区二区三区免费观看| 国产精品久久久久久久久电影网| 先锋影音最新色资源站| 精品国产亚欧无码久久久| 视频国产一区二区在线| 深夜福利啪啪片| 精品视频一区二区三三区四区| 在线不卡中文字幕福利| 亚洲av五月天一区二区| 极品av麻豆国产在线观看| 国产偷国产偷高清精品| 久久中文字幕国产精品| 97人伦影院a级毛片| 免费精品无码av片在线观看| 杨幂国产精品一区二区| 一区二区三区国产黄色| 男女上下猛烈啪啪免费看| 亚州AV无码乱码精品国产 | 日韩在线不卡一区在线观看| 亚洲熟少妇一区二区三区| 久久久久亚洲精品无码蜜桃| 亚洲va在线va天堂va手机|