亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高維加性Cox 模型的估計(jì)

        2023-02-07 01:57:22雷馨鈺徐嘉璐
        科海故事博覽 2023年2期
        關(guān)鍵詞:加性高維樣條

        雷馨鈺,徐嘉璐

        (蘭州財(cái)經(jīng)大學(xué),甘肅 蘭州 730101)

        1 緒論

        在信息爆炸的時(shí)代,高維數(shù)據(jù)的產(chǎn)生便于研究者從多個(gè)維度去分析問(wèn)題,但同時(shí),傳統(tǒng)的回歸模型就不能滿足高維數(shù)據(jù)的需要,故近年來(lái),半?yún)?shù)回歸模型的產(chǎn)生很好地解決了模型構(gòu)造問(wèn)題。Cox 模型是由英國(guó)統(tǒng)計(jì)學(xué)家D.R.Cox 于1972 年提出的一種半?yún)?shù)回歸模型[1]。該模型以生存結(jié)局和生存時(shí)間為因變量,引入基線風(fēng)險(xiǎn)函數(shù),對(duì)實(shí)際問(wèn)題中的無(wú)規(guī)律分布、刪失數(shù)據(jù)等問(wèn)題可以很好地處理。該模型自問(wèn)世以來(lái),在醫(yī)學(xué)隨訪研究中得到廣泛的應(yīng)用,也是迄今生存分析中應(yīng)用最多的多因素分析方法。

        然而,在實(shí)踐中,通常很少或沒(méi)有先驗(yàn)信息表明協(xié)變量的影響呈線性形式或?qū)儆谌魏纹渌邢蘧S參數(shù)族。因此需要通過(guò)使用一類更靈活的非參數(shù)模型,例如加性Cox 模型,加性Cox 模型中分量函數(shù)的引入顯著增加了模型的靈活性,因此,大量學(xué)者對(duì)加性Cox 模型進(jìn)行了研究。

        Tibshirani(1997)首次提出在Cox 模型中使用Lasso進(jìn)行變量選擇,F(xiàn)an 和Li(2002a,2002b)提出在Cox模型中使用平滑剪裁絕對(duì)偏差(SCAD)懲罰進(jìn)行變量選擇和估計(jì),Huang(1999)利用多項(xiàng)式樣條研究了部分線性可加Cox 模型下最大偏似然估計(jì)的性質(zhì),但是,上述作者僅僅研究了加性模型維數(shù)p 固定時(shí)的情況。對(duì)于稀疏加性Cox 模型,Lemler(2012)考慮了Cox 模型中基線風(fēng)險(xiǎn)函數(shù)和回歸系數(shù)的聯(lián)合估計(jì),但未考慮由分量函數(shù)和基線函數(shù)的線性組合引起的近似誤。基于高維數(shù)據(jù)與生存分析模型所具有的特殊性,傳統(tǒng)的變量選擇方法就不再適用,這是由于傳統(tǒng)的變量選擇方法不滿足變量選擇應(yīng)該具有的準(zhǔn)確性、可解釋性、穩(wěn)定性等顯著特點(diǎn)。因此需要對(duì)加性Cox 模型在高維情況下的變量選擇進(jìn)行系統(tǒng)分析,以便高效處理高維數(shù)據(jù)下的變量選擇問(wèn)題。

        總體上看,在高維數(shù)據(jù)中,使用變量選擇方法來(lái)篩選出數(shù)據(jù)中的重要信息是未來(lái)發(fā)展的趨勢(shì)。大量學(xué)者基于懲罰思想對(duì)有關(guān)模型的變量選擇進(jìn)行不斷地改進(jìn),常見(jiàn)的變量選擇的方法有嶺回歸、Lasso、SCAD、MCP[2]等。但往往有些變量選擇方法的“過(guò)度壓縮”會(huì)導(dǎo)致重要信息的損失,從而損失模型估計(jì)的精確度。故如何使模型在變量選擇后仍保留更多的有用信息也是研究者們大量關(guān)注的問(wèn)題。

        傳統(tǒng)Lasso 方法對(duì)不同系數(shù)進(jìn)行相同程度的加權(quán),造成過(guò)度壓縮絕對(duì)值較大的參數(shù)的情況,得到過(guò)于稀疏的模型,而且Lasso 方法是在單個(gè)變量的基礎(chǔ)上對(duì)模型進(jìn)行特征選擇,不具備處理具有組特性的數(shù)據(jù)。Yuan(2006)提出了組Lasso(Group Lasso)方法,組Lasso是Lasso 的擴(kuò)展,它的不同之處是對(duì)一組系數(shù)向量添加約束,因此克服了Lasso 方法無(wú)法實(shí)現(xiàn)從組的水平進(jìn)行特征選擇的這一缺點(diǎn)。組Lasso 在各個(gè)領(lǐng)域中都被廣泛使用:

        在醫(yī)學(xué)方面,Ma(2007)將有監(jiān)督的組Lasso 方法用于基因選擇和模型預(yù)測(cè),并通過(guò)組Lasso 方法選擇集群,從基因簇中找到重要的基因?;谧兞窟x擇特征,Kim(2012)將組Lasso 方法用于生存數(shù)據(jù)的分析中,該方法可以有效地結(jié)合臨床和基因組協(xié)變量,并在實(shí)際微陣列中進(jìn)行了實(shí)驗(yàn)。

        在機(jī)器學(xué)習(xí)方面,Yeh(2014)將組Lasso 多核學(xué)習(xí)方法應(yīng)用于異構(gòu)特征選擇,并證明了在選擇緊湊特征子集方面是有效的。在金融風(fēng)險(xiǎn)投資方面,Qi 等(2021)利用非負(fù)稀疏組Lasso 方法[3],用于成分股的選擇和權(quán)重系數(shù)的估計(jì)。

        針對(duì)現(xiàn)有文獻(xiàn)中存在的問(wèn)題,本文使用了一類正則化方法,通過(guò)對(duì)對(duì)數(shù)偏似然函數(shù)施加群組懲罰,并基于一些溫和的假設(shè)條件可以同時(shí)對(duì)高維Cox 加性模型進(jìn)行結(jié)構(gòu)識(shí)別,變量選擇及其估計(jì)。特別地,我們將模型的結(jié)構(gòu)識(shí)別和變量選擇問(wèn)題轉(zhuǎn)化為一個(gè)對(duì)于分量函數(shù)的判別問(wèn)題,通過(guò)構(gòu)建正交B 樣條基可以將這些問(wèn)題參數(shù)化,并通過(guò)快坐標(biāo)最優(yōu)下降法lv(2017)[4]對(duì)提出的變量選擇方法進(jìn)行識(shí)別。

        2 稀疏加性Cox 模型

        一般來(lái)說(shuō),醫(yī)學(xué)中生存分析的研究應(yīng)用在觀察時(shí)間與事件發(fā)生時(shí)間不一致的情況,它將事件發(fā)生的結(jié)果與觀察時(shí)間兩因素結(jié)合起來(lái),研究生存函數(shù)與斜變量之間的關(guān)系,可以分別對(duì)完全、不完全數(shù)據(jù)進(jìn)行分析,通常可用生存率、生存曲線等指標(biāo)來(lái)估計(jì)生存時(shí)間。但當(dāng)生存時(shí)間的分布過(guò)于復(fù)雜時(shí),簡(jiǎn)單的計(jì)算指標(biāo)不能滿足現(xiàn)實(shí)的需要,而Cox 比例風(fēng)險(xiǎn)模型就可以很好地解決上述問(wèn)題。

        Cox 模型不直接考察生存函數(shù)與斜變量之間的關(guān)系,而是用風(fēng)險(xiǎn)函數(shù)作為因變量,將參數(shù)與非參數(shù)結(jié)合,排除混雜因素影響,篩選出影響生存時(shí)間的因素。但在Cox 模型中,當(dāng)引進(jìn)的斜變量對(duì)時(shí)間的響應(yīng)較為敏感時(shí),偏似然函數(shù)損失的信息較多。故在本文中對(duì)帶有時(shí)間變量的Cox 模型進(jìn)行假設(shè)。

        由lv(2017)知稀疏加性Cox 模型如下:

        其中,Yi(t)為關(guān)于i 的主觀時(shí)變風(fēng)險(xiǎn)過(guò)程,為參數(shù)部分,f*(Xi(t))為具有P 維斜變量的真實(shí)分量函數(shù),為非參數(shù)部分。Λ0(t)為未知的基線累積函數(shù)。并且針對(duì)稀疏加性cox 模型要滿足p≥n。但在實(shí)際中關(guān)于f(x)的重要協(xié)變量相對(duì)較少,所以,針對(duì)式(1)中的分量函數(shù)可以表示為:

        其中,中的元素都為單變量,并且??{1,2,...,p}是基底|?|=d0的子集,滿足d0<<p。

        3 懲罰對(duì)數(shù)偏似然函數(shù)

        本文針對(duì)模型,提出主要應(yīng)用B樣條[5]的方法對(duì)未知的分量函數(shù)進(jìn)行樣條基函數(shù)展開,從而進(jìn)行后續(xù)估計(jì)。在樣條估計(jì)中,主要利用樣條基函數(shù)的線性組合來(lái)逼近未知的光滑函數(shù),這種組合可以擬合不同形狀或分布的數(shù)據(jù),因此,為了使得B 樣條估計(jì)方法可以對(duì)更復(fù)雜的模型進(jìn)行逼近求解,對(duì)于合適的基函數(shù)的選取也是我們值得關(guān)心的問(wèn)題。

        假定Xj(t)在任意t∈[0,T]在區(qū)間[a,b]上取值,且j=1,2,…p,假定多項(xiàng)式空間Sn中有K個(gè)點(diǎn),滿足a=ξ0<ξ1<…ξK+1=b,則K個(gè)點(diǎn)就為多項(xiàng)式空間Sn中的K個(gè)節(jié)點(diǎn)。用IKq表示為區(qū)間[a,b]上的子集,建立IKq=[ξq,ξq+1],q=0,1,…K,其中K滿足K=K(n)=nv0<v<1/2 并使得max1≤q≤K+1|ξq-ξq+1|=O(n-v)成立。

        此時(shí)定義Sn為滿足以下條件的多項(xiàng)式樣條空間:(1)IKq為Sn的子集,且1≤q≤K;(2)對(duì)于?≥2 與0≤?≤?-2,函數(shù)s是? 次連續(xù)可微的。

        由上述可知,在空間Sn上,當(dāng)1<k<mn,mn=K(n)+l時(shí)存在一個(gè)B 樣條基k使得對(duì)于任意fnj∈Sn都存在:

        基于光滑性假定,基函數(shù)fnj(z)可以逼近Sn,在上述近似下,每個(gè)分參數(shù)分量都可以表示為樣條基函數(shù)的線性組合,則通過(guò)B 樣條可以將模型中未知的分量選擇問(wèn)題變成了線性組合中選擇系數(shù)組的問(wèn)題,便于之后的估計(jì)。

        目標(biāo)函數(shù):

        4 模擬研究

        本節(jié)對(duì)整合后的加性Cox 模型進(jìn)行蒙特卡洛模擬分析,因高維數(shù)據(jù)的特殊性,分別考慮當(dāng)P=10 和P=50時(shí)的擬合情況。

        其中,假定在上式中前三個(gè)變量當(dāng)j=1,2,3 時(shí)定義為f1(x)=sinx+2,f2(x)=sin(2x)2+12,f3(x)=10(x-2)2,當(dāng)j=4,…p定義為fj(x)=0,且協(xié)變量和殘差都滿足均勻分布。

        情形1:當(dāng)P=10 時(shí),分別取n=100、200、500??傻帽?:

        表1

        情形2:當(dāng)P=50 時(shí),分別取n=100、200、500??傻帽?:

        表2

        由情形1 和情形2 可知,隨著維數(shù)增加,誤差會(huì)增大,但數(shù)值普遍較小,可知估計(jì)量有良好的性能。

        5 總結(jié)展望

        從大量數(shù)據(jù)中選擇出重要變量對(duì)于模擬研究及探尋事物變化的本質(zhì)有著重要的意義,因此變量選擇方法在高維數(shù)據(jù)中就顯得尤為重要。在本文中,考慮加性Cox 模型在高維數(shù)據(jù)中的情況,通過(guò)B 樣條曲線擬合模型,將函數(shù)中的未知函數(shù)用樣條基函數(shù)展開,結(jié)合具有Oracle 性質(zhì)的組Lasso 懲罰方法,建立了更完善的加性Cox 模型的變量選擇過(guò)程。后續(xù)可考慮在更高維度下的變量選擇問(wèn)題。

        猜你喜歡
        加性高維樣條
        一元五次B樣條擬插值研究
        ?2?4[u]-加性循環(huán)碼
        一種改進(jìn)的GP-CLIQUE自適應(yīng)高維子空間聚類算法
        企業(yè)家多重政治聯(lián)系與企業(yè)績(jī)效關(guān)系:超可加性、次可加性或不可加性
        企業(yè)家多重政治聯(lián)系與企業(yè)績(jī)效關(guān)系:超可加性、次可加性或不可加性
        三次參數(shù)樣條在機(jī)床高速高精加工中的應(yīng)用
        三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測(cè)
        軟件(2017年6期)2017-09-23 20:56:27
        基于樣條函數(shù)的高精度電子秤設(shè)計(jì)
        基于加權(quán)自學(xué)習(xí)散列的高維數(shù)據(jù)最近鄰查詢算法
        一般非齊次非線性擴(kuò)散方程的等價(jià)變換和高維不變子空間
        亚洲精品无码永久中文字幕| 国产91精品自拍视频| 欧美国产高清| 在线视频中文字幕乱人伦 | 91精品91久久久久久| 中文字幕一区二区网站| av资源在线永久免费观看| 亚洲中文字幕乱码在线观看 | 中文字幕日韩精品一区二区三区 | 久久精品亚洲熟女av蜜謦| 欧美亚洲一区二区三区| 国产精品久久777777| 熟女人妻在线视频| 亚洲国产成人精品无码区在线观看 | 在线观看免费午夜大片| 亚洲黄视频| 日本高清不在线一区二区色| 99久久国产一区二区三区| 在线观看二区视频网站二区| 一区二区三区视频在线观看| 亚洲无av在线中文字幕| 亚洲av永久精品爱情岛论坛| 精品欧洲av无码一区二区三区 | 亚洲裸男gv网站| 人妻少妇av无码一区二区| 少妇AV射精精品蜜桃专区| 91精品欧美综合在线观看| 亚洲图文一区二区三区四区| 男女射精视频在线观看网站| 天天做天天爱夜夜爽| 精品国产三级a∨在线观看| 国产不卡视频一区二区在线观看| 少妇隔壁人妻中文字幕| 亚洲成av人片在线观看| 一本久久a久久精品vr综合| 日韩在线免费| 国产一区二区三区观看视频| 丝袜美腿诱惑区在线播放| 夜夜爽夜夜叫夜夜高潮| 免费1级做爰片1000部视频| 无码人妻AⅤ一区 二区 三区|