亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中心K階中心矩子空間的迭代海塞變換估計(jì)

        2016-05-25 05:27:13甘勝進(jìn)游文杰
        關(guān)鍵詞:降維

        甘勝進(jìn),游文杰

        (福建師范大學(xué)福清分校電子與信息工程學(xué)院,中國(guó) 福清 350300)

        ?

        中心K階中心矩子空間的迭代海塞變換估計(jì)

        甘勝進(jìn)*,游文杰

        (福建師范大學(xué)福清分校電子與信息工程學(xué)院,中國(guó) 福清350300)

        摘要提出中心K階條件矩降維子空間,指出與中心K階中心矩子空間的關(guān)系,并給出迭代的海塞變換估計(jì),該方法僅僅需要線性條件,綜合了最小二乘和海塞主方向方法.

        關(guān)鍵詞降維;CKCMS;OLS;PHD;迭代海塞變換

        在高維空間中進(jìn)行統(tǒng)計(jì)建模,往往會(huì)碰到“維數(shù)災(zāi)難”(curse of dimensionality)問(wèn)題,因此降維作為建模之前的數(shù)據(jù)預(yù)處理階段,顯得十分重要.常見(jiàn)的降維方法有主成分回歸分析、偏最小二乘回歸和投影尋蹤等,主成分回歸僅僅考慮了自變量之間的相關(guān)信息,忽略了與因變量之間的關(guān)系,而偏最小二乘雖然同時(shí)考慮自變量與因變量之間相關(guān)關(guān)系,但是僅僅局限于線性關(guān)系,沒(méi)有考慮非線性關(guān)系,另外投影尋蹤需要估計(jì)連接函數(shù),超出數(shù)據(jù)預(yù)處理的范圍.

        對(duì)于一維響應(yīng)變量Y和p維解釋變量X=(X1,X2,…,Xp),考慮它們之間的回歸問(wèn)題本質(zhì)上是討論在X給定條件下,Y的條件分布FY|X如何隨X變化.Li(1991)[1]提出切片逆回歸(sliced inverse regression,簡(jiǎn)稱SIR),即如果存在p×k(k

        Y‖X|X?Y‖X|ηTX,

        (1)

        則FY|X(y|x)=FY|ηTX(y|ηTx),Y對(duì)X條件分布是k維的,如果k遠(yuǎn)小于p,就達(dá)到了降維的目的,特別地,當(dāng)k=1或2時(shí),便可從可視化角度來(lái)分析Y與X之間的回歸關(guān)系,由于Y‖X|ηTX?Y‖X|(ηB)TX,其中B為k階可逆方陣,η與ηB所形成的子空間一樣,所以關(guān)心的是span{η},而不是η本身,并稱span{η}為降維子空間.如果滿足(1)的所有η的交集仍然滿足(1),則稱之為中心降維子空間(central dimension reduction subspace,簡(jiǎn)稱CS),記為SY|X,rank(SY|X)稱為結(jié)構(gòu)維數(shù).一般來(lái)說(shuō),在很弱條件下CS總是存在的.有時(shí)候感興趣的是E(Y|X),Cook和Li(2002)[2]提出中心均值子空間,即:

        Y‖E(Y|X)|ηTX.

        (2)

        類似CS,若所有滿足(2)的集合的交集仍然滿足(2),稱之為中心均值降維子空間(central mean dimension reduction subspace,簡(jiǎn)稱CMS),記為SE(Y|X).估計(jì)降維子空間[3-4]的條件通常為:

        (1)線性條件:E(X|ηTX)為ηTX線性函數(shù),即E(X|ηTX)=PηX,?η∈Rp,其中投影陣Pη=η(ηTη)-1ηT.

        (2)常數(shù)方差 :Var(X|ηTX)為非隨機(jī)矩陣.

        滿足線性條件一般要求X是橢圓分布,滿足常數(shù)方差條件的是多元正態(tài)分布.本文分三個(gè)部分,第二部分提出中心K階條件矩降維子空間定義,并指出與中心K階中心矩子空間的關(guān)系,第三部分為利用Cook和Li[5](2004)提出的迭代海塞變換方法來(lái)估計(jì)中心K階條件矩子空間,最后部分給出實(shí)例模擬.

        1中心K階條件矩子空間

        Yin和Cook(2002)[6]提出中心K階中心矩子空間定義:

        Y‖{M(1)(Y|X),…,M(k)(Y|X)}|ηTX,

        (3)

        定義1如果Y‖E(Yk|X)|ηTX成立,則稱span{η}為K階條件矩降維子空間,若span{η}仍然是K階條件矩降維子空間,則稱之為中心K階條件矩降維子空間,記為SE(Yk|X).顯然SE(Yk|X)?SY|X,類似Cook和Li(2002),給出以下定理.

        定理1以下3個(gè)命題相互等價(jià)

        (i) Y‖E(Yk|X)|ηTX;

        (ii)Cov[(Yk,E(Yk|X))|ηTX]=0;

        (iii)E(Yk|X)是ηTX的函數(shù).

        證顯然(i)? (ii),(iii) ?(i),只需證明(ii) ?(iii),由(ii)可知

        E[YkE(Yk|X)|ηTX]=E(Yk|ηTX)E(E(Yk|X)|ηTX).

        依據(jù)條件期望的平滑性,左邊等于E[E(YkE(Yk|X)|X)|ηTX]=E[E2(Yk|X)|ηTX],右邊第一項(xiàng)E(Yk|ηTX)=E(E(Yk|X)|ηTX).故右邊等于E2(E(Yk|X)|ηTX),所以Var(E(Yk|X)|ηTX)=0,表明在ηTX給定條件下,E(Yk|X)是常數(shù),故(iii)成立.(iii)表明E(Yk|X)=E(Yk|ηTX).

        證對(duì)于任意的k≥2

        (4)

        由(3)可知Y‖E(Y|X)|ηTX,故Y‖Ei(Y|X)|ηTX,

        由于Y‖{M(1)(Y|X),…,M(k)(Y|X)}|ηTX,故Y‖{E(Y|X),…,E(Yk|X)}|ηTX

        2CKCMS的迭代海塞變換估計(jì)

        Yin和Cook(2002)在線性條件下給出最小二乘估:

        βOLS=(E(YX),E(Y2X),…,E(YkX)).

        (5)

        Yin和Cook(2006)[7]在線性條件和常數(shù)方差條件下給出高階海塞主方向估計(jì):

        Mphdk=(E[(Y-E(Y)XXT],E[(Y2-E(Y2)XXT],…,E[(Yk-E(Yk)XXT]).

        (6)

        式(5)雖然條件弱,但是沒(méi)有估計(jì)出CKCMS中更多的方向,式(6)相對(duì)于(5)似乎得到更多估計(jì)方向,但是需要條件較為苛刻.本節(jié)提出一種新的估計(jì)方法,只需要在線性條件下,以最小二乘為種子向量,最小二乘與高階海塞矩陣[8-11]不斷結(jié)合產(chǎn)生新的方向,其理論依據(jù)如下.

        定理3假設(shè)E(X|ηTX)為ηTX線性函數(shù),U,V均為關(guān)于ηTX可測(cè)的函數(shù),即U=U(ηTX),V=V(ηTX),則E((UYi+V)X)∈span(η),i=1,2,…k.

        E[(UYi+V)X]=E[(E(UYi|X)+E(V|X))X]=E[(UE(Yi|X)+V)X]=

        E[(UE(Yi|ηTX)+V)X]=E[(UE(Yi|ηTX)+V)E(X|ηTX)]=E[E(UYi+V)E(X|ηTX)]=

        PηE[(UYi+V)X]∈span(η)

        選取適當(dāng)?shù)腢,V可以得到迭代的海塞變換估計(jì):

        推論1取U0=(E(YiX))TX,V0=-(E(YiX))TXE(Yi),則

        證在線性條件下,最小二乘估計(jì)E(YiX)∈SE(Yi|X)

        U1=δ1TX,V1=-δ1TXE(Yi)代入定理3.1中得到

        δk+1=E[(UkYi+Vk)X]=[E((Yi-E(Yi))XXT)]k+1E(YiX),證畢.

        實(shí)際當(dāng)中span{E(YiX),[E((Yi-E(Yi))XXT)]jE(YiX),j=1,2,…,n,…}的維數(shù)不可能是無(wú)限的,最多是p,下面定理給出迭代停止條件.

        定理4對(duì)于p維列向量序列:β,Aβ,A2β,…,Anβ,…,如果某個(gè)k,β,Aβ,…,Akβ線性相關(guān),則β,Aβ,…,Anβ,n≥k線性相關(guān).

        證不失一般性,假設(shè)β,Aβ,…,Ak-1β線性無(wú)關(guān),而β,Aβ,…,Akβ線性相關(guān),則Akβ可由β,Aβ,…,Ak-1β線性表示,Ak+1β=A(Akβ),所以Ak+1β可由β,Aβ,…,Ak-1β線性表示,以此類推可得Anβ可由β,Aβ,…,Ak-1β線性表示,證畢.

        推論1、定理4給出迭代海塞變換估計(jì)方法,具體步驟如下:

        (a) 計(jì)算βOLS(i)=E(YiX),PHDi=E((Yi-E(Yi))XXT),i=1,2,…,k

        (b) 計(jì)算(PHDi)jβOLS(i),j≤p-1

        (c) 判定βOLS(i),PHDiβOLS(i),…,(PHDi)jβOLS(i)是否線性相關(guān),若無(wú)關(guān),則j=j+1重復(fù)(b),若相關(guān),則停止迭代,span{βOLS(i),PHDiβOLS(i),…,(PHDi)j-1βOLS(i)}=ηi

        (d) 最后得到CKCMS的迭代海塞變換估計(jì)span{η1,η2,…,ηk}

        3模擬研究

        表1為針對(duì)維數(shù)p和樣本容量n在100次重復(fù)下迭代海塞變換估計(jì)模擬結(jié)果,其中每個(gè)格子里第一個(gè)數(shù)為均值,第二個(gè)數(shù)為標(biāo)準(zhǔn)差.

        表1 迭代海塞變換估計(jì)方向與真實(shí)方向接近程度的均值與標(biāo)準(zhǔn)差

        從表1可以看出:維數(shù)相同情況下,迭代海塞變換估計(jì)方向與真實(shí)方向接近程度的均值越來(lái)越大,標(biāo)準(zhǔn)差越來(lái)越小,表明樣本容量越大,估計(jì)的效果越好,說(shuō)明估計(jì)具有相合性;樣本容量相同情況下,維數(shù)越高,均值越小,而標(biāo)準(zhǔn)差變化不大,表明維數(shù)越高,該方法估計(jì)的效果越差,但穩(wěn)定性較好.因此迭代海塞變換收斂速度依賴樣本容量和解釋變量的維數(shù).圖1和圖2為100次重復(fù)下,維數(shù)p=8,樣本容量分別為300和500時(shí),迭代海塞變換估計(jì)與現(xiàn)常見(jiàn)方法如切片逆回歸(切片數(shù)量為10)、最小二乘相比較.

        圖1    樣本容量為300時(shí),IHT、SIR、OLS與真實(shí)方向接近     圖2    樣本容量為500時(shí),IHT、SIR、OLS與真實(shí)方向接   程度的箱線圖   近程度的箱線圖Fig.1    Boxplots of distances between directions estimated by IHT, SIR,   Fig.2    Boxplots of distances between directions estimated by IHT, SIR,    OLS respectively with real directions under sample size 300   OLS respectively with real directions under sample size 500

        通過(guò)比較發(fā)現(xiàn):最小二乘估計(jì)非常穩(wěn)定,但是估計(jì)的效果遠(yuǎn)遠(yuǎn)不及前兩者,當(dāng)樣本容量變大時(shí),與其他兩種方法估計(jì)效果的差距越來(lái)越大,一個(gè)很重要的原因是最小二乘只能估計(jì)降維子空間中的一個(gè)方向;切片逆回歸性能對(duì)切片數(shù)量較為敏感,如何選擇切片數(shù)量至今是個(gè)公開的難題,并且當(dāng)回歸函數(shù)是偶函數(shù)時(shí),該方法失效;相比之下迭代海塞變換隨著樣本容量增大在估計(jì)效果與穩(wěn)定性方面越來(lái)越好.

        致謝感謝審稿人的細(xì)致和編輯提出的有益建議!

        參考文獻(xiàn):

        [1]LI K C. Sliced inverse regression for dimension reduction[J]. J Am Stat Assoc,1991,86(414):316-327.

        [2]COOK R D, LI B. Dimension reduction for conditional mean in regression[J].Ann Stat, 2002,30(2):455-474.

        [3]COOK R D, LI L X. Dimension reduction in regressions with exponential family predictors[J].J Comput Graph Stat, 2009,18(3).

        [4]PENG Z, YU Z. An integral transform method for estimating the central mean and central subspaces[J]. J Multiv Anal, 2010,101:271-290.

        [5]COOK R D, LI B. Determing the dimension of iterative Hessian transformation[J]. Ann Stat,2004,32(6):2501-2531.

        [6]YIN X R, COOK R D. Dimension reduction for the conditional kth moment in regression[J].J Statist Soc B, 2002,64:159-175.

        [7]YIN X Y, COOK R D. Dimension reduction via marginal high moments in regression[J].Stat Prob Lett, 2006,76:393-400.

        [8]LI K C. On principal hessian directions for data visualization and dimension reduction :another application of stein’s lemma[J].J Am Stat Assoc,1992,87:420.

        [9]COOK R D. Principal hessian directions revisited[J]. J Am Stat Assoc, 1998,93:441.

        [10]LUE H H. On principal Hessian directions for multivariate response regressions[J]. Comput Stat, 2010,25:619-632.

        [11]ZHOU Y, DONG Y X, FANG Y. Marginal coordinate tests for central mean subspace with principal Hessian directions[J]. Chin J Appl Proba Stat,2010,26(5).

        [12]ZHU L P, ZHU L X, WEN S Q. On dimension reduction in regression with multivariate responses[J]. Stat Sin, 2010,20:1291-1307.

        [13]RAPHAEL C, STEPHANE G, JEROME S. A new sliced inverse regression method for multivariate response[J]. Comput Stat Data Anal,2014,77:285-299.

        (編輯HWJ)

        Iterative Hessian Transformation Estimation of CentralKthConditional Moment Subspace

        GANSheng-jin*,YOUWen-jie

        (School of Electronical and Information Engineering, Fuqing Branch of Fujian Normal University, Fuqing 350300, China)

        AbstractThis paper defines the central Kthmoment subspace, and has derived its relationship with CKCMS. In addition, iterative Hessian transformation estimation has been proposed, which is a combination of ordinary least square estimation and principal Hessian directions applied only to the linear condition.

        Key wordsdimension reduction; CKCMS; OLS; PHD; IHT

        中圖分類號(hào)O213

        文獻(xiàn)標(biāo)識(shí)碼A

        文章編號(hào)1000-2537(2016)02-0090-05

        *通訊作者,E-mail:ganshengjin2001@163.com

        基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61473329);福建省自然科學(xué)基金資助項(xiàng)目(2015J01009)

        收稿日期:2015-03-23

        DOI:10.7612/j.issn.1000-2537.2016.02.015

        猜你喜歡
        降維
        Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
        混動(dòng)成為降維打擊的實(shí)力 東風(fēng)風(fēng)神皓極
        車主之友(2022年4期)2022-08-27 00:57:12
        基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
        Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
        降維打擊
        海峽姐妹(2019年12期)2020-01-14 03:24:40
        一種基于降維對(duì)偶四元數(shù)的多源導(dǎo)航系統(tǒng)信息融合方法
        基于堆棧自編碼降維的武器裝備體系效能預(yù)測(cè)
        圖像降維下的埋弧焊缺陷自動(dòng)識(shí)別算法及框架
        焊接(2016年9期)2016-02-27 13:05:19
        一種改進(jìn)的稀疏保持投影算法在高光譜數(shù)據(jù)降維中的應(yīng)用
        基于簡(jiǎn)化CKF/降維CKF混合濾波的非線性對(duì)準(zhǔn)技術(shù)研究
        久久久久一| 少妇裸体性生交| 精品欧洲av无码一区二区14 | 中文字幕亚洲综合久久| 国产真实强被迫伦姧女在线观看| 九九九精品成人免费视频小说| 91在线区啪国自产网页| 亚洲女同av一区二区在线观看| 中文字幕色偷偷人妻久久一区| 久久偷看各类wc女厕嘘嘘偷窃| 色噜噜狠狠一区二区三区果冻 | 国产chinese在线视频| 国内偷拍第一视频第一视频区| 亚洲美女毛多水多免费视频| 日日拍夜夜嗷嗷叫国产| 日本japanese少妇高清| 中文字幕不卡高清免费| 免费毛片一区二区三区女同| 久久综合精品国产丝袜长腿| 久久久久亚洲av综合波多野结衣| 亚洲av综合久久九九| 国产视频最新| 亚洲大胆视频在线观看| 日韩亚洲精品国产第二页| 亚洲a∨无码男人的天堂| 六月丁香婷婷色狠狠久久| 91精品亚洲一区二区三区| 国产午夜精品视频观看| 极品老师腿张开粉嫩小泬| 亚洲综合区图片小说区| 欧洲一区在线观看| 精品国产3p一区二区三区| 日韩精品一区二区在线天天狠天| 亚洲av日韩精品久久久久久久| 亚洲av成本人无码网站| 日韩精品视频免费福利在线观看| 日本一区二区三级在线| 亚洲中文字幕久久精品蜜桃| 黄色视频免费在线观看| 国产成人精品男人的天堂网站| 91色综合久久熟女系列|