亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高維縱向數(shù)據(jù)的亞組識別方法及應(yīng)用

        2022-10-11 13:30:48吉洋瑩
        關(guān)鍵詞:高維回歸系數(shù)亞組

        段 謙,吉洋瑩,黃 磊

        (西南交通大學(xué) 數(shù)學(xué)學(xué)院, 成都 611756)

        0 引言

        亞組識別常用于精準(zhǔn)醫(yī)療[1]或精準(zhǔn)營銷[2],根據(jù)個體之間的異質(zhì)性,針對不同亞組的個體采取特異性的方案,從而提高總體的治療效果或營銷收益。因此,在進(jìn)行統(tǒng)計推斷和決策之前,先正確識別亞組是十分有必要的。常用的亞組識別參數(shù)劃分的方法有貝葉斯方法[3]、分類與回歸樹[4]等。然而,在大數(shù)據(jù)的背景下,遞歸分割方法具有通用性和更強(qiáng)的計算效率,使得一系列非參數(shù)方法流行起來,這類方法包括針對患者分層的預(yù)后特征所提出的PRIM方法[5]、適用于臨床藥物開發(fā)所提出的sequential-batting方法[6]、基于最大似然估計原理所提出的MOB方法[7]等。亞組識別方法的原理是如果某些個體屬于同一亞組,則協(xié)變量對同一亞組的預(yù)期效應(yīng)是相同的。為了更好地對群體進(jìn)行亞組識別,目前已有二值分割[8]、同時分組劃分和特征選擇[9]、分層聚類[10]等方法。有關(guān)亞組識別方法的詳細(xì)文獻(xiàn)綜述,可以參閱Lipkovich等[11]的文章。由于每個個體中有大量的測量數(shù)據(jù),因此可以將每個個體中的數(shù)據(jù)視為一個獨特的亞組,并擬合一個適合這個亞組的模型。與傳統(tǒng)的總體模型相比,該建模方法允許不同亞組間模型的協(xié)變量系數(shù)發(fā)生變化。將在高維縱向數(shù)據(jù)的背景下構(gòu)建一種亞組識別的方法。在詳細(xì)介紹此亞組識別方法前,先介紹一下縱向數(shù)據(jù)和高維變量篩選。

        縱向數(shù)據(jù)[12]是按照時間的推移對一系列的個體進(jìn)行重復(fù)多次測量獲得的兼?zhèn)錂M截面數(shù)據(jù)特性和時間序列特性的一類數(shù)據(jù)??v向數(shù)據(jù)可分析個體的響應(yīng)變量隨時間變化的趨勢,也可橫向?qū)Ρ葌€體之間的差異。根據(jù)研究課題內(nèi)重復(fù)測量的次數(shù),縱向數(shù)據(jù)可以分為不定期測量的且測量次數(shù)有限的稀疏縱向數(shù)據(jù)[13]和定期測量且測量次數(shù)趨于無窮的密集縱向數(shù)據(jù)[14]。現(xiàn)有文獻(xiàn)詳細(xì)地探究了縱向數(shù)據(jù)的統(tǒng)計方法,常見的有參數(shù)方法、非參數(shù)方法以及半?yún)?shù)方法。Liang等[15]基于擬似然的思想提出了廣義估計方程的方法,且驗證了該方法運用到實際縱向數(shù)據(jù)分析的問題中是有效的;趙明濤等[16]研究了縱向數(shù)據(jù)的單指標(biāo)模型的參數(shù)估計方法;李劭珉等[17]利用指數(shù)平方損失函數(shù)對縱向數(shù)據(jù)模型構(gòu)建了一種穩(wěn)健的估計法;Li等[18]提出了基于B樣條基的同質(zhì)劃分方法對縱向數(shù)據(jù)進(jìn)行了研究。隨著大數(shù)據(jù)技術(shù)的發(fā)展,縱向數(shù)據(jù)也越來越容易收集到高維的協(xié)變量,因此對縱向數(shù)據(jù)進(jìn)行回歸建模時,也有必要考慮高維協(xié)變量的篩選。

        模型的協(xié)變量過多,或者說數(shù)據(jù)的維度過高就會產(chǎn)生多重共線性或者偽相關(guān)問題,并導(dǎo)致參數(shù)估計量的方差過大以及響應(yīng)變量預(yù)測值的方差過大,且在擬合高維模型時需要強(qiáng)大的計算量,費時費力。統(tǒng)計學(xué)者們通過引入懲罰估計方法對此類問題進(jìn)行系數(shù)收縮建模,如景甜甜等[19]利用主成分對肌電信號特征參數(shù)進(jìn)行降維,摒棄冗余信息;林倩瑜[20]結(jié)合特征壓縮方法對分類輸出的云服務(wù)組合大數(shù)據(jù)進(jìn)行降維處理;還有l(wèi)asso[21]以及elastic-net[22]等廣為人知的統(tǒng)計學(xué)習(xí)方法,但是這些方法都不具有oracle性質(zhì),即不具備模型選擇的相合性和參數(shù)估計的漸近正態(tài)性;在此基礎(chǔ)上,F(xiàn)an等[23]提出了SCAD(smoothly clipped absolute deviation)方法,Zhang[24]提出了極大極小凹懲罰(minimax concave penalty)方法,簡稱MCP方法。這些懲罰估計方法不僅可以剔除不重要的協(xié)變量,還可以提高計算效率,最終獲得更穩(wěn)健的預(yù)測模型。其中MCP已經(jīng)成為對高維數(shù)據(jù)進(jìn)行變量選擇的一種流行工具。該方法能有效地篩選出不重要的協(xié)變量,從而獲得一個更簡約的模型。除此之外,它還能減少過度擬合的可能性,并使建模過程不那么耗費算力。與lasso等方法相比,MCP方法更能產(chǎn)生稀疏的模型,并獲得參數(shù)的無偏估計。因此將采用MCP對高維縱向數(shù)據(jù)的亞組識別問題進(jìn)行變量選擇。到目前為止,高維縱向數(shù)據(jù)的亞組識別并沒有得到徹底的研究,也沒有完整的解決方案。

        綜上所述,將針對高維縱向數(shù)據(jù)進(jìn)行建模分析,將變量選擇方法與亞組識別方法相結(jié)合,即將MCP方法引入到同質(zhì)劃分中,再通過二值分割的方法對回歸系數(shù)之間的變點進(jìn)行自動識別,系統(tǒng)地構(gòu)建了一套關(guān)于高維縱向數(shù)據(jù)的亞組識別方法。該方法的步驟大致如下:首先對每個個體進(jìn)行建模,通過MCP來獲得回歸參數(shù)的初始估計;然后利用二值分割的同質(zhì)劃分法來識別回歸系數(shù)的變點,獲取被識別的亞組結(jié)構(gòu);最后,在每個已識別的亞組上重新構(gòu)建模型,并再次利用MCP來剔除不重要的協(xié)變量,最終得到更可靠的回歸系數(shù)的估計值。

        剩余部分安排如下:在第1節(jié)建立亞組模型,并基于MCP法構(gòu)建了一種詳細(xì)的亞組識別方法;第2節(jié)將通過統(tǒng)計模擬試驗來評估所構(gòu)建的亞組識別方法的性能;第3節(jié)通過所構(gòu)建的亞組識別方法對國內(nèi)各地區(qū)生產(chǎn)總值和產(chǎn)業(yè)結(jié)構(gòu)進(jìn)行建模,以驗證所構(gòu)建方法的適用性和可行性;第4節(jié)對全文進(jìn)行了簡單的總結(jié)。

        1 亞組模型和方法

        下面將對亞組模型及其參數(shù)估計和亞組識別進(jìn)行討論。

        1.1 亞組模型

        (1)

        其中εi=(εi1,…,εiTi)′,i=1,…,n是均值為零的多元正態(tài)誤差項。假設(shè)對于不同的個體的誤差項是不相關(guān)的,但是εi的元素之間是互相相關(guān)的。

        此外,假設(shè)亞組模型的結(jié)構(gòu)為:

        (2)

        然而,當(dāng)個體數(shù)量和觀測次數(shù)相對較少時,但考慮的協(xié)變量的數(shù)量非常大時,對回歸系數(shù)的估計提出了嚴(yán)重的挑戰(zhàn)。因此,不使用傳統(tǒng)的模型(如最小二乘法)來估計亞組的回歸系數(shù),而是使用MCP方法進(jìn)行估計。采用MCP的損失函數(shù)作為亞組識別的損失函數(shù),有以下優(yōu)勢:該方法不僅降低了協(xié)變量的維數(shù),同時具有oracle性質(zhì);在某種情況下,可使模型能夠正確的識別亞組的數(shù)目,且所估計的回歸系數(shù)具有無偏性。

        1.2 亞組識別和參數(shù)估計

        步驟1(MCP初估) 對于每一個個體,首先通過最小化模型的帶MCP懲罰項的平方損失函數(shù)來估計回歸系數(shù):

        (3)

        其中正則化參數(shù)λ≥0,γ>1,φλ,γ為MCP懲罰函數(shù):

        閾值算子:

        定義Yi=(Yi,1,…,Yi,Ti)′,Xit,0=1,Xi, j=(Xi1, j,…,XiTi, j)′,Xi=(Xi,0,…,Xi,p)。

        則目標(biāo)函數(shù)(3)可用矩陣格式表示為:

        (4)

        對于任意1≤l1≤l2≤n,定義第一部分τ-l1+1觀測的均值與最后一部分l2-τ觀測均值之間的比例差函數(shù)為:

        定義δ為閾值,該閾值可以由AIC或BIC選擇,則識別變點的二值分割算法的步驟如下:

        步驟3(分組建模) 使用步驟2中識別的亞組結(jié)構(gòu),通過MCP對每個亞組構(gòu)建的模型表示為:

        (5)

        (6)

        1.3 MPLS-ADMM算法

        MCP是一種估計量稀疏、連續(xù)、無偏的估計方法,它通過構(gòu)造一個懲罰函數(shù)對回歸系數(shù)進(jìn)行壓縮,并使得一些回歸系數(shù)為0,來構(gòu)建一個簡單且易于解釋的模型,進(jìn)而達(dá)到變量選擇的目的。其主要思想是在回歸系數(shù)的約束條件下,最小化模型的殘差平方和,從而得到回歸系數(shù)的一個稀疏估計。針對非凸函數(shù)優(yōu)化問題,將采用交替方向乘子法[26](the alternating direction method of multipliers,以下簡稱ADMM算法),作為懲罰函數(shù)來估計每次迭代中的更新準(zhǔn)則和停止準(zhǔn)則。ADMM算法結(jié)合了對偶算法和最小二乘法的優(yōu)點,可以在合理的計算代價下解決涉及高維數(shù)據(jù)的非光滑和分布式非凸優(yōu)化問題,此外,它非常適合處理并行和稀疏優(yōu)化問題,特別是統(tǒng)計學(xué)習(xí)的問題。ADMM 算法是一個分解協(xié)調(diào)求解的過程,將大的全局問題分解成多個較小、易求解的局部問題,并通過協(xié)調(diào)子問題的解來得到全局問題的解。其特點是:多次迭代可收斂到一個很高的精度,也可以和其他算法組合使用。用ADMM算法求解MCP簡稱為MPLS-ADMM算法,過程如下。

        針對目標(biāo)函數(shù)(4),引入一個輔助變量αi∈Rp,i=1,…,n,目標(biāo)函數(shù)(4)可以寫成以下形式:

        (7)

        其相應(yīng)的增廣拉格朗日函數(shù)是

        (8)

        (9)

        經(jīng)過一些代數(shù)的計算,式(9)中βi的估計值可以由式(10)獲得:

        (10)

        其中Ip是一個p×p的單位矩陣,在實際解決問題中,當(dāng)p>n的時候,直接計算線性函數(shù)(10)比較困難,因此將其分解成以下形式:

        (11)

        同樣的,式(9)中的αi的估計值可以由式(12)獲得:

        (12)

        其中:

        給定調(diào)節(jié)參數(shù)λ和γ,關(guān)于MPLS-ADMM算法的實現(xiàn)步驟如算法1所示。

        算法1MPLS-ADMM算法

        4.檢查停止標(biāo)準(zhǔn);

        5.結(jié)束while;

        2 模擬研究

        本節(jié)通過設(shè)定多個模擬模型,運用Mento Carlo模擬方法來驗證第1節(jié)中所探究的MPLS-ADMM算法的有效性。在模擬和實際數(shù)據(jù)分析中,使用BIC[27]準(zhǔn)則來選擇調(diào)節(jié)參數(shù)δ,ω表示需要估計的參數(shù)的總個數(shù),其中BIC定義為

        本節(jié)中評估了不同數(shù)量的個體和不同數(shù)量的重復(fù)測量的協(xié)變量選擇、分組、估計和預(yù)測的準(zhǔn)確性??紤]以下真實模型:

        (13)

        這里i=1,…,n;t=1,…,Ti,個體水平協(xié)變量

        Xit=(Xit,1,…,Xit,p)=(0.1t+Xit,1,…,0.1t+Xit,p)

        其中Xit,1,…,Xit,p是相互獨立同分布的,即服從多元正態(tài)分布,均值為零,協(xié)方差Cov(Xit,d,…,Xit,l)=0.2|d-l|。(εi,1,…,εi,T)′是由標(biāo)準(zhǔn)多元正態(tài)分布產(chǎn)生的??紤]以下模擬的亞組結(jié)構(gòu):

        當(dāng)j=0,2,4時,

        當(dāng)j=1,3時,

        故將所有個體分為N=4組。本節(jié)考慮以下4種情形,模擬試驗參數(shù)如表1所示。

        表1 模擬試驗參數(shù)

        在模擬試驗中,假定個體的數(shù)量為n=40或80。 在不失一般性的情況下,考慮平衡設(shè)計,其中重復(fù)測量的數(shù)量對所有個體都是相等的,Ti=30或60。

        為了體現(xiàn)所構(gòu)建的亞組識別方法的優(yōu)點,比較了以下7種方法,如表2所示。

        表2 構(gòu)建的亞組識別方法

        在估計回歸系數(shù)時,方法1是不考慮聚類效應(yīng)的同質(zhì)性擬合方法,是參數(shù)最少的方法,缺點是它完全忽略了亞組。方法2是一種異質(zhì)性擬合方法,它使用個體的初始估計對βi進(jìn)行估計,但不進(jìn)行變點識別,這是一種參數(shù)最多的方法。方法3考慮了亞組的識別,但它對不同的協(xié)變量進(jìn)行了不恰當(dāng)?shù)幕旌?,從而產(chǎn)生的亞組可能不合理。

        通過下列參數(shù)來評估這7種方法的協(xié)變量選擇、亞組識別、估計和預(yù)測的性能。對每個案例和數(shù)據(jù)模擬200次。Lasso和elastic-net用R包glmnet實現(xiàn),SCAD和MCP用R包ncvreg實現(xiàn)。這里的評估準(zhǔn)則有:

        TP:對模型有貢獻(xiàn)的協(xié)變量個數(shù);

        FP:對模型沒有貢獻(xiàn)的協(xié)變量個數(shù);

        N:確定的亞組的組數(shù);

        NMI[29]:標(biāo)準(zhǔn)互信息,它是測量估計所識別的亞組結(jié)構(gòu)接近真實結(jié)構(gòu)的程度,范圍在0~1之間,值越大表明2組之間的相似性越高;假設(shè)P={P1,P2,…}和Q={Q1,Q2,…}是關(guān)于個體{1,2,…,n}的2個不相交的組,i和j分別為該2組的亞組總數(shù),則:

        其中互信息:

        熵:

        表3為200次數(shù)值模擬不同個體數(shù)量和不同測量次數(shù)中的TP和FP的中位數(shù),從表中可知7種方法選擇出的重要協(xié)變量大多為4個,與擬合方法的重要變量的真實數(shù)量相等;比較了這7種方法,可以發(fā)現(xiàn)方法4產(chǎn)生的FP(無效變量)值最少。當(dāng)重復(fù)測量次數(shù)Ti增加時,無效協(xié)變量的數(shù)量降低。

        表3 200次模擬中TP和FP的中位數(shù)

        表4為200次數(shù)值模擬運行中N和NMI的中位數(shù)。從表4可得,同質(zhì)性擬合方法(1個單組)和異質(zhì)性擬合方法(n組)都不能識別個體的真實結(jié)構(gòu)。方法3識別的亞組數(shù)目多于實際亞組,而方法4和方法5、6、7識別的亞組數(shù)與實際亞組數(shù)相當(dāng)接近。同時NMI接近1,也支持了這個觀點,這表明方法4在識別亞組方面比方法3具有更好的性能,方法5和方法6也取得了與方法4相似的結(jié)果。隨著重復(fù)測量次數(shù)Ti的增加,識別真實亞組的機(jī)會也增加。

        表4 200次數(shù)值模擬中N和NMI的中位數(shù)

        表5為200次模擬中的MSE和BIAS的平均值,方法1相較于其他的亞組識別方法,估計和預(yù)測結(jié)果較差。除方法1外,所有其他方法都能很好地估計回歸系數(shù),偏差在0.1左右。方法4的偏差值最小,比其他的方法更準(zhǔn)確。隨著重復(fù)測量次數(shù)Ti的增加,偏差在逐漸變小。

        表5 200次數(shù)值模擬中MSE和BIAS的平均值

        綜上所述,所提出的方法在變量選擇、亞組識別、參數(shù)估計以及各種情況下的預(yù)測方面效果較好。

        3 實證分析

        將亞組識別的方法應(yīng)用于分析全國31個省份的國內(nèi)生產(chǎn)總值和其產(chǎn)業(yè)結(jié)構(gòu)的關(guān)系。該數(shù)據(jù)集包括31個省份2005年到2017年的每年國內(nèi)生產(chǎn)總值(用y表示),共包含了13年的數(shù)據(jù),樣本量共有n=31×13=403個,來源于國務(wù)院發(fā)展研究中心信息院。協(xié)變量包括第一產(chǎn)業(yè)(農(nóng)林牧漁業(yè)x1)、第二產(chǎn)業(yè)(工業(yè)x2、建筑業(yè)x3)、第三產(chǎn)業(yè)(交通運輸和倉儲郵政業(yè)x4、批發(fā)和零售業(yè)x5、住宿和餐飲業(yè)x6、金融業(yè)x7、房地產(chǎn)業(yè)x8)及其兩兩之間的相互作用(單位為億元)。因此,本數(shù)據(jù)總共有36個協(xié)變量。協(xié)變量分別用x1,…,x36來表示。

        為了避免數(shù)據(jù)出現(xiàn)異方差的現(xiàn)象,采取將數(shù)據(jù)取對數(shù)的方法,并考慮隨機(jī)因素對模型的影響,添加隨機(jī)因子ε,則對每個省份建??梢缘玫剑?/p>

        lnyi=βi0+βi1lnxi1+…+βijlnxij+εi

        其中i=1,…,31,j=1,…,36。

        為了綜合地了解31省份的產(chǎn)業(yè)結(jié)構(gòu)的分布對國內(nèi)地區(qū)生產(chǎn)總值的影響,研究了地區(qū)的哪些產(chǎn)業(yè)對國內(nèi)生產(chǎn)總值的影響較大,以及每個產(chǎn)業(yè)對每個地區(qū)的國內(nèi)生產(chǎn)總值的影響是否相等,即地區(qū)之間是否存在亞組。除了采用提出的亞組識別方法(方法4),也考慮了在模擬試驗中提到的識別地區(qū)之間亞組的各種方法。

        MCP迭代的最大次數(shù)設(shè)置為100。通過十折交叉驗證來選擇懲罰模型的調(diào)優(yōu)參數(shù)。表6給出了確定的亞組數(shù)、亞組模型中選擇的非零協(xié)變量數(shù)以及均方誤差;除此之外,構(gòu)造了一種類似AIC的信息準(zhǔn)則來驗證方法的有效性,將該信息準(zhǔn)則稱作AIC extension for subgroup,以下簡稱AIC_ES,其值為:

        AIC_ES=lnMSE+2w/n

        其中w為總的回歸參數(shù)的數(shù)量。

        由表6可知,通過計算所有方法的AIC_ES,方法4的AIC_ES最小,即本文采用的亞組識別方法的綜合性能最好。

        表7是方法4所確定的6個亞組的結(jié)果。表8是每個亞組最終選擇的協(xié)變量和回歸系數(shù)的估計值。

        表6 7種方法的非零協(xié)變量、均方誤差和AIC_ES值

        表7 方法4的亞組結(jié)果

        表8 選擇的協(xié)變量和回歸系數(shù)估計值

        從表7和表8可知:① 對于亞組1,農(nóng)林牧漁業(yè)、工業(yè)、建筑業(yè)、批發(fā)零售業(yè)對地區(qū)生產(chǎn)總值的影響比較顯著,房地產(chǎn)業(yè)和金融業(yè)的影響最不顯著;比如四川省,由于地形的限制及區(qū)域經(jīng)濟(jì)發(fā)展不均衡,其發(fā)展主要靠農(nóng)業(yè)和工業(yè)支撐,金融業(yè)和房地產(chǎn)業(yè)發(fā)展相對較弱。② 對于亞組2,北京和天津的地區(qū)生產(chǎn)總值和建筑業(yè)的關(guān)系比較顯著,其他產(chǎn)業(yè)相對來說并不顯著;從實際情況來看,北京作為我國首都,在2003年到2017年間發(fā)展迅猛,在經(jīng)歷持續(xù)的舊城改造及新城建設(shè)過程中,離不開建筑業(yè)的大力支持,因此北京的建筑業(yè)對城市的發(fā)展作出了巨大的貢獻(xiàn),也提供了大量就業(yè)機(jī)會。③ 對于亞組3,它的工業(yè)和住宿餐飲業(yè)對于地區(qū)生產(chǎn)總值的影響比較顯著;比如廣東是一個工業(yè)大省,第二產(chǎn)業(yè)發(fā)達(dá),各類輕重工業(yè)對地區(qū)生產(chǎn)總值的影響較大;除此之外,廣東第三產(chǎn)業(yè),即服務(wù)、旅游及餐飲產(chǎn)業(yè)完備,因此廣東的住宿餐飲業(yè)比較發(fā)達(dá)。④ 對于亞組4,建筑業(yè)、批發(fā)零售業(yè)以及住宿餐飲業(yè)對地區(qū)生產(chǎn)總值的影響不顯著,其他產(chǎn)業(yè)和地區(qū)生產(chǎn)總值的關(guān)系都比較顯著;如貴州省多山,它的優(yōu)勢在于土地資源豐富,電力便宜,但是缺乏基礎(chǔ)支柱產(chǎn)業(yè),人才流失嚴(yán)重,地區(qū)相對貧窮落后,因此貴州的農(nóng)林牧漁業(yè)和工業(yè)對地區(qū)生產(chǎn)總值的影響較大,但是由于地區(qū)落后,游客較少,住宿餐飲業(yè)相對不發(fā)達(dá)。⑤ 而亞組5的產(chǎn)業(yè)發(fā)展比較平衡,影響較顯著的產(chǎn)業(yè)當(dāng)屬工業(yè);如山東作為裝備制造業(yè)強(qiáng)省,它最重要的動力引擎是從濟(jì)南到青島之間的膠濟(jì)鐵路沿線形成的一條工業(yè)經(jīng)濟(jì)帶,石油、化工、金屬冶煉、機(jī)械等產(chǎn)業(yè)聚集在這里。⑥對于亞組6,從表中可以觀察到農(nóng)林牧漁業(yè)、工業(yè)、住宿餐飲業(yè)、金融業(yè)對地區(qū)生產(chǎn)總值的影響是積極的,而交通運輸業(yè)、建筑業(yè)和房地產(chǎn)業(yè)的影響不積極;比如河南,身處內(nèi)陸,有大量的農(nóng)業(yè)人口和強(qiáng)大的工業(yè)能力,但是沒有沿海優(yōu)越的地理位置,從而造成運輸成本的增加,因此河南的生產(chǎn)總值主要受農(nóng)業(yè)和工業(yè)的影響,而交通運輸業(yè)對河南的地區(qū)生產(chǎn)總值影響較小。通過以上分析,可以得出所提出的亞組識別方法是合理有效的,且有較好的估計性能。

        4 結(jié)論

        構(gòu)建了一種新的高維縱向數(shù)據(jù)的亞組識別方法。為了克服對高維縱向數(shù)據(jù)實現(xiàn)聚類效果的困難,考察了7種不同的方法對不同的個體使用不同的系數(shù)來考慮異質(zhì)性,將MCP方法和二值分割的同質(zhì)劃分方法結(jié)合起來識別回歸系數(shù)中的變點,獲得被識別的亞組結(jié)構(gòu)。通過模擬試驗,可以直觀觀測到該方法的協(xié)變量選擇和回歸系數(shù)估計值較準(zhǔn)確,未知參數(shù)的個數(shù)較少,并且模型的誤差和偏差比其他的模型更小。這些都表明構(gòu)建的方法在識別亞組和估計回歸系數(shù)方面是有效的。此外,通過綜合分析全國31省的產(chǎn)業(yè)結(jié)構(gòu)數(shù)據(jù)集,實證了方法的有效性和適用性,但得到的亞組結(jié)構(gòu)是基于數(shù)據(jù)驅(qū)動的結(jié)果,其經(jīng)濟(jì)學(xué)內(nèi)涵還有待進(jìn)一步研究。希望該方法今后可以有效地運用于其他縱向或面板經(jīng)濟(jì)數(shù)據(jù)的分析中。

        構(gòu)建的方法的性能在一定程度上受δ的選擇所影響。δ的選擇相當(dāng)于變點數(shù)的選擇,采用BIC準(zhǔn)則選擇最優(yōu)δ。通過模擬研究表明它是一個可行可信的選擇方法??紤]的是常數(shù)系數(shù)模型。當(dāng)回歸系數(shù)是時變的,可采用B樣條估計系數(shù)函數(shù),并使用一些特定的函數(shù)來度量系數(shù)函數(shù)之間的偏差,證明所提方法可以適用于時變系數(shù)模型的亞組識別。

        猜你喜歡
        高維回歸系數(shù)亞組
        基于Meta分析的黃酮類化合物對奶牛生產(chǎn)性能和血清免疫指標(biāo)影響的研究
        慢性阻塞性肺疾病患者膈肌移動度分析
        槭葉鐵線蓮亞組的研究進(jìn)展
        園林科技(2021年3期)2022-01-19 03:17:32
        冠心病患者腸道菌群變化的研究 (正文見第45 頁)
        一種改進(jìn)的GP-CLIQUE自適應(yīng)高維子空間聚類算法
        多元線性回歸的估值漂移及其判定方法
        電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
        基于加權(quán)自學(xué)習(xí)散列的高維數(shù)據(jù)最近鄰查詢算法
        多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
        一般非齊次非線性擴(kuò)散方程的等價變換和高維不變子空間
        日韩午夜在线视频观看| 国产精品无码久久久久久久久久| 人妻aⅴ无码一区二区三区| 2017天天爽夜夜爽精品视频| 日本在线观看三级视频| 极品粉嫩嫩模大尺度无码视频 | 亚洲精品成人一区二区三区 | 国产一区二区三区18p| 97久久国产亚洲精品超碰热| www国产亚洲精品久久网站| 青青草视频华人绿色在线| 少妇我被躁爽到高潮在线影片| 中文字幕av伊人av无码av| 日韩精品无码免费专区网站| 国产精品原创av片国产日韩| 天堂麻豆精品在线观看| 国产成人综合日韩精品无码| 国产自偷亚洲精品页65页| 精品免费久久久久国产一区 | 国产亚洲精品久久久久5区| 亚洲а∨天堂久久精品2021| 国产精品福利片免费看| 国产一区二区三区精品乱码不卡 | 人妻风韵犹存av中文字幕| 国产最新女主播福利在线观看| 日韩一卡2卡3卡4卡新区亚洲| 在线观看无码一区二区台湾 | 国产免费久久精品99re丫y| 美女把内衣内裤脱了给男人舔 | 国模丽丽啪啪一区二区| 亚洲片一区二区三区| 最新国内视频免费自拍一区| 在线观看人成视频免费| 无码三级在线看中文字幕完整版 | 亚洲不卡在线免费视频| 久久99亚洲精品久久久久| 欧美尺寸又黑又粗又长| 人妻少妇人人丰满视频网站| 精品亚洲一区中文字幕精品| 亚洲精品国产suv一区88| 成人国产精品一区二区网站|