亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        矩陣型因子模型及其在我國省際人口流動(dòng)網(wǎng)絡(luò)數(shù)據(jù)中的應(yīng)用

        2022-06-14 08:31:36王浩瑩徐賽男王亞杰馬維軍袁超鳳
        關(guān)鍵詞:方法模型

        王浩瑩, 徐賽男, 王亞杰, 馬維軍, 袁超鳳

        (黑龍江大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 哈爾濱, 150080)

        0 引 言

        高維矩陣值時(shí)間序列數(shù)據(jù)廣泛存在于金融經(jīng)濟(jì)學(xué)、氣象水文和圖像處理等許多領(lǐng)域。這類數(shù)據(jù)復(fù)雜度高,特點(diǎn)難以發(fā)現(xiàn),因此,對高維矩陣值時(shí)間序列數(shù)據(jù)進(jìn)行分析并尋找規(guī)律具有十分重要的意義。

        近年來,針對高維矩陣值時(shí)間序列數(shù)據(jù),眾多學(xué)者進(jìn)行了相關(guān)研究[1-4]。2019年,Wang等提出了一個(gè)矩陣型因子模型。該模型在保證了數(shù)據(jù)的矩陣結(jié)構(gòu)的同時(shí),實(shí)現(xiàn)了顯著的降維[1]。2019年,Chen等基于上述模型通過對行和列施加線性約束,并將先驗(yàn)知識融入到了模型中,從而增強(qiáng)了觀測矩陣中潛在因子的可解釋性[5]。2020年,Chen等給出了上述矩陣型因子的另一個(gè)應(yīng)用研究,即用在動(dòng)態(tài)國際貿(mào)易數(shù)據(jù)上。由于國際貿(mào)易數(shù)據(jù)可以被整理為一個(gè)動(dòng)態(tài)網(wǎng)絡(luò)數(shù)據(jù),也可視為矩陣型時(shí)序數(shù)據(jù)[6]。2019年,Yu等針對上述矩陣型因子模型給出了一個(gè)投影估計(jì)方法,并證明了其投影估計(jì)有較高的收斂階數(shù)[7]。2020年,Chen等進(jìn)一步考慮了上述矩陣型因子模型的統(tǒng)計(jì)推斷問題[8]。

        針對上述矩陣型因子模型,給出了模型可識別的充分條件,并從擬似然的角度給出了一個(gè)新的參數(shù)估計(jì)方法。最后,將上述模型應(yīng)用于我國31個(gè)省(包括4個(gè)直轄市)之間的人口流動(dòng)網(wǎng)絡(luò)數(shù)據(jù),研究其網(wǎng)絡(luò)結(jié)構(gòu)的動(dòng)態(tài)變化規(guī)律。

        1 矩陣型因子模型

        1.1 模型介紹

        Xt=RFtC′+Et

        (1)

        vec(Xt)=(C?R)vec(Ft)+vec(Et)

        (2)

        基于上述模型便可將高維觀測矩陣Xt在時(shí)間上的相依性用更低維(k1×k2)的因子矩陣來驅(qū)動(dòng),達(dá)到降維的目的。

        1.2 可識別性研究

        Σ=(C?R)ΣF(C′?R′)+σ2Ip?Iq

        (3)

        定理1設(shè)θ={R,C,ΣF,σ2}為所有參數(shù),在模型假設(shè)(IC1)和(IC2)的條件下,模型(1)的協(xié)方差陣結(jié)構(gòu)(2)式滿足可識別,即由Σ(θ)=Σ(θ*),可得θ=θ*。

        1.3 矩陣型因子的擬似然估計(jì)

        對于傳統(tǒng)的向量型因子模型,2015年,Ng等利用矩陣分解得到了參數(shù)的擬似然估計(jì)[11],2016年,Bai等利用兩步擬似然法求出了估計(jì),并證明了擬似然估計(jì)在一定條件下滿足相合性,且具有理想的收斂速度[12]。針對矩陣型因子模型(1),將通過擬似然的方法(Quasi-maximum likelihood estimation, Q-MLE),對其參數(shù)進(jìn)行估計(jì)。

        (4)

        則E(MXX)=Σ。因此,構(gòu)建如下的擬似然函數(shù):

        L(θ)=-log|Σ|-tr(MXXΣ-1)

        (5)

        由Σ的特殊結(jié)構(gòu)(如式(3)),可以求出其逆矩陣及行列式的顯式表達(dá)式(見定理2),從而可對上述擬似然進(jìn)行化簡。

        定理2假設(shè)Σ=(C?R)ΣF(C′?R′)+σ2Ip?Iq,且滿足R′R=pIk1;C′C=qIk2,則其逆和行列式為:

        由定理2,擬似然函數(shù)可化簡為:

        (6)

        接下來便通過以下三步分別給出R,C,{ΣF,σ2}的估計(jì)。

        (1)給定C、 {ΣF,σ2}及R′R=pIk1, 求R的估計(jì)。

        通過簡單的矩陣運(yùn)算,式(6)可化簡為:

        (7)

        表1 更新R為

        (2)給定R、{ΣF,σ2}及C′C=qIk2,求C的估計(jì)。

        方法與求R的估計(jì)類似,化簡擬似然函數(shù)式(6)為:

        (8)

        (3)利用EM算法,估計(jì){ΣF,σ2}。

        設(shè)θ1={ΣF,σ2},給定R和C,可以通過EM過程進(jìn)行估計(jì)。令完全的擬似然函數(shù)為:

        (9)

        進(jìn)一步在正態(tài)假設(shè)下可得潛在因子的條件分布為:

        vec(Ft)|vec(Xt)~N(μ,Δ)

        (10)

        其中μ=ΣF(C′?R′)Σ-1vec(Xt),Δ=ΣF-ΣF(C′?R′)Σ-1(C?R)ΣF, 則Q函數(shù)為:

        (11)

        最大化Q函數(shù)有:

        (12)

        (13)

        綜上三步,采用如下的交替最大化算法來估計(jì)參數(shù),如表2所示。

        表2 交替最大化算法

        2 模擬研究

        將通過數(shù)值模擬來驗(yàn)證上述擬似然估計(jì)的有效性,并與文獻(xiàn)[1]給出的估計(jì)方法進(jìn)行比較。

        2.1 數(shù)據(jù)生成

        根據(jù)模型(1)生成觀測數(shù)據(jù)Xt,其步驟如下:

        (4) 觀測數(shù)據(jù)Xt通過式(1)生成。

        分別考慮了k1=k2=1、k1=k2=2及p,q,T=20, 50, 80, 100的情況,每種情形下重復(fù)500次。

        2.2 模擬結(jié)果

        表3呈現(xiàn)了k1=k2=1時(shí)參數(shù)的估計(jì)結(jié)果。其中,σ2=1,Φ=0.55,則因子的方差ΣF=1.433 7。由表3可以看出,隨著p、q和T的增加,兩種參數(shù)的估計(jì)效果逐漸變好,且采用的估計(jì)方法始終優(yōu)于文獻(xiàn)[1]中的方法。此外,文獻(xiàn)[1]中的方法僅能給出載荷矩陣的估計(jì),而本文的方法不僅能給出載荷的估計(jì),還能給出與方差有關(guān)的參數(shù)的估計(jì)。

        表3 k1=k2=1的模擬結(jié)果

        表4 k1=k2=2的模擬結(jié)果

        3 人口流動(dòng)網(wǎng)絡(luò)數(shù)據(jù)實(shí)證分析

        人口的遷徙流動(dòng)一直是涉及地理學(xué)、管理學(xué)和人口學(xué)等學(xué)科的熱門研究課題。目前,人口的流動(dòng)也是國內(nèi)新冠疫情擴(kuò)散的主要原因[15-17]。本節(jié)將對由百度遷徙大數(shù)據(jù)平臺得到的我國各省之間的人口流動(dòng)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析,研究其網(wǎng)絡(luò)結(jié)構(gòu)的動(dòng)態(tài)變化規(guī)律。

        3.1 數(shù)據(jù)介紹與整理

        本文數(shù)據(jù)來源于百度遷徙大數(shù)據(jù)平臺(https://qianxi.baidu.com/),該平臺利用百度地圖定位服務(wù)LBS(Location based service),通過手機(jī)定位信息記錄用戶行為軌跡,記錄出人口流動(dòng)過程中的起止城市,路徑流強(qiáng)度。研究數(shù)據(jù)包括從2020年10月1日到2021年8月29日(共330日)的逐日的31個(gè)省級行政區(qū)(包括直轄市和自治區(qū),不含港澳臺)之間的省際流動(dòng)數(shù)據(jù)。初始數(shù)據(jù)包含關(guān)于每個(gè)省遷入、遷出人口的規(guī)模指數(shù),和其遷入、遷出來源省份的比率。時(shí)間跨度包含2021年元旦前、春運(yùn)和暑假。由于百度遷徙網(wǎng)站缺失7月8日、8月12日和8月25日的數(shù)據(jù),故這三日忽略不計(jì)。

        3.2 結(jié)果與解釋

        首先,對于每個(gè)窗口,利用文獻(xiàn)[5]中的方法選出因子的個(gè)數(shù),即k1,k2,結(jié)果如表5所示。同時(shí),也列出了當(dāng)k1=k2=3時(shí)的累計(jì)方差貢獻(xiàn)率。對于每個(gè)窗口,當(dāng)因子數(shù)k1=k2=3時(shí),模型至少解釋了總方差的80%以上。故為了便于解釋和比較,對所有時(shí)間窗口均采用k1=k2=3來估計(jì)載荷矩陣R和C。

        表5 因子Ft的維度的估計(jì)和k1=k2=3時(shí)的累計(jì)方差貢獻(xiàn)率

        圖1 因子個(gè)數(shù)為k1=k2=3時(shí)的載荷熱圖

        觀察圖1中的(R1),除1月以廣東為主導(dǎo)外,其他窗口都是長三角(長江三角洲城市群)城市所在省,例如上海、江蘇、浙江、安徽,占據(jù)了第1個(gè)遷出樞紐的主導(dǎo)地位。觀察(C1),除1月以外,長江三角洲城市群也占據(jù)了第1個(gè)遷入樞紐的主導(dǎo)地位。這與江浙滬皖三省一市經(jīng)濟(jì)實(shí)力最強(qiáng),城市聚集程度高密切相關(guān),從而使得人口的短期流動(dòng)最為活躍。1月對應(yīng)的窗口實(shí)際包含12月、1月、2月,包含春運(yùn)期間,是以泛珠三角主要省份(湖南、廣西、江西)為第1個(gè)遷入樞紐,以廣東為第1個(gè)遷出樞紐。這與他們的地理位置及密切的經(jīng)濟(jì)往來相關(guān)。

        圖1中(R2, C2)可分為兩部分,11~12月、4~7月分別是以北京為主導(dǎo)地位的京津冀(北京、天津、河北)地區(qū)為第2個(gè)遷出和遷入樞紐。1~3月則是以泛珠三角省份(湖南、廣西、江西)為主的第2個(gè)遷出樞紐,同時(shí)也是以廣東為主的第2個(gè)遷入樞紐。

        由圖1中的R3,從11月、12月、1月、2~3月、4~7月數(shù)據(jù)可知,第3個(gè)遷出樞紐依次由河北,變?yōu)閺V東,變?yōu)殚L三角、變?yōu)閺V東、變?yōu)楹颖?。由圖1中的C3,在上述時(shí)間段中,第3個(gè)遷入樞紐依次由河北,變?yōu)榉褐槿?、變?yōu)殚L三角、變?yōu)榉褐槿?,變?yōu)楹颖薄?/p>

        綜合圖1來看,山東、河南的人口流動(dòng)情況較長三角、珠三角和京津冀都較弱,長三角省群樞紐主要分布在第一、三個(gè)樞紐,且在所有時(shí)間段上一直都是人口流動(dòng)情況明顯的省群,京津冀省群樞紐在第二、三個(gè)樞紐都占了比較明顯的主導(dǎo)位置,主導(dǎo)時(shí)間主要是11~12月、4~7月,而珠三角省省群樞紐在一、二、三個(gè)樞紐中都占有較大載荷,主導(dǎo)時(shí)間主要是12~3月。

        圖2 潛在樞紐的人口流動(dòng)網(wǎng)絡(luò)圖: (a) 2021年2月; (b) 2021年7月

        觀察圖2,2月份、7月份的第1個(gè)遷出、遷入樞紐均為長三角省群。2月份的第2個(gè)遷出、遷入樞紐為泛珠三角省群,7月份以北京為主。2月份的第3個(gè)遷出、遷入樞紐為廣東,7月份的為河北。由實(shí)線部分可以看出所有樞紐的內(nèi)部人口流動(dòng)性最強(qiáng),比如遷出樞紐1與遷入樞紐1之間的實(shí)線最粗,說明長三角省群內(nèi)部的人更偏好于在長三角流動(dòng),這是受地理因素影響比較大的原因。

        最后,為了呈現(xiàn)省份間流動(dòng)情況的相似性,分別基于2月份和7月份的載荷矩陣進(jìn)行層次聚類(圖3)。本文選取歐幾里得距離和離差平方和法進(jìn)行層次聚類[19-20]。圖3(a)依次2月份R和C的結(jié)果,圖3(b)依次為7月份R和C的結(jié)果。

        由圖3可以很容易地識別出長三角群體和珠三角群體。一般來說,地理位置相近、經(jīng)濟(jì)和文化聯(lián)系密切的省份通常會屬于一個(gè)群體,人口流動(dòng)情況會相似。比如2月的廣東、湖南和廣西人口流動(dòng)很活躍,故整個(gè)2月可標(biāo)記為“珠三角活躍”、“長三角-京津冀活躍”和“不那么活躍”。而省份之間的關(guān)系也在發(fā)生變化,2月的珠三角在人口流動(dòng)網(wǎng)絡(luò)中占主導(dǎo)地位,而后京津冀在人口網(wǎng)絡(luò)中越來越活躍,7月成為了一個(gè)單獨(dú)的集群。此聚類圖和圖1、圖2所說明的情況也相呼應(yīng),這也說明了本文的結(jié)果具有一定的可靠性。

        圖3 根據(jù)遷出和遷入載荷矩陣對省份聚類: (a) 2021年2月; (b) 2021年7月

        4 結(jié) 論

        為了更好地理解矩陣值時(shí)間序列數(shù)據(jù)的動(dòng)態(tài)性質(zhì),本文針對文獻(xiàn)[1]中所研究的矩陣型因子,提出了可識別性條件,并基于擬似然的參數(shù)估計(jì)方法,不僅求出了載荷矩陣的估計(jì),還求出了潛在因子矩陣的估計(jì)。同時(shí),通過模擬驗(yàn)證了所提出的估計(jì)方法在矩陣維數(shù)較大或者在時(shí)間長度較大時(shí)也是更具有優(yōu)越性的。用所提出的估計(jì)方法針對人口流動(dòng)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行了分析,研究其網(wǎng)絡(luò)結(jié)構(gòu)的動(dòng)態(tài)變化規(guī)律,研究結(jié)果能為中國省際人口流動(dòng)的動(dòng)態(tài)性研究提供一種新型的可參照方法。

        本文所用的高維矩陣型時(shí)間序列模型可以更直觀地呈現(xiàn)出網(wǎng)絡(luò)型數(shù)據(jù)的動(dòng)態(tài)性變化。由于并沒有對網(wǎng)絡(luò)模型提出任何分布假設(shè),所得到的載荷矩陣和潛在因子矩陣也都是直接從數(shù)據(jù)網(wǎng)絡(luò)中得到的,而且所提出的方法可以有效地降低動(dòng)態(tài)網(wǎng)絡(luò)的維數(shù),并揭示其核心結(jié)構(gòu),得到的載荷矩陣的估計(jì)和潛在因子的估計(jì)可以進(jìn)一步用于動(dòng)態(tài)型網(wǎng)絡(luò)數(shù)據(jù)的研究和預(yù)測,也可以廣泛運(yùn)用到其他動(dòng)態(tài)因子模型。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        国产性感主播一区二区| 最近中文字幕在线mv视频在线 | 国产成人高清精品亚洲一区| 99在线视频这里只有精品伊人| 国产色xx群视频射精| 国产真人无遮挡作爱免费视频 | 国产一级r片内射免费视频| 亚洲福利二区三区四区| 亚洲成熟丰满熟妇高潮xxxxx| 亚洲欧美日韩国产精品专区| 思思久久96热在精品不卡| 国内揄拍国内精品少妇国语| 99re国产电影精品| 一区二区三区极品少妇| 高清毛茸茸的中国少妇| 国产大学生粉嫩无套流白浆 | 国产亚洲精品97在线视频一 | 人人妻人人澡av天堂香蕉| 国产精品香蕉网页在线播放| 久久精品中文字幕有码| 免费观看羞羞视频网站| 亚洲av日韩精品久久久久久| 国产精品狼人久久久影院| 国产自拍成人免费视频| 亚洲av中文无码乱人伦在线播放| 日韩中文网| 国产在线播放免费人成视频播放| 一边摸一边做爽的视频17国产 | 国产精品原创巨作AV女教师| 国产高清亚洲精品视频| 国产精品网站91九色| 日产无人区一线二线三线乱码蘑菇| 久久人妻AV无码一区二区| 亚洲人妻精品一区二区三区| 人妻 丝袜美腿 中文字幕| 国产午夜视频在线观看| 亚洲中文字幕不卡无码| 97中文字幕精品一区二区三区| 日本japanese丰满多毛| 欧美刺激午夜性久久久久久久| 人妻少妇偷人精品视频|