亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        北京CPI網(wǎng)絡(luò)搜索指數(shù)合成研究

        2019-08-29 02:58:06付麗麗
        科技視界 2019年19期
        關(guān)鍵詞:百度變量文獻

        付麗麗

        【摘 要】本文是研究網(wǎng)絡(luò)搜索數(shù)據(jù)與北京CPI的關(guān)系及預測能力的先導步驟,利用與CPI相關(guān)的關(guān)鍵詞在百度指數(shù)網(wǎng)站獲取的搜索數(shù)據(jù),探究采用因子分析法進行網(wǎng)絡(luò)搜索指數(shù)的合成,最后給出了北京CPI網(wǎng)絡(luò)搜索指數(shù)的合成公式。

        【關(guān)鍵詞】網(wǎng)絡(luò)搜索指數(shù);指數(shù)合成;CPI

        中圖分類號: F224;F49文獻標識碼: A文章編號: 2095-2457(2019)19-0078-002

        DOI:10.19694/j.cnki.issn2095-2457.2019.19.036

        1 問題提出

        居民消費價格指數(shù)(Consumer Price Index,CPI)是反映宏觀經(jīng)濟形勢特別是通貨膨脹程度的一個重要指標,它體現(xiàn)了居民的生活成本高低。北京市統(tǒng)計局通過人工方式在全市固定地點通過手持數(shù)據(jù)采集器定時調(diào)查商品價格,每個月發(fā)布一次CPI數(shù)據(jù)。隨著大數(shù)據(jù)日益受到重視,一些學者已經(jīng)開始運用網(wǎng)絡(luò)搜索數(shù)據(jù)來研究失業(yè)率(Ettredge et al.,2005)[1]、CPI(孟婷婷、2017)[2]等從宏觀經(jīng)濟現(xiàn)象,對互聯(lián)網(wǎng)用戶利用關(guān)鍵詞在網(wǎng)絡(luò)進行搜索而產(chǎn)生的沉淀在搜索引擎等網(wǎng)站上的大數(shù)據(jù)對經(jīng)濟現(xiàn)象進行預測。

        網(wǎng)絡(luò)搜索數(shù)據(jù)能否成功預測經(jīng)濟現(xiàn)象,關(guān)鍵在于關(guān)鍵詞的選擇以及隨后的搜索指數(shù)合成方法。關(guān)鍵詞的產(chǎn)生有兩種方式:一種是互聯(lián)網(wǎng)用戶根據(jù)自己的學識、需求、認知而主動思考出來的,一種是網(wǎng)站根據(jù)用戶的搜索行為主動推薦的。與CPI相關(guān)的關(guān)鍵詞的選擇就是選取與實際CPI指數(shù)走勢相關(guān)且趨向一致的那些關(guān)鍵詞的搜索數(shù)據(jù)。關(guān)鍵詞選擇好后不能直接利用關(guān)鍵詞在網(wǎng)站上的搜索數(shù)據(jù)來建立預測模型,這是因為,相關(guān)的關(guān)鍵詞的數(shù)量較多,關(guān)鍵詞之間有共線性,如果僅僅用各個關(guān)鍵詞的搜索數(shù)據(jù)直接構(gòu)建模型,模型會比較復雜,各變量間的共線性問題會使模型達不到理想的效果,因此需要進行關(guān)鍵詞搜索數(shù)據(jù)(網(wǎng)絡(luò)搜索指數(shù))的合成。本文正是基于這一目的,以百度的關(guān)鍵詞搜索指數(shù)為樣本來探索用因子分析的方法進行關(guān)鍵詞搜索指數(shù)的合成,為后續(xù)構(gòu)建預測模型打下基礎(chǔ)。

        2 文獻綜述

        從查閱的文獻來看,網(wǎng)絡(luò)搜索指數(shù)的文獻多散見于各種研究網(wǎng)絡(luò)搜索指數(shù)與經(jīng)濟及社會現(xiàn)象的文獻里,作為模型構(gòu)建前數(shù)據(jù)處理的一種方式,只有極個別的文獻研究了網(wǎng)絡(luò)搜索指數(shù)的方法。彭賡等(2013)采用谷歌趨勢推薦關(guān)鍵詞的功能進行了四層推薦選取關(guān)鍵詞,之后采用逐步回歸法進行搜索指數(shù)的合成[3]。崔東佳(2014)通過百度搜索引擎搜索與奇瑞、大眾及寶馬三個品牌汽車相關(guān)的關(guān)鍵詞,通過采用綜合賦權(quán)、錯位逐步合成方法對三個品牌相關(guān)的關(guān)鍵詞得到的搜索量計算相應(yīng)的網(wǎng)絡(luò)搜索指數(shù)[4]。孫毅等(2014)認為現(xiàn)有的網(wǎng)絡(luò)搜索指數(shù)的方法主要有直接合成法、相關(guān)性合成法、時差相關(guān)合成法[5]。殷三杰(2018)運用文本挖掘方法及時差相關(guān)分析法篩選關(guān)鍵詞,接著使用逐步回歸分析、Adaptive-Lasso算法、主成分分析三種降維方法進行比較,用于選擇變量[6]。

        從以往的文獻可以看出,網(wǎng)絡(luò)搜索的指數(shù)有不同的合成方法。因子分析是針對變量間有相關(guān)性且變量數(shù)量比較多的情況下的一種降維方法,它能夠從眾多的原有變量中綜合出少數(shù)具有代表性的因子,因此本文嘗試用這種方法進行網(wǎng)絡(luò)搜索指數(shù)的合成。

        3 數(shù)據(jù)的采集和預處理

        本文的樣本數(shù)據(jù)來自于百度指數(shù)平臺上的數(shù)據(jù),選取“CPI”為初始關(guān)鍵詞,利用百度CPI需求圖譜推薦的20個關(guān)鍵詞,篩選出重復的、不相關(guān)的、無意義的關(guān)鍵詞,保留了四個關(guān)鍵詞,進行第二層選取,依此類推到第四層,共得到151個關(guān)鍵詞。之后,采集這些關(guān)鍵詞的搜索指數(shù),時間范圍是2013年1月至2018年12月共72個月的月度數(shù)據(jù),采集區(qū)域的選項是北京,采集設(shè)備的選項是PC端。北京CPI數(shù)據(jù)來自于國家統(tǒng)計局的同比月度數(shù)據(jù)。

        用以上151個關(guān)鍵詞在百度指數(shù)平臺上獲取的搜索數(shù)據(jù),與實際的CPI值進行皮爾遜(Pearson)相關(guān)系數(shù)的計算,選取了相關(guān)系數(shù)大于0.4的關(guān)鍵詞共計18個。

        4 因子分析

        4.1 前提條件檢驗

        因子分析要求原有的變量之間應(yīng)該具有較強的相關(guān)關(guān)系,利用KMO檢驗和巴特利特球體檢驗來判斷原始變量是否適合做因子分析。

        運行軟件所得檢驗結(jié)果如表1所示。

        根據(jù)檢驗結(jié)果,數(shù)據(jù)的KMO檢驗值為0.678>0.6,Bartlett球體檢驗相應(yīng)的概率值接近0.000,小于顯著性水平0.05,表明數(shù)據(jù)適合作因子分析。

        4.2 因子提取

        本文選取特征值大于1的因子,并且根據(jù)公共因子在變量總方差中所占的累計百分數(shù)來選取因子。根據(jù)因子提取和因子旋轉(zhuǎn)結(jié)果,前四個因子的特征值分別為6.839、4.280、2.205、1.032,各因子的貢獻率分別為37.995%、23.777%、12.251%、5.732%,能夠解釋原有18個變量總方差的79.755%。據(jù)此,本文將提取4個公共因子。

        按照方差極大法對因子載荷矩陣旋轉(zhuǎn)后得到結(jié)果如表2所示。

        從表2可以看出,第1個因子在物價上漲、CPI是什么、物價、CPI、外匯牌價表、中國投資、存款這七個變量上有較高的載荷。加息、央行、央行加息、存款利率、通脹、通貨膨脹這六個變量在第2個因子的載荷較高。準備金、物價指數(shù)、美元匯率在第三個因子上的載荷較高。中國股市、基金在第四個因子的載荷較高。

        通過因子得分的協(xié)方差矩陣,可以看出,4個因子完全是正交的、沒有線性相關(guān)性。這說明提取的四個因子能夠解釋原有18個變量所包含的信息。

        4.3 網(wǎng)絡(luò)搜索指數(shù)合成計算

        按照這四個因子分別占四個因子累計方差貢獻率的比值來計算四個因子的系數(shù)即權(quán)重。由此得出北京CPI的網(wǎng)絡(luò)搜索綜合指數(shù)的計算公式為:

        F=0.48F1+0.3F2+0.15F3+0.07F4

        5 結(jié)論

        本文基于CPI相關(guān)的關(guān)鍵詞的百度網(wǎng)絡(luò)搜索數(shù)據(jù),利用因子分析法探索了網(wǎng)絡(luò)搜索指數(shù)合成的方法,并給出了樣本數(shù)據(jù)的北京CPI網(wǎng)絡(luò)搜索綜合指數(shù)的計算公式。這其中的難點就在于如何篩選出能夠反映所要預測某一現(xiàn)象的關(guān)鍵詞,這是采用任何網(wǎng)絡(luò)搜索指數(shù)合成方法的前提。

        【參考文獻】

        [1]MICHAEL E, JOHN G,GILBERT K. Using web-based search data to predict macroeconomic statistics[J]. Communications of the ACM,2005,48(11):87-92.

        [2]孟婷婷.我國CPI波動及外部影響因素研究[D].首都經(jīng)濟貿(mào)易大學,2017.

        [3]彭賡,蘇亞軍,李娜.失業(yè)率預測研究——基于網(wǎng)絡(luò)搜索數(shù)據(jù)及改進的逐步回歸模型[J].現(xiàn)代管理科學,2013(12):40-43.

        [4]崔東佳.大數(shù)據(jù)時代背景下的品牌汽車銷量預測的實證研究[D].河南大學碩士學位論文,2014.

        [5]孫毅,戴維,董紀昌,呂本富.基于主成分分析的網(wǎng)絡(luò)搜索數(shù)據(jù)合成方法研究[J].數(shù)學的實踐與認識,2014,44(21).

        [6]殷三杰.加入網(wǎng)絡(luò)搜索數(shù)據(jù)的居民消費價格指數(shù)預測[D].西北師范大學,2018.

        猜你喜歡
        百度變量文獻
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        抓住不變量解題
        也談分離變量
        Robust adaptive UKF based on SVR for inertial based integrated navigation
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        百度年度熱搜榜
        青年與社會(2018年2期)2018-01-25 15:37:06
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        百度遭投行下調(diào)評級
        IT時代周刊(2015年8期)2015-11-11 05:50:22
        SL(3,3n)和SU(3,3n)的第一Cartan不變量
        精品国产夫妻自拍av| 国产一精品一aⅴ一免费| 黑人巨大精品欧美在线观看| 国产欧美亚洲精品第二区首页| 精品国产乱来一区二区三区| 人妻少妇中文字幕专区| 不卡av网站一区二区三区| 日本办公室三级在线观看| 男女交射视频免费观看网站| 亚洲av永久无码精品古装片| 精品久久久无码中字| 色一情一区二| 囯产精品无码一区二区三区| 亚洲中文字幕不卡无码| 韩国黄色三级一区二区| 国产成人一区二区三区乱| 国产精品网站在线观看免费传媒 | 在线日本看片免费人成视久网| 精品乱人伦一区二区三区| 狠狠做深爱婷婷久久综合一区| 97精品伊人久久大香线蕉app| 毛片av在线播放亚洲av网站| 亚洲国产免费一区二区| 日韩有码在线观看视频| 十四以下岁毛片带血a级| 日本牲交大片免费观看 | 91精品啪在线观看国产色| av中文字幕性女高清在线| 精品国产一区二区三区不卡在线| 色先锋av影音先锋在线| 少妇人妻偷人精品视蜜桃| 亚洲两性视频一三区| 国产精品自拍网站在线| 国产公开免费人成视频| 无码国产精品一区二区免费16| 欧美激情国产一区在线不卡| 亚洲无av码一区二区三区| 日韩精品在线免费视频| 国产卡一卡二卡三| 国产成人拍精品免费视频| 一二三四中文字幕日韩乱码|