亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SSA-LSTM 模型的消費者信心指數(shù)預測研究

        2022-09-10 16:15:24李希亮陳亞娟
        統(tǒng)計理論與實踐 2022年8期
        關鍵詞:變量預測算法

        李希亮 陳亞娟

        (1.山東工商學院 數(shù)學與信息科學學院,山東 煙臺 264005;2.山東工商學院 統(tǒng)計學院,山東 煙臺 264005)

        一、引言

        消費是拉動經濟增長的“三駕馬車”之一,2011—2019 年消費對我國經濟增長貢獻率始終保持在50%以上,逐步成為中國經濟增長的第一驅動力。2020 年受新冠疫情的影響,我國第一季度GDP 同比下降6.8%,對此各地政府出臺多項政策以提高居民消費意愿,促進消費持續(xù)穩(wěn)定增長。在反映消費意愿的眾多經濟指標中,消費者信心指數(shù)是當前最受社會關注的經濟指標之一。消費者信心指數(shù)(Consumer Confidence Index,CCI)是體現(xiàn)消費者信心強弱的指標,是預測經濟走向和消費變化趨勢的先行指標。對CCI 準確且及時地預測有助于了解消費者消費傾向,對制定宏觀經濟政策和推動消費結構升級都有重大意義[1]。

        我國獲取編制CCI 數(shù)據的方法是問卷調查法,雖然編制方法在不斷完善,但傳統(tǒng)統(tǒng)計調查數(shù)據存在成本高、時滯性和低頻性等問題,不能及時預測經濟走勢和了解人們消費心理變化。而網絡搜索數(shù)據具有及時性和易獲取等特點,本文結合網絡搜索數(shù)據,使用深度學習方法預測CCI,從而解決CCI 數(shù)據發(fā)布的時滯性和低頻性等問題。

        關于CCI 預測的研究,早期學者多使用傳統(tǒng)計量經濟模型進行預測。陳雪嬌(2011)使用ARIMA 模型預測我國CCI,發(fā)現(xiàn)ARIMA 模型具有良好的短期預測效果[2]。Lachowska(2013)結合網絡搜索數(shù)據構建VAR模型對CCI 進行分析,發(fā)現(xiàn)構建的模型對個人消費支出短期的預測效果顯著[3]。孫毅和呂本富等(2014)基于網絡搜索數(shù)據構建多元線性回歸模型,發(fā)現(xiàn)基于網絡搜索行為預測的CCI 比宏觀經濟景氣一致指數(shù)領先半年,且預測能力更強[4]。劉偉江和李映橋(2015)、董現(xiàn)壘和Bollen 等(2016)基于谷歌趨勢數(shù)據,使用主成分分析方法合成變量并構建回歸模型預測CCI,相較于傳統(tǒng)預測方法,該模型擁有轉折點預測能力[5-6]。傳統(tǒng)計量經濟模型對于平穩(wěn)時間序列的預測效果較好,但對于呈現(xiàn)非線性、隨機波動的時間序列,其預測效果較差,而CCI 與變量之間的關系復雜多樣,因此一些學者提出采用機器學習或深度學習模型對CCI進行預測。劉苗和李蔚等(2018)基于百度搜索新聞文本數(shù)據,使用情感分析、機器學習等方法建立消費情感指數(shù),發(fā)現(xiàn)消費情感指數(shù)和CCI 存在較高的相關性,且消費情感指數(shù)對短期消費趨勢判斷更靈敏[7]。鄒鴻飛和王建州(2019)加入差分灰狼算法(DEGWO)改進誤差反向傳播(BP)神經網絡模型對CCI 進行預測,結果表明組合模型相較于原模型預測精度顯著提高且對CCI 變化規(guī)律的把握更準確[8]。唐曉彬和董曼茹等(2020)結合網絡搜索數(shù)據,采用LSTM模型對我國CCI進行預測,同時引入SVR 模型、BP 模型以及XGB 模型等進行對比分析,結果表明加入網絡搜索數(shù)據可以提高模型的預測精度,且LSTM 模型的預測效果顯著優(yōu)于其他預測模型。孫景和朱建霖等(2021)以網絡搜索數(shù)據和網絡新聞文本數(shù)據為依據,使用滑動時間窗口動態(tài)篩選預測變量,最終得出使用網絡數(shù)據構建的機器學習預測模型預測精度較高且更為及時[9]。

        梳理現(xiàn)有文獻可以發(fā)現(xiàn),結合網絡搜索數(shù)據,運用機器學習或深度學習方法預測CCI 準確率更高,且LSTM模型預測的精確度和穩(wěn)定性顯著優(yōu)于其他模型[10-12],因而本文采用LSTM 模型,結合網絡搜索數(shù)據對CCI 進行預測。但是,LSTM模型的預測精度較大程度依賴于模型參數(shù)的優(yōu)化和選擇,人為調整參數(shù)存在主觀性和不確定性,難以確保模型參數(shù)的最優(yōu)性。SSA算法穩(wěn)定性高、收斂速度快、全局搜索能力強,且能夠快速尋找到全局最優(yōu)值[13],因此本文引入SSA 對LSTM模型參數(shù)進行自動尋優(yōu),以期提高模型的預測效果。

        二、模型與方法

        (一)L a sso 回歸

        Lasso(Leastabsoluteshrinkageand selection operator)[14]通過構造一個懲罰函數(shù)將相對不重要的特征變量回歸系數(shù)壓縮到零,保留重要的特征變量,從而達到篩選變量的效果。Lasso 回歸對數(shù)據類型設限較少,且能夠彌補逐步回歸和最小二乘回歸陷入局部最優(yōu)估計的不足,防止特征變量較多導致模型過擬合的情況。Lasso 回歸的目標函數(shù)為:

        (二)LSTM 模型

        長短期記憶(Long Short-Term Memory,LSTM)[15]神經網絡模型是一種特殊的循環(huán)神經網絡(RNN),它能夠解決RNN 存在的長期依賴問題和梯度消失問題。其記憶單元結構由細胞狀態(tài)(Cell State)和3 個控制門(Gates)組成,3 個控制門分別為遺忘門(Forget Gate)、輸入門(Input Gate)和輸出門(Output Gate)。LSTM 記憶單元結構圖如圖1。

        圖1 LSTM 記憶單元結構圖

        LSTM神經網絡由多個記憶單元組成,圖1 是一個記憶單元。每個記憶單元對應處理某一時刻的數(shù)據。在t 時刻,記憶單元將對t 時刻的輸入特征向量Xt、t-1 時刻的細胞狀態(tài)Ct-1和t-1 時刻記憶單元的輸出ht-1進行訓練。三類數(shù)據將通過記憶單元的3 個控制門進行運算,計算過程如下:

        首先,遺忘門決定將哪部分信息從細胞狀態(tài)中丟棄。它根據t-1 時刻輸出信息ht-1和t 時刻輸入信息Xt決定需要刪除的信息。遺忘門的控制函數(shù)為:

        其中,ft、Wf、bf分別為遺忘門的門閥向量、權重矩陣和偏置向量,σ 為sigmoid 函數(shù)。

        其次,輸入門決定哪些信息需要進入單元狀態(tài)中。輸入門根據輸入信息ht-1、Xt計算出需要保留下來的新信息it,并根據it計算出待更新的細胞狀態(tài)t。輸入門的控制函數(shù)為:

        其中,it、Wi、bi分別為輸入門的門閥向量、權重矩陣和偏置向量,t、WC、bC分別為待更新的細胞狀態(tài)、權重矩陣和偏置向量,tanh 為激活函數(shù)。

        然后,更新細胞狀態(tài)。將t-1 時刻的細胞狀態(tài)乘以ft,決定需要“遺忘”的信息,再將上一步中待更新的細胞狀態(tài)t乘以it,決定“選擇”哪些信息。細胞狀態(tài)的更新函數(shù)為:

        其中,Ct和Ct-1分別為細胞狀態(tài)在t 時刻和t-1 時刻的對應值。

        最后,輸出門決定將哪些信息從細胞狀態(tài)中輸出。先由其計算輸出結果ot,再由細胞狀態(tài)處理,得到實際輸出ht。輸出門的控制函數(shù)為:

        其中,ot、Wo、bo分別為輸出門的門閥向量、權重矩陣和偏置向量,ht為t 時刻模型的輸出值。

        LSTM模型作為一種改進的RNN 模型,具有深度挖掘數(shù)據信息的能力,相較于傳統(tǒng)方法,其計算能力更強,算法模式更先進。但LSTM模型的預測精度較大程度依賴于模型參數(shù)的優(yōu)化和選擇,人為調整參數(shù)存在一定的主觀性和不確定性,難以確保模型參數(shù)的最優(yōu)性,且耗時長,因此引入優(yōu)化算法對LSTM 模型的參數(shù)進行自主尋優(yōu),既能得到最優(yōu)的模型參數(shù),又能節(jié)省人為調整參數(shù)的時間。

        (三)麻雀搜索算法

        麻雀搜索算法(Sparrow Search Algorithm,SSA)[16]是一種新型的群智能優(yōu)化算法,受麻雀的覓食行為和反捕食行為的啟發(fā)而得。在覓食過程中,麻雀種群分為發(fā)現(xiàn)者和跟隨者,發(fā)現(xiàn)者負責探索覓食區(qū)域和方向,跟隨者追隨它們來獲得食物。當麻雀種群察覺到周圍存在捕食者時,會發(fā)出危險信號,并做出反捕食行為。麻雀不斷尋找最好食物的過程就是尋找最優(yōu)解的過程。

        假設麻雀種群數(shù)量為N,將其放到D 維的搜索空間中,第i 只麻雀在空間中的位置為:xi=[xi,1,xi,2,…,xi,j,…,xi,D],其中i=1,2,…,N,j=1,2,…,D。

        在每次迭代的過程中,發(fā)現(xiàn)者的位置更新公式為:

        其中,Xi,j表示第i 只麻雀在第j 維空間中的位置信息;α 是一個取值范圍為(0,1]的隨機數(shù);t 和itermax分別為當前迭代次數(shù)和最大迭代次數(shù);R2表示預警值,取值范圍為[0,1];ST 表示安全值,取值范圍為[0.5,1];Q 是服從正態(tài)分布的隨機數(shù)。L 為1× d 階的矩陣且所有元素均為1。

        跟隨者的位置更新公式為:

        其中,Xworst和XP分別為當前全局最差位置和當前發(fā)現(xiàn)者所占據的最優(yōu)位置。A 為1×d 階的矩陣,其中每個元素隨機賦值為1 或-1,且A+=AT(AAT)-1。

        在模擬實驗中,假設麻雀種群中有10%—20%的個體能察覺到危險,它們的初始位置是隨機生成的。其位置更新公式為:

        其中,Xbest為當前全局最優(yōu)位置;β 和K 是控制步長的參數(shù)且均為隨機數(shù),其中β ~N(0,1),K 的取值范圍為[-1,1];ε 是使分母不為零的最小常數(shù);fi為當前個體的適應度值,fg和fw分別為當前全局最佳和最差的適應度值。

        (四)算法流程

        SSA-LSTM預測模型的算法流程如下:

        1.將原始數(shù)據分成訓練集和測試集,進行歸一化處理。

        2.將LSTM模型中的超參數(shù)(時間窗口大小、隱藏層單元數(shù)目、學習率)作為優(yōu)化對象。

        3.SSA 相關參數(shù)初始化并設定需優(yōu)化超參數(shù)的范圍,確定最大迭代次數(shù)。

        4.計算初始種群的適應度值并進行排序,找出最優(yōu)和最差的適應度值。

        5.更新發(fā)現(xiàn)者的位置、跟隨者的位置和察覺到危險的麻雀的位置。

        6.獲取當前最優(yōu)值,如果優(yōu)于上一次迭代的最優(yōu)值,則進行更新操作,否則不更新;繼續(xù)進行迭代直到滿足條件為止,最終得到全局最佳的適應度值和全局最優(yōu)解值。

        7.將SSA 得到的最優(yōu)超參數(shù)構建LSTM 模型,對訓練集進行訓練并對測試集進行預測。

        8.將測試集的真實值和預測值進行反歸一化處理,使用不同的評價指標對模型的預測性能進行評估。

        三、實證分析

        (一)選取關鍵詞

        1.數(shù)據來源。本文的中國CCI 數(shù)據來源于中國經濟信息網,選取時段為2011 年1 月至2021 年12 月。在近些年我國經濟形勢整體平穩(wěn)運行的背景下,為了更加細致地刻畫CCI 變化的動態(tài)過程,本文對月度數(shù)據進行三次樣條插值處理,將月度數(shù)據擴充為旬度數(shù)據。

        截至2021 年12 月,百度在我國搜索引擎市場份額中占比高達85.48%,其中PC 端占比為52.32%,移動端占比為94.72%,由百度提供的網絡搜索數(shù)據(百度指數(shù))能涵蓋我國絕大部分網民的檢索信息,所以本文采用百度指數(shù)作為網絡搜索數(shù)據來源。網絡搜索關鍵詞PC 端和移動端的日度數(shù)據來源于百度指數(shù)官網,可用python 程序爬取獲得,選取時段為2011 年1月1 日至2021 年12 月31 日,將關鍵詞日度數(shù)據進行加總平均轉換為旬度數(shù)據。

        2.關鍵詞的選取?;谥袊鳦CI 編制準則,參考相關文獻,采用范圍取詞法和經驗取詞法從經濟形勢、生活狀況、物價水平、就業(yè)、投資和購房六個方面獲取初始關鍵詞,并結合相關文獻和搜索引擎拓展取詞,最終選取與CCI 相關的182 個關鍵詞構成初始關鍵詞詞庫。初始關鍵詞詞庫如表1 所示。

        表1 初始關鍵詞詞庫

        (二)數(shù)據處理與變量篩選

        1.數(shù)據預處理。第一步:缺失值處理。通過python爬蟲獲得的關鍵詞百度指數(shù)日度數(shù)據,有個別關鍵詞數(shù)據存在缺失值嚴重的情況,進行剔除處理。第二步:數(shù)據換頻。本文將CCI 月度數(shù)據進行三次樣條插值處理,轉換為旬度數(shù)據,故需要將關鍵詞日度數(shù)據進行加總平均轉換為旬度數(shù)據。第三步:平滑處理。為了消除網絡搜索數(shù)據的短期波動性,凸顯數(shù)據的長期趨勢,故對關鍵詞旬度數(shù)據采取三期移動平均的平滑處理。

        2.篩選關鍵詞。采用傳統(tǒng)統(tǒng)計方法篩選關鍵詞,可剔除存在較大噪聲的網絡關鍵詞數(shù)據,得到與CCI相關性較強的關鍵詞。通過Pearson 交叉相關分析,取閾值為± 0.6,去除噪聲大的數(shù)據,篩選出與CCI 相關性較強且對應滯后期大于零的關鍵詞,獲得26 個關鍵詞。

        3.確定預測變量。由上一步得到了與CCI 相關性較高的26 個關鍵詞,但不同關鍵詞在模型中的解釋能力不同,有的關鍵詞在模型中邊際貢獻較弱,需要剔除。采用Lasso 回歸算法對以上26 個關鍵詞進行降維,剔除解釋能力較弱的關鍵詞,從而獲得最終的預測變量。

        Lasso 回歸模型中的λ 值是待確定的,通過正則化路徑圖可以確定λ 的取值范圍,再結合交叉驗證法確定λ 值。使用sklearn 模塊中的LassoCV 類進行交叉驗證,確定λ=0.0251。將最終的λ 值代入Lasso 回歸模型,篩選得到5 個預測性能較優(yōu)的關鍵詞,分別是美元、電腦、房貸計算器、搜房網、鏈家。預測變量與CCI的相關系數(shù)和對應滯后階數(shù)如表2 所示。

        表2 預測變量與消費者信心指數(shù)相關性分析

        由表2 可知,CCI 和自身1 階滯后相關系數(shù)高達0.9949,呈顯著正相關。為了增強模型的預測效果,將CCI 的1 階滯后作為預測變量。最終預測變量中包含了三個購房方面的關鍵詞,分別為房貸計算器、搜房網和鏈家,表明CCI 和購房方面的關鍵詞相關性很高,說明消費者對房價和房源相關信息的關注度較高,購房信息會影響居民的消費意愿和信心。消費者對美元和電腦的搜索體現(xiàn)了對經濟形勢和物價水平的關注度。消費者根據自身的消費意愿和關注點,搜索相關信息,并基于相關信息對消費結構進行一定調整。從表2 可以看出,關鍵詞電腦和搜房網與CCI 高度負相關,分別具有高31 階和1 階的滯后相關性。關鍵詞美元、房貸計算器和鏈家與CCI 高度正相關,分別具有高22 階、20 階和25 階的滯后相關性。

        綜上可得,最后的預測變量為CCI 滯后1 階、美元滯后22 階、電腦滯后31 階、房貸計算器滯后20 階、搜房網滯后1 階和鏈家滯后25 階,被預測變量為當期CCI,樣本容量為363 期。

        (三)建立預測模型與效果評價

        1.歸一化。先將數(shù)據劃分為訓練集和測試集,本文將最后36 期(一年)CCI 作為測試集預測對象。對數(shù)據進行歸一化變換以消除不同變量之間的量綱差異對模型預測結果的影響。公式如下:

        其中,xi、xmax、xmin、xi' 分別是變量X 中第i 個樣本原始值、最大值、最小值和歸一化后的數(shù)據,xi'取值范圍為[0,1]。使用歸一化后的數(shù)據構建模型,并將最終預測值進行反歸一化變換得到實際預測值。

        2.模型預測性能評價指標。為了對比SSA-LSTM模型和LSTM 模型的預測性能,本文采用擬合優(yōu)度R2、均方根誤差RMSE、平均絕對誤差MAE、平均絕對百分比誤差MAPE 四種指標對模型預測性能進行評價。指標定義公式如下:

        3.預測結果分析。本文基于Python 3 語言環(huán)境和Pytorch 深度學習框架構建SSA-LSTM預測模型,該模型輸入層的維度為6,分別為CCI 滯后1 階、美元滯后22 階、電腦滯后31 階、房貸計算器滯后20 階、搜房網滯后1 階和鏈家滯后25 階,輸出層為CCI 的預測值。使用Adam 優(yōu)化算法進行訓練,激活函數(shù)為sigmoid 函數(shù)和tanh 函數(shù),損失函數(shù)設定為均方誤差(MSE),迭代次數(shù)設為500 次。通過SSA 算法尋優(yōu),得到的最優(yōu)超參數(shù)分別為滑動窗口timesteps=7,隱藏層單元數(shù)目num_net=95,學習率η =0.005。將最優(yōu)超參數(shù)帶入LSTM模型,得到最后36 期(2021 年1 月上旬至2021年12 月下旬)預測結果,將預測結果進行反歸一化處理,得到CCI 的預測值。CCI 預測結果圖如下:

        從圖2 可以看出,SSA-LSTM 模型一年期預測效果顯著,CCI 的預測值和實際值差距很小,充分利用了歷史數(shù)據信息,且轉折點預測能力較強。為了驗證引入SSA 算法對LSTM 模型尋優(yōu)效果更好,將其與LSTM基準模型進行對比,計算出預測性能評價指標,如表3 所示。

        圖2 S S A -LSTM 模型預測結果圖

        表3 測試集預測結果統(tǒng)計性能對比

        由表3 可以看出,在對CCI 的一年期預測中,引入SSA 算法對LSTM模型參數(shù)進行自主尋優(yōu)顯著提升了模型的預測性能。具體而言,在預測效果方面,SSALSTM模型的擬合優(yōu)度R2為0.9909 接近于1,相較于LSTM基準模型提高了2.57%,說明引入SSA 算法能有效提高LSTM模型的預測效果。在預測精度方面,SSALSTM 模型的RMSE、MAE、MAPE 明顯小于LSTM 模型,與LSTM模型相比,SSA-LSTM模型的預測精度提高了0.12%,說明引入SSA 算法后LSTM模型的預測精度顯著提高。SSA 算法之所以能夠有效提高LSTM模型的預測性能,在于其穩(wěn)定性高、收斂速度快、且全局搜索能力強,保證了預測結果的穩(wěn)定性和準確性。

        四、結論

        本文針對CCI 的非線性時變特征,結合相關網絡搜索數(shù)據,使用Lasso 算法進行合理降維,采用LSTM神經網絡模型對CCI 進行預測,并引入SSA 算法進行參數(shù)尋優(yōu),構建SSA-LSTM 模型對CCI 進行預測研究。從最后篩選出的網絡搜索關鍵詞可以看出,消費者對經濟形勢、物價水平和房價情況等與人民生活息息相關的經濟指標的關注度與CCI 高度相關。根據預測結果圖可以看出,SSA-LSTM 模型具有很好的轉折點預測能力。通過對比LSTM模型和SSA-LSTM模型的預測結果發(fā)現(xiàn),引入SSA 算法的LSTM 模型預測效果和預測精度顯著高于LSTM基準模型,預測效果和預測精度分別提高了2.57%和0.12%。同時,結合網絡搜索數(shù)據的當月CCI 預測值在下月初即可獲得,而官方當月CCI 在下月下旬才能獲得,即基于SSA-LSTM模型結合網絡搜索數(shù)據的CCI 預測值比官方發(fā)布數(shù)據領先半個月左右,其預測結果能夠及時為市場調控提供參考依據。以上結果表明SSA-LSTM預測模型具有較優(yōu)的預測效果和較高的預測精度,且預測結果比官方發(fā)布數(shù)據更為及時,是一種有效的CCI 預測模型。

        綜上所述,本文構建的SSA-LSTM 模型能夠準確預測CCI 的變化,結合篩選出的高度相關的網絡搜索關鍵詞,能夠及時為宏觀經濟決策和相關政策制定提供參考,可及時了解消費者信心變化情況從而更好地促進消費結構升級。同時,本文構建的SSA-LSTM 模型亦可用于其他宏觀經濟指標預測研究。

        猜你喜歡
        變量預測算法
        無可預測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預測卷(A卷)
        選修2-2期中考試預測卷(B卷)
        抓住不變量解題
        也談分離變量
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        不必預測未來,只需把握現(xiàn)在
        一種改進的整周模糊度去相關算法
        五十路熟妇高熟无码视频 | 国产精品一区二区三区四区亚洲 | 中文字幕久久熟女人妻av免费| 中文字幕av永久免费在线| 亚洲av无码专区在线观看成人| 夜夜爽一区二区三区精品| 人妻无码人妻有码不卡| 国产色视频在线观看了| 国产私人尤物无码不卡| 四房播播在线电影| 天天澡天天揉揉AV无码人妻斩 | 国产成人精品免费视频大全| 日韩在线视频专区九区| 国产免费久久精品99久久| 亚洲欧美另类激情综合区| 青春草在线视频精品| 看国产亚洲美女黄色一级片| 国产精品国产精品国产专区不卡| 天堂√中文在线bt| 青榴社区国产精品| 日韩麻豆视频在线观看| 国产精品泄火熟女| 亚洲三级黄色| 丁香婷婷激情俺也去俺来也| 欧美xxxxx高潮喷水| 女性女同性aⅴ免费观女性恋| 免费一级黄色大片久久久| 亚洲精品中文字幕乱码无线| 久久久久夜夜夜精品国产| 亚洲国产av一区二区三区四区| 亚洲熟女国产熟女二区三区| 永久免费视频网站在线| 99久久综合精品五月天| 人妻无码AⅤ不卡中文字幕| 久久精品亚洲热综合一本色婷婷| 久久亚洲av成人无码电影a片| 妺妺窝人体色www在线图片| av免费看网站在线观看| 日本久久伊人特级黄色| 伊人色综合视频一区二区三区 | 国产一区二区三区免费精品视频|