亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多變量乘用車銷量預(yù)測模型研究

        2023-12-05 13:04:36段昊江吳冰
        汽車文摘 2023年12期
        關(guān)鍵詞:乘用車銷量變量

        段昊江 吳冰

        (同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海 201800)

        縮略語

        ARMA Auto-Regressive Moving Average Model

        RBF Radial Basis Function

        SARIMA Seasonal Auto-Regressive Moving Average Model

        BP Back Propagation

        GDP Gross Domestic Product

        VECM Vector Error Correction Model

        XGBOOST eXtreme Gradient Boosting

        VAR Vector Autoregressive Model

        CNN Convolutional Neural Network

        MSFM Multivariate Sales Forecasting Model

        CPI Consumer Price Index

        GDBT Gradient Boosting Decision Tree

        MAPE Mean Absolute Percentage Error

        SVR Support Vector Regression

        0 引言

        近年來,隨著國民經(jīng)濟(jì)的高速發(fā)展和居民可支配收入的不斷提高,我國乘用車市場已經(jīng)趨于飽和,乘用車市場消費(fèi)主力萎縮,加之近幾年我國城市公共交通系統(tǒng)的完善、高鐵線路網(wǎng)的擴(kuò)散、城市限行等因素的作用,導(dǎo)致了汽車銷量的低迷。2020 年,我國乘用車銷量為2 006萬輛,創(chuàng)近年新低。2021年,隨著國內(nèi)疫情逐步得到控制,乘用車行業(yè)逐漸回暖,全國乘用車銷量達(dá)到2 175 萬輛。2022 年,乘用車銷量更是上漲到2 309 萬輛。在汽車行業(yè)日漸繁榮的大環(huán)境下,無論是已經(jīng)在市場中占據(jù)席位的車企還是打算進(jìn)入汽車行業(yè)的“新人”,都應(yīng)認(rèn)真剖析市場現(xiàn)狀格局和國家政策,準(zhǔn)確把握行業(yè)發(fā)展方向,精準(zhǔn)識(shí)別消費(fèi)者需求,從而制定相適應(yīng)的生產(chǎn)目標(biāo),實(shí)現(xiàn)按需生產(chǎn)。

        在乘用車銷量預(yù)測研究中,對(duì)于變量的選擇,早期大部分學(xué)者只基于歷史銷量數(shù)據(jù)展開預(yù)測[1-2],雖然預(yù)測模型與結(jié)果對(duì)市場長期性的變化有著比較好的效果體現(xiàn),但是當(dāng)市場出現(xiàn)波動(dòng)時(shí),時(shí)間序列模型的預(yù)測精度就會(huì)大幅度降低。有研究發(fā)現(xiàn)宏觀經(jīng)濟(jì)因素會(huì)對(duì)乘用車的銷量產(chǎn)生很大影響,是非常重要的外部因素,國內(nèi)外學(xué)者開始考慮將宏觀經(jīng)濟(jì)指標(biāo)作為變量添加到模型中進(jìn)行預(yù)測研究[3-5]。近年來,隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,消費(fèi)者們幾乎都喜歡在網(wǎng)絡(luò)中搜索自己想購買的商品,并將網(wǎng)絡(luò)中的相關(guān)信息和其他消費(fèi)者的評(píng)價(jià)作為自己是否消費(fèi)的參考。網(wǎng)絡(luò)搜索數(shù)據(jù)為商品市場發(fā)展動(dòng)向和趨勢提供了一定程度的前瞻,越來越多的學(xué)者都開始應(yīng)用時(shí)效性更好的網(wǎng)絡(luò)搜索數(shù)據(jù)來進(jìn)行乘用車的銷量預(yù)測研究[6-10]。

        但是,國內(nèi)外學(xué)者們?cè)谶M(jìn)行乘用車銷量預(yù)測的研究時(shí),大多只選取一到兩類影響變量進(jìn)行研究,少有將上述變量類型綜合起來同時(shí)進(jìn)行考慮的研究,因此,本文在已有研究的基礎(chǔ)上,以乘用車整體市場為研究對(duì)象,逐步添加歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)、網(wǎng)絡(luò)搜索關(guān)鍵詞這些影響乘用車銷量的變量,建立銷量預(yù)測模型并進(jìn)行效果比對(duì)分析。

        1 文獻(xiàn)綜述

        在乘用車銷量預(yù)測方面,現(xiàn)有研究中考慮到的變量主要包括歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)、網(wǎng)絡(luò)搜索數(shù)據(jù)等,按照變量的選擇與組合可以分為基于單類型變量的銷量預(yù)測研究和基于雙類型變量的銷量預(yù)測研究。

        1.1 基于單類型變量的銷量預(yù)測

        1.1.1 歷史銷量

        早期關(guān)于銷量預(yù)測的研究主要集中于使用時(shí)間序列分析方法,通過尋找銷量數(shù)據(jù)過去的規(guī)律來預(yù)測其未來的發(fā)展趨勢。李響等[1]通過自回歸滑動(dòng)平均模型(Auto-Regressive Moving Average Model,ARMA)與徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合模型來對(duì)銷量進(jìn)行了預(yù)測,并通過仿真試驗(yàn)驗(yàn)證了模型的有效性。王旭天等[2]考慮了季節(jié)性因素的影響,采用季節(jié)性差分自回歸滑動(dòng)平均模型(Seasonal Auto-Regressive Moving Average Model,SARIMA)并選取2004年到2015年的月度銷量數(shù)據(jù)來進(jìn)行銷量預(yù)測。

        1.1.2 宏觀經(jīng)濟(jì)指標(biāo)

        在眾多影響乘用車銷量的因素中,宏觀經(jīng)濟(jì)方面的因素是非常重要的外部因素。王棟等[3]通過灰色關(guān)聯(lián)分析法篩選出國民總收入、人均國內(nèi)生產(chǎn)總值(Gross Domestic Product, GDP)、進(jìn)出口總額等7 個(gè)影響汽車保有量的相關(guān)因子,將其加入反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測分析。Gao等[4]分析了中國汽車銷量與經(jīng)濟(jì)變量之間的關(guān)系,建模結(jié)果表明鋼鐵產(chǎn)量和汽油價(jià)格為內(nèi)生變量,并與中國汽車銷量之間存在長期協(xié)整關(guān)系,因此建立了向量誤差修正模型(Vector Error Correction Model,VECM)來定量分析內(nèi)生變量對(duì)中國汽車銷量的長期影響。

        1.1.3 網(wǎng)絡(luò)搜索數(shù)據(jù)

        網(wǎng)絡(luò)搜索數(shù)據(jù)能夠體現(xiàn)用戶的關(guān)注意向和需求變化,可以提高銷量預(yù)測模型的精準(zhǔn)度。袁慶玉等[6]首先將關(guān)鍵詞進(jìn)行合成,之后建立模型研究關(guān)鍵詞合成指數(shù)與汽車銷量之間的關(guān)系并進(jìn)行預(yù)測。李憶等[7]運(yùn)用文本挖掘技術(shù)確定網(wǎng)絡(luò)搜索關(guān)鍵詞庫,構(gòu)建固定效應(yīng)模型來研究網(wǎng)絡(luò)搜索數(shù)據(jù)與汽車銷量的關(guān)系,最終發(fā)現(xiàn)兩者間存在長期均衡關(guān)系。

        1.2 基于雙類型變量的銷量預(yù)測研究

        現(xiàn)有研究中也有不少學(xué)者結(jié)合兩種類型的變量對(duì)汽車銷量進(jìn)行建模預(yù)測。王易等[5]結(jié)合歷史銷量數(shù)據(jù)與宏觀經(jīng)濟(jì)數(shù)據(jù),建立了極端梯度提升(eXtreme Gradient Boosting,XGBOOST)模型對(duì)汽車銷量進(jìn)行了預(yù)測研究。Yong等[8]提出預(yù)測電動(dòng)汽車量化市場需求的模型,考慮5 個(gè)經(jīng)濟(jì)指標(biāo)和關(guān)鍵詞“電動(dòng)汽車”百度指數(shù)的外部影響,建立了多元向量自回歸模型(Vector Autoregressive Model,VAR),使預(yù)測精度得到顯著提高。劉吉華等[9]以大眾汽車為研究對(duì)象,構(gòu)建其網(wǎng)絡(luò)搜索關(guān)鍵詞庫,并基于主成分分析將關(guān)鍵詞進(jìn)行合成,建立了結(jié)合歷史銷量數(shù)據(jù)與網(wǎng)絡(luò)搜索數(shù)據(jù)的回歸預(yù)測模型。劉吉華等[10]在以后的研究中還將深度學(xué)習(xí)的算法引入汽車銷量預(yù)測,用卷積神經(jīng)網(wǎng)絡(luò)模型(Convolutional Neural Network,CNN)來對(duì)結(jié)合歷史銷量數(shù)據(jù)與網(wǎng)絡(luò)搜索數(shù)據(jù)的大眾汽車進(jìn)行銷量預(yù)測。

        綜上所述,可以發(fā)現(xiàn)目前對(duì)于汽車銷量預(yù)測分析有很多效果良好的研究模型,但在變量的選擇與組合方面,少有同時(shí)考慮歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)和網(wǎng)絡(luò)搜索數(shù)據(jù)作為自變量的研究,因此本文將在此基礎(chǔ)上嘗試逐步添加歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)、網(wǎng)絡(luò)搜索關(guān)鍵詞,作為自變量建立多變量銷量預(yù)測模型(Multivariate Sales Forecasting Model,MSFM)并進(jìn)行效果比對(duì)分析。

        2 基于梯度提升決策樹的銷量預(yù)測模型構(gòu)建

        本文首先進(jìn)行變量選擇與數(shù)據(jù)獲取,然后對(duì)各變量數(shù)據(jù)進(jìn)行如主成分分析和標(biāo)準(zhǔn)化等預(yù)處理,最后將各變量數(shù)據(jù)逐步加入梯度提升決策樹算法進(jìn)行訓(xùn)練,本文所構(gòu)建的銷量預(yù)測模型的框架如圖1所示。

        圖1 銷量預(yù)測模型構(gòu)建框架

        2.1 變量選擇

        本文將嘗試在模型中逐步加入歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)、網(wǎng)絡(luò)搜索數(shù)據(jù)3 種變量進(jìn)行建模。下面首先對(duì)這3方面的變量進(jìn)行介紹。

        2.1.1 歷史銷量

        在時(shí)間序列數(shù)據(jù)的構(gòu)成要素中,季節(jié)變動(dòng)和循環(huán)變動(dòng)都是序列數(shù)據(jù)隨著季節(jié)的變化或者固定型周期而發(fā)生的有規(guī)律的周期性變動(dòng)[11],因此研究歷史銷量數(shù)據(jù)的規(guī)律變動(dòng)能夠從一定程度上預(yù)測未來銷量數(shù)據(jù)的變化趨勢。

        2.1.2 宏觀經(jīng)濟(jì)指標(biāo)

        乘用車行業(yè)深受經(jīng)濟(jì)因素變動(dòng)的影響,經(jīng)濟(jì)因素大多體現(xiàn)一個(gè)國家的發(fā)展情況和人民的平均生活水平,一個(gè)國家經(jīng)濟(jì)水平越高,人民的生活水平越高,對(duì)乘用車的購買力就越強(qiáng)。本文選取了常用的消費(fèi)者物價(jià)指數(shù)(Consumer Price Index, CPI)和92 號(hào)汽油價(jià)格作為影響乘用車銷量的宏觀經(jīng)濟(jì)指標(biāo)變量[4,8,12]。

        2.1.3 網(wǎng)絡(luò)搜索關(guān)鍵詞

        近年來,隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,消費(fèi)者們?cè)谫徺I商品之前越來越傾向于在網(wǎng)絡(luò)上通過搜索引擎查找或咨詢商品的相關(guān)信息和評(píng)價(jià),以此為參考來做出進(jìn)一步的消費(fèi)行為。所以,網(wǎng)絡(luò)搜索數(shù)據(jù)為商品市場發(fā)展動(dòng)向和趨勢提供了一定程度的前瞻。消費(fèi)者在進(jìn)行網(wǎng)絡(luò)搜索時(shí),通常會(huì)選擇自己關(guān)注商品的關(guān)鍵詞進(jìn)行搜索,因此現(xiàn)有的網(wǎng)絡(luò)搜索數(shù)據(jù)大都是根據(jù)搜索引擎中用戶對(duì)于關(guān)鍵詞的搜索量為基礎(chǔ)形成的。比如百度指數(shù)是指互聯(lián)網(wǎng)用戶對(duì)關(guān)鍵詞搜索關(guān)注程度及持續(xù)變化情況,其是以網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)對(duì)象,科學(xué)分析并計(jì)算出各個(gè)關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次的加權(quán)[13]。本文也選取百度指數(shù)作為銷量預(yù)測中的自變量之一。

        本文銷量預(yù)測模型中所涉及的變量如表1所示。

        表1 銷量預(yù)測模型涉及變量

        2.2 數(shù)據(jù)預(yù)處理

        2.2.1 時(shí)間序列分解

        一個(gè)時(shí)間序列通常由長期趨勢、季節(jié)變動(dòng)和不規(guī)則波動(dòng)部分組成[14]。為了研究銷量時(shí)間序列的規(guī)律變動(dòng),本文選擇將時(shí)間序列進(jìn)行分解來判斷其季節(jié)變化周期。關(guān)于時(shí)間序列的分解模型主要分為加法模型和乘法模型,如公式(1)和公式(2)所示:

        式中,Value為時(shí)間序列值;Trend為長期趨勢值;Seasonal為季節(jié)變動(dòng)值;Resid為不規(guī)則變動(dòng)值。

        加法模型中時(shí)間序列的各個(gè)組成成分是相互獨(dú)立的,都有相同的量綱。而乘法模型中輸出部分和趨勢項(xiàng)有相同的量綱,季節(jié)項(xiàng)是比例數(shù),不規(guī)則變動(dòng)項(xiàng)為獨(dú)立隨機(jī)變量序列,服從正態(tài)分布。通過對(duì)時(shí)間序列進(jìn)行分解能夠快速找到時(shí)間序列的季節(jié)或周期變動(dòng)規(guī)律。

        2.2.2 時(shí)差關(guān)系分析

        為了對(duì)關(guān)鍵詞進(jìn)行篩選,本文采取時(shí)差關(guān)系分析來研究關(guān)鍵詞百度指數(shù)數(shù)據(jù)與乘用車銷量之間的相關(guān)關(guān)系。時(shí)差關(guān)系分析是利用相關(guān)系數(shù)驗(yàn)證兩組時(shí)間序列之間先行、一致或滯后關(guān)系的常用方法,其計(jì)算公式如公式(3)所示[15]:

        式中,rl是兩組時(shí)間序列的相關(guān)系數(shù);l表示先行或滯后階數(shù),l取負(fù)數(shù)時(shí)表示先行,取正數(shù)時(shí)表示滯后。在經(jīng)濟(jì)預(yù)測領(lǐng)域,一般只考慮具有預(yù)測作用的先行關(guān)鍵詞。

        對(duì)于rl的取值,當(dāng)rl>0 時(shí)表示兩組時(shí)間序列呈正相關(guān);當(dāng)rl<0 時(shí)表示兩組時(shí)間序列呈負(fù)相關(guān)。在相關(guān)程度上,當(dāng)0 < |rl|≤0.3 時(shí)認(rèn)為兩組時(shí)間序列不存在相關(guān)關(guān)系或相關(guān)性極弱;當(dāng)0.3 < |rl|≤0.5 時(shí)認(rèn)為兩組時(shí)間序列為低度線性相關(guān);當(dāng)0.5 < |rl|≤0.8時(shí)認(rèn)為兩組時(shí)間序列為中度線性相關(guān);當(dāng) |rl|>0.8時(shí)認(rèn)為兩組時(shí)間序列為高度線性相關(guān)[16]。

        2.2.3 主成分分析

        由于網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)多而復(fù)雜,且多個(gè)相關(guān)關(guān)鍵詞的百度指數(shù)數(shù)據(jù)之間一般存在多重共線性,于是本文采取主成分分析的方法來對(duì)關(guān)鍵詞進(jìn)行合成,以消除數(shù)據(jù)間的多重共線性。主成分分析是一種利用降維的思想,通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)變量的統(tǒng)計(jì)方法,轉(zhuǎn)換后的這組變量叫主成分[9]。主成分分析的主要步驟如下:

        (1)指標(biāo)轉(zhuǎn)換

        假設(shè)進(jìn)行主成分回歸的指標(biāo)變量有m個(gè),分別為X1,X2,…,Xm,共有n個(gè)樣本數(shù)據(jù),第i個(gè)樣本的第j個(gè)指標(biāo)的取值為aij。將各指標(biāo)值aij轉(zhuǎn)換成標(biāo)準(zhǔn)化指標(biāo)值如公式(4)所示:

        式中,uj,sj分別為第j個(gè)指標(biāo)的樣本均值和樣本標(biāo)準(zhǔn)差。對(duì)應(yīng)地稱為標(biāo)準(zhǔn)化指標(biāo)變量。如公式(5)所示:(2)計(jì)算相關(guān)系數(shù)矩陣

        相關(guān)系數(shù)矩陣R= (rij)m*m,式中對(duì)角線元素rii= 1,rij=rji是第i個(gè)指標(biāo)與第j個(gè)指標(biāo)的相關(guān)系數(shù),如公式(6)所示:

        (3)計(jì)算特征值與特征向量

        計(jì) 算 相 關(guān) 系 數(shù) 矩 陣R的 特 征 值λ1≥λ2≥… ≥λm≥0 時(shí) 對(duì) 應(yīng) 的 特 征 向 量μ1,μ2,…,μm,其中μj=[μ1j,μ2j,…,μmj]T,由特征向量組成m個(gè)新的指標(biāo)變量,如公式(7)所示:

        式中,Y1是第一個(gè)主成分;Y2是第二主成分;…,Ym是第m主成分。

        (4)計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率

        根據(jù)公式(8)和公式(9),稱bj為主成分Yj的信息貢獻(xiàn)率,αp為主成分Y1,Y2,…,YP的累積貢獻(xiàn)率,當(dāng)αp接近于1 時(shí),則選擇前p個(gè)指標(biāo)變量Y1,Y2,…,YP作為p個(gè)主成分,代替原來m個(gè)指標(biāo)變量,從而可對(duì)p個(gè)主成分進(jìn)行綜合分析(p≤m)。

        2.2.4 數(shù)據(jù)標(biāo)準(zhǔn)化

        本文選取使用的梯度提升決策樹(Gradient Boosting Decision Tree, GDBT)算法與梯度有關(guān),為了避免預(yù)測結(jié)果向數(shù)值大的變量傾斜,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,如公式(10)所示[17]:

        2.3 模型訓(xùn)練與結(jié)果分析

        2.3.1 數(shù)據(jù)集劃分

        機(jī)器學(xué)習(xí)算法在訓(xùn)練前一般需要將數(shù)據(jù)集劃分成獨(dú)立的3部分,即訓(xùn)練集、測試集和驗(yàn)證集。其中訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于評(píng)估模型,協(xié)助調(diào)整模型超參數(shù),測試集則是用于檢驗(yàn)最終選擇的最優(yōu)模型的性能表現(xiàn)。

        2.3.2 梯度提升決策樹

        梯度提升決策樹算法可以靈活處理各種類型的數(shù)據(jù),且其模型一般具有較好的解釋性和魯棒性,因此本文選擇梯度提升決策樹算法為基礎(chǔ)來進(jìn)行乘用車銷量預(yù)測研究。

        梯度提升決策樹(GDBT)是Friedman在2001年提出的一種迭代學(xué)習(xí)的決策樹算法[18]。GDBT 采用的是集成學(xué)習(xí)中Boosting 算法的基本思想,即首先使用初始權(quán)重從訓(xùn)練集中訓(xùn)練出一個(gè)弱學(xué)習(xí)器,根據(jù)弱學(xué)習(xí)器的學(xué)習(xí)誤差率來更新樣本的權(quán)重,提高之前弱學(xué)習(xí)器學(xué)習(xí)率較高的訓(xùn)練樣本點(diǎn)權(quán)重,使得這些誤差率高的樣本在后面的弱學(xué)習(xí)器中得到更多的重視。如此循環(huán),直到得到指定數(shù)量的學(xué)習(xí)器,再結(jié)合策略進(jìn)行式就是各棵決策樹。總體上,GBDT 是通過采用加法模型(即基函數(shù)的線性組合)以及不斷減小訓(xùn)練過程產(chǎn)生的殘差來達(dá)到將數(shù)據(jù)分類或者回歸的算法。

        2.3.3 結(jié)果比對(duì)分析

        為了驗(yàn)證各個(gè)變量對(duì)銷量預(yù)測的影響,本文在GDBT算法基礎(chǔ)上,分別構(gòu)建只考慮歷史銷量的模型1,同時(shí)考慮歷史銷量和宏觀經(jīng)濟(jì)指標(biāo)的模型2,同時(shí)考慮歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)和網(wǎng)絡(luò)搜索關(guān)鍵詞的模型3來進(jìn)行訓(xùn)練(如式(11)至式(13)所示)并進(jìn)行結(jié)果比對(duì)分析。

        3 實(shí)證研究與結(jié)果分析

        3.1 數(shù)據(jù)獲取與預(yù)處理

        3.1.1 銷量數(shù)據(jù)

        本文從車主之家官網(wǎng)獲取了乘用車市場2013 年1 月至2021 年12 月共72 個(gè)月的銷量數(shù)據(jù),其時(shí)序圖如圖2所示。在模型評(píng)價(jià)指標(biāo)的選擇上,由于平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)數(shù)值是百分比的形式,更能形象地表達(dá)出誤差值,易于解釋,因此本文選取MAPE 來對(duì)不同模型進(jìn)行效果比較[19],其計(jì)算公式如公式(14)所示:

        圖2 乘用車銷量時(shí)序圖

        式中,yi是t時(shí)刻的預(yù)測值;yi是t時(shí)刻的真實(shí)值。理論上,MAPE 的值越小,說明預(yù)測模型擬合效果越好,具有更好的精確度。

        由圖2所展示的時(shí)序圖可以初步認(rèn)為乘用車的月度銷量數(shù)據(jù)有一定的周期性變化,接下來對(duì)其進(jìn)行分解來判斷其季節(jié)變化周期。本文采用Python的statesmodel 庫中的seasonal_decompose 函數(shù)來對(duì)乘用車的銷量數(shù)據(jù)進(jìn)行時(shí)間序列分解,加法模型和乘法模型的結(jié)果分別如圖3、圖4所示。

        圖3 乘用車銷量序列分解(加法模型)

        圖4 乘用車銷量序列分解(乘法模型)

        由圖3 和圖4 所展示的時(shí)間序列分解結(jié)果可知,乘用車銷量數(shù)據(jù)的季節(jié)變化周期均為12個(gè)月,故選擇將去年同期的銷量數(shù)據(jù)作為模型中的變量之一。

        3.1.2 宏觀經(jīng)濟(jì)數(shù)據(jù)

        本文從東方財(cái)富網(wǎng)上通過網(wǎng)絡(luò)爬蟲獲取了2014年1月至2021年12月的宏觀經(jīng)濟(jì)數(shù)據(jù),包括消費(fèi)者物價(jià)指數(shù)(CPI)和92號(hào)汽油價(jià)格,其部分?jǐn)?shù)據(jù)如表2所示。

        表2 宏觀經(jīng)濟(jì)樣本數(shù)據(jù)表(部分?jǐn)?shù)據(jù))

        3.1.3 網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)

        由于受到不同消費(fèi)者的語言習(xí)慣、搜索風(fēng)格主觀因素的影響,網(wǎng)絡(luò)搜索關(guān)鍵詞庫變得龐大而復(fù)雜,因此構(gòu)建合適的關(guān)鍵詞組就成了研究的關(guān)鍵。

        (1)關(guān)鍵詞的獲取

        本文首先分別以“乘用車”作為初始核心關(guān)鍵詞,然后利用百度指數(shù)需求圖譜與相關(guān)詞熱度模塊來進(jìn)行兩輪關(guān)鍵詞的拓展,同時(shí)去除搜索指數(shù)較低以及明顯與乘用車無顯著關(guān)系的關(guān)鍵詞,最終得到的關(guān)鍵詞為86個(gè),之后再根據(jù)選取的關(guān)鍵詞在百度指數(shù)官網(wǎng)上通過網(wǎng)絡(luò)爬蟲獲取到百度指數(shù)數(shù)值。采集到的部分?jǐn)?shù)據(jù)如表3所示。

        表3 網(wǎng)絡(luò)搜索關(guān)鍵詞百度指數(shù)數(shù)據(jù)表(部分?jǐn)?shù)據(jù))

        (2)關(guān)鍵詞的篩選

        本文采取時(shí)差關(guān)系分析來研究關(guān)鍵詞百度指數(shù)數(shù)據(jù)與乘用車銷量之間的相關(guān)關(guān)系,從而對(duì)關(guān)鍵詞進(jìn)行篩選。首先取l∈[-6,0)(即先行階數(shù)取1 至6),在每個(gè)關(guān)鍵詞百度指數(shù)數(shù)據(jù)中選擇相關(guān)程度為低度相關(guān)及以上(即相關(guān)系數(shù) |rl|>0.3)且相關(guān)系數(shù)值最大的先行階數(shù)[16],最終篩選得到的關(guān)鍵詞為23 個(gè),部分結(jié)果如表4所示。

        表4 關(guān)鍵詞百度指數(shù)數(shù)據(jù)時(shí)差關(guān)系分析結(jié)果(部分?jǐn)?shù)據(jù))

        根據(jù)時(shí)差關(guān)系分析結(jié)果,將關(guān)鍵詞按照先行階數(shù)與銷量數(shù)據(jù)進(jìn)行對(duì)應(yīng),得到關(guān)鍵詞篩選后的百度指數(shù)數(shù)據(jù)。

        (3)關(guān)鍵詞的合成

        將經(jīng)過預(yù)處理的百度指數(shù)數(shù)據(jù)運(yùn)用Python 的sklearn庫中的PCA()函數(shù)進(jìn)行主成分分析,結(jié)果如表5所示。

        表5 百度指數(shù)數(shù)據(jù)主成分分析結(jié)果

        由表5的結(jié)果可以得出,經(jīng)過主成分分析降維后,前3個(gè)主成分的特征方差累計(jì)占比超過95%,包含了原數(shù)據(jù)的大部分信息,因此考慮將百度指數(shù)數(shù)據(jù)降維到3維。

        3.1.4 數(shù)據(jù)標(biāo)準(zhǔn)化

        本文使用Python的sklearn庫中的StandardScaler()函數(shù)對(duì)以上獲取并預(yù)處理過的銷量數(shù)據(jù)、宏觀經(jīng)濟(jì)數(shù)據(jù)和百度指數(shù)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。

        3.2 模型訓(xùn)練

        對(duì)于數(shù)據(jù)集的劃分,本文選取2014年1月至2020年12月的數(shù)據(jù)作為訓(xùn)練集和驗(yàn)證集,選取2021年1月至12月的數(shù)據(jù)作為測試集。

        模型訓(xùn)練方面,本文使用Python的sklearn庫中的GradientBoostingRegressor()函數(shù)進(jìn)行GDBT 算法的建模。對(duì)于模型中的超參數(shù)選擇,選擇用網(wǎng)格搜索的方法進(jìn)行確定,即在指定的參數(shù)范圍內(nèi),按步長依次調(diào)整參數(shù),利用調(diào)整的參數(shù)訓(xùn)練學(xué)習(xí)器,從所有的參數(shù)中找到在驗(yàn)證集上精度最高的參數(shù)[20]。同時(shí)考慮到不同驗(yàn)證集對(duì)模型結(jié)果的影響不同,對(duì)訓(xùn)練集和驗(yàn)證集采取7折交叉驗(yàn)證的方式進(jìn)行建模。本文使用sklearn庫中的GridSearchCV()函數(shù)遍歷多種超參數(shù)組合并通過交叉驗(yàn)證確定最優(yōu)效果參數(shù)。

        3.3 模型結(jié)果比對(duì)分析

        在GDBT算法中逐步加入歷史銷量數(shù)據(jù)、宏觀經(jīng)濟(jì)數(shù)據(jù)、網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)所得到的各模型對(duì)乘用車2021年1月至12月的預(yù)測結(jié)果MAPE指標(biāo)如表6所示。

        表6 GDBT模型預(yù)測的MAPE指標(biāo)結(jié)果

        由表6 所展示的預(yù)測結(jié)果可知,只使用歷史銷量數(shù)據(jù)進(jìn)行建模時(shí),模型MAPE值為14.37%。添加了宏觀經(jīng)濟(jì)指標(biāo)進(jìn)行建模后,MAPE 值有所降低,為12.71%,說明宏觀經(jīng)濟(jì)指標(biāo)對(duì)銷量有一定的影響。當(dāng)在模型中同時(shí)考慮歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)和網(wǎng)絡(luò)搜索關(guān)鍵詞變量時(shí),MAPE值進(jìn)一步降低,模型效果進(jìn)一步提升,表明了網(wǎng)絡(luò)搜索數(shù)據(jù)有助于乘用車銷量的預(yù)測。

        在時(shí)間序列的相關(guān)預(yù)測問題中,季節(jié)性差分自回歸滑動(dòng)平均模型(Seasonal Auto-Regressive Moving Average Model,SARIMA)、支持向量機(jī)回歸(Support Vector Regression,SVR)模型也得到了廣泛應(yīng)用[2,21],為了證明本文所使用模型的有效性,進(jìn)一步對(duì)比了同時(shí)考慮3 個(gè)變量時(shí)GDBT 模型與SARIMA 模型、SVR 模型的預(yù)測結(jié)果MAPE指標(biāo),結(jié)果如表7所示。

        表7 不同模型預(yù)測的MAPE對(duì)比%

        由表7可知,GDBT 模型的MAPE 指標(biāo)比SARIMA模型、SVR模型都低,表明GDBT模型的擬合效果最優(yōu)。

        綜合上述分析可以得出,同時(shí)使用歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)、網(wǎng)絡(luò)關(guān)鍵詞搜索數(shù)據(jù)變量會(huì)使銷量預(yù)測模型的精度提高,本文中得到的最優(yōu)模型是GDBT模型,其MAPE值結(jié)果為10.35%,能夠較好的預(yù)測銷量變化。

        4 結(jié)論與展望

        4.1 研究結(jié)論

        本文以乘用車整體市場為研究對(duì)象,在現(xiàn)有研究的基礎(chǔ)上分別建立了只考慮歷史銷量的預(yù)測模型,同時(shí)考慮歷史銷量和宏觀經(jīng)濟(jì)指標(biāo)的預(yù)測模型,同時(shí)考慮歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)和網(wǎng)絡(luò)搜索關(guān)鍵詞的預(yù)測模型,最終將建立的模型進(jìn)行對(duì)比分析,發(fā)現(xiàn)同時(shí)考慮了3 種變量的梯度提升決策樹模型的MAPE 值最小,說明其擬合效果最好,也表明了宏觀經(jīng)濟(jì)指標(biāo)和網(wǎng)絡(luò)搜索數(shù)據(jù)有助于乘用車銷量預(yù)測。

        本文在理論層面以乘用車整體市場為研究對(duì)象,使用歷史銷量、宏觀經(jīng)濟(jì)指標(biāo)和網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)作為影響乘用車銷量的變量,得出同時(shí)使用上述3種變量的梯度提升決策樹模型為最佳模型,為銷量預(yù)測的研究提供一種新的參考模型。在實(shí)踐層面,對(duì)于乘用車市場中已有一定滲透率的企業(yè),可以基于本文得出的最優(yōu)銷量模型對(duì)市場趨勢發(fā)展情況做參考,從而進(jìn)行針對(duì)性的生產(chǎn)計(jì)劃安排與優(yōu)化以及市場營銷戰(zhàn)略的制定。

        4.2 研究不足與展望

        (1)本文在銷量預(yù)測中所考慮的影響乘用車銷量的變量仍然不完備,后續(xù)研究中可以繼續(xù)發(fā)掘其他影響因素進(jìn)行綜合考慮,例如宏觀經(jīng)濟(jì)環(huán)境、政策因素、零部件供給端相關(guān)因素和消費(fèi)者評(píng)價(jià)因素,來進(jìn)一步提高模型的預(yù)測精確度。

        (2)本文在銷量預(yù)測中僅應(yīng)用了單一模型,后續(xù)研究中可以進(jìn)一步將各類預(yù)測模型進(jìn)行融合來建模并分析比對(duì)效果,得到表現(xiàn)更優(yōu)的模型。

        (3)本文是以乘用車整體市場為研究對(duì)象進(jìn)行預(yù)測,未來對(duì)新能源汽車的銷量預(yù)測也是重要的研究方向。

        猜你喜歡
        乘用車銷量變量
        同比增長130%!劍指3萬噸銷量,豐華黃顙料迎來大爆發(fā)
        抓住不變量解題
        也談分離變量
        盤點(diǎn)2018年車企銷量
        汽車觀察(2019年2期)2019-03-15 06:00:12
        上汽通用172萬銷量下的陰影
        家用汽車(2016年4期)2016-02-28 02:23:37
        SL(3,3n)和SU(3,3n)的第一Cartan不變量
        分離變量法:常見的通性通法
        直接式TPMS在某款乘用車上的應(yīng)用介紹
        汽車電器(2014年5期)2014-02-28 12:14:19
        新一代清潔型乘用車柴油機(jī)
        國內(nèi)市場主要乘用車型價(jià)格表
        产国语一级特黄aa大片| 国产乱对白刺激视频| 久久国内精品自在自线图片| 国产电影无码午夜在线播放| 精东天美麻豆果冻传媒mv| 日日摸夜夜添夜夜添无码免费视频| 欧美自拍丝袜亚洲| 亚洲伊人免费综合网站| 久久久精品毛片免费观看| 奇米影视第四色首页| 一本久久a久久精品亚洲| 精品久久久久中文字幕APP| 亚洲综合原千岁中文字幕| 亚洲国产天堂久久综合网| 丰满少妇呻吟高潮经历| 国产最新网站| 亚洲国产精品午夜一区| 国产高颜值女主播在线| 真实国产精品vr专区| 亚洲妇女水蜜桃av网网站| 亚洲中文字幕黄色小视频| 亚洲男人av天堂久久资源| 精品日产卡一卡二卡国色天香| 中文字幕无码无码专区| 中文字幕第一页在线无码一区二区| 日韩一区二区三区人妻中文字幕| 国产精品亚洲а∨无码播放| 少妇私密会所按摩到高潮呻吟| 午夜性刺激免费视频| 高清亚洲精品一区二区三区| 97人妻人人揉人人躁九色| 国产影片中文字幕| 国产乱人视频在线观看播放器| 日韩精品一区二区亚洲观看av| 丰满少妇被猛烈进入高清播放| 亚洲精品综合一区二区| 国产成人啪精品视频免费网| 东京热加勒比久久精品| 50岁退休熟女露脸高潮| 亚洲AV肉丝网站一区二区无码 | 一进一出一爽又粗又大|