馮 瀟,黃昱馨
(電子科技大學(xué) 成都學(xué)院, 四川 成都 611731)
長期以來中國與東南亞國家都保持著良好的經(jīng)貿(mào)合作關(guān)系,而“一帶一路”建設(shè)更進(jìn)一步推進(jìn)了彼此的經(jīng)貿(mào)往來合作。目前東南亞已成為中國三大核心貿(mào)易伙伴之一,因此預(yù)測中國-東南亞各國的進(jìn)出口貿(mào)易額,對(duì)研判中國-東南亞貿(mào)易趨勢、制定貿(mào)易政策等具有重要意義。
關(guān)于中國與東南亞國家貿(mào)易預(yù)測的研究,常用的預(yù)測模型有經(jīng)濟(jì)計(jì)量模型,如劉宓雯等通過面板回歸對(duì)東南亞各國的貿(mào)易總量進(jìn)行了預(yù)測;余振岳等通過計(jì)算HM 指數(shù)評(píng)估了中國與東南亞的貿(mào)易趨勢。也有學(xué)者運(yùn)用了機(jī)器學(xué)習(xí)對(duì)貿(mào)易額進(jìn)行預(yù)測,如鄧洋洋構(gòu)建了多種機(jī)器學(xué)習(xí)的中國-東盟貿(mào)易額預(yù)測模型。本文在前人研究的基礎(chǔ)上,基于線性回歸和非線性回歸的視角,構(gòu)建多種機(jī)器學(xué)習(xí)模型對(duì)中國-東南亞各國進(jìn)出口總額的歷史數(shù)據(jù)進(jìn)行建模測算,并在此基礎(chǔ)上提出多模型組合的中國-東南亞貿(mào)易預(yù)測模型。
線性回歸旨在尋找一條直線或者一個(gè)平面對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測:
J(θ)為損失函數(shù),計(jì)算方法主要有最小二乘法(OLS)和梯度下降法(SGD)。OLS 是對(duì)J(θ)中的每個(gè)θ 直接求偏導(dǎo)的過程。而SGD 是根據(jù)J(θ)更小的原則對(duì)θ 進(jìn)行修改,直到J(θ)達(dá)到最小的過程。當(dāng)變量個(gè)數(shù)較多且有相關(guān)關(guān)系時(shí),Lasso 回歸能夠通過正則化項(xiàng)實(shí)現(xiàn)對(duì)變量的選取:
漸進(jìn)梯度回歸樹(GBRT)與RF 類似,是一種迭代的決策樹回歸算法,計(jì)算如下:
而極端梯度提升(XGBoost)對(duì)損失函數(shù)L 進(jìn)行了二階泰勒展開,并在L 里加入了正則項(xiàng):
本文選取中國與東南亞11 國的GDP、人口總量和CPI 作為回歸模型的輸入變量,時(shí)間范圍為2000-2019年,輸出變量時(shí)間范圍為2001-2020 年。本文將存在缺失值的年份數(shù)據(jù)進(jìn)行刪除,并將各經(jīng)濟(jì)數(shù)據(jù)的量綱進(jìn)行歸一化:
本文將前16 年的數(shù)據(jù)作為訓(xùn)練集,將后3 年的數(shù)據(jù)作為測試集對(duì)訓(xùn)練模型進(jìn)行評(píng)估,評(píng)估指標(biāo)為平均百分比誤差(MAPE):
7 種回歸模型在測試集上的MAPE 值如表1 所示。從該表可以看出,除OLS 線性回歸模型外,其余線性回歸模型和非線性回歸模型在不同國家數(shù)據(jù)集上有不同的預(yù)測優(yōu)勢,其中SGD 與XGBoost 在多個(gè)數(shù)據(jù)集上預(yù)測效果較好。盡管LASSO 在多個(gè)國家數(shù)據(jù)集上預(yù)測效果不佳,但與其他模型相比,LASSO 在中國-文萊進(jìn)出口數(shù)據(jù)預(yù)測上的預(yù)測效果最好。
表1 單個(gè)預(yù)測模型評(píng)估結(jié)果
為了綜合各機(jī)器學(xué)習(xí)回歸預(yù)測模型的優(yōu)點(diǎn),本文分別對(duì)各模型賦予不同權(quán)重,然后將各模型預(yù)測的加權(quán)平均值作為組合回歸預(yù)測結(jié)果,具體計(jì)算公式如下:
本文首先將各模型進(jìn)行兩兩組合,通過對(duì)組合回歸模型目標(biāo)函數(shù)進(jìn)行求解,以得到單個(gè)模型在組合模型中的權(quán)重,隨后將組合模型對(duì)測試集的進(jìn)出口貿(mào)易總額進(jìn)行預(yù)測,檢驗(yàn)結(jié)果如表2 所示。與表1 進(jìn)行比較可以看出,組合后的模型能夠綜合兩個(gè)模型所包含的信息,有效降低單個(gè)模型的預(yù)測誤差,取得比單個(gè)模型更好的預(yù)測效果。同時(shí)從表2 可以看出,在15 種組合模型中,SGD-LASSO 組合模型預(yù)測誤差最小,故本文首先選取SGD回歸模型與LASSO 回歸模型進(jìn)行模型組合。
表2 兩種模型組合評(píng)估結(jié)果
由于組合模型的基模型均是線性模型,而中國-東南亞國家進(jìn)出口貿(mào)易總額與各國經(jīng)濟(jì)變量之間并非存在著嚴(yán)格的線性關(guān)系,故本文將4 種非線性模型與SGD-LASSO 組合模型再次進(jìn)行模型組合,以進(jìn)一步降低對(duì)中國-東南亞進(jìn)出口總額的預(yù)測誤差。模型評(píng)估結(jié)果及各模型權(quán)重計(jì)算結(jié)果如表3、表4 所示,從表3 可以看出,將SGD-LASSO 組合模型與各非線性回歸模型進(jìn)一步組合后,模型預(yù)測誤差均有了不同程度的降低,其中SGD-LASSO-XGBoost 模型的MAPE 值低于其他組合預(yù)測模型的MAPE 值,說明在針對(duì)中國-東南亞進(jìn)出口總額的預(yù)測問題上,SGD-LASSO-XGBoost 模型有更好的預(yù)測性能。
表3 線性-非線性組合模型評(píng)估結(jié)果
表4 SGD-LASSO-XGBoost 組合模型權(quán)重計(jì)算結(jié)果
本文從線性和非線的視角選擇了7 種常用的機(jī)器學(xué)習(xí)回歸模型分別對(duì)中國-東南亞11 國的進(jìn)出口總額進(jìn)行模型訓(xùn)練,使用評(píng)估指標(biāo)MAPE 值對(duì)測試集進(jìn)行評(píng)估,發(fā)現(xiàn)線性模型與非線性模型在不同的數(shù)據(jù)集上有各自的預(yù)測優(yōu)勢。因此結(jié)合線性模型與非線性模型的特點(diǎn),對(duì)不同模型賦予不同權(quán)重,構(gòu)建SGD-LASSO-XGBoost 組合回歸預(yù)測模型,得到了更準(zhǔn)確的預(yù)測結(jié)果。