吳樂 陳剛
摘? 要:為了提高上海市物流需求量預測精度,運用GM1,1和嶺回歸組合預測方法基于9個影響因素構建需求預測指標體系,選取近13年的歷史數(shù)據(jù)預測上海市未來4年的物流需求量并與BP神經(jīng)網(wǎng)絡和GM1,1預測模型進行對比。結果表明,文章提出的組合預測模型預測精度優(yōu)于其他模型,其均方根誤差和平均相對誤差分別至少減少了42.8%和45.4%,證明模型的優(yōu)越性和可行性,可為其他地區(qū)的物流需求預測提供研究方向。
關鍵詞:嶺回歸模型;GM1,1模型;物流需求預測;上海市
中圖分類號:F259.27? ? 文獻標志碼:A? ? DOI:10.13714/j.cnki.1002-3100.2023.15.002
Abstract: In order to improve the prediction accuracy of Shanghai's logistics demand, the GM1,1 and ridge regression combined forecasting method is used to construct the demand forecasting index system based on nine influencing factors. The historical data of the past 13 years are selected to predict the logistics demand of Shanghai in the next 4 years and compared with the BP neural network and GM1,1 prediction model. The results show that the prediction accuracy of the combined forecasting model proposed in this paper is better than other models, and its root mean square error and average relative error are reduced by at least 42.8% and 45.4% respectively, which proves the superiority and feasibility of the model and can provide research directions for logistics demand forecasting in other regions.
Key words: ridge regression model; GM1,1 model; logistics demand forecasting; Shanghai
0? 引? 言
近年來,隨著全球經(jīng)濟和物流行業(yè)的快速發(fā)展,上海市作為中國國家中心城市、滬杭甬大灣區(qū)核心城市,地處長江入???,其每年物流貨運量巨大。因此,預測上海市未來物流需求量具有重要的現(xiàn)實意義,有助于了解社會經(jīng)濟活動對物流供給能力的需求強度,從而保障供給平衡,為高效社會物流活動的實現(xiàn)提供基礎[1]。
針對物流需求預測問題。首先,多數(shù)學者使用不同模型進行仿真預測[2-3],其預測方法主要包括BP神經(jīng)網(wǎng)絡[1]、灰色預測模型[4]、隨機森林[5]、時間序列[6]等。還有部分學者將組合預測方法進行實際應用,如黃建華[7]提出了改進GM-BPNN組合預測方法,利用ARIMA和遺傳算法分別改進GM1,1和BPNN,更具有效度確定加權系數(shù)并構建線性組合模型進行預測。其次,多數(shù)學者在分析物流需求量影響因素及其指標體系的構建過程時一般會選擇常用的指標[1],但未能得到良好的預測結果[3]。人口規(guī)模在影響全球經(jīng)濟發(fā)展和人民日常生活[8]的同時也會明顯影響物流需求量的變化,因此將其作為影響因素之一。
基于此,本文結合以往學者研究物流需求預測影響因素基礎上使用9個影響因素基于GM1,1和嶺回歸組合預測模型預測上海市未來4年物流需求量。
1? 模型介紹
本文在進行上海市物流需求預測時首先使用GM1,1模型進行影響因素預測,再使用嶺回歸模型對物流需求進行預測,此操作適用于研究不確定性系統(tǒng)。
1.1? GM1,1模型
灰色系統(tǒng)理論預測模型中學者們最常使用的就是GM1,1模型,1,1表示對一個一階方程的自變量進行預測,其一般計算步驟如下:
Step 1:獲得初始序列X=X1,X2,…,XN。
Step 2:將各時刻數(shù)據(jù)依次累加得到累加序列X=X1,X2,…,XN。
Step 3:判斷序列X的級比σk===ρk+1,此時,隨著k增加,ρk會逐漸接近0,當ρk∈0,0.5時X有準指數(shù)規(guī)律時,便可進行灰色系統(tǒng)建模預測。
1.2? 嶺回歸模型
當回歸方程自變量之間出現(xiàn)多重共線性問題時,使用最小二乘法進行預測的估計量均方誤差會變得很大,因此,于1962年Heer對最小二乘方法進行改進提出嶺回歸[9],其表達式為:
w=
XX+λIXy? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
其中:λ為嶺系數(shù),I為單位矩陣。嶺回歸屬于一種有偏估計,通過引入懲罰項來減少不重要因素的重要度得到更好的估計,其代價函數(shù)為:
Jθ=
hx-y
+
λ
θ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
通過公式可以得到嶺回歸方程,再輸入影響因素預測值即可上海市物流需求預測。
2? 上海市物流需求預測
2.1? 上海市物流需求預測模型構建
在物流需求預測時,不合適的指標會導致預測效果變差且增加數(shù)據(jù)收集的工作量,因此需要結合本地發(fā)展特性選取合適的影響因素以建立合適指標體系預測。對不確定變化數(shù)據(jù)預測時,僅用外推方法進行預測會導致預測偏差大,而通過外部因素結合時間發(fā)展進行預測更能獲得準確的結果。本文給出預測模型圖如圖1所示。
首先,本文考慮多重共線性問題,選擇總均方誤差最優(yōu)的嶺回歸預測方法。其次,在進行物流需求預測時嶺回歸需要輸入影響因素的未來預測值,此數(shù)據(jù)通過GM1,1模型進行預測即可。最后,輸入歷史數(shù)據(jù)到嶺回歸模型中即可獲得嶺回歸方程,將獲得的影響因素預測數(shù)據(jù)輸入嶺回歸方程中預測未來4年的物流需求數(shù)據(jù)。此組合預測模型通過GM1,1預測影響因素與嶺回歸預測物流需求的方法相結合從而實現(xiàn)結果的準確性。
2.2? 物流需求指標體系建立
如圖1所示,在獲得物流需求預測結果之前需要構建指標體系,指標體系的構建關乎預測結果的準確性。因此,一般選擇與輸出指標相關性強的影響因素,參考文獻[1]可知經(jīng)濟指標、消費水平、對內(nèi)和對外貿(mào)易是常用影響因素。然而隨著新冠疫情的到來,物流行業(yè)在一段時間內(nèi)發(fā)展緩慢、國外疫情嚴重無變好趨勢、外部輸入導致國內(nèi)疫情反復都要求考慮國際形勢和國內(nèi)突發(fā)事件的影響,張森[10]認為在一個地區(qū)內(nèi)消費水平由人口密度決定,人口密度越大消費水平越高,物流需求量越大,同時人口密度一般由常住人口數(shù)進行計算?;诖耍疚脑谧錾虾J形锪餍枨箢A測時增加常住人口數(shù)指標建立新的指標體系,并以貨運量為輸出向量,考慮數(shù)據(jù)可得性選取2009—2021年的上海市各類數(shù)據(jù)作為原始數(shù)據(jù),如表1所示。
3? 實例分析
為檢驗本文模型方法的可行性和有效性,第一,本文基于歷史數(shù)據(jù)得到預測值驗證其可行;第二,對比預測模型與BP神經(jīng)網(wǎng)絡、GM1,1的預測結果,并通過均方根誤差、平均相對誤差和擬合優(yōu)度三個方面預測結果來評價本文改進模型的優(yōu)越性。
3.1? 數(shù)據(jù)獲取與處理
通過上海市統(tǒng)計局官網(wǎng)查詢得表1中的相關指標數(shù)據(jù),基于數(shù)據(jù)可獲得性,整理了2009年至2021年的上海市物流需求預測相關數(shù)據(jù),如表2所示。
3.2? 實例驗證
根據(jù)圖1流程,首先進行嶺回歸預測,第一步:確定K值,如圖2所示。
圖2以可視形式化展示了本次模型的各個自變量的標準化系數(shù)趨于穩(wěn)定時的情況,并根據(jù)方差擴大因子法確定K=0.153,為了更好地展示效果,將原先橫坐標幅度由0~1至0~0.10。
第二步:輸出嶺回歸分析結果如下,基于F檢驗顯著性P值為0.120*,水平上不呈現(xiàn)顯著性,接受原假設,表明自變量與因變量之間不存在著回歸關系。同時,模型的擬合優(yōu)度R為0.932,模型表現(xiàn)較為優(yōu)秀。模型的公式:Y=126 228.768+0.517×X
+258.335×X+5.32×X+0.522×X+0.061×X-67.991×X-0.149×X
+1.597×X+3.712×X,最終結果如表3所示。
第三步:對二級指標X—X使用GM1,1模型預測未來4年的數(shù)值,得到結果如表4所示。實驗發(fā)現(xiàn)總體預測趨勢良好,其影響因素的預測偏差僅為0.5~4%。最重要的是,所有影響因素平移轉換后序列的所有級比值都位于區(qū)間0.867,1.154內(nèi),說明平移轉換后序列適合構建灰色預測模型。
第四步:將影響因素的預測數(shù)據(jù)輸入嶺回歸方程中即得到未來4年上海市物流需求量預測值,如表5所示。
3.3? 不同模型預測效果對比分析
為了驗證本文模型和方法的優(yōu)越性,現(xiàn)從橫向和縱向分析其優(yōu)越性并以平均相對誤差、均方根誤差和擬合優(yōu)度進行評比,其中MAPE和RMSE公式如下:
MAPE=? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
RMSE=? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
基于此,給出表6不同模型的MAPE、RMSE和R值,可以發(fā)現(xiàn)本文模型在三個方面都優(yōu)于其他模型和方法,并至少減少了25.3%的平均相對誤差、30.34%的均方根誤差及更優(yōu)的擬合優(yōu)度,證明本文所選模型和方法的可行性和有效性。
此外,為了直觀觀察給出圖3不同模型對上海市物流需求預測結果對比圖,可以發(fā)現(xiàn)紅色線條的預測效果最好。
4? 結? 論
本文利用上海市物流需求預測相關影響因素建立了嶺回歸-GM1,1組合預測模型?;谝酝鶎W者在進行物流需求預測影響因素指標體系基礎上分析了海市物流需求的9個主要影響因素,重新構建需求指標體系進行預測。同時鑒于上海市物流需求在總體上表現(xiàn)為波動大、難預測特點上,使用嶺回歸和GM1,1組合預測,在過程中先對影響因素使用GM1,1得到的預測結果,結合新指標體系在嶺回歸結果上進行未來4年的上海市物流需求預測。最后,在研究中對比了本文提出的模型、GM1,1和BP神經(jīng)網(wǎng)絡的平均相對誤差、均方根誤差和擬合優(yōu)度指標,來證明本文模型方法的可行性和優(yōu)越性。
最終結果表明,本文預測未來4年上海市物流需求逐年上升,嶺回歸-GM1,1組合預測模型能更好地預測上海市物流需求,同時能有效減少不確定數(shù)據(jù)預測問題,可為其他市區(qū)的物流需求預測提供方向。
參考文獻:
[1] 楊麒,張志清. 基于BP神經(jīng)網(wǎng)絡法和二次指數(shù)平滑法的珠海市物流需求預測比較分析[J]. 物流科技,2022,45(15):27-32.
[2] 武亞鵬,李慧穎,李婷,等. 基于多模型組合的物流需求預測分析——以武漢市為例[J]. 物流技術,2022,41(6):60-63.
[3] 鄧熠. 基于BP神經(jīng)網(wǎng)絡的福州都市圈物流需求預測[J]. 物流工程與管理,2022,44(8):29-31.
[4] 劉新文,劉曉霞. 廣西R&D投入強度預測——基于灰色GM1,1模型[J]. 生產(chǎn)力研究,2022(9):55-60.
[5] 夏偉懷,劉嘉莉,馮芬玲. 基于隨機森林的鐵路冷藏運輸需求預測[J]. 鐵道科學與工程學報,2022,19(4):909-916.
[6] 徐子涵. 基于組合模型的合肥市航空貨運需求預測研究[D]. 合肥:安徽理工大學,2020.
[7] 黃建華,張迪. 面向不確定物流需求的改進GM-BPNN組合預測方法[J]. 統(tǒng)計與決策,2022,38(16):26-29.
[8] 段容谷,莊媛媛,張克勇,等. 突發(fā)公共衛(wèi)生事件下多階段應急救援物資配置研究[J]. 中國安全生產(chǎn)科學技術,2021,17(12):142-148.
[9] 邵楠,許冰. 基于嶺回歸的大壩變形位移模型[J]. 測繪與空間地理信息,2021,44(6):191-192,196.
[10] 張森. 基于粗糙集理論和最小二乘支持向量機的區(qū)域物流需求預測研究[D]. 深圳:深圳大學,2020.
[11] 劉玉囡,閆國東,紀如雪. 港口物流與旅游經(jīng)濟的協(xié)調(diào)發(fā)展研究——基于面板數(shù)據(jù)的實證分析[J]. 物流科技,2022,45(7):17-21,32.
收稿日期:2023-05-23
基金項目:國家自然科學基金資助項目(71761006)
作者簡介:吳? 樂(1997—),男,安徽滁州人,貴州大學管理學院碩士研究生,研究方向:物流與供應鏈管理;陳? 剛(1987—),男,四川廣安人,貴州大學管理學院,副教授,博士,研究方向:物流系統(tǒng)優(yōu)化。
引文格式:吳樂,陳剛. 基于嶺回歸和GM1,1組合的上海市物流需求預測模型[J]. 物流科技,2023,46(15):6-9.