詹 蕓,馬佳玉,張 陵
(1. 西安汽車職業(yè)大學(xué),陜西 臨潼 710038;2. 西安交通大學(xué),陜西 西安 710048)
“一帶一路”戰(zhàn)略使陜西成為中國向西開放的中心區(qū)域和重要節(jié)點,陜西省物流樞紐地位重要性日益凸顯,物流需求預(yù)測在物流發(fā)展規(guī)劃、物流資源整合等方面發(fā)揮著重要作用。物流與各影響因素之間表現(xiàn)為隱含的、錯綜復(fù)雜的非線性數(shù)學(xué)映射關(guān)系,物流需求的預(yù)測涉及數(shù)據(jù)統(tǒng)計技術(shù)、計算機技術(shù)等,因此建立可靠、高效及精準的陜西省物流需求預(yù)測模型面臨巨大的挑戰(zhàn)。
目前,研究學(xué)者構(gòu)建物流需求預(yù)測模型的方法主要分為傳統(tǒng)預(yù)測方法和現(xiàn)代預(yù)測方法。傳統(tǒng)預(yù)測方法主要包括增長率法、指數(shù)平滑法、差分自回歸移動平均法等,其中增長率法、指數(shù)平滑法默認物流發(fā)展為穩(wěn)定的增長態(tài)勢,無法準確預(yù)測發(fā)展趨勢多變的短期物流需求,差分自回歸移動平均法僅可以建立物流與各影響因素之間的線性關(guān)系,預(yù)測效果存在偏差。現(xiàn)代預(yù)測方法主要包括灰色預(yù)測模型、神經(jīng)網(wǎng)絡(luò)、支持向量機(SVM)等方法,可以建立物流需求與各影響因素之間的非映射關(guān)系,預(yù)測效果更為準確。相較于SVM 模型,灰色預(yù)測模型、神經(jīng)網(wǎng)絡(luò)方法本身理論架構(gòu)存在不足,模型在初始階段狀態(tài)產(chǎn)生誤差。SVM 模型以結(jié)構(gòu)風(fēng)險最小作為算法準則,在小樣本、非線性的物流需求預(yù)測中表現(xiàn)出良好的適應(yīng)性。然而傳統(tǒng)的SVM 模型在處理高重疊、高緯度的樣本數(shù)據(jù)時,計算速度與效果都會受到影響,整合樣本數(shù)據(jù)、降低數(shù)據(jù)維度是提高SVM 模型預(yù)測效率與準確性的重要步驟。
1.1 因子分析模型(FA)。因子分析是當前較為常用的多變量統(tǒng)計方法,研究變量間的相互依賴關(guān)系,把錯綜復(fù)雜及緊密聯(lián)系的變量綜合成少數(shù)公因子的統(tǒng)計方法。基于降維的理念,確保指標信息不丟失的前提下,用較少的公因子指標取代諸多原始指標,使原始的指標體系結(jié)構(gòu)更加簡潔易操作,有利于后期指標體系綜合評價分析。
因子分析的原理就是把每個研究變量分解成兩部分因素,一部分由為代表全部變量共同特征的少數(shù)幾個公因子F 組成,另一部分是每個變量獨自具有的特征,即特殊因子ε。因子分析模型如式(1)。
通過定義核函數(shù)K (xx)=φ (x)·φ (x)(φ (x)為非線性函數(shù)),將樣本數(shù)據(jù)變換到高維空間進行線性回歸,在實際應(yīng)用過程中,將非線性回歸函數(shù)轉(zhuǎn)化為其對偶問題進行求解。
在進行物流需求預(yù)測時,影響預(yù)測效率及準確性的因素眾多,影響多為非線性、隨機性的,同時樣本數(shù)據(jù)維度過高,單一預(yù)測模型預(yù)測效率低、結(jié)果穩(wěn)定性差。由于FA 模型可以對物流的樣本數(shù)據(jù)進行整合、降低樣本維度,SVM 預(yù)測模型又可以表征物流需求的非線性、隨機性;故此,為了解決物流需求預(yù)測模型中的難題,本文提出了FA-SVM 模型,首先構(gòu)建多影響因素下陜西省物流需求指標體系,并采用因子分析方法(FA) 對數(shù)據(jù)樣本進行降維處理,選取累計貢獻度較高的指標,用于反映需求量變化情況;其次采用SVM 模型對2010~2017 年的陜西省物流數(shù)據(jù)進行訓(xùn)練,確定核函數(shù),用2008~2009 年數(shù)據(jù)進行模型修正,2018 年數(shù)據(jù)進行過模型驗證;最后對2019~2020 年的陜西省物流需求情況進行預(yù)測,具體過程如圖1 所示。
圖1 FA-SVM 的物流需求預(yù)測流程
從陜西省的經(jīng)濟水平、貿(mào)易水平、服務(wù)供給水平3 個角度選取影響因素。對選取影響指標進行收集整理,得到物流需求量指標體系如表1 所示。
表1 物流需求量指標體系圖
3.1 區(qū)域物流需求指標體系構(gòu)建。本文中涉及到的數(shù)據(jù)主要來源于陜西省2008~2018 年相關(guān)部門統(tǒng)計年鑒以及國家統(tǒng)計局公布數(shù)據(jù),如圖2 所示。
圖2 2008~2018 年物流需求量指標變化圖
使用SPSS 軟件對區(qū)域物流需求量指標體系進行因子分析,得到KMO 和巴特利特檢驗結(jié)果、初始值為1 的X~X指標累計貢獻率,如表2、表3 所示。
表2 KMO 和巴特利特檢驗
表3 累計貢獻率
由表2 可知,KMO=0.63>0.5,說明所選指標關(guān)聯(lián)性強,且巴特利特球形度檢驗Sig.<0.01,證明各指標相關(guān)系數(shù)矩陣不為單位矩陣,各指標間存在關(guān)聯(lián)性。由表3 可知,X~X均與Y、Y有密切相關(guān)性,其中X、X、X、X、X、X、X對研究對象的累計貢獻率達到94%,X、X的累計貢獻達到70%,證明所選取的指標可靠有效,數(shù)據(jù)質(zhì)量較好,構(gòu)建區(qū)域物流需求指標體系,可用于反映需求量變化情況。
3.2 SVM 模型參數(shù)及適用性評價。將陜西省各物流需求影響因素作為模型的輸入量,分別以客流量、貨流量作為輸出,在訓(xùn)練和預(yù)測過程中,確定本次SVM 模型的約束函數(shù)及核函數(shù),以2010~2017 年預(yù)測結(jié)果的誤差(均方根誤差、平均絕對誤差)作為評價預(yù)測效果的標準。
通過多次訓(xùn)練驗證,確定核函數(shù)為徑向基核函數(shù)(RBF Kernel),相關(guān)參數(shù)表4。其中Kernel Scale 為SVM 模型參數(shù)Sigma,即“內(nèi)核寬度”,該參數(shù)為徑向基核函數(shù)的主要表征參數(shù),表明模型核函數(shù)選取準確;R均大于98%,表明模型擬合效果較好。
表4 SVM 模型核函數(shù)參數(shù)表
經(jīng)過SVM 模型處理后,得到2010~2017 年貨運量及客運量的預(yù)測結(jié)果,如圖3、圖4 所示。
圖3 客運量預(yù)測結(jié)果擬合圖
圖4 貨運量預(yù)測結(jié)果擬合圖
從客運量、貨運量預(yù)測圖來看,預(yù)測模型擬合程度高,變化趨勢表征明顯,證明本文研究對象的影響因素指標選取得當,能夠很好地反映客、貨運量的變化趨勢。在后續(xù)對本地區(qū)物流發(fā)展情況進行研究時,可根據(jù)不同領(lǐng)域影響因素指標的重要程度著手調(diào)節(jié)管控,從而提高區(qū)域物流水平。
根據(jù)表5 SVM 模型得出的預(yù)測結(jié)果與真實值的誤差分析可得,Y貨運量、Y客運量的MAPE 分別為2.23%、1.21%,表明預(yù)測值與真實值之間誤差極小,模型選取合適。
表5 預(yù)測結(jié)果誤差表
3.3 FA-SVM 模型在陜西省物流預(yù)測中的應(yīng)用。依據(jù)FA-SVM 的區(qū)域物流需求預(yù)測模型,對2018~2020 年陜西省貨運量Y及客運量Y進行預(yù)測,預(yù)測結(jié)果與實際值如表6 所示。2018 年Y、Y預(yù)測值與實際值的誤差分別為3.85%、2.83%,2019 年Y、Y預(yù)測值與實際值的誤差分別為6.39%、5.46%,預(yù)測效果整體較為準確;2020 年Y、Y實際值較模型預(yù)測發(fā)展趨勢差異較大,主要原因為新冠疫情嚴重降低了國內(nèi)人員及貨物的流動性、國際航運和進出口冷鏈產(chǎn)品的貨運量。
表6 區(qū)域物流預(yù)測結(jié)果與實際值對比
隨著疫情防控形勢的好轉(zhuǎn),疫情所帶來的影響會逐漸削弱,陜西省的貨運量及客運量仍將保持增長趨勢,建立穩(wěn)定高效的應(yīng)急物流服務(wù)體系將為物流業(yè)的發(fā)展提供可靠保障。
本文提出了一種“FA-SVM”新模型,并對陜西省近年物流需求展開了預(yù)測、分析和研究,主要得出以下結(jié)論:(1) 構(gòu)建了經(jīng)濟水平、貿(mào)易水平、服務(wù)供給水平三方面的陜西省區(qū)域物流需求量指標體系,通過因子分析發(fā)現(xiàn)地區(qū)生產(chǎn)總值(X)、物流業(yè)增加值(X)、物流業(yè)固定資產(chǎn)投資額(X)、區(qū)域消費零售總額(X)、區(qū)域進出口總額(X)、區(qū)域貨運周轉(zhuǎn)量(X)、區(qū)域旅客周轉(zhuǎn)量(X)等指標對陜西省物流需求的累計貢獻率高于94%,區(qū)域郵電業(yè)務(wù)量(X)、物流從業(yè)人數(shù)(X)等指標對陜西省物流需求的累計貢獻率高于71%,指標選取恰當,能夠反映區(qū)域物流變化趨勢特點。(2) 獲取整理了陜西省區(qū)域物流量數(shù)據(jù)集,將其應(yīng)用于FA-SVM 模型的訓(xùn)練、修正、驗證及使用,確定支持向量機模型的核函數(shù)為RBF Kernel,得到關(guān)于客運量(Y)、貨運量(Y)的R和MAPE 分別為0.9879 和0.9924、2.23%和1.21%,擬合效果優(yōu)秀,模型選取恰當。(3) 運用FA-SVM 模型對2018~2019 年區(qū)域物流需求進行預(yù)測分析,得到2018 年客運量(Y)、貨運量(Y)預(yù)測值與實際值的誤差分別為3.85%、2.83%,2019年客運量(Y)、貨運量(Y)預(yù)測值與實際值的誤差分別為6.39%、5.46%。(4) FA-SVM 的區(qū)域物流需求預(yù)測模型有效改善了預(yù)測效率及精度,其對陜西省物流需求的預(yù)測結(jié)果良好,也為其他省市的物流需求預(yù)測提供了一種行之有效的途徑。