謝萍萍
( 黎明職業(yè)大學 智能制造工程學院, 福建 泉州 362000 )
近年來隨著石油能源危機和生態(tài)環(huán)境壓力的進一步加大,新能源汽車已逐步代替?zhèn)鹘y(tǒng)汽車,并呈快速發(fā)展趨勢,如2019年我國新能源車的銷售量為120.6萬輛,2020年為136.7萬輛,2021年為352.1萬輛.目前,預測銷售量通常采用時間序列模型[1]、回歸分析模型[2]、灰色模型[3]等方法,但時間序列模型和回歸分析模型對解決多元非線性問題具有局限性,而灰色神經網絡則存在易陷入局部極小和收斂速度慢等問題.研究顯示,組合模型可以更好地挖掘數(shù)據的內部特征,提高預測的精度.例如:O.Kitapc等[4]利用多元回歸和神經網絡分析法對土耳其的汽車銷售量進行了預測;周彥福等[5]利用果蠅算法優(yōu)化灰色神經網絡模型后對新能源汽車的月度銷售量進行了預測.廣義回歸神經網絡(general regression neural network,GRNN)是一種建立在數(shù)理統(tǒng)計基礎上的徑向基函數(shù)網絡,由于它能夠較好地解決非線性問題以及提高少量數(shù)據或者數(shù)據不穩(wěn)定時的預測效果,因而受到學者們的關注[6].目前,使用GRNN預測銷售量的相關研究較少.梁達強[7]和王紅衛(wèi)等[8]利用GRNN分別對木漿和燈具的銷售量進行了預測,但其研究均將所選的影響因子直接作為預測模型的輸入變量(未對影響因子進行降維),因此其計算速度和預測精度存在不足.為此,本文將主成分分析(principal component analysis,PCA)方法與GRNN方法相結合,提出了一種PCA-GRNN預測模型,并對我國新能源汽車的月度銷售量進行了預測.
PCA是一種多變量統(tǒng)計分析方法,該方法將原來的多個變量化為少數(shù)幾個主成分,以此實現(xiàn)降維并用以特征提取和數(shù)據壓縮.PCA的基本模型為:
(1)
圖1 廣義回歸神經網絡結構
影響新能源汽車月度銷售量的因素較多,本文根據文獻[11-13]的研究結果選取動力電池月份裝車量X1(GW·h)、充電基礎設施X2(萬臺)、電池級碳酸鋰平均價格X3(萬元/t)、交通和通信類居民消費價格指數(shù)X4(上年同月=100)、全國城鎮(zhèn)調查失業(yè)率X5(%)、汽車制造業(yè)工業(yè)生產者出廠價格指數(shù)X6(上年同月=100)等6個影響因子作為構建新能源汽車月度銷售量Y(萬輛)預測模型的因子指標,各年份及其月份的數(shù)據見表1.表1中的數(shù)據來源于國家統(tǒng)計局、中國汽車工業(yè)協(xié)會以及網絡公開資料.
表1 影響新能源汽車月度銷售量的因子指標及其數(shù)值
采用SPSS軟件對因子指標進行主成分分析,其分析主要包括:因子相關系數(shù)矩陣、KMO和Bartlett’s球形檢驗、因子總方差的解釋.
1)因子相關系數(shù)矩陣.表2為新能源汽車銷售量影響因子的相關性矩陣.由表中的相關系數(shù)可知,各個影響因子之間的相關性較強,因此需利用主成分分析法對其進行降維來消除各影響因子間的相關性,以減少預測模型的輸入變量.
表2 因子的相關性矩陣
2) KMO和Bartlett’s球形檢驗.經檢驗,KMO檢驗的結果為0.685,這表明所選因子適用于主成分分析;Bartlett’s球形檢驗的顯著性結果為p=0 (小于0.001),該結果進一步表明所選因子適用于主成分分析.
3)因子總方差的解釋.表3為新能源汽車銷售量影響因子的總方差解釋表.由表3可知,成分1和成分2的方差解釋率累計為89.625%(成分1的方差解釋率為71.615%,成分2的方差解釋率為18.011%),表明這兩個成分包含了6個影響因子的大部分信息,可以作為主成分分析的條件.
表3 因子總方差的解釋
2.3.1PCA-GRNN模型的建立
建模時首先根據表1中的影響因子數(shù)據在SPSS軟件中計算出主成分1和主成分2,然后在Matlab軟件中調用Matlab神經網絡工具箱中的GRNN神經網絡函數(shù)建立GRNN神經網絡預測模型.按上述建立的預測模型如圖2所示.
圖2 PCA-GRNN模型的結構
2.3.2預測方法與結果分析
預測時,將表1中的2020—2021年的24個月度數(shù)據作為模型訓練數(shù)據,并將其隨機分為24組;在每個組內,將前23個月度數(shù)據作為訓練樣本,將最后的1個月的月度數(shù)據作為測試樣本.計算時,模型的分布密度值取0.1~1.0(采用試驗法獲得)[14].
為檢驗PCA-GRNN模型的有效性,將PCA-GRNN模型與PCA-BP、PCA-Elman模型進行了對比.PCA-BP模型和PCA-Elman模型是通過調用Matlab軟件中的BP和Elman神經網絡函數(shù)建立的,其中輸入層為主成分1和主成分2,輸出層為月度銷售量,隱含層的節(jié)點數(shù)為2.PCA-BP模型中的隱含層的激活函數(shù)分別為tansig函數(shù)和purelin函數(shù),輸出層函數(shù)為trainlm函數(shù);PCA-Elman模型中的隱含層的激活函數(shù)分別為tansig函數(shù)和purelin函數(shù),輸出層函數(shù)為traingdm函數(shù).3個模型均采用相同的月度數(shù)據進行學習訓練.3個模型完成訓練后,以2022年1—3月的樣本數(shù)據對其進行預測和性能對比.圖3為3個模型的預測結果.由圖可以看出,3個模型預測的銷量趨勢基本一致,即總體呈現(xiàn)穩(wěn)步增長趨勢.
圖3 3種模型預測新能源汽車月度銷售量的預測值與實際值的對比
圖4為3種模型預測的新能源汽車月度銷售量的相對誤差 (預測數(shù)據的月份為2020年1月—2021年12月).由圖4可見,3個模型預測的相對誤差除2020年2月和2021年12月超過10%外,其余月份均在10%以內.2020年2月出現(xiàn)預測值相對誤差較大的主要原因是銷售受到了新冠疫情的影響(銷售量僅達到1.3萬輛);2021年12月出現(xiàn)預測值相對誤差較大的主要原因是銷售受到了新能源汽車財政補貼政策調整預期的影響(銷售量達到53.1萬輛).經計算,PCA-GRNN、PCA-BP和PCA-Elman模型預測的新能源汽車月度銷售量的平均相對誤差分別為5.34%、6.78%和6.42%.該結果表明,PCA-GRNN模型的預測效果優(yōu)于PCA-BP和PCA-Elman模型.
表4為3種模型對2022年1—3月的新能源汽車月度銷售量的預測結果.由表4可知,PCA-GRNN、PCA-BP和PCA-Elman模型預測的平均相對誤差分別為4.00%、4.77%和4.29%,該結果進一步表明PCA-GRNN模型的預測效果優(yōu)于PCA-BP和PCA-Elman模型.
圖4 3種模型預測新能源汽車月度銷售量的相對誤差
表4 3種模型對2022年1—3月新能源汽車銷售量的預測結果
利用本文提出的PCA-GRNN模型對2022年1—3月的新能源汽車月度銷售量進行預測顯示,其平均相對誤差為4.00%,低于PCA-BP和PCA-Elman模型預測的平均相對誤差(分別為4.77%和4.29%),因此本文提出的預測模型具有一定的實用價值.由于影響銷售的因素較多,因此在今后的研究中筆者將增加其他因素(如財政補貼標準和汽車芯片產能等指標)以及采用遺傳算法等來進一步提高本文模型的適用性.