李冬
(云南機電職業(yè)技術學院 工業(yè)信息技術系, 云南 昆明 650203)
隨著人們生活水平的日益提高,人們對生活質量要求也越來越高,出去旅游成為人們享受生活,休閑度假的一種重要方式,這使得景區(qū)管理面臨的壓力越來越大。在節(jié)假日,景區(qū)客流量急劇增加,而淡季時,景區(qū)客流量很少,如何對景區(qū)客流量進行有效管理,提高景區(qū)的經(jīng)濟收益,同時又不破壞景區(qū)生態(tài)顯得越來越重要,而景區(qū)客流量的預測可以描述景區(qū)客流量的變化態(tài)勢,因此景區(qū)客流量預測與建模研究具有十分重要的理論意義,同時具有一定的經(jīng)濟價值[1-3]。
幾十年以來,景區(qū)客流量預測的研究一直沒有中斷過,主要有定性的景區(qū)客流量預測建模技術和定量的景區(qū)客流量預測建模技術,其中定性的景區(qū)客流量預測建模技術主要從整體上對景區(qū)客流量變化態(tài)勢進行分析和研究,但是其景區(qū)客流量預測結果的可解釋性比較差[4],而定量的景區(qū)客流量預測建模技術可以更加細致地對景區(qū)客流量變化特點進行分析,其實際應用范圍更加廣泛,成為當前景區(qū)客流量預測建模方向[5]。當前定量的景區(qū)客流量預測建模技術主要有線性建模和非線性建模兩種。線性建模方法最常用為自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,ARIMA),其主要對景區(qū)客流量的季節(jié)性變化特點進行描述,當景區(qū)客流量具有隨機性時,ARIMA模型的景區(qū)客流量預測缺陷就體現(xiàn)出來了,如景區(qū)客流量預測誤差大等[6];非線性建模方法最常用為人工神經(jīng)網(wǎng)絡,主要有RBF神經(jīng)網(wǎng)絡、BP神經(jīng)網(wǎng)絡[7-9],其主要對景區(qū)客流量的隨機性變化特點進行描述,無法對景區(qū)客流量的季節(jié)性、周期性等變化特點進行描述,因此局限性也十分明顯,得到的景區(qū)客流量預測結果并非真正的最優(yōu),經(jīng)常出現(xiàn)一些偏差比較大的景區(qū)客流量預測結果[10]。
由于景區(qū)客流量變化十分復雜,具有一定的季節(jié)性變化特點,并且具有隨機性變化特點,單一的ARIMA模型或者人工神經(jīng)網(wǎng)絡無法有效的反映景區(qū)客流量的全部變化特點,為了提高景區(qū)客流量預測結果,降低景區(qū)客流量預測誤差,提出了大數(shù)據(jù)分析的景區(qū)客流量預測模型,該方法集成了ARIMA模型和BP神經(jīng)網(wǎng)絡的優(yōu)點,對景區(qū)客流量的季節(jié)性、隨機性變化特點同時進行描述,并與其他景區(qū)客流量預測模型進行了對比實例分析,結果表明,大數(shù)據(jù)分析是一種精度高、時間少的景區(qū)客流量預測模型。
ARIMA是一種常用的時間序列分析方法,可以對具體問題不需要詳細的描述就可以找到適合的預測模型,常用的形式為ARIMA(p,d,q),其中p表示自回歸過程的階數(shù)、d表示差分的階數(shù)、q表示移動平均階數(shù),ARIMA(p,d,q)的結構,如式(1)—式(4)。
(1)
式中,
d=(1-B)d
(2)
Φ(B)=1-φ1B-…-φpBp
(3)
Θ(B)=1-θ1B-…-θqBq
(4)
ARIMA的建模流程如下。
Step1:數(shù)據(jù)預處理。
Step2:時間序列平穩(wěn)性的檢驗。
Step3:差分運算。
Step4:自回歸移動平均定階。
Step5:對回歸擬合結果進行顯著性檢驗。
Step6:選擇效果最好的ARIMA(p,d,q)作為最終的預測模型。
BP神經(jīng)網(wǎng)絡屬于多層前饋網(wǎng)絡,相對于其他人工神經(jīng)網(wǎng)絡,最大的優(yōu)點為:誤差反向傳播機制,對一般的回歸問題,可以對其輸入和輸出的非線性映射關系進行自適應學習,工作過程為:
第1階段:信號前向傳播,具體步驟如下。
Step1:隱含層第i個節(jié)點的輸入和輸出,如式(5)、式(6)。
(5)
(6)
Step2:輸出層第k個節(jié)點的輸入和輸出,如式(7)、式(8)。
(7)
(8)
第2階段:誤差反向傳播,具體步驟如下。
Step1:第p個訓練樣本的誤差計算式,如式(9)。
(9)
Step2:所有訓練樣本的誤差計算式,如式(10)。
(10)
Step3:根據(jù)誤差梯度下降法對各層的連接權值和閾值進行修正,直到誤差滿足實際應用要求為止,權值和閾值修正公式,如式(11)—式(14)。
(11)
(12)
(13)
(14)
(1) 收集景區(qū)客流量的歷史樣本數(shù)據(jù),并將這些數(shù)據(jù)根據(jù)時間先后順序組成一個時間序列樣本集合。
(2) 采用ARIMA對景區(qū)客流量時間序列樣本集合進行建模,得到ARIMA的景區(qū)客流量預測結果。
(3) 采用BP神經(jīng)網(wǎng)絡對景區(qū)客流量時間序列樣本集合進行建模,得到BP神經(jīng)網(wǎng)絡的景區(qū)客流量預測結果。
(4) 確定ARIMA的景區(qū)客流量預測結果和BP神經(jīng)網(wǎng)絡的景區(qū)客流量預測結果的權值w1和w2。
(5) 根據(jù)w1和w2對ARIMA的景區(qū)客流量預測結果和BP神經(jīng)網(wǎng)絡的景區(qū)客流量預測結果進行加權操作,得到最終的景區(qū)客流量預測結果。
為了分析大數(shù)據(jù)分析的景區(qū)客流量預測有效性,選擇10個景區(qū)一段時間內(nèi)客流量作為分析目標,每一個景區(qū)的客流量樣本數(shù)據(jù)量不一樣,將樣本數(shù)據(jù)劃分為訓練樣本集合和驗證樣本集合,其中訓練樣本集合用于構建景區(qū)客流量預測模型,并對景區(qū)客流量預測模型的擬合效果進行分析,驗證樣本集合用于測試景區(qū)客流量預測模型的預測能力,它們的樣本數(shù)量,如表1所示。
表1 景區(qū)客流量預測的實驗分析數(shù)據(jù)源
采用VC++6.0編程實現(xiàn)景區(qū)客流量預測仿真實驗。
選擇文獻[11]的景區(qū)客流量預測模型進行對比測試,統(tǒng)計它們的擬合精度,如圖1所示。
圖1 景區(qū)客流量的擬合精度對比
從圖1的景區(qū)客流量擬合精度可以看出,兩種模型的景區(qū)客流量擬合精度都比較高,大數(shù)據(jù)分析的景區(qū)客流量擬合精度平均值為95.32%,文獻[11]的景區(qū)客流量擬合精度平均值為91.55%,相對于文獻[11]的景區(qū)客流量預測模型,大數(shù)據(jù)分析的景區(qū)客流量擬合精度提升了3.67%,可以更好地描述景區(qū)客流量的變化特點,對比結果驗證了大數(shù)據(jù)分析的景區(qū)客流量預測模型的優(yōu)越性。
對于一個景區(qū)客流量預測模型來說,擬合結果只能描述其對過去景區(qū)客流量變化特點的描述,無法對將來的景區(qū)客流量變化特點進行描述,因此需要通過對驗證樣本集合進行測試,統(tǒng)計選擇文獻[11]和本文模型對景區(qū)客流量的驗證樣本的預測精度,如圖2所示。
圖2 景區(qū)客流量的預測精度對比
從圖2的景區(qū)客流量預測精度可以看出,兩種模型的景區(qū)客流量預測精度相差比較大,大數(shù)據(jù)分析的景區(qū)客流量預測精度平均值為90.69%,文獻[11]的景區(qū)客流量預測精度平均值為83.20%,相對于文獻[11]的景區(qū)客流量預測模型,大數(shù)據(jù)分析的景區(qū)客流量預測精度有了較大的提升,有效減少了景區(qū)客流量預測誤差,對比結果再次驗證了大數(shù)據(jù)分析的景區(qū)客流量預測模型的優(yōu)越性。
為了測試景區(qū)客流量建模時間,分別統(tǒng)計所有預測模型的平均擬合時間和預測時間,如表2所示。
從表2可以看出,本文模型的景區(qū)客流量的擬合時間和預測時間均少于對比模型,精簡了景區(qū)客流量建模過程,獲得了較好的景區(qū)客流量建模效率。
景區(qū)客流量變化具有一定的季節(jié)性,即周期性,同時具有一定的非平穩(wěn)性,即隨機性,使得當前傳統(tǒng)模型的景區(qū)客流量預測偏差較大,不能對景區(qū)游客的管理工作提供更有價值的指導意見。為此,提出了大數(shù)據(jù)分析的景區(qū)客流量預測模型,實例分析結果表明,大數(shù)據(jù)分析模型集成了當前經(jīng)典模型的優(yōu)點,解決了當前景區(qū)客流量預測誤差大的難題,獲得了比當前其他模型更優(yōu)的景區(qū)客流量預測結果,可以應用于實際的景區(qū)游客的管理工作中。
表2 不同的景區(qū)客流量建模時間比較