亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于數(shù)據(jù)挖掘的景區(qū)客流量預測模型研究

2021-08-06 14:35吳學成

現(xiàn)代電子技術(shù) 2021年15期

吳學成

（凱里學院，貴州凱里 556011）

0 引言

對景區(qū)客流量進行建模與預測，可以幫助景區(qū)管理人員了解景區(qū)客流量的變化動態(tài)，制定一些更加合理的管理措施，增強景區(qū)管理水平，因此景區(qū)客流量預測成為經(jīng)濟領(lǐng)域研究的一個熱點課題[1?3]。

當前景區(qū)客流量預測模型分為三類：線性回歸方法、時間序列分析法、神經(jīng)網(wǎng)絡(luò)[4]。其中線性回歸方法主要有多元回歸、逐步回歸，對景區(qū)客流量數(shù)據(jù)直接進行建模，景區(qū)客流量預測誤差大[5]；時間序列分析法根據(jù)時間先后對景區(qū)客流量進行組合，然后對其進行建模[6?7]，該類方法主要針對季節(jié)性、周期性等變化規(guī)律的景區(qū)客流量，通用性差[8?10]；人工神經(jīng)網(wǎng)絡(luò)可以深層次挖掘景區(qū)客流量變化特點，是當前主要的建模工具[11?13]。在實際應用中，當前景區(qū)客流量預測模型同樣存在一些不足，如景區(qū)客流量預測誤差比較大，景區(qū)客流量預測穩(wěn)定性比較差[14?16]。

為了解決回聲狀態(tài)網(wǎng)絡(luò)的參數(shù)優(yōu)化問題，以提高景區(qū)客流量預測效果為目標，提出了數(shù)據(jù)挖掘的景區(qū)客流量預測模型，并通過具體景區(qū)客流量預測仿真對比實驗，驗證了本文模型的有效性和優(yōu)越性。

1 數(shù)據(jù)挖掘的景區(qū)客流量預測模型

1.1 回聲狀態(tài)網(wǎng)絡(luò)

回聲狀態(tài)網(wǎng)絡(luò)是一種數(shù)據(jù)挖掘技術(shù)，具有短期記憶數(shù)據(jù)的功能，其結(jié)構(gòu)如圖1所示。其中，Win，Wout分別表示輸入層和儲備層、儲備層和輸出層之間的連接權(quán)重矩陣。

圖1 回聲狀態(tài)網(wǎng)絡(luò)結(jié)構(gòu)

回聲狀態(tài)網(wǎng)絡(luò)的工作狀態(tài)方程可以采用如下形式進行描述：

式中：W x為連接矩陣；u(t)，x(t)分別為輸入向量和儲備池內(nèi)部向量。

回聲狀態(tài)網(wǎng)絡(luò)的輸出形式可以描述為：

式中y(t)為輸出向量。

采用最小二乘法對輸出權(quán)值進行求解，那么目標函數(shù)可以描述為：

式中：X=[x(1),x(2),…,x(l)]T，X∈Rl×N，N為儲備池節(jié)點數(shù)，l為訓練樣本數(shù)；Y=[y(1),y(2),…,y(l)]T。

對于大規(guī)模網(wǎng)絡(luò)流量數(shù)據(jù)，訓練樣本數(shù)常大于儲備池節(jié)點數(shù)，那么，根據(jù)式（3）得到解：

X的奇異值分解可以描述為：

式中：U=(u1,u2,…,ul)和V=(v1,v2,…,vl)是酉矩陣；Σ=diag(σ1,…,σr,σr+1,…,σN)。

當前X的秩是r，那么可以得到：

X的逆矩陣為X+，那么可以采用式（7）進行表示：

這樣可以得到：

傳統(tǒng)回聲狀態(tài)網(wǎng)絡(luò)的魯棒性差，為了克服該缺陷，選擇拉普拉斯分布描述高斯分布，可得到：

這樣，w的先驗分布計算公式可以表示為：

那么可以得到：

式中p(y|a,β)為邊際函數(shù)，且有：

基于邊際優(yōu)化原則有：

式中ε=y-Aw。

得到：

p(w|y)和p(y|a,β)替代函數(shù)分別為：

綜合式（10）、式（16）以及式（18）產(chǎn)生如下公式：

其中：

最后得到w的計算公式為：

其中：

式中A表示對角矩陣。

對于參數(shù)a和β可以根據(jù)證據(jù)函數(shù)方法確定，通過對輸出權(quán)值w積分，可得邊際似然函數(shù)為：

式中，C=β-1Λ+ΦA(chǔ)-1ΦT。

將lnp分別對參數(shù)a和β求偏導，并令導數(shù)為零，可以得到a和β估計公式具體如下：

式中γj=1-aj Σij。

1.2 數(shù)據(jù)挖掘的景區(qū)客流量預測步驟

1）收集景區(qū)客流量預測數(shù)據(jù)，并根據(jù)時間先后順序組成景區(qū)客流量的學習樣本集合。

2）對原始的景區(qū)客流量時間序列數(shù)據(jù)進行重構(gòu)，得到景區(qū)客流量預測的訓練集和測試集合。

3）回聲狀態(tài)網(wǎng)絡(luò)對景區(qū)客流量的訓練集進行學習，并確定回聲狀態(tài)網(wǎng)絡(luò)的參數(shù)。

4）根據(jù)參數(shù)建立景區(qū)客流量預測模型，采用測試樣本對景區(qū)客流量預測模型性能進行分析。

2 景區(qū)客流量預測模型性能的仿真測試

2.1 景區(qū)客流量的歷史數(shù)據(jù)

為了測試基于數(shù)據(jù)挖掘的景區(qū)客流量預測性能，采用黔東南地區(qū)某景區(qū)客流量歷史數(shù)據(jù)作為研究對象，如圖2 所示。圖2 景區(qū)客流量數(shù)據(jù)具有一定的隨機性和混沌性，因此不能采用原始的景區(qū)客流量數(shù)據(jù)進行建模與預測，需要對其進行相應的變換。

圖2 景區(qū)客流量的歷史數(shù)據(jù)

2.2 重構(gòu)景區(qū)客流量的歷史數(shù)據(jù)

景區(qū)客流量數(shù)據(jù)嵌入維和延遲時間如圖3 所示。從圖3 可以看出，景區(qū)客流量數(shù)據(jù)嵌入維和延遲時間最優(yōu)值為3 和5，對圖2 景區(qū)客流量重構(gòu)，選擇50 個樣本作為景區(qū)客流量，其他景區(qū)客流量數(shù)據(jù)用于訓練回聲狀態(tài)網(wǎng)絡(luò)，建立景區(qū)客流量預測模型。

圖3 景區(qū)客流量數(shù)據(jù)的嵌入維和延遲時間

2.3 與經(jīng)典景區(qū)客流量預測模型的性能對比

為了檢測基于數(shù)據(jù)挖掘的景區(qū)客流量預測的優(yōu)越性，選擇BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預測模型、時間序列分析法的景區(qū)客流量預測模型進行對比實驗，預測結(jié)果如圖4 所示。

對圖4的景區(qū)客流量預測結(jié)果進行對比和分析可知：

圖4 不同模型的景區(qū)客流量預測結(jié)果對比

1）時間序列分析法的景區(qū)客流量預測值與實際的景區(qū)客流量值之間的偏差最大，這表明時間序列分析法無法描述景區(qū)客流量的變化態(tài)勢，使得景區(qū)客流量預測誤差大。

2）BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預測值與實際的景區(qū)客流量值之間的偏差不大，這表明BP 神經(jīng)網(wǎng)絡(luò)可以描述景區(qū)客流量的變化態(tài)勢，但是其個別景區(qū)客流量預測誤差比較大，使得景區(qū)客流量預測結(jié)果不穩(wěn)定，導致景區(qū)客流量預測整體精度比較低。

3）相對于時間序列分析法的景區(qū)客流量預測模型和BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預測模型，本文模型的預測值與實際景區(qū)客流量之間的偏差最小，這表明本文模型可以更好地擬合景區(qū)客流量的變化態(tài)勢，減少了景區(qū)客流量預測誤差，獲得了更加理想的景區(qū)客流量預測結(jié)果，體現(xiàn)了本文模型的優(yōu)越性。

2.4 景區(qū)客流量預測模型的通用性測試

為了分析基于數(shù)據(jù)挖掘的景區(qū)客流量預測模型的通用性，采用全國10 個熱門景區(qū)客流量作為研究對象，統(tǒng)計每一個景區(qū)客流量的預測精度，結(jié)果如表1 所示。

表1 不同景區(qū)客流量預測精度 %

對表1 的景區(qū)客流量預測精度進行對比可以發(fā)現(xiàn)，相對于BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預測模型和時間序列分析法的景區(qū)客流量預測模型，本文模型的景區(qū)客流量預測精度得到了提高，景區(qū)客流量預測精度平均值超過了90%，景區(qū)客流量預測誤差處于景區(qū)客流量實際管理范圍內(nèi)，獲得了較好的通用性。

3 結(jié)語

針對當前景區(qū)客流量預測效果差的弊端，以改善景區(qū)客流量預測結(jié)果為目標，本文提出了基于互聯(lián)網(wǎng)大數(shù)據(jù)的景區(qū)客流量預測模型。仿真實驗結(jié)果表明，本文模型是一種精度高、通用性好的景區(qū)客流量平均預測模型，具有廣泛的應用前景。