屈波怡,詹冰清,劉博偉
(1.上海理工大學(xué)管理學(xué)院,上海 200093;上海理工大學(xué)出版印刷與藝術(shù)設(shè)計學(xué)院,上海 200093)
隨著我們踏入智能化生活,我們的消費支付方式也由從前的現(xiàn)金支付發(fā)展到現(xiàn)金支付與電子支付并存[1]。電子支付中使用率最高且最便捷的是移動支付。移動支付并不是我國所創(chuàng)造,但它卻在我國得到了前所未有發(fā)展。由于它方便快捷,人們開始越來越依賴這種支付方式,甚至政府也開始數(shù)字人民幣試點。但也有一部分人覺得移動支付沒有現(xiàn)金支付實在,移動支付在很多鄉(xiāng)村及偏遠(yuǎn)地區(qū)沒有得到普及,以及很多老年人不會使用移動支付,是否要取消現(xiàn)金支付及數(shù)字人民幣能否取代移動支付等都成為一個個爭議話題[2]。從表1 中我們可以觀察到中國移動支付交易額呈持續(xù)增長,在面臨種種問題的環(huán)境下,移動支付未來尚不明確,所以有必要對中國移動支付交易額進(jìn)行預(yù)判。
表1 中國移動支付現(xiàn)狀
GM(1,1)模型、ARIMA 模型和LSTM 模型已經(jīng)在預(yù)測方面有了很好的案例結(jié)果[3-5],本文也使用上述模型對中國移動支付額進(jìn)行預(yù)測。希望本文預(yù)測能為政府決策和企事業(yè)單位管理方式等提供科學(xué)有效的政策建議[6]。
GM(1,1)灰色系統(tǒng)理論模型由鄧聚龍等人在1982 年提出[7]。在面對數(shù)據(jù)量少且信息不豐富的條件下,GM 模型通過對數(shù)據(jù)處理,從而建立模型,完成預(yù)測任務(wù)。GM(1,1)模型參數(shù)意義是該模型方程為一階方程一個變量。構(gòu)建GM(1,1)模型,過程如下:
為了降低隨機序列波動性和隨機性影響,我們對一般序列累加處理,達(dá)到數(shù)據(jù)降噪效果。設(shè)原始數(shù)據(jù)為n 個樣本X(0)={X(0)(1),X(0)(2),…,X(0)(n)},累加得到灰色序列X(1)={X(1)(1),X(1)(2),…,X(1)(n)}。然后建立灰微分方程,令,建立累加矩陣B,常數(shù)項向量y。
對其進(jìn)行最小二乘估計,
我們對結(jié)果數(shù)據(jù)累減操作,得到原數(shù)據(jù)X(0)。最后我們使用精度檢驗表對GM(1,1)模型進(jìn)行評判,計算出后驗差比或小誤差概率,與表2 進(jìn)行對照,得到模型精度等級。
表2 精度檢驗等級參照表
ARIMA 模型[8]是一種較為經(jīng)典的時間序列預(yù)測模型,它是自回歸模型(AR)和移動平均模型(MA)整合而來。若序列非平穩(wěn)序列,需通過差分轉(zhuǎn)化為平穩(wěn)序列,經(jīng)過幾次差分轉(zhuǎn)化,稱為幾階單整I,下式能夠直觀明了解釋ARIMA 模型:
基本建模步驟為:(1)對數(shù)據(jù)檢驗平穩(wěn)性,如不平穩(wěn)則進(jìn)行差分處理;(2)對平穩(wěn)后序列進(jìn)行白噪聲檢驗;(3)對符合要求的序列定階;(4)對模型檢驗其精度;(5)使用模型預(yù)測。
Schmidhuber 等人[9]于1997 年提出LSTM 長短期記憶網(wǎng)絡(luò)。LSTM 能夠避免長期依賴問題,中心理念是細(xì)胞狀態(tài)。該網(wǎng)絡(luò)由各種各樣結(jié)構(gòu)的門組成。通過Sigmoid 函數(shù)及點乘操作完成一個門的創(chuàng)建。一個LSTM 中使用三個門來控制細(xì)胞狀態(tài),也就是信息傳輸。通過控制全局記憶達(dá)到延緩記憶衰退效果。
圖1 LSTM 結(jié)構(gòu)圖
1.遺忘門:LSTM 要決定刪減掉原始細(xì)胞狀態(tài)的哪一部分信息,信息取舍是通過激活函數(shù)sigmoid函數(shù)決定。
公式(6)中,ft為遺忘門最終輸出,上一個細(xì)胞狀態(tài)為ht-1,xt為細(xì)胞此時狀態(tài)。W 是線性關(guān)系系數(shù)參數(shù),b 是偏置參數(shù)。
2.輸入門:為更好確定單元狀態(tài)所要加入的信息,先使用sigmoid 函數(shù)對信息進(jìn)行選擇,其次使用tanh 函數(shù)創(chuàng)建更新的狀態(tài)量。
對舊細(xì)胞狀態(tài)進(jìn)行更新,丟棄舊細(xì)胞部分信息并添加新信息。
3.輸出門:通過sigmoid 函數(shù)與tanh 函數(shù)實現(xiàn)最后輸出值。
表3 中國移動支付額
本文實驗采取前瞻數(shù)據(jù)庫的中國移動支付額(季度)數(shù)據(jù),選取2013 年3 月—2019 年6 月中國移動支付額(季度)數(shù)據(jù)制作數(shù)據(jù)樣本。分別建立GM(1,1)模型、ARIMA 模型與LSTM 模型對未來3個季度中國移動支付額預(yù)測。本文所建立的三個模型均是用python 語言實現(xiàn),同時下載Pandas,Numpy,Statsmodels,Matplotlib 庫使用。表3 為2013 年3月—2020 年3 月中國移動支付額(季度)。
使用實驗數(shù)據(jù)集建立時間序列:X(0)={1.1,2.07,2.9,3.57,3.89,4.92,6.16,7.61,39.78,26.81,18.17,23.46,52.13,29.32,35.33,40.77,60.65,39.24,49.26,53.77,70.82,62.88,65.48,78.22,86.62,79.46,86.11,94.92,90.81}。通過一次累加得到灰色序列:X(1)={1.1,3.17,6.07,9.64,13.53,18.45,24.61,32.22,72,98.81,116.98,140.44,192.57,221.89,257.22,297.99,358.64,397.88,447.08,500.85,571.67,634.55,700.03,778.25,864.87,944.33}。
然后構(gòu)建累加矩陣B 以及常數(shù)項向量y,通過公式(1)(2)(3)得到a=-0.089,μ=11.971。最終得到預(yù)測模型:X(1)(t+1)=135.546×e0.089t-134.446。經(jīng)計算,得到其后驗差比C=0.135<0.35。與表2 進(jìn)行對照,模型精度為“好”。使用灰色預(yù)測模型對后三個季度移動支付額預(yù)測,結(jié)果如表4 所示。
表4 GM(1,1)模型殘差與相對殘差
GM(1,1)模型預(yù)測結(jié)果、中國移動支付金額真實數(shù)據(jù)及殘差對比如表4 所示。GM(1,1)模型預(yù)測的2019 年9 月-2020 年3 月中國移動支付額為11.7、12.8、14。
首先對數(shù)據(jù)進(jìn)行ADF 平穩(wěn)性檢驗[10],計算pvalue 值,得出結(jié)果是0.993 356,顯著大于0.05,該序列不是平穩(wěn)序列,對該序列差分處理,對差分處理(一階)后序列再次ADF 檢驗,得出p-value 是5.48569*10-15,該值小于0.05,得到平穩(wěn)序列。對平穩(wěn)后序列進(jìn)行白噪聲檢驗,得出p-value 是0.021 694 24,p 值小于0.05,為非白噪聲序列。對ARIMA模型定階,觀察該平穩(wěn)序列的自相關(guān)圖和偏自相關(guān)圖確定,如圖2 所示。
圖2 自相關(guān)圖和偏自相關(guān)圖
根據(jù)AF 圖看出0、1、2 階拖尾,PAF 圖看出0、1階截尾。根據(jù)經(jīng)驗法則,嘗試性確定為ARIMA(0,1,1),ARIMA(0,1,2),ARIMA(1,1,0),ARIMA(1,1,1),ARIMA(1,1,2)。模型信息準(zhǔn)則篩選如表5 所示。
表5 信息準(zhǔn)則值
根據(jù)AIC、BIC 和HQ 信息準(zhǔn)則,ARIMA(0,1,1)的AIC、BIC 和HQ 值最小,為最佳模型。其中發(fā)現(xiàn)ARIMA(0,1,2)模型計算出的初始MA 系數(shù)不可逆,因此,ARIMA(0,1,1)為最合適的模型。最后對模型殘差進(jìn)行自相關(guān)檢驗,本文采用DW 德賓-沃森檢驗[11],該檢驗是一種經(jīng)典且常用的一階自相關(guān)性檢驗方法。根據(jù)本文解釋變量數(shù)與樣本容量查表知dL=1.302,dU=1.461,該模型DW 檢驗規(guī)則如表6 所示:
表6 DW 檢驗規(guī)則
檢驗結(jié)果為2.128 117 319 203 272 7,由表6 得出不存在自相關(guān)性。模型通過檢驗,所以本文建立ARIMA(0,1,1)時間序列模型作為預(yù)測移動支付額的一種模型。模型確定之后,對未來3 個季度數(shù)據(jù)進(jìn)行預(yù)測。
前26 個數(shù)據(jù)為測試數(shù)據(jù),后3 個為預(yù)測數(shù)據(jù)。預(yù)測結(jié)果為84.02、85.42、89.95,較為合理,如圖3所示。
本文對數(shù)據(jù)集進(jìn)行預(yù)處理,為讓尋求最優(yōu)解過程波動不會太大,即訓(xùn)練模型的loss 值下降更快,對數(shù)據(jù)進(jìn)行min-max 標(biāo)準(zhǔn)化。
圖3 ARIMA 模型預(yù)測趨勢圖
設(shè)定時間步長,制作具有標(biāo)簽監(jiān)督的數(shù)據(jù)集。由于本文數(shù)據(jù)集較小,時間步長設(shè)置為1。
表7 標(biāo)簽監(jiān)督數(shù)據(jù)集(部分)
LSTM 模型構(gòu)建中,優(yōu)化器為adam 優(yōu)化,學(xué)習(xí)率lr=0.002,loss 損失函數(shù)為RMSE 函數(shù),預(yù)測評價指標(biāo)為平均絕對誤差MAE。
根據(jù)上述公式,本文最終模型的RMSE 為0.037 4,模型預(yù)測結(jié)果為81.35、92.38、93.63,平均相對殘差為0.037 7。根據(jù)預(yù)測結(jié)果得出LSTM 模型能夠很好地應(yīng)用于中國移動支付金額(季度)數(shù)據(jù)方面。
將三種模型預(yù)測值繪制如圖4 所示的三種模型預(yù)測趨勢圖。
圖4 三種模型預(yù)測趨勢圖
觀察圖4 發(fā)現(xiàn),中國移動支付額整體呈上升趨勢,其中LSTM 模型和ARIMA 模型預(yù)測趨勢線與真實值更貼近。
將GM(1,1)、ARIMA、LSTM 模型預(yù)測結(jié)果比對分析,如表8 所示。
表8 殘差對比
從表8 可知,GM(1,1)模型精度為58.589%,ARIMA 模型精度為95.539%,LSTM 模型精度為96.230%,其中LSTM 模型精度最高,更接近于中國移動支付額真實值。
在互聯(lián)網(wǎng)金融時代,一線城市早已普及移動支付,二三線城市也在快速發(fā)展,移動支付額不斷增長,都印證移動支付發(fā)展充滿潛力。本文分別使用GM(1,1)模型、ARIMA 模型及LSTM 模型對2013—2019 年移動支付額數(shù)據(jù)進(jìn)行擬合,預(yù)測結(jié)果表明GM(1,1)模型精度較差,ARIMA 模型精度較好,LSTN 模型精度最佳。移動支付的創(chuàng)新性不僅給我們帶來便利,同時也帶來問題:移動支付平臺管理、制度規(guī)范、監(jiān)管制度的完善等。