崔金鑫,鄒輝文
(1.福州大學(xué)經(jīng)濟(jì)與管理學(xué)院,福建 福州 350116; 2.福州大學(xué)投資與風(fēng)險(xiǎn)管理研究所,福建 福州 350116)
隨著中國互聯(lián)網(wǎng)金融行業(yè)的持續(xù)發(fā)展,互聯(lián)網(wǎng)金融市場的規(guī)范性和有效性正在逐步地提升.P2P(peer to peer lending)網(wǎng)貸市場作為中國互聯(lián)網(wǎng)金融市場的重要組成部分,其高效穩(wěn)定運(yùn)行對于整個(gè)互聯(lián)網(wǎng)金融市場的運(yùn)轉(zhuǎn)起到至關(guān)重要的作用,同時(shí)也已成為金融市場的新業(yè)態(tài)和學(xué)術(shù)研究中最受關(guān)注的前沿性領(lǐng)域之一[1].截止2019 年8 月底,中國P2P 貸款余額已經(jīng)達(dá)到了6 094.88 億元,正常運(yùn)營的平臺數(shù)量為658 家,累計(jì)問題平臺數(shù)量高達(dá)7 458 家1數(shù)據(jù)來源于第一網(wǎng)貸——中國P2P 網(wǎng)貸行業(yè)概況:http://www.p2p001.com/.可以看出,近些年P(guān)2P 網(wǎng)貸市場發(fā)展十分迅猛,同時(shí)大量問題也隨之產(chǎn)生.為了加強(qiáng)中國P2P 網(wǎng)貸市場的規(guī)范性,政府及監(jiān)管部門相繼出臺了一系列監(jiān)管法案,尤其是近期《關(guān)于加強(qiáng)P2P 網(wǎng)貸領(lǐng)域征信體系建設(shè)的通知》的發(fā)布,使得P2P 網(wǎng)貸領(lǐng)域借款人失信懲戒力度得到進(jìn)一步增強(qiáng),對于中國P2P 網(wǎng)貸行業(yè)的長期健康穩(wěn)定發(fā)展具有相當(dāng)深遠(yuǎn)的意義.已有的關(guān)于P2P 網(wǎng)貸市場的研究多集中于探討“羊群效應(yīng)”[2]、“經(jīng)營效率差異”[3]、“監(jiān)管制度”[4]、“違約預(yù)測”[5]、“風(fēng)險(xiǎn)溢出效應(yīng)”[6]、“信用風(fēng)險(xiǎn)評估”[7]和“網(wǎng)絡(luò)借貸拍賣機(jī)制”[8]等方面的問題,目前還鮮有文獻(xiàn)對P2P 網(wǎng)貸市場的收益率預(yù)測問題展開研究.然而,P2P 網(wǎng)貸市場收益率反映了P2P 網(wǎng)貸市場的整體運(yùn)行狀況,對其作出精準(zhǔn)的預(yù)測不僅可以為P2P 網(wǎng)貸市場參與者和監(jiān)管當(dāng)局提供有力的決策參考,還可以為P2P 網(wǎng)貸市場風(fēng)險(xiǎn)預(yù)警模型的構(gòu)建奠定前期基礎(chǔ).因此,對P2P 網(wǎng)貸市場收益率的預(yù)測問題展開研究就顯得尤為緊迫和必要.
P2P 網(wǎng)貸市場收益率的預(yù)測問題本質(zhì)上仍然屬于金融市場收益率預(yù)測范疇,鑒于目前鮮有單獨(dú)針對P2P 網(wǎng)貸市場收益率預(yù)測的研究,因此可以借鑒已有的金融市場收益率預(yù)測方法.綜合已有的文獻(xiàn),金融市場收益率序列預(yù)測模型主要包括兩類:經(jīng)典的金融計(jì)量模型和新興的機(jī)器學(xué)習(xí)預(yù)測模型.相關(guān)學(xué)者已經(jīng)基于經(jīng)典的金融計(jì)量模型對金融市場收益率預(yù)測問題展開了研究,例如,郭存芝[9]引入了馬爾科夫過程模型預(yù)測中國股市的收益率并取得良好的預(yù)測效果; 張銀雪等[10]基于ARMA(autoregressive moving average)和GARCH(generalized autoregressive conditional heteroskedasticity)模型對滬深300 指數(shù)收益率序列進(jìn)行了擬合和預(yù)測,研究表明ARMA 模型的長期預(yù)測效果較好而GARCH 模型的短期預(yù)測效果較優(yōu); 姜富偉等[11]通過研究發(fā)現(xiàn)傳統(tǒng)的經(jīng)濟(jì)變量可以用來預(yù)測中國股票市場的收益率.除了傳統(tǒng)的經(jīng)濟(jì)變量以外,Bail 等[12]、Galsband[13]和Huang 等[14]研究發(fā)現(xiàn)股票收益的尾部風(fēng)險(xiǎn)對于收益率同樣具備一定的預(yù)測能力.同樣的,陳堅(jiān)[15]通過研究表明基于極值理論的VaR(value at risk)模型相較于Copula-VaR 模型對中國股票市場未來收益率具有更強(qiáng)的預(yù)測性能.在此之后,楊婉茜等[16]又基于貝葉斯向量自回歸模型對中國國債收益率展開了預(yù)測研究.然而,金融市場收益率序列并不具備線性特征,且不服從正態(tài)分布,已有的金融計(jì)量收益率預(yù)測模型難以獲得較高的預(yù)測精度.因此,伴隨著計(jì)算機(jī)系統(tǒng)科學(xué)和人工智能前沿技術(shù)的發(fā)展,大量的學(xué)者開始基于新興的機(jī)器學(xué)習(xí)智能預(yù)測模型對金融市場收益率展開預(yù)測研究,例如,Qiu 等[17]基于人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)對日經(jīng)225 指數(shù)收益率展開預(yù)測研究;Fu 等[18]、Peng 等[19]基于支持向量機(jī)(support vector regression,SVR)模型對股市收益率進(jìn)行預(yù)測; Nilmet 等[20]實(shí)證對比了極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)模型和ARMA 以及ARMA-GARCH 模型在匯率收益率預(yù)測中的性能,發(fā)現(xiàn)ELM模型預(yù)測性能最佳; Melek 等[21]基于自適應(yīng)神經(jīng)模糊推理系統(tǒng)(adaptive network-based fuzzy inference system,ANFIS)對伊斯坦布爾股票市場收益率序列展開預(yù)測并取得了良好效果;Zhao 等[22]采用小波神經(jīng)網(wǎng)絡(luò)(wavelet neural network,WNN) 對上海股票市場收益率進(jìn)行預(yù)測,發(fā)現(xiàn)WNN模型預(yù)測效果優(yōu)于BPNN(back propagation neural network)模型; 于志軍等[23]基于灰色神經(jīng)網(wǎng)絡(luò)模型(grey neural network,GNN)并引入EGARCH(exponential generalized autoregressive conditional heteroskedasticity)誤差校正方法對中國股市收益率展開預(yù)測研究.其中在ELM 極限學(xué)習(xí)機(jī)模型的訓(xùn)練過程中,并不需要調(diào)整輸入層和隱含層間的連接權(quán)值以及隱含層神經(jīng)元的閾值,只需要對隱含層神經(jīng)元的個(gè)數(shù)進(jìn)行設(shè)定.因此,ELM 模型的訓(xùn)練過程高效快捷,且預(yù)測性能較優(yōu),已經(jīng)被廣泛應(yīng)用于風(fēng)速預(yù)測[24]、風(fēng)電功率預(yù)測[25]、空氣質(zhì)量指數(shù)預(yù)測[26]、原油價(jià)格預(yù)測[27]等領(lǐng)域.基于此,本文將ELM 極限學(xué)習(xí)機(jī)模型作為基準(zhǔn)預(yù)測模型對P2P 網(wǎng)貸市場收益率進(jìn)行預(yù)測,并采用粒子群優(yōu)化算法[28](particle swarm optimization,PSO)對ELM 模型的參數(shù)進(jìn)行尋優(yōu)操作,以期提升ELM 模型的預(yù)測性能.
隨著金融時(shí)間序列預(yù)測研究的不斷深入,學(xué)者們發(fā)現(xiàn)單一機(jī)器學(xué)習(xí)模型的預(yù)測性能還有較大的提升空間,一種結(jié)合數(shù)據(jù)分解技術(shù)和機(jī)器學(xué)習(xí)算法的組合預(yù)測模型由于其簡單明晰的建模思路以及優(yōu)越的預(yù)測性能開始受到大量學(xué)者的青睞,例如:Cheng 等[29]將經(jīng)驗(yàn)?zāi)B(tài)分解算法(empirical mode decomposition,EMD)與SVR相結(jié)合進(jìn)而構(gòu)造EMD-SVR 模型對股票市場展開預(yù)測研究,并發(fā)現(xiàn)該模型顯著優(yōu)于單一預(yù)測模型,與之類似的還有EMD-ELM 模型[30]、EMD-BPNN模型[31]和EMD-ANFIS 模型[32].然而,EMD 算法容易導(dǎo)致模態(tài)混疊,因而Wu 等[33]提出了一種集合經(jīng)驗(yàn)?zāi)B(tài)分解算法(ensemble empirical mode decomposition,EEMD),它的關(guān)鍵步驟是把高斯白噪聲加入原始序列中進(jìn)行多次經(jīng)驗(yàn)?zāi)B(tài)分解,最后再將多次分解的本征模態(tài)函數(shù)(intrinsic mode function,IMF) 總體平均定義為最終的IMF.然而,在一定次數(shù)實(shí)驗(yàn)的集成平均后,所得到的重構(gòu)分量中依然包含著一定幅值的殘留噪聲.在集合經(jīng)驗(yàn)?zāi)B(tài)分解算法的已有基礎(chǔ)上,Torres 等[34]提出了一種帶有自適應(yīng)白噪聲的完全集成經(jīng)驗(yàn)?zāi)B(tài)分解方法(complementary ensemble empirical mode decomposition with adaptive noise,CEEMDAN),該方法在分解過程的每一個(gè)階段均添加自適應(yīng)的白噪聲,通過算出單一的余量信號從而得到各個(gè)模態(tài)分量[35].遺憾的是,無論是EEMD 還是CEEMDAN 算法,它們均是基于EMD 算法改進(jìn)得來,缺乏嚴(yán)格的理論支撐及證明,且計(jì)算效率較低.基于此,Gilles[36]提出了一種基于小波分析理論架構(gòu)的新型自適應(yīng)信號處理方法:經(jīng)驗(yàn)小波分解算法(empirical wavelet transform,EWT),其具有計(jì)算量小且魯棒性強(qiáng)等優(yōu)點(diǎn),在風(fēng)電功率及風(fēng)速預(yù)測領(lǐng)域已經(jīng)取得了顯著的研究成果[37-40].然而,目前還未曾發(fā)現(xiàn)EWT 方法在收益率預(yù)測領(lǐng)域的應(yīng)用研究.EWT 算法在預(yù)測領(lǐng)域相較于以往的分解算法是否具有優(yōu)越性值得探討,因而本文采用EWT 分解算法對P2P網(wǎng)貸市場原始收益率綜指序列進(jìn)行分解處理.
綜合已有的文獻(xiàn)可以看出,組合預(yù)測模型大多遵循“分解”、“重構(gòu)”、“預(yù)測”和“集成”的基本建模架構(gòu),本文的P2P 網(wǎng)貸市場收益率預(yù)測模型總體上同樣遵循該建模流程.然而,現(xiàn)實(shí)中高頻重構(gòu)分量的預(yù)測效果往往不及中頻和低頻重構(gòu)分量,因而需要對高頻分量再次進(jìn)行分解,也即“兩階段分解”.Mi 等[41]和Kim等[42]的研究也已證明了該種方法的有效性,因此本文也將“兩階段分解”方法引入預(yù)測模型的構(gòu)建流程.在具體的分解算法選取上,奇異譜分析方法(singular spectrum analysis,SSA)具有較強(qiáng)的降噪能力和較優(yōu)的魯棒性,且也已被應(yīng)用于預(yù)測研究[41,43,44].然而,SSA 降噪算法目前多被應(yīng)用于理工科領(lǐng)域而較少被應(yīng)用于人文社科領(lǐng)域.基于此,本文將SSA 降噪算法引進(jìn)預(yù)測模型的構(gòu)建流程,利用其對高頻重構(gòu)分量進(jìn)行降噪,以期進(jìn)一步提升高頻分量的預(yù)測效果.
基于以上認(rèn)識,將EWT 分解算法、SSA 降噪算法和PSO-ELM 預(yù)測模型相結(jié)合,構(gòu)建了一種P2P 網(wǎng)貸市場收益率預(yù)測模型,即EWT-SSA-PSO-ELM 預(yù)測模型.本文的特色及創(chuàng)新點(diǎn)主要包括以下幾點(diǎn):第一,對P2P 網(wǎng)貸市場收益率進(jìn)行精準(zhǔn)預(yù)測,對于P2P 網(wǎng)貸市場投資及風(fēng)險(xiǎn)管理策略的構(gòu)建均具備一定的現(xiàn)實(shí)意義.然而,目前鮮有文獻(xiàn)探討該問題,本文則對此展開深入研究,以期進(jìn)一步豐富P2P 網(wǎng)貸市場的研究視角;第二,已有的收益率預(yù)測模型在分解算法、預(yù)測算法等方面均存在不足,本文首次將EWT 和SSA 分解算法引入收益率預(yù)測領(lǐng)域,并將其與PSO-ELM 模型相結(jié)合,構(gòu)建了EWT-SSA-PSO-ELM 預(yù)測模型,以期提升P2P 網(wǎng)貸市場收益率的預(yù)測精度;第三,在模型的預(yù)測效果對比部分,本文不僅給出了各個(gè)預(yù)測模型的損失函數(shù)計(jì)算數(shù)值,還進(jìn)一步對預(yù)測結(jié)果進(jìn)行了MCS(model confidence set)檢驗(yàn)和DM(diebold-mariano)檢驗(yàn),以期更加科學(xué)穩(wěn)健地體現(xiàn)本文所構(gòu)建的預(yù)測模型性能的優(yōu)越性.
EWT 分解算法是由Gilles[36]提出的一種新型自適應(yīng)信號處理方法,其通過對信號頻譜進(jìn)行自適應(yīng)的分割,基于每一個(gè)頻譜構(gòu)建適當(dāng)?shù)恼恍〔V波器,進(jìn)而提取Fourier 頻譜的調(diào)頻和調(diào)幅成分,然后再利用Hilbert變換處理不同的調(diào)頻和調(diào)幅模態(tài),進(jìn)而得到瞬時(shí)頻率和瞬時(shí)幅值[36,38].從傅里葉變換(Fourier transform)的角度來看,這種構(gòu)造方法類似于構(gòu)建了一組帶通濾波器[37].
EWT 算法的理論架構(gòu)如下[36-38]:首先,將Fourier 支撐定義為[0,π],假設(shè)其被分割為N個(gè)連續(xù)的成分,各個(gè)分割片段的邊界可以被表示為Λn=[ωn-1,ωn],進(jìn)而可以有在分割區(qū)間Λn上,經(jīng)驗(yàn)小波被定義為每個(gè)Λn上的帶通濾波器.經(jīng)驗(yàn)小波構(gòu)造方法可參照Meyer 小波,Gilles[36]構(gòu)造的經(jīng)驗(yàn)小波函數(shù)為
經(jīng)驗(yàn)尺度函數(shù)可表示為
奇異譜分析法是由Broomhead 等[45]提出的一種廣義功率譜分析方法,首先根據(jù)時(shí)間序列的周期特征以及所處的時(shí)間區(qū)間,構(gòu)造出相應(yīng)的軌跡矩陣,然后再對其進(jìn)行分解和重構(gòu),進(jìn)而提取出能夠表征原時(shí)間序列的多組分解量.SSA 算法主要包含四個(gè)步驟:嵌入、奇異值分解(singular value decomposition,SVD)、分組以及對角平均.前兩個(gè)步驟屬于數(shù)據(jù)分解,后兩個(gè)步驟屬于重構(gòu),SSA 算法流程如下[41]:
步驟1先將原始P2P 網(wǎng)貸市場收益率綜指序列的高頻重構(gòu)分量轉(zhuǎn)換成軌跡矩陣Y=(Y1,Y2,...,YL),該矩陣中的每一個(gè)元素被定義為因而矩陣Y可表示為
步驟2SVD 奇異值分解,矩陣Y可以被分解成d個(gè)分量,d=rank(Y).Y可以被進(jìn)一步表示為Y=Y1+Y2+Y3+···+Yd,其中.
步驟3將d個(gè)分量中的前m個(gè)分量重構(gòu)為趨勢分量,也即降噪序列,定義I={I1,I2,...,Im},YI=YI1+YI2+···+YIm即為降噪序列,剩余的(d-m)個(gè)分量則構(gòu)成噪聲序列.
步驟4對角平均,通過Hankelization 流程,{YI1,YI2,...,YIm}就可以被轉(zhuǎn)換成時(shí)間序列
此時(shí)原始的P2P 網(wǎng)貸市場收益率綜指序列的高頻重構(gòu)分量就可以被重新表示為
極限學(xué)習(xí)機(jī)是由Huang 等[26]提出的一種特殊類型的單隱含層前饋神經(jīng)網(wǎng)絡(luò).隨機(jī)初始化其輸入權(quán)值和偏置并得到對應(yīng)的輸入權(quán)重,在ELM 模型的整個(gè)訓(xùn)練過程中并不需要對模型的各個(gè)參數(shù)進(jìn)行調(diào)整,只需要對模型隱含層神經(jīng)元的個(gè)數(shù)進(jìn)行設(shè)置,最終就可以獲得唯一的最優(yōu)解[45].具有簡潔高效,無需調(diào)參,訓(xùn)練學(xué)習(xí)速度較快等優(yōu)點(diǎn),其基本網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示.
圖1 極限學(xué)習(xí)機(jī)基本結(jié)構(gòu)Fig.1 The basic structure of extreme learning machine
極限學(xué)習(xí)機(jī)模型的理論架構(gòu)如下[26]:ELM 模型包括輸入層、隱含層和輸出層,其中輸入層的n個(gè)神經(jīng)元分別與n個(gè)輸入變量相對應(yīng),隱含層有l(wèi)個(gè)神經(jīng)元,輸出層的m個(gè)神經(jīng)元分別與m個(gè)輸出變量相對應(yīng).設(shè)隱含層神經(jīng)元的激活函數(shù)為g(x),則ELM 極限學(xué)習(xí)機(jī)的輸出為
其中ωi=[ωi1,ωi2,...,ωin],xj=[x1j,x2j,...,xnj]T,ωi代表輸入層神經(jīng)元與隱含層神經(jīng)元之間的連接權(quán)值,bi表示第i個(gè)神經(jīng)元的偏差也即隱含層閾值.式(8)也可以表示為Hβ=TT,其中H代表神經(jīng)網(wǎng)絡(luò)隱含層的輸出矩陣,H的具體形式可以表示為
本文采用PSO 算法對ELM 模型輸入層與隱含層連接權(quán)值以及隱含層閾值進(jìn)行參數(shù)尋優(yōu):第一步,初始化PSO 算法的粒子群,包括學(xué)習(xí)速率、慣性權(quán)重、種族規(guī)模及迭代次數(shù);第二步,計(jì)算初始化種群的單個(gè)個(gè)體的均方根誤差,令粒子群適應(yīng)度為訓(xùn)練次數(shù),di代表觀測值與平均值的差值.在同一次迭代過程中,首先比較Fi與pbest的大小,接著比較Fi與gbest的大小,其中pbest代表迭代過程中的個(gè)體極值,gbest則代表全局極值.然后,用大的一方替代小的一方,否則保持不變;第三步,一直迭代進(jìn)行上述步驟,直到運(yùn)行次數(shù)大于等于設(shè)置的迭代次數(shù)、適應(yīng)度值小于等于規(guī)定的閾值3 個(gè)條件中之一,此時(shí)算法流程停止,并且返回當(dāng)前最優(yōu)的個(gè)體和適應(yīng)度;第四步,利用最優(yōu)的ωi和bi計(jì)算輸出權(quán)值矩陣H.
文章所提出的EWT-SSA-PSO-ELM 預(yù)測模型的機(jī)理闡述如下:
遵循已有的“分解”、“重構(gòu)”、“預(yù)測”和“集成”的智能預(yù)測模型經(jīng)典建模架構(gòu),P2P 網(wǎng)貸市場收益率預(yù)測模型主要由兩大模塊構(gòu)成:兩階段分解流程和分量預(yù)測重構(gòu)流程.第一部分的兩階段分解過程包括基于EWT 經(jīng)驗(yàn)小波分解算法對原始收益率綜指序列進(jìn)行分解和基于SSA 奇異譜分析算法對高頻重構(gòu)分量進(jìn)行降噪處理,目的是為了降低原始收益率綜指序列和高頻重構(gòu)分量的非線性以及非平穩(wěn)性特征,從而提升它們的預(yù)測效果.第二部分是基于粒子群優(yōu)化的極限學(xué)習(xí)機(jī)模型對高頻重構(gòu)分量的噪聲序列和降噪序列、中頻和低頻重構(gòu)分量進(jìn)行預(yù)測.其中本文選取的Lempel-Ziv 復(fù)雜度算法是為了保證分量重構(gòu)過程的科學(xué)性,PSO 參數(shù)優(yōu)化算法是為了提升ELM 模型的預(yù)測性能,PACF 偏自相關(guān)函數(shù)是為了增強(qiáng)預(yù)測模型輸入變量選取的合理性.最終,線性疊加集成各個(gè)分量預(yù)測結(jié)果即可得到最終的收益率預(yù)測結(jié)果.
本文預(yù)測模型的具體建模步驟闡述如下:
步驟1數(shù)據(jù)分解階段,采用魯棒性更高的EWT 經(jīng)驗(yàn)小波分解算法對原始的P2P 網(wǎng)貸市場收益率綜指序列進(jìn)行分解,進(jìn)而得到若干個(gè)具有不同經(jīng)驗(yàn)尺度的經(jīng)驗(yàn)?zāi)J椒至?
步驟2分量重構(gòu)階段,為了降低復(fù)雜度以提升建模效率,計(jì)算各個(gè)經(jīng)驗(yàn)?zāi)J椒至康腖empel-Ziv 復(fù)雜度指數(shù)2Lempel-Ziv 復(fù)雜度指數(shù)由Lempel 和Ziv 提出,用于衡量序列復(fù)雜性,詳見:https://ieeexplore.ieee.org/document/1055501..參照Zhu 等[46]的研究,以80%為臨界值,按頻率的高低排列,當(dāng)前N個(gè)經(jīng)驗(yàn)?zāi)J椒至康膹?fù)雜度之和超過所有經(jīng)驗(yàn)?zāi)J椒至繌?fù)雜度之和的80%時(shí),則前N個(gè)經(jīng)驗(yàn)?zāi)J椒至繕?gòu)成高頻分量,復(fù)雜度最低的經(jīng)驗(yàn)?zāi)J椒至繕?gòu)成低頻分量,中間部分的經(jīng)驗(yàn)?zāi)J椒至縿t構(gòu)成中頻分量.
步驟3高頻分量降噪階段,為了進(jìn)一步提升高頻重構(gòu)分量的預(yù)測效果,采用SSA 奇異譜分析算法對高頻重構(gòu)分量進(jìn)行降噪[41],進(jìn)而得到高頻重構(gòu)分量的降噪序列以及噪聲序列.
步驟4分量預(yù)測階段,基于ELM 極限學(xué)習(xí)機(jī)預(yù)測模型對降噪序列、噪聲序列、中頻分量和低頻分量分別進(jìn)行預(yù)測,并采用PSO 粒子群算法對ELM 模型的參數(shù)進(jìn)行尋優(yōu),基于各個(gè)預(yù)測分量自身的偏自相關(guān)函數(shù)(partial autocorrelation function,PACF)來選取模型的輸入變量.
步驟5預(yù)測結(jié)果集成階段,將降噪序列及噪聲序列的預(yù)測結(jié)果相加即可得到高頻重構(gòu)分量的預(yù)測結(jié)果,然后再將高頻重構(gòu)分量、中頻重構(gòu)分量和低頻重構(gòu)分量的預(yù)測結(jié)果加總集成即可得到最終的P2P 網(wǎng)貸市場收益率綜指預(yù)測結(jié)果.
本文選取P2P 網(wǎng)貸市場收益率作為研究對象,中國P2P 網(wǎng)貸理財(cái)收益率綜指3中國P2P 網(wǎng)貸理財(cái)收益率綜指數(shù)據(jù)詳見:https://www.p2p001.com/licai/shownews/id/1209.html是由第一網(wǎng)貸4第一網(wǎng)貸(www.p2p001.com),隸屬于錢誠,現(xiàn)由深圳市錢誠互聯(lián)網(wǎng)金融研究院運(yùn)維,為互聯(lián)網(wǎng)金融門戶網(wǎng)站,為P2P 網(wǎng)貸行業(yè)的參與者提供行業(yè)資訊和行業(yè)大數(shù)據(jù).基于所有運(yùn)營的P2P 網(wǎng)貸平臺的收益率數(shù)據(jù)綜合編制而成,可以較為客觀地反映P2P 網(wǎng)貸市場整體的收益情況.因此,本文將其作為P2P 網(wǎng)貸市場收益率的代理量,基于Python 軟件編寫爬蟲代碼,爬取2016–05–15~2019–04–04,共1 000 個(gè)交易日的收益率綜指數(shù)據(jù).參照文獻(xiàn)[46–48]中的設(shè)定,本文將總樣本的前80%(2016–05–15~2018–09–16,800 個(gè)交易日)作為預(yù)測模型的訓(xùn)練集,將剩余的20%(2018–09–17~2019–04–04,200 個(gè)交易日)作為預(yù)測模型的測試集,用于檢驗(yàn)?zāi)P偷念A(yù)測效果.本文的實(shí)證流程均基于MATLAB(2014a)編程軟件完成,運(yùn)行平臺為WIN10 系統(tǒng),英特爾酷睿i7 處理器,CPU 2.8 GHz,運(yùn)行內(nèi)存16 GB.
從表1 可以看出,收益率綜指序列整體上較離散,具有一定的序列波動(dòng)性,J-B 統(tǒng)計(jì)量的值也證明了收益率綜指序列并不服從正態(tài)分布,這一點(diǎn)也符合金融時(shí)間序列的典型特征.
表1 P2P 網(wǎng)貸市場收益率綜指描述性統(tǒng)計(jì)Table 1 The descriptive statistics of P2P online lending market yield composite index
圖2 給出了P2P 網(wǎng)貸市場收益率綜指序列圖,可以看出收益率綜指序列總體上呈現(xiàn)出一種典型的不規(guī)律特征,震蕩頻率較高.
圖2 P2P 網(wǎng)貸市場收益率綜指序列圖Fig.2 The original P2P online lending market yield composite index series
為了檢驗(yàn)收益率綜指序列的平穩(wěn)性和線性特征,此處分別對其進(jìn)行ADF(augmented Dickey-Fuller)檢驗(yàn)和BDS(Brock-Decher-Scheikman)檢驗(yàn)[46,49],檢驗(yàn)結(jié)果如表2 和表3 所示.表2 中收益率綜指序列在顯著性水平1%,5%和10%下的臨界值均小于ADF 值,且p–值為0.190 4,因而收益率綜指序列呈現(xiàn)出非平穩(wěn)特征.從BDS 檢驗(yàn)結(jié)果也可看出,當(dāng)嵌入維數(shù)從2 增加到10 時(shí),p–值均為0,表明收益率綜指序列具有典型的非線性特征.
表2 P2P 網(wǎng)貸市場收益率綜指平穩(wěn)性檢驗(yàn)結(jié)果Table 2 P2P online lending market yield composite index stationarity test results
表3 P2P 網(wǎng)貸市場收益率綜指BDS 檢驗(yàn)結(jié)果Table 3 P2P online lending market yield composite index BDS test results
續(xù)表3Table 3 Continues
由4.1 節(jié)的檢驗(yàn)結(jié)果可知,P2P 網(wǎng)貸市場收益率綜指序列呈現(xiàn)出典型的波動(dòng)性、非平穩(wěn)和非線性等特征.為了進(jìn)一步挖掘其隱含的內(nèi)在特征,此處采用分解效率和魯棒性更優(yōu)的EWT 經(jīng)驗(yàn)小波分解算法對原始的收益率綜指序列進(jìn)行分解,進(jìn)而可以得到8 個(gè)經(jīng)驗(yàn)?zāi)J椒至?如圖3 所示,可以看出EWT 分解結(jié)果呈現(xiàn)出從低頻向高頻變化的特征.為了進(jìn)一步提高預(yù)測建模效率,因此需要基于各個(gè)分量的Lempel-Ziv 復(fù)雜度數(shù)值對分量進(jìn)行重構(gòu).收益率綜指序列分量重構(gòu)結(jié)果見圖4.
圖3 收益率綜指序列EWT 分解結(jié)果Fig.3 EWT decomposition results of yield composite index series
圖4 收益率綜指序列分量重構(gòu)結(jié)果Fig.4 Component reconstruction results of yield composite index series
Lempel-Ziv 復(fù)雜度指數(shù)反映的是序列內(nèi)在特征復(fù)雜程度,序列的Lempel-Ziv 復(fù)雜度數(shù)值越大,表明該序列中的周期成分越少,變化越無規(guī)律,序列越趨向于一種隨機(jī)狀態(tài),所包含的頻率成分越豐富;反之,數(shù)值越小,序列越有規(guī)律,周期性越強(qiáng),所含頻率成分越少.從表4 的Lempel-Ziv 復(fù)雜度計(jì)算結(jié)果可以看出各個(gè)經(jīng)驗(yàn)?zāi)J椒至康膹?fù)雜度不盡相同,其中,經(jīng)驗(yàn)?zāi)J椒至?~8 的復(fù)雜度之和占總復(fù)雜度之和的83.28%,超過臨界值80%.因此,經(jīng)驗(yàn)?zāi)J椒至?構(gòu)成低頻分量,經(jīng)驗(yàn)?zāi)J椒至? 構(gòu)成中頻分量,經(jīng)驗(yàn)?zāi)J椒至?~8 構(gòu)成高頻分量.
可以看出,低頻分量的波動(dòng)非常平緩,代表了P2P 網(wǎng)貸市場收益率綜指序列的長期運(yùn)行趨勢,一般不易受到市場及外部環(huán)境的沖擊;中頻分量波動(dòng)特征相對平緩,代表重大事件對收益率綜指序列的沖擊影響,但最終會回歸長期趨勢線;高頻分量呈現(xiàn)出十分復(fù)雜的波動(dòng)特征,代表了市場短期噪聲對P2P 網(wǎng)貸市場收益率的影響,但是方向不定,頻率較高,且持續(xù)的時(shí)間較短.Lempel-Ziv 復(fù)雜度計(jì)算結(jié)果見表4.
表4 Lempel-Ziv 復(fù)雜度計(jì)算結(jié)果Table 4 Lempel-Ziv complexity calculation results
通過分量重構(gòu)流程,進(jìn)而得到了高頻、中頻和低頻三個(gè)重構(gòu)分量,然后基于PSO-ELM 模型對三個(gè)重構(gòu)分量分別進(jìn)行預(yù)測.在機(jī)器學(xué)習(xí)模型的訓(xùn)練過程中,模型參數(shù)的設(shè)定和輸入變量的選取對模型的預(yù)測性能都起到至關(guān)重要的作用.在參考大量相關(guān)研究以后,本文的預(yù)測模型參數(shù)設(shè)定如下:PSO 參數(shù)尋優(yōu)算法的初始種群大小為25,最大迭代次數(shù)為200,加速因子c1=c2=2.0,利用PSO 算法對機(jī)器學(xué)習(xí)模型進(jìn)行參數(shù)尋優(yōu)操作;ELM 模型的隱含節(jié)點(diǎn)設(shè)定為30,輸入層個(gè)數(shù)即為輸入變量的個(gè)數(shù)(根據(jù)具體的預(yù)測分量而定),隱含層節(jié)點(diǎn)輸出權(quán)值范圍為[-1,1],隱含層節(jié)點(diǎn)閾值取值范圍為[0,1].為了保證模型預(yù)測效果對比的公平性,本文中所有的PSO 算法均采用該種參數(shù)設(shè)定.另外,預(yù)測模型輸入變量的選取方法參照文獻(xiàn)[38,47,50]中的設(shè)定,基于偏自相關(guān)函數(shù)PACF 來選取各個(gè)分量所對應(yīng)的輸入變量,選取結(jié)果如表5 所示.
表5 預(yù)測模型輸入變量選取結(jié)果Table 5 Input variables selection results
高頻、中頻和低頻分量的PSO-ELM 預(yù)測結(jié)果如圖5~圖7 所示.
圖5 高頻重構(gòu)分量PSO-ELM 預(yù)測結(jié)果Fig.5 PSO-ELM prediction results of high-frequency component
圖6 中頻重構(gòu)分量PSO-ELM 預(yù)測結(jié)果Fig.6 PSO-ELM prediction results of medium-frequency component
圖7 低頻重構(gòu)分量PSO-ELM 預(yù)測結(jié)果Fig.7 PSO-ELM prediction results of low-frequency component
為了更加科學(xué)穩(wěn)健地體現(xiàn)本文所構(gòu)建的EWT-SSA-PSO-ELM 模型預(yù)測性能的優(yōu)越性,選取了15個(gè)基準(zhǔn)對比模型,包括單一預(yù)測模型ARIMA,PSO-SVR,PSO-ANFIS 和PSO-ELM 模型; 組合預(yù)測模型CEEMDAN-PSO-SVR,CEEMDAN-PSO-ANFIS,CEEMDAN-PSO-ELM 模型; SSA-PSO-SVR,SSA-PSOANFIS,SSA-PSO-ELM 模型; EWT-PSO-SVR,EWT-PSO-ANFIS,EWT-PSO-ELM 模型,EWT -SSA-PSOSVR,EWT-SSA-PSO-ANFIS 模型.采用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)以及Theil 不等系數(shù)(TIC)作為各個(gè)模型預(yù)測效果的評價(jià)指標(biāo),并且對各個(gè)模型的預(yù)測結(jié)果進(jìn)行MCS 模型置信集檢驗(yàn)以及迪勃爾特–馬里亞諾(DM)檢驗(yàn).各個(gè)誤差函數(shù)計(jì)算公式為
其中T代表預(yù)測樣本數(shù),Yt代表t時(shí)刻的網(wǎng)貸收益率綜指真實(shí)值,Pt代表t時(shí)刻網(wǎng)貸收益率綜指預(yù)測值.RMSE,MAE,MAPE 和TIC 的值越小表明模型的預(yù)測精度越高,預(yù)測性能越好.
可以明顯地看出,中頻和低頻分量的預(yù)測效果顯著優(yōu)于高頻分量.為了提升高頻分量的預(yù)測效果,此處采用SSA 奇異譜分析算法對高頻分量進(jìn)行降噪處理,從而得到高頻降噪序列及高頻噪聲序列,如圖8 所示.
圖8 高頻重構(gòu)分量SSA 分解結(jié)果Fig.8 SSA decomposition results of high-frequency component
然后,再利用PSO-ELM 模型對其進(jìn)行預(yù)測,最后加總集成高頻降噪序列、高頻噪聲序列、中頻以及低頻分量的預(yù)測結(jié)果即可得到最終的EWT-SSA-PSO-ELM 預(yù)測結(jié)果,如圖9 所示.
圖9 EWT-PSO-ELM 與EWT-SSA-PSO-ELM 預(yù)測結(jié)果Fig.9 EWT-PSO-ELM and EWT-SSA-PSO-ELM prediction results
MCS 檢驗(yàn)是由Hansen 等[51]提出的衡量模型預(yù)測性能的一種方法,相較于SPA(superior predictive ability)更穩(wěn)健.由于篇幅限制,MCS 檢驗(yàn)的理論框架及流程詳見文獻(xiàn)[51,52].為了得到MCS 檢驗(yàn)中的各統(tǒng)計(jì)量以及p–值,參照雷立坤等[53]的參數(shù)設(shè)定方法,將MCS 檢驗(yàn)的各個(gè)參數(shù)設(shè)置為d=2(block length),模擬次數(shù)B=10 000 次作為Bootstrap 過程的控制參數(shù),MCS 檢驗(yàn)的顯著性水平α取值為0.1,也即p–值大于0.1 的模型將幸存下來.
DM 檢驗(yàn)方法原假設(shè)是目標(biāo)模型A 的預(yù)期預(yù)測精準(zhǔn)性與基準(zhǔn)模型B 的預(yù)測精準(zhǔn)性一致,因此原假設(shè)為[48]
因此,DM 統(tǒng)計(jì)量為
表6 模型預(yù)測誤差對比表Table 6 Model prediction error comparison
表7 DM 檢驗(yàn)結(jié)果Table 7 DM test results
表8 MCS 檢驗(yàn)結(jié)果Table 8 MCS test results
續(xù)表8Table 8 Continues
對P2P 網(wǎng)貸市場收益率做出精準(zhǔn)預(yù)測,不僅可以為P2P 網(wǎng)貸市場上的借貸雙方提供有力的決策參考,同時(shí)也可以為銀保監(jiān)會對P2P 網(wǎng)貸市場進(jìn)行審慎監(jiān)督管理提供重要的考量依據(jù).針對已有的收益率預(yù)測模型存在的不足,文章首次基于EWT 經(jīng)驗(yàn)小波分解算法、SSA 奇異譜分析算法和PSO-ELM 智能預(yù)測模型,構(gòu)建了一種P2P 網(wǎng)貸市場收益率預(yù)測模型.研究表明,EWT 分解算法可以有效挖掘出原始序列的內(nèi)在特征并降低分解誤差,在一定程度上優(yōu)于CEEMDAN 分解算法;SSA 降噪算法可以有效剝離高頻重構(gòu)分量的噪聲序列,進(jìn)而提升高頻重構(gòu)分量的預(yù)測效果;EWT-SSA-PSO-ELM 預(yù)測模型的性能優(yōu)于其余基準(zhǔn)對比模型.本文的研究成果一方面豐富了P2P 網(wǎng)貸市場的研究內(nèi)容,另一方面也為金融市場收益率預(yù)測研究提供了一種新的視角和方法.除了收益率預(yù)測問題,P2P 網(wǎng)貸市場的風(fēng)險(xiǎn)特征同樣是業(yè)界和學(xué)術(shù)界關(guān)注的焦點(diǎn)之一,利用機(jī)器學(xué)習(xí)智能算法預(yù)測P2P 網(wǎng)貸市場的風(fēng)險(xiǎn)狀況并且構(gòu)建出相應(yīng)的風(fēng)險(xiǎn)規(guī)避策略將是下一步的重點(diǎn)研究方向.