賈茹閣 張忠林
(蘭州交通大學(xué)電子與信息工程學(xué)院 甘肅 蘭州 730070)
隨著全球市場(chǎng)經(jīng)濟(jì)的發(fā)展,金融市場(chǎng)研究技術(shù)不斷涌現(xiàn),大大推動(dòng)了市場(chǎng)偏好的預(yù)測(cè)期,但隨著市場(chǎng)波動(dòng)加劇,市場(chǎng)偏好的預(yù)測(cè)準(zhǔn)確性仍有待進(jìn)一步提升,合理實(shí)現(xiàn)市場(chǎng)偏好的有效預(yù)測(cè)對(duì)防范金融市場(chǎng)危機(jī)具有重要意義,是當(dāng)前研究的熱點(diǎn)之一[1,2]。近年,金融市場(chǎng)偏好和偏好風(fēng)險(xiǎn)的預(yù)測(cè)和分析受到金融機(jī)構(gòu)業(yè)務(wù)和行政機(jī)構(gòu)的關(guān)注和研究。同時(shí),由于偏好風(fēng)險(xiǎn)的可能性小得多,曾經(jīng)出現(xiàn)投資者嚴(yán)重虧損,甚至是全球金融風(fēng)險(xiǎn),對(duì)經(jīng)濟(jì)秩序造成嚴(yán)重影響。如何建立金融市場(chǎng)偏好預(yù)警模型的分析方法對(duì)于防范和控制財(cái)務(wù)管理風(fēng)險(xiǎn)和科學(xué)規(guī)劃以及投資決策具有重要意義[3]。中國(guó)金融市場(chǎng)的建立時(shí)間很短,因此市場(chǎng)秩序不夠規(guī)范,與防控相關(guān)的極端市場(chǎng)偏好風(fēng)險(xiǎn)技術(shù)還不夠成熟,使得防范和控制中國(guó)極端市場(chǎng)偏好風(fēng)險(xiǎn)的能力非常薄弱。事實(shí)上,隨著經(jīng)濟(jì)全球化的發(fā)展,國(guó)內(nèi)和國(guó)際金融市場(chǎng)的關(guān)系越來越密切,其中外國(guó)金融風(fēng)險(xiǎn)很容易加劇國(guó)內(nèi)市場(chǎng)的風(fēng)險(xiǎn)[4-6]。因此,優(yōu)化中國(guó)的金融風(fēng)險(xiǎn)預(yù)警分析領(lǐng)域,提升金融市場(chǎng)風(fēng)險(xiǎn)防控能力,是一項(xiàng)必須緊急進(jìn)行的研究。到目前為止,已有不少學(xué)者設(shè)計(jì)了不同的財(cái)務(wù)偏好風(fēng)險(xiǎn)預(yù)警策略[7],如邏輯回歸策略、多判別分析法、決策樹算法、似然比回歸算法、支持向量機(jī)(SVM)算法和神經(jīng)網(wǎng)絡(luò)算法。其中,作為一種智能預(yù)測(cè)模型,支持向量機(jī)具有更高的分析預(yù)測(cè)精度和計(jì)算效率,并已在許多領(lǐng)域得到應(yīng)用和驗(yàn)證。在本文中,支持向量機(jī)將成為研究如何提升極端市場(chǎng)偏好風(fēng)險(xiǎn)預(yù)測(cè)水平的主要工具。由于極端市場(chǎng)偏好和樣本數(shù)據(jù)非平衡性的樣本特征很小,SVM算法直接應(yīng)用于極端市場(chǎng)偏好風(fēng)險(xiǎn)預(yù)測(cè)中會(huì)得到不理想的結(jié)果和嚴(yán)重的風(fēng)險(xiǎn)預(yù)測(cè)傾向。因此,在預(yù)測(cè)極端市場(chǎng)偏好風(fēng)險(xiǎn)時(shí),如何處理樣本數(shù)據(jù)的不平衡對(duì)于用SVM建立市場(chǎng)偏好預(yù)警模型至關(guān)重要[8]。
本文針對(duì)極端市場(chǎng)偏好風(fēng)險(xiǎn)預(yù)警相關(guān)問題,以深圳股票和上海股票綜合指數(shù)樣本數(shù)據(jù)為研究對(duì)象,以SVM算法為預(yù)測(cè)分析工具,針對(duì)SVM算法存在的問題,并基于灰度模型,自回歸模型和多核SVM,提高了算法的性能,結(jié)果驗(yàn)證了算法的可用性[9-12]。
在市場(chǎng)i和時(shí)間t中,將會(huì)出現(xiàn)兩種極端偏好風(fēng)險(xiǎn),即非極端偏好風(fēng)險(xiǎn)和極端偏好風(fēng)險(xiǎn),前者定義為“-1”,后者定義為“+1”。樣本集中的樣本點(diǎn)將被分成兩部分[13-14]:
f(x)=sgn(w*·x+b)=
(1)
(2)
以上是本文應(yīng)用的市場(chǎng)極值偏好風(fēng)險(xiǎn)預(yù)警的SVM模型,如上所述,因?yàn)樵撃P涂赡茉跇O端偏好的風(fēng)險(xiǎn)預(yù)測(cè)中“失敗”,并且可能將極端偏好風(fēng)險(xiǎn)錯(cuò)誤地判斷為非極值偏好風(fēng)險(xiǎn)。本文旨在上述支持市場(chǎng)偏好風(fēng)險(xiǎn)的SVM預(yù)警模型的基礎(chǔ)上,改進(jìn)算法優(yōu)化過程,提高預(yù)測(cè)精度。
灰度預(yù)處理是一種基于歷史數(shù)據(jù)構(gòu)造的樣本預(yù)處理算法,其中GM(1,1)是包含單變量微分方程最常見的灰色模型。
通過對(duì)市場(chǎng)極值偏好的原始數(shù)據(jù)進(jìn)行累加計(jì)算,可以得到具有指數(shù)增長(zhǎng)特征的數(shù)據(jù)序列模型和基于該序列的市場(chǎng)極值偏好風(fēng)險(xiǎn)微分模型,以及時(shí)間響應(yīng)數(shù)據(jù)遞減歸約法,我們可以得到如下市場(chǎng)極值偏好風(fēng)險(xiǎn)數(shù)據(jù)的灰度預(yù)處理模型[17]:
(3)
(4)
式中:x′(0)為市場(chǎng)極值偏好序列的滑動(dòng)平均值,x0為市場(chǎng)極值偏好的原始序列,通過求解的滑動(dòng)平均值,x0將增加數(shù)據(jù)權(quán)重并顯著減少數(shù)據(jù)波動(dòng),從而使數(shù)據(jù)擬合效果更好。
(5)
在確定AR模型的階數(shù)時(shí),需要計(jì)算市場(chǎng)極端偏好數(shù)據(jù)的自協(xié)方差,形式如下:
(6)
那么,可以得到與市場(chǎng)極端偏好樣本存在相關(guān)的參數(shù)如下:
(7)
部分相關(guān)參數(shù)的形式如下:
(8)
其中的相關(guān)參數(shù):
(9)
(10)
(11)
(12)
然后只需要找出符合上述約束條件的mar來獲得自回歸SVM風(fēng)險(xiǎn)預(yù)測(cè)模型的階次數(shù)。
在高維空間中,計(jì)算核函數(shù)上點(diǎn)的內(nèi)積,并用多模簡(jiǎn)單函數(shù)組合代替普通核函數(shù),如高斯核函數(shù)、傅立葉核函數(shù)、多項(xiàng)式函數(shù)內(nèi)核,其中多項(xiàng)式SVM內(nèi)核的格式如下:
K(x,x′)=((x,x′)+c)d
(13)
式中:c≥0,d=1,2,…,當(dāng)參數(shù)c>0時(shí),上述多項(xiàng)式SVM內(nèi)核將具有維度非均勻性,當(dāng)參數(shù)c=0時(shí),上述多項(xiàng)式SVM內(nèi)核將具有維度均勻性,其形式為K(x,x′)=(x,x′)d,d=1,2,…,高斯內(nèi)核是:
(14)
傅立葉內(nèi)核將是:
(15)
式中:當(dāng)?x,x′∈R,γ是模型常數(shù);q是常數(shù)值,滿足0 多項(xiàng)式SVM內(nèi)核是一種基于單項(xiàng)內(nèi)核組合的新型SVM內(nèi)核,考慮使用這種組合來實(shí)現(xiàn)全局和局部?jī)?nèi)核,這種方法的應(yīng)用可能實(shí)現(xiàn)這兩種SVM內(nèi)核的互補(bǔ)。根據(jù)Mercer理論,如果K3(θ,θ′)屬于Rm×Rm和θ(x)是X?Rn到Rm的數(shù)據(jù)映射,可以得到K(x,x′)=K3(θ(x),θ(x′))也是Rn×Rn上的內(nèi)核;如果f(·)是在x∈Rn上定義的實(shí)際映射函數(shù),那么可以得到該內(nèi)核K(x,x′)=f(x)f(x′)具有正定性。如果K1和K2是Rn×Rn上的SVM內(nèi)核,則可以得到以下SVM內(nèi)核: (16) 特別是如果p(x)是一個(gè)正值的多項(xiàng)式,我們可以得到下面的SVM內(nèi)核: K(x,x′)=ρ(K1(x,x′),K(x,x′)=exp(K1(x,x′))) (17) (18) 然后獲得以下SVM內(nèi)核: (19) 在0 假設(shè)回歸模型的訓(xùn)練集為: T={(x1,y1),(x2,y2),…,(xt,yt)}∈(X×Y)t (20) 式中:參數(shù)xi∈X=Rn是多項(xiàng)式AR-SVM核模型的輸入,參數(shù)yi∈Y=R是模型輸出,其中i=1,2,…,l,通過搜索Rn存在的實(shí)際值映射f(x),我們可以得到y(tǒng)=f(x)并推導(dǎo)出x和y的對(duì)應(yīng)關(guān)系,多項(xiàng)式AR-SVM核模型的計(jì)算是:將原始市場(chǎng)極值偏好的高維特征數(shù)據(jù)空間,實(shí)現(xiàn)最佳決策目標(biāo)并建立: f(x)=wTφ(x)+b (21) 式中:參數(shù)φ(x)是變量x到高維空間的映射轉(zhuǎn)移,參數(shù)ω是單項(xiàng)SVM核的權(quán)重,b是模型的偏差。根據(jù)最優(yōu)理論,我們可以得到相同的上述模型的公式: (22) 式中:參數(shù)L為模型的損失因子,由于ε非敏感模型,這種損失因子可能使得SVM算法具有特定的稀疏性,因此我們?cè)诖诉x擇了非敏感模型損失因子ε: (23) (24) (25) 式中:模型輸入為x1,x2,…,xk,k是模型輸入的階數(shù),模型輸出是xk+1。本文多項(xiàng)式AR-SVM核模型的流程圖如圖1所示。 圖1 多項(xiàng)式AR-SVM核模型 為了驗(yàn)證本文提出的SVM算法的效率,選擇sinC測(cè)試函數(shù)的形式如下: f(x)=sinc(x)+vx∈[-3,3] (26) 算法性能與預(yù)測(cè)結(jié)果比較如圖2和表1所示。 圖2 SVM算法性能比較 表1 預(yù)測(cè)結(jié)果比較 根據(jù)圖2和表1可以看出,與正交SVM和原始SVM相比,本文提出的改進(jìn)的SVM算法需要最少量的SVM模型核,并且呈現(xiàn)出最低的預(yù)測(cè)誤差和訓(xùn)練誤差,對(duì)測(cè)試函數(shù)的預(yù)測(cè)更接近于原始樣本的預(yù)測(cè)。 參數(shù)設(shè)置后,選擇Torrubiano風(fēng)險(xiǎn)預(yù)測(cè)模型作為比較算法,對(duì)市場(chǎng)極端偏好風(fēng)險(xiǎn)預(yù)測(cè)過程進(jìn)行了實(shí)證檢驗(yàn),并對(duì)內(nèi)外部樣本的預(yù)警誤差TEN1、TEW1進(jìn)行了比較分析,k的值將在5~10以內(nèi),預(yù)警比較圖如圖3所示。 圖3 Torrubiano模型與本文算法內(nèi)外部預(yù)警誤差比較圖 由于模型特征的選擇可能會(huì)對(duì)市場(chǎng)極端偏好風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性產(chǎn)生不利影響,因此合理選擇對(duì)于此類預(yù)測(cè)至關(guān)重要。本文根據(jù)目前研究結(jié)果選取特征,主要有指標(biāo):股指、馬克指數(shù)和終極波動(dòng)指數(shù)(UOI),獲得了14組月度特征指標(biāo)樣本,詳見表2。 表2 市場(chǎng)極端偏好風(fēng)險(xiǎn)預(yù)警特征指標(biāo) 表3優(yōu)化指數(shù)為(ZB1-ZB2)/ZB1,其中ZB1是Torrubiano風(fēng)險(xiǎn)預(yù)測(cè)模型樣本的內(nèi)外部數(shù)據(jù)的平均值,ZB2是本文提出的風(fēng)險(xiǎn)預(yù)測(cè)模型樣本的內(nèi)外部數(shù)據(jù)的平均值。與Torrubiano風(fēng)險(xiǎn)預(yù)測(cè)模型相比,本文優(yōu)化指數(shù)具體如表3所示,指數(shù)值越大,該算法的優(yōu)越性越好。 表3 本文算法相比Torrubiano模型的優(yōu)化指數(shù) % 從表3可以看出,所提出的k為5~10的算法的跟蹤誤差均比Torrubiano風(fēng)險(xiǎn)預(yù)測(cè)模型的優(yōu)越。例如當(dāng)k=5時(shí),與Torrubiano風(fēng)險(xiǎn)預(yù)測(cè)模型相比,該算法的跟蹤精度了提高43.25%;當(dāng)k=6時(shí),提高43.62%;當(dāng)k=7時(shí),提高52.19%;當(dāng)k=8時(shí),提高了50.68%;k=9時(shí),提高了49.82%;當(dāng)k=10時(shí),提高了45.82%。在k=7時(shí)提高的最多。以上結(jié)果表明,與Torrubiano風(fēng)險(xiǎn)預(yù)測(cè)模型相比,本文提出的算法的預(yù)測(cè)精度得到了顯著提升。 在風(fēng)險(xiǎn)預(yù)測(cè)SVM模型分析中,選取平均值設(shè)置精度G,極值偏好風(fēng)險(xiǎn)預(yù)測(cè)等級(jí)F和ROC曲線區(qū)域作為評(píng)價(jià)指標(biāo),選擇原始SVM算法和文獻(xiàn)[18]提出的支持向量機(jī)算法作為比較算法,選擇的三種市場(chǎng)偏好風(fēng)險(xiǎn)支持向量機(jī)預(yù)警算法的比較數(shù)據(jù)如表4所示。 表4 三種模型對(duì)兩類股指的比較 根據(jù)表4中的模型評(píng)估比較結(jié)果,可以看出:無論是深證指數(shù)還是上證指數(shù),本文提出的算法的三個(gè)指標(biāo)G、F和AUC均優(yōu)于其他兩種算法,本文提出的算法能夠顯著提高市場(chǎng)極值偏好風(fēng)險(xiǎn)預(yù)測(cè)模型的準(zhǔn)確性;本文提出的模型優(yōu)于文獻(xiàn)[18]中提出的模型,除上證指數(shù)的AUC指數(shù)略低于文獻(xiàn)[18],其余指標(biāo)的擬合值都優(yōu)于文獻(xiàn)[18]。以上結(jié)果表明,本文提出的SVM模型的改進(jìn)方法可以顯著提高算法性能。 本文以深證指數(shù)和上證指數(shù)為基礎(chǔ),構(gòu)建了基于灰度混合核AR-SVM模型的市場(chǎng)偏好預(yù)警分析模型,得出結(jié)論:本文提出的算法模型可以顯著提升市場(chǎng)極端偏好風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性??梢钥闯觯疚奶岢龅哪P湍軌驕?zhǔn)確預(yù)測(cè)市場(chǎng)極端偏好風(fēng)險(xiǎn),得到更準(zhǔn)確的市場(chǎng)極端偏好風(fēng)險(xiǎn)預(yù)測(cè),能夠?qū)鹑谑袌?chǎng)監(jiān)管和宏觀調(diào)控有協(xié)助作用,具有一定的實(shí)際應(yīng)用價(jià)值。0.5,主導(dǎo)將是多項(xiàng)式SVM內(nèi)核;如果ρ<0.5,主導(dǎo)是基礎(chǔ)核;如果ρ=0.5,兩個(gè)單項(xiàng)SVM內(nèi)核將同樣重要??梢钥吹剑跇?gòu)建多項(xiàng)式SVM核函數(shù)時(shí),通過調(diào)整ρ的值可以得到單項(xiàng)SVM核函數(shù)的靈活組合,從而得到不同形式的多項(xiàng)式SVM核函數(shù)。
2.4 多項(xiàng)式AR-SVM核模型
3 實(shí)驗(yàn)分析
3.1 算法性能測(cè)試
3.2 實(shí)證分析
3.3 SVM模型風(fēng)險(xiǎn)預(yù)測(cè)分析
4 結(jié) 語(yǔ)