亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于增量寬度學習的投資組合風險控制模型

        2023-03-14 10:33:50陳良霞馮澤濤
        統(tǒng)計理論與實踐 2023年1期
        關鍵詞:集上比率特征值

        陳良霞 李 博, 王 琪 余 遠 馮澤濤 賈 穎

        (1.山東工商學院 計算機科學與技術學院,山東 煙臺 264005;2.山東工商學院 統(tǒng)計學院,山東 煙臺 264005)

        一、引言

        投資組合是對各種金融資產進行資金的最優(yōu)配置[1-2],目標是在風險最小化的同時產生穩(wěn)定的收益。除了金融,投資組合選擇還在多個領域得到廣泛研究,如人工智能、機器學習和統(tǒng)計學等。傳統(tǒng)的投資組合選擇方法通常來源于兩種經典的方法:馬科維茨均值方差模型[3]和凱利理論[4]。由哈里·馬科維茨提出的馬科維茨模型基于均值-方差組合選擇框架,適用于單周期投資組合選擇。而凱利資本增長理論關注的是多期投資組合選擇和預期收益最大化,但沒有考慮風險控制。隨著高性能計算機的發(fā)展,這兩個理論引起了研究人員越來越多的關注,在線投資組合選擇也成為近幾年投資組合研究領域的熱點。

        近年來,研究人員開發(fā)了很多新的投資組合選擇策略,特別是針對在線投資組合[5]。這些模型適用于在線場景,因為它們不僅具有實時交易特性,而且側重多期投資組合選擇。在線投資組合進行的實時交易需要投資者作出決定和調整資本分配,以產生較高的財富回報。

        根據(jù)在線投資組合選擇的具體應用,交易策略被分為四類[6]。第一類稱為基準模型。相應的策略包括統(tǒng)一買入并持有(UBAH)、最佳股票(Best Stock)、統(tǒng)一恒定再平衡(UCRP)和最佳恒定再平衡(BCRP)。統(tǒng)一買入并持有策略在交易期開始時購置資產,并將資產配置推遲到交易期結束。最佳股票策略是買入并持有策略的一個子模型,在該策略中,最好的股票是通過追溯歷史獲取的。統(tǒng)一恒定再平衡策略是一種固定比例的策略,用于在每個期間開始時重新平衡預設的投資組合。而最佳恒定再平衡策略是一種恒定再平衡的投資組合策略,在該策略中,根據(jù)交易日的結果對投資組合進行修改,以使累積財富最大化。第二類稱為“追隨贏家”,因為它試圖漸近達到與最優(yōu)策略相同的增長率。這些方法假設之前成功的股票將在接下來的一段時間內仍然表現(xiàn)良好。第三類是“追隨失敗者”,它基于這樣一種觀點,即當前時期的贏家在下一時期可能不會成功。雖然這一想法似乎缺乏依據(jù),但在實際交易環(huán)境中,這一策略往往會取得優(yōu)異的表現(xiàn)。

        由于前三個類別中的模型不挖掘數(shù)據(jù)集上的隱藏模式,第四類(模式匹配策略)試圖基于相似的歷史模式和趨勢預測資產在特定時間窗口內的后續(xù)分布。該策略假設相似的歷史模式將產生相似的結果,然后作出相應的決定。此外,最近幾年的一些研究工作結合了互聯(lián)網上不同利益相關者的信息和每日價格來預測股票收益[7]。在機器學習模型流行后,導致了人們對投資組合選擇的興趣與日俱增。然而,以上模型沒有考慮增量學習和系統(tǒng)風險。考慮到市場的不確定性,如莊家操作等因素,僅利用模式識別方法是不夠的。此外,盡管這些在線投資組合選擇模型是多樣化的,但它們都未將資產波動視為風險。

        針對上述問題,本文提出了一種新的收益-風險控制模型。首先,本文提出了一個增量寬度學習模型,該模型以增量的方式進行在線學習,比目前提出的其他模型更靈活。其次,基于隨機矩陣理論[8-10],本文提出了一種消除系統(tǒng)風險噪聲的方法。最后,本文沒有像其他很多文獻一樣使用每日收盤價,而是使用了30分鐘和60分鐘的高頻交易數(shù)據(jù)。因為這樣選擇不僅符合實際情況,而且使用每日收盤價作為樣本數(shù)據(jù)集的研究還忽略了一個關鍵因素——股票每日價格的波動性。

        二、投資組合概述

        投資組合問題可以表達如下:考慮金融市場中的各種資產,用價格向量p=[pt1,pt2,…,ptm]T來表示tth時期的價格,其中t=1,2,…,n,n表示周期數(shù),m表示資產數(shù)即相對價格向量的維數(shù)。如前所述,該周期為30或60分鐘的短間隔。m維相對價格向量由xt∈Rm表示,其中xt=pt/pt-1。在第t個周期開始時,將資產分配給投資組合向量bt。bt的第ith個元素(bti)表示投資于第jth種資產的資金比例。因此,每個投資組合都應該滿足約束:bt∈{b:b≥0,bt1=1}。投資者可以使用過去時期的歷史數(shù)據(jù)在這段時間內重新配置bt,將投資組合維持到收盤時間。因此,收益St將增加因子btxt,其初始值為S0=1。在n個周期后的最終累積財富可表示為:

        通常,在線投資組合選擇的主要目標是通過使用統(tǒng)計或人工智能模型開發(fā)新的投資組合策略,以實現(xiàn)累積財富的最大化。投資者必須同時使用適當?shù)闹笜藢L險降低。投資組合算法整體框架見算法1。

        算法1.在線投資組合框架1.第1步:初始值b1和S0=1 2.第2步:輸入歷史相對價格序列xt∈R+m 3.第3步:For t=1,2,…,n 4.從市場獲取相對價格xt 5.計算周期返回btxt,并更新累計值St=St-1×btxt 6.設置更新投資組合模型7.使用模型學習投資組合bt+1 8.End for 9.第4步:輸出最終的累積財富等指標

        三、模型簡介

        (一)增量寬度學習系統(tǒng)

        寬度學習的模型架構見圖1[11]。該算法的輸入是一個相對價格矩陣X∈Rm×k。其中k是周期窗口長度,其相應的輸出是預測的相對價格向量。令Zi是ith的映射特征,Hi是ith的增強征,則A=[Z|H]是塊矩陣。寬度學習模型可以表示為AW=Y的映射,因此有W=A-Y,其中Y是標簽矩陣。本文在寬度學習的基礎上提出了一種增量寬度學習模型,可以在增強特征方向進行維度擴展??紤]增強特征的維度擴展,Ah=[Z|H1…h(huán)]則可以表示為:

        圖1 寬度學習架構

        其中,A2=A+BBT+BDBT和B2=B(I+)。由此可得:

        其中,

        圖1 中,φ是線性函數(shù),ξ是線性或非線性函數(shù),We和Wh是正態(tài)分布的權重收益率。寬度學習模型不需要使用反向傳播算法來更新權重。因此,可以獨立設置映射特征和增強節(jié)點的數(shù)量Ah+1的廣義逆的特殊解可以表示如下:((Ah+1)TAh+1)-(Ah+1)T,則有:

        令A=(Ah)TAh,B=(Ah)THh+1,D=(Hh+1)THh+1,則有:

        其中,C1、C2、C3、D2由式(4)定義。新的權重由下式得出:

        因此,該模型可以通過增量學習來學習到新的權重。本文使用寬度學習的目的是在均值方差模型中產生價格序列并消除系統(tǒng)風險。它使用協(xié)方差作為風險控制因子,該因子由使用之前的歷史數(shù)據(jù)計算得出。

        (二)Bootstrap方法

        Bootstrap方法用于擴展預測數(shù)據(jù)矩陣。假設增量寬度學習模型產生了一個相對價格矩陣Xp∈RM×K,它可以擴展到Xp∈RM×K(N×M),相關矩陣Cp可以通過XP確定。

        (三)風險控制模型

        本文中,我們提出了一種新的風險控制模型,如式(8):

        其中,E(rp)代表投資組合的平均回報,b是投資組合向量,x是平均相對價格向量,σ是投資組合方差,δ1和δ2是不同風險比重系數(shù),∑是資產的協(xié)方差矩陣,由預測的相對價格序列計算而得。函數(shù)lg(·)的作用是對結果的放縮。目前一些研究工作的重點是改進方差,使用隨機矩陣理論分析資產相關性,并將隨機噪聲視為系統(tǒng)風險或外部市場影響。然而,這些研究并沒有利用預測數(shù)據(jù)從協(xié)方差矩陣中去除噪聲。

        (四)完備性

        其中,μi和σi分別是xi的均值和標準差。因此,CP可以通過XP直接計算。

        需要注意的是,在計算協(xié)方差的過程中,隨機矩陣需要滿足M→+∞和N→+∞。但是,這個條件是不切實際的。因此本文雖然采用了Bootstrap方法,但還需要提供樣本和總體協(xié)方差的估計。給定特定樣本(x和y)和總體(X和Y),樣本均值可以表示為和總體均值可以表示為E[X]=μx和E[Y]=μy。另外,和是無偏估計,且能夠得到:

        其中,xi和yj是成對數(shù)據(jù)。因此:

        因此樣本協(xié)方差的期望可以表示如下:

        根據(jù)推導結果可知,在本文研究背景下,樣本協(xié)方差是總體協(xié)方差的無偏估計。這種完備性在前述文獻中未探討過。

        四、實驗結果

        (一)數(shù)據(jù)集獲取

        本研究中使用的數(shù)據(jù)集見表1。選擇的股票數(shù)據(jù)集來源于深圳證券交易所的3個不同指數(shù):中小企業(yè)板創(chuàng)新指數(shù)(SMEBII)、創(chuàng)業(yè)板創(chuàng)新指數(shù)(GEBII)和大數(shù)據(jù)50指數(shù)(BG50I)。每只股票采集兩種不同頻率的數(shù)據(jù)(每30和每60分鐘的股票價格變動)。例如,SMEBII-30min數(shù)據(jù)集中的股票價格是中小企業(yè)板創(chuàng)新指數(shù)中每只股票每日每間隔30分鐘期間內的收盤價。

        表1 使用來自深圳股票交易所的6個真實數(shù)據(jù)集

        考慮到時間成本和資產的管理成本,我們每個指數(shù)選擇了20只股票,3個指數(shù)共60只股票。因此,本文采集了來自3個指數(shù)、2種頻率的60只股票的高頻價格數(shù)據(jù)構成了本文使用的全部6個數(shù)據(jù)集。

        (二)評價指標

        本文用5個不同指標評估所提出的方法。

        1.特征值分布,用于比較和預測隨機相關矩陣的特征值的相似性。

        2.累積財富(CW)[15],描述了在特定時間段內獲得或損失的總投資的累積回報。如前述章節(jié)所述,CW是評估模型性能的最重要指標。

        3.夏普比率(SR)[16],描述了每個波動期(投資組合的標準偏差)超過無風險利率的平均回報。它允許投資者更直接地評估與承擔活動相關的風險與利潤,定義如下:

        其中,Rf是無風險利率,σt是tth當期投資組合權重的標準差。風險調整后的回報通常隨著SR的增加而增加。

        4.信息比率(IR)[17],通常被用作衡量投資者相對于基準產生超額回報的能力。它通過在計算中加入風險標準偏差來考慮性能的一致性,定義為:

        其中,Rb是基準回報。在本文的研究中,最佳股票(Best Stork)被用作基準。較高的信息比率表示較好的性能,相反較低的值表示較低的性能。

        5.卡爾馬比率(CR)[18],用于確定相對于回撤(下行)風險的回報,其定義為:

        (三)對比方法

        為了對提出的模型進行分析和比較,本文利用4種策略對數(shù)據(jù)集進行了模擬實驗。對其中一些模型進行了總結和實現(xiàn)。上述4種策略描述如下:

        1.基準模型

        最佳股票(Best Stock):購買之前表現(xiàn)最好的股票。

        統(tǒng)一買入持有(UBAH):在開始時購買資產,一直持有資產到結束。

        最佳恒定再平衡投資組合(BCRP):將投資組合設置為事后最大化終端財富的投資組合。

        統(tǒng)一恒定再平衡投資組合(UCRP):在每個期初重新平衡當前投資組合的固定比例。

        2.關注獲勝者

        在線牛頓步進法(ONS):采用L2范數(shù)作為正則化約束項的BCRP。

        3.追隨失敗者

        置信加權均值回歸(CWMR):采用高斯分布對投資組合進行建模,并使用均值回歸原理更新分布。

        在線移動平均回歸(OLMAR):基于均值回歸預測下一個相對價格。

        4.模式匹配/機器學習

        局部自適應學習(LOAD)[19]:使用局部回歸來估計資產的價格趨勢。

        (四)特征值分布比較

        本文計算了經驗相關矩陣的特征值以研究其特性。圖2提供了真實或經驗特征值和理論特征值分布的比較。通過將經驗相關矩陣的特征值與隨機相關矩陣的特征值進行比較,從經驗相關矩陣中提取無噪聲的信息。圖2表明對于同一數(shù)據(jù)集,不同頻率的經驗分布是相似的。然而,這些數(shù)據(jù)并不符合隨機相關矩陣的理論分布。這一發(fā)現(xiàn)表明不同資產之間存在相關性(真實信息),并不依賴于頻率。相比之下,由于兩個分布之間的重疊,不同資產的相關性也存在噪聲。

        從圖2可以看出,一些經驗特征值超出了理論特征值分布,這些是與相關矩陣(真實信息)對應的無噪聲特征值。因此,符合理論特征值分布的經驗特征值對應于隨機噪聲。例如,在圖2(A)SMEBII數(shù)據(jù)集中,兩個頻率下(30和60分鐘)有35%的特征值是無噪聲的。同理,在圖2(B)GEBII數(shù)據(jù)集中,30分鐘頻率下和60分鐘頻率下分別有25%和35%的特征值是無噪聲的。此外,在圖2(C)BG50I中,30分鐘頻率下和60分鐘頻率下分別有40%和35%的特征值是無噪聲的。

        圖2 不同數(shù)據(jù)集在不同頻率的經驗分布圖

        (五)累積財富

        最終的累積財富結果見表2。任何一個模型都不可能在所有期間實現(xiàn)正的相對回報。但相對來說,一些模型例如本文提出的模型和OLMAR模型,比其他模型產生了更多的正向回報。然而,在少數(shù)期間內僅略高于1.0的相對回報可能會導致累積財富的大幅增加。因此,這一指標對于累積財富的發(fā)展至關重要。

        數(shù)據(jù)結果表明,盡管本文提出的模型在BG50I-30min數(shù)據(jù)集中的領先優(yōu)勢相對較小,但該模型在所有數(shù)據(jù)集上都取得了最佳性能,尤其體現(xiàn)在以下三個數(shù)據(jù)集上:SMEBII-30min、SMEBII-60min和GEBII-60min。因此,與其他模型相比,所提出的模型可以更好地從數(shù)據(jù)集中提取統(tǒng)計特性或模式;此外,OLMAR(在3個數(shù)據(jù)集上排名第二)、CWMR(在3個數(shù)據(jù)集上排名第二)等模型也取得了良好但非均衡的性能;基準模型在所有數(shù)據(jù)集中均產生了較低的累積財富;機器學習模型LOAD在數(shù)據(jù)集上表現(xiàn)不佳。

        如前所述,每個周期回報的小幅提升可以導致最終巨大的累積財富收益。例如表2所示,若BG50I-30min數(shù)據(jù)集的初始投資為1000元,應用本文提出的模型在投資周期結束時會產生約10.5萬元的收益。本文研究中使用了高頻數(shù)據(jù),雖然中國股市遵循T+1交易制度,即投資者不能在一天內多次買賣,但是高頻交易數(shù)據(jù)的實驗使投資者可以在一天的任意30分鐘之內進行一次交易。相對于其他論文中使用的收盤價,本文的實驗設置更接近實際股票市場用戶的交易行為,且所提出的模型產生了較高而穩(wěn)健的最終累積財富(在6個數(shù)據(jù)集中均排名第一)。

        表2 6個數(shù)據(jù)集的累積財富

        (六)夏普比率

        在真實的金融市場中,高累積財富回報往往伴隨著高風險。因此,投資者通常會嘗試平衡風險與收益。夏普比率是一個重要的指標,已被廣泛用于評估風險調整后的回報。表3給出了不同模型的SR計算結果。所提出的模型在所有數(shù)據(jù)集上明顯優(yōu)于其他模型(在所有數(shù)據(jù)集排名第一)。

        表3 6個數(shù)據(jù)集的夏普比率

        (七)信息比率

        表4給出了不同模型的信息比率。與夏普比率不同,信息比率用于評估相對于基準回報(不包括風險)的超額回報。實驗結果表明,本文模型同樣取得了最好的結果(在所有數(shù)據(jù)集中均排名第一)。其他幾個模型在特定數(shù)據(jù)集上也表現(xiàn)良好(例如OLMAR模型和CWMR模型分別在3個數(shù)據(jù)集上排名第二)。

        表4 6個數(shù)據(jù)集的信息比率

        (八)卡爾馬比率

        卡爾馬比率(CR)是用于比較平均復合回報率和最大回撤風險的指標。一般來說,卡爾馬比率的值越高,模型性能越好。表5所列結果表明,本文提出的模型優(yōu)于其他模型(在所有數(shù)據(jù)集上排名第一)。相比之下,其他幾個模型也取得了較好效果,例如OLMAR模型(在2個數(shù)據(jù)集并列排名第一,在1個數(shù)據(jù)集上排名第二)、CWMR模型(在1個數(shù)據(jù)集上排名并列第一,在2個數(shù)據(jù)集上排名第二)。這些結果表明,本文提出的模型在卡爾馬比率度量上取得了最好的效果。

        表5 6個數(shù)據(jù)集的卡爾馬比率

        (九)運行時間

        表6給出了各個模型的運行時間。從表中結果可以看出,雖然本文提出的模型耗時最多,因為它必須在每個期間訓練多個BLS模型。但是,數(shù)據(jù)集是基于30或60分鐘。如果本文提出的模型能夠讓投資者在30分鐘或者60分鐘內作出決策,那么模型的運行時間能夠滿足決策的要求。

        表6 模型在6個數(shù)據(jù)集上平均一個期間的運行時間

        五、分析與討論

        本研究中使用高頻數(shù)據(jù)集的原因可以解釋如下:(1)大多數(shù)現(xiàn)有研究均基于每日收盤價[20-21],但事實上,交易者經常在每個交易日的不定時間買賣股票。盡管他們當日不能多次交易股票,但交易者可以在交易時間段的任何時間(在30或60分鐘內)作出交易決定。(2)本文認為僅使用每日收盤價會忽略價格波動等關鍵因素,因此,使用高頻數(shù)據(jù)集為訓練集提供了更多信息,能更有效地預測相對價格。本文沒有采用15分鐘、5分鐘、1分鐘甚至秒級的數(shù)據(jù),因為發(fā)現(xiàn)太短的時間間隔內相對價格波動性較弱。(3)由于其他研究中使用的數(shù)據(jù)集年代較久,例如NYSE(O)數(shù)據(jù)集時間跨度為1962/07/03到1962/12/31,NYSE(N)數(shù)據(jù)集時間跨度為1985/01/01到2010/06/30,SP500數(shù)據(jù)集時間跨度為1998/01/02年至2003/01/31,MSCI數(shù)據(jù)集時間跨度為2006/04/01至2010/03/31,因此本文制作了新的數(shù)據(jù)集。另外,因為存在系統(tǒng)風險和不確定性,僅靠模式匹配不足以分析股市中的一些股票。例如莊家的操作或者外部因素的干擾可以視為是市場噪聲,這些因素都存在于真實的中國股票市場中。本文所提出的模型表現(xiàn)良好的主要原因是它可以進行增量學習并使用隨機矩陣理論消除了系統(tǒng)風險。

        六、結論

        本研究提出了一種新的風險控制模型。首先在寬度學習系統(tǒng)的基礎上提出了可以進行增量學習的在線學習模型。其次基于隨機矩陣理論提出了一種消除噪聲的方法。最后,使用特征值分布、累積財富、夏普比率、信息比率、卡爾馬比率等指標來評估所提出的模型性能。結果表明,本文提出的模型在幾種指標上均優(yōu)于現(xiàn)有常用模型。因此,本文提出的模型可以在有效控制風險的同時產生高累積收益。◆

        猜你喜歡
        集上比率特征值
        一類具有時滯及反饋控制的非自治非線性比率依賴食物鏈模型
        一類帶強制位勢的p-Laplace特征值問題
        單圈圖關聯(lián)矩陣的特征值
        Cookie-Cutter集上的Gibbs測度
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        復扇形指標集上的分布混沌
        一種適用于微弱信號的新穎雙峰值比率捕獲策略
        基于商奇異值分解的一類二次特征值反問題
        關于兩個M-矩陣Hadamard積的特征值的新估計
        幾道導數(shù)題引發(fā)的解題思考
        成年女人色毛片| 一区二区三区视频在线免费观看 | 精品88久久久久88久久久| 国产极品喷水视频| 亚洲av熟女传媒国产一区二区| 国产午夜av秒播在线观看| aaa级久久久精品无码片| 麻豆AⅤ精品无码一区二区| 中文字幕亚洲视频三区| 少妇激情av一区二区三区| 国产乱xxⅹxx国语对白| 亚洲精品黄网在线观看| 国产一级自拍av播放| 无码人妻久久久一区二区三区| 成人免费毛片aaaaaa片| 免费毛片性天堂| 国产精品亚洲精品专区| av无码精品一区二区三区| 国产成人午夜精华液| 久久亚洲第一视频黄色| 亚洲无人区乱码中文字幕动画| 无码人妻h动漫中文字幕| 精品香蕉久久久午夜福利| 天堂av无码大芭蕉伊人av孕妇黑人| 新久久国产色av免费看| 久久只精品99品免费久23| 久久精品国产一区二区电影| 一片内射视频在线观看| 国产区女主播一区在线| 蜜桃无码一区二区三区| 美女污污网站| 久久综合五月天啪网亚洲精品| 色欲人妻综合aaaaa网| 国模精品无码一区二区二区| 性色av手机在线观看| 99久久国产精品网站| 亚洲av无码精品色午夜| 国产国拍亚洲精品福利| 日本少妇熟女一区二区| 一边做一边喷17p亚洲乱妇50p| 91av精品视频|