亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        在金融科技中基于人工智能算法的風(fēng)險特征因子篩選框架的建立和在期貨價格趨勢預(yù)測相關(guān)的特征因子刻畫的應(yīng)用

        2020-10-13 12:40:50袁先智周云鵬劉海洋嚴(yán)誠幸錢國騏錢曉松汪冬華李志勇李祥林林健武沈思丞
        安徽工程大學(xué)學(xué)報 2020年4期
        關(guān)鍵詞:特征提取關(guān)聯(lián)特征

        袁先智,周云鵬,劉海洋,嚴(yán)誠幸, 錢國騏,錢曉松,汪冬華,李志勇, 李祥林,林健武,沈思丞,曾 途

        (1.成都大學(xué) 商學(xué)院,四川 成都 610106;2.上海立信會計金融學(xué)院 金融科技學(xué)院,上海 201620;3.成都數(shù)聯(lián)銘品科技有限公司,四川 成都 610000;4.墨爾本大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,澳大利亞 墨爾本 VIC3010;5.蘇州大學(xué) 金融工程研究中心,江蘇 蘇州 215000;6.華東理工大學(xué) 商學(xué)院,上海 200237;7.西南財經(jīng)大學(xué) 金融學(xué)院,四川 成都 611137;8.上海高級金融學(xué)院,上海 200030;9.清華大學(xué) 深圳國際研究生院,廣東 深圳 518057)

        期貨市場具有規(guī)避風(fēng)險和價格發(fā)現(xiàn)的功能。期貨價格是期貨交易的核心要素之一,同時也是反映整個期貨市場運行狀況的主要因素,合理有效的期貨價格可以起到先導(dǎo)作用并彌補現(xiàn)貨價格的滯后。隨著國內(nèi)期貨市場的不斷完善和發(fā)展,期貨市場在宏觀經(jīng)濟運行中的作用也顯得愈發(fā)突出,因此對于期貨定價的研究具有重要意義。

        大宗商品作為期貨市場的主要標(biāo)的,“消費屬性”是大宗商品的基本屬性。不過,隨著金融市場的不斷發(fā)展以及期貨期權(quán)、商品ETF等金融產(chǎn)品的不斷豐富,大宗商品的金融化特征不斷加強[1-2],除傳統(tǒng)意義下的“微觀”和“宏觀(基本面)”等因素以外,更多因素對大宗商品的價格產(chǎn)生影響開始愈發(fā)明顯,其中,“微觀因素”與“宏觀因素”包括經(jīng)濟發(fā)展對商品的需求、生產(chǎn)技術(shù)、地緣政治,以及事件風(fēng)險等因素。更多因素包括大宗商品市場與其他金融市場間的價格協(xié)整關(guān)系,資本市場和國際貨幣政策的變動,國際投機力量以及資本的流動性等。同時,由于大數(shù)據(jù)時代帶來的信息的量級遞增,許多高度關(guān)聯(lián)大宗商品價格的關(guān)聯(lián)因素以非結(jié)構(gòu)化數(shù)據(jù)的形式出現(xiàn),對大數(shù)據(jù)的分析處理正成為解決和分析傳統(tǒng)問題盲區(qū)的有效手段。因此在大數(shù)據(jù)框架下,以海量的結(jié)構(gòu)化和非結(jié)構(gòu)化的大宗商品數(shù)據(jù)為基礎(chǔ)數(shù)據(jù)池,通過大數(shù)據(jù)特征篩選和提取方法,建立關(guān)于大宗商品價格(變化)趨勢的影響因素研究,嘗試建立在給定的誤差容忍度下與大宗商品價格(趨勢)變化高度關(guān)聯(lián)的特征風(fēng)險因子。這類通過大數(shù)據(jù)框架篩選提取出的高度關(guān)聯(lián)的風(fēng)險因子,將幫助和改善針對大宗商品價格趨勢變化的解釋能力。

        到目前為止,盡管大多數(shù)的大宗商品定價模型能夠在很大程度上擬合期貨價格的期限結(jié)構(gòu)以及價格變化規(guī)律,但是這些傳統(tǒng)模型對于期貨價格變化的解釋還存在許多問題,比如不能很好地反映所有相關(guān)指標(biāo)對期貨價格的影響:一個基本的原因在于目前的大宗商品定價模型只是基于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)信息,通過因果關(guān)系來對商品價格的變化進行描述。但是,大宗商品的“消費、金融二重屬性”給期貨價格變化所帶來的影響是復(fù)雜的,傳統(tǒng)的定價模型無法反映海量的非結(jié)構(gòu)化數(shù)據(jù)提供的相關(guān)信息。Yuan[3]等通過大數(shù)據(jù)全息畫像方法(也叫“Hologram”方法)實現(xiàn)了結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的實時融合,然后完成針對中小微企業(yè)信用評分的全息畫像評估方法與平臺的建立,實現(xiàn)對中小微企業(yè)的風(fēng)險特征的刻畫和特征風(fēng)險因子的提取,用于建立針對中小型企業(yè)貸款的信用評估能力。我們本文研究的目的是建立對影響大宗商品期貨價格變化趨勢的高度關(guān)聯(lián)的風(fēng)險特征因子的提取框架。具體來講,以金融科技中大數(shù)據(jù)概念為出發(fā)點,利用人工智能中的吉布斯隨機搜索(Gibbs Sampling)算法為工具,全面陳述了如何提取高度關(guān)聯(lián)大宗商品期貨價格變化的風(fēng)險特征因子的流程和配套的邏輯原理,即采用(在馬爾科夫鏈蒙特卡洛(MCMC) 框架下) 人工智能中的吉布斯隨機抽樣算法,結(jié)合OR值(Odds Ratio,又稱為“比值比”或“優(yōu)勢比”,參見“附錄1”的描述)作為驗證標(biāo)準(zhǔn),實現(xiàn)從大量風(fēng)險因子的數(shù)據(jù)中提取與大宗商品期貨(銅)價格趨勢變化相關(guān)的特征因子并進行分類,從而用于構(gòu)建支持期貨價格趨勢變化分析的特征指標(biāo)。實證分析結(jié)果表明,研究討論的特征提取方法能夠比較有效地刻畫大宗商品期貨(銅)價格的變化趨勢,這為業(yè)界進行大宗期貨交易和風(fēng)險對沖的管理提供了一種新的分析維度。另外, 此次研究討論的從影響價格趨勢變化的特征因子中篩選出高度關(guān)聯(lián)的特征指標(biāo)的大數(shù)據(jù)分析方法,這是與過去文獻中對價格趨勢分析的不同之處和創(chuàng)新點。

        基于上述的介紹,研究的工作重點是在給定的誤差容忍度標(biāo)準(zhǔn)下,提煉出與大宗商品價格變化具有高度相關(guān)的特征指標(biāo),圍繞大宗商品的基礎(chǔ)指標(biāo)、產(chǎn)業(yè)指標(biāo)、宏觀指標(biāo)等指標(biāo)建立一套完善的大宗商品價格特征指標(biāo)體系,為預(yù)測大宗商品的價格變化,提供一種基于大數(shù)據(jù)思維的全新方法。

        研究以宏觀及微觀的因素為元素,以大數(shù)據(jù)框架下大宗商品期貨相關(guān)的海量非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)作為基礎(chǔ)的超過126個與期貨價格變化相關(guān)的因子作為初步風(fēng)險因子數(shù)據(jù)池(參見“附錄2”中的陳述),利用吉布斯隨機搜索(Gibbs Sampling)算法構(gòu)建關(guān)于影響大宗商品期貨價格變化的大數(shù)據(jù)特征篩選方法,完成對大宗商品期貨價格變換的特征提取,然后以Logistic回歸模型為工具構(gòu)建基于特征集的特征權(quán)重比照,形成對期貨定價影響強弱的價格風(fēng)險因子特征的排序,最終進行實證檢驗。實證結(jié)果表明大數(shù)據(jù)特征提取算法能夠有效地提取刻畫滬銅指數(shù)合約價格趨勢的特征,這些特征包含基礎(chǔ)特征、消費市場特征和宏觀經(jīng)濟指標(biāo)多個維度,并支持我們實現(xiàn)對期貨價格變化較好的預(yù)測性。

        1 相關(guān)文獻和相關(guān)研究綜述

        隨著期貨市場的不斷發(fā)展與完善,對于期貨價格的研究也成為學(xué)術(shù)界的重點研究領(lǐng)域。目前國內(nèi)外對于大宗商品期貨價格的研究主要集中在布朗運動模型及其擴展模型,大宗商品期貨價格波動率,不同金融市場與期貨價格之間聯(lián)動性三個方面的研究。

        在布朗運動模型及其擴展模型為主的期貨價格研究方面,Brennan[4]等假設(shè)商品現(xiàn)貨價格服從布朗運動,并提出以現(xiàn)貨價格為狀態(tài)變量的單因素模型。Schwartz[5]提出了以現(xiàn)貨價格和隨機便利收益為狀態(tài)變量的二因素模型,同時又以利率作為第三個狀態(tài)變量提出了三因素模型。Cassassus[6]等在Schwartz三因素模型的基礎(chǔ)上提出了基于三因素仿射模型的仿射期限結(jié)構(gòu)模型。王蘇生[7]等在Schwartz[8]等的基礎(chǔ)上提出了以短期偏離、中期偏離和長期均衡為狀態(tài)變量的三因素模型。韓立巖[9]等對能源商品期貨也進行了研究,提出了以現(xiàn)貨價格、便利收益和長期收益為狀態(tài)變量的三因素期限結(jié)構(gòu)模型,楊勝剛[10]和朱晉[11]也對基于三因素結(jié)構(gòu)來研究期貨價格與其他因素的關(guān)系提出了看法。

        在針對大宗商品期貨價格波動率變動的研究方面,張保銀[12]、董珊珊[13]、黃健柏[14]等分別通過建立VEC模型、分?jǐn)?shù)協(xié)整向量自回歸模型(FC-VAR)、狀態(tài)空間模型,基于實證分析認(rèn)為我國滬銅商品期貨價格波動具有尖峰厚尾、集聚性和長記憶性等特征。Hamilton[15]等將馬爾科夫鏈引入自回歸模型中,提出了RS-ARCH模型。

        在針對不同金融市場與期貨價格之間聯(lián)動性的研究方面,高輝[16]、張屹山[17]和郭樹華[18]等分別用格蘭杰檢驗、協(xié)整分析、誤差修正模型(ECM)等計量方法分析了國內(nèi)外金屬期貨市場之間的價格聯(lián)動性。胡東濱[19]等運用DCC-GARCH模型對于金屬期貨與外匯、貨幣市場的動態(tài)相關(guān)性進行了深入研究。Yue[20]等采用VAR-DCC-GARCH模型,研究中國金屬市場和LME市場金屬價格間的動態(tài)聯(lián)動性。李潔[21]等考慮不同期貨市場、不同期貨品種間的關(guān)聯(lián)關(guān)系,對中英期貨市場的期銅、期鋁、期鋅之間的價格交叉影響和風(fēng)險進行了針對性地分析。

        在過去幾年的研究中,針對金融市場和FOF等產(chǎn)品方面,袁先智[22]等完成了針對FOF和中小微企業(yè)風(fēng)險關(guān)聯(lián)特征的提煉和刻畫(特別是對于非結(jié)構(gòu)化指標(biāo)的提煉和刻畫),并應(yīng)用于金融業(yè)界實踐。本文研究的目標(biāo)是建立對影響大宗商品期貨價格變化趨勢的高度關(guān)聯(lián)的風(fēng)險特征因子的提取框架和配套的實踐流程。研究結(jié)果顯示,與傳統(tǒng)的計量分析方法相比,大數(shù)據(jù)特征提取方法更能有效地在高維度的特征空間中對商品期貨價格變化趨勢特征進行特征刻畫,同時利用大數(shù)據(jù)特征提取得到的特征集合建立針對滬銅價格變化的趨勢分析,結(jié)果如表1所示。

        2 基于人工智能算法的風(fēng)險特征因子篩選框架的建立

        研究以金融科技中大數(shù)據(jù)概念為出發(fā)點,利用人工智能中的吉布斯隨機搜索(Gibbs Sampling)算法為工具,全面地陳述了如何提取高度關(guān)聯(lián)大宗商品期貨價格變化的風(fēng)險特征因子的流程和配套的邏輯原理,即采用(在馬爾科夫鏈蒙特卡洛(MCMC)框架下)人工智能中的吉布斯隨機抽樣算法,結(jié)合OR值(Odds Ratio,又稱“比值比”或“優(yōu)勢比”)作為驗證標(biāo)準(zhǔn)(參見“附錄1”的介紹),實現(xiàn)從大量風(fēng)險因子的數(shù)據(jù)中提取與大宗商品期貨(銅)價格趨勢變化相關(guān)的特征因子并進行分類,從而用于構(gòu)建支持期貨價格趨勢變化分析的特征指標(biāo)。

        2.1 基于吉布斯(Gibbs)隨機搜索和Logistic回歸模型方法的關(guān)聯(lián)風(fēng)險因子篩選算法思想

        在人工智能算法中的吉布斯抽樣(Gibbs Sampling)是一種簡單有效并且廣泛應(yīng)用的馬爾科夫鏈蒙特卡洛(MCMC)算法,特別適宜于從復(fù)雜的多元概率分布產(chǎn)生隨機向量。考慮到某大宗商品價格漲跌受眾多因素決定,而我們只有和其有潛在關(guān)聯(lián)的M個因素(記為zi,i=1,2,…,M)的觀測值。因此假設(shè)價格漲跌是服從依賴于這M個(關(guān)聯(lián))因素的一個概率模型,那些影響價格漲跌但未被觀測到的因素的影響全部被歸入該概率模型的隨機部分。目標(biāo)是從這M個因素中發(fā)現(xiàn)和價格漲跌最關(guān)聯(lián)的因素,要完成這一目標(biāo)是一件非常具有挑戰(zhàn)性的工作。由于M一般比較大,同時M個元素之間也互相關(guān)聯(lián)(在大數(shù)據(jù)的概念下),不能孤立地進行處理。但考慮任何一組給定的因素和價格漲跌的可能的關(guān)聯(lián)可以用Logistic回歸模型為工具來進行分類處理和分析,基于這個基本的思路,可以構(gòu)造一個與價格漲跌和任何一組因素關(guān)聯(lián)關(guān)系的概率分布函數(shù),這個分布函數(shù)可以表示為p(z):=p(z1,…,zM),這里zi是一個指標(biāo)變量,i=1,2,…,M;zi=1表示關(guān)聯(lián)因素i被用在所分析的logistic回歸模型里,zi=0表示因素i沒有被用在所分析的logistic回歸模型里,然后就可以把原始目標(biāo)的尋找轉(zhuǎn)換為找出基于(z1,…,zM)的最優(yōu)值,使得p(z)獲得最大概率。因為搜索空間的大小是2M,一個指數(shù)增長的計算量級。因此直接找最優(yōu)的(z1,…,zM)在計算上不可行(即所謂的“NP問題”,參見文獻[23]中的討論)。通過把尋找最優(yōu)值的問題轉(zhuǎn)換為對應(yīng)的概率分布p(z)的最大值的估計工作,可以由吉布斯(Gibbs)隨機抽樣的搜索方法產(chǎn)生一系列隨機向量來解決問題(因為最優(yōu)z值通過隨機樣本的產(chǎn)生來實現(xiàn)),這樣就可以在生成的隨機樣本里搜索最優(yōu)關(guān)聯(lián)因素集,解決現(xiàn)實的計算復(fù)雜度這種NP問題(參見文獻[23],文獻[24]和相關(guān)文獻的討論)。

        為了將所有與價格關(guān)聯(lián)的(風(fēng)險)因子以Logistic回歸模型為工具進行關(guān)聯(lián)關(guān)系的強弱分類,首先按照吉布斯抽樣方法,把每個步驟涉及到的一個關(guān)聯(lián)變量的值替換為以剩余變量的值為條件的條件概率,從這個條件概率分布中抽取對應(yīng)變量的值,即將zi替換為從條件概率分布p(zi|zi)中抽取的值(其中zi表示z第i個元素的指標(biāo)變量,zi表示z1,z2,…,zM去掉zi這一項)。再按照一個特定的順序在變量之間進行循環(huán)計算,每一步按照某個變量關(guān)于其他所有變量組合的條件概率分布隨機地對該變量進行更新。

        經(jīng)過多次迭代后,樣本與初始狀態(tài)的分布無關(guān)。正是由于吉布斯抽樣的特殊性質(zhì),下面陳述基于吉布斯抽樣方法構(gòu)建的大數(shù)據(jù)框架下的特征因子的篩選框架和落地實現(xiàn)流程。

        2.2 基于吉布斯隨機搜索算法對風(fēng)險特征提取的實現(xiàn)路徑流程

        在大數(shù)據(jù)框架下,建模工作通常面對著高維度的稀疏數(shù)據(jù),遍歷高維度特征空間以提取出有效的特征進行建模是一項具有指數(shù)復(fù)雜度的工作,并不具備計算可行性,因此Qian[24]等提出了基于馬爾科夫鏈蒙特卡洛模擬進行特征提取的方法,通過吉布斯抽樣的方法將指數(shù)復(fù)雜度(NP問題)的特征提取問題轉(zhuǎn)化為在給定的(樣本)誤差容忍度(比如,5%的誤差)下轉(zhuǎn)化為多項式復(fù)雜度的問題,從而實現(xiàn)對高維特征空間的特征提取?;赒ian[24]等討論的方法,按照如下步驟進行風(fēng)險因子特征的提?。?/p>

        第一步:建立初始化模型,構(gòu)建初始特征集合。隨機抽取一個特征子集I0用于初步的模擬建模,將初始模型中系數(shù)不為0的特征記為1,系數(shù)為0的特征記為0,則有:

        I0=(0,1,1,…,0)∈{0,1}k。

        (1)

        第二步:基于AIC[25]、BIC[5,26]構(gòu)建指標(biāo)條件概率函數(shù)p(z)(如式(2)、式(3)所示)。

        (2)

        式中,js表示第s個特征;J-s表示除第s個特征之外的全部特征的組合;IC表示J-s這一組合的確定值。然后,研究將分別基于AIC(參見文獻[25])和BIC方法(參見文獻[5]或文獻[26])構(gòu)建兩組條件概率分布函數(shù),目的是在最后一步中比較兩者的模型效果,條件概率分布函數(shù)可表示為:

        (3)

        第三步:進入抽樣過程,共完成(通過下面推算出的)樣本量為400次的模擬,計算每一個特征進入模型的頻率,這個頻率即表示該特征與被預(yù)測變量之間的關(guān)聯(lián)顯著性。對于各個特征的吉布斯抽樣,由于假定隨機分布滿足伯努利過程,根據(jù)蒙特卡洛模擬的標(biāo)準(zhǔn)差公式,反映關(guān)聯(lián)規(guī)則顯著性的頻率指標(biāo)的標(biāo)準(zhǔn)差(用“std(p)”表示)如式(4)所示:

        (4)

        由式(4)可知,進行400次抽樣可以保證樣本關(guān)聯(lián)顯著性的誤差小于5%。這樣就完成支持建立“風(fēng)險特征因子篩選框架”相配套的在大數(shù)據(jù)框架下針對非結(jié)構(gòu)性(風(fēng)險)特征提取(篩選)的推斷邏輯支持原理。

        3 特征因子篩選框架方法在支持期貨銅價格趨勢預(yù)測特征因子刻畫上的應(yīng)用

        利用建立的基于特征因子篩選框架方法,結(jié)合大宗商品期貨產(chǎn)品銅和相關(guān)的真實市場和經(jīng)濟指標(biāo)數(shù)據(jù),討論如何從眾多(超過126個)與期貨銅價格相關(guān)的指標(biāo)(參見“附錄2”)中篩選出不超過10個與價格趨勢變化的關(guān)聯(lián)風(fēng)險特征來進行預(yù)測的刻畫如表1、表2、表3所示。這是過去很難想象和可以辦到的事情。但是,利用大數(shù)據(jù)針對比較全面的數(shù)據(jù)進行有效地篩選,可以使大宗商品期貨銅價格趨勢變化(即價格變化的方向)方面的預(yù)測達到超過90%的正確率。

        3.1 大宗商品期貨(銅)價格數(shù)據(jù)使用介紹

        研究將以2011年7月至2019年6月之間滬銅期貨指數(shù)合約價格(下文簡稱為“滬銅價格”)的每月累計漲跌幅度的方向為被預(yù)測變量,我們的工作是在今天(t時間)預(yù)測期貨銅價格在將來時間(大于t)價格變化的方向,因此,基于當(dāng)下時間t,我們預(yù)測的將來價格的變化只有兩種情況:價格向上變化和價格向下變化(不失一般性,假定價格不變的概率為零)。

        我們使用的描述“大宗商品期貨產(chǎn)品銅”價格的指標(biāo)為“當(dāng)前市場中正在交易的所有同品種期貨合約價格以成交量為權(quán)重的加權(quán)平均”。通常而言,剩余期限為3個月的期貨合約持倉量最大(如圖1所示),因此可以近似認(rèn)為銅期貨指數(shù)合約價格近似為3個月銅期貨合約價格。

        圖1 2011年7月至2019年6月期間上期所銅合約日均持倉量比例

        我們使用的其他解釋變量則包括以下幾個部分:商品期貨指數(shù)合約行情數(shù)據(jù)、人民幣兌美元中間價、滬深300指數(shù)及其行業(yè)子指數(shù)、宏觀經(jīng)濟數(shù)據(jù)、ICSG(International Copper Study Group,國際銅研究組織)統(tǒng)計數(shù)據(jù)、精煉銅產(chǎn)量、出口量等數(shù)據(jù)。

        由于預(yù)測是針對價格(將來)的變化趨勢,自然需要考慮今天以及基于以前(針對時間序列的預(yù)測)時間點的可預(yù)測的特征因子,這是因為我們只能由變量滯后于被預(yù)測變量實時點的信息進行預(yù)測工作。“附錄2”中列出的126(大)類初始特征因子作為最基本的出發(fā)點,考慮到因子滯后階的四種情況:“1個月,3個月,6個月和12個月”,這個構(gòu)成了全部的初始因子,472個作為最開始的備選解釋變量(下面稱為“初始特征”),下面匯報和討論基于大數(shù)據(jù)特征提取方法獲得的可以對期貨(滬)銅價格變化的行情進行預(yù)測的具有強關(guān)聯(lián)性的特征指標(biāo)的表現(xiàn)情況(研究分析需要的數(shù)據(jù)全部來源于Wind,參見Wind官方網(wǎng)址https://www.wind.com.cn/)。

        3.2 可以預(yù)測大宗商品期貨銅價格變化趨勢的關(guān)聯(lián)特征因子和實證預(yù)測效果

        基于上文所述的大數(shù)據(jù)特征提取方法以二分類(即價格向上變化和價格向下變化)Logistic回歸進行高度關(guān)聯(lián)的特征提取。

        為了研究滬銅價格趨勢特征的變化情況,以每5年為一個時間窗口分別進行特征提取,因此分析的數(shù)據(jù)段分別為3個時間窗口:2011年7月至2017年6月(簡記為“11年到17年”);2012年7月至2018年6月(簡記為“12年到18年”)和2013年7月至2019年6月(簡記為“13年到19年”)。

        另外,在每個自然月內(nèi),若月內(nèi)累計對數(shù)回報率大于0,記為1,表示當(dāng)月滬銅行情為牛市;月累計對數(shù)回報率小于0,記為0,表示當(dāng)月滬銅行情為熊市。

        根據(jù)“附錄1”中Odds Ratio的概念,我們有下面基于吉布斯(Gibbs)隨機搜索算法篩選出的關(guān)聯(lián)風(fēng)險特征因子的分類:①強關(guān)聯(lián)(特征因子):對應(yīng)“特征比值比”小于0.8或大于1.2時;②一般關(guān)聯(lián)(特征因子):對應(yīng)“特征比值比”介于1.1與1.2之間,或介于0.8與0.9之間;③弱關(guān)聯(lián)(特征因子):對應(yīng)“特征比值比”大于0.9且小于1.1時。

        首先考慮基于吉布斯(Gibbs)框架下,附錄2中那些具有“關(guān)聯(lián)顯著性”表現(xiàn)的因子?!瓣P(guān)聯(lián)顯著性”是指在吉布斯(Gibbs)隨機抽樣過程中,特征因子在模型中出現(xiàn)的概率(即公式(1)中定義的特征空間I0)。表1是具有“關(guān)聯(lián)顯著性”表現(xiàn)的前14個因子的匯總明細(xì)(基于“附錄2”中126個與銅價格相關(guān)的關(guān)聯(lián)因子),這里“關(guān)聯(lián)顯著性”是指在研究建立的吉布斯(Gibbs)隨機抽樣過程中,特征因子在模型中出現(xiàn)的概率,即式(1)中定義的特征空間I0,表1中ICSG是該項指標(biāo)的數(shù)據(jù)來源。

        把表1中與銅價格變化相關(guān)的“強關(guān)聯(lián)特征”因子分為三類。第一類為基礎(chǔ)特征(編號1~5),即反映滬銅的需求和供給的特征,同時也是最受滬銅交易者們關(guān)注的特征,經(jīng)過大數(shù)據(jù)特征提取可見,產(chǎn)能缺口、精煉銅、銅材產(chǎn)量分別在不同年份中體現(xiàn)出與滬銅價格的強關(guān)聯(lián)性。第二類為消費市場特征(編號6~9),即從產(chǎn)業(yè)鏈角度反映銅消費情況的特征,通過大數(shù)據(jù)特征提取發(fā)現(xiàn)家電行業(yè)(彩電、冰柜產(chǎn)量)、房地產(chǎn)面積(房地產(chǎn)竣工面積同比增長率)、基礎(chǔ)設(shè)施建設(shè)(電網(wǎng)設(shè)施建設(shè)完成率)等特征同樣是與滬銅價格趨勢存在強關(guān)聯(lián)的特征。由消費市場類特征的關(guān)聯(lián)顯著性可見,隨時間推移家電產(chǎn)量增長率、房地產(chǎn)竣工面積增長率與滬銅價格趨勢的關(guān)聯(lián)顯著性逐漸增強,而電網(wǎng)基本建設(shè)投資完成額同比增長率與滬銅價格趨勢的關(guān)聯(lián)顯著性逐漸減弱。這一現(xiàn)象與我國當(dāng)前電網(wǎng)建設(shè)逐漸趨向完善,國民消費升級的經(jīng)濟轉(zhuǎn)型大趨勢相吻合。第三類為宏觀經(jīng)濟指標(biāo)(編號10~14),即反映宏觀經(jīng)濟情況的常用指標(biāo)。通過大數(shù)據(jù)特征提取后宏觀指標(biāo)并沒有體現(xiàn)出很強的關(guān)聯(lián)顯著性,但是由于宏觀經(jīng)濟指標(biāo)具有對于經(jīng)濟整體狀況的刻畫能力,同時能夠影響市場預(yù)期,因此在進一步對滬銅價格趨勢的預(yù)測建模中仍將使用宏觀經(jīng)濟指標(biāo)作為特征。

        表1 與銅價格變化趨勢相關(guān)的表現(xiàn)出“關(guān)聯(lián)顯著性”的14個因子名單

        3.3 預(yù)測銅價格變化趨勢的特征因子刻畫

        為了檢驗基于吉布斯隨機搜索算法篩選出的對銅價格變化趨勢可進行預(yù)測的高度關(guān)聯(lián)的特征因子的有效性,采用上文提取得到的對篩選出的特征進行二分類邏輯回歸建模篩選出的具有預(yù)測能力的關(guān)聯(lián)方因子。

        在檢驗過程中,使用2011年7月~2017年6月的數(shù)據(jù)作為訓(xùn)練集,利用2017年7月~2019年6月的數(shù)據(jù)為測試集檢驗提取得到的特征對樣本外數(shù)據(jù)的預(yù)測效果的可靠性。

        基于上面的討論,在建模過程中采用二分類邏輯回歸模型,將銅價格收漲的月份作為正例,記為1;將收跌的月份作為負(fù)例,記為0。同時,為了降低特征共線性對模型預(yù)測效果的影響,采用“L1”和“L2”兩種正則化方法分別建模,基于模型對測試集數(shù)據(jù)的預(yù)測效果的好壞來驗證建立的特征提取方法是否具備對滬銅價格變化趨勢的預(yù)測能力。

        基于表1和表2的預(yù)測結(jié)果得出下面的基本結(jié)論:

        結(jié)論1:在L1、L2兩種正則化方法下建立的滬銅價格趨勢預(yù)測模型對滬銅價格趨勢預(yù)測的準(zhǔn)確率分別為95.83%和91.67%,兩種模型均能較好地預(yù)測滬銅價格未來的變化趨勢,如表2中的明細(xì)結(jié)果所示。

        結(jié)論2:從預(yù)測模型的模型系數(shù)來看,反映滬銅市場供需狀態(tài)的基本特征(表2中編號1~4)具有最強的解釋能力;消費市場特征(表2中編號6~9)能夠在模型中對銅價格趨勢的預(yù)測形成有效地補充;而宏觀因子(表2中編號10~14)的系數(shù)接近或等于0,同時說明宏觀因子與其他特征具有共線性,月度的宏觀經(jīng)濟數(shù)據(jù)中的信息可以由基礎(chǔ)特征和消費市場特征的線性組合所替代(至少在訓(xùn)練集樣本數(shù)據(jù)內(nèi)),即基本特征與消費市場特征已經(jīng)反映了宏觀因子對滬銅期貨未來價格的影響,其結(jié)果與數(shù)據(jù)特征提取中顯示出的結(jié)果相吻合。

        結(jié)論3:通過比對基于L1正則化方法和L2正則化方法建立的模型結(jié)果,我們發(fā)現(xiàn)基于L1正則方法的模型能夠更好地對滬銅期貨價格趨勢進行預(yù)測,同時能夠?qū)χ笜?biāo)進行進一步的提煉(如表2和表3中明細(xì)結(jié)果比較所示)。

        綜合起來,基于上面的3個結(jié)論并結(jié)合對應(yīng)表2、表3的結(jié)果,以及對應(yīng)關(guān)聯(lián)特征因子的Odds Ratio指標(biāo),有如下的結(jié)論:6個高度關(guān)聯(lián)的風(fēng)險特征可以用來刻畫期貨銅價格變化趨勢的預(yù)測(即對價格變化趨勢的方向正確性達到90%以上)。即,①前1個月滬銅價格漲跌幅;②前1個月ICSG:期間庫存變化;③前1個月精煉銅產(chǎn)量同比增長率;④前1個月精煉銅(再生)同比增長率;⑤前1個月房地產(chǎn)竣工面積同比增長率;⑥前1個月新增固定資產(chǎn)同比增長率。如果只是基于常規(guī)的計量分析的方法和手段,很難會發(fā)現(xiàn)“前1個月房地產(chǎn)竣工面積同比增長率”以及“前1個月新增固定資產(chǎn)同比增長率”會成為描述銅價格變化趨勢的高度關(guān)聯(lián)的特征刻畫指標(biāo),這是大數(shù)據(jù)分析多維度信息融合的優(yōu)點的體現(xiàn)。

        表2 滬銅價格趨勢分析模型系數(shù)

        表3 滬銅價格趨勢模型Odds Ratio(基于L1、L2正則化)

        4 結(jié)論

        研究的目的是建立對影響大宗商品期貨價格變化趨勢關(guān)聯(lián)的(結(jié)構(gòu)和非結(jié)構(gòu)化)風(fēng)險特征因子的提取框架和配套的推斷邏輯原理。以金融科技中大數(shù)據(jù)概念為出發(fā)點,利用人工智能中的吉布斯隨機搜索算法為工具,全面地陳述了如何提取高度關(guān)聯(lián)大宗商品期貨價格變化的風(fēng)險特征因子的流程和配套的邏輯原理,即采用(在馬爾科夫鏈蒙特卡洛(MCMC)框架下)人工智能中的吉布斯隨機抽樣算法,結(jié)合OR值作為驗證標(biāo)準(zhǔn)(參見附錄2),實現(xiàn)從大量風(fēng)險因子的數(shù)據(jù)中提取與大宗商品期貨(銅)價格趨勢變化相關(guān)的特征因子并進行分類,從而可用于構(gòu)建支持期貨價格趨勢變化分析的特征指標(biāo)。

        研究的實證結(jié)果表明大數(shù)據(jù)特征提取算法能夠有效地提取刻畫滬銅指數(shù)合約價格趨勢的特征,這些特征包含基礎(chǔ)特征、消費市場特征和宏觀經(jīng)濟指標(biāo)多個維度,并利用這些特征為滬銅指數(shù)月度行情進行建模分析,最終實現(xiàn)較好的預(yù)測準(zhǔn)確性。

        特征挖掘的結(jié)果說明能夠反映銅市場供需平衡狀態(tài)的基礎(chǔ)特征是對大宗市場進行預(yù)測分析的最有效特征,而消費市場特征能夠在預(yù)測分析中起到有效補充。

        基于2011年到2019年的真實數(shù)據(jù),針對消費市場特征的變化進行分析,我們發(fā)現(xiàn),用于能夠刻畫滬銅價格趨勢變化的消費市場特征伴隨著我國經(jīng)濟發(fā)展而變化,特別是隨著基建設(shè)施的逐步完善,電網(wǎng)建設(shè)完成額與滬銅價格變化的關(guān)聯(lián)性逐漸減弱;而隨著消費升級的趨勢,家電行業(yè)與滬銅價格的關(guān)聯(lián)性逐漸增強。

        我們的特征提取算法也表明:宏觀經(jīng)濟指標(biāo)與滬銅價格的變化關(guān)聯(lián)性不強,但宏觀經(jīng)濟指標(biāo)具有對經(jīng)濟整體狀況的刻畫能力,同時能夠影響市場預(yù)期,因此保留宏觀經(jīng)濟指標(biāo)作為特征因子是一個比較好的選擇。

        最后,希望研究建立的基于大數(shù)據(jù)框架下對刻畫銅期貨價格趨勢變化(分析)的風(fēng)險特征提取方法不只是理論上的創(chuàng)新,同時其結(jié)果可以用于業(yè)界實踐指導(dǎo)銅期貨的交易,風(fēng)險管理和相關(guān)的資產(chǎn)投資業(yè)務(wù)的實踐工作中。

        猜你喜歡
        特征提取關(guān)聯(lián)特征
        “苦”的關(guān)聯(lián)
        如何表達“特征”
        基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
        電子制作(2019年15期)2019-08-27 01:12:00
        不忠誠的四個特征
        奇趣搭配
        抓住特征巧觀察
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        一種基于LBP 特征提取和稀疏表示的肝病識別算法
        基于MED和循環(huán)域解調(diào)的多故障特征提取
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        国模无码视频专区一区| 人妻丰满av无码中文字幕| 国产精品 人妻互换| 北条麻妃毛片在线视频| 杨幂国产精品一区二区| 国产精品毛片极品久久| 人成午夜免费视频无码| 亚洲精品无码久久久久sm| 国产精品色内内在线播放| 91国内偷拍精品对白| 极品尤物一区二区三区| 末发育娇小性色xxxxx视频| 国产av一区二区三区区别| 国产免费精品一品二区三| 插鸡网站在线播放免费观看| 免费观看黄网站在线播放| 久久久久久久一线毛片| 香蕉蜜桃av一区二区三区| 人妻av中文字幕久久| 国产精品麻豆成人av电影艾秋| 欧美日韩中文亚洲另类春色| 自拍偷拍亚洲视频一区二区三区| 女人的精水喷出来视频| 韩国19禁无遮挡啪啪无码网站| 欧美日韩一区二区三区色综合| 国产午夜视频高清在线观看| 98色婷婷在线| 精品国产一区二区三区久久狼| 久久精品国产只有精品96| 深夜黄色刺激影片在线免费观看 | 亚洲一区二区三区1区2区| 亚洲人成人无码www| 免费人成视频在线观看网站| 乱人伦人妻中文字幕不卡| 免费在线视频亚洲色图| 久久久久久国产精品免费免费| 婷婷丁香91| 国产91成人自拍视频| 国产a∨天天免费观看美女| 色一乱一伦一图一区二区精品| 日韩一区二区三区中文字幕|