亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于XGBoost的大宗商品價格預(yù)測

        2021-05-26 01:17:33田秋紅廖文琪歐陽漢
        企業(yè)科技與發(fā)展 2021年4期
        關(guān)鍵詞:大宗商品

        田秋紅 廖文琪 歐陽漢

        【摘 要】大宗商品已成為財富管理與資產(chǎn)管理的重要內(nèi)容,通過搜集數(shù)據(jù)發(fā)現(xiàn)大宗商品價格走勢規(guī)律,對輔助投資者選擇合適的大宗商品進行投資等具有重要的意義。文章通過待預(yù)測的6種有色金屬和5種輔助有色金屬數(shù)據(jù)(包含6種日交易數(shù)據(jù)),7種市場指標(包含7種日交易數(shù)據(jù))。解決的問題是在考慮有色金屬具有時序性的情況下,通過了解背景知識和對數(shù)據(jù)的探索,創(chuàng)建了7類新的特征,并根據(jù)每一個待預(yù)測金屬的不同待預(yù)測時間點的標簽,篩選出對該金屬有著較大影響的特征。在有效數(shù)據(jù)的篩選上,分別選取2003—2017年(缺失鈀、鉑、銀3種金屬數(shù)據(jù))和2013—2017年(包含所有紐約金屬交易所的金屬數(shù)據(jù))建立XGBoost模型進行對比發(fā)現(xiàn),2013—2017年模型的預(yù)測結(jié)果好于2003—2017年模型的預(yù)測結(jié)果;在模型選取上,根據(jù)篩選不同金屬的特征,建立CatBoost、SVM、XGBoost 3個模型進行對比,結(jié)果顯示XGBoost的預(yù)測結(jié)果明顯好于另外兩個模型。因此,最終選取2013—2017年的數(shù)據(jù)和XGBoost作為訓(xùn)練數(shù)據(jù)和最終的模型,然后對每一種待預(yù)測金屬建立模型(共18個),分別預(yù)測各種金屬在2018年1 d、20 d、60 d的漲跌情況。

        【關(guān)鍵詞】大宗商品;XGBoost;特征工程

        【中圖分類號】F713.32;F274【文獻標識碼】A 【文章編號】1674-0688(2021)04-0150-03

        1 研究意義及現(xiàn)狀

        大宗商品電子交易市場作為一種新興的交易方式,對促進流通現(xiàn)代化、實現(xiàn)流通創(chuàng)新具有重要意義。目前,中國經(jīng)濟的迅速發(fā)展,特別是城市化、市場化進程不斷加快,貿(mào)易企業(yè)數(shù)量持續(xù)增長,形成對大宗商品市場的巨大需求。如果采用最直接也是最簡明的大宗商品投資方式,直接購買大宗商品進行投資,可能會產(chǎn)生很大的運輸成本和儲存成本,投資者很少采用這樣的方式。因此,通過搜集數(shù)據(jù)發(fā)現(xiàn)大宗商品價格走勢規(guī)律,輔助選擇合適的大宗商品進行投資等有著重要的意義 [1]。

        華仁海等人(2004)利用協(xié)整檢驗和Granger因果檢驗方法對國內(nèi)外期貨市場商品進行實證檢驗,得到不同期貨交易之間可能存在長期均衡關(guān)系或協(xié)整關(guān)系 [1]。曹旭等人(2017)基于機器學(xué)習(xí)中的支持向量機模型,選取大宗商品中金融屬性最強的黃金,對黃金價格進行預(yù)測,并初步嘗試構(gòu)建一個擇時策略。最后預(yù)測黃金價格的SVM模型,初步構(gòu)建了一個擇時交易策略,并給出在回測樣本中的回測結(jié)果 [2]。陳宇韶(2018)提出將皮爾森特征篩選與XGBoost算法結(jié)合的預(yù)測方法預(yù)測股票收盤價。以A股市場600677股票為例,采用皮爾森相關(guān)系數(shù)分析法提取重要特征,并生成高相關(guān)特征的數(shù)據(jù)集,再基于數(shù)據(jù)挖掘算法中表現(xiàn)極為優(yōu)異的XGBoost框架,結(jié)合特征工程處理,取得良好的訓(xùn)練預(yù)測效果 [3]。

        2 數(shù)據(jù)分析及數(shù)據(jù)清洗

        2.1 數(shù)據(jù)分析

        biendata競賽提供了倫敦金屬交易所(LME)數(shù)據(jù)集、紐約商品交易所(COMEX)數(shù)據(jù)集、一些市場指標(Indices)數(shù)據(jù)集、待預(yù)測金屬的標簽(Label)4類數(shù)據(jù)集,每一類數(shù)據(jù)集又分為訓(xùn)練集數(shù)據(jù)集和驗證集數(shù)據(jù)集。

        本文所使用的數(shù)據(jù)時間線如圖1所示。

        本文所使用的數(shù)據(jù)時間線為訓(xùn)練集:2003-01-02至2017-12-29,總共有3 790個數(shù)據(jù);驗證集:2018-01-02至2018-01-02,總共有253個數(shù)據(jù)。

        2.2 數(shù)據(jù)探索和數(shù)據(jù)預(yù)處理

        2.2.1 數(shù)據(jù)探索

        (1)基礎(chǔ)數(shù)據(jù)查看。以鋁(Aluminium)1d為例進行基礎(chǔ)數(shù)據(jù)查看,發(fā)現(xiàn)共有3種類型的數(shù)據(jù),分別是int64、object和float64,其中Unnamed:0為無意義的數(shù)據(jù);Unnamed:0.1為交易日期,Open.Price、High.Price、High.Price、low.Price為鋁金屬的日交易數(shù)據(jù);交易量(Vloume)數(shù)據(jù)則存在缺失情況,缺失243條數(shù)據(jù)。

        (2)標簽分布。在查看完所有的數(shù)據(jù)后發(fā)現(xiàn),除了標簽之外,所有的數(shù)據(jù)均為連續(xù)性變量,因此查看一下標簽的分布情況,6種有色金屬的漲跌情況分布較為均衡。

        2.2.2 數(shù)據(jù)預(yù)處理

        (1)缺失值填補。由于數(shù)據(jù)是基于時間序列進行變化的,如果對缺失值進行均值填補或者中位數(shù)填補時,有可能會用到來自未來的數(shù)據(jù),為了避免使用到未來數(shù)據(jù)而導(dǎo)致模型過擬合,選擇后值填補,即使用前一天的非空值對當天的數(shù)據(jù)進行填補 [4]。

        (2)時間線篩選。對數(shù)據(jù)探索之后發(fā)現(xiàn),除了紐約商品交易所中的鈀、鉑、銀3種金屬的基礎(chǔ)數(shù)據(jù)丟失嚴重,要到2013-11-11,日交易數(shù)據(jù)才較完整;其余的數(shù)據(jù)在這個時間點后,也都基本完整。因此,為了在選擇更多金屬數(shù)據(jù)而舍棄2003—2013年的數(shù)據(jù)還是選擇更長的時間線而舍棄鈀、鉑、銀3種金屬之間做一個簡易的模型對比,一個是不包含鈀、鉑、銀3種金屬的2003—2017年模型,一個是包含著3種金屬的2013—2017年模型,都采取XGBoost模型,AUC結(jié)果見表1。

        通過對比發(fā)現(xiàn),2013—2017年的模型比2003—2017年的模型效果要好很多,說明對預(yù)測金屬來說,在保證一定數(shù)據(jù)量時,更多的相關(guān)金屬種類數(shù)據(jù)的重要性是大于過于長的時間、但缺少相關(guān)金屬種類數(shù)據(jù)的,因此對有效數(shù)據(jù)的篩選時間線是2013-11-11至2017-12-31的有關(guān)數(shù)據(jù)。

        3 特征工程

        3.1 特征構(gòu)造

        在了解股票漲跌、大宗商品相關(guān)的背景知識和查看相關(guān)文獻之后,基于有色金屬的有關(guān)基礎(chǔ)數(shù)據(jù)創(chuàng)建7類特征[5]:range、hl、oc、MA、std_dev、rsi、Williams%R①。其中,創(chuàng)建移動平均線時,分短期、中期、長期指標,短期指標包含3 d、5 d、10 d,中期指標包含30 d、75 d,長期指標包含255 d;創(chuàng)建相對強弱指數(shù)時,選擇的是6 d、12 d、24 d的數(shù)據(jù);創(chuàng)建威廉指數(shù)時,選擇的是12 d、24 d的數(shù)據(jù)。

        3.2 特征選取

        常見的特征選擇方法有過濾法、嵌入法、包裝法 [6]。在這里選擇基于XGBoost的特征重要性排名,在71個特征中選取了前30個特征作為模型的特征。

        在分別對1 d、20 d、60 d的6種金屬進行特征篩選后,將出現(xiàn)在篩選后的6種金屬特征中的特征進行統(tǒng)計。其中,1 d的共同特征共有10個,20 d的共同特征共有6個,60 d的共同特征共有8個。具體來看,對1d的金屬漲跌預(yù)測來說,紐約金屬交易所中的銅和鈀金屬影響比較大,在6種金屬預(yù)測中都出現(xiàn)了這兩種金屬的當日開盤收盤價格差、交易量和最高最低價格差,以及待預(yù)測金屬自身屬性中的交易量和漲跌幅。對20 d的金屬漲跌預(yù)測來說,中期移動平均線中的季線和長期的移動平均線更為重要,6種金屬的特征選擇中都出現(xiàn)了中期移動平均線中的季線和所有的長期移動平均線,然后就是市場指標中的波動率指數(shù)和歐洲斯托克50指數(shù)。對60 d的金屬漲跌預(yù)測來說,紐約金屬交易所中鈀、鉑、銀3種金屬的個人持倉量出現(xiàn)比較多,然后是長期移動平均線和市場指標的滬深300指數(shù)、美元指數(shù)的影響比較大 [7]。

        4 模型選擇與評估

        本文專注于銅、鋁、鉛、鎳、鋅及錫6種有色金屬。通過構(gòu)建模型,分別預(yù)測1 d、20 d、60 d 3個時間段的有色金屬價格走勢方向(漲/跌)。選擇CatBoost、XGBoost、SVM 3種模型對數(shù)據(jù)進行擬合,根據(jù)AUC進行模型篩選,根據(jù)模型結(jié)果顯示可得,XGBoost的預(yù)測效果均比CatBoost和SVM預(yù)測效果好,因此決定采用XGBoost進行預(yù)測。為了比較特征篩選后與特征篩選前的模型效果對比,設(shè)定了包含所有特征的模型1和只含有篩選特征的模型2,選取2013-11-11后的800條數(shù)據(jù)作為訓(xùn)練集,后面的246條數(shù)據(jù)作為測試集,將數(shù)據(jù)代入XGBoost模型進行訓(xùn)練。

        結(jié)果發(fā)現(xiàn),只含有篩選特征的模型2的性能整體都要好于包含所有特征的模型1。因此,選擇特征篩選后的模型2作為最終模型。最終選擇了特征篩選之后的數(shù)據(jù)集和XGBoost模型對最后的驗證集進行預(yù)測,最終準確率為65.11%。

        5 結(jié)論與啟示

        在考慮有色金屬具有時序性的情況下,針對有色金屬的收盤價格創(chuàng)建新的、更有代表性的特征,并針對不同的金屬和不同的預(yù)測目標進行不同的特征選擇。同時,需要選擇一個適宜的模型,可以通過多種方式進行嘗試,根據(jù)模型效果選擇合適的模型,并對模型進行優(yōu)化。針對每一種待預(yù)測金屬的不同預(yù)測時間點,分別建立了一個模型(共18個模型)進行預(yù)測。由于各個不同的模型對數(shù)據(jù)的擬合程度不同,所以最終選取了在各個金屬的預(yù)測中表現(xiàn)都比較好的XGBoost模型。

        文中存在一些不足之處,在特征創(chuàng)建時,只對待預(yù)測金屬的交易數(shù)據(jù)進行了處理,如果對市場指標、紐約金屬交易所的數(shù)據(jù)也進行滑動窗口的處理,效果可能會更好;對相對強弱指數(shù)、威廉指數(shù)的時間線選取如果像移動平均線一樣長,可能體現(xiàn)的價值也會更全面。創(chuàng)造移動平均線,選取的是簡單移動平均算法,這種處理方式的滯后性比較強,如果采取滯后性更弱的算法,例如分型自適應(yīng)移動平均或赫爾移動平均,可能會有不一樣的結(jié)果。市場內(nèi),本文只考慮了有關(guān)金屬的交易數(shù)據(jù)和市場指標,沒有考慮金融機構(gòu)發(fā)布的有關(guān)研報和新聞;市場外,沒有考慮整體的國際形勢和政治、政策因素對有色金屬帶來的影響 [8]。

        注 釋

        ①range:漲跌幅,表示當日的收盤價與前一日收盤價價格差異的比值;hl:表示當日最高價和最低價的差;oc:表示當日開盤價格和收盤價格的差;MA:表示收盤價的移動平均線,反映價格變動的趨勢;std_dev:表示收盤價格過去一段時間的平均方差線;rsi:相對強弱指數(shù),通過過去一段時間收盤價平均漲數(shù)和平均跌數(shù)來分析市場;Williams%R:威廉指數(shù),利用擺動點度量市場的超買超賣現(xiàn)象。

        參 考 文 獻

        [1]華仁海,陳百助.國內(nèi)、國際期貨市場期貨價格之間的關(guān)聯(lián)研究[J].經(jīng)濟學(xué)(季刊),2004(2):727-742.

        [2]曹旭.基于SVM的黃金價格預(yù)測模型及其參數(shù)優(yōu)化[D].濟南:山東大學(xué),2017.

        [3]陳宇韶,唐振軍,羅揚,等.皮爾森優(yōu)化結(jié)合Xgboost算法的股價預(yù)測研究[J].信息技術(shù),2018(9):92-97.

        [4]唐亞平.基于移動電信數(shù)據(jù)個人征信模型研究[D].北京:北京郵電大學(xué),2017.

        [5]鐘一鳴.大宗商品價格波動的影響因素探析——以基本金屬銅為例[J].中國管理信息化,2012(16):48-49.

        [6]張靖.面向高維小樣本數(shù)據(jù)的分類特征選擇算法研究[D].合肥:合肥工業(yè)大學(xué),2014.

        [7]蔣劍輝,朱穎菲.上海有色金屬價格指數(shù)(SMMI)與倫敦金屬期貨交易所指數(shù)(LMEX)的相關(guān)性研究[J].浙江統(tǒng)計,2008(9):6-8.

        [8]孫靜嫻.有色金屬行業(yè)環(huán)境信息披露及其影響因素分析[D].南京:南京大學(xué),2012.

        猜你喜歡
        大宗商品
        大宗商品電子交易市場經(jīng)濟特征與風(fēng)險因素研究
        大宗商品貿(mào)易項下進口信用證業(yè)務(wù)的風(fēng)險與控制
        信用證結(jié)算在大宗商品交易中的風(fēng)險與防范探析
        搭乘“大宗商品”快車不可不知的四點
        投資與理財(2016年6期)2016-07-18 19:15:16
        寧波大宗農(nóng)產(chǎn)品電子商務(wù)發(fā)展現(xiàn)狀與建議
        中國市場(2016年23期)2016-07-05 04:56:53
        寧波大宗商品現(xiàn)貨市場的需求與供給分析
        中國市場(2016年20期)2016-06-12 04:28:05
        我國金融機構(gòu)應(yīng)對大宗商品價格波動風(fēng)險的措施建議
        美國貨幣政策與中國物價水平關(guān)系的經(jīng)驗研究
        京津冀一體化背景下天津自貿(mào)區(qū)推進大宗商品交易的對策研究
        大宗商品進口匯率傳遞及動態(tài)趨勢
        亚洲第一最快av网站| 亚洲另类丰满熟妇乱xxxx| 男女调情视频在线观看| 成人国产精品一区二区八戒网| 亚洲人成网77777色在线播放| 欧美丰满熟妇bbbbbb| 免费观看又色又爽又湿的视频| 欧美gv在线观看| 欧美一级三级在线观看| 草草浮力地址线路①屁屁影院| 欧美亚洲日韩国产人成在线播放| 激情婷婷六月| 亚洲一区二区三区在线观看| 日本一区二区三区在线视频播放| 91色老久久偷偷精品蜜臀懂色 | 小鲜肉自慰网站| 欧美日韩亚洲国内综合网| 热99精品| 免费大学生国产在线观看p| 性色av手机在线观看| 亚洲免费在线视频播放| 男女无遮挡高清性视频| 亚洲av永久无码一区二区三区| 四虎影视永久地址www成人 | 国产剧情无码中文字幕在线观看不卡视频| 国产一区二区在线观看视频免费| 高清不卡av在线播放| 日韩精品一区二区三区在线视频| 欧美成人国产精品高潮| 国产精品第一国产精品| 欧美日韩性视频| 亚洲国产精品日韩专区av| 精品国产av一区二区三四区| 2020国产在视频线自在拍| 麻豆影视视频高清在线观看| 亚洲黄色电影| 国产aⅴ天堂亚洲国产av| 国产一区二区三区免费主播| 媚药丝袜美女高清一二区| 久久亚洲av午夜福利精品一区| 久久精品成人欧美大片|