謝玉成 王嘉琳
摘? 要:很多人都知道股市的賺錢比例是很低的,近70%的人在虧損,真正可以賺錢的只有10%。面對(duì)金融市場(chǎng)中的巨大風(fēng)險(xiǎn),人們通過(guò)各種技術(shù)手段分析金融數(shù)據(jù),發(fā)掘其中隱含的規(guī)律,大數(shù)據(jù)技術(shù)就是一種重要的技術(shù)手段。針對(duì)如何利用大數(shù)據(jù)技術(shù)分析數(shù)據(jù)在股市中獲得利潤(rùn)的問(wèn)題,文章將利用R語(yǔ)言對(duì)金融數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,給投資者提出建議。
關(guān)鍵詞:大數(shù)據(jù);價(jià)差套利;R語(yǔ)言;金融
中圖分類號(hào):TP311.1? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)06-0013-03
Abstract:Many people know that the percentage of people who make money in the stock market is very low. Nearly 70% of people are losing money,and only 10% can make money. In the face of huge risks in the financial market,people analyze financial data through various technical means to discover the hidden laws. Big data technology is an important technical means. Aiming at how to use big data technology to analyze data to obtain profits in the stock market,this paper will use R language to conduct big data analysis on financial data and give suggestions to investors.
Keywords:big data;spread arbitrage;R language;financial
0? 引? 言
在金融市場(chǎng)上,對(duì)于投資者來(lái)說(shuō),抓住合適的投資機(jī)會(huì)進(jìn)行盈利是很困難的,因?yàn)槭袌?chǎng)中金融產(chǎn)品眾多而且難以把握交易的時(shí)機(jī),大數(shù)據(jù)技術(shù)可以給投資者提供合理的建議。大數(shù)據(jù)是一個(gè)專門用于分析、處理和存儲(chǔ)大量數(shù)據(jù)的領(lǐng)域,這些數(shù)據(jù)通常來(lái)自不同的數(shù)據(jù)源。通過(guò)大數(shù)據(jù)技術(shù)對(duì)金融數(shù)據(jù)的分析處理,將會(huì)幫助投資者對(duì)交易時(shí)機(jī)的把握和對(duì)金融產(chǎn)品的選擇,因此,本文基于河南大學(xué)大數(shù)據(jù)課程,對(duì)金融數(shù)據(jù)進(jìn)行了大數(shù)據(jù)分析。
1? 股市的風(fēng)險(xiǎn)
以一個(gè)經(jīng)典的故事為例:一個(gè)女人和一個(gè)男人拋硬幣,如果都是正面男人贏3塊,都是反面男人贏1塊錢,一正一反女人贏兩塊,這從表面上的看是非常公平的,但結(jié)果是男人一直輸。我們可以通過(guò)數(shù)學(xué)分析的方法來(lái)看看其中的原因,女人想要自己一直贏,保證男人贏的數(shù)學(xué)期望始終小于零就可以了,我們不難解出,只要女人出正面的概率在1/3和2/5之間,無(wú)論男人怎么出硬幣,都會(huì)一直輸錢。女人就像股市里的莊家一樣,可以拉升股價(jià)也可以打壓股價(jià),男人就像散戶一樣,可以買多,也可以買空。當(dāng)莊家拉升股價(jià)時(shí),我們做多贏了,做空的話就輸了;如莊家打壓股價(jià),我們做多輸了,做空就贏了,表面是公平的,實(shí)際上莊家有一定的策略讓散戶一直輸錢。由此表明,股市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。
在市場(chǎng)上,隨著新的信息被披露,企業(yè)的股價(jià)必然會(huì)受其影響而出現(xiàn)價(jià)格波動(dòng),例如,2019年蘋果公司的新產(chǎn)品iPhone 11的熱賣造成了其股價(jià)的上升。當(dāng)然反應(yīng)和調(diào)整是需要時(shí)間的,一般來(lái)說(shuō)市場(chǎng)越有效,反應(yīng)和調(diào)整所需要的時(shí)間就越短,對(duì)于投資者來(lái)說(shuō),要想獲利,就要想盡一切辦法在市場(chǎng)作出反應(yīng)之前確定投資計(jì)劃。
2? 價(jià)差套利
下面介紹一種利用價(jià)差來(lái)獲利的投資方式,這種方式相對(duì)來(lái)說(shuō)風(fēng)險(xiǎn)較低。
(1)該方式的典型是在期貨市場(chǎng)。期貨價(jià)格的基礎(chǔ)是現(xiàn)貨價(jià)格,但是期貨價(jià)格和現(xiàn)貨價(jià)格的變化趨勢(shì)并不一樣??梢杂没顏?lái)描述現(xiàn)貨價(jià)格與期貨價(jià)格之間的關(guān)系,利用“基差=現(xiàn)貨價(jià)格-期貨價(jià)格”的公式就可以求出基差。在到期之前,基差應(yīng)該為正(此時(shí)稱為反向市場(chǎng)),也就是期貨>現(xiàn)貨價(jià)格,因?yàn)槠谪浐侠韮r(jià)格=現(xiàn)貨價(jià)格*(1+利率)。如果出現(xiàn)了現(xiàn)貨價(jià)格高于期貨價(jià)格(此時(shí)稱為正向市場(chǎng)),且幅度擴(kuò)大,就可以買進(jìn)期貨、賣出現(xiàn)貨,等著日結(jié)算獲利。
(2)時(shí)間價(jià)差也叫作日歷價(jià)差或水平價(jià)差。一般情況是賣出一個(gè)期權(quán),并同時(shí)買入一個(gè)遠(yuǎn)期期權(quán),如果兩個(gè)期權(quán)的實(shí)際價(jià)值相同的話,遠(yuǎn)期期權(quán)更具有時(shí)間價(jià)值,因?yàn)殡x到期日越近,期權(quán)的價(jià)值會(huì)減少。這一買一賣就可以賺取其中的價(jià)差,時(shí)間價(jià)差最多的就是商品,如Crude Oil Calendar Spreads。
(3)各產(chǎn)業(yè)內(nèi)不同個(gè)股,股價(jià)時(shí)常會(huì)一起漲或一起跌,且保持一定的價(jià)格差距(Price Gap)。當(dāng)兩只股票之間的價(jià)差擴(kuò)大縮小時(shí),就可以進(jìn)行價(jià)差交易。例如,股票A高于股票B約20元。參考技術(shù)、籌碼情況之后,如果價(jià)差縮小到20元以內(nèi),可以買進(jìn)股票A,賣出股票B。反之,價(jià)差高于20元可以買進(jìn)股票B,賣出股票A。
(4)尋找走勢(shì)相近的兩檔權(quán)重股,一買一賣進(jìn)行價(jià)差交易??煞譃橘I進(jìn)價(jià)差、賣出價(jià)差。若價(jià)差=股票A-股票B,買進(jìn)價(jià)差的意思是:做多股票A,做空股票B。兩只股票的統(tǒng)計(jì)相關(guān),出現(xiàn)正負(fù)交替時(shí),就是套利機(jī)會(huì)出現(xiàn)的時(shí)候。表1計(jì)算了在香港上市的兩只股票:中國(guó)銀行和中國(guó)農(nóng)業(yè)銀行的價(jià)差表(中國(guó)農(nóng)業(yè)銀行-中國(guó)銀行)。
從2019年6月4日到2019年7月3日一個(gè)月內(nèi),一股未計(jì)算手續(xù)費(fèi)的利潤(rùn)是0.88元,以一張期權(quán)1 000股計(jì)算,此1:1的價(jià)差部分,一套價(jià)差獲利880元。如果配合套期保值比率(hedge ratio),獲利可能更驚人。
3? 大數(shù)據(jù)技術(shù)
對(duì)于大數(shù)據(jù)的定義,可以認(rèn)為大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)[1]。大數(shù)據(jù)具有數(shù)據(jù)量巨大、數(shù)據(jù)真實(shí)性、數(shù)據(jù)類型多樣、流動(dòng)速度快和價(jià)值密度低的特點(diǎn),即大數(shù)據(jù)的“5V”。
3.1? 數(shù)據(jù)量巨大
大數(shù)據(jù)處理的數(shù)據(jù)量是巨大的,而且還在不斷增長(zhǎng)。世界上有很多股票交易所,這些股票交易所擁有數(shù)萬(wàn)家上市公司,每家上市公司每個(gè)財(cái)年都會(huì)公布財(cái)務(wù)報(bào)告,還有大量的期貨信息和其他的金融衍生品。由此可見金融市場(chǎng)的數(shù)據(jù)之多。
3.2? 數(shù)據(jù)的真實(shí)性
數(shù)據(jù)的真實(shí)性是指數(shù)據(jù)的質(zhì)量或真實(shí)可信度。股票的開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià)和成交量的數(shù)據(jù)是真實(shí)的。
3.3? 數(shù)據(jù)類型多樣
大數(shù)據(jù)支持處理多種格式和類型的數(shù)據(jù)。金融市場(chǎng)上有很多產(chǎn)品、股票、期權(quán)、期貨、外匯以及各種各樣的衍生品,當(dāng)然,還有與它們緊密聯(lián)系的時(shí)間數(shù)據(jù)。由此可見市場(chǎng)上種類豐富的數(shù)據(jù)。
3.4? 流動(dòng)速度快
在大數(shù)據(jù)環(huán)境中,大量的數(shù)據(jù)可以在很短的時(shí)間內(nèi)積累。毫不夸張地說(shuō),在市場(chǎng)上,一分鐘可能積累幾百GB或者幾TB的數(shù)據(jù),投資者所做決策的價(jià)值會(huì)隨時(shí)間的推移慢慢下降。
3.5? 價(jià)值密度低
價(jià)值是指數(shù)據(jù)對(duì)企業(yè)或個(gè)人的有用性。一般來(lái)說(shuō)在大數(shù)據(jù)背景下,處理龐大的數(shù)據(jù)量才可以提供一個(gè)投資建議,進(jìn)行獲利。
基于大數(shù)據(jù)的“5V”特點(diǎn),其存儲(chǔ)技術(shù)和處理技術(shù)可以有效處理金融領(lǐng)域的數(shù)據(jù)。數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),對(duì)于這些數(shù)量龐大而且種類多樣的數(shù)據(jù),提出了集群、分片、NoSQL數(shù)據(jù)庫(kù)、CAP理論、ACID數(shù)據(jù)庫(kù)設(shè)計(jì)原則、BASE數(shù)據(jù)庫(kù)設(shè)計(jì)原則,這些理論和對(duì)應(yīng)的技術(shù)將有效地對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。無(wú)論是SCV理論,Hadoop和MapReduce的處理模型,相關(guān)性分析,機(jī)器學(xué)習(xí),自然語(yǔ)言處理,大數(shù)據(jù)使用這些理論方法的目的就是發(fā)掘數(shù)據(jù)背后隱藏的秘密,要將這些結(jié)論以圖表或者其他易懂的方式和模型清晰地展示在使用者的面前[2]。由此可見大數(shù)據(jù)技術(shù)在金融領(lǐng)域應(yīng)用價(jià)值。
4? 利用R語(yǔ)言進(jìn)行數(shù)據(jù)分析
下面通過(guò)分析聯(lián)合利華公司和保潔公司的收盤價(jià)來(lái)發(fā)現(xiàn)價(jià)差套利機(jī)會(huì),因?yàn)檫@兩個(gè)公司的主要經(jīng)營(yíng)業(yè)務(wù)相似,所以數(shù)據(jù)相關(guān)性夠高。
以保潔公司2015年11月到2019年11月的收盤價(jià)減去聯(lián)合利華公司2015年11月到2019年11月的收盤價(jià)(數(shù)據(jù)來(lái)源于雅虎金融),利用R語(yǔ)言匯總分析得到如圖1所示的價(jià)差的時(shí)間序列圖。從圖中觀察可知,兩家公司的價(jià)差波動(dòng)比較大,有套利的機(jī)會(huì)。對(duì)此進(jìn)行進(jìn)一步的分析,得到如圖2所示的價(jià)差概率分布圖,圖中的虛線是波動(dòng)的平均值,通過(guò)圖2我們可以進(jìn)一步發(fā)現(xiàn),兩家公司的價(jià)差有明顯的波動(dòng),這就意味著有價(jià)差套利的可能。
我們有個(gè)價(jià)差交易策略——價(jià)差大于上界,我們做空價(jià)差,反之做多。按照上述所列舉的中國(guó)銀行和中國(guó)農(nóng)業(yè)銀行進(jìn)行價(jià)差套利的例子所代表的思想,利用R語(yǔ)言進(jìn)行分析,結(jié)果如圖3所示,點(diǎn)1證明我們要做多,點(diǎn)2證明我們要做空。
5? 結(jié)? 論
利用R語(yǔ)言對(duì)保潔公司和聯(lián)合利華公司的股票收盤價(jià)進(jìn)行分析,可以找出合適的套利時(shí)機(jī),指導(dǎo)投資者做出正確的決策。由此可見,使用大數(shù)據(jù)分析對(duì)利用價(jià)差進(jìn)行投資有巨大的意義?,F(xiàn)在國(guó)內(nèi)的大數(shù)據(jù)技術(shù)發(fā)展已經(jīng)成熟,且中國(guó)市場(chǎng)是一個(gè)弱式有效市場(chǎng),善用大數(shù)據(jù)技術(shù)對(duì)歷史金融數(shù)據(jù)處理分析,將會(huì)給投資這帶來(lái)巨大的利益。
參考文獻(xiàn):
[1] 本刊編輯部.什么是大數(shù)據(jù) [J].黑龍江檔案,2016(6):98.
[2] 維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革 [M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012.
作者簡(jiǎn)介:謝玉成(1998.11-),男,漢族,河北石家莊人,本科,研究方向:大數(shù)據(jù)分析;王嘉琳(1998.11-),女,漢族,河南鄭州人,本科,研究方向:數(shù)據(jù)分析。