范國亮
(晉中職業(yè)技術(shù)學(xué)院,山西 晉中 030600)
由于大數(shù)據(jù)技術(shù)的普及,許多金融機構(gòu)的投資者開始采取該項技術(shù)來幫助其開展證券投資活動,并處理其中可能出現(xiàn)的各種問題。大數(shù)據(jù)分析可以幫助投資者針對股市中存在的海量數(shù)據(jù)進行分析,同時依靠整理互聯(lián)網(wǎng)中的各種相關(guān)信息來評估當(dāng)前市場中的投資情況,以此來掌握當(dāng)前的市場動向,并以此為基礎(chǔ)開展投資決策。同時,大數(shù)據(jù)分析技術(shù)可以針對股票的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)開展精確分析,從而進行更科學(xué)、更精確的量化投資,實現(xiàn)收益率的有效提升。
目前,我國學(xué)術(shù)界并未針對大數(shù)據(jù)提出一個明確的界定,但其具有的以下特征受到廣泛認同,也就是容量大(Volume)、多樣性(Variety)、速度快(Velocity)及真假難辨(Veracity)。首先是容量龐大,這也是大數(shù)據(jù)最為重要的一個特點。容量過大導(dǎo)致傳統(tǒng)的數(shù)據(jù)存儲、管理及搜索方式無法滿足該技術(shù)實際運用過程中的需求,為此必須形成一套更靈活并易于擴展的數(shù)據(jù)存儲與管理方案。其次是多樣性。在當(dāng)前時代,數(shù)據(jù)存在著許多不同的表現(xiàn)形式,其中包括圖像、文字及音頻等諸多類型。采取傳統(tǒng)的檢驗與分析方式來針對這些數(shù)據(jù)進行探討,可能會導(dǎo)致數(shù)據(jù)分析的效率低下,無法保持相對較高的數(shù)據(jù)利用率。再次是速度快。傳統(tǒng)的計算機設(shè)備不具備實時處理大量不同格式數(shù)據(jù)的能力,為此需采用更先進的技術(shù)來進行數(shù)據(jù)分析。大數(shù)據(jù)基礎(chǔ)設(shè)施的運用有助于人們更靈活便捷地開展數(shù)據(jù)管理工作,同時還能針對許多不同格式的數(shù)據(jù)進行實時探析。最后是真假難辨。尤其是一些來源于社交媒體中的數(shù)據(jù),其真實性往往無法得到充分的保障,這也給大數(shù)據(jù)分析技術(shù)的運用帶來更多困難。
大數(shù)據(jù)分析指的是對互聯(lián)網(wǎng)中產(chǎn)生的大量數(shù)據(jù)進行分析,以此來尋找出能為決策提供幫助的有用信息。大數(shù)據(jù)分析主要采取信息網(wǎng)絡(luò)技術(shù)對人們交易過程中形成的大量數(shù)據(jù)信息進行搜集與整合,之后再采取相應(yīng)的大數(shù)據(jù)分析模型對這些數(shù)據(jù)進行探究,從而尋找出其中蘊含的規(guī)律。大數(shù)據(jù)分析技術(shù)的基礎(chǔ)在于從信息網(wǎng)絡(luò)等數(shù)據(jù)源中搜集的各種結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并把這些數(shù)據(jù)存儲到處理器中。利用信息技術(shù)來對其進行研究,依靠相應(yīng)的算法模型來進行關(guān)聯(lián)分析,以此查找出其中存在的價值。使用大數(shù)據(jù)分析技術(shù)的主要目標(biāo)在于找出數(shù)據(jù)中存在的價值。
股票分析主要涵蓋了以下兩個方面內(nèi)容,分別為基本面分析與技術(shù)分析。
2.1.1 基本面分析
在廣義層面上,基本面分析主要指以供求關(guān)系理論為基礎(chǔ),通過對各種經(jīng)濟數(shù)據(jù)與政治環(huán)境進行分析來探究金融市場的發(fā)展態(tài)勢。而在狹義層面上,基本面分析需要把微觀經(jīng)濟狀況作為研究的對象,其中涵蓋的要素主要有產(chǎn)品競爭力、行業(yè)發(fā)展?fàn)顩r及管理者的專業(yè)素養(yǎng)等。在進行大數(shù)據(jù)分析的過程中,需要采取相關(guān)算法,依據(jù)投資者的實際需求來查找出能夠滿足其需求的股票,幫助其進行投資。
2.1.2 技術(shù)分析
技術(shù)分析主要指依靠分析市場行為的方式來評估市場運行的發(fā)展趨勢,并在充分理解了市場運行趨勢周期性變化的基礎(chǔ)之上進行證券投資相關(guān)的決策。技術(shù)分析理論認為市場行為具有一定的重復(fù)性,因此如果市場屬于有效市場,則在股票市場中發(fā)生的大部分事件都曾經(jīng)在以往發(fā)生過。以人工神經(jīng)網(wǎng)絡(luò)算法技術(shù)為基礎(chǔ)的股票技術(shù)分析,需要依靠輸入預(yù)測樣本和設(shè)定目標(biāo)變量等方式來進行分析,并在此基礎(chǔ)上將預(yù)測取得的結(jié)果和實際值進行對照,最后依靠構(gòu)建擬合方程的手段來了解預(yù)測值與實際之間的差異性和關(guān)聯(lián)性,以此來為投資決策提供有益的參考。
在廣義層面上,投資情緒的內(nèi)容涵蓋各種可以使投資者對證券的估值與市場預(yù)期造成影響的因素。而在狹義層面上,投資情緒分析著重探討經(jīng)濟變量和其他因素。對于券商和其他參與到證券投資活動的投資者而言,如何針對投資情緒進行準(zhǔn)確的評估是極為困難的事情,而針對投資情緒開展準(zhǔn)確的量化分析,對于證券市場研究的發(fā)展具有極為重要的積極作用。
在進行投資情緒分析的過程中,需要收集人們在各種社交網(wǎng)絡(luò)平臺中發(fā)表的信息,并在這些復(fù)雜的信息中篩選出具有良好價值的信息,從而將非結(jié)構(gòu)化的文本信息向著結(jié)構(gòu)化的方向進行轉(zhuǎn)化,以此來取得投資者情緒測評指標(biāo)。此外,還需要運用情感分析引擎來取得投資情緒分析的結(jié)果,最終在海量的數(shù)據(jù)信息中提取出更多有價值的內(nèi)容,這也是大數(shù)據(jù)分析在證券投資活動中的主要優(yōu)勢。
量化投資的內(nèi)容主要是指針對金融市場和產(chǎn)品信息開展量化分析,并依據(jù)歷史交易數(shù)據(jù)的內(nèi)容來進行模型的構(gòu)建,以此來做出科學(xué)的證券投資決策,以便完成交易活動。大數(shù)據(jù)分析的過程需采用各種類型的分析工具,其中包括人工智能技術(shù)、數(shù)據(jù)挖掘等。這些分析工具的使用有助于讓金融投資活動向著智能化和高頻化的方向發(fā)展。依據(jù)數(shù)據(jù)結(jié)構(gòu)的差異,筆者將大數(shù)據(jù)分析技術(shù)區(qū)分成結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),其中前者的使用范圍相對較廣。
在進行量化投資時,結(jié)構(gòu)化數(shù)據(jù)應(yīng)用集中于人們無法利用的極為短暫的市場變化。舉例而言,證券在買入與賣出之間價格發(fā)生的變化便屬于結(jié)構(gòu)化數(shù)據(jù)。高頻交易具有頻率較高且交易量較大等特性,因此計算機需要針對不同種類的結(jié)構(gòu)化數(shù)據(jù)進行分析。雖然這類數(shù)據(jù)的收益率較少,但也具有穩(wěn)定性強的優(yōu)越性。在量化投資領(lǐng)域,非結(jié)構(gòu)化數(shù)據(jù)并未得到廣泛的運用,許多學(xué)者與從業(yè)者都在對其開展深入研究。這類數(shù)據(jù)能夠幫助企業(yè)取得更多有用的信息,從而給其帶來高額的收益。為此,許多企業(yè)都為其提供高額的投資。
大數(shù)據(jù)技術(shù)在使用過程中必然會引發(fā)數(shù)據(jù)安全方面的問題。大數(shù)據(jù)具有較高的價值,所以受到了黑客的重視,他們往往會選擇冒著風(fēng)險展開攻擊。歷史上曾經(jīng)發(fā)生多次黑客攻擊引發(fā)的信息泄露事件。例如,雅虎公司曾經(jīng)因為受到了黑客的攻擊,使得約有10 億用戶的個人信息泄露,其中涵蓋姓名、性別、聯(lián)系方式、居住地址及登錄密碼等內(nèi)容。此外,我國也曾經(jīng)出現(xiàn)過各種類型的隱私泄露事件,這些事件均在社會上引發(fā)了強烈的反響。除了黑客活動可能產(chǎn)生的用戶隱私風(fēng)險,企業(yè)員工盜竊數(shù)據(jù)所產(chǎn)生的風(fēng)險也需要得到充分的重視。2017 年,我國一些互聯(lián)網(wǎng)企業(yè)的員工便竊取了超過50 億條用戶信息進行販賣。這些問題的普遍存在使得大數(shù)據(jù)安全問題受到人們的關(guān)注。若個人的隱私受到泄露,必然會導(dǎo)致用戶受到騷擾,甚至可能導(dǎo)致用戶與其親友遭遇詐騙,最終給其帶來嚴(yán)重的損失。同時,人們在大數(shù)據(jù)發(fā)展的過程中面臨的威脅還包括大數(shù)據(jù)技術(shù)對人們的行為與狀態(tài)的預(yù)測。由于各種信息技術(shù)取得突破性發(fā)展,互聯(lián)網(wǎng)企業(yè)可以依靠對用戶行為進行建模與分析等方式來探究用戶的行為規(guī)律,甚至一些用戶不愿被他人察覺的隱藏屬性也可能被推測出來,這對用戶的個人隱私造成了一定的侵害。例如,通過對用戶在微博上發(fā)表的言論和網(wǎng)購記錄進行分析,便可以準(zhǔn)確地推測出其政治傾向和消費習(xí)慣等。同時,還可以通過隱馬爾可夫模型來針對用戶出行的目的地進行推測,若這些信息被不法分子掌握,便可能對用戶的人身財產(chǎn)安全構(gòu)成嚴(yán)重的威脅。
時至今日,我國依然沒有開發(fā)出能在所有場合實現(xiàn)針對性應(yīng)用的大數(shù)據(jù)分析軟件,因為不同的投資者對信息的實際需求存在差異性,因此所使用的分析軟件也各不相同。有些投資者只需要采用電子表格便可以滿足其需求,有些投資者則必須使用許多不同的大型軟件與工具的組合方可解決問題。此外,大數(shù)據(jù)建模問題是數(shù)據(jù)分析的一項重要內(nèi)容,依靠數(shù)據(jù)分析工具可以對各種數(shù)據(jù)進行整合,從而總結(jié)出其中蘊含的規(guī)律,采取適宜的數(shù)據(jù)模型進行分析,便可以得出準(zhǔn)確的分析結(jié)果。大數(shù)據(jù)分析需要處理的數(shù)據(jù)規(guī)模極為龐大,分析當(dāng)前的實際狀況可以發(fā)現(xiàn),過去使用的模型組合已經(jīng)無法滿足當(dāng)前證券投資者對大數(shù)據(jù)分析的實際需求。
與其他行業(yè)相比,大數(shù)據(jù)分析對專業(yè)人才的需求更為迫切,大數(shù)據(jù)分析行業(yè)需要的人才資源必然屬于復(fù)合型人才,他們不但需要熟練掌握各種計算機軟件的使用方法,還需要掌握數(shù)學(xué)和統(tǒng)計學(xué)的專業(yè)知識。然而,當(dāng)前我國證券行業(yè)在培養(yǎng)與發(fā)掘復(fù)合型人才方面依然存在著顯著的問題,因此如何開展更加科學(xué)有效的人才培養(yǎng)工作,對于證券投資的發(fā)展極為重要。
因為我國在大數(shù)據(jù)領(lǐng)域的法律制度并不完善,許多企業(yè)在進行用戶數(shù)據(jù)的搜集、存儲及管理時并未得到有效的規(guī)范,而許多企業(yè)制定的內(nèi)控制度也無法充分保障用戶的信息安全。在商業(yè)化場景中,用戶應(yīng)當(dāng)能自行決定個人信息怎樣被使用。當(dāng)前,信息技術(shù)已經(jīng)取得了突破性發(fā)展并且在全國各地得到了普及,有必要完善相關(guān)領(lǐng)域的法律法規(guī),從而保障人民群眾的合法權(quán)益不受侵害。
當(dāng)前,大數(shù)據(jù)技術(shù)在各個行業(yè)的應(yīng)用自成體系。在金融行業(yè)中,銀行、保險及證券所采用的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范存在著顯著的差異性,同時其使用的數(shù)據(jù)記錄方法和會計處理方式也各不相同。因此,在進行大數(shù)據(jù)分析的過程中,企業(yè)應(yīng)當(dāng)針對數(shù)據(jù)記錄方式進行科學(xué)的規(guī)范,并制定出完善的數(shù)據(jù)質(zhì)量規(guī)范。同時,企業(yè)還應(yīng)采取適宜的手段來推動不同金融機構(gòu)之間的數(shù)據(jù)開放共享,從而構(gòu)建出金融業(yè)綜合統(tǒng)計基礎(chǔ)數(shù)據(jù)共享平臺。
大數(shù)據(jù)分析技術(shù)是計算機技術(shù)發(fā)展過程中取得的一項重大突破,為了進一步提升其應(yīng)用范疇,使其能夠在更加重要的領(lǐng)域發(fā)揮效用,企業(yè)應(yīng)當(dāng)在技術(shù)層面為信息安全提供更加充分的保障。大部分黑客都需要依靠企業(yè)存在的技術(shù)漏洞來實現(xiàn)竊取數(shù)據(jù)的目標(biāo),因此,企業(yè)必須依靠升級技術(shù)手段來解決這一問題,加大力度培養(yǎng)信息技術(shù)人才并進行信息安全技術(shù)的開發(fā)與使用,同時在后續(xù)發(fā)展的過程中將其作為企業(yè)的戰(zhàn)略規(guī)劃,為信息安全技術(shù)的開發(fā)投入更多的資金支持。易安信等企業(yè)作為世界數(shù)據(jù)存儲系統(tǒng)的寡頭,其提供的數(shù)據(jù)存儲技術(shù)為我國企業(yè)的信息安全奠定了完善的技術(shù)基礎(chǔ),并且為金融業(yè)的發(fā)展提供了高質(zhì)量的數(shù)據(jù)存儲服務(wù)。當(dāng)前,我國和美國之間展開的博弈主要集中在科技方面,美國針對我國進行的技術(shù)封鎖也讓我國深刻體會到核心技術(shù)受制于人帶來的諸多問題,因此我國金融業(yè)的發(fā)展不能完全依賴外國公司的技術(shù),而是應(yīng)當(dāng)通過發(fā)展我國的信息安全技術(shù)來為數(shù)據(jù)安全提供更加切實有效的保障。
當(dāng)前,我國已經(jīng)正式邁入大數(shù)據(jù)時代,而大數(shù)據(jù)分析在證券投資中的運用受到了金融領(lǐng)域從業(yè)者的廣泛重視。當(dāng)前,我國投資者數(shù)量的增長和各種新型技術(shù)的出現(xiàn),使得許多金融投資產(chǎn)品涌現(xiàn)出來,為此,我國需要采取大數(shù)據(jù)來發(fā)掘出金融數(shù)據(jù)中存在的各種信息,從而幫助證券投資者做出更加科學(xué)的決策。