Gerard Francis
數(shù)據(jù)、機(jī)器學(xué)習(xí)和自然語(yǔ)言處理這三大因素正在相互融合,從根本上改變?nèi)蛸Y本市場(chǎng)投資者獲取、使用和分析可用信息的方式。
● 在數(shù)據(jù)更加易于獲取、更加多樣化但也更缺乏關(guān)聯(lián)的背景下,金融信息正在重塑投資策略
● 機(jī)器學(xué)習(xí)成為引領(lǐng)金融業(yè)未來(lái)發(fā)展的力量,為投資者提供更快、更明智、更精確的市場(chǎng)分析
● 通過(guò)即用數(shù)據(jù)可以實(shí)現(xiàn)流程自動(dòng)化、制定新的交易策略和捕捉投資信號(hào)
金融業(yè)正在經(jīng)歷前所未見的科技突破,而數(shù)據(jù)是支撐行業(yè)快速轉(zhuǎn)型的基礎(chǔ)。如今,決策者可獲取的數(shù)據(jù)無(wú)論在數(shù)量、復(fù)雜程度和多樣性方面都呈指數(shù)級(jí)增長(zhǎng),但這些數(shù)據(jù)也變得更缺乏關(guān)聯(lián)性。根據(jù)IBM統(tǒng)計(jì),當(dāng)今世界90%數(shù)據(jù)是在過(guò)去兩年中生成的。
數(shù)據(jù)(與另類數(shù)據(jù))、機(jī)器學(xué)習(xí)與自然語(yǔ)言處理這三大因素正在相互融合,這一趨勢(shì)從根本上改變了全球資本市場(chǎng)投資者獲取、使用和分析可用信息的方式,也正在重塑投資機(jī)構(gòu)的交易策略以及他們辨別商業(yè)信息的方法。
處理數(shù)據(jù)的挑戰(zhàn)——更加多樣化但更欠關(guān)聯(lián)性
金融機(jī)構(gòu)的數(shù)據(jù)池十分龐大但同時(shí)很零碎,它不僅僅包括大多數(shù)人熟悉的財(cái)報(bào)、證券價(jià)格等基本面數(shù)據(jù),還包括業(yè)務(wù)流程生成的數(shù)據(jù)(如:商業(yè)交易)、機(jī)器生成的數(shù)據(jù)(如:衛(wèi)星信息)以及非傳統(tǒng)來(lái)源的數(shù)據(jù)(如:社交媒體)。
越來(lái)越多投資者選擇采用另類數(shù)據(jù)集,借助創(chuàng)新技術(shù)專注于發(fā)現(xiàn)有用的投資信號(hào)以捕捉超額收益。如今,投資者不但要了解證券定價(jià)與財(cái)務(wù)表現(xiàn),還要分析外部圖像、供應(yīng)鏈信息、ESG因素乃至社交媒體輿情。
金融業(yè)不斷產(chǎn)生海量數(shù)據(jù),彭博每天收到的市場(chǎng)數(shù)據(jù)信息多達(dá)1千億條,另外還從12.5萬(wàn)個(gè)新聞來(lái)源接收200萬(wàn)篇新聞報(bào)道。我們通過(guò)機(jī)器學(xué)習(xí)算法和自然語(yǔ)言處理打造的預(yù)測(cè)分析工具,可以快速檢閱所有信息,篩選出對(duì)投資者最為重要的信息。
今天,市場(chǎng)參與者與金融機(jī)構(gòu)面臨的最大挑戰(zhàn)是如何識(shí)別有用的數(shù)據(jù)、如何確保收集的數(shù)據(jù)具有高質(zhì)量、連貫性、關(guān)聯(lián)性和即用性,以及如何快速分析這些數(shù)據(jù)從而做出正確的關(guān)鍵決策。
即用數(shù)據(jù)賦能自動(dòng)化
數(shù)據(jù)的爆發(fā)性增長(zhǎng)僅僅是變革與復(fù)雜性的基礎(chǔ)驅(qū)動(dòng)力??紤]到所面臨任務(wù)的艱巨程度,毫不意外地許多金融機(jī)構(gòu)都借助科技將處理流程自動(dòng)化,以更高效地管理好數(shù)據(jù),并借此生成超額收益。
機(jī)器學(xué)習(xí)在這些技術(shù)之中快速脫穎而出。自然語(yǔ)言處理和數(shù)據(jù)采集的進(jìn)步正在推動(dòng)電子交易執(zhí)行平臺(tái)的交易自動(dòng)化;多家機(jī)構(gòu)選擇借助大數(shù)據(jù)與機(jī)器學(xué)習(xí)預(yù)測(cè)客戶需求與價(jià)格波動(dòng)。
以買方機(jī)構(gòu)為例,對(duì)沖基金與資產(chǎn)管理公司可使用預(yù)測(cè)分析工具,基于市場(chǎng)流動(dòng)性評(píng)估風(fēng)險(xiǎn)。隨著更多的工作流程自動(dòng)化,專業(yè)金融人士將更多的注意力放在注重認(rèn)知能力的工作上,包括策略和投資組合篩選以及投資理論制定。他們?cè)噲D通過(guò)這樣的方式解決金融領(lǐng)域的眾多問(wèn)題,打造更優(yōu)良的信息系統(tǒng)支持交易和客戶溝通工作。
彭博最近在悉尼、新加坡、東京和孟買舉行了以“解碼機(jī)器學(xué)習(xí)”為主題的研討會(huì),發(fā)現(xiàn)多數(shù)專業(yè)人士已經(jīng)開始利用機(jī)器學(xué)習(xí)發(fā)現(xiàn)投資信號(hào)和因子,優(yōu)化執(zhí)行策略以提高交易效率。在上述四個(gè)亞太市場(chǎng)當(dāng)中,日本在將機(jī)器學(xué)習(xí)應(yīng)用于交易模型方面最為先進(jìn),在投資策略中利用的數(shù)據(jù)也是最為多樣化。有鑒于此,我們正在加速投入以發(fā)掘機(jī)器學(xué)習(xí)的潛力。
高質(zhì)量數(shù)據(jù)在機(jī)器學(xué)習(xí)時(shí)代至關(guān)重要
15年前,金融信息與數(shù)據(jù)行業(yè)向電子交易轉(zhuǎn)型,隨后又發(fā)展出了高頻交易和算法交易。今天,我們正在步入機(jī)器學(xué)習(xí)與人工智能的信息時(shí)代,數(shù)據(jù)賦能自動(dòng)化、創(chuàng)新交易策略,并發(fā)掘前所未有的洞察。
在機(jī)器學(xué)習(xí)時(shí)代,金融數(shù)據(jù)與信息將更加豐富,而且也更加可測(cè)和更具條理。彭博作為領(lǐng)先的金融信息公司,將數(shù)據(jù)標(biāo)準(zhǔn)化為“整潔格式”(tidy formats),通過(guò)提供標(biāo)準(zhǔn)化歷史數(shù)據(jù)使分析變得更加容易,從而提升效率也更便于互相參考。
我們新推出的數(shù)據(jù)接入平臺(tái)網(wǎng)站——彭博企業(yè)數(shù)據(jù)接入站點(diǎn)(BEAP)通過(guò)便于操作、易于建模和可視化的方式,幫助客戶探索大批量數(shù)據(jù)集并與之互動(dòng)。最近,我們還向BEAP增加了20多套另類數(shù)據(jù)集,來(lái)源同時(shí)包括彭博和市場(chǎng)領(lǐng)先的另類數(shù)據(jù)提供商,內(nèi)容涵蓋金屬存貨洞察、股票相關(guān)博客情緒、藥品審批、消費(fèi)人流量和停車場(chǎng)數(shù)據(jù)、建筑許可、地緣政治風(fēng)險(xiǎn)以及APP使用率等。 投資機(jī)構(gòu)希望可以靈活應(yīng)用這些數(shù)據(jù),所以我們正努力做到何時(shí)何地都能夠遞送數(shù)據(jù)。數(shù)據(jù)將成為一種服務(wù),而未來(lái)的平臺(tái)會(huì)更加輕量化且具有移動(dòng)性。
機(jī)器學(xué)習(xí)從本質(zhì)上說(shuō)是由數(shù)據(jù)驅(qū)動(dòng)的,投資者應(yīng)用機(jī)器學(xué)習(xí)可以快速掌握紛繁復(fù)雜的關(guān)系;從而應(yīng)對(duì)之前因?yàn)槭苤朴跀?shù)據(jù)之間的復(fù)雜關(guān)系、問(wèn)題的復(fù)雜性,以及數(shù)據(jù)或計(jì)算資源的可獲得性而無(wú)從入手的問(wèn)題。
科技日益進(jìn)步的今天,讓機(jī)器學(xué)習(xí)發(fā)揮更大價(jià)值需要高質(zhì)量、互相關(guān)聯(lián)并可付諸應(yīng)用的數(shù)據(jù)。在機(jī)器學(xué)習(xí)時(shí)代,能夠領(lǐng)悟這一點(diǎn),并有效執(zhí)行數(shù)據(jù)驅(qū)動(dòng)策略的機(jī)構(gòu)將成為最終贏家。
(作者Gerard Francis是彭博企業(yè)數(shù)據(jù)業(yè)務(wù)全球負(fù)責(zé)人)