姜疆
大數(shù)據(jù)時代對數(shù)據(jù)的挖掘、處理和分析的方式,對于傳統(tǒng)的宏觀經(jīng)濟(jì)分析,無疑是一次大的革新
在新常態(tài)下,我國經(jīng)濟(jì)面臨的形勢和任務(wù)更加復(fù)雜艱巨,政府宏觀決策對宏觀經(jīng)濟(jì)分析的準(zhǔn)確性和時效性提出了更高的要求。隨著大數(shù)據(jù)時代的到來,借助大規(guī)模數(shù)據(jù)生產(chǎn)、分享和利用,以嶄新的思維和技術(shù)去分析,將揭示海量數(shù)據(jù)背后所隱藏的宏觀經(jīng)濟(jì)運(yùn)行模式。
大數(shù)據(jù)方法和技術(shù)不僅可以被深度地應(yīng)用在微觀分析、行業(yè)研究領(lǐng)域,也可以運(yùn)用在宏觀決策之中。未來,大數(shù)據(jù)既是企業(yè)占領(lǐng)市場、贏得機(jī)遇的利器,也是政府進(jìn)行宏觀調(diào)控、國家治理、社會管理的信息基礎(chǔ)。而大數(shù)據(jù)時代對數(shù)據(jù)的挖掘、處理和分析的方式,對于傳統(tǒng)的宏觀經(jīng)濟(jì)分析,無疑是一次大的革新。
大數(shù)據(jù)應(yīng)用于宏觀經(jīng)濟(jì)分析的趨勢
傳統(tǒng)的宏觀經(jīng)濟(jì)分析通常是通過對比主要宏觀經(jīng)濟(jì)指標(biāo)、建立宏觀經(jīng)濟(jì)計量模型、仿真宏觀經(jīng)濟(jì)動力系統(tǒng),對宏觀經(jīng)濟(jì)形勢及未來發(fā)展趨勢進(jìn)行判斷與預(yù)測。
在當(dāng)前的大數(shù)據(jù)時代,越來越多的宏觀經(jīng)濟(jì)政策制定者和相關(guān)專家學(xué)者都已經(jīng)意識到,大數(shù)據(jù)對宏觀經(jīng)濟(jì)分析有著革命性的影響。目前,在宏觀經(jīng)濟(jì)分析及預(yù)測中運(yùn)用大數(shù)據(jù)方面,無論是國外還是國內(nèi),從新型宏觀經(jīng)濟(jì)指數(shù)構(gòu)建,到建立新型大數(shù)據(jù)宏觀經(jīng)濟(jì)預(yù)測模型,各方面都取得了一定的進(jìn)展。
早期大數(shù)據(jù)在宏觀經(jīng)濟(jì)分析領(lǐng)域的應(yīng)用,主要集中在建立新的宏觀經(jīng)濟(jì)指數(shù),以便更加準(zhǔn)確的反應(yīng)宏觀經(jīng)濟(jì)運(yùn)行狀況。這方面的工作主要基于個人的交易記錄,包括像一些歐洲國家將銷售點(diǎn)掃描數(shù)據(jù)納入CPI指數(shù)編制。
特別引起關(guān)注的是麻省理工學(xué)院的經(jīng)濟(jì)學(xué)家利用網(wǎng)上購物交易數(shù)據(jù)創(chuàng)建的BBP項目 (Billion Prices Project),基于不斷變化的一籃子商品所計算的日度通脹指數(shù)。這種實時的通貨膨脹指數(shù)能夠比相應(yīng)的官方數(shù)據(jù)更好地反映實際經(jīng)濟(jì)運(yùn)行的情況。當(dāng)年,在雷曼兄弟公司倒閉后,BPP 的數(shù)據(jù)顯示,大部分美國企業(yè)幾乎立刻開始削減價格,這就表明總需求已經(jīng)減弱。而相比之下,官方通脹機(jī)構(gòu)公布的數(shù)據(jù)直到當(dāng)年11月,即在10月CPI數(shù)據(jù)公布后,才對通貨緊縮有所反應(yīng)。
“企業(yè)發(fā)展工商指數(shù)”是宏觀經(jīng)濟(jì)分析領(lǐng)域中典型的大數(shù)據(jù)應(yīng)用案例,也是我國政府在大數(shù)據(jù)挖掘領(lǐng)域的首創(chuàng)成果。該指數(shù)包括10 個對宏觀經(jīng)濟(jì)具有顯著先行性的指標(biāo),可以提前1~2 個季度預(yù)測宏觀經(jīng)濟(jì)發(fā)展趨勢。它改變了傳統(tǒng)的抽樣統(tǒng)計方式,利用大數(shù)據(jù)挖掘技術(shù),對工商全量、動態(tài)的全國企業(yè)登記數(shù)據(jù)進(jìn)行分析,發(fā)掘大數(shù)據(jù)價值,并采用合成企業(yè)發(fā)展工商指數(shù),以判斷宏觀經(jīng)濟(jì)走勢。
除了宏觀經(jīng)濟(jì)分析與預(yù)測方面相關(guān)指數(shù)的建構(gòu),從宏觀經(jīng)濟(jì)分析與預(yù)測研究的國際趨勢看,使用大數(shù)據(jù)集,建構(gòu)監(jiān)測預(yù)測的模型,進(jìn)行經(jīng)濟(jì)預(yù)測越來越廣泛,逐漸成為很多國家央行進(jìn)行經(jīng)濟(jì)預(yù)測的新方法和新工具。
在應(yīng)用互聯(lián)網(wǎng)大數(shù)據(jù)進(jìn)行經(jīng)濟(jì)分析及預(yù)測中,使用網(wǎng)絡(luò)搜索引擎或網(wǎng)絡(luò)社交媒體記錄的關(guān)鍵詞,會有數(shù)據(jù)獲取及時、樣本統(tǒng)計意義明顯等優(yōu)勢,預(yù)測精度較高。
Google Trends每天都在產(chǎn)生大量與經(jīng)濟(jì)發(fā)展相關(guān)的查詢結(jié)果,且這些查詢結(jié)果與當(dāng)下的經(jīng)濟(jì)活動之間必然存在著不容忽視的關(guān)系,或許可以對預(yù)測當(dāng)下的經(jīng)濟(jì)活動起到非常重要的作用。并且,在此基礎(chǔ)上,Choi H. &. Varian H.(2016)舉例說明了如何利用Google Trends預(yù)測美國零售業(yè)、汽車、住房和旅游的銷售情況。
還有相關(guān)機(jī)構(gòu)引用專業(yè)數(shù)據(jù)分析軟件公司SAS的研究數(shù)據(jù),以社交網(wǎng)絡(luò)活躍度增長作為失業(yè)率上升的早期征兆,幫助政府判斷就業(yè)形勢和經(jīng)濟(jì)狀況,以更好地制定經(jīng)濟(jì)政策。在社交網(wǎng)絡(luò)上,網(wǎng)民們更多地談?wù)摗拔业能嚪旁谲噹煲呀?jīng)快兩周了”、“我這周只去了一次超市”這些話題時,顯示網(wǎng)民可能面臨巨大的失業(yè)壓力;當(dāng)網(wǎng)民開始討論“我要出租房屋”、“我準(zhǔn)備取消度假”這些話題時,顯示出這些網(wǎng)民可能已經(jīng)失業(yè),面臨巨大的生存壓力,這些指標(biāo)是失業(yè)后的滯后標(biāo)志性指標(biāo)。
樣本統(tǒng)計轉(zhuǎn)為總體普查
大數(shù)據(jù)的發(fā)展對于宏觀經(jīng)濟(jì)分析最為顯著的積極影響,莫過于使宏觀經(jīng)濟(jì)分析從樣本統(tǒng)計時代走向總體普查時代。大數(shù)據(jù)時代的宏觀經(jīng)濟(jì)分析中,傳統(tǒng)的樣本假設(shè)方式被拋棄,轉(zhuǎn)而以真實的海量數(shù)據(jù)來進(jìn)行計算機(jī)的自動分析。
我們知道,傳統(tǒng)的經(jīng)濟(jì)分析包括經(jīng)濟(jì)計量分析是建立在抽樣統(tǒng)計基礎(chǔ)之上的,在傳統(tǒng)的抽樣統(tǒng)計分析中,往往以假設(shè)檢驗為基本模式,依靠的數(shù)據(jù)主要是樣本,將樣本假設(shè)為整體,然而,這種分析往往與事實存在或多或少的出入。
與傳統(tǒng)宏觀經(jīng)濟(jì)分析總是局限于小規(guī)模樣本數(shù)據(jù)有所不同,在大數(shù)據(jù)時代,隨著信息覆蓋范圍和數(shù)據(jù)量迅速提升,數(shù)據(jù)樣本的體量會極大地提高,甚至可以達(dá)到樣本即總體的程度。例如,就物價而言,每一筆在電子商務(wù)網(wǎng)站成交的交易信息都能記錄在案。這樣的情況下,宏觀經(jīng)濟(jì)分析的可靠性必然大大加強(qiáng)。
同時,隨著信息量的極大拓展和處理信息能力的極大提高,使得宏觀經(jīng)濟(jì)的分析不再局限于傳統(tǒng)的統(tǒng)計分析模式,而是將抽樣分析轉(zhuǎn)變?yōu)榭傮w分析。這一點(diǎn)對宏觀經(jīng)濟(jì)分析意義重大,因為宏觀經(jīng)濟(jì)系統(tǒng)紛繁復(fù)雜,如果能將對整體宏觀經(jīng)濟(jì)變量的分析建立在盡可能多的關(guān)于經(jīng)濟(jì)主體行為的信息以及其他諸多經(jīng)濟(jì)變量的信息的基礎(chǔ)上,無疑將會極大地提高宏觀經(jīng)濟(jì)分析的準(zhǔn)確性。
基于推特(Twitter)平臺表達(dá)的公共情緒用來預(yù)測股市變動,是很典型的例子。2008年3月到12月長達(dá)九個月間,270萬Twitter用戶推送的多達(dá)970萬條的消息,經(jīng)過情緒評估工具——Opinion Finder 和GPOMS 被分別賦值并評估為“積極”與“消極”兩種情緒和“calm(冷靜)”、“alert(警覺)”、“ sure(確信)”、“vital(活潑)”、“kind(美好)”、“happy(高興)”六種情緒。結(jié)果發(fā)現(xiàn),在道瓊斯工業(yè)平均指數(shù)和GPOMS中的“calm(冷靜)”情緒之間存在相關(guān)性。進(jìn)一步研究發(fā)現(xiàn),“calm(冷靜)”情緒可以很好地預(yù)測道瓊斯工業(yè)平均指數(shù)在未來2到6天的漲跌情況,而且這種每日預(yù)測的準(zhǔn)確率高達(dá)到87.6%。
大數(shù)據(jù)時代,可獲得大而全的可得數(shù)據(jù),甚至可拋棄原有的假設(shè)檢驗的模式,這些優(yōu)勢是傳統(tǒng)經(jīng)濟(jì)分析方法無法想象和實現(xiàn)的,無疑將會極大地提高宏觀經(jīng)濟(jì)分析的準(zhǔn)確性和可信度,不僅可以更加準(zhǔn)確了解宏觀經(jīng)濟(jì)形勢,還有利于正確做出宏觀經(jīng)濟(jì)發(fā)展的預(yù)測,從而更加合理地制定宏觀經(jīng)濟(jì)政策。
變量個數(shù)無限增多
在當(dāng)前大數(shù)據(jù)時代,數(shù)據(jù)的可得性和多樣性導(dǎo)致樣本量無限增大,同時變量個數(shù)無限增多,這有利于應(yīng)用大量模型進(jìn)行研究,并應(yīng)用完備的數(shù)據(jù)信息,提高預(yù)測的準(zhǔn)確性。
經(jīng)濟(jì)預(yù)測模型可以分為兩類:一是傳統(tǒng)的小模型預(yù)測,這類模型往往通過建立時間序列、橫截面或面板方程來進(jìn)行經(jīng)濟(jì)分析。傳統(tǒng)的小模型預(yù)測的特點(diǎn)是僅使用較少的變量,像VAR模型的變量個數(shù)通常小于10個。二是大模型預(yù)測,這類模型往往使用成百上千個變量,因而大模型預(yù)測利用的信息非常豐富。
小模型預(yù)測理論比較成熟、方法相對簡單。但是,小模型預(yù)測有天然的缺陷,那就是變量的完整通常是不可能的,而預(yù)測的效果受限于其所使用的變量。
使用小模型進(jìn)行預(yù)測時必須仔細(xì)挑選預(yù)測變量,然而仁者見仁智者見智,無論是根據(jù)理論還是根據(jù)經(jīng)驗進(jìn)行變量的選擇,其過程必然會存在差異,其結(jié)果也更是可想而知,而且甚至?xí)a(chǎn)生一些爭議。比如,基于菲利普斯曲線預(yù)測通脹時,有的研究使用失業(yè)率作為預(yù)測變量,也有研究使用GDP缺口或者產(chǎn)能利用率。
清華大學(xué)經(jīng)濟(jì)學(xué)研究所所長劉濤雄教授就指出,由于模型變量選擇、參數(shù)設(shè)置、估計方法以及滯后期選擇等的不同,預(yù)測結(jié)果會產(chǎn)生很大的偏差。
小模型預(yù)測方法這一天然的局限是很難調(diào)和的,主要是因為數(shù)據(jù)樣本有限而導(dǎo)致增加很多變量不可行。這使小模型預(yù)測的結(jié)論往往和經(jīng)濟(jì)現(xiàn)實嚴(yán)重脫節(jié)。我們很難想象中央銀行會僅僅根據(jù)少數(shù)幾個變量進(jìn)行宏觀預(yù)測,并據(jù)此做出決策。即便是一家企業(yè)也不會如此草率。
通過大數(shù)據(jù)挖掘,可以使得變量大大增加。這就為經(jīng)濟(jì)預(yù)測從小模型預(yù)測轉(zhuǎn)變?yōu)榇竽P皖A(yù)測創(chuàng)造了條件,應(yīng)用大量模型進(jìn)行分析及預(yù)測,可以應(yīng)用完備的數(shù)據(jù)信息,從而提高預(yù)測的準(zhǔn)確性。
在美國,銀行通常依靠FICO得分做出貸款與否的決定,F(xiàn)ICO分大概有15-20個變量,諸如信用卡的使用比率、有無未還款的記錄等。而一家名為ZestCash的金融機(jī)構(gòu),在決定是否向客戶放貸的時,分析的卻是數(shù)千個信息線索。ZestCash正是依靠其強(qiáng)大的對于大數(shù)據(jù)的處理和分析能力,形成了其獨(dú)特的核心競爭力。
未必因果關(guān)系 而是相關(guān)關(guān)系
傳統(tǒng)的經(jīng)濟(jì)計量分析以尋找相關(guān)事物(變量)的因果關(guān)系為核心,而大數(shù)據(jù)條件下的經(jīng)濟(jì)分析通常則著眼于挖掘相關(guān)事物(變量)的相關(guān)關(guān)系。
在復(fù)雜的宏觀經(jīng)濟(jì)系統(tǒng)中,許多經(jīng)濟(jì)變量的因果關(guān)系往往難以準(zhǔn)確檢驗,或者因果結(jié)論經(jīng)常廣受質(zhì)疑。然而,在如今的大數(shù)據(jù)時代,更加重視可靠相關(guān)關(guān)系的發(fā)掘,并且充分利用相關(guān)關(guān)系對于經(jīng)濟(jì)預(yù)測、經(jīng)濟(jì)政策制定與評估的作用,則無疑為宏觀經(jīng)濟(jì)分析打開了另一片廣闊的空間。
在“小數(shù)據(jù)”時代,宏觀經(jīng)濟(jì)中的因果關(guān)系分析其實并不容易,耗費(fèi)的精力大、時間多。特別是,要從建立假設(shè)開始,進(jìn)而不斷地進(jìn)行一系列假設(shè)的實驗,而一個個假設(shè)要么被證實,要么被推翻。不過,無論被證實還是被推翻,由于二者都始于假設(shè),這些分析就都有受偏見的可能,所以極易導(dǎo)致錯誤。
同時,由于計算機(jī)能力的不足,在小數(shù)據(jù)時代,大部分相關(guān)事物(變量)關(guān)系的分析局限于尋求線性關(guān)系。然而,實際上的情況要復(fù)雜得多,在現(xiàn)實宏觀經(jīng)濟(jì)中,總能夠發(fā)現(xiàn)的是相關(guān)事物(變量)的“非線性關(guān)系”。
當(dāng)然,在小數(shù)據(jù)世界的宏觀經(jīng)濟(jì)分析中,相關(guān)關(guān)系也是存在并有價值的;不過,在大數(shù)據(jù)時代的宏觀經(jīng)濟(jì)分析中,相關(guān)關(guān)系才將大放異彩。維克托·邁爾-舍恩伯格與肯尼思·庫克耶(Victor?Mayer-Schonberger &. Kenneth?Cukier)認(rèn)為,建立在相關(guān)關(guān)系分析基礎(chǔ)上的預(yù)測是大數(shù)據(jù)的核心。通過應(yīng)用相關(guān)關(guān)系,可以比之前更容易、更快捷、更清楚地分析事物(變量)。
英國華威商學(xué)院為預(yù)測股市的漲跌,使用谷歌趨勢(Google Trends)共計追蹤了98個搜索關(guān)鍵詞。這中包括“債務(wù)”、“股票”、“投資組合”、“失業(yè)”、“市場”等與投資行為相關(guān)的詞,也包括“生活方式”、“藝術(shù)”、“快樂”、“戰(zhàn)爭”、“沖突”、“政治”等與投資無關(guān)的關(guān)鍵詞。結(jié)果發(fā)現(xiàn)有些詞條,諸如“債務(wù)”,成為預(yù)測股市的主要關(guān)鍵詞。
“谷歌流感趨勢”為預(yù)測季節(jié)性流感的暴發(fā),對2003年和2008年間的5000萬最常搜索的詞條進(jìn)行大數(shù)據(jù)“訓(xùn)練”,試圖發(fā)現(xiàn)某些搜索詞條的地理位置是否與美國流感疾病預(yù)防和控制中心的數(shù)據(jù)相關(guān)。
谷歌并沒有直接推斷哪些查詢詞條是最好的指標(biāo),相反,為了測試這些檢索詞條,谷歌總共處理了4.5億個不同的數(shù)字模型。將得出的預(yù)測與2007年和2008年美國疾控中心記錄的實際流感病例進(jìn)行對比后,谷歌公司發(fā)現(xiàn),它們的大數(shù)據(jù)處理結(jié)果發(fā)現(xiàn)了45條檢索詞條的組合,將它們用于特定的數(shù)學(xué)模型,預(yù)測結(jié)果與官方數(shù)據(jù)的相關(guān)性高達(dá)97%。
在大數(shù)據(jù)時代來臨之前,盡管相關(guān)關(guān)系已被充分證明大有用途,可是相關(guān)關(guān)系的應(yīng)用很少。這是因為用來做相關(guān)關(guān)系分析的數(shù)據(jù)同用來做因果關(guān)系分析的數(shù)據(jù)一樣,也很少,也不容易得到,并且收集有關(guān)的數(shù)據(jù),在過去相對來說,也費(fèi)時費(fèi)力,也會耗資巨大。不過現(xiàn)如今,可用的數(shù)據(jù)如此之多,也就不存在這樣的難題了。特別是現(xiàn)在,有關(guān)專家們正在研發(fā)能發(fā)現(xiàn)并對比分析“非線性關(guān)系”的必要工具。總之,一系列飛速發(fā)展的新技術(shù)和新軟件從多方面提高了有關(guān)分析工具發(fā)現(xiàn)宏觀經(jīng)濟(jì)變量相關(guān)關(guān)系的能力,這就好比立體畫法可同時從多個角度來表現(xiàn)人物或事物。
在大數(shù)據(jù)時代,這些新的分析工具和思路為我們提供了一系列新的視野和有用的預(yù)測,使我們看到了很多以前不曾注意到的宏觀經(jīng)濟(jì)中的聯(lián)系,掌握了以前無法理解的復(fù)雜的國民經(jīng)濟(jì)動態(tài)。
時滯變即期
目前對宏觀經(jīng)濟(jì)的分析研究所采用的資料,主要依賴于各種統(tǒng)計調(diào)查系統(tǒng)發(fā)布的統(tǒng)計數(shù)據(jù),但面臨的最明顯的缺陷之一便在于關(guān)于宏觀經(jīng)濟(jì)統(tǒng)計的數(shù)據(jù)具有很強(qiáng)的時滯性。而大數(shù)據(jù)經(jīng)濟(jì)模型可以充分利用數(shù)據(jù)的實時性,提高分析或預(yù)測的時效性,為經(jīng)濟(jì)預(yù)警和政策制定提供最快速的資料和依據(jù)。
一般來說,依賴統(tǒng)計部門的宏觀經(jīng)濟(jì)數(shù)據(jù)的發(fā)布都存在時間滯后的問題。由于不能及時獲取宏觀經(jīng)濟(jì)發(fā)展的數(shù)據(jù)信息,也就不能對當(dāng)下的宏觀經(jīng)濟(jì)形勢作出準(zhǔn)確判斷。例如,政府公布的季度GDP 往往會有1個月的滯后期,而反映全面經(jīng)濟(jì)社會狀況的統(tǒng)計年鑒的滯后期會達(dá)到3個月左右,這對及時了解宏觀經(jīng)濟(jì)形勢、預(yù)測與預(yù)警都是非常不利的,基于此統(tǒng)計進(jìn)行的預(yù)測甚至被認(rèn)為助長了宏觀經(jīng)濟(jì)波動。
在互聯(lián)網(wǎng)技術(shù)的輔助下相關(guān)宏觀經(jīng)濟(jì)的分析部門能夠快速地收集到主要宏觀經(jīng)濟(jì)發(fā)展數(shù)據(jù),如全社會的用電量、全社會的商品銷售總額以及商品房的購買量等。這些大數(shù)據(jù)的獲取時間較短,有的數(shù)據(jù)甚至是立即可以獲得。
而隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的發(fā)展,產(chǎn)生了大量的即時傳播數(shù)據(jù),如企業(yè)通過微博、微信第一時間發(fā)布產(chǎn)品、人事等重要信息; 普通用戶實時針對特定事件或?qū)ο蟀l(fā)表見解和態(tài)度,等等。
這些即時傳播的非結(jié)構(gòu)化數(shù)據(jù)對宏觀經(jīng)濟(jì)的走勢也產(chǎn)生了重要影響。通過大數(shù)據(jù)軟件處理平臺,可以實時追蹤和搜集這些即時數(shù)據(jù),并快速對數(shù)據(jù)進(jìn)行分析和處理,從而提高宏觀經(jīng)濟(jì)的時效性,為經(jīng)濟(jì)活動參與者贏得決策時間。
在日本北九州市八幡東區(qū)東田地區(qū)實行的“八幡東區(qū)綠色鄉(xiāng)村構(gòu)想”中,日本IBM公司除了設(shè)立城市整體能源管理系統(tǒng)、綜合性移動管理系統(tǒng)外,還參與了控制整個城市的城市指揮中心建設(shè)。得益于該公司處理和分析大數(shù)據(jù)的高效工作,當(dāng)?shù)匦姓C(jī)關(guān)可以實時掌握城市能源的情況,并將分析的結(jié)果同氣象信息結(jié)合,詳細(xì)預(yù)測48小時之后電力等能源的供需狀況。如果發(fā)現(xiàn)將有電力不足的情況發(fā)生,行政部門可直接采取抑制電力消費(fèi)或讓電動汽車釋放電能等措施,提前進(jìn)行預(yù)防。
近來,在利用大數(shù)據(jù)對宏觀經(jīng)濟(jì)進(jìn)行預(yù)測方面,“現(xiàn)時預(yù)測(Now Casting)”受到特別關(guān)注?!艾F(xiàn)時預(yù)測”一詞最初起源于氣象學(xué)領(lǐng)域,是對現(xiàn)在已經(jīng)發(fā)生的事由于信息發(fā)布滯后等原因難以馬上知道準(zhǔn)確情況,因而根據(jù)其他可得信息進(jìn)行推測。
目前“現(xiàn)時預(yù)測”的主要應(yīng)用范圍為預(yù)測通脹指數(shù)、GDP,基礎(chǔ)信息可以為消費(fèi)數(shù)據(jù),如私人消費(fèi),或其他與產(chǎn)出相關(guān)的變量,如工業(yè)產(chǎn)出?!艾F(xiàn)時預(yù)測”基本原理是充分挖掘比目標(biāo)變量頻率更高的歷史基礎(chǔ)信息,以在官方數(shù)據(jù)公布前獲得目標(biāo)變量的提前估計量,這對政府了解宏觀經(jīng)濟(jì)情況制定經(jīng)濟(jì)政策有很大的作用。