中泰證券 李迅雷
在人人都在講大數(shù)據(jù)的時(shí)代,我們?cè)撊绾蝸砜创瓦\(yùn)用大數(shù)據(jù),當(dāng)大數(shù)據(jù)不合邏輯時(shí),究竟是相信大數(shù)據(jù)還是相信邏輯?
“大數(shù)據(jù)”是指以多元形式,通過許多來源搜集而來的龐大數(shù)據(jù)組,往往具有實(shí)時(shí)性。大約從2009年開始,“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。如美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長(zhǎng)50%,每?jī)赡瓯銓⒎环?,而目前世界?0%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。
此外,數(shù)據(jù)又并非單純指人們?cè)诨ヂ?lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時(shí)測(cè)量和傳遞著有關(guān)位置、運(yùn)動(dòng)、震動(dòng)、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價(jià)值含量、挖掘成本比數(shù)量更為重要。對(duì)于很多行業(yè)而言,如何利用這些大規(guī)模數(shù)據(jù)是成為贏得競(jìng)爭(zhēng)的關(guān)鍵。
又有人認(rèn)為大數(shù)據(jù)就是全樣本統(tǒng)計(jì),這樣理解大數(shù)據(jù)未免有點(diǎn)淺薄了,全樣本統(tǒng)計(jì)只是大數(shù)據(jù)的一種形式而已。因此,大數(shù)據(jù)的涵義要比傳統(tǒng)意義上的統(tǒng)計(jì)數(shù)據(jù)廣泛,但確實(shí)又具有統(tǒng)計(jì)數(shù)據(jù)的很多屬性,因此大數(shù)據(jù)需要通過合適的方法,才能發(fā)揮其作用。
因此,步入信息社會(huì),大數(shù)據(jù)概念的流行對(duì)于習(xí)慣于形象思維的國(guó)人是一個(gè)很好開闊眼界機(jī)會(huì),從古到今,相信奇跡的人為數(shù)不少,而相信常識(shí)或相信概率的卻不那么多。例如,為何澳門博彩業(yè)會(huì)如此繁榮,規(guī)模是拉斯維加斯的四五倍呢?就是因?yàn)椤跋嘈牌孥E(一夜暴富)”的國(guó)人太多了。
在國(guó)內(nèi),你會(huì)發(fā)現(xiàn)類似“成功學(xué)”的書特別好銷,但就“成功”本身而言,其比例一般都很低,否則就不叫成功了。也就是說,成功只能是個(gè)案,但大部分人只對(duì)成功的個(gè)案有興趣,對(duì)成功率茫然無知。
大數(shù)據(jù)比個(gè)案更有說服力,但是過度迷信大數(shù)據(jù)也有問題。以股市為例,目前A股市場(chǎng)的上市公司數(shù)量超過3000家,所有上市公司的盈利等財(cái)務(wù)數(shù)據(jù)累加起來,也構(gòu)成了大數(shù)據(jù)。
從2016年開始,上市公司的整體ROE都在上升,但為何股市的估值水平卻在下移呢?為何商品房銷量屢創(chuàng)新高,房企的盈利也出現(xiàn)了高增長(zhǎng),但房地產(chǎn)股卻大幅下跌?說明借助大數(shù)據(jù)來預(yù)測(cè)未來,必須搞清楚數(shù)據(jù)與預(yù)測(cè)對(duì)象之間的邏輯關(guān)系。其實(shí),股價(jià)應(yīng)該是領(lǐng)先指標(biāo)(或稱晴雨表),大數(shù)據(jù)則是滯后指標(biāo)。房地產(chǎn)股的下跌,或是反映了股市投資者對(duì)國(guó)內(nèi)樓市未來下跌的擔(dān)憂。
同樣,2017-18年上市企業(yè)盈利整體增速超過兩位數(shù),但不意味著2019年盈利增速不下降,當(dāng)投資者看到經(jīng)濟(jì)增速下行的長(zhǎng)期趨勢(shì),就會(huì)對(duì)企業(yè)未來的盈利前景感到擔(dān)憂。
此外,大數(shù)據(jù)總量數(shù)據(jù)固然重要,但“內(nèi)部結(jié)構(gòu)”還需要分析:為何這兩年股市中的“中小創(chuàng)”跌幅較大?是因?yàn)槠錃v史的估值水平較高,盡管其盈利增速并不低,但面臨市場(chǎng)趨向理性之后的估值水平下移壓力。
所以,盲目偏信大數(shù)據(jù)反而容易產(chǎn)生誤判,只有運(yùn)用合適邏輯分析方法,才能把大數(shù)據(jù)的結(jié)構(gòu)和特征描述清楚。例如,由于A股中大市值公司的估值水平比較低,如銀行股的利潤(rùn)總額加起來要占到所有上市公司總利潤(rùn)的一半左右,且大部分銀行的PE只有5-7倍;所有上市公司PE加權(quán)平均之后,就很低了,但從PE的中位數(shù)看,估值水平仍然不低(目前23倍左右)。
我國(guó)的成語(yǔ)中也有類似對(duì)大數(shù)據(jù)“滯后”特性的描述,如盛極而衰,表示數(shù)據(jù)雖然非常好看,但可能意味著衰退。而且,正是由于人們偏愛“用數(shù)據(jù)說話”,因此,數(shù)據(jù)作假現(xiàn)象也屢見不鮮,從而導(dǎo)致總量數(shù)據(jù)與實(shí)際相背離,或者數(shù)據(jù)之間的勾稽關(guān)系出現(xiàn)矛盾。
大數(shù)據(jù)的運(yùn)用,大部分采用歸納法——人類思維中90%以上的機(jī)率都在使用歸納法,因?yàn)闅w納法不需要運(yùn)用太多的知識(shí);不像演繹法,它先要掌握不少知識(shí)或定理,然后再據(jù)此去推理。
例如前段時(shí)間英國(guó)皇家學(xué)會(huì)前主席阿提亞爵士宣稱證明了黎曼猜想,是否真的證明了姑且不論,但證明過程所需要的深?yuàn)W專業(yè)知識(shí),肯定不是一般人所能觸及的。
事實(shí)上,西方在基礎(chǔ)研究領(lǐng)域的巨大成就,大部分都是在17世紀(jì)之后取得的,遠(yuǎn)沒有跨入大數(shù)據(jù)時(shí)代,且大部分沒有采取實(shí)驗(yàn)室研究的方式,但至今大部分成果都被廣泛應(yīng)用到社會(huì)經(jīng)濟(jì)、科技生產(chǎn)的各個(gè)領(lǐng)域。也就是說,17世紀(jì)之后,西方抽象思維得到極大發(fā)展,建立了數(shù)學(xué)、物理的科學(xué)體系,進(jìn)而又推動(dòng)了科技進(jìn)步,從而拉大了中西方在科技領(lǐng)域的差距。
相比之下,從中國(guó)歷史上所取得的科學(xué)成果看,能體現(xiàn)抽象思維的東西比較少,形式邏輯在中國(guó)沒有充分發(fā)展,春秋戰(zhàn)國(guó)時(shí)代,形式邏輯也曾有過發(fā)展,但最終卻演變成了“詭辯術(shù)”,因此,中國(guó)歷朝歷代的思維還是見長(zhǎng)于歸納法和辯證法。
由于形式邏輯、演繹法在中國(guó)五千年的漫長(zhǎng)歷史中沒有得到充分發(fā)展,這才是導(dǎo)致我國(guó)近代科技發(fā)展遲緩的根本原因,而不是所謂的制度因素。為什么哲學(xué)、宗教、文化乃至醫(yī)學(xué)等都有中西方之分,但數(shù)理化就沒有“中國(guó)數(shù)理化”而是照搬西方的呢?因?yàn)檫@些學(xué)科都不能通過經(jīng)驗(yàn)(或稱大數(shù)據(jù)歸納)、傳承或辯證法來創(chuàng)設(shè)的。
三年前,我提出要相信邏輯,不要相信奇跡(個(gè)案)。如今進(jìn)入了大數(shù)據(jù)時(shí)代,仍然提倡:在大數(shù)據(jù)面前,更要相信邏輯,雖然大數(shù)據(jù)比個(gè)案更有說服力,但大數(shù)據(jù)同樣存在失真、變異、滯后甚至被操縱的可能性。
縱觀全球各國(guó)經(jīng)濟(jì)走勢(shì),都會(huì)發(fā)生波動(dòng),盡管波動(dòng)劇烈時(shí)政府部門會(huì)采取逆周期的政策,試圖通過干預(yù)市場(chǎng)來避免發(fā)生危機(jī),但事實(shí)上卻很難避免。也有些國(guó)家盡管沒有爆發(fā)危機(jī),但其代價(jià)是往往經(jīng)濟(jì)停滯和債務(wù)高企。因此,就像價(jià)值投資理念對(duì)資本市場(chǎng)的影響一樣,邏輯產(chǎn)生作用可能會(huì)遲到,但不會(huì)缺席。
圖:2017年以來大市值公司ROE改善明顯優(yōu)于小市值公司