龔慧明
(南方出版?zhèn)髅焦煞萦邢薰荆?廣東 廣州 510075)
自Shefrin and Statman(1985)提出處置效應(yīng)(Disposition Effect),學(xué)術(shù)界對其產(chǎn)生原因和機(jī)理進(jìn)行了諸多研究論證,尤其是利用Kahneman & Tversky(1979)提出的前景理論(Prospect Theory),可以得到較為完美的闡釋。處置效應(yīng)是指投資者廣泛存在著過早賣出盈利股票而長期持有虧損股票的傾向,是一種典型的投資者行為偏差。作為前景理論核心概念之一的損失厭惡(Loss Aversion) 指出,人們面對收益時傾向于風(fēng)險規(guī)避,面對損失時傾向于風(fēng)險追逐。
可見,損失厭惡與處置效應(yīng)現(xiàn)象完全一致,盈利股票屬于收益范疇,面對盈利股票亦即收益,采用風(fēng)險規(guī)避策略而賣出股票。虧損股票則屬于損失范疇,面對虧損股票以及損失,則采用風(fēng)險追逐策略而長期持有。
McFarlane and Pliner(1997)從進(jìn)化的角度提出了損失厭惡是人類在進(jìn)化過程中獲得的一種適應(yīng)性心理本能。Breiter 等(2001)認(rèn)為這種適應(yīng)性本能通過杏仁核及邊緣系統(tǒng)的長期記憶功能,以可遺傳再現(xiàn)的情緒形式影響人們的風(fēng)險決策行為。因此,損失厭惡則是進(jìn)化過程中形成的心理本能,在進(jìn)化適應(yīng)環(huán)境(EEA,Environment of Evolutionary Adaptation)中更具優(yōu)勢的生存和繁衍策略,處置效應(yīng)則是損失厭惡在股票市場的體現(xiàn)。
但在股票市場中,也有很多投資者在賺取豐厚利潤的同時惜售、在嚴(yán)重虧損的時候斬倉,出現(xiàn)處置效應(yīng)的反轉(zhuǎn)行為。比如2007 年中國石油A 股上市當(dāng)天每股價格沖高至48 元,很多打新中簽的投資者獲得3 倍盈利仍然不愿賣出,直至跌到8 元卻又忍痛割愛。王曉田(2008)提出的三參照點(diǎn)理論,對前景理論的損失厭惡參照點(diǎn)進(jìn)行了拓展,對相關(guān)行為的解釋廣度得到加強(qiáng),但對其形成機(jī)制未做分析,未找出解釋行為的進(jìn)化原因。
本文在現(xiàn)有研究的基礎(chǔ)上,繼續(xù)從進(jìn)化角度出發(fā),利用博弈論工具對損失厭惡心理模塊的進(jìn)化成因進(jìn)行分析,并在人類的進(jìn)化適應(yīng)環(huán)境(EEA)下拓展博弈預(yù)期收益,進(jìn)而解釋了從處置到惜售、從持有到斬倉的異常交易行為。
人類進(jìn)化適應(yīng)環(huán)境(EEA)是指人類進(jìn)化所適應(yīng)的環(huán)境,是自然選擇發(fā)揮作用的環(huán)境,是人類祖先生存的環(huán)境。從人類進(jìn)化史看,大腦需要更多能量,能夠獲取更多能量的策略對于進(jìn)化是有優(yōu)勢的;人類大腦從400 毫升到900 毫升再到1200 毫升的這400 萬年,肯定是人類大腦及相關(guān)心理模塊進(jìn)化的EEA。為簡化起見,我們不對食物進(jìn)行過多分類,而以能量為標(biāo)準(zhǔn),并假設(shè)采用風(fēng)險規(guī)避策略(不冒險策略)獲得的食物能量較低,而采用風(fēng)險追逐策略(冒險策略)獲得食物的能量較高,且獲得較高能量的祖先更具進(jìn)化優(yōu)勢。
在這樣的前提下,假設(shè)僅有兩名祖先的情形:若通過較為安全的方式即選擇不冒險策略獲得食物,如塊莖、根莖、野果、小動物等等,可滿足基本的能量需求,其收益為a,并假設(shè)a 對應(yīng)1 人份基本能量需求,是人體所需的最低能量。如果選擇冒險策略獲得食物帶來更多的能量,則得到一個新的收益,設(shè)為b(b>a),但要付出努力的成本(比如需要付出更多的體力、智力,消耗更多的能量等),設(shè)為c。而一旦冒險,原本可以穩(wěn)定得到的食物會被不冒險的祖先所獲得,于是不冒險的祖先反而得到2 人份基本能量需求。但如果兩個祖先都選擇冒險,仍然還能得到原來的1 人份基本能量需求,則博弈結(jié)構(gòu)如表1。
表1
此時,博弈可能存在兩個均衡:(2a,b-c)和(b-c,2a),滿足條件是b-c>a,即冒險帶來的額外收益足夠超過1 人份基本能量需求。結(jié)果是,有人冒險,有人不冒險。但冒險獲取食物和能量,其收益存在不確定性(收益風(fēng)險),有時即使付出了努力和能量也找不到食物。更重要的,還會遇到豺狼虎豹等猛獸天敵,命喪黃泉,而這種威脅才是最大的風(fēng)險(環(huán)境風(fēng)險),并且不是付出努力和成本就可以解決的風(fēng)險,于是c 升格為C,b-C 可能小于0,祖先陷入類似的“囚徒困境”,不會有人愿意冒險。不過,冒險也不一定總會碰上豺狼虎豹,環(huán)境風(fēng)險具有不確定性。假設(shè)環(huán)境風(fēng)險的不確定性概率為q,暫時假設(shè)收益風(fēng)險下的收益概率為1,則博弈結(jié)構(gòu)變成表2 所示。
表2
當(dāng)b-qC>a,即q<(b-a)../c,也會如表1 所示,出現(xiàn)兩個均衡。
為便于理解,我們假設(shè)a=2,b=5(滿足b=2.5a,比2a再多50%額外收益),C=6(滿足條件b-C<0);再考慮風(fēng)險概率為q(0<q<1),則:當(dāng)q<50%的時候,出現(xiàn)兩個均衡。也即是,風(fēng)險q 要滿足小于50%,才有可能采取冒險策略;否則,陷入囚徒困境。可以設(shè)想,在400 萬年前的進(jìn)化階段,受制于腦容量和工具的殘酷現(xiàn)實(shí),祖先抵御肉食動物的能力很弱,冒險的行為大概率被肉食動物獵殺,在q>50%的情況下,祖先絕不會冒險獲取食物。除非能量收益b 很大,但能量收益b 則受身體對能量的需求上限制約,不會無限向上。在這樣的進(jìn)化環(huán)境下,經(jīng)過自然選擇的人類心理模塊自然是風(fēng)險規(guī)避的,這就是人類面對收益時采用風(fēng)險規(guī)避策略的心理模塊產(chǎn)生的進(jìn)化原因。這里需要進(jìn)一步說明的是,根據(jù)博弈結(jié)構(gòu),面對收益所面臨的實(shí)際上是“損失”預(yù)期,并且是可能危及生存和基本能量需求的損失預(yù)期,是現(xiàn)有的收益和未來可能損失預(yù)期之間的權(quán)衡,因?yàn)楝F(xiàn)有收益沒有變化,在博弈策略選擇中起作用的顯然是對損失的預(yù)期。
同時,在人類進(jìn)化過程中,多次出現(xiàn)生存瓶頸,惡劣的環(huán)境導(dǎo)致食物急劇減少,獲得食物越來越難。當(dāng)祖先已經(jīng)無法獲得基本能量需求時,情況會怎么樣呢?假設(shè)a 從原來的2 降到了1,則:當(dāng)5-6q>1,q<66.67%時,出現(xiàn)兩個均衡,否則,陷入囚徒困境,不再冒險。但這時冒險策略的可承受概率q 增大,承受環(huán)境風(fēng)險能力增強(qiáng)。當(dāng)食物繼續(xù)減少,聚居地已經(jīng)沒有食物可提供能量的時候,a 下降至0,則,只要5-6q>0,q<83.33%時,就會選擇冒險策略。此時,承受環(huán)境風(fēng)險能力進(jìn)一步提升。在沒有能量供應(yīng)情況下,繼續(xù)待在聚居地的話,將會面臨生死存亡的饑荒,此時的a 降至負(fù)數(shù),假設(shè)為-1,則,5-6q>-1,q<1 時,就會選擇冒險策略。
可見,面對能量損失和生死存亡,一定會選擇冒險策略;這種環(huán)境下自然選擇留下來的心理模塊也一定是風(fēng)險追逐的。這正是面對損失風(fēng)險追逐的心理模塊產(chǎn)生的進(jìn)化原因。人類祖先利用這個策略,獲得了進(jìn)化優(yōu)勢,獲得了生存機(jī)會,與McDermott et al.(2008)提出的風(fēng)險敏感最優(yōu)覓食理論 (Risk-Sensitive Optimal Foraging Theory) 一致,也與楊勇華利用模擬仿真得出的結(jié)論一致。有意思的是,根據(jù)博弈結(jié)構(gòu),面對損失雖然產(chǎn)生了對未來可能收益的預(yù)期,并且是可能滿足生存和基本能量需求的收益預(yù)期,但在權(quán)衡現(xiàn)有的損失和未來可能收益之間,因?yàn)槭找骖A(yù)期沒有變化,在博弈策略選擇中起作用的是現(xiàn)有已經(jīng)發(fā)生的損失的威脅。
隨著進(jìn)化的繼續(xù),合作的加強(qiáng),食物共享成為常態(tài)。冒險獲得食物也是為了群體利益,也會進(jìn)行食物共享。因此采用冒險策略的祖先仍然可以得到本應(yīng)得到的基本能量收益a,則:當(dāng)5-6q>0,即q<83.33%時,就會選擇冒險策略。此時的變化,不是因?yàn)槊媾R損失,而是食物分配方式的變化?;灸芰啃枨蟮玫奖U?,冒險所得都是額外收益,都有利于保持進(jìn)化優(yōu)勢。不過,當(dāng)我們再把收益風(fēng)險考慮進(jìn)來時,情況就不一樣了。假設(shè)收益風(fēng)險下的收益概率為p(0<p<1),則博弈結(jié)構(gòu)變成表3 所示。
表3
當(dāng)5p-6q>0 時選擇冒險策略。那么,當(dāng)p=50%時,q<41.67%。也就是,當(dāng)收益概率為50%,環(huán)境風(fēng)險概率低于41.67%時,選擇冒險策略,否則獲取安全有保證的基本能量收益。收益概率越低,環(huán)境風(fēng)險承受能力越低,p=25%時,q<20.83%;收益概率越高,環(huán)境風(fēng)險承受能力越高,p=75%時,q<62.5%。當(dāng)然,進(jìn)一步提升能量收益b 也可以提高環(huán)境風(fēng)險承受能力,畢竟獲取更多能量補(bǔ)充具有更大進(jìn)化優(yōu)勢。
人體對能量的需求有上限的,隨著邊際遞減效應(yīng)的發(fā)生,人體不再需要更多的能量,再加上EEA 環(huán)境下也沒有任何食物保鮮機(jī)制,多余的食物無法保存下來供以后食用,能量收益b 很快就遇到了天花板。不過,進(jìn)入舊石器時代的直立人,群體合作已經(jīng)成為常態(tài),開始出現(xiàn)流動的狩獵采集群,有學(xué)者稱之為“游群”(Bands),是小規(guī)模的社會,人數(shù)一般少于100 人,以季節(jié)性的流動來獲取未馴化的食物資源??梢韵胍姡诤献髋c共享的群體生活中,在滿足自身的能量需求之外如有食物剩余,可以分享給其他成員補(bǔ)充額外能量和基本能量,并在自己缺少食物補(bǔ)給能量的時候,獲得其他伙伴的分享。就相當(dāng)于冒險獲取的多余食物,以合作共享的方式儲存在群體之中供以后食用,此時冒險獲取食物的能量收益就可以進(jìn)一步向上突破了。群體合作讓遠(yuǎn)離聚居地食物獲取成為可能,工具的使用、腦容量增長也使得抵御大型肉食動物等天敵的能力大大增強(qiáng),甚至可以將天敵變成獵物,于是C 變成c-′.,此時b-,c-′.不再小于0,原來適用的環(huán)境風(fēng)險概率q 幾乎可以忽略不計(jì)。
假設(shè)其獲得的食物足以額外再滿足3 人份基本能量需求,記為超額能量收益B,達(dá)到12,c-′.仍為6,q 忽略不計(jì),此時,12p-6>0,p>50%時,就會選擇冒險策略。隨著獲取多余食物的次數(shù)增加以及經(jīng)常性的分享,其在群體中的歡迎程度必然不斷提升,同時腦容量的進(jìn)一步增大使得人類祖先的認(rèn)知能力進(jìn)一步增強(qiáng),逐漸形成了聲望。Singer 等(2012)研究了在連續(xù)博弈任務(wù)中聲望(Reputation) 的建立。當(dāng)被試看到那些有意合作的對手的面孔時,腦島、杏仁核、腹側(cè)紋狀體等獎勵相關(guān)腦區(qū)顯著激活,表明人腦能很好地加工交往中他人的聲望,以預(yù)測將來合作的可能性。這種對聲望的識別能力,反過來對那些具備聲望的人,就相當(dāng)于在群體中儲存了巨量的食物,長期以后都會被他人記住并受到他人的回饋和幫助,超額能量收益B 進(jìn)一步提升至18。此時,只要p>33.33%,就會選擇冒險策略。這是超額能量收益情形下的博弈策略選擇,這種情形下的自然選擇必然留下風(fēng)險追逐的心理模塊,也是面對超額收益預(yù)期選擇風(fēng)險追逐的心理模塊產(chǎn)生的進(jìn)化原因,可以看作是追求聲望的心理模塊。因?yàn)楝F(xiàn)有收益沒有變化,在博弈策略選擇中起作用的顯然是對超額收益的預(yù)期。
需要說明的是,損失厭惡心理模塊和追求聲望的心理模塊,表面上看都是面對收益預(yù)期而采取冒險策略,但兩者的心理機(jī)制和進(jìn)化原因并不一樣,面對損失產(chǎn)生收益預(yù)期進(jìn)而追逐風(fēng)險是為了生存,面對超額收益預(yù)期追逐風(fēng)險則是為了聲望,是人類在不同的進(jìn)化階段、不同的進(jìn)化環(huán)境下,經(jīng)過不同的選擇壓力留下的不同心理模塊。如此,也就找到了中石油48 元都不賣的心理根源,為的是更多超額收益,獲得聲望,盡管中石油繼續(xù)上漲的幾率極為渺茫。這些與王曉田三參照點(diǎn)理論的結(jié)論一致。Dabney 等(2020)的研究也為此提供了依據(jù),當(dāng)預(yù)期不斷被超預(yù)期的結(jié)果驗(yàn)證,預(yù)期將被不斷被強(qiáng)化和放大,直至不切實(shí)際。
當(dāng)超額能量收益B 為18 時,則18p-6>0,p>33.33%時,選擇冒險策略;當(dāng)超額能量收益B 降到10,則10p-6>0,p>60%時,選擇冒險策略。超額能量收益B 越高,冒險的意愿越強(qiáng),即所要求的收益概率p 越低。但超額能量收益B 也有天花板。根據(jù)鄧巴數(shù)原理,人類的群體規(guī)模受認(rèn)知能力限制。這意味著通過分享獲得的食物儲存機(jī)制存在上限,聲望在將來獲得的回饋和幫助也有上限。當(dāng)你的投資收益達(dá)到這個上限,同樣也會落袋為安不再冒險,與王曉田三參照點(diǎn)理論的結(jié)論仍然一致。
而在這個上限以內(nèi),隨著能量收益B 的下降,對收益概率p 的要求上升,可以理解為冒險的意愿減弱,但仍然選擇冒險。在上限以內(nèi),即使一路下跌,也不會輕易放棄冒險,直至能量收益降至6,危及基本能量需求,損失厭惡心理模塊啟動,進(jìn)而轉(zhuǎn)向風(fēng)險規(guī)避。這是中石油一路下跌,都沒有賣出,而跌到8 元的時候突然轉(zhuǎn)而風(fēng)險規(guī)避、賣出股票的進(jìn)化依據(jù),也是人類進(jìn)化過程中內(nèi)置到大腦的能夠做出無意識反應(yīng)和切換的心理模塊。
進(jìn)化心理學(xué)認(rèn)為,人類的心理是由大量專門的認(rèn)知機(jī)制即心理模塊(mental modules)所構(gòu)成,即“達(dá)爾文模塊”(Darwinian modules),是祖先在進(jìn)化過程中產(chǎn)生的,一種可遺傳的、能夠穩(wěn)定發(fā)展的先天傾向。達(dá)爾文模塊有助于解決祖先在EEA 環(huán)境下的生存和繁殖問題?!碍h(huán)境選擇”觀點(diǎn)認(rèn)為非洲稀樹草原的擴(kuò)張是導(dǎo)致人猿直立行走、使用石制工具、腦化發(fā)展等特質(zhì)出現(xiàn)的關(guān)鍵事件,“社會選擇”觀點(diǎn)認(rèn)為隨著人類祖先克服種種環(huán)境壓力而獲得生態(tài)支配地位,同類的競爭與合作關(guān)系對生存與繁衍變得越來越重要??梢赃@么說,人類大腦容量從400 毫升進(jìn)化到900 毫升,面對的是環(huán)境壓力,從900 毫升到1200毫升的進(jìn)化,面對的則是社會壓力。
從本文的推演可見,“損失厭惡心理模塊”進(jìn)化于更早期的環(huán)境壓力,而群體合作突破了進(jìn)化博弈收益的上限,在社會壓力下進(jìn)化出了“追求聲望的心理模塊”。這些心理模塊導(dǎo)致的行為看似矛盾實(shí)則在人類進(jìn)化過程中都是適應(yīng)性的。未來,如何將進(jìn)化心理學(xué)與腦的進(jìn)化、神經(jīng)科學(xué)等結(jié)合起來,從全新的角度進(jìn)一步厘清近因和終極因如何導(dǎo)致看似矛盾的決策行為,才能為研究投資行為提供更清晰的理論依據(jù)。