周廣方 魏子晗,3 歐陽良媛 Ngure Mary Muthoni 王曉莊,3
(1 教育部人文社會科學重點研究基地天津師范大學心理與行為研究院,天津 300387) (2 天津師范大學心理學部,天津300387) (3 學生心理發(fā)展與學習天津市高校社會科學實驗室,天津 300387) (4 天津機電職業(yè)技術學院,天津 300350)
描述決策(decision from description)和經驗決策(decision from experience)是從決策依據視角劃分的兩種決策類型。前者是以來自外部的信息為依據,后者是以決策者自身經驗為依據進行決策(Hertwig et al., 2004)。已有研究多關注描述決策與經驗決策之間的差異(Gurevich, 2017; Hertwig et al., 2004),而現實中,描述決策與經驗決策并不具有清晰的界限。人們進行決策的依據往往既受外部信息又受自身經驗的影響,而且來自外部的描述信息與決策者的自身經驗并不總是一致的。
已有研究考察了描述信息和自身經驗的組合如何影響個體決策。研究發(fā)現,描述信息與自身經驗一致的情況下的行為特點和單獨呈現經驗時的行為特點相似,因此研究者認為在該條件下個體更傾向于根據自身經驗進行決策(Jessup et al.,2008; Lejarraga & Gonzalez, 2011)。Weiss-Cohen等(2018)將任務分為低、中、高復雜性等級,進一步探究了任務復雜性對經驗偏好的影響,結果發(fā)現在低、高復雜性任務中,個體對于自身經驗的偏好更高。Weiss-Cohen等(2016)提出了描述-經驗沖突范式,將代表不同收益分布的描述信息和反饋同時呈現給被試,據此可以通過分析被試的選擇模式來判斷其依據何種信息進行決策。結果發(fā)現,在描述信息與自身經驗不一致的條件下,個體依然主要根據自身經驗進行決策。但是以上研究均存在一個共同的局限性,即僅在獲益情境中進行了考察,而未綜合考慮損益情境對決策行為的影響。最近的一項研究探究了損益情境對描述信息與經驗一致的條件下的概率折扣(probability discounting)的影響,發(fā)現隨著經驗的累積,在獲益情境中的概率折扣顯著減?。欢趽p失情境中的概率折扣并未發(fā)生顯著的改變(Asgarova et al.,2020)。研究者認為在獲益情境中概率折扣的減小是經驗習得的結果,而在損失情境中概率折扣未出現顯著的變化,這似乎暗示了損失情境中的被試較少受到經驗的影響。
此外,Kahneman和Tversky(1984)指出不同的信息框架會引發(fā)不同的情緒,積極的框架引發(fā)積極情緒,消極的框架引發(fā)消極情緒。Bodenhausen等(2000)對錨定效應的研究發(fā)現,當處于消極情緒的個體對信息做出初步的比較判斷時,更多的與初始錨定值相符合的信息可能會被有選擇性地獲取,因此,消極情緒個體的最終估計值應該比其他人的估計更偏向初始錨定值的方向。在描述信息與經驗不一致的情境中,個體在開始階段只能根據描述信息對選項的收益分布進行初步的判斷,之后再根據每次選擇所獲得的反饋對最初的判斷進行調整?;谏鲜鲅芯?,損失情境中的個體可能會產生消極的情緒,導致其選擇性加工與初始判斷相符的信息,使其對選項收益分布的估計更偏向基于描述信息所做的初始判斷。另外,還有研究發(fā)現個體在損益情境中對描述信息的真實性判斷和對自身經驗的信心也存在差異?;谶M化心理學的視角,消極的風險信息往往比積極的風險信息更具有價值,因此個體也更傾向于相信消極的風險信息(Siegrist & Cvetkovich, 2001),Hilbig(2012)也發(fā)現以消極框架呈現的信息更容易被判斷為真實的。另外Lebreton等(2019)發(fā)現,在基于經驗的重復決策任務中,相較于損失情境,獲益情境中被試對自己的選擇表現出更強的自信,在該研究中,被試不會接受描述信息,說明他們對自身經驗具有更強的信心。基于上述研究,本研究預測相較于獲益情境,損失情境中的個體更傾向于根據描述信息進行決策。
因此本研究采用描述-經驗沖突范式(Weiss-Cohen et al., 2016),考察損益情境下描述信息與經驗不一致對個體風險選擇的影響。由于在損益情境下,相同描述信息概率所代表的實際意義不同(例如,在獲益情景中,相較于安全選項100%獲得2分,風險選項5%獲得5分為劣勢選項,但在損失情境中,相較于安全選項100%損失2分,風險選項5%損失5分為優(yōu)勢選項),本研究通過研究1a和研究1b分別考察獲益情境和損失情境中的個體風險選擇特點。研究2在行為數據分析基礎上,擬合決策模型參數,探究和比較損益情境中個體風險選擇的機制。
研究1a考察獲益情境下描述信息與經驗不一致對個體風險選擇的影響。
2.1.1 被試
從天津兩所高校招募131名被試(男性58名,女性73名),年齡范圍18~26歲。其中描述信息低于經驗45%條件39名,低于經驗25%條件33名,高于經驗25%條件33名,高于經驗45%條件26名。被試均身心健康,自愿參加實驗。實驗結束后給予被試相應報酬。
2.1.2 實驗任務
采用描述-經驗沖突范式,被試需在兩個選項之間進行選擇。在實驗中,既向被試呈現描述信息,也通過被試的選擇和得到的反饋呈現實際獲益的經驗,且描述信息與經驗不一致。描述信息以文字形式在選項下方呈現。描述信息與經驗不一致分為四種條件,如表1所示。選項選擇設置樣例如圖1所示。
表1 研究 1a 實驗條件操縱
圖1 選項選擇設置樣例
2.1.3 實驗程序
首先,被試閱讀指導語。指導語為:“歡迎參加本次實驗,屏幕上的兩個選項都對應著有一定的概率獲得分數,在選項按鈕的下方提供了該選項收益概率的信息,每次選擇之后還能獲得選擇的收益結果的反饋。在實驗中,你的任務就是選擇你認為能夠使收益最大化的選項,因為你的得分將會與實驗報酬關聯。”之后通過10個練習試次熟悉實驗流程,然后進入正式實驗。在正式實驗中,屏幕上呈現兩個選項,左側為安全選項,右側為風險選項。被試在兩個選項之間進行選擇,每次選擇完成立刻呈現反饋(反饋的內容為:很遺憾您獲得0分/恭喜您獲得X分,您已累計獲得X分)。在正式實驗中,各實驗條件下的試次數均為140。
使用Eprime2.0編制實驗程序,實驗在筆記本電腦上完成。具體流程如圖2所示。
圖2 實驗流程圖
2.1.4 實驗設計
采用單因素被試間設計,自變量為描述信息與經驗的不一致程度(高于經驗45%、高于經驗25%、低于經驗25%、低于經驗45%),因變量為對風險選項的選擇率(R率)。需要注意的是,實驗條件之間的差異僅僅在于描述信息不同,在其他方面是完全一致的?;诖?,如果不同條件下的被試對選項的選擇出現差異,那么這種差異也只能歸因為描述信息的不同,說明被試受到了描述信息的影響;反之,則說明被試較少地受到描述信息的影響。
2.1.5 數據處理
參考前人研究,劃分組塊進行數據分析(Lejarraga & Gonzalez, 2011),每20個試次為一個組塊。分別計算各組塊的R率及總體的R率,R率的計算方法為:選擇風險選項的試次數/總試次數,該值越大代表被試越傾向于選擇風險選項。
2.1.6 結果
(1)反應時
各組塊的平均反應時和總反應時:組塊1,1510±4692 ms;組塊 2,508±1166 ms;組塊 3,435±929 ms;組塊 4,374±673 ms;組塊 5,375±606 ms;組塊 6,345±661 ms;組塊 7,351±873 ms;總反應時,557±1976 ms。
以組塊為自變量,反應時為因變量進行方差分析,發(fā)現組塊對反應時具有顯著影響,F(6, 18333)=125.71,p<0.001,η2=0.039,事后比較發(fā)現組塊1的反應時顯著長于其他6個組塊(ps<0.001),組塊2的反應時顯著長于組塊6(p<0.001),組塊2與組塊7的反應時差異邊緣顯著(p=0.053)。
(2)R率
各條件下R率的平均數和標準差:低于經驗45%條件為0.47±0.26;低于經驗25%條件為0.52±0.25;高于經驗25%條件為0.57±0.25;高于經驗45%條件為0.58±0.20。各條件R率如圖3所示。
圖3 獲益情境中各條件的平均R率
以描述信息與經驗不一致程度,組塊及其交互作用為固定因子,被試差異為隨機因子,R率為因變量,使用Bates等(2015)開發(fā)的R包lme4建立線性混合模型,使用Fox和Weisberg(2019)開發(fā)的R包car獲得模型結果。結果發(fā)現:描述信息與經驗不一致程度[χ2(3)=4.69,p=0.196]和組塊[χ2(6)=3.60,p=0.730]的主效應不顯著,兩者的交互作用不顯著 [χ2(18)=16.78,p=0.538]。
研究1a發(fā)現獲益情境中,描述信息與經驗不一致程度對被試的R率未產生顯著影響,說明在獲益情境中描述信息對個體風險決策的影響較小。
研究1b考察損失情境下描述信息與經驗不一致對個體風險選擇的影響。
2.2.1 被試
從天津兩所高校招募147名被試(男性65名,女性82名),年齡范圍18~27歲。其中描述信息低于經驗45%條件36名,低于經驗25%條件34名,高于經驗25%條件40名,高于經驗45%條件37名。被試均身心健康,自愿參加實驗。實驗結束后給予被試相應報酬。
2.2.2 實驗任務
除了損益情境發(fā)生變化,其他同研究1a。描述信息與經驗不一致的四種條件如表2所示。
表2 研究 1b 實驗條件操縱
2.2.3 實驗程序和實驗設計
同研究1a。
2.2.4 結果
(1)反應時
各組塊的平均反應時和總反應時:組塊1,2244±827 ms;組塊 2,768±1229 ms;組塊 3,600±953 ms;組塊 4,548±1711 ms;組塊 5,550±1098 ms;組塊 6,429±534 ms;組塊 7,418±535 ms;總反應時,794±2835 ms。
以組塊為自變量,反應時為因變量進行方差分析,發(fā)現組塊對反應時具有顯著影響,F(6, 20573)=161.88,p<0.001,=0.045,事后比較發(fā)現組塊1的反應時顯著長于其他6個組塊(ps<0.001),組塊2的反應時顯著長于組塊4(p<0.05),組塊5(p<0.05),組塊 6(p<0.001)和組塊 7(p<0.001)。
結合研究1a和1b的反應時分析可以發(fā)現前兩個組塊的反應時顯著較長,因此其可能是被試獲得經驗信息,形成選擇策略的關鍵階段。對于損益情景中前兩個組塊的反應時進行比較發(fā)現,損失情境的反應時顯著長于獲益情境,t(272.88)=5.02,p<0.001,Cohen’sd=0.60,M獲益=1009 ms,SD=733 ms,M損失=1506 ms,SD=916 ms。
(2)R率
各條件下R率的平均數和標準差:低于經驗45%條件為0.59±0.22;低于經驗25%條件為0.60±0.27;高于經驗25%條件為0.43±0.20;高于經驗45%條件為0.43±0.25。各條件R率如圖4所示。
圖4 損失情境中各條件的平均R率
以描述信息與經驗不一致程度,組塊及其交互作用為固定因子,被試差異為隨機因子,R率為因變量進行線性混合模型分析。結果表明:描述信息與經驗不一致程度的主效應顯著[χ2(3)=17.34,p<0.001]。Tukey事后檢驗發(fā)現,低于經驗25%條件下的R率顯著大于高于經驗25%條件(b=0.17,p<0.05)和高于經驗 45% 條件(b=0.17,p<0.05);低于經驗45%條件下的R率顯著大于高于經驗25%(b=0.16,p<0.05)和高于經驗45%(b=0.15,p<0.05)。組塊的主效應顯著 [χ2(6)=62.72,p<0.001]。Tukey事后檢驗發(fā)現組塊1的R率顯著大于其他6個組塊(組塊1vs.組塊2,b=0.06,p<0.05;組塊 1vs.組塊 3,b=0.10,p<0.001; 組塊 1vs.組塊 4,b=0.09,p<0.001; 組塊 1vs.組塊 5,b=0.09,p<0.001; 組塊 1vs.組塊 6,b=0.10,p<0.001; 組塊 1vs.組塊 7,b=0.11,p<0.001),組塊2的R率顯著大于組塊7(b=0.05,p<0.05)。兩者的交互作用不顯著[χ2(18)=12.74,p=0.807]。
研究1b發(fā)現在損失情境中,描述信息與經驗不一致程度對被試的R率有顯著影響,說明在損失情境中個體更傾向于采用描述信息進行決策。
研究1的結果說明相較于獲益情境,損失情境中的個體在決策過程中更加依賴描述信息。但這只是基于行為結果的推測,實際上決策過程中個體依賴描述信息的程度是一個內部變量,無法通過行為直接觀察到。而決策模型可以通過模型參數表示不能通過行為直接觀察到的內部變量,揭示決策過程的心理機制(高青林, 周媛, 2021)。因此,研究2使用行為數據擬合決策模型,進一步驗證研究1的結果,探究損益情境下描述信息與經驗不一致影響個體風險決策的心理機制。
“期望價值學習模型”(prospect-valence learning model, PVL)在基于反饋的決策領域被廣泛使用(Don et al., 2019)。但該模型只包含經驗成分,并未考慮描述信息。如果個體的決策很大程度上是根據描述信息做出的,那么該模型對行為數據的解釋力應該較差?!懊枋?期望價值學習模型”(descriptionprospect valence learning model, D-PVL)將描述信息加入模型中,以考察經驗與描述信息對個體風險選擇的影響(Weiss-Cohen et al., 2016, 2018)。
PVL模型基于三個假設:(1)通過價值函數評估選擇結果;(2)根據學習規(guī)則進行期望效用更新;(3)根據選項期望效用決定選擇某選項的可能性(Dai et al., 2015)。
首先,價值函數如公式1所示。
rj(t)代表第t次選擇j選項的結果。參數α和β分別決定積極和消極價值曲線的曲率。λ(0≤λ≤5)表示損失厭惡程度,該值大于1表示對損失更加敏感。
根據學習規(guī)則進行期望更新,該模型使用衰減規(guī)則(decay rule)。根據該規(guī)則,選項j在第t次選擇的經驗期望Ej(t)如公式2所示。
φ(0≤φ≤1)代表選項期望值的衰減比例,該值越小表示個體越傾向于根據即時反饋進行決策。δj(t)為虛擬變量,代表第t次選擇時該選項是否被選擇。
選項被選擇的概率通過比例選擇規(guī)則(ratio choice rule)計算。根據該規(guī)則,被試在第t次選擇j選項的概率如公式3所示。
θ表示個體選擇較高期望值選項的一致性,該值越大表示個體越能夠較為一致地選擇期望值較高的選項。θ是由參數c(0≤c≤5)決定的:θ=3c-1。
借鑒Weiss-Cohen等(2016)的方法,通過參數ξ將描述信息加入PVL模型中。如公式4所示。
Ej(t)表示j選項的經驗期望值。ξ(0≤ξ≤1)的值越大描述信息越會影響人們的風險選擇。Dj表示j選項的描述期望值,其計算見公式5。
vjm代表j選項第m個結果,U(·)為價值函數(同PVL模型);pjm代表j選項第m個結果的概率,W(·)為概率權重函數,如公式6所示。
γ(0≤γ≤2)代表對概率的敏感性。γ小于1說明高估小概率事件;相反,則說明低估小概率事件。
使用各被試的行為數據擬合兩個模型的參數。即將觀察到被試選擇序列的概率定義為在整個實驗中實際被選擇選項的模型預測概率。然后通過最小化似然函數發(fā)現對應模型的最佳參數估計值,似然函數見公式7。
n表示選擇次數,Pr[Dj(t+1)]代表在t+1次選擇時,模型預測選擇選項j的可能性,δj(t+1)為虛擬變量。
使用貝葉斯信息準則(BIC)進行模型比較,因為其權衡了模型的準確性和復雜性(Dai et al.,2015)。公式為為模型參數數量,N為行為數據數量。BIC越小,行為數據對決策模型的擬合越好。
使用損益情境的行為數據分別對兩個模型進行擬合,共獲得四組參數。結果見表3。
表3 最佳擬合參數和平均 BIC
BIC值的比較:獲益情境下,D-PVL模型的BIC值大于PVL模型;損失情境下,D-PVL模型的BIC值小于PVL模型。這說明PVL模型較好預測獲益情境中的決策,而D-PVL模型較好預測了損失情境中的決策。
D-PVL模型參數的比較:獲益情境的參數ξ顯著小于損失情境,t(245.88)=-4.02,p<0.001,Cohen’sd=0.50;獲益情境的參數c顯著小于損失情境,t(263.44)=-2.03,p<0.05,Cohen’sd=0.24;獲益情境的參數φ顯著大于損失情境,t(276)=3.71,p<0.001,Cohen’sd=0.45。
研究1發(fā)現,獲益情境中與經驗不一致的描述信息對個體的風險選擇沒有顯著影響;而損失情境相反。進一步擬合決策模型發(fā)現,在獲益情境中PVL模型的BIC值小于D-PVL模型,在損失情境中PVL模型的BIC值大于D-PVL模型。這說明在損失情境中D-PVL模型對行為數據的解釋力更強,且損失情境的描述信息權重參數ξ顯著大于獲益情境。可見,當描述信息與經驗不一致時,相較于獲益情境,損失情境中個體更傾向于采用描述信息進行決策。
在損益情境中,描述信息與經驗不一致對風險決策的影響可從三方面來解釋:其一,相較于獲益情境,個體在損失情境中更認可描述信息的真實性。Baumeister等(2001)發(fā)現消極信息比同等強度的積極信息更能影響個體的認知。Hilbig(2012)進一步發(fā)現當信息以消極框架呈現時個體更傾向于認為其是真實的。在本研究中,損失情境下的描述信息是與損失分數這一消極結果相聯系的,這可能導致被試對描述信息更高的真實性評估。其二,在損益情境中,個體對經驗的自信程度存在差異。Lebreton等(2019)發(fā)現在基于經驗的重復決策任務中,獲益情境中的被試對自己的選擇表現出更強的自信。這說明相較于獲益情境,損失情境中的被試對自身經驗的信心更低,傾向于低估自身經驗的可靠性。其三,對反應時的分析發(fā)現,損失情境中被試的反應時顯著長于獲益情境。Gl?ckner等(2012)認為個體在加工描述性信息過程中會涉及復雜的計算過程,因此對描述信息的加工時間也會更長。因此更長的反應時表明損失情境中的被試對描述信息進行了更加細致、精確的加工?;谝陨戏治?,本研究認為,可能是損失情境中被試對描述信息的深度加工及過度信任,同時又低估自身經驗的可靠性,導致其傾向于根據描述信息進行決策。
模型參數的比較發(fā)現,損益情境下個體決策的心理機制存在差異。首先,獲益情境下的近因參數φ顯著大于損失情境,說明損失情境中個體更容易受到最近一次選擇結果的影響(φ=0.35)。而在獲益情境中個體能夠對經驗信息進行較為系統的整合(φ=0.61),這可能也是獲益情境中被試對自身經驗更自信的原因。此外,獲益情境下的選擇一致性參數c顯著小于損失情境,表明損失情境中個體較穩(wěn)定地選擇高期望值的選項,但這并不能說明被試的選擇是合理的,因為他們是根據虛假描述信息進行決策。而獲益情境下,選擇一致性參數較小,可能反映被試對經驗信息進行探索的過程,導致其沒有遵循期望最大化原則。
本研究結果與強化學習領域神經影像學研究結果可能存在一定相關性。強化學習是指人們利用先前的經驗來改善未來選擇的結果(Lee et al.,2012),該過程與本研究中經驗學習過程較為相似。以往研究發(fā)現紋狀體在強化學習過程中的重要作用,如屬于紋狀體一部分的尾狀核已被證明與學習和記憶有關,特別是在反饋結果的處理方面(Packard & Knowlton, 2002)。還有研究發(fā)現在強化學習過程中,學習者的背側和腹側紋狀體均表現出了穩(wěn)健的判斷錯誤信號(Schonberg et al.,2007),說明在決策者可能在出現錯誤時激活此區(qū)域對學習信息進行整合。同時,有研究發(fā)現損失情境中紋狀體的激活程度顯著低于獲益情境(Dong et al., 2014; Tom et al., 2007)?;谏鲜鲅芯?,推測本研究中損失情境中的決策者更傾向于根據虛假描述信息進行決策的原因在于其紋狀體的激活水平更低,導致他們未能對經驗信息進行有效的學習(這也與本研究損失情境中的被試更加容易受到即時反饋的影響,未能對經驗信息進行整合的現象一致),因而只能根據虛假的描述信息進行決策。
本研究存在以下不足。第一,本研究被試均為大學生,未能對老年人在本實驗條件下的決策特點進行研究。目前,世界上老年人口最多的國家是中國(項鑫, 王乙, 2021),而以往研究發(fā)現老年人的風險決策與年輕人存在很大的差異(張力元 等, 2015),因此未來探究老年人在本實驗條件下的決策特點具有現實意義;第二,本研究只是從行為和心理機制層面揭示了損益情境對個體決策的影響,未能對其神經基礎進行探究,因此未來研究可以以強化學習領域研究發(fā)現的紋狀體等腦區(qū)為興趣區(qū),對其腦機制進行探究。
相較于獲益情境,損失情境中的個體更大程度地采信描述信息進行決策;且在損失情境中個體的決策更容易被最近一次的選擇結果影響。