黃文強(qiáng) 楊沙沙 于 萍
(首都師范大學(xué)心理系, 北京市“學(xué)習(xí)與認(rèn)知”重點(diǎn)實(shí)驗(yàn)室, 北京 100048)
決策(decision making)是指對(duì)已有方案進(jìn)行評(píng)估和選擇的過(guò)程(Hogarth & Reder, 1986)。根據(jù)選擇結(jié)果的確定性, 決策可分為確定型決策和不確定型決策兩類(lèi), 不確定型決策又劃分為兩種不同的類(lèi)型:風(fēng)險(xiǎn)決策(risky decision making)與模糊決策(ambiguity decision making), 風(fēng)險(xiǎn)決策的結(jié)果出現(xiàn)概率是已知的, 如輪盤(pán)游戲 (Levy, Snell,Nelson, Rustichini, & Glimcher, 2010)。人類(lèi)的風(fēng)險(xiǎn)決策行為可通過(guò)博弈任務(wù)來(lái)研究, 例如愛(ài)荷華博弈任務(wù)(Iowa Gambling Task, IGT)。大量證據(jù)表明,多類(lèi)動(dòng)物如魚(yú)類(lèi)、鳥(niǎo)類(lèi)以及哺乳類(lèi)動(dòng)物都能在需要進(jìn)行行為選擇時(shí), 對(duì)獎(jiǎng)賞的概率進(jìn)行評(píng)估, 從而做出效用最大化的選擇(Kacelnik & Bateson,1997), 因此我們可以使用動(dòng)物模型來(lái)模擬人類(lèi)風(fēng)險(xiǎn)決策。嚙齒類(lèi)動(dòng)物風(fēng)險(xiǎn)決策模型已經(jīng)比較成熟,能夠很好模擬人類(lèi)決策障礙的特征(van den Bos et al., 2013)。常用的嚙齒類(lèi)動(dòng)物風(fēng)險(xiǎn)決策模型包括概率折扣任務(wù)(Probability Discounting Task,PDT)、大鼠氣球模擬風(fēng)險(xiǎn)決策任務(wù)(Rat Balloon Analog Risk Task, r-BART)和大鼠博弈任務(wù)(Rat Gambling Task, RGT)。
風(fēng)險(xiǎn)決策是非常復(fù)雜的心理過(guò)程, 依賴(lài)于學(xué)習(xí)與記憶、認(rèn)知評(píng)價(jià)、獎(jiǎng)賞、情緒、運(yùn)動(dòng)程序編制與執(zhí)行等多個(gè)系統(tǒng)的協(xié)同活動(dòng), 所以涉及的腦區(qū)非常廣泛。神經(jīng)科學(xué)家利用腦損傷、電生理、神經(jīng)藥理、光遺傳學(xué)等多種技術(shù)系統(tǒng)研究風(fēng)險(xiǎn)決策行為的神經(jīng)機(jī)制。在目前研究結(jié)果中, 前額皮層中的內(nèi)側(cè)前額皮層(medial prefrontal cortex,mPFC)、前扣帶回(anterior cingutate cortex, ACC)和眶額皮層(orbital frontal cortex, OFC), 以及皮層下核團(tuán)中的基底外側(cè)杏仁核、伏隔核等結(jié)構(gòu)在風(fēng)險(xiǎn)決策中發(fā)揮至關(guān)重要的作用(Stopper &Floresco, 2015), 尤其是上述結(jié)構(gòu)組成的前額皮層?基底外側(cè)杏仁核?伏隔核神經(jīng)環(huán)路聯(lián)系是決定風(fēng)險(xiǎn)決策的選擇傾向的關(guān)鍵所在(St. Onge, Stopper,Zahm, & Floresco, 2012)。也有大量研究表明某些神經(jīng)遞質(zhì)對(duì)風(fēng)險(xiǎn)決策有十分顯著的影響, 例如多巴胺遞質(zhì)系統(tǒng)參與不同形式的成本?效益決策,包括風(fēng)險(xiǎn)決策; 多巴胺(Dopamine, DA)的釋放量對(duì)風(fēng)險(xiǎn)選擇的偏向起到重要的調(diào)控作用(Nasrallah et al., 2011)。本文從行為學(xué)、細(xì)胞電生理學(xué)和遞質(zhì)系統(tǒng)三個(gè)方面總結(jié)近年來(lái)關(guān)于風(fēng)險(xiǎn)決策神經(jīng)機(jī)制的嚙齒類(lèi)動(dòng)物實(shí)驗(yàn)研究結(jié)果?;陲L(fēng)險(xiǎn)決策的復(fù)雜性, 大部分嚙齒類(lèi)動(dòng)物實(shí)驗(yàn)?zāi)P瓦x擇大鼠作為研究對(duì)象, 也有少部分研究使用小鼠, 尤其是在制作精神病理動(dòng)物模型時(shí)利用轉(zhuǎn)基因小鼠具有一定優(yōu)勢(shì)。本文總結(jié)的研究結(jié)果主要是基于大鼠的實(shí)驗(yàn)研究。
大鼠的非可逆和可逆性腦損傷研究大部分使用RGT或者PDT模型, 使用這兩種任務(wù)的研究結(jié)果相近但不完全相同。RGT的設(shè)計(jì)來(lái)源于考察人的風(fēng)險(xiǎn)決策的 IGT (van den Bos, Lasthuis, Den Heijer, van der Harst, & Spruijt, 2006; de Visser et al.,2011)。大鼠在相對(duì)簡(jiǎn)單的沖突情境中進(jìn)行自由選擇, 通過(guò)經(jīng)驗(yàn)積累而習(xí)得各個(gè)選項(xiàng)的意義。每個(gè)選項(xiàng)包含可能付出的成本(cost)和可能的收益(benefit)以及兩者的概率。成本包括消耗的體力、需要等待的時(shí)間或者可能遭受懲罰的風(fēng)險(xiǎn); 收益主要是可口的食物或者遭受懲罰(van den Bos,Homberg, & de Visser, 2013)。大鼠學(xué)習(xí)RGT需要平衡幾個(gè)選項(xiàng)的獎(jiǎng)懲和概率信息, 做出綜合判斷并選擇優(yōu)勢(shì)選項(xiàng), 若干次訓(xùn)練后, 穩(wěn)定在優(yōu)勢(shì)選項(xiàng)上, 形成最優(yōu)策略。
而PDT的設(shè)計(jì)改編自延時(shí)折扣任務(wù)(Cardinal& Howes, 2005)。例如在基于獎(jiǎng)賞的概率折扣任務(wù)中, 大鼠在風(fēng)險(xiǎn)選項(xiàng)和安全選項(xiàng)中做出自由選擇,風(fēng)險(xiǎn)選項(xiàng)所對(duì)應(yīng)的獎(jiǎng)賞額度較大, 但獲得的概率隨時(shí)間出現(xiàn)遞減或者遞增的變化, 安全選項(xiàng)所對(duì)應(yīng)的獎(jiǎng)賞額度較小而概率不變。風(fēng)險(xiǎn)選項(xiàng)在獎(jiǎng)賞概率較高時(shí)是優(yōu)勢(shì)選項(xiàng), 較低時(shí)是劣勢(shì)選項(xiàng)。大鼠學(xué)會(huì)任務(wù)后會(huì)在風(fēng)險(xiǎn)選項(xiàng)和安全選項(xiàng)的決策中進(jìn)行及時(shí)的轉(zhuǎn)變。在另一種基于懲罰概率折扣任務(wù)中, 風(fēng)險(xiǎn)選項(xiàng)所對(duì)應(yīng)的懲罰概率有著遞增或遞減的變化, 懲罰又有多種方式: 用奎寧處理的食物、電擊、無(wú)條件的等待。
所以, RGT和PDT雖然都是考察大鼠能否在風(fēng)險(xiǎn)決策任務(wù)中做出最優(yōu)選擇, 但是側(cè)重點(diǎn)不同:① PDT往往考察風(fēng)險(xiǎn)的一個(gè)方面: 風(fēng)險(xiǎn)是可能得不到食物獎(jiǎng)賞或者可能遭受懲罰, 但一般不同時(shí)出現(xiàn)。而RGT則需要?jiǎng)游锔鶕?jù)每個(gè)選項(xiàng)的獎(jiǎng)賞大小及其概率和懲罰大小及其概率等因素做出綜合的價(jià)值判斷, 雖然無(wú)法分離出單一風(fēng)險(xiǎn)因素,但是這個(gè)范式與人的風(fēng)險(xiǎn)決策范式是最接近的;②大鼠在RGT中只進(jìn)行自由選擇, 需要在不斷的學(xué)習(xí)過(guò)程中積累經(jīng)驗(yàn), 因而RGT在大鼠決策行為穩(wěn)定前屬于模糊決策, 在行為穩(wěn)定后屬于風(fēng)險(xiǎn)決策, RGT的學(xué)習(xí)過(guò)程是風(fēng)險(xiǎn)決策的策略形成的過(guò)程。但是對(duì)于 PDT, 動(dòng)物需要在每一個(gè)周期的任務(wù)執(zhí)行中根據(jù)選項(xiàng)的優(yōu)劣勢(shì)完成選項(xiàng)的轉(zhuǎn)移, 所以PDT更多考察大鼠策略轉(zhuǎn)換的靈活性以及風(fēng)險(xiǎn)偏好。目前, PDT和RGT在考察風(fēng)險(xiǎn)決策的性別差異、年齡差異, 以及環(huán)境、酒精對(duì)風(fēng)險(xiǎn)決策行為影響等方面應(yīng)用廣泛(van den Bos, Jolles, van der Knaap, Baars, & de Visser, 2012; van den Bos,Homberg, & de Visser, 2013; Gilbert et al., 2012;Boutros, Semenova, Liu, Crews, & Markou, 2015;Zeeb, Wong, & Winstanley, 2013)。
Jentsch, Woods, Groman和Seu (2010)根據(jù)人類(lèi)氣球模擬風(fēng)險(xiǎn)決策任務(wù)(Balloon Analog Risk Task, BART)設(shè)計(jì)出不同于 RGT和 PDT范式的r-BART范式: 大鼠面臨兩個(gè)杠桿選擇——按壓“取現(xiàn)杠桿”釋放積累的食物, 按壓“增加杠桿”可以增加潛在的食物獎(jiǎng)賞。但風(fēng)險(xiǎn)是可能失敗并且導(dǎo)致先前積累的食物全部取消, 冒險(xiǎn)程度大小和食物積累的量成正比。該模型用來(lái)研究大鼠的風(fēng)險(xiǎn)承擔(dān)(risk taking), 即追求收益最大化的同時(shí)能夠承受多大程度的風(fēng)險(xiǎn)。大鼠學(xué)會(huì)任務(wù)后, 正常表現(xiàn)應(yīng)該是相對(duì)穩(wěn)定的選擇模式, 經(jīng)過(guò)學(xué)習(xí)之后,選擇“增加杠桿”的次數(shù)會(huì)相對(duì)穩(wěn)定。r-BART的優(yōu)點(diǎn)是比RGT和PDT更加生態(tài)化, 能更好的擬合生活的情景, 能較為準(zhǔn)確的反映大鼠的風(fēng)險(xiǎn)偏好,但是由于任務(wù)較難, 結(jié)果呈現(xiàn)并不如RGT和PDT直觀, 所以應(yīng)用較少。
由于嚙齒類(lèi)動(dòng)物的前額皮層由非顆粒狀結(jié)構(gòu)組成, 其解剖結(jié)構(gòu)及位置與靈長(zhǎng)類(lèi)動(dòng)物不能完全對(duì)應(yīng), 但是纖維投射以及功能相類(lèi)似, 因此嚙齒類(lèi)動(dòng)物的實(shí)驗(yàn)結(jié)果可以為我們探究風(fēng)險(xiǎn)決策的神經(jīng)機(jī)制提供有用信息。與決策相關(guān)的大鼠前額皮層主要包括OFC以及mPFC, OFC分為內(nèi)側(cè)眶額皮層(medial orbitofrontal cortex, mOFC)和外側(cè)眶額皮層(lateral orbitofrontal cortex, lOFC)兩部分;mPFC包括前扣帶回(anterior cingulate cortex,ACC)、緣前皮層(prelimbic cortex, PL)以及緣下皮層(infralimbic cortex, IL), PL的功能與人類(lèi)的ACC以及背外側(cè)前額皮層(dlPFC)的功能相似(?ngür & Price, 2000)。
嚙齒類(lèi)動(dòng)物與靈長(zhǎng)類(lèi)前額皮層的纖維投射相似: OFC接受多種感覺(jué)信息的輸入, 包括嗅覺(jué)、味覺(jué)、視覺(jué), 內(nèi)臟感覺(jué)以及軀體感覺(jué), 而mPFC則向腦干、丘腦中控制內(nèi)臟運(yùn)動(dòng)的腦區(qū)提供主要的輸出, 這兩個(gè)腦區(qū)都與邊緣系統(tǒng)、丘腦聯(lián)系緊密, 但是分屬于兩個(gè)分離的紋狀體?丘腦?皮層環(huán)路, 其中IL與PL分別投射到伏隔核的殼與核, OFC則主要投射到尾狀核與殼核。但是OFC與mPFC之間存在大量的纖維聯(lián)系, 不但表征多種感覺(jué)刺激,同時(shí)也表征感覺(jué)刺激相關(guān)的情感價(jià)值, 所以在指導(dǎo)獎(jiǎng)賞相關(guān)的行為以及決策中起關(guān)鍵作用(?ngür& Price, 2000)。
OFC損傷或失活對(duì)風(fēng)險(xiǎn)決策的學(xué)習(xí)和執(zhí)行有不同的影響。Pais-Vieira, Lima和Galhardo (2007)最早使用類(lèi)似博弈任務(wù)的二選一實(shí)驗(yàn)范式考察大鼠 OFC損傷后在高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)選擇上的偏向,任務(wù)訓(xùn)練持續(xù)幾個(gè)周期后, OFC損傷的大鼠表現(xiàn)出較高的風(fēng)險(xiǎn)偏向。OFC損傷的大鼠從RGT學(xué)習(xí)一開(kāi)始就固著于某一選項(xiàng), 最終學(xué)不會(huì)優(yōu)勢(shì)策略,或策略不穩(wěn)定(Rivalan, Coutureau, Fitoussi, &Dellu-Hagedorn, 2011); 但是如果學(xué)會(huì)RGT、行為穩(wěn)定后損傷 OFC, 優(yōu)勢(shì)策略不受影響(Zeeb &Winstanley, 2011)。在PDT中, 大鼠學(xué)會(huì)之后OFC失活也不影響概率折扣決策的選擇偏向, 只是增加了選擇反應(yīng)時(shí)(St. Onge & Floresco, 2010)。這說(shuō)明OFC在策略學(xué)習(xí)階段起到更加關(guān)鍵的作用。先前的大部分研究都集中在lOFC, 但最近研究發(fā)現(xiàn)mOFC與 lOFC的解剖結(jié)構(gòu)及功能都存在分離,Stopper, Green和Floresco (2014)發(fā)現(xiàn)在學(xué)會(huì)PDT任務(wù)后, mOFC的失活導(dǎo)致大鼠更加冒險(xiǎn), 且在風(fēng)險(xiǎn)選項(xiàng)的獎(jiǎng)賞概率降低序列和升高序列任務(wù)都偏向風(fēng)險(xiǎn)選項(xiàng), 說(shuō)明mOFC對(duì)風(fēng)險(xiǎn)偏向的抑制作用,這與 lOFC的作用不同。Orsini, Trotta, Bizon和Setlow (2015)使用足底電擊懲罰作為風(fēng)險(xiǎn)因素,發(fā)現(xiàn)在不影響?yīng)勝p大小辨別能力和焦慮基線水平的前提下, 學(xué)會(huì)懲罰概率折扣的大鼠 lOFC損傷后顯著降低了風(fēng)險(xiǎn)選擇, 這與先前結(jié)論不一致,究其原因, 可能是電擊作為外顯的懲罰, 不同于獎(jiǎng)賞的損失, 而 OFC對(duì)不同懲罰反應(yīng)并不相同;也有可能是損傷 lOFC時(shí)也造成 mOFC損傷, 該問(wèn)題需要進(jìn)一步探究。
mPFC損傷同樣損害風(fēng)險(xiǎn)決策的學(xué)習(xí), 大鼠PL損傷后后在RGT任務(wù)中表現(xiàn)為學(xué)不會(huì)優(yōu)勢(shì)或者策略轉(zhuǎn)換不靈活(Rivalan et al., 2011)。但與OFC作用不同的是, 學(xué)習(xí)過(guò)后損傷 mPFC, 導(dǎo)致大鼠在RGT中對(duì)優(yōu)勢(shì)選項(xiàng)的選擇次數(shù)降低, 可能的原因是 mPFC受損會(huì)導(dǎo)致對(duì)負(fù)性結(jié)果不敏感: 對(duì)作為懲罰的等待時(shí)間的長(zhǎng)短以及其出現(xiàn)的概率不敏感(Paine, Asinof, Diehl, Frackman, & Leffler,2013)。對(duì)學(xué)習(xí) RGT后的大鼠腦切片進(jìn)行 c-Fos免疫組織化學(xué)測(cè)試(c-Fos免疫染色的程度反應(yīng)了腦區(qū)的激活程度), 發(fā)現(xiàn)決策不良的大鼠的 mPFC(包括PL和IL)比決策較好的大鼠的mPFC激活程度高, 決策不良的大鼠可能正處于策略探索階段(de Visser, Baars, Lavrijsen, van der Weerd, & van den Bos, 2011)。St. Onge 和 Floresco (2010)的研究發(fā)現(xiàn)PDT中mPFC失活不是簡(jiǎn)單地影響選擇的風(fēng)險(xiǎn)偏向: 在風(fēng)險(xiǎn)選項(xiàng)的獎(jiǎng)賞概率不斷降低的 PDT中, mPFC失活導(dǎo)致大鼠選擇風(fēng)險(xiǎn)選項(xiàng)的次數(shù)的遞減幅度變小; 在風(fēng)險(xiǎn)選項(xiàng)的獎(jiǎng)賞概率不斷增加的PDT中, mPFC失活導(dǎo)致大鼠選擇風(fēng)險(xiǎn)選項(xiàng)的次數(shù)的增加幅度也變小。僅從風(fēng)險(xiǎn)偏向上看, 兩者正好相反; 但無(wú)論是風(fēng)險(xiǎn)偏好的遞減曲線還是遞增曲線均表現(xiàn)為趨于平緩, 說(shuō)明大鼠不是僅僅變得更加冒險(xiǎn)或保守, 而是策略轉(zhuǎn)換變慢。該研究還設(shè)置了控制實(shí)驗(yàn)以排除mPFC功能失活后損傷行為靈活性和概率判斷能力對(duì)決策的影響, 表明mPFC對(duì)風(fēng)險(xiǎn)決策的影響不是通過(guò)影響其它行為因素導(dǎo)致的。Jentsch等人(2010)在r-BART中發(fā)現(xiàn)mPFC失活會(huì)干擾大鼠的最優(yōu)決策能力, 導(dǎo)致整個(gè)決策行為中次優(yōu)化、不適應(yīng)行為的比率上升,決策行為的穩(wěn)定性下降。
ACC在解剖上處于整合獎(jiǎng)賞信息腦區(qū)與行為選擇腦區(qū)之間的位置(Hoover & Vertes, 2007), 可將獎(jiǎng)賞的價(jià)值信息傳遞到運(yùn)動(dòng)區(qū), 并且可以預(yù)測(cè)將要做出的行動(dòng)的價(jià)值信息(Alexander & Brown,2011; Hyman, Whitman, Emberly, Woodward, &Seamans, 2013)。但是在風(fēng)險(xiǎn)決策上, ACC似乎更多地參與動(dòng)作的執(zhí)行。ACC損傷雖然學(xué)習(xí) RGT較慢, 但并不影響最終學(xué)會(huì) (Rivalan et al., 2011);而學(xué)習(xí)PDT后ACC暫時(shí)失活也并不影響決策的風(fēng)險(xiǎn)偏向或反應(yīng)速度(St. Onge & Floresco, 2010)。
以上行為學(xué)研究成果, 說(shuō)明OFC和mPFC均參與風(fēng)險(xiǎn)決策, OFC更多參與動(dòng)物風(fēng)險(xiǎn)決策任務(wù)中策略的形成和負(fù)性結(jié)果的表征, 而 mPFC作用更加明顯, 既參與策略的形成, 又參與決策的執(zhí)行。對(duì)于皮層這兩個(gè)腦區(qū)功能的差異, 可以有以下解釋: ①研究表明lOFC更多地參與刺激?結(jié)果聯(lián)結(jié), 刺激?結(jié)果的學(xué)習(xí)被內(nèi)隱地包含在整個(gè)RGT學(xué)習(xí)過(guò)程中, 而在RGT的執(zhí)行中則更多是對(duì)優(yōu)勢(shì)策略的提取, 所以lOFC參與RGT學(xué)習(xí)而較少參與每個(gè)周期的執(zhí)行, 未來(lái)應(yīng)該更多地考察lOFC在RGT整個(gè)學(xué)習(xí)進(jìn)程中的作用; 而在PDT中, 每個(gè)周期中在自選任務(wù)前都執(zhí)行迫選任務(wù),與任務(wù)相關(guān)的獎(jiǎng)賞、風(fēng)險(xiǎn)信息都強(qiáng)化于反應(yīng)?結(jié)果聯(lián)結(jié)中, 所以lOFC在PDT上的作用并不明顯; ②mPFC在反應(yīng)?結(jié)果聯(lián)結(jié)中更加重要, 所以在風(fēng)險(xiǎn)決策任務(wù)特別是PDT的執(zhí)行上作用十分明顯, 因?yàn)閙PFC還與注意、工作記憶、計(jì)劃等大腦執(zhí)行功能有關(guān), 所以 mPFC可能參與信息的選擇和鞏固、對(duì)形成的策略保持、根據(jù)收益更新策略等環(huán)節(jié), 即參與 RGT和 PDT的學(xué)習(xí)和執(zhí)行的整個(gè)過(guò)程。③在風(fēng)險(xiǎn)決策過(guò)程中, OFC可能是“計(jì)算中樞”,而 mPFC更像是“執(zhí)行中樞”: OFC更多地參與對(duì)刺激關(guān)系、環(huán)境信息的處理, 而 mPFC則將信息匯總形成執(zhí)行策略并保存, 然后根據(jù)新的信息進(jìn)行策略更新。
細(xì)胞電生理研究發(fā)現(xiàn)腦內(nèi)多個(gè)結(jié)構(gòu)的神經(jīng)元編碼決策中的獎(jiǎng)賞概率信息(Burke & Tobler,2011), 如頂內(nèi)外側(cè)(Platt & Glimcher, 1999; Sugrue,Corrado, & Newsome, 2004), 中腦腹側(cè)被蓋區(qū)和黑質(zhì)致密部多巴胺能神經(jīng)元(Fiorillo, Tobler, &Schultz, 2003), 中腦和基底部的蒼白球內(nèi)側(cè)、蒼白球外側(cè)及黑質(zhì)網(wǎng)狀部(Hong & Hikosak, 2008;Joshua, Rosin, Vaadia, & Bergman, 2009; Tachibana& Hikosaka, 2012); OFC與邊緣系統(tǒng)、mPFC、感覺(jué)與運(yùn)動(dòng)皮層、顳葉、頂葉等多個(gè)腦區(qū)聯(lián)系緊密,表征刺激的價(jià)值, 并與其他腦區(qū)聯(lián)合指導(dǎo)以目標(biāo)導(dǎo)向行為(Takahashi et al., 2011)。在基于價(jià)值的決策任務(wù)(value-based decision making)中, OFC參與加工與刺激相關(guān)的獎(jiǎng)賞或懲罰信息, 可以表征刺激?結(jié)果的價(jià)值的改變, 并且嚙齒類(lèi)動(dòng)物 OFC神經(jīng)元更傾向于編碼刺激單方面的信息而非綜合信息(Burke, Franz, Miller, & Schoenbaum, 2008;Roesch, Taylor, & Schoenbaum, 2006; Burton,Kashtelyan, Bryden, & Roesch, 2014)。
以往研究認(rèn)為嚙齒類(lèi)動(dòng)物OFC中存在編碼獎(jiǎng)賞概率的神經(jīng)元, van Duuren等(2009)研究將不同氣味線索與不同概率的獎(jiǎng)賞建立聯(lián)系, 發(fā)現(xiàn)在線索呈現(xiàn)階段, 大鼠OFC中很多神經(jīng)元表現(xiàn)出放電頻率隨概率而上升或下降。另外, OFC神經(jīng)元在獎(jiǎng)賞評(píng)估階段能編碼大鼠冒險(xiǎn)偏好(risk attitude)。大鼠在自由選擇過(guò)程中表現(xiàn)出風(fēng)險(xiǎn)偏好的差異,分別存在尋求冒險(xiǎn)、中立以及避免冒險(xiǎn)的大鼠。而獎(jiǎng)賞評(píng)估階段有 3種情況: 選擇風(fēng)險(xiǎn)選項(xiàng)獲得大額獎(jiǎng)賞、選擇風(fēng)險(xiǎn)選項(xiàng)沒(méi)有獲得獎(jiǎng)賞以及選擇安全選項(xiàng)獲得小額獎(jiǎng)賞。追求冒險(xiǎn)的大鼠只有在選擇風(fēng)險(xiǎn)選項(xiàng)獲得大獎(jiǎng)賞后OFC神經(jīng)元放電頻率會(huì)顯著升高, 而風(fēng)險(xiǎn)中立的大鼠OFC神經(jīng)元只對(duì)是否獲得獎(jiǎng)賞有放電頻率的變化。這兩種放電模式的差異正說(shuō)明了OFC神經(jīng)元編碼了大鼠的風(fēng)險(xiǎn)偏好。研究還發(fā)現(xiàn)OFC神經(jīng)元的活動(dòng)活性隨風(fēng)險(xiǎn)大小的改變而改變, 并且更多出現(xiàn)在線索呈現(xiàn)階段和獎(jiǎng)賞傳送的階段(Roitman & Roitman, 2010)。靈長(zhǎng)類(lèi)猴子研究結(jié)果也證明OFC在線索評(píng)估選項(xiàng)階段和獎(jiǎng)賞評(píng)價(jià)階段能編碼風(fēng)險(xiǎn)信息, 而且風(fēng)險(xiǎn)信息的編碼獨(dú)立于價(jià)值編碼(O’Neill & Schultz,2010, 2013)。
關(guān)于OFC的功能和風(fēng)險(xiǎn)決策的關(guān)系尚存在爭(zhēng)議, 很多電生理學(xué)研究結(jié)果表明了這一點(diǎn)。Ogawa等(2013)認(rèn)為大鼠OFC對(duì)風(fēng)險(xiǎn)因素的編碼受到獎(jiǎng)賞大小的影響, 研究發(fā)現(xiàn)在線索呈現(xiàn)階段能表征風(fēng)險(xiǎn)的OFC神經(jīng)元, 更大程度上受獎(jiǎng)賞大小顯著性的影響: 即使是編碼風(fēng)險(xiǎn)的神經(jīng)元依然對(duì)獎(jiǎng)賞大小十分敏感。最近的研究觀點(diǎn)認(rèn)為, 作為感覺(jué)、運(yùn)動(dòng)、聯(lián)結(jié)信息的中樞, OFC的作用是對(duì)當(dāng)前任務(wù)的狀態(tài)的表征, 形成“認(rèn)知地圖” (Takahashi et al.,2013; Stalnaker, Cooch, & Schoenbaum, 2015;Wilson, Takahashi, Schoenbaum, & Niv, 2014)。按照此觀點(diǎn), 風(fēng)險(xiǎn)編碼不是 OFC的核心功能, 而是OFC形成的“認(rèn)知地圖”在風(fēng)險(xiǎn)決策任務(wù)中的表現(xiàn)。
大鼠mPFC功能較為復(fù)雜, mPFC神經(jīng)元對(duì)風(fēng)險(xiǎn)因素編碼特征的研究相對(duì)較少。但是近期研究表明 mPFC作為執(zhí)行功能的中樞腦結(jié)構(gòu), 參與不確定性的復(fù)雜表征。大鼠不確定地做出行為時(shí),mPFC的神經(jīng)網(wǎng)絡(luò)存在一種不穩(wěn)定狀態(tài), 這種不穩(wěn)定狀態(tài)表明大鼠對(duì)新的策略的探索(Karlsson,Tervo, & Karpova, 2012)。
總之, 目前關(guān)于風(fēng)險(xiǎn)決策的電生理學(xué)研究主要集中在 OFC, 較多關(guān)注腦區(qū)如何進(jìn)行價(jià)值表征和風(fēng)險(xiǎn)表征, 這個(gè)過(guò)程出現(xiàn)在決策的上游階段,而 OFC 作為“計(jì)算中樞”, 更多地處理刺激?結(jié)果的價(jià)值信息; 而mPFC作為“執(zhí)行中樞”在刺激?結(jié)果聯(lián)結(jié)中編碼哪一方面的信息作用不清晰。未來(lái)的神經(jīng)電生理研究需要設(shè)計(jì)出更能體現(xiàn)“執(zhí)行中樞”功能的反應(yīng)?結(jié)果聯(lián)結(jié)范式, 探究 mPFC在風(fēng)險(xiǎn)決策中的具體作用。
在學(xué)習(xí)RGT之前損傷基底外側(cè)杏仁核, 會(huì)顯著降低學(xué)習(xí)的速度, 但不會(huì)長(zhǎng)期地影響風(fēng)險(xiǎn)決策功能; 相反, 在學(xué)習(xí)任務(wù)之后對(duì)基底外側(cè)杏仁核進(jìn)行損傷, 將會(huì)導(dǎo)致動(dòng)物在RGT中持續(xù)地選擇不利的選項(xiàng)(Zeeb & Winstanley, 2011), 并在PDT中表現(xiàn)出更多的冒險(xiǎn)回避(Ghods-Sharifi, St. Onge,& Floresco, 2009)。結(jié)合杏仁核在情感通路中的作用, 提示杏仁核可能及時(shí)提供皮層適宜和非適宜的刺激信息和結(jié)果信息, 進(jìn)而指導(dǎo)風(fēng)險(xiǎn)決策的學(xué)習(xí)和策略轉(zhuǎn)換; 并且保存與價(jià)值相關(guān)的信息, 來(lái)指導(dǎo)風(fēng)險(xiǎn)決策中最優(yōu)策略的提取。
伏隔核參與風(fēng)險(xiǎn)決策的神經(jīng)機(jī)制非常復(fù)雜并且與其它腦區(qū)產(chǎn)生協(xié)同作用。伏隔核與其他腦區(qū)有廣泛的神經(jīng)纖維聯(lián)系主要受兩類(lèi)刺激信息輸入:一類(lèi)是腹側(cè)被蓋區(qū)的多巴胺能輸入, 另一類(lèi)是前額皮層和邊緣系統(tǒng)的谷氨酸能興奮性輸入。伏隔核根據(jù)腹側(cè)被蓋區(qū)(ventral tegmental area, VTA)的多巴胺能的信息輸入, 對(duì)行為的獎(jiǎng)賞水平進(jìn)行調(diào)節(jié), 進(jìn)而影響風(fēng)險(xiǎn)決策中的選擇偏向(Sugam, Day,Wightman, & Carelli, 2012)。谷氨酸能興奮性輸入來(lái)源主要為: 海馬負(fù)責(zé)提供空間位置、不同刺激聯(lián)結(jié)等信息; 基底外側(cè)杏仁核負(fù)責(zé)提供正性或負(fù)性結(jié)果等情感類(lèi)信息; 前額皮層負(fù)責(zé)提供行動(dòng)的成本?效益的評(píng)價(jià)信息以及期待?實(shí)際差異的評(píng)價(jià)信息(Floresco, 2015)。伏隔核通過(guò)綜合上述多種類(lèi)型的信息進(jìn)行價(jià)值判斷來(lái)影響決策的風(fēng)險(xiǎn)偏向和反應(yīng)靈活性。
伏隔核包含兩個(gè)亞區(qū): 核部和殼部。Cardinal和Howes (2005)最先使用PDT研究伏隔核在風(fēng)險(xiǎn)決策中的作用, 對(duì)伏隔核的核部進(jìn)行興奮毒性損傷, 大鼠后表現(xiàn)出風(fēng)險(xiǎn)回避。但是實(shí)驗(yàn)中的損傷處理也造成伏隔核殼部相當(dāng)程度的損害, 所以并不清楚伏隔核的核部和殼部的不同作用。后續(xù)研究發(fā)現(xiàn)大鼠伏隔核整體失活導(dǎo)致在PDT中回避風(fēng)險(xiǎn), 減少動(dòng)物對(duì)冒險(xiǎn)獎(jiǎng)賞的偏好, 也增加了反應(yīng)時(shí); 此外, 伏隔核的核部和殼部在風(fēng)險(xiǎn)決策中的作用并不相同, 殼部的失活會(huì)降低冒險(xiǎn)選擇; 而核部的失活不影響動(dòng)物的選擇, 但會(huì)導(dǎo)致反應(yīng)時(shí)延長(zhǎng)(Stopper & Floresco, 2011)。實(shí)驗(yàn)說(shuō)明伏隔核的核部和殼部在風(fēng)險(xiǎn)決策中的作用不同: 殼部與風(fēng)險(xiǎn)決策偏向和策略轉(zhuǎn)換的關(guān)系更大, 促使大鼠做出冒險(xiǎn)的決策, 而核部影響決策行為的強(qiáng)度。Floresco (2015)總結(jié)伏隔核的功能認(rèn)為, 伏隔核決定著選擇的方向和強(qiáng)度, 核部的作用是促使大鼠即刻行動(dòng), 而殼部的作用是使個(gè)體保持在任務(wù)執(zhí)行上, 調(diào)整行為的方向和靈活性。
紋狀體是腦內(nèi)接受多巴胺能神經(jīng)元投射最多的區(qū)域之一, 伏隔核是紋狀體腹側(cè)部最主要的核團(tuán)。獎(jiǎng)賞的概率大小反映了風(fēng)險(xiǎn)程度的高低, 大鼠的背側(cè)紋狀體神經(jīng)元對(duì)獎(jiǎng)賞概率的反應(yīng)與多巴胺神經(jīng)元對(duì)獎(jiǎng)賞概率的反應(yīng)相類(lèi)似。Oyama, Hernádi,Iijima和 Tsutsui (2010)采用不同頻率的聲音刺激作為不同概率獎(jiǎng)賞的線索, 在獎(jiǎng)賞預(yù)期階段, 背側(cè)紋狀體神經(jīng)元對(duì)線索進(jìn)行反應(yīng), 線索提示的獎(jiǎng)賞概率越高, 放電頻率越高; 而在獲得獎(jiǎng)賞階段,放電模式正好相反, 獎(jiǎng)賞概率越低, 放電頻率越高, 反映了結(jié)果與預(yù)期的差異。但是背側(cè)紋狀體神經(jīng)元對(duì)概率的編碼和主觀價(jià)值沒(méi)有關(guān)系, 因?yàn)闊o(wú)論動(dòng)物是否飽食, 對(duì)概率信息都有不變的反應(yīng)。相反, 伏隔核神經(jīng)元的活動(dòng)反映大鼠的主觀信息, Sugam, Saddoris和Carelli (2014)考察大鼠在風(fēng)險(xiǎn)與安全的選擇偏好, 發(fā)現(xiàn)伏隔核的神經(jīng)元在大鼠自由選擇階段可以編碼在大鼠風(fēng)險(xiǎn)偏好的信息: 伏隔核核部在決策過(guò)程中表現(xiàn)為抑制的神經(jīng)元越少、而表現(xiàn)為興奮的神經(jīng)元越多, 則大鼠越偏好冒險(xiǎn), 而抑制性的神經(jīng)元越多, 興奮性的神經(jīng)元越少, 則大鼠越偏好安全; 而殼部則正好是相反的模式(Sugam et al., 2014)。這說(shuō)明在伏隔核的兩個(gè)亞區(qū)存在控制風(fēng)險(xiǎn)偏好的不同類(lèi)型的神經(jīng)元。
前額皮層與基底外側(cè)杏仁核有交互的直接纖維投射, 均發(fā)出纖維間接投射到伏隔核(Bacon,Headlam, Gabbott, & Smith, 1996; McDonald, 1991)。mPFC與基底外側(cè)杏仁核之間分別通過(guò)腹外側(cè)杏仁核束支和腹內(nèi)側(cè)內(nèi)囊進(jìn)行交互的直接纖維投射;OFC的傳出纖維則主要投射到尾狀核與殼核;OFC與mPFC之間存在大量的纖維聯(lián)系(見(jiàn)圖1)。
圖1 前額皮層?杏仁核?伏隔核神經(jīng)環(huán)路圖
基底外側(cè)杏仁核投射至伏隔核的神經(jīng)通路主要與目標(biāo)導(dǎo)向性行為的選擇方向有關(guān), 該通路激活后傾向于冒險(xiǎn)選擇, 并進(jìn)一步通過(guò)到運(yùn)動(dòng)區(qū)的投射來(lái)影響行為(Ambroggi, Ishikawa, Fields, &Nicola, 2008)。阻斷基底外側(cè)杏仁核向伏隔核的投射, 動(dòng)物由選擇風(fēng)險(xiǎn)選項(xiàng)改為安全選項(xiàng)(Ghods-Sharifi et al., 2009; St. Onge et al., 2012), 究其原因, Smith等(2009)認(rèn)為基底外側(cè)杏仁核?伏隔核通路負(fù)責(zé)編碼不同選擇的相對(duì)價(jià)值信息, 當(dāng)損毀該環(huán)路時(shí), 基底外側(cè)杏仁核?伏隔核環(huán)路對(duì)冒險(xiǎn)選擇的相對(duì)價(jià)值評(píng)價(jià)降低, 因此會(huì)轉(zhuǎn)而選擇風(fēng)險(xiǎn)小的安全的選項(xiàng)。杏仁核?伏隔核受到前額皮層的調(diào)節(jié), 前額皮層通過(guò)發(fā)出至基底外側(cè)杏仁核的下行纖維投射調(diào)節(jié)基底外側(cè)杏仁核?伏隔核環(huán)路的活動(dòng)。
OFC和基底外側(cè)杏仁核的聯(lián)系對(duì)于價(jià)值表征和認(rèn)知靈活性具有重要作用。OFC對(duì)于獎(jiǎng)賞價(jià)值的編碼依賴(lài)于杏仁核的傳入信息, 基底外側(cè)杏仁核損傷后, 大鼠OFC神經(jīng)元無(wú)法編碼刺激的獎(jiǎng)賞價(jià)值, 只能編碼刺激的感覺(jué)特征(Schoenbaum,Setlow, Saddoris, & Gallagher, 2003)。OFC指導(dǎo)動(dòng)物進(jìn)行行為轉(zhuǎn)換時(shí)需依賴(lài)于來(lái)自基底外側(cè)杏仁核的更新信息的輸入(Stalnaker, Franz, Singh, &Schoenbaum, 2007)。另一方面, OFC損毀導(dǎo)致基底外側(cè)杏仁核的獎(jiǎng)賞期待性神經(jīng)元放電減少, 說(shuō)明OFC編碼了獎(jiǎng)賞的價(jià)值信息, 來(lái)自O(shè)FC的信息輸入又是杏仁核產(chǎn)生獎(jiǎng)賞期待的來(lái)源(Schoenbaum& Roesch, 2005)。采用非對(duì)稱(chēng)損毀基底外側(cè)杏仁核與 OFC的方法阻斷大鼠基底外側(cè)杏仁核與OFC聯(lián)系后, 大鼠在RGT中策略的學(xué)習(xí)與更新都受到了影響(Zeeb & Winstanley, 2013)。
由于mPFC負(fù)責(zé)學(xué)習(xí)環(huán)境、位置、事件與相應(yīng)的適應(yīng)性行為之間的連接(Euston, Gruber, &McNaughton, 2012), 其中與基底外側(cè)杏仁核之間的聯(lián)系在適應(yīng)性行為中尤為重要(Likhtik & Paz,2015)。mPFC與基底外側(cè)杏仁核之間雖然存在直接的纖維投射, 但是投射途徑不同: mPFC發(fā)出的下行神經(jīng)纖維途經(jīng)腹內(nèi)側(cè)內(nèi)囊投射至基底外側(cè)杏仁核; 基底外側(cè)杏仁核發(fā)出的上行投射纖維經(jīng)腹外側(cè)杏仁核束支通路到達(dá) mPFC (Bacon et al.,1996)。損傷mPFC?杏仁核下行投射, 將導(dǎo)致選擇傾向于風(fēng)險(xiǎn)選項(xiàng), 而在選擇風(fēng)險(xiǎn)選項(xiàng)未獲得獎(jiǎng)賞后轉(zhuǎn)移到安全選項(xiàng)的行為減少, 說(shuō)明對(duì)負(fù)性結(jié)果敏感性降低, 不能夠及時(shí)轉(zhuǎn)換策略, 提示 mPFC-基底外側(cè)杏仁核下行通路參與獎(jiǎng)賞信息的傳達(dá)以及選擇偏差的調(diào)節(jié)(St. Onge, Stopper, Zahm, &Floresco, 2012)。該效應(yīng)與損毀mPFC的結(jié)果非常類(lèi)似, 也與損傷 mPFC-基底外側(cè)杏仁核雙向投射的效果類(lèi)似, 但是與損傷基底外側(cè)杏仁核的作用相反。反之, 損傷基底外側(cè)杏仁核-mPFC的上行纖維投射, 對(duì)選擇沒(méi)有影響, 提示雖然基底外側(cè)杏仁核可以將獎(jiǎng)賞信息上行輸入 mPFC, 但是這個(gè)信息不足以改變風(fēng)險(xiǎn)決策的選擇方向。
前額葉皮層至腹側(cè)紋狀體的投射是與注意、工作記憶、認(rèn)知彈性等執(zhí)行功能有關(guān)的重要結(jié)構(gòu)(Christakou, Robbins, & Everitt, 2004)。mPFC 至伏隔核的投射受阻, 大鼠在PDT上的風(fēng)險(xiǎn)偏好并不受影響, 但會(huì)造成潛伏期延長(zhǎng)、完成任務(wù)能力下降(St. Onge et al., 2012) 。根據(jù)mPFC-杏仁核通路對(duì)風(fēng)險(xiǎn)決策的影響, 可以認(rèn)為 mPFC發(fā)出的下行投射是平行傳出的, 分別調(diào)節(jié)皮層下各個(gè)結(jié)構(gòu)的功能: 發(fā)出纖維投射到杏仁核來(lái)調(diào)節(jié)決策選擇的偏差, 而發(fā)出纖維投射到伏隔核來(lái)控制選擇的速度, 以便快速完成決策任務(wù)(St. Onge et al., 2012)。
在前額皮層?杏仁核?伏隔核環(huán)路的研究中,針對(duì)前額皮層的研究多集中在mPFC。關(guān)于ACC的研究相對(duì)較少。研究結(jié)果顯示, 在基于努力的決策中, ACC的功能依賴(lài)于其神經(jīng)環(huán)路的完整性,阻斷ACC與伏隔核之間的聯(lián)系, 導(dǎo)致大鼠無(wú)法在不同價(jià)值的獎(jiǎng)賞之間做出正常選擇(Hauber &Sommer, 2009)。
黑質(zhì)致密部和 VTA中多巴胺能神經(jīng)元參與對(duì)風(fēng)險(xiǎn)信息的編碼。Fiorillo等(2003)在條件反射程序中設(shè)立不同視覺(jué)刺激和獎(jiǎng)賞概率之間的聯(lián)結(jié),發(fā)現(xiàn)在刺激呈現(xiàn)階段, 當(dāng)獎(jiǎng)賞概率增大或者減少時(shí), 多巴胺能神經(jīng)元放電頻率也出現(xiàn)對(duì)應(yīng)的時(shí)相性升高或者降低(phasic response)說(shuō)明多巴胺能神經(jīng)元能夠編碼概率信息。實(shí)驗(yàn)進(jìn)一步發(fā)現(xiàn), 接近30%的編碼獎(jiǎng)賞概率的神經(jīng)元除了在概率信息出現(xiàn)時(shí)產(chǎn)生時(shí)相性放電外, 還在刺激呈現(xiàn)之后出現(xiàn)了一種頻率較低的持續(xù)性放電, 這種放電一直持續(xù)到獎(jiǎng)賞時(shí)段。這種持續(xù)性放電和時(shí)相性放電不同, 其放電頻率和風(fēng)險(xiǎn)大小相關(guān)(風(fēng)險(xiǎn)和概率的關(guān)系呈現(xiàn)倒U型曲線, 在獎(jiǎng)賞確定時(shí), 概率為0.5的選項(xiàng)風(fēng)險(xiǎn)最大)。研究說(shuō)明多巴胺神經(jīng)元同時(shí)參與概率編碼和風(fēng)險(xiǎn)編碼。另外, 大鼠伏隔核的 DA含量時(shí)相變化或緊張性 DA水平能夠反映風(fēng)險(xiǎn)信息, Sugam等(2012)評(píng)估大鼠在風(fēng)險(xiǎn)決策中的冒險(xiǎn)偏好, 利用微透析壓技術(shù)測(cè)定任務(wù)過(guò)程中伏隔核的 DA釋放量的時(shí)相性變化, 發(fā)現(xiàn)在大鼠自由選擇階段線索呈現(xiàn)時(shí), 伏隔核中 DA釋放量時(shí)相性變化高低能預(yù)測(cè)動(dòng)物偏向于安全還是風(fēng)險(xiǎn)。St.Onge, Ahn, Phillips和Floresco (2012)用微透析技術(shù)記錄風(fēng)險(xiǎn)決策過(guò)程中大鼠前額皮層和伏隔核的緊張性DA水平(tonic DA levels)。前額皮層和伏隔核的DA含量動(dòng)態(tài)變化反映了獎(jiǎng)賞的可獲得性,但伏隔核的DA含量同時(shí)也編碼了風(fēng)險(xiǎn)信息。
多巴胺系統(tǒng)的獎(jiǎng)賞概率信息可能來(lái)源于韁外側(cè)核(lateral habenula, LHb)。研究發(fā)現(xiàn)LHb神經(jīng)元興奮后抑制多巴胺能神經(jīng)元的活動(dòng), 具體過(guò)程為: 刺激LHb的谷氨酸能神經(jīng)元可以導(dǎo)致喙內(nèi)側(cè)被蓋區(qū)(Rostromedial Tegmental, RMTg)神經(jīng)元活動(dòng)增強(qiáng), RMTg再通過(guò)釋放GABA抑制VTA的多巴胺能神經(jīng)元活動(dòng)(Jhou, Fields, Baxter, Saper, &Holland, 2009; Hong, Jhou, Smith, Saleem, &Hikosaka, 2011)。LHb神經(jīng)元編碼獎(jiǎng)賞的放電模式與多巴胺能神經(jīng)元相反, 但反應(yīng)速度相似: 即隨著獎(jiǎng)賞概率的增加, 當(dāng)獎(jiǎng)賞刺激呈現(xiàn)時(shí)LHb神經(jīng)元的放電活動(dòng)抑制(Matsumoto &Hikosaka, 2009);反之, 當(dāng)預(yù)示厭惡事件的刺激出現(xiàn)時(shí), LHb神經(jīng)元的放電頻率增加, 從而抑制多巴胺能神經(jīng)元的活動(dòng)(Bromberg-Martin, Matsumoto, Hong, & Hikosaka,2010)。Stopper, Tse, Montes和 Floresco (2014)電刺激LHb導(dǎo)致DA釋放量出現(xiàn)時(shí)相性的變化, 大鼠在PDT中選擇偏好發(fā)生變化。大鼠選擇風(fēng)險(xiǎn)選項(xiàng)后大獎(jiǎng)賞給予時(shí)刺激 LHb, 冒險(xiǎn)選擇減少, 行為趨向保守; 大鼠選擇安全選項(xiàng)時(shí)刺激 LHb, 冒險(xiǎn)選擇增多。因?yàn)長(zhǎng)Hb對(duì)多巴胺能神經(jīng)元的抑制作用導(dǎo)致大鼠對(duì)獎(jiǎng)賞的敏感性降低, 從而影響DA對(duì)風(fēng)險(xiǎn)決策的指導(dǎo)作用。
不同的多巴胺能受體在風(fēng)險(xiǎn)決策PDT中的作用不同(見(jiàn)表1)。在PDT中, 腹腔注射D1受體拮抗劑 SCH23390、D2受體拮抗劑鹽酸依替必利(eticlopride hydrochloride)或者D1/D2受體拮抗劑三氟噻噸, 可以降低大鼠的風(fēng)險(xiǎn)偏好, 注射D1受體激動(dòng)劑SKF81297或D2受體激動(dòng)劑溴麥角環(huán)肽(bromocriptine)則增加風(fēng)險(xiǎn)偏好。與之相反, 注射 D3受體激動(dòng)劑 PD128, 907可減少冒險(xiǎn)選擇,給予 D3受體拮抗劑那法道曲(nafadotride)則具有增加冒險(xiǎn)選擇的作用。D4受體激活或阻斷作用對(duì)選擇行為沒(méi)有影響(St. Onge, Chiu, & Floresco,2010)。而在RGT中, 注射安非他明(amphetamine)來(lái)抑制DA重?cái)z取, 則增加動(dòng)物的風(fēng)險(xiǎn)偏好(Zeeb,Robbins, & Winstanley, 2009)。以上結(jié)果提示, DA釋放的增加可能破壞個(gè)體根據(jù)獎(jiǎng)賞的價(jià)值和不確定性等信息對(duì)行為選擇做出調(diào)整的能力。
進(jìn)一步的研究表明, 不同腦區(qū)的D1和D2受體在風(fēng)險(xiǎn)決策中也具有不同的作用, 如前額皮層和伏隔核中的D1、D2和D3受體在風(fēng)險(xiǎn)決策中作用不同。在mPFC注射D1受體拮抗劑SCH23390將會(huì)降低PDT的風(fēng)險(xiǎn)偏好, 與腹腔注射所得到的結(jié)果一致。而在 mPFC注射 D1受體激動(dòng)劑SKF81297則對(duì)風(fēng)險(xiǎn)選擇偏好無(wú)顯著影響。相反地,在 mPFC注射 D2受體拮抗劑鹽酸依替必利則會(huì)增加動(dòng)物的風(fēng)險(xiǎn)選擇。而 D2受體激動(dòng)劑喹吡羅(quinpirole)將損害動(dòng)物在整個(gè)決策任務(wù)中的表現(xiàn),無(wú)法進(jìn)行優(yōu)勢(shì)選擇, 與 mPFC失活的效應(yīng)類(lèi)似。說(shuō)明在PDT決策過(guò)程中, mPFC中的D2受體在風(fēng)險(xiǎn)決策中具有重要作用。在伏隔核注射 D1受體拮抗劑會(huì)降低PDT的風(fēng)險(xiǎn)偏好, 與在mPFC注射和腹腔注射所得到的結(jié)果一致。而伏隔核注射D1受體激動(dòng)劑會(huì)增加最適應(yīng)性行為: 當(dāng)風(fēng)險(xiǎn)有利時(shí)會(huì)增加風(fēng)險(xiǎn)選項(xiàng), 當(dāng)概率下降時(shí)及時(shí)轉(zhuǎn)移, 促進(jìn)行為轉(zhuǎn)向獲利的方向。伏隔核的 D2受體功能比較復(fù)雜, 在研究中沒(méi)有影響風(fēng)險(xiǎn)決策的有效證據(jù),注射 D3受體激動(dòng)劑會(huì)降低動(dòng)物風(fēng)險(xiǎn)選擇(St.Onge, Abhari, & Floresco, 2011; Stopper et al., 2013)。但是也有研究得出不一致的結(jié)論, Mai和 Hauber(2012, 2015)在 mPFC、伏隔核以及 OFC注射 6-羥基多巴胺, 大鼠的風(fēng)險(xiǎn)偏向并不受影響, 這可能與6-羥基多巴胺不是特異性的D1、D2等受體亞型阻斷劑有關(guān)。最新研究發(fā)現(xiàn), D1/D2受體作用主要在核部而不在殼部(Mai, Sommer, & Hauber,2015)。
表1 興奮或阻斷不同多巴胺能受體對(duì)PDT任務(wù)的影響
到目前為止, 在風(fēng)險(xiǎn)決策領(lǐng)域?qū)ι窠?jīng)遞質(zhì)系統(tǒng)的研究主要集中在DA系統(tǒng)對(duì)風(fēng)險(xiǎn)決策的影響上。其他的神經(jīng)遞質(zhì)如五羥色胺(5-hydroxytryptamine,5-HT)和去甲腎上腺素(Norepinephrine, NA)也有少量研究。研究表明, 人類(lèi)與嚙齒類(lèi)動(dòng)物的概率折扣任務(wù)的完成均未受到 5-HT消耗的影響(Anderson, Richell, & Bradshaw, 2003)。而在大鼠賭博任務(wù)中, 注射 5-HT受體激動(dòng)劑 8-OH-DPAT的效果與注射安非他明一樣, 增加了動(dòng)物的風(fēng)險(xiǎn)偏好(Zeeb et al., 2009)。
NA對(duì)風(fēng)險(xiǎn)決策的影響目前所知較少。有研究表明, NA神經(jīng)元編碼了不確定性(在給定框架下做預(yù)測(cè))的某些方面, 是以一種與乙酰膽堿相互補(bǔ)充的方式(Yu & Dayan, 2005)。此外, 系統(tǒng)的NA阻塞將會(huì)對(duì)人類(lèi)的不確定性決策產(chǎn)生影響。近年來(lái)發(fā)現(xiàn) NA的重吸收抑制劑阿托莫西汀和多巴胺重吸收抑制劑 GBR12909共同作用會(huì)損害大鼠在 RGT上的表現(xiàn)(Baarendse, Winstanley, &Vanderschuren, 2013), 提示 NA遞質(zhì)系統(tǒng)和多巴胺遞質(zhì)系統(tǒng)存在相互作用。最近, Montes, Stopper和 Floresco (2015)發(fā)現(xiàn) α2受體激動(dòng)劑氯壓定(clonidine)減少大鼠在 PDT上的風(fēng)險(xiǎn)選擇, 原因是降低了對(duì)獎(jiǎng)賞的敏感性, 而胍法辛(guanfacine)不影響選擇行為。α2受體拮抗劑育亨賓(yohimbine)影響大鼠策略調(diào)整, 是因?yàn)楦淖兞舜笫髮?duì)負(fù)性反饋的敏感性??梢钥闯? NA在風(fēng)險(xiǎn)決策中的作用比較復(fù)雜, 需要進(jìn)一步研究其作用機(jī)理。
風(fēng)險(xiǎn)決策的動(dòng)物模型是人類(lèi)研究范式的重要補(bǔ)充, 與人類(lèi)被試相比, 在研究神經(jīng)環(huán)路結(jié)構(gòu)之間的解剖和功能聯(lián)系上, 嚙齒類(lèi)動(dòng)物模型有著獨(dú)特的優(yōu)勢(shì)。首先, 在行為學(xué)方面, 動(dòng)物模型具有相對(duì)簡(jiǎn)單的行為模式, 通過(guò)動(dòng)物行為的各個(gè)方面的觀察可以推理出決策的各個(gè)階段。其次, 在動(dòng)物模型中可以實(shí)施腦定位損毀與藥物注射、電刺激或者光遺傳激活特殊神經(jīng)元等侵入性干預(yù)手段,也可以在細(xì)胞水平上對(duì)各腦區(qū)的神經(jīng)元放電活動(dòng)進(jìn)行觀察記錄, 通過(guò)動(dòng)物實(shí)驗(yàn)可以更加深入地考察腦功能與行為之間的關(guān)系, 是人類(lèi)研究范式的重要補(bǔ)充。
但是風(fēng)險(xiǎn)決策的動(dòng)物模型有著一定的局限,例如概率折扣任務(wù)無(wú)法對(duì)現(xiàn)實(shí)生活中的人類(lèi)風(fēng)險(xiǎn)決策進(jìn)行較大程度上的模擬, 甚至不確定的獎(jiǎng)賞概率是否能夠作為風(fēng)險(xiǎn)因素也受到質(zhì)疑。雖然大鼠博弈任務(wù)能夠較好的模擬人類(lèi)風(fēng)險(xiǎn)決策, 但實(shí)驗(yàn)結(jié)果綜合了各種因素, 不能細(xì)分出決策的各個(gè)階段和各個(gè)因素的作用, 從而在電生理研究推廣上受限。動(dòng)物模型研究和人類(lèi)決策研究成果有一定差異, 其中一個(gè)因素是風(fēng)險(xiǎn)決策任務(wù)的生態(tài)化。近年來(lái), 研究者們也在對(duì)風(fēng)險(xiǎn)決策的動(dòng)物模型的改進(jìn)方面進(jìn)行了不懈的努力, 如將懲罰變量引入了概率折扣任務(wù)中(Simon, Gilbert, Mayse, Bizon,& Setlow, 2009); Jentsch等人(2010)設(shè)計(jì)了大鼠的氣球模擬風(fēng)險(xiǎn)決策任務(wù)。以期能在更大程度上對(duì)人類(lèi)的風(fēng)險(xiǎn)決策進(jìn)行模擬, 增加實(shí)驗(yàn)的效度。
關(guān)于風(fēng)險(xiǎn)決策神經(jīng)環(huán)路的研究多采用局部腦功能損毀方法, 通過(guò)注射局部可逆性腦功能抑制劑或者神經(jīng)毒素使腦功能暫時(shí)或永久失活。這種方法通過(guò)觀察腦損傷后的行為學(xué)改變可以觀察各個(gè)腦區(qū)在風(fēng)險(xiǎn)決策中的作用。神經(jīng)電生理學(xué)方法通過(guò)記錄不同腦區(qū)的神經(jīng)元放電活動(dòng), 觀察神經(jīng)元活動(dòng)與行為學(xué)之間的關(guān)系, 尤其是在觀察神經(jīng)元在風(fēng)險(xiǎn)決策的各個(gè)階段的編碼方式以及腦區(qū)之間的相互聯(lián)系方面具有一定優(yōu)勢(shì), 目前關(guān)于風(fēng)險(xiǎn)決策的電生理研究多以猴等靈長(zhǎng)類(lèi)動(dòng)物為研究對(duì)象, 且研究的腦區(qū)和深部核團(tuán)數(shù)目也有限, 隨著多通道神經(jīng)元記錄等電生理技術(shù)以及光遺傳技術(shù)的發(fā)展, 未來(lái)針對(duì)神經(jīng)元編碼方式等方面的研究將會(huì)具有廣闊的前景。
前額葉?紋狀體?邊緣系統(tǒng)中各神經(jīng)結(jié)構(gòu)與決策的不同環(huán)節(jié)有密切關(guān)系, 而風(fēng)險(xiǎn)決策是一個(gè)信息不斷更新和策略不斷調(diào)整的過(guò)程, 需要根據(jù)環(huán)境信息的變化即時(shí)計(jì)算成本與收益, 并且為了獲得最大利益隨時(shí)調(diào)整選擇方向, 因此是一個(gè)動(dòng)態(tài)過(guò)程, 各個(gè)結(jié)構(gòu)之間形成了復(fù)雜的神經(jīng)聯(lián)系。研究信息如何在神經(jīng)環(huán)路內(nèi)進(jìn)行傳遞, 以及不同腦區(qū)之間如何進(jìn)行協(xié)同活動(dòng), 是未來(lái)進(jìn)一步揭示風(fēng)險(xiǎn)決策神經(jīng)機(jī)制的重要方向。神經(jīng)遞質(zhì)如多巴胺等對(duì)風(fēng)險(xiǎn)決策過(guò)程中動(dòng)物選擇行為的影響尚存在一些爭(zhēng)議, 腦內(nèi)多巴胺含量對(duì)風(fēng)險(xiǎn)決策過(guò)程中其他環(huán)節(jié)是否產(chǎn)生影響, 以及除多巴胺以外其他相關(guān)神經(jīng)遞質(zhì)對(duì)風(fēng)險(xiǎn)決策過(guò)程產(chǎn)生的影響尚待進(jìn)一步研究。
綜上所述, 風(fēng)險(xiǎn)決策的嚙齒類(lèi)動(dòng)物研究范式及其腦機(jī)制研究對(duì)研究動(dòng)物以及人類(lèi)的決策行為具有重要作用, 并且已經(jīng)取得了一定的進(jìn)展, 但仍需在動(dòng)物研究范式的生態(tài)化、神經(jīng)環(huán)路聯(lián)系以及神經(jīng)遞質(zhì)的功能等方面開(kāi)展進(jìn)一步的深入研究。
Alexander, W. H., & Brown, J. W. (2011). Medial prefrontal cortex as an action-outcome predictor.Nature Neuroscience,14(10), 1338–1344.
Ambroggi, F., Ishikawa, A., Fields, H. L., & Nicola, S. M.(2008). Basolateral amygdala neurons facilitate rewardseeking behavior by exciting nucleus accumbens neurons.Neuron, 59(4), 648–661.
Anderson, I. M., Richell, R. A., & Bradshaw, C. M. (2003).The effect of acute tryptophan depletion on probabilistic choice.Journal of Psychopharmacology, 17(1), 3–7.
Baarendse, P. J. J., Winstanley, C. A., & Vanderschuren, L. J.M. J. (2013). Simultaneous blockade of dopamine and noradrenaline reuptake promotes disadvantageous decision making in a rat gambling task.Psychopharmacology,225(3), 719–731.
Bacon, S. J., Headlam, A. J. N., Gabbott, P. L. A., & Smith,A. D. (1996). Amygdala input to medial prefrontal cortex(mPFC) in the rat: A light and electron microscope study.Brain Research, 720(1-2), 211–219.
Boutros, N., Semenova, S., Liu, W., Crews, F. T., & Markou,A. (2015). Adolescent intermittent ethanol exposure is associated with increased risky choice and decreased dopaminergic and cholinergic neuron markers in adult rats.International Journal of Neuropsychopharmacology, 18(2),pyu003.
Bromberg-Martin, E. S., Matsumoto, M., Hong, S., &Hikosaka, O. (2010). A pallidus-habenula-dopamine pathway signals inferred stimulus values.Journal of Neurophysiology,104(2), 1068–1076.
Burke, C. J., & Tobler, P. N. (2011). Coding of reward probability and risk by single neurons in animals.Frontiers in Neuroscience, 5, 121.
Burke, K. A., Franz, T. M., Miller, D. N., & Schoenbaum, G.(2008). The role of the orbitofrontal cortex in the pursuit of happiness and more specific rewards.Nature, 454(7202), 340–344.
Burton, A. C., Kashtelyan, V., Bryden, D. W., & Roesch, M.R. (2014). Increased firing to cues that predict low-value reward in the medial orbitofrontal cortex.Cerebral Cortex,24(12), 3310–3321.
Cardinal, R. N., & Howes, N. J. (2005). Effects of lesions of the nucleus accumbens core on choice between small certain rewards and large uncertain rewards in rats.BMC Neuroscience, 6(1), 37.
Christakou, A., Robbins, T. W., & Everitt, B. J. (2004).Prefrontal cortical–ventral striatal interactions involved in affective modulation of attentional performance: Implications for corticostriatal circuit function.The Journal of Neuroscience, 24(4), 773–780.
de Visser, L., Baars, A. M., Lavrijsen, M., van der Weerd, C.M. M., & van den Bos, R. (2011). Decision–making performance is related to levels of anxiety and differential recruitment of frontostriatal areas in male rats.Neuroscience,184, 97–106.
de Visser, L., Homberg, J. R., Mitsogiannis, M., Zeeb, F. D.,Rivalan, M., Fitoussi, A.,... Dellu–Hagedorn, F. (2011).Rodent versions of the Iowa gambling task: Opportunities and challenges for the understanding of decision–making.Frontiers in Neuroscience, 5, 109.
Euston, D. R., Gruber, A. J., & McNaughton, B. L. (2012).The role of medial prefrontal cortex in memory and decision making.Neuron, 76(6), 1057-1070.
Fiorillo, C. D., Tobler, P. N., & Schultz, W. (2003). Discrete coding of reward probability and uncertainty by dopamine neurons.Science, 299(5614), 1898–1902.
Floresco, S. B. (2015). The nucleus accumbens: An interface between cognition, emotion, and action.Annual Review of Psychology, 66, 25–52.
Ghods-Sharifi, S., St. Onge, J. R., & Floresco, S. B. (2009).Fundamental contribution by the basolateral amygdala to different forms of decision making.The Journal of Neuroscience, 29(16), 5251–5259.
Gilbert, R. J., Mitchell, M. R., Simon, N. W., Ba?uelos, C.,Setlow, B., & Bizon, J. L. (2012). Risk, reward, and decision-making in a rodent model of cognitive aging.Frontiers in Neuroscience, 5, 144.
Hauber, W., & Sommer, S. (2009). Prefrontostriatal circuitry regulates effort–related decision making.Cerebral Cortex,19(10), 2240–2247.
Hogarth, R. M., & Reder, M. W. (1986). The behavioral foundations of economic theory.The Journal of Business,59(4 pt 2), S209–S224.
Hong, S., & Hikosaka, O. (2008). The globus pallidus sends reward-related signals to the lateral habenula.Neuron,60(4), 720-729.
Hong, S., Jhou, T. C., Smith, M., Saleem, K. S., & Hikosaka,O. (2011). Negative reward signals from lateral habenula to dopamine neurons are mediated by rostromedial tegmental nucleus in primates.The Journal of Neuroscience,31(32), 11457–11471.
Hoover, W. B., & Vertes, R. P. (2007). Anatomical analysis of afferent projections to the medial prefrontal cortex in the rat.Brain Structure and Function, 212(2), 149–179.
Hyman, J. M., Whitman, J., Emberly, E., Woodward, T. S., &Seamans, J. K. (2013). Action and outcome activity state patterns in the anterior cingulate cortex.Cerebral Cortex,23(6),1257–1268.
Jentsch, J. D., Woods, J. A., Groman, S. M., & Seu, E.(2010). Behavioral characteristics and neural mechanisms mediating performance in a rodent version of the Balloon Analog Risk Task.Neuropsychopharmacology, 35(8),1797–1806.
Jhou, T. C., Fields, H. L., Baxter, M. G., Saper, C. B., &Holland, P. C. (2009). The rostromedial tegmental nucleus(RMTg), a GABAergic afferent to midbrain dopamine neurons, encodes aversive stimuli and inhibits motor responses.Neuron, 61(5), 786–800.
Joshua, M., Adler, A., Rosin, B., Vaadia, E., & Bergman, H.(2009). Encoding of probabilistic rewarding and aversive events by pallidal and nigral neurons.Journal of Neurophysiology, 101(2), 758–772.
Kacelnik, A., & Bateson, M. (1997). Risk–sensitivity:Crossroads for theories of decision–making.Trends in Cognitive Sciences, 1(8), 304–309.
Karlsson, M. P., Tervo, D. G. R., & Karpova, A. Y. (2012).Network resets in medial prefrontal cortex mark the onset of behavioral uncertainty.Science, 338(6103), 135–139.
Levy, I., Snell, J., Nelson, A. J., Rustichini, A., & Glimcher,P. W. (2010). Neural representation of subjective value under risk and ambiguity.Journal of Neurophysiology,103(2), 1036–1047.
Likhtik, E., & Paz, R. (2015). Amygdala–prefrontal interactions in (mal)adaptive learning.Trends in Neurosciences, 38(3),158–166.
Mai, B., & Hauber, W. (2012). Intact risk-based decision making in rats with prefrontal or accumbens dopamine depletion.Cognitive, Affective, & Behavioral Neuroscience,12(4), 719–729.
Mai, B., & Hauber, W. (2015). Orbitofrontal or accumbens dopamine depletion does not affect risk-based decision making in rats.Cognitive, Affective & Behavioral Neuroscience, 15(3), 507–522.
Mai, B., Sommer, S., & Hauber, W. (2015). Dopamine D1/D2 receptor activity in the nucleus accumbens core but not in the nucleus accumbens shell and orbitofrontal cortex modulates risk-based decision making.International Journal of Neuropsychopharmacology, 18(10), pyv043.
Matsumoto, M., & Hikosaka, O. (2009). Representation of negative motivational value in the primate lateral habenula.Nature Neuroscience, 12(1), 77–84.
McDonald, A. J. (1991). Organization of amygdaloid projections to the prefrontal cortex and associated striatum in the rat.Neuroscience, 44(1), 1–14.
Montes, D. R., Stopper, C. M., & Floresco, S. B. (2015).Noradrenergic modulation of risk/reward decision making.Psychopharmacology, 232(15), 2681–2696.
Nasrallah, N. A., Clark, J. J., Collins, A. L., Akers, C. A.,Phillips, P. E., & Bernstein, I. L. (2011). Risk preference following adolescent alcohol use is associated with corrupted encoding of costs but not rewards by mesolimbic dopamine.Proceedings of the National Academy of Sciences of the United States of America, 108(13), 5466–5471.
Ogawa, M., van der Meer, M. A. A., Esber, G. R., Cerri, D.H., Stalnaker, T. A., & Schoenbaum, G. (2013). Riskresponsive orbitofrontal neurons track acquired salience.Neuron, 77(2), 251–258.
O'Neill, M., & Schultz, W. (2010). Coding of reward risk by orbitofrontal neurons is mostly distinct from coding of reward value.Neuron, 68(4), 789–800.
O'Neill, M., & Schultz, W. (2013). Risk prediction error coding in orbitofrontal neurons.The Journal of Neuroscience,33(40), 15810–15814.
?ngür, D., & Price, J. L. (2000). The organization of networks within the orbital and medial prefrontal cortex of rats, monkeys and humans.Cerebral Cortex, 10(3), 206–219.
Orsini, C. A., Trotta, R. T., Bizon, J. L., & Setlow, B. (2015).Dissociable roles for the basolateral amygdala and orbitofrontal cortex in decision-making under risk of punishment.The Journal of Neuroscience, 35(4), 1368–1379.
Oyama, K., Hernádi, I., Iijima, T., & Tsutsui, K. I. (2010).Reward prediction error coding in dorsal striatal neurons.The Journal of Neuroscience, 30(34), 11447–11457.
Paine, T. A., Asinof, S. K., Diehl, G. W., Frackman, A., &Leffler, J. (2013). Medial prefrontal cortex lesions impair decision-making on a rodent gambling task: Reversal by D1 receptor antagonist administration.Behavioural Brain Research, 243, 247–254.
Pais-Vieira, M., Lima, D., & Galhardo, V. (2007).Orbitofrontal cortex lesions disrupt risk assessment in a novel serial decision-making task for rats.Neuroscience,145(1), 225–231.
Platt, M. L., & Glimcher, P. W. (1999). Neural correlates of decision variables in parietal cortex.Nature, 400, 233–238.
Rivalan, M., Coutureau, E., Fitoussi, A., & Dellu-Hagedorn,F. (2011). Inter-individual decision-making differences in the effects of cingulate, orbitofrontal, and prelimbic cortex lesions in a rat gambling task.Frontiers in Behavioral Neuroscience, 5, 22.
Roesch, M. R., Taylor, A. R., & Schoenbaum, G. (2006).Encoding of time-discounted rewards in orbitofrontal cortex is independent of value representation.Neuron,51(4), 509–520.
Roitman, J. D., & Roitman, M. F. (2010). Risk-preference differentiates orbitofrontal cortex responses to freely chosen reward outcomes.European Journal of Neuroscience,31(8), 1492–1500.
Schoenbaum, G., & Roesch, M. (2005). Orbitofrontal cortex,associative learning, and expectancies.Neuron, 47(5),633–636.
Schoenbaum, G., Setlow, B., Saddoris, M. P., & Gallagher, M.(2003). Encoding predicted outcome and acquired value in orbitofrontal cortex during cue sampling depends upon input from basolateral amygdala.Neuron, 39(5), 855–867.
Simon, N. W., Gilbert, R. J., Mayse, J. D., Bizon, J. L., &Setlow, B. (2009). Balancing risk and reward: A rat model of risky decision making.Neuropsychopharmacology,34(10), 2208–2217.
Smith, B. W., Mitchell, D. G. V., Hardin, M. G., Jazbec, S.,Fridberg, D., Blair, R. J. R., & Ernst, M. (2009). Neural substrates of reward magnitude, probability, and risk during a wheel of fortune decision-making task.NeuroImage, 44(2),600–609.
Stalnaker, T. A., Cooch, N. K., & Schoenbaum, G. (2015).What the orbitofrontal cortex does not do.Nature Nneuroscience, 18(5), 620–627.
Stalnaker, T. A., Franz, T. M., Singh, T., & Schoenbaum, G.(2007). Basolateral amygdala lesions abolish orbitofrontaldependent reversal impairments.Neuron, 54(1), 51–58.
St. Onge, J. R., Abhari, H., & Floresco, S. B. (2011).Dissociable contributions by prefrontal D1 and D2 receptors to risk-based decision making.The Journal of Neuroscience, 31(23), 8625–8633.
St. Onge, J. R., Ahn, S., Phillips, A. G., & Floresco, S. B.(2012). Dynamic fluctuations in dopamine efflux in the prefrontal cortex and nucleus accumbens during riskbased decision making.The Journal of Neuroscience,32(47), 16880–16891.
St. Onge, J. R., Chiu, Y. C., & Floresco, S. B. (2010).Differential effects of dopaminergic manipulations on risky choice.Psychopharmacology, 211(2), 209–221.
St. Onge, J. R., & Floresco, S. B. (2010). Prefrontal cortical contribution to risk–based decision making.Cerebral Cortex, 20(8), 1816–1828.
St. Onge, J. R., Stopper, C. M., Zahm, D. S., & Floresco, S.B. (2012). Separate prefrontal–subcortical circuits mediate different components of risk–based decision making.The Journal of Neuroscience, 32(8), 2886–2899.
Stopper, C. M., & Floresco, S. B. (2011). Contributions of the nucleus accumbens and its subregions to different aspects of risk–based decision making.Cognitive,Affective, & Behavioral Neuroscience, 11(1), 97–112.
Stopper, C. M., & Floresco, S. B. (2015). Dopaminergic circuitry and risk/reward decision making: Implications for schizophrenia.Schizophrenia Bulletin, 41(1), 9–14.
Stopper, C. M., Green, E. B., & Floresco, S. B. (2014).Selective involvement by the medial orbitofrontal cortex in biasing risky, but not impulsive, choice.Cerebral Cortex, 24(1), 154–162.
Stopper, C. M., Khayambashi, S., & Floresco, S. B. (2013).Receptor-specific modulation of risk-based decision making by nucleus accumbens dopamine.Neuropsychopharmacology,38(5), 715–728.
Stopper, C. M., Tse, M. T. L., Montes, D. R., Wiedman, C. R.,& Floresco, S. B. (2014). Overriding phasic dopamine signals redirects action selection during risk/reward decision making.Neuron, 84(1), 177–189.
Sugam, J. A., Day, J. J., Wightman, R. M., & Carelli, R. M.(2012). Phasic nucleus accumbens dopamine encodes risk-based decision-making behavior.Biological Psychiatry,71(3), 199–205.
Sugam, J. A., Saddoris, M. P., & Carelli, R. M. (2014).Nucleus accumbens neurons track behavioral preferences and reward outcomes during risky decision making.Biological Psychiatry,75(10), 807–816.
Sugrue, L. P., Corrado, G. S., & Newsome, W. T. (2004).Matching behavior and the representation of value in the parietal cortex.Science, 304, 1782–1787.
Tachibana, Y., & Hikosaka, O. (2012). The primate ventral pallidum encodes expected reward value and regulates motor action.Neuron, 76, 826–837.
Takahashi, Y. K., Chang, C. Y., Lucantonio, F., Haney, R. Z.,Berg, B. A., Yau, H. J.,... Schoenbaum, G. (2013). Neural estimates of imagined outcomes in the orbitofrontal cortex drive behavior and learning.Neuron, 80(2), 507–518.
Takahashi, Y. K., Roesch, M. R., Wilson, R. C., Toreson, K.,O'Donnell, P., Niv, Y., & Schoenbaum, G. (2011).Expectancy-related changes in firing of dopamine neurons depend on orbitofrontal cortex.Nature Neuroscience,14(12), 1590–1597.
van den Bos, R., Davies, W., Dellu-Hagedorn, F., Goudriaan,A. E, Granon, S., Homberg, J.,... Adriani, W. (2013).Cross–species approaches to pathological gambling: A review targeting sex differences, adolescent vulnerability and ecological validity of research tools.Neuroscience &Biobehavioral Reviews, 37(10), 2454–2471.
van den Bos, R., Homberg, J., & de Visser, L. (2013). A critical review of sex differences in decision-making tasks:Focus on the Iowa Gambling Task.Behavioural Brain Research, 238, 95–108.
van den Bos, R., Jolles, J., van der Knaap, L., Baars, A., &de Visser, L. (2012). Male and female Wistar rats differ in decision-making performance in a rodent version of the Iowa Gambling Task.Behavioural Brain Research, 234(2),375–379.
van den Bos, R., Lasthuis, W., Den Heijer, E., van der Harst,J., & Spruijt, B. (2006). Toward a rodent model of the Iowa gambling task.Behavior Research Methods, 38(3),470–478.
van Duuren, E., van der Plasse, G., Lankelma, J., Joosten, R.N. J. M. A., Feenstra, M. G. P., & Pennartz, C. M. A.(2009). Single–cell and population coding of expected reward probability in the orbitofrontal cortex of the rat.The Journal of Neuroscience, 29(28), 8965–8976.
Wilson, R. C., Takahashi, Y. K., Schoenbaum, G., & Niv, Y.(2014). Orbitofrontal cortex as a cognitive map of task space.Neuron, 81(2), 267–279.
Yu, A. J., & Dayan, P. (2005). Uncertainty, neuromodulation,and attention.Neuron, 46(4), 681–692.
Zeeb, F. D., Robbins, T. W., & Winstanley, C. A. (2009).Serotonergic and dopaminergic modulation of gambling behavior as assessed using a novel rat gambling task.Neuropsychopharmacology, 34(10), 2329–2343.
Zeeb, F. D., & Winstanley, C. A. (2011). Lesions of the basolateral amygdala and orbitofrontal cortex differentially affect acquisition and performance of a rodent gambling task.The Journal of Neuroscience, 31(6), 2197–2204.
Zeeb, F. D., & Winstanley, C. A. (2013). Functional disconnection of the orbitofrontal cortex and basolateral amygdala impairs acquisition of a rat gambling task and disrupts animals' ability to alter decision-making behavior after reinforcer devaluation.The Journal of Neuroscience,33(15), 6434–6443.
Zeeb, F. D., Wong, A. C., & Winstanley, C. A. (2013).Differential effects of environmental enrichment, socialhousing, and isolation-rearing on a rat gambling task:Dissociations between impulsive action and risky decisionmaking.Psychopharmacology, 225(2), 381–395.