陳嘉卉
◆摘 要:獎(jiǎng)勵(lì)與強(qiáng)化作為應(yīng)激原,均可以幫助確定動(dòng)物的特定行為,讓動(dòng)物習(xí)得某種動(dòng)作。然而動(dòng)物行為的改變是表象,獎(jiǎng)勵(lì)與強(qiáng)化實(shí)際上是通過(guò)影響動(dòng)物神經(jīng)系統(tǒng)來(lái)達(dá)到改變動(dòng)物行為的目的。未來(lái)還需要更多的研究去探索獎(jiǎng)勵(lì)與強(qiáng)化對(duì)動(dòng)物行為、神經(jīng)系統(tǒng)的潛在作用,為動(dòng)物行為學(xué)、動(dòng)物訓(xùn)練乃至于藥物成癮的治療提供更多幫助。
◆關(guān)鍵詞:獎(jiǎng)勵(lì);強(qiáng)化;動(dòng)物行為;伏隔核
一、獎(jiǎng)勵(lì)對(duì)動(dòng)物行為的影響
(一)食物獎(jiǎng)賞對(duì)動(dòng)物行為的影響
1.食物獎(jiǎng)賞的概念
食物獎(jiǎng)賞是指進(jìn)食可口的食物后動(dòng)物會(huì)獲得一種滿足感,這種食物能引發(fā)對(duì)動(dòng)物的獎(jiǎng)賞效應(yīng)。即使不是饑餓狀態(tài),可口的食物會(huì)激活獎(jiǎng)賞環(huán)路進(jìn)而引發(fā)動(dòng)物的攝食動(dòng)機(jī)。因此,攝食的獎(jiǎng)賞效應(yīng)是促進(jìn)動(dòng)物持續(xù)攝食、提高攝食量的關(guān)鍵因素。
2.食物獎(jiǎng)賞的作用
幫助動(dòng)物習(xí)得某一特定行為。如:把大鼠放置于設(shè)置了有效和無(wú)效打扮的行為箱后,它踏有效板時(shí)給予蔗糖獎(jiǎng)賞,踏無(wú)效板時(shí)無(wú)任何獎(jiǎng)賞,一段時(shí)間后,大鼠會(huì)習(xí)得踏有效踏板的行為;將目標(biāo)棒放在綠籃晰的面前,當(dāng)綠籃晰嘴巴接觸目標(biāo)棒時(shí),按響片同時(shí)給予食物以強(qiáng)化目標(biāo)行為;訓(xùn)練紅毛猩猩也采取相同的手段,若猩猩取得明顯進(jìn)步給予翻倍的食物獎(jiǎng)勵(lì),這樣可使得猩猩習(xí)得新的動(dòng)作技能。
增強(qiáng)動(dòng)物的覓藥行為。李彥慶等人對(duì)大鼠進(jìn)行隨機(jī)分組,分為蔗糖組和對(duì)照組,它們分別習(xí)得了蔗糖和普通食物的自給食行為。隨后讓兩組大鼠進(jìn)行自給藥,大鼠踏板給予可卡因注射,第8天開(kāi)始蔗糖組大鼠比對(duì)照組的踏板數(shù)更多,攝藥量更大。
3.影響食物獎(jiǎng)賞對(duì)動(dòng)物行為作用效果的因素
低氧暴露后,大鼠在食物獎(jiǎng)賞區(qū)域停留更久。王娟發(fā)現(xiàn):將大鼠放入低氧暴露下的Y型迷宮并使其自由活動(dòng),與暴露在正常含氧量的情況對(duì)比,大鼠更傾向于停留在食物獎(jiǎng)賞區(qū)域。
(二)藥物獎(jiǎng)賞對(duì)動(dòng)物行為的影響
1.藥物獎(jiǎng)賞的概念
藥物獎(jiǎng)賞是指動(dòng)物長(zhǎng)期反復(fù)服用成癮藥物后,其中樞神經(jīng)系統(tǒng)會(huì)發(fā)生生理變化,漸漸地依賴該藥物,稱之為藥物成癮。可以通過(guò)藥物獎(jiǎng)賞使動(dòng)物習(xí)得某種特定行為。
2.藥物獎(jiǎng)賞的作用
與食物獎(jiǎng)賞作用相似,藥物作為一種天然獎(jiǎng)賞物,也可幫助確定動(dòng)物的某些行為、學(xué)習(xí)某種行為。以下是藥物獎(jiǎng)賞有助于動(dòng)物習(xí)得不同行為的證明。
(1)長(zhǎng)期停留在伴隨成癮藥物的區(qū)域。條件化位置偏愛(ài)(conditioned place preference,CPP)實(shí)驗(yàn)是指在特定的環(huán)境下對(duì)動(dòng)物反復(fù)給藥,會(huì)讓它喜愛(ài)或厭惡這個(gè)給藥環(huán)境,從而選擇逗留或者逃離。
這一理論已被大量研究證明:如嗎啡、氯胺酮、尼古丁這些藥物都可以作為成癮藥物,讓小鼠長(zhǎng)期進(jìn)入并停留在伴隨該藥物的區(qū)域中。
(2)行為敏化。行為敏化是指反復(fù)使用成癮藥物后,動(dòng)物的自主活動(dòng)、旋轉(zhuǎn)運(yùn)動(dòng)或刻板行為等精神活動(dòng)刺激反應(yīng)增強(qiáng)的現(xiàn)象。
Castner等人發(fā)現(xiàn)重復(fù)給予苯丙胺可誘導(dǎo)非人靈長(zhǎng)類動(dòng)物(如猴子)出現(xiàn)跟蹤、過(guò)度警覺(jué)、在空氣中抓取尋找刺激物等幻覺(jué)行為。非人靈長(zhǎng)類動(dòng)物敏化后的表現(xiàn)較嚙齒類動(dòng)物更為豐富。
(3)自給藥行為。自給藥行為基于斯金納的操作式條件反射,可通過(guò)藥物獎(jiǎng)賞訓(xùn)練動(dòng)物完成某一行為,如嚙齒類動(dòng)物學(xué)會(huì)壓桿或鼻觸,靈長(zhǎng)類動(dòng)物較多習(xí)得踏板或拉桿。
Foll等人曾用松鼠猴為實(shí)驗(yàn)動(dòng)物,建立自給藥模型。松鼠猴坐在裝有兩個(gè)杠桿的房間里,杠桿上方分別有紅光、藍(lán)光刺激。每當(dāng)松鼠猴拉動(dòng)紅光杠桿就會(huì)得到尼古丁注射,拉動(dòng)藍(lán)光杠桿則沒(méi)有藥物注射。一段時(shí)間后,松鼠猴學(xué)會(huì)了拉動(dòng)紅光杠桿自行給藥。說(shuō)明尼古丁這種成癮藥物可以使松鼠猴學(xué)會(huì)拉動(dòng)特定燈光顏色的杠桿。
3.影響藥物獎(jiǎng)賞對(duì)動(dòng)物行為作用效果的因素
(1)冷水應(yīng)激的抑制作用。藥物成癮是一種腦損傷,而復(fù)吸是臨床治療藥物成癮遇到的最大難題,主要表現(xiàn)為覓藥動(dòng)機(jī)強(qiáng)烈和重復(fù)出現(xiàn)給藥行為。實(shí)際上,藥物成癮是一種病理性情感記憶,有研究表明破壞藥物獎(jiǎng)賞記憶的再鞏固能夠抑制復(fù)吸。
陳靜研究發(fā)現(xiàn):冷水應(yīng)激可以抑制大鼠對(duì)嗎啡的條件位置偏愛(ài),且給藥時(shí)間會(huì)影響這一抑制作用的效果。
先讓大鼠對(duì)嗎啡產(chǎn)生CPP,然后喚醒藥物記憶,再通過(guò)冷水應(yīng)激的手段干預(yù),結(jié)果嗎啡對(duì)大鼠的獎(jiǎng)賞效應(yīng)被明顯削弱。
另外,只有在嗎啡獎(jiǎng)賞記憶激活后立即給予應(yīng)激才能破壞嗎啡獎(jiǎng)賞記憶再鞏固,若在記憶激活后6小時(shí)再給予應(yīng)激是沒(méi)有抑制效果的,說(shuō)明冷水應(yīng)激干擾嗎啡CPP具有時(shí)間特異性。
(2)運(yùn)動(dòng)應(yīng)激的抑制作用。張鹿發(fā)現(xiàn),運(yùn)動(dòng)應(yīng)激可以抑制小鼠對(duì)氯胺酮而形成CPP。這里的運(yùn)動(dòng)應(yīng)激指的是在小鼠用藥后,進(jìn)行增大運(yùn)動(dòng)量的跑臺(tái)實(shí)驗(yàn)。
(3)藥物劑量影響作用效果。低劑量藥物因藥物濃度低而無(wú)法引發(fā)行為敏化;中等劑量藥物所產(chǎn)生的非條件反應(yīng)必須與與環(huán)境所產(chǎn)生的條件反應(yīng)結(jié)合才能引發(fā)行為敏化;高劑量藥物能夠單獨(dú)引發(fā)行為敏化。
二、獎(jiǎng)勵(lì)對(duì)動(dòng)物神經(jīng)系統(tǒng)的影響
(一)獎(jiǎng)賞環(huán)路的概念
1954年,詹姆斯·奧爾茲和皮特·米爾納最先認(rèn)識(shí)到腦內(nèi)存在獎(jiǎng)賞系統(tǒng)。他們?cè)O(shè)置了如下裝置:按壓按鈕使大鼠接受大腦中的對(duì)特定部位短暫的電刺激。大鼠會(huì)慢慢習(xí)得按壓按鈕的行為,這種現(xiàn)象稱為顱內(nèi)自我刺激。研究者們將大腦內(nèi)能夠介導(dǎo)獎(jiǎng)賞相關(guān)的行為的區(qū)域稱為獎(jiǎng)賞環(huán)路。
(二)獎(jiǎng)賞環(huán)路的分類
正性獎(jiǎng)賞環(huán)路和負(fù)性獎(jiǎng)賞環(huán)路:前者增大獎(jiǎng)賞效應(yīng);后者抑制獎(jiǎng)賞效應(yīng)。
1.正性獎(jiǎng)賞環(huán)路
中腦邊緣多巴胺(Dopamine,DA)系統(tǒng)是獎(jiǎng)賞環(huán)路的中心。該系統(tǒng)主要起源于兩個(gè)腦區(qū):中腦腹側(cè)被蓋區(qū)(ventral tegmental area,VTA)和黑質(zhì)致密部。VTA多巴胺能神經(jīng)元主要投射到伏隔核(Nucleus Accumbens,NAcc)、內(nèi)側(cè)前額葉皮層和基底外側(cè)杏仁核。此外,基底外側(cè)杏仁核的谷氨酸能神經(jīng)元可以通過(guò)NAcc間接投射到VTA。內(nèi)側(cè)前額葉皮層也能投射到VTA,這些腦區(qū)共同構(gòu)成了正性獎(jiǎng)賞環(huán)路。其中,VTA富含多巴胺能神經(jīng)元,是調(diào)控獎(jiǎng)賞功能的主要區(qū)域,這就是獎(jiǎng)勵(lì)對(duì)動(dòng)物神經(jīng)內(nèi)分泌的作用的體現(xiàn)之一。
2.負(fù)性獎(jiǎng)賞環(huán)路
外側(cè)韁核(lateral habenula,LHb)是負(fù)性獎(jiǎng)賞環(huán)路的主要區(qū)域。研究發(fā)現(xiàn),向猴子進(jìn)行厭惡刺激會(huì)強(qiáng)烈激活LHb神經(jīng)元;用光遺傳方法激活大鼠腳內(nèi)核到LHb的輸入會(huì)使得大鼠厭惡、逃避所探索的環(huán)境。這都說(shuō)明LHb參與處理和編碼厭惡信息。這提示我們可通過(guò)激活LHb來(lái)抑制獎(jiǎng)賞效應(yīng),從而治療藥物成癮、抑制動(dòng)物刻板行為的目的。
LHb接收來(lái)自蒼白球、下丘腦和前扣帶回等腦區(qū)的輸入,然后投射到VTA的多巴胺能神經(jīng)元。這些通路共同構(gòu)成了負(fù)性獎(jiǎng)賞環(huán)路。
三、強(qiáng)化對(duì)動(dòng)物行為的影響
由于強(qiáng)化與獎(jiǎng)勵(lì)有一定關(guān)系,可以通過(guò)獎(jiǎng)勵(lì)的手段使行為強(qiáng)化,這屬于正強(qiáng)化,所以這里主要介紹負(fù)強(qiáng)化。強(qiáng)化與獎(jiǎng)勵(lì)類似,是對(duì)特定行為的加強(qiáng),幫助動(dòng)物習(xí)得某一特定行為,同時(shí)也有助于理解動(dòng)物的刻板行為。
(1)規(guī)避電擊。偏愛(ài)黑暗的老鼠可以隨意選擇進(jìn)入燈光室或者暗室,當(dāng)它進(jìn)入一個(gè)偏愛(ài)的暗室后受到電擊懲罰,24小時(shí)后,老鼠選擇進(jìn)入燈光室,“電擊+燈光”的環(huán)境條件使得老鼠因規(guī)避電擊而學(xué)會(huì)進(jìn)入燈光室。這屬于負(fù)強(qiáng)化對(duì)動(dòng)物行為的影響。
相似的實(shí)驗(yàn)結(jié)果出現(xiàn)在果蠅身上:果蠅也會(huì)規(guī)避電擊,通過(guò)這一厭惡型刺激使得果蠅習(xí)得某種行為。
(2)規(guī)避氣體。一定濃度的CO2會(huì)引起果蠅強(qiáng)烈的回避行為。但饑餓會(huì)抑制果蠅對(duì)CO2的排斥。高濃度的CO2對(duì)果蠅是致死,但為了生存,果蠅會(huì)減弱對(duì)CO2的回避,去靠近釋放CO2腐敗的水果(果蠅的食物)。
在T型迷宮兩臂分別通入OCT(某種果蠅厭惡的氣味)和新鮮空氣,果蠅會(huì)因?yàn)橐?guī)避OCT而選擇充滿新鮮空氣的區(qū)域。
(3)規(guī)避苦味。印楝素是一種苦味劑,具有拒食、忌避、抑制生長(zhǎng)發(fā)育、誘導(dǎo)凋亡和自噬等多種作用機(jī)制。
動(dòng)物形成味覺(jué)記憶后可利用它來(lái)回避有毒食物。昆蟲口器伸展反應(yīng)是分析昆蟲味覺(jué)行為的一種經(jīng)典的行為范式,能夠快速地檢測(cè)厭惡性味覺(jué)記憶的形成。
用蔗糖刺激果蠅足部,同時(shí)將奎寧、印楝素等不同溶液讓果蠅伸出口器取食。一段時(shí)間后用蔗糖刺激果蠅足部,其口器不再伸展。這是因?yàn)橹罢崽堑淖悴看碳ぐ殡S著印楝素這種苦味物質(zhì)的刺激,形成了厭惡性味覺(jué)記憶,果蠅為了規(guī)避苦味,就會(huì)學(xué)會(huì)拒絕甜味。
四、強(qiáng)化影響動(dòng)物行為的神經(jīng)機(jī)制
能產(chǎn)生愉悅感的獎(jiǎng)勵(lì)刺激(如食物、金錢等)與正強(qiáng)化相關(guān);撤銷厭惡刺激時(shí)產(chǎn)生的放松感,與負(fù)強(qiáng)化相關(guān)。
Kravitz和Kreitzer認(rèn)為:接受腹側(cè)被蓋區(qū)多巴胺支配的神經(jīng)元,在紋狀體中組成兩條平行的投射通路,其中直接通路從背側(cè)紋狀體的中型棘狀神經(jīng)元經(jīng)過(guò)外蒼白球投射到視丘下核,回返支配腹側(cè)被蓋區(qū),選擇性地表達(dá)低親和性D1受體;間接通路從背側(cè)紋狀體的中型棘狀神經(jīng)元出發(fā),投射到黑質(zhì)網(wǎng)狀和內(nèi)蒼白球的神經(jīng)元,回返支配腹側(cè)被蓋區(qū),選擇性表達(dá)高親和性D2受體。
其中,正強(qiáng)化對(duì)動(dòng)物行為及神經(jīng)內(nèi)分泌的影響與獎(jiǎng)勵(lì)相似,而負(fù)強(qiáng)化的作用在上文也已闡述,它可以通過(guò)讓動(dòng)物規(guī)避某一懲罰,而習(xí)得與之相反的另一選擇所關(guān)聯(lián)的行為,簡(jiǎn)而言之,強(qiáng)化作為應(yīng)激原,也是幫助動(dòng)物確定某一行為。
綜上所述,獎(jiǎng)勵(lì)與強(qiáng)化作為應(yīng)激原,都可以幫助確定動(dòng)物的特定行為,讓動(dòng)物習(xí)得某種動(dòng)作。而動(dòng)物行為的改變是表象,獎(jiǎng)勵(lì)與強(qiáng)化實(shí)際上是通過(guò)影響動(dòng)物神經(jīng)系統(tǒng)、內(nèi)分泌系統(tǒng)來(lái)達(dá)到改變動(dòng)物行為的目的。未來(lái)還需要更多的研究去探索獎(jiǎng)勵(lì)與強(qiáng)化對(duì)動(dòng)物行為、神經(jīng)內(nèi)分泌的潛在作用。
參考文獻(xiàn)
[1]李永祥,王嘉雯,江青艷,王麗娜.采食的獎(jiǎng)賞性調(diào)節(jié)及其機(jī)制[J].中國(guó)畜牧雜志,2018,54(09):10-15.
[2]李彥慶,樂(lè)秋旻,于向沉,馬蘭,王菲菲.蔗糖獎(jiǎng)賞增強(qiáng)大鼠對(duì)可卡因的覓藥動(dòng)機(jī)[J].生理學(xué)報(bào),2016,68(03):233-240.
[3]唐華,左智力,毛杰,謝毅,陳建,劉選珍.綠鬣蜥行為訓(xùn)練研究[J].野生動(dòng)物,2012,33(06):342-344.
[4]李梅榮,竇海靜,李俊嫻.圈養(yǎng)猩猩的行為訓(xùn)練[J].野生動(dòng)物學(xué)報(bào),2014,35(01):62-65.
[5]王娟.低氧暴露對(duì)大鼠攝食行為的影響[D].杭州師范大學(xué),2013.
[6]戚仁莉,瞿家桂,陳艷梅,馬原野,胡新天.青春期小鼠與成年小鼠在嗎啡和食物誘導(dǎo)條件化位置偏愛(ài)建立上的異同[J].動(dòng)物學(xué)研究,2011,32(05):528-532.
[7]張鹿.運(yùn)動(dòng)應(yīng)激對(duì)氯胺酮成癮相關(guān)行為的影響[D].中北大學(xué),2014.
[8]韓龍.尼古丁導(dǎo)致決策能力異常的神經(jīng)機(jī)制探討[D].中國(guó)科學(xué)技術(shù)大學(xué),2018.
[9]覃旺軍,梁建輝.用藥環(huán)境對(duì)藥物敏化效應(yīng)的調(diào)控作用[J].中國(guó)藥理學(xué)通報(bào),2011,27(12):1632-1635.
[10]Castner S A ,Goldman-Rakic P S.Amphetamine sensitization of hallucinatory-like behaviors is dependent on prefrontal cortex in nonhuman primates[J].Biological Psychiatry,2003,54(2):105-110.
[11]Foll B L,Wertheim C,Goldberg S R.High Reinforcing Efficacy of Nicotine in Non-Human Primates[J].PLOS ONE,2007,2.
[12]Leshner AI.Addiction is a brain disease,and It Matters[J].Science,1997,278 (5335):45-47.