于 毅
條件反射理論是警犬訓(xùn)練基本理論,警犬作業(yè)能力培養(yǎng)過(guò)程就是若干個(gè)條件反射建立和組合過(guò)程。加深對(duì)條件反射理論的理解將有助于我們提高警犬訓(xùn)練技術(shù)。
巴甫洛夫反射理論主要觀點(diǎn)是:具有生命的個(gè)體和它所處的外部條件是相互聯(lián)系的。高等生物個(gè)體和他們所處的外部世界的所有聯(lián)結(jié)實(shí)質(zhì)上就是通過(guò)神經(jīng)體系來(lái)聯(lián)結(jié)的。神經(jīng)體系與外部世界聯(lián)結(jié)的形式就是反射。反射就是當(dāng)外部世界和機(jī)體內(nèi)部對(duì)生命體產(chǎn)生刺激后,生命個(gè)體通過(guò)大腦和神經(jīng)系統(tǒng)產(chǎn)生的應(yīng)答性反應(yīng)。其核心思想就是條件反射理論,這一理論亦稱(chēng)為經(jīng)典性條件反射理論。
巴甫洛夫條件反射理論的形成來(lái)源于研究消化生理的實(shí)驗(yàn),也稱(chēng)“搖鈴實(shí)驗(yàn)”。在實(shí)驗(yàn)中,他選擇食物作為非條件刺激,犬吃到食物時(shí)會(huì)自然地分泌唾液。他又選擇鈴聲作為中性刺激。在實(shí)驗(yàn)中,巴甫洛夫首先讓犬聽(tīng)到鈴聲,然后立即給它喂食,這時(shí),犬會(huì)分泌大量的唾液。反復(fù)多次訓(xùn)練之后,聽(tīng)到鈴聲后犬就像已經(jīng)吃到食物一樣,自然地分泌唾液。此時(shí)說(shuō)明條件反射已經(jīng)形成,原本的中性刺激鈴聲已經(jīng)成為引起唾液分泌的條件刺激。巴甫洛夫的實(shí)驗(yàn)印證了條件反射的存在,說(shuō)明它可以替代非條件反射引起個(gè)體相同的反應(yīng)。巴甫洛夫的經(jīng)典性條件反射實(shí)驗(yàn)以科學(xué)實(shí)驗(yàn)的方式給我們揭示了動(dòng)物行為的學(xué)習(xí)途徑。一是食物可以使犬流唾液,流唾液是自然的、無(wú)法控制的反應(yīng),食物是一種非條件刺激;二是鈴聲不會(huì)使犬流唾液,鈴聲是一種條件刺激;三是把食物和鈴聲配合起來(lái),使犬學(xué)會(huì)把這兩者聯(lián)系起來(lái);四是即使沒(méi)有食物,鈴聲也可以引起犬流唾液。這種將兩個(gè)本沒(méi)有關(guān)聯(lián)的事物聯(lián)系在一起,就是條件反射的建立過(guò)程。
斯金納是操作性條件反射理論的奠基者,斯金納箱實(shí)驗(yàn)最能說(shuō)明操作性條件反射原理。這一實(shí)驗(yàn)把貓放到一個(gè)“問(wèn)題箱”里,此時(shí)貓?jiān)诒灸茯?qū)使下就會(huì)想方設(shè)法逃出去,它會(huì)到處沖撞試圖找到出口。最后它可能因某一個(gè)偶然性動(dòng)作而踩踏了1 塊木板,門(mén)便通過(guò)機(jī)關(guān)自動(dòng)打開(kāi)或者實(shí)驗(yàn)人員按下開(kāi)關(guān)把門(mén)打開(kāi),于是貓便逃出箱外獲得了自由,即得到了獎(jiǎng)勵(lì)。如果把逃出的貓?jiān)訇P(guān)入“問(wèn)題箱”,使這一過(guò)程不斷重復(fù),貓就能越來(lái)越快地從“問(wèn)題箱”中逃出來(lái),最后貓便能學(xué)會(huì)把踩踏木板和開(kāi)門(mén)這兩件事聯(lián)系起來(lái)。此時(shí)如果再把貓放入箱中,它就會(huì)為了開(kāi)門(mén)而直接去踩踏木板。操作性條件反射就是這樣建立起來(lái)的。在此基礎(chǔ)上,我們將動(dòng)物的這種學(xué)習(xí)行為進(jìn)一步延伸,在其中加入某種信號(hào),使動(dòng)物根據(jù)人為發(fā)出的信號(hào)執(zhí)行某種行為。例如,訓(xùn)練動(dòng)物在聽(tīng)到蜂鳴器發(fā)出聲響的時(shí)候去壓桿,起初1 只饑餓的動(dòng)物是隨機(jī)運(yùn)動(dòng)的,也許當(dāng)蜂鳴器發(fā)出聲響時(shí)它偶然壓了1 次桿,此時(shí)食物立刻出現(xiàn)使之得到獎(jiǎng)勵(lì)。以后,食物的每次都是在這一特定的情況下出現(xiàn),經(jīng)過(guò)反復(fù)練習(xí),動(dòng)物就建立了對(duì)蜂鳴器聲響的條件反射,聽(tīng)從其指令去壓桿。操作性條件反射建立過(guò)程的邏輯關(guān)系是:將動(dòng)物放在某種我們?cè)O(shè)計(jì)的特定的場(chǎng)景中,其在本能驅(qū)使下產(chǎn)生自發(fā)行為,某種自發(fā)行為自動(dòng)獲得或者人為施與的獎(jiǎng)勵(lì),使這種自發(fā)行為反復(fù)得到強(qiáng)化,這樣,當(dāng)某種特定的場(chǎng)景再次出現(xiàn),動(dòng)物就“學(xué)會(huì)”了采取其不斷得到強(qiáng)化的那種行為去“解決問(wèn)題”,條件反射就此建立。
在經(jīng)典性條件反射中,條件刺激與非條件刺激(強(qiáng)化物)幾乎同時(shí)出現(xiàn),經(jīng)過(guò)反復(fù)練習(xí),使這兩個(gè)刺激暫時(shí)建立神經(jīng)聯(lián)系,當(dāng)?shù)谝粋€(gè)刺激出現(xiàn)時(shí)就能引發(fā)與第二個(gè)刺激一樣的反應(yīng)。例如,將鈴聲(條件刺激)與食物(非條件刺激)反復(fù)結(jié)合共同作用于犬,反復(fù)練習(xí),鈴聲就能引發(fā)犬產(chǎn)生流唾液的反應(yīng)。
在操作性條件反射中,當(dāng)動(dòng)物的某一個(gè)反應(yīng)發(fā)生后,緊接著對(duì)其施加特定形式的刺激,這種刺激分為獎(jiǎng)勵(lì)和懲罰兩種性質(zhì),即正、負(fù)強(qiáng)化。如果動(dòng)物得到的是獎(jiǎng)勵(lì)性質(zhì)的刺激(正強(qiáng)化),這種反應(yīng)將趨向于再次發(fā)生;如果動(dòng)物得到的是懲罰性質(zhì)的刺激(負(fù)強(qiáng)化),反應(yīng)將逐漸弱化,直至不再發(fā)生。獎(jiǎng)勵(lì)或懲罰是伴隨條件反應(yīng)的發(fā)生而出現(xiàn)的,反應(yīng)決定強(qiáng)化,無(wú)反應(yīng)就無(wú)強(qiáng)化。
操作性條件反射同經(jīng)典性條件反射的區(qū)別在于,前者沒(méi)有所謂的條件刺激,也不是靠條件刺激與非條件刺激相結(jié)合而形成條件反射,它的形成是動(dòng)物的一種隨意活動(dòng),而且是本能行為的結(jié)果。動(dòng)物在本能驅(qū)使下不斷去嘗試,因此是一種“試錯(cuò)式”學(xué)習(xí)。在操作性條件反射建立過(guò)程中,動(dòng)物具有“主動(dòng)學(xué)習(xí)”的特點(diǎn)。
犬體不健康時(shí),建立經(jīng)典性條件反射時(shí),當(dāng)非條件刺激施加于犬體,可能影響犬做出相應(yīng)的應(yīng)答性行為。建立操作性條件反射時(shí),當(dāng)某種情境出現(xiàn)時(shí),犬可能不出現(xiàn)我們預(yù)期的行為,強(qiáng)化手段無(wú)法實(shí)施,條件反射將無(wú)法建立。因此,我們應(yīng)加強(qiáng)對(duì)犬的飼養(yǎng)管理,當(dāng)犬患有疾病時(shí)應(yīng)及時(shí)治療,消除犬的病痛才能進(jìn)行訓(xùn)練。
如果犬因疲倦、睡眠不足等原因,導(dǎo)致頭腦不清醒,將影響條件刺激與非條件刺激、犬主動(dòng)行為與強(qiáng)化之間結(jié)合的效果,導(dǎo)致犬學(xué)習(xí)效率低下。因此,我們應(yīng)避免過(guò)度、長(zhǎng)時(shí)間的訓(xùn)練。每天分多次、短時(shí)間地開(kāi)展訓(xùn)練,是避免過(guò)度訓(xùn)練的有效方法。
安靜的環(huán)境是訓(xùn)練必要的條件。訓(xùn)練中干擾因素太多將導(dǎo)致犬無(wú)法集中精力,甚至對(duì)干擾刺激產(chǎn)生反應(yīng),亦稱(chēng)產(chǎn)生“外抑制”,將嚴(yán)重影響訓(xùn)練效果。一方面我們應(yīng)堅(jiān)持對(duì)犬進(jìn)行環(huán)境鍛煉,以消除犬對(duì)訓(xùn)練、使用環(huán)境中常見(jiàn)刺激的過(guò)激反應(yīng),以至不再反應(yīng);另一方面,要避免在過(guò)于復(fù)雜的環(huán)境中進(jìn)行訓(xùn)練,尤其是在條件反射建立初期。
與警犬訓(xùn)練密切相關(guān),應(yīng)重點(diǎn)利用的非條件反射主要有:食物反射、防御反射、探求反射、獵取反射、姿勢(shì)反射、自由反射、性反射。條件反射建立過(guò)程中,犬相應(yīng)的非條件反射神經(jīng)活動(dòng)應(yīng)處于興奮狀態(tài),警犬訓(xùn)練才能取得預(yù)期效果。例如,利用食物反射誘導(dǎo)犬做出某種作業(yè)行為,或者用食物獎(jiǎng)勵(lì)犬的某種作業(yè)行為,將食物作為正強(qiáng)化的手段,以建立某種條件反射時(shí),如果剛給犬喂食,其處于飽腹?fàn)顟B(tài),或者犬患病導(dǎo)致食欲不振,食物反射的神經(jīng)活動(dòng)處于抑制狀態(tài),利用食物來(lái)建立條件反射就失去了原有的基礎(chǔ),條件反射將難以建立。
在經(jīng)典性條件反射建立過(guò)程中,要注意非條件刺激和條件刺激的強(qiáng)度。強(qiáng)刺激引起強(qiáng)反應(yīng),弱刺激引起弱反應(yīng),但超過(guò)犬生理承受范圍的強(qiáng)刺激將引起超限抑制。例如,長(zhǎng)時(shí)間單調(diào)重復(fù)訓(xùn)練將使犬處于抑制狀態(tài),服從科目訓(xùn)練中對(duì)犬施加的機(jī)械刺激過(guò)強(qiáng)也將導(dǎo)致犬處于抑制狀態(tài)等。值得注意的是,在建立條件反射時(shí),非條件刺激強(qiáng)度要大于條件刺激。在操作性條件反射建立過(guò)程中,對(duì)犬施加的正、負(fù)強(qiáng)化刺激也要注意強(qiáng)度,刺激強(qiáng)度的大小要因“犬”制宜,尤其是正強(qiáng)化刺激不應(yīng)太弱,負(fù)強(qiáng)化刺激不能過(guò)強(qiáng),否則將影響訓(xùn)練效果。
巴普洛夫在研究條件反射建立過(guò)程中發(fā)現(xiàn),條件刺激先于非條件刺激出現(xiàn)的效果最佳,同時(shí)出現(xiàn)的效果次之,而其他結(jié)合方式則很難建立條件反射。在警犬訓(xùn)練中,我們應(yīng)先對(duì)犬發(fā)出條件刺激——口令、手勢(shì)等,再對(duì)犬施加非條件刺激。例如,“坐”科目訓(xùn)練,先對(duì)犬下達(dá)“坐”的口令、手勢(shì),再按壓犬的腰角、提拉脖圈等,使犬做出“坐”的動(dòng)作,兩個(gè)刺激之間一般間隔幾秒鐘,但口令、手勢(shì)一定要在前。
條件反射的建立過(guò)程就是學(xué)習(xí)的過(guò)程,學(xué)習(xí)就離不開(kāi)反復(fù)練習(xí)。經(jīng)典性條件反射要將條件刺激與非條件刺激反復(fù)結(jié)合,操作性條件反射要將犬的某種自發(fā)行為與訓(xùn)導(dǎo)員施加的正負(fù)強(qiáng)化刺激反復(fù)結(jié)合。結(jié)合的次數(shù)因科目難度和犬的個(gè)體差異有所不同,從數(shù)十次到成百上千次不等。值得注意的是,條件反射建立后也不是一勞永逸的,如果條件刺激頻頻出現(xiàn)而其后沒(méi)有非條件刺激出現(xiàn),那么這兩種刺激之間的聯(lián)系就會(huì)逐漸消失。例如,拿犬看到燈光就分泌唾液這一條件反射來(lái)說(shuō),如果不是不斷地同時(shí)給予犬食物刺激,條件反射就會(huì)慢慢衰退,這種現(xiàn)象就叫消退。因此,犬的條件反射形成后,還要經(jīng)常性地進(jìn)行復(fù)習(xí)鞏固,這也就是我們要堅(jiān)持開(kāi)展日常訓(xùn)練,定期進(jìn)行復(fù)訓(xùn)的原因。