袁 野
關(guān)于負(fù)強(qiáng)化的深入探析
袁 野
斯金納認(rèn)為:人或動物為了達(dá)到某種目的,會采取一定的行為作用于環(huán)境,當(dāng)這種行為的后果對他有利時,這種行為就會在以后重復(fù)出現(xiàn);不利時,這種行為就減弱或消失。這種“有利的后果”就是強(qiáng)化。
根據(jù)強(qiáng)化的性質(zhì)和目的,可分為正強(qiáng)化和負(fù)強(qiáng)化。人們可以用正強(qiáng)化或負(fù)強(qiáng)化的辦法來影響行為的后果,從而修正其行為。在管理上,正強(qiáng)化就是獎勵那些組織上需要的行為,從而加強(qiáng)這種行為;負(fù)強(qiáng)化是積極行為預(yù)期增加或者已經(jīng)增加,為了鞏固那些已經(jīng)增加的積極行為,撤銷原來的那些懲罰及與組織不相容的行為帶來的痛苦。正強(qiáng)化的方法包括獎金、對成績的認(rèn)可、表揚(yáng)、改善工作條件和人際關(guān)系、提升、安排擔(dān)任挑戰(zhàn)性的工作、給予學(xué)習(xí)和成長的機(jī)會等。負(fù)強(qiáng)化的方法包括撤銷批評、處分、降級等,有時恢復(fù)減少的獎金也是一種負(fù)強(qiáng)化。
負(fù)強(qiáng)化,就是對于符合目標(biāo)的行為,撤消或減弱原來存在的消極刺激或者條件,以使這些行為發(fā)生的頻率提高。
筆者注意到了容易將負(fù)強(qiáng)化混同于懲罰的現(xiàn)象,例如Thyer Laura和L Myers指出:“正強(qiáng)化概念雖然是已經(jīng)進(jìn)入我們?nèi)粘I畹脑~匯,但即使受過良好訓(xùn)練的臨床工作者有時也被正強(qiáng)化與負(fù)強(qiáng)化、正懲罰與負(fù)懲罰和消退之間的區(qū)別所困惑?!笔聦嵈_實如此。
《警犬訓(xùn)練學(xué)》一書認(rèn)為,“在警犬訓(xùn)練中,根據(jù)強(qiáng)化的性質(zhì)和目的可把強(qiáng)化分為正強(qiáng)化和負(fù)強(qiáng)化。凡屬糾正和改變?nèi)环嫌?xùn)練要求的條件反射活動,或制止犬某種不良聯(lián)系的行為而采取的手段及其效應(yīng),稱為負(fù)強(qiáng)化?!薄敖故怯?xùn)犬員或助訓(xùn)員通過使用威脅音調(diào)發(fā)出‘非’的口令,同時伴以強(qiáng)有力的機(jī)械刺激制止犬的不良行為所采用的負(fù)強(qiáng)化手段?!埂瘜θ畞碚f,實質(zhì)上是一種抑制性的懲罰。”“在警犬訓(xùn)練中,訓(xùn)犬員不僅要通過正強(qiáng)化加速犬所訓(xùn)作業(yè)能力條件反射的形成,而且還要對犬已形成的某些不良聯(lián)系,采取負(fù)強(qiáng)化進(jìn)行消退?!币簿褪钦f,負(fù)強(qiáng)化是一種懲罰,可以糾正和制止犬的不良行為或不良聯(lián)系。
《犬的行為原理》一書認(rèn)為,“強(qiáng)化是一種進(jìn)一步增大行為完成的可能性的刺激或活動”“凡是其結(jié)果可使行為增加的就稱‘強(qiáng)化’,凡是其結(jié)果可使其行為減少的稱為‘懲罰’”。也就是說,無論正強(qiáng)化和負(fù)強(qiáng)化都可以使行為增加,但舉例為“通過對行為的正強(qiáng)化或負(fù)強(qiáng)化,可以使這種條件反射發(fā)生改變,如幼犬向家具上跳而遭到主人反復(fù)責(zé)備后,可使犬跳的頻率減少”,可見前后矛盾。
一、“正、負(fù)”的含義
首先要明白概念中“正、負(fù)”的含義。在實施強(qiáng)化與懲罰的過程中,如果呈現(xiàn)某事物,就叫做“正”,如果某事物消失,就叫做“負(fù)”。因此呈現(xiàn)某事物、導(dǎo)致犬愉快并使犬的特定行為表現(xiàn)頻率增加,就叫正強(qiáng)化;如果移去某事物、導(dǎo)致犬愉快并使行動者特定行為增加,就叫負(fù)強(qiáng)化;呈現(xiàn)某事物、導(dǎo)致犬痛苦并使犬特定行為表現(xiàn)消失,就叫正懲罰:移去某事物、導(dǎo)致犬痛苦并使犬特定行為表現(xiàn)消失,就叫負(fù)懲罰。
Thyer Laura和L Myers認(rèn)為:“口語上,正強(qiáng)化可以貼上獎勵的標(biāo)簽,當(dāng)一個結(jié)果呈現(xiàn),而自此以后該受到獎勵的行為增加了,那么就發(fā)生了正強(qiáng)化。負(fù)強(qiáng)化可以被解釋為解脫,如果一個行為的結(jié)果由移走不愉快的事物構(gòu)成,該行為以后就被增強(qiáng)了,那么這就牽涉到負(fù)強(qiáng)化。當(dāng)一個行為的結(jié)果由呈現(xiàn)令人厭惡的東西構(gòu)成,那么就發(fā)生了正懲罰,它以該行為發(fā)生的可能性降低為結(jié)果。負(fù)懲罰包含移走令人愉快的事物,它以未來該行為發(fā)生的可能性降低為結(jié)果,口語上將負(fù)懲罰看做類似于罰款的操作”。負(fù)強(qiáng)化是好的,人們向往的,而懲罰是不好的,人們力求回避的。因此不能將負(fù)強(qiáng)化等同于懲罰。
二、從行為與結(jié)果關(guān)系考察
Barry Schwartz將效果律作為操作條件作用的基本問題進(jìn)行分析,他指出:“效果律研究的焦點是行為和它的結(jié)果、反應(yīng)和結(jié)果之間的關(guān)系。我們可以確認(rèn)四類行為——結(jié)果關(guān)系類型。一是行為能產(chǎn)生積極的結(jié)果,這種關(guān)系叫正強(qiáng)化;二是行為導(dǎo)致已經(jīng)呈現(xiàn)的刺激結(jié)束或移去,這種關(guān)系叫負(fù)強(qiáng)化;三是行為產(chǎn)生消極的結(jié)果,這種關(guān)系叫懲罰;最后一種是行為可能防止消極事件發(fā)生,這種關(guān)系叫回避?!睆男袨榕c結(jié)果關(guān)系看,正強(qiáng)化、負(fù)強(qiáng)化、回避等都將導(dǎo)致行為反應(yīng)的增加,而懲罰導(dǎo)致行為反應(yīng)頻率降低。
三、依據(jù)操作式條件反射原理,強(qiáng)化可以分為四種類型
(一)正強(qiáng)化:給予一種好刺激。為了建立一種適應(yīng)性的行為模式,運(yùn)用獎勵的方式,使這種行為模式重復(fù)出現(xiàn),并保持下來。例如實驗中猴子按下某按鈕即可以得到食物,將會培養(yǎng)其主動按下按鈕。
(二)負(fù)強(qiáng)化:去掉一個壞刺激。為引發(fā)所希望的行為的出現(xiàn)而設(shè)立。例如實驗中猴子按下某按鈕即可以停止對其噴水,將會培養(yǎng)其主動按下按鈕。
(三)正懲罰:施加一個壞刺激。這是當(dāng)不適當(dāng)?shù)男袨槌霈F(xiàn)時,給予處罰的一種方法。例如實驗中猴子不小心碰到某個按鈕會遭到輕微電擊,將會使其避免碰到此按鈕。
(四)負(fù)懲罰:去掉一個好刺激。這種懲罰比之正懲罰更為常用。當(dāng)不適當(dāng)?shù)男袨槌霈F(xiàn)時,不再給予原有的獎勵。例如實驗中猴子不小心碰到某個按鈕食物會從洞中漏出,將會使其避免碰到此按鈕。
一、在警犬訓(xùn)練中的應(yīng)用
其實在日常訓(xùn)練中,我們一直在有意或無意地使用負(fù)強(qiáng)化方法。例如,在培養(yǎng)犬立科目時,如果“立”的口令下達(dá)后犬不立,可用右手向斜上方拉牽引帶,同時左手手指向上刺激犬腹部,這時犬會感受到來自脖子和腹部的非條件刺激,對于犬來說這是不舒服的,為了避免這個“壞刺激”再次施加到身上,犬會逐漸主動做出立的動作,訓(xùn)犬員則在犬主動做出動作后立即停止施加刺激。又如撲咬科目中令犬放口,當(dāng)“放”的口令下達(dá)后,犬依然會死死咬住護(hù)袖,我們常用向上提拉牽引帶、朝耳朵吹氣、用木棍按壓舌根等方法,這都是在對犬施加一個“壞刺激”,犬為了避免受到刺激會主動形成聽到口令后放口的行為,訓(xùn)犬員則立即停止施加刺激。也就是說,訓(xùn)犬員在犬做出正確動作時給予食物等獎勵,則屬于正強(qiáng)化;而為了防止犬隨意撲咬人或隨地揀食對其施加的強(qiáng)有力的機(jī)械刺激,則屬于正懲罰。
二、在訓(xùn)練教學(xué)中的應(yīng)用
在警犬訓(xùn)練教學(xué)過程中,也可以參照企業(yè)管理方法,對學(xué)員實施強(qiáng)化與懲罰,有利于培養(yǎng)學(xué)員的訓(xùn)練積極性。讓那些訓(xùn)練成績差的人在隊伍前檢查自己的不足——這實際是一種正懲罰,那些沒有上臺的人得到了負(fù)強(qiáng)化;讓成績好的人在隊伍前帶犬示范、談訓(xùn)練的心得、給予表揚(yáng)——這是正強(qiáng)化,而那些沒有上臺的人就受到了負(fù)懲罰。這里的負(fù)懲罰給學(xué)員們提供了努力的方向,且自尊心不會受到影響,因而與正懲罰相比,人們更樂于接受負(fù)懲罰。另外,負(fù)強(qiáng)化能否發(fā)揮激勵作用取決于負(fù)強(qiáng)化物的性質(zhì),如果負(fù)強(qiáng)化物具有激勵作用,那么負(fù)強(qiáng)化就具有激勵作用。
一、必須與刺激結(jié)合起來使用。沒有相應(yīng)的刺激措施,犬逃避刺激的行為就不會出現(xiàn),行為出現(xiàn)頻次更不會逐漸變高,也就不可能形成負(fù)強(qiáng)化。
二、必須應(yīng)用于科目的建立。很顯然,負(fù)強(qiáng)化和懲罰同樣具有積極的教育意義,但要清楚負(fù)強(qiáng)化是為了建立某種行為。因此,負(fù)強(qiáng)化主要針對犬科目的形成和鞏固。
三、負(fù)強(qiáng)化如果想收到預(yù)期效果,必須建立在客觀、一致的情況下。就是無論任何時候,如果犬沒做出某行為,對其施加的刺激都是一致的;如果犬做出某行為,則立即撤銷對其施加的刺激,這樣才能在犬的觀念中建立起逃避刺激的反應(yīng)意識,可以快速幫助犬建立起“行為”與“刺激”之間的因果關(guān)系。
(作者單位:公安部警犬技術(shù)學(xué)校,110034)
(編輯:顏 勤)