姜英杰 馬瀟瀟 姜元濤 任吉梅 龍翼婷
編碼后獎賞影響基于議程的學習:獎賞預期和結(jié)果的作用*
姜英杰 馬瀟瀟 姜元濤 任吉梅 龍翼婷
(東北師范大學心理學院, 長春 130024)
基于ABR模型考察獎賞預期和獎賞結(jié)果對不同難度詞對記憶與元記憶的影響。結(jié)果發(fā)現(xiàn):(1)限時學習條件下, 獎賞結(jié)果促進不同難度詞對記憶成績和學習判斷, 獎賞預期僅提高簡單詞對的記憶成績。(2)自定步調(diào)學習條件下, 定時學習判斷時獎賞結(jié)果僅影響學習判斷; 獎賞預期促進高難度詞對的學習時間分配, 從而提高記憶成績和學習判斷。(3)在自定步調(diào)學習時, 獎賞預期超越難度成為影響學習時間分配的因素。以上結(jié)果表明, 個體會綜合獎賞預期、獎賞結(jié)果和難度構(gòu)建學習議程, 足夠大的獎賞預期會超越難度成為議程構(gòu)建的主導因素。但獎賞預期和獎賞結(jié)果對記憶成績、學習時間分配和學習判斷的影響受學習條件調(diào)節(jié)。
獎賞預期, 學習判斷, 學習時間分配, 元記憶, 記憶
元記憶是對記憶過程進行監(jiān)測和控制的元認知成分(Flavell, 1979; Flavell & Wellman, 1977), 包括元記憶監(jiān)測和控制(Nelson, 1990)。元記憶監(jiān)測(metamemory monitoring)是個體根據(jù)記憶材料特征、學習條件與目標、自身記憶特點等對記憶過程和狀態(tài)的主觀評價或判斷, 元記憶監(jiān)測會影響自我調(diào)節(jié)學習中認知資源的分配。學習判斷(judgements of learning, JOLs)是一種前瞻性元記憶監(jiān)測指標, 是個體在學習之后對于已學習項目在未來測試中成功回憶可能性的預測(Dunlosky & Nelson, 1992)。元記憶控制(metamemory control)是在元記憶監(jiān)測基礎上進行的對記憶過程的調(diào)節(jié)和控制(Nelson, 1990), 自定步調(diào)學習時的學習時間分配(study time allocation)是元記憶控制的核心成分。
有研究表明, JOLs和學習時間分配受項目難度影響(Koriat & Ackerman, 2010; Price et al., 2010)。但另有研究卻發(fā)現(xiàn)項目難度對JOLs和學習時間分配的影響存在不一致的結(jié)果:當實驗指導語為記住一個項目得1分, 要求盡量得更多分時, 被試會優(yōu)先學習容易項目并給其更高JOLs (Koriat & Nussinson, 2009)。但當困難項目價值更高時, 個體就會優(yōu)先學習困難項目并分配更多學習時間, JOLs也以價值為導向(Koriat & A ckerman, 2010; Price et al., 2010)。為解決上述爭議, Ariel等人(2009)引入獎賞結(jié)構(gòu)(reward structure), 包括項目價值和項目測試可能性, 考察其對不同難度項目學習時間分配的影響。發(fā)現(xiàn)不論加工容易還是困難項目, 個體會依據(jù)項目測試可能性進行項目選擇, 優(yōu)先學習測試可能性較高(90%)的項目; 將測試可能性換成項目價值, 結(jié)果相同, 即個體依據(jù)項目價值做項目選擇。
上述研究表明, 當項目同時具有難度和獎賞結(jié)構(gòu)上的不同特征時, 學習者并非先考慮項目難度, 而是優(yōu)先依據(jù)項目的獎賞結(jié)構(gòu)進行JOLs和項目選擇, 即獎賞結(jié)構(gòu)對JOLs和學習時間分配的影響超過了項目難度。據(jù)此, 有研究提出了基于議程的調(diào)節(jié)模型(Agenda-Based Regulation Model, ABR)來解釋學習者綜合考慮項目難度和價值后建立的議程對學習時間分配的影響(Ariel et al., 2009; Yu et al., 2020)。該模型認為, 個體會綜合任務要求等學習條件, 構(gòu)建學習議程, 并在此基礎上不斷調(diào)整自己的學習行為。在這一過程中, 足夠高的項目價值能夠取代難度對JOLs和學習時間分配產(chǎn)生主導性影響。
但是, ABR模型僅將項目價值和測試可能性作為獎賞結(jié)構(gòu), 未對獎賞加工的不同時段進行區(qū)分。依據(jù)發(fā)生在獎賞期待和獎賞獲得兩個不同時段, 獎賞加工分為欲求階段(appetitive phase)和執(zhí)行階段(consummatory phase), 對應于這兩個時段的獎賞結(jié)構(gòu)分別是獎賞預期(reward expectation)和獎賞結(jié)果(reward outcome)兩種成分(Mason et al., 2017)。獎賞預期是被試對成功記憶項目能獲得收益的猜測, 獎賞結(jié)果是被試成功記憶該項目后獲得的分值或獎賞。先前研究對項目價值或測試可能性的呈現(xiàn)均在項目呈現(xiàn)前, 被試在項目編碼前已知成功記住該項目能獲得的獎賞, 無需猜測可能獲得的收益, 不產(chǎn)生獎賞預期。因此, ABR模型只考慮了獎賞結(jié)果對學習時間分配的影響, 而忽略了獎賞預期的作用。如果在項目呈現(xiàn)前僅用指導語告知成功記住該項目會獲得獎勵, 具體分值在編碼后呈現(xiàn), 被試就會對項目產(chǎn)生獎賞預期, 能夠考察獎賞預期對JOLs和學習時間分配的影響。
Soderstrom和McCabe (2011)引入價值呈現(xiàn)順序這一變量, 控制價值在項目前或后呈現(xiàn), 考察因價值呈現(xiàn)順序帶來的獎賞預期、獎賞結(jié)果和詞對相關(guān)程度(即難度)對JOLs的影響。結(jié)果發(fā)現(xiàn), 在固定步調(diào)學習中, JOLs僅受獎賞結(jié)果的影響, 而與價值呈現(xiàn)順序無關(guān); 而在自定步調(diào)學習中, 價值呈現(xiàn)順序雖仍不影響JOLs, 但呈現(xiàn)順序和獎賞結(jié)果對學習時間分配的影響存在交互作用——僅當價值呈現(xiàn)在編碼前時, 獎賞結(jié)果才能夠影響學習時間分配和回憶成績, 而當價值在編碼后呈現(xiàn)時, 獎賞結(jié)果的效應消失。但這一結(jié)果可能是因其變量和條件設置局限導致:實驗中的每個項目都匹配了價值, 導致不論價值呈現(xiàn)在編碼前、后, 被試都會對分值結(jié)果產(chǎn)生預期, 存在獎賞結(jié)果和獎賞預期的混淆, 且考察獎賞預期作用時缺少無預期作為基線比較。因此該研究實際上無法對獎賞預期是否影響JOLs和學習時間分配, 以及獎賞預期高低怎樣影響JOLs和學習時間分配等問題做出解釋。
綜上, 已有研究缺乏對獎賞預期影響JOLs和學習時間分配的有效考察, ABR模型尚需通過獎賞預期成分進行驗證。因此, 本研究將獎賞預期成分補充進ABR模型中, 驗證在基于難度與價值的學習議程構(gòu)建中, 足夠高的獎賞預期是否能夠取代難度對JOLs和學習時間分配產(chǎn)生主導性影響。共3個實驗:實驗1在 Soderstrom和McCabe (2011)的實驗基礎上加入控制組, 旨在通過將獎賞后置呈現(xiàn)考察獎賞預期對限時學習時JOLs和回憶正確率的影響; 實驗2取消學習時限被試自主控制學習時間, 旨在考察后置條件下獎賞對學習時間分配的影響。實驗3在實驗2的基礎上, 通過操縱價值梯度來控制獎賞預期, 旨在考察后置條件下獎賞預期梯度大小對自定步調(diào)學習的影響。
實驗1通過2 (難度:簡單、困難) × 2 (獎賞預期:有、無)和2 (難度:簡單、困難) × 2 (獎賞結(jié)果:高、低)實驗設計, 將價值后置探究獎賞預期、獎賞結(jié)果和難度對被試JOLs和回憶正確率的影響。獎賞組以價值高低作為控制獎賞結(jié)果的方法。而非獎賞組不設任何分值作為基線。由于價值呈現(xiàn)在項目后, 價值不能作為記憶的有效線索, 因此假設獎賞結(jié)果對被試回憶正確率無顯著影響, 而對JOLs影響顯著。
2.1.1 被試
依據(jù)前人研究中的平均效應量= 0.6來確定被試量(Peng & Tullis, 2021)。(1 ? β) = 0.95, 使用G* Power 3進行效能分析, 發(fā)現(xiàn)α = 0.05時推薦的最小被試量為8人。實驗2被試量的計算同上。
東北師范大學60名在校大學生參與了本次實驗, 根據(jù)被試報名順序隨機分配為獎賞組(29人)和非獎賞組(31人), 記憶材料平均通過率為0.3~0.55 (Yu et al., 2020), 5名被試的數(shù)據(jù)因記憶正確率低于10%而剔除。有效被試55名(男24人, 女31人, 平均年齡20.35歲,= 2.34)。被試視力正?;虺C正視力正常, 無腦損傷或精神病史, 之前未參加過類似實驗。所有被試自愿參加本實驗, 在實驗開始前簽署知情同意書, 實驗結(jié)束后獲得相應報酬。
2.1.2 實驗材料
以線索回憶通過率為指標確定詞對難度, 選取高(通過率: 0.03~0.13)、低(通過率: 0.63~0.87)難度詞對各30對用于正式實驗, 另外選取7個中等難度詞對用于練習, 共計67個中性詞對構(gòu)成本實驗材料(Yu et al., 2020), 例如“電報(線索詞)—茶葉(目標詞)”。詞頻控制在0.00076~0.00997, 筆畫數(shù)范圍在7~30畫, 音節(jié)數(shù)范圍在4~6個。
為避免首因和近因效應, 正式實驗中最初2個和最后2個詞對作為填充刺激不計入數(shù)據(jù)分析(Soderstrom & McCabe, 2011), 有效詞對共計56個, 簡單和困難詞對各半。在獎賞組, 每個詞對都匹配了0~6中一個分值。因此, 各價值條件下分別有8個trial。
2.1.3 實驗儀器
實驗程序使用E-Prime 2.0軟件編寫。實驗設備采用配有21英吋CRT彩色純平顯示器的聯(lián)想多媒體計算機, 分辨率為1024×768, 刷新率為75 Hz。使用SPSS 26.0軟件進行數(shù)據(jù)處理與分析。
2.1.4 實驗程序
實驗分為學習階段和測試階段。學習階段具體流程見圖1。首先, 屏幕上呈現(xiàn)一個注視點0.5 s, 提醒被試集中注意; 之后, 屏幕上呈現(xiàn)一組雙字詞對, 被試需要在4s內(nèi)對其進行記憶; 然后, 獎賞組被試的屏幕上會呈現(xiàn)0~6不等的分值1 s, 如果測試階段能夠成功回憶該詞對, 會獲得與其分值匹配的額外被試費??刂平M被試屏幕上呈現(xiàn)一個等時的空屏; 最后, 被試需要對之后能否正確回憶做0~100的信心判斷, 并用數(shù)字鍵盤輸入。共計60個詞對, 學習30個詞對后休息, 待被試狀態(tài)恢復后完成剩余30個詞對的學習。學習階段結(jié)束后進行“自2000開始的連續(xù)減3”干擾任務3分鐘, 之后進入測試階段:所有線索詞呈現(xiàn)在Excel表中, 不限時回憶與之對應的目標詞并輸入。無法回憶的項目跳過并繼續(xù)作答。
實驗1中各價值項目及控制組的回憶正確率和JOLs值見表1。
2.2.1 無獎賞和0價值對回憶正確率影響
圖1 實驗1獎賞組學習階段流程圖
表1 有獎賞組與無獎賞組的回憶正確率和學習判斷的平均數(shù)和標準差(M ± SD)
2.2.2 無獎賞和0價值對JOLs影響
與有獎賞結(jié)果中的1~6價值相比, 0價值詞對無法為被試帶來任何收益, 被試認識到對0價值詞對的記憶會造成認知資源的浪費。因此在得到0價值結(jié)果后, 在進行JOLs時就不會再對該詞對進行復述等繼續(xù)加工, 但無獎賞詞對在做JOLs時被試會做復述。JOLs結(jié)果也驗證了上述推測, 被試對無獎賞詞比對0價值詞對的JOLs更高。但是, 這種對0價值詞對在JOLs時的不復述, 本該導致0價值詞對的記憶成績低于無獎賞條件的詞對, 可實際上二者并無顯著差異。這可能是因為與無獎賞條件相比, 0價值詞對的編碼受到了獎賞預期的額外促進, 獎賞預期的促進作用與0價值獎賞結(jié)果的削弱作用相抵消, 才導致了0價值與無獎賞條件下詞對的回憶正確率無顯著差異。
2.2.3 獎賞預期與難度對JOLs的影響
2.2.4 獎賞預期與難度對回憶正確率的影響
2.2.5 獎賞結(jié)果與難度對JOLs的影響
圖2 不同組別和難度的JOLs回憶和正確率
注:*< 0.05, **< 0.01, ***< 0.001, 下同,誤差線為標準差
2.2.6 獎賞結(jié)果與難度對回憶正確率的影響
實驗1改進先前實驗范式(Soderstrom & McCabe, 2011), 考察后置價值與難度對限時學習的影響。發(fā)現(xiàn)記憶困難詞對時, 獎賞和非獎賞組回憶成績差異不顯著。而記憶簡單詞對時差異顯著, 表明獎賞組產(chǎn)生的獎賞預期促進了被試簡單詞對記憶, 驗證了本研究獎賞預期能促進編碼的假設。而在記憶困難詞對時, 獎賞與非獎賞組間記憶成績和JOLs都無顯著差異, 可能是因詞對過難, 被試無法在有限時間內(nèi)(4 s內(nèi))根據(jù)獎賞預期分配認知資源完成有效學習。先前研究發(fā)現(xiàn)學習時間是影響被試JOLs和學習成績的因素。因此, 實驗2中的編碼階段改用不限時的自定步調(diào)學習, 進一步探究獎賞預期和難度對回憶正確率以及元記憶監(jiān)測和控制的影響。
另外, 獎賞結(jié)果對學習成績有顯著影響, 高價值比低價值和0價值詞對回憶正確率更高??赡芤虮辉囋诓幌迺rJOLs階段對高價值詞對進行多次復述提取, 而對0價值和低價值項目較少復述提取。為排除JOLs階段的記憶鞏固效應, 實驗2改為固定時長的JOLs。
將學習時間限制取消, 進行自定步調(diào)學習, 探究獎賞預期、獎賞結(jié)果和難度對學習時間分配、JOLs以及回憶正確率的影響; 并將JOLs改為固定時長, 防止JOLs階段進行記憶鞏固。根據(jù)實驗1結(jié)果, 實驗2采用自定步調(diào)學習時間和固定時長JOLs, 由于價值呈現(xiàn)在編碼后, 假設獎賞結(jié)果只能影響被試的學習判斷, 對回憶正確率無顯著影響, 而獎賞預期影響學習時間分配, 從而影響記憶成績。
3.1.1 被試
東北師范大學60人參與本實驗, 根據(jù)被試報名順序隨機分配為獎賞組(30人)和非獎賞組(30人), 6名被試因記憶正確率低于10%剔除, 2名被試因參與類似實驗經(jīng)歷導致練習效應被剔除, 故有效被試52名(男生25人, 女生27人, 平均年齡20.35歲,= 2.34)。被試要求同實驗1。
圖3 不同價值和難度的JOLs和回憶正確率
3.1.2 實驗材料
同實驗1。
3.1.3 實驗儀器
同實驗1。
3.1.4 實驗程序
與實驗1基本一致, 改2處:(1)取消學習時限, 被試認為記住后, 按“空格”鍵進入下一屏學習。(2)學習判斷時間控制在2 s (見圖4)。
實驗2中各價值項目及控制組的學習時間見表2, 回憶正確率和JOLs值見表3。
3.2.1 無獎賞和0價值對回憶正確率影響
3.2.2 無獎賞和0價值對JOLs影響
圖4 實驗2獎賞組學習階段流程圖
表2 有獎賞組與無獎賞組學習時間的平均數(shù)及標準差(M ± SD)
表3 有獎賞組與無獎賞組的回憶正確率和學習判斷值的平均數(shù)及標準差(M ± SD)
3.2.3 獎賞預期與難度對學習時間分配的影響
3.2.4 獎賞結(jié)果與難度對學習時間分配的影響
3.2.5 獎賞預期與難度對JOLs的影響
圖5 不同組別、不同價值和難度的學習時間
圖6 不同組別和難度的JOLs和回憶正確率
3.2.6 獎賞預期與難度對回憶正確率的影響
3.2.7 獎賞結(jié)果與難度對JOLs的影響
3.2.8 獎賞結(jié)果與難度對回憶正確率的影響
與實驗1結(jié)果類似, 詞對難度對回憶成績、學習判斷和學習時間分配均有影響, 困難詞對被分配更多學習時間, 而簡單詞對回憶成績和JOLs卻高于困難項目。再次證明, 難度是個體進行學習判斷的重要內(nèi)部線索, 也是影響學習時間分配的重要因素。
圖7 不同價值和難度的JOLs和回憶正確率
價值呈現(xiàn)于詞對充分編碼后, 被試在編碼階段無法得知價值(獎賞結(jié)果)的高低, 因此獎賞結(jié)果僅對JOLs產(chǎn)生影響, 而無法對學習時間產(chǎn)生影響, 表現(xiàn)為高價值詞對的JOLs顯著高于低價值詞對, 而高低價值詞對的學習時間沒有差異。并且, JOLs階段時間固定, 被試無法根據(jù)獎賞結(jié)果在此階段進行復述鞏固, 因此, 高低價值詞對回憶正確率無顯著差異。驗證實驗2的假設: 實驗1中獎賞結(jié)果對記憶成績的影響是因被試在JOLs階段進行了記憶鞏固, 實驗2將JOLs改為定時, 被試無法在此階段對高價值項目進行充分復述, 獎賞結(jié)果僅影響被試的元記憶監(jiān)測, 不影響記憶成績, 與先前研究結(jié)果一致(Dunlosky & Connor, 1997; Mazzoni & Cornoldi, 1993; Soderstrom & McCabe, 2011)。
通過獎賞與非獎賞組比較, 可以得到獎賞預期對JOLs、學習時間以及回憶成績的影響。結(jié)果發(fā)現(xiàn), 自定步調(diào)學習條件下, 記憶困難詞對時, 獎賞組被試JOLs和學習時間高于非獎賞組; 而記憶簡單詞對時, 獎賞與非獎賞組學習時間分配的差異相比于困難詞對時變小, JOLs差異不顯著。表明在元記憶監(jiān)測過程中, 難度高時個體會根據(jù)獎賞預期進行學習判斷和學習時間分配; 而難度降低時, 獎賞預期不再成為學習判斷和學習時間分配的重要依據(jù)。即隨著難度的降低, 獎賞預期對學習時間分配的影響在變小。但是, 這并未體現(xiàn)在回憶成績上, 高低難度詞對的回憶正確率都表現(xiàn)出獎賞預期的促進作用。綜上, 獎賞預期對元記憶監(jiān)測和控制的作用會受到難度的影響, 而這種影響并未體現(xiàn)在回憶成績上。
在自定步調(diào)學習時, 有獎賞預期但無獎賞結(jié)果的0價值回憶正確率顯著高于無獎賞組, 表明在學習時間充足時, 獎賞預期促進被試的記憶成績。通過比較學習時間可以發(fā)現(xiàn), 有獎賞預期組被試在編碼階段對詞對進行充分編碼以獲得更高的成績, 因此與實驗1相比, 被試對0價值詞對的回憶正確率和JOL都顯著提高。
獎賞結(jié)果對JOLs有顯著影響, 高、低價值都和0價值有顯著差異。但高、低價值間無顯著差異, 表明獎賞結(jié)果對元記憶監(jiān)測的作用可能會受到獎賞結(jié)果梯度影響, 梯度足夠大時才有明顯作用。并且當獎賞預期和難度同時存在時, 二者哪個會成為影響學習的主要依據(jù)需進一步探究。因此, 實驗3中進一步操控獎賞預期, 考察獎賞預期大小對自定步調(diào)學習的影響。
進一步操控獎賞預期大小, 考察其對自定步調(diào)學習學習時間分配、JOLs和回憶正確率的影響。如果獎賞預期的大小影響回憶正確率(Yu et al., 2020), 那么大梯度獎賞預期比小梯度獎賞預期對學習不同難度詞對時的學習時間分配有更大促進作用。
4.1.1 被試
依據(jù)前人研究中的平均效應量= 0.6來確定被試量(Undorf & Br?der, 2020; Undorf et al., 2018)。通過Gpower 3計算得出, 1 ? β = 0.95,= 0.05時推薦的最小被試量為8人。東北師范大學18名在校大學生參加本實驗, 因記憶成績過低篩除3名被試, 故有效被試15名(男生4人, 女生11人, 平均年齡22.00歲,= 2.17歲)。被試要求同實驗1。
4.1.2 實驗材料
因?qū)嶒?價值數(shù)目由7變?yōu)?, 故從實驗1中選取48個詞對作為實驗3的材料, 每個價值包括8個詞對, 困難與簡單詞對各24個。
4.1.3 實驗儀器
同實驗1。
4.1.4 實驗程序
與實驗2基本一致, 但實驗3取消控制組改為被試內(nèi)設計(見圖8)。被試學習兩個block, 一個block項目價值為1、3、6 (低獎賞預期), 另一個block項目價值為1、6、12 (高獎賞預期)。每一個block開始前, 告知被試接下來一組詞的分值。呈現(xiàn)順序被試間平衡。
實驗3中各價值項目的學習時間見表4, 回憶正確率和JOLs值見表5。
4.2.1 獎賞預期與難度對學習時間分配的影響
圖8 實驗3學習階段流程圖
表4 各價值項目的學習時間的平均數(shù)及標準差(M ± SD, n = 15)
表5 各價值項目的回憶正確率和學習判斷值的平均數(shù)及標準差(M ± SD, n = 15)
圖9 不同獎賞預期和難度對學習時間分配的影響
4.2.2 獎賞預期與難度對JOLs的影響
4.2.3 獎賞預期與難度對回憶正確率的影響
圖10 不同獎賞預期和難度的JOLs和回憶正確率
圖11 不同獎賞預期價值1和難度的回憶正確率
結(jié)果表明, 難度作為個體元記憶監(jiān)測的重要內(nèi)部線索, 依然對個體學習判斷產(chǎn)生影響, 簡單詞對JOLs高于困難詞對; 同時難度對回憶成績的影響也是穩(wěn)定存在的, 簡單詞對回憶成績高于困難詞對。然而在學習時間分配上, 難度的主效應消失, 這與實驗2結(jié)果并不一致??赡苁怯捎谠趯嶒?中, 價值梯度增大, 被試可以更清楚地覺察到獎賞預期的重要性, 從而使獎賞預期取代難度成為影響學習時間分配的主要依據(jù)(Ariel et al., 2009; Yu et al., 2020)。
獎賞預期對JOLs、學習時間分配及回憶成績均產(chǎn)生影響。表現(xiàn)為高預期項目JOLs、學習時間和回憶成績均高于低預期項目。結(jié)合實驗1和實驗2的結(jié)果, 在后置條件下, 獎賞結(jié)果和獎賞預期對個體記憶和元記憶的影響存在分離。具體來說, 獎賞結(jié)果僅促進了個體在編碼完成后的記憶鞏固, 而獎賞預期的有無和獎賞預期的高低對個體編碼和元記憶監(jiān)控均產(chǎn)生影響。
本研究考察了獎賞結(jié)果、獎賞預期和項目難度對學習時間分配、JOLs和回憶正確率的影響, 把獎賞預期的作用補充進ABR模型。
本研究結(jié)果表明, 獎賞結(jié)果、獎賞預期和項目難度會對個體元記憶監(jiān)測產(chǎn)生影響。實驗1通過改進Soderstrom和McCabe (2011)的實驗程序, 發(fā)現(xiàn)個體會依據(jù)獎賞結(jié)果、獎賞預期和難度線索進行學習時間分配和JOLs。在記憶表現(xiàn)上, 獎賞預期和難度的交互作用顯著, 限時學習時獎賞預期可以促進個體對簡單詞對的記憶成績。而個體的JOLs呈現(xiàn)出價值導向, 高價值項目JOLs高于低價值項目, 這表明了獎賞結(jié)果能夠促進個體的元記憶監(jiān)測過程。
由于本研究獎賞結(jié)果呈現(xiàn)于控制過程后, 故而獎賞結(jié)果無法影響個體元記憶控制過程。實驗2與實驗3中由于限制了JOLs的時間, 獎賞結(jié)果對記憶成績的影響消失, 但仍對JOLs產(chǎn)生影響。實驗2和實驗3中關(guān)于獎賞預期和項目難度對學習時間分配的相關(guān)結(jié)果表明, 獎賞預期和項目難度都會對元記憶控制產(chǎn)生影響, 通過自定步調(diào)學習時間, 被試有足夠的時間進行編碼, 獎賞預期的作用突顯出來。并且通過縱向分析實驗2和3的結(jié)果可以看出, 隨價值梯度加大, 獎賞預期能取代難度成為元記憶控制的主導線索。
為突出獎賞結(jié)果和獎賞預期各自對元記憶監(jiān)測和控制的影響, 本研究分別以獎賞結(jié)果和獎賞預期兩種視角對獎賞組和無獎賞組進行了比較。但是, 這種比較方式卻忽視了獎賞組和無獎賞組之間獎賞結(jié)果和獎賞預期共同影響帶來的差異。因此本文將有獎賞預期但無獎賞結(jié)果的0價值, 與無獎賞預期且無獎賞結(jié)果的無獎賞組進行比較, 結(jié)果發(fā)現(xiàn)二者僅在元記憶層面有顯著差異。這一結(jié)果可能是由于獎賞預期的促進作用與無結(jié)果的抑制作用相抵消, 使被試的回憶正確率與無獎賞相同。為進一步分析獎賞預期的作用, 在實驗3中將高獎賞預期組價值1與低獎賞預期組價值1進行比較, 二者均作為價值的起始點且獎賞結(jié)果相同。結(jié)果表明在獎賞結(jié)果相同的情況下, 高獎賞預期組回憶正確率高于低獎賞預期組, 表明了獎賞預期的作用。未來研究可以改進實驗范式以及數(shù)據(jù)分析方法, 在控制獎賞結(jié)果和獎賞預期共同影響的基礎上, 獨立地分析獎賞結(jié)果和獎賞預期對個體元記憶監(jiān)測和控制的影響。
先前研究表明, 基于議程模型中價值對學習時間的影響具有時間依賴性(Soderstrom & McCabe, 2011), 具體來說, 當價值呈現(xiàn)在項目前或與項目同時呈現(xiàn)時, 價值會對自定步調(diào)學習產(chǎn)生影響。然而價值呈現(xiàn)方式不同會產(chǎn)生不同的獎賞結(jié)構(gòu)成分, 先于或同時與項目呈現(xiàn)的價值, 其本質(zhì)為獎賞結(jié)果; 價值在項目后呈現(xiàn), 此時會引發(fā)獎賞預期。將兩者統(tǒng)稱為“價值”并不能清晰說明獎賞結(jié)構(gòu)中不同成分對自主學習的影響(Mason et al., 2017)。因此, 先前研究中對價值呈現(xiàn)時間不同所形成的“獎賞預期”和“獎賞結(jié)果”的界定并不明晰。
本研究區(qū)分了獎賞預期和獎賞結(jié)果對自主學習的影響, 補充和完善了基于議程的自主學習模型。首先, 在價值后置的條件下, 自主學習會受到獎賞預期的影響, 并且通過操縱價值梯度增大使得獎賞預期變大, 獎賞預期可以取代難度成為元記憶監(jiān)控的決定性線索, 在支持議程模型原有假設的基礎上進一步擴展了獎賞預期對自我調(diào)節(jié)學習的影響。其次, 獎賞預期與獎賞結(jié)果對自主學習的影響機制不同。具體來說, 當價值呈現(xiàn)在編碼前時, 個體不存在獎賞預期, 此時個體根據(jù)已知的獎賞結(jié)果建立議程, 并以此為基礎開展學習活動; 當價值呈現(xiàn)在編碼后時, 主要是獎賞預期對自主學習產(chǎn)生影響, 個體根據(jù)獎賞預期建立議程, 在此基礎上對自主學習進行調(diào)整。
個體如何高效利用有限的認知資源來提高記憶成績是元記憶研究要解決的關(guān)鍵問題。學習過程中記憶材料的難度并不相同(Laursen & Fiacconi, 2021), 為提高學習效率, 學習者需要綜合考慮材料價值、難度和可用學習時間等因素進行合理的認知資源分配。本研究通過設置后置獎賞的方式考察了獎賞預期和獎賞結(jié)果對個體記憶以及元記憶過程的影響, 其研究發(fā)現(xiàn)有如下教育啟示:第一, 在教學中可以恰當設置獎賞來促進個體自主學習效果。如, 學習前預告成功記憶會獲取一定的獎賞, 但不明確具體獎賞數(shù)額而在學習后呈現(xiàn)具體數(shù)額, 比在學習前明確告知具體數(shù)額或者分值, 對學習者的學習時間分配會有更好的促進作用; 第二, 對較難材料的學習, 在學習前給予獎賞預期會促進學習時間分配進而促進記憶效果提升, 但要注意給學生自主分配學習時間和調(diào)節(jié)學習進程的機會, 而不是由教師來控制學習時間和進程。因為如果學習時間過短會影響個體對于獎賞預期的權(quán)衡, 減弱獎賞預期對學習時間分配和學習效果的提升作用; 第三, 相比于容易項目, 困難項目學習可獲得的獎賞預期更大時, 獎賞預期的作用在學習時間分配中取代難度成為主要影響因素。所以在教學中, 可以通過設置不同的獎賞預期梯度來引導個體對于更困難材料分配更多學習時間, 從而提高記憶成績。
本研究通過3個實驗考察獎賞預期和獎賞結(jié)果對學習時間分配、回憶正確率和JOLs的影響,結(jié)論如下:
(1)個體會綜合獎賞預期、獎賞結(jié)果和難度構(gòu)建學習議程, 足夠大的獎賞預期會超越難度成為議程構(gòu)建的主導因素。
(2)獎賞預期和獎賞結(jié)果對記憶成績、學習時間分配和學習判斷的影響受學習條件調(diào)節(jié)。
Ariel, R., Dunlosky, J., & Bailey, H. (2009). Agenda-based regulation of study-time allocation: When agendas override item-based monitoring.(3), 432?447.
Castel, A. D., Farb, N. A., & Craik, F. I. (2007). Memory for general and specific value information in younger and older adults: Measuring the limits of strategic control.(4), 689?700.
Dunlosky, J., & Connor, L. T. (1997). Age differences in the allocation of study time account for age differences in memory performance.(5), 691?700.
Dunlosky, J., & Nelson, T. O. (1992). Importance of the kind of cue for judgments of learning (JOL) and the delayed-JOL effect.(4), 374?380.
Flavell, J. H. (1979). Metacognition and cognitive monitoring: A new area of cognitive-developmental inquiry.(10), 906?911.
Flavell, J. H., & Wellman, H. M. (1977). Metamemory. In R. Kail & J. Hagen (Eds.),(pp. 3–33). Hillsdale, NJ: Erlbaum.
Koriat, A., & Ackerman, R. (2010). Metacognition and mindreading judgments of learning for self and other during self-paced study.(1), 251?264.
Koriat, A., & Nussinson, R. (2009). Attributing study effort to data-driven and goal-driven effects: Implications for metacognitive judgments.(5), 1338?1343.
Laursen, S. J., & Fiacconi, C. M. (2021). Examining the effect of list composition on monitoring and control processes in metamemory.,(3), 498?517.
Mason, A., Farrell, S., Howard-Jones, P., & Ludwig, C. J. H. (2017). The role of reward and reward uncertainty in episodic memory., 62?77.
Mazzoni, G., & Cornoldi, C. (1993). Strategies in study time allocation: Why is study time sometimes not effective?(1), 47?60.
Nelson, T. O. (1990). Metamemory: A theoretical framework and new findings.,(8), 125?173.
Peng, Y., & Tullis, J. G. (2021). Dividing attention impairs metacognitive control more than monitoring.,(6), 2064?2074.
Price, J., Hertzog, C., & Dunlosky, J. (2010). Self-regulated learning in younger and older adults: Does aging affect metacognitive control?(3), 329?359.
Soderstrom, N. C., & McCabe, D. P. (2011). The interplay between value and relatedness as bases for metacognitive monitoring and control: Evidence for agenda-based monitoring.(5), 1236?1242.
Undorf, M., & Br?der, A. (2020). Cue integration in metamemory judgements is strategic.(4), 629?642.
Undorf, M., S?llner, A., & Br?der, A. (2018). Simultaneous utilization of multiple cues in judgments of learning.(4), 507?519.
Yu, Y., Jiang, Y., & Li, F. (2020). The effect of value on judgment of learning in tradeoff learning condition: The mediating role of study time.(3), 435?454.
The effect of after-encoding rewards on agenda-based learning:The role of reward expectation and reward outcome
JIANG Yingjie, MA Xiaoxiao, JIANG Yuantao, REN Jimei, LONG Yiting
(School of Psychology, Northeast Normal University, Changchun 130024, China)
Metamemory monitoring is a process in which individuals subjectively evaluate or judge the memory process and state, and the common indicator is judgments of learning (JOLs). Metamemory control is the regulation and control of memory processes carried out on the basis of metamemory monitoring, and the study time allocation during self-paced learning is a central component of metamemory control. According to Agenda-Based Regulation Model (ABR), individuals in the learning process will comprehensively analyze various factors such as task objectives, task constraints to construct the learning agenda, which is used to prioritize the study items and the amount of time needed to study. However, the main concern of the previous studies is the value presented as a reward outcome (reward obtained after successfully memory), leading to a lack of valid examination of whether reward expectation (prediction of reward outcome) affects the agenda construction and memory performance. Therefore, the aim of this study was to supplement the reward expectation into the ABR model by verifying whether a sufficiently high reward expectation can replace difficulty with exerting a dominant influence on JOLs and time allocation in an agenda construction.
Experiment 1 added a control group on the basis of Soderstrom and McCabe's (2011) to examine the effect of reward expectation and difficulty on JOLs and memory rates under a time limited learning condition by presenting the reward posteriorly. Experiment 2, which abolished the limited time learning to self-paced learning, was designed to examine the effect of reward expectation and difficulty on the study time allocation. To go a step further, Experiment 3 controlled reward expectation in the test by manipulating the value gradient, and was designed to examine the effect of the size of the gradient of reward expectation.
The current study found that: (1) under the limited time learning condition in Experiment 1, reward outcomes facilitated the memory performance and JOLs of both easy and hard word pairs, and reward expectation only improved the memory performance of easy word pairs without significant effects on JOLs. (2) in self-paced learning in Experiment 2, reward outcome only affected the JOLs rather than memory performance, but reward expectation promoted both JOLs and study time allocation thus improving the memory performance, what’s more, JOLs and study time allocation of hard word pairs in condition with reward expectation are higher than with no reward. (3) in self-paced learning in Experiment 3, the influence of difficulty on study time not significant any more, reward expectation beyond difficulty becomes the main factor affecting the study time allocation.
The above results proved that reward expectation is a contributing factor in ABR model. Individuals synthesize reward expectation, reward outcome and difficulty while constructing a learning agenda, and reward expectation overrides difficulty as the dominant factor in agenda construction when it is sufficiently large. However, the effects of reward expectation and reward outcome on memory performance, study time allocation, and JOLs were modulated by the learning conditions.
reward expectation, judgments of learning, study time allocation, metamemory, memory
2021-05-25
* 吉林省自然科學基金面上項目(20230101149JC)和國家自然科學基金面上項目(32271095)資助。
姜英杰, E-mail: jiangyj993@nenu.edu.cn
B842