呂慧敏 ,董翠香 *,楊秋穎 ,劉 超
體力活動(physical activity,PA),是指骨骼肌產(chǎn)生的任何需要能量消耗的身體移動(Caspersen et al.,1985)。根據(jù)不同的研究設(shè)計,體力活動常被分為一次性體力活動(acute physical activity)和長期體力活動(regular/chronic physical activity)。長期體力活動對身心健康的益處已被熟知,如增強體質(zhì)、降低慢性疾病發(fā)生風險(如肥胖、心血管疾病、糖尿病等)、改善精神障礙(如壓力、抑郁、低自尊等)(Ahn et al.,2011;Janssen et al.,2010;Poitras et al.,2016)。研究表明,體力活動對大腦發(fā)育及認知功能也有積極影響,從而促進兒童青少年學業(yè)成績的提高(方黎明 ,2020;álvarez-Bueno et al.,2017b;Donnelly et al.,2016;Singh et al.,2012)。體質(zhì)健康狀況好的學生往往表現(xiàn)出更好的出勤率、認知表現(xiàn)、課堂行為和學業(yè)成績(CDC,2014;Michael et al.,2015)。神經(jīng)生理學領(lǐng)域的研究顯示,兒童青少年時期是大腦發(fā)育的絕佳“窗口期”,此時大腦的神經(jīng)可塑性最強,參與體力活動能夠最大限度地對大腦結(jié)構(gòu)和功能產(chǎn)生積極影響,從而獲得更好的學業(yè)成績(董進霞,2017;Ratey et al.,2013)。
但也有研究認為,長期體力活動對學業(yè)成績沒有影響或有負面影響(Chan et al.,2016;Yu et al.,2006)??梢姡瑢τ趦和嗌倌赀M行長期體力活動是否能夠提高學業(yè)成績這個議題,迄今為止并未達成共識。研究結(jié)果的差異,可能是研究設(shè)計及體力活動干預劑量差異導致的。體力活動干預劑量是指機體接受的運動量,一般包括頻率、強度和持續(xù)時間,干預方式也常被研究者納入體力活動的劑量處方中(Howie et al.,2018)。劑量-效應關(guān)系(dose-response)是指由于不同的干預劑量而產(chǎn)生不同的結(jié)果效應。對長期體力活動與學業(yè)成就的劑量-效應關(guān)系進行研究,可以檢驗不同持續(xù)時間、強度、頻率與方式的體力活動干預對學業(yè)成績影響的差異。但目前,鮮見體力活動與學業(yè)成績劑量-效應關(guān)系的量化研究(溫煦,2015;álvarez-Bueno et al.,2017b;Donnelly et al.,2016)。
鑒于此,本研究在充分考慮被納入文獻的方法學質(zhì)量基礎(chǔ)上,運用Meta分析方法,對國內(nèi)外關(guān)于長期體力活動對兒童青少年學業(yè)成績影響的實驗研究進行綜合分析,探討長期體力活動對學業(yè)成績影響的總體效應,長期體力活動對不同科目學業(yè)成績影響的效應差異,以及長期體力活動與學業(yè)成績的劑量-效應關(guān)系。
納入標準:1)研究主題為關(guān)于體力活動與學業(yè)成績關(guān)系的實驗研究;2)長期體力活動干預,至少進行了一項學業(yè)成績評估;3)研究對象為3~18歲的健康兒童青少年;4)中、英文文獻;5)文獻類型為期刊文獻。
剔除標準:1)未進行實驗研究的文獻;2)未進行體力活動干預的研究;3)體力活動干預類型為非長期性干預;4)針對非健康兒童青少年的研究;5)非中、英文發(fā)表的文獻;6)數(shù)據(jù)報告不完整的文獻。
分別選取中、英文數(shù)據(jù)庫(中國知網(wǎng)、ScienceDirect、Web of Science、EBSCO、Scopus),根據(jù)納入標準構(gòu)建檢索式[中文:SU=(“體力活動”+“身體活動”+“體育活動”+“身體活動”+“體育鍛煉”+“運動”)AND SU=(“學業(yè)成績”+“學業(yè)成就”+“學業(yè)表現(xiàn)”+“學業(yè)成績”);英文:TS=(“physical activit*”O(jiān)R exercise OR sports OR“physical education”O(jiān)R running OR walking OR yoga)AND TS=(“academic”O(jiān)R“academic achievement”O(jiān)R“academic grades”O(jiān)R“academic performance”O(jiān)R“class‐room behavior”)AND TS=(children OR kids OR adoles‐cent*OR teenager*OR youngster*OR preadolescent*OR school*OR preschool OR kindergarten OR“middle school”O(jiān)R“high school”)]并進行文獻檢索,檢索時間范圍為2020年以前,共獲得中文文獻642篇、英文文獻4 376篇。將檢索獲得的文獻信息導入EndNote,去掉1 933篇重復文獻,獲得中文文獻634篇、英文文獻2 451篇,共計3 085篇。
基于檢索獲得的3 085篇文獻信息,由兩位研究者根據(jù)納入和剔除標準分別進行文獻篩選。采用Cohen’s Kappa系數(shù)對兩位研究者篩選的一致性程度進行檢驗,Cohen’s Kappa系數(shù)為0.828,說明文獻篩選結(jié)果具有高度一致性(Tang et al.,2015)。對于存在爭議的17篇文獻,邀請第三位研究者加入討論,共同確定是否納入,最終獲得中文文獻5篇、英文文獻26篇,共計31篇。
采用定量研究質(zhì)量評估標準(改編版)對納入的研究質(zhì)量進行評估(表1)。兩位研究者根據(jù)評估標準對納入研究的質(zhì)量進行獨立評估,從選擇偏倚、實驗設(shè)計、干擾因素、盲法、測量方法和樣本變化6個維度進行了綜合評定,即高質(zhì)量研究:強維度≥4且弱維度=0;中等質(zhì)量研究:強維度<4且弱維度≤1;低質(zhì)量研究:弱維度≥2。對于不一致的評估結(jié)果,邀請第三位研究者加入討論,共同確定結(jié)果。研究質(zhì)量評估結(jié)果顯示,高質(zhì)量研究6篇,中等質(zhì)量研究7篇,低質(zhì)量研究18篇。為使研究結(jié)果可信度更高,本研究僅納入13項中高質(zhì)量研究(圖1)。
表1 定量研究質(zhì)量評估標準(改編版)Table 1 Quality Evaluation Standard for Quantitative Studies(Revised Version)
圖1 文獻篩選與納入流程Figure 1. Literature Selection and Inclusion Flow Chart
采用Excel對納入的13項研究進行編碼,提取以下特征值:作者、年份、國籍、樣本特征(樣本量和年齡)、學業(yè)成績測評工具、體力活動干預劑量(干預方式、持續(xù)時間、單次時間、頻率和強度)、研究結(jié)果(表2)。
表2 納入文獻特征值編碼縮略Table 2 Abbreviated List of the Characteristics of Included Literature
采用Review Manager 5.3軟件進行Meta分析,通過Q檢驗和I2確定研究間是否存在異質(zhì)性:P<0.05為異質(zhì)性顯著,P≥0.05為異質(zhì)性不顯著;Ⅰ2<25%為低度異質(zhì),25%<I2<50%為中度異質(zhì),50%<I2<75%為高度異質(zhì),I2>75%不能直接合并(黃志劍等,2013)。采用效應量(ef‐fect size,ES)表示實驗組與控制組間的差異程度:ES<0.2為小效應,0.2≤ES≤0.8為中等效應,ES>0.8為大效應(Cohen,1992)。本研究結(jié)果均為連續(xù)型變量,且使用不同測量工具,故采用標準化均數(shù)差(standardized mean dif‐ference,SMD)計算效應量,95%置信區(qū)間,P≤0.05為具有統(tǒng)計學意義。
對篩選得到的31篇文獻進行研究質(zhì)量評估發(fā)現(xiàn),僅19%的研究被評為高質(zhì)量研究。選擇偏倚維度上,由于選取樣本不具代表性或樣本有一定代表性但同意參與實驗的樣本比例低于60%而被評為弱維度。實驗設(shè)計維度上,89%的研究為隨機對照實驗,還包括準實驗和對照實驗。干擾因素維度上,77%的研究比較全面地排除了樣本年齡、性別,以及體力活動水平和學業(yè)成績水平基線可能對實驗結(jié)果產(chǎn)生的影響。盲法維度上,僅19%的研究選擇單盲或雙盲法,以降低研究者和被試的主觀因素引起實驗結(jié)果的信息偏倚。測量方法維度上,選用多種學業(yè)成績測評工具,55%的研究對測評工具的信效度進行了檢驗。樣本變化維度上,45%的研究報告了最終完成實驗的樣本數(shù)量,并對樣本丟失原因進行了說明。81%的研究在不同維度上表現(xiàn)出弱維度,提示,未來開展該領(lǐng)域的實驗研究時,注意提高實驗設(shè)計的方法學質(zhì)量。
由于研究間存在中度異質(zhì)性(χ2=22.29,I2=46%,P=0.03),故采用隨機效應模型對納入的13篇文獻的效應量進行綜合檢驗。從合并效應量結(jié)果來看,13項實驗研究的合并效應量:SMD=0.29;95%CI:0.16,0.41;P<0.000 1。說明長期體力活動對學業(yè)成績具有中等程度的正向影響,兒童青少年進行長期體力活動有助于提高學業(yè)成績。
針對長期體力活動對不同科目學業(yè)成績的影響效果是否一樣這一問題,本研究探究了長期體力活動對不同科目學業(yè)成績的影響差異。納入的13篇文獻分別對數(shù)學和語文成績進行了評估,其中語文科目包括閱讀(read‐ing)、寫作(writing)、拼讀(spelling)、言語表達(expressive language)和語音意識(phonological awareness)等。長期體力活動對數(shù)學、閱讀和寫作成績具有顯著的正向影響(表3),對數(shù)學成績的促進效果最大(SMD=0.48,P<0.000 1),對閱讀成績的促進效果次之(SMD=0.25,P<0.000 1),對寫作成績的促進效果較?。⊿MD=0.16,P=0.05)。說明長期體力活動對不同科目的影響效果不同,對數(shù)學成績的促進效果高于閱讀和寫作。
表3 長期體力活動干預對不同科目學業(yè)成績的影響效果Table 3 Effect of Regular Physical Activity on Academic Performance of Different Subjects
為保證研究結(jié)果的科學性與可靠性,Meta分析過程通常會對樣本數(shù)據(jù)的發(fā)表偏倚進行檢測。當納入Meta分析的研究個數(shù)≥10時,可采用漏斗圖法進行發(fā)表偏倚評估。從13項研究在漏斗圖中的分布情況來看(圖2),研究樣本效應量均勻分布在平均效應值兩側(cè),無異常值存在,說明發(fā)表偏倚檢測效果良好,提示,數(shù)據(jù)分析結(jié)果較為穩(wěn)定。
圖2 樣本數(shù)據(jù)發(fā)表偏倚檢測漏斗圖Figure 2. Funnel Plot of Publication Bias Risk
1)干預方式。納入的13篇文獻包含7種干預方式,不同干預方式的合并效應量:有氧運動:SMD=0.59,95%CI:0.22,0.96,P<0.000 1;綜合性學校體育活動計劃:SMD=0.51,95%CI:0.38,0.65,P<0.000 1;專業(yè)體育與健康課:SMD=0.25,95%CI:0.09,0.41,P<0.000 1;與學習任務相關(guān)的體力活動:SMD=0.28,95%CI:-0.01,0.56,P=0.06;要求認知參與的體力活動:SMD=0.26,95%CI:-0.14,0.67,P=0.20;文化課中的微運動:SMD=0.16,95%CI:-0.21,0.53,P=0.39;瑜伽:SMD=-0.01,95%CI:-0.24,0.21,P=0.91??梢姡醒踹\動、綜合性學校體育活動計劃和專業(yè)體育與健康課對學業(yè)成績有著顯著的中等程度正向效應(ES>0.2,P≤0.5),且有氧運動的效應量最大。
2)干預持續(xù)時間。納入文獻中的體力活動持續(xù)時間從3周到3年不等,不同持續(xù)時間的合并效應量:≤1個月:SMD=0.32,95%CI:-0.01,0.64,P=0.06;1.5個月 :SMD=0.14,95%CI:-0.25,0.53,P=0.49;3個月:SMD=-0.05,95%CI:-0.37,0.27,P=0.76;4個月:SMD=0.13,95%CI:-0.28,0.53,P=0.54;5個月:SMD=0.47,95%CI:0.23,0.70,P<0.000 1;6個月:SMD=0.23,95%CI:-0.30,0.77,P=0.40;≥12月:SMD=0.32,95%CI:0.12,0.52,P<0.000 1。說明干預持續(xù)時間為5個月或1年以上,可以對學業(yè)成績產(chǎn)生顯著的中等程度正向效應,其中5個月的效應量最大。
3)單次干預時間。12篇文獻報告了體力活動的單次干預時間,不同干預時間的合并效應量:5 min/次:SMD=0.10,95%CI:-0.42,0.61,P=0.71;15 min/次:SMD=0.44,95%CI:0.17,0.71,P<0.000 1;20 min/次 :SMD=0.26,95%CI:-0.14,0.67,P=0.20;30 min/次 :SMD=0.47,95%CI:0.20,0.73,P<0.000 1;45 min/次 :SMD=0.14,95%CI:-0.03,0.31,P=0.11;60 min/次 :SMD=0.14,95%CI:-0.25,0.53,P=0.49。說明單次干預時間為15 min或30 min對學業(yè)成績具有顯著的中等程度正向效應,且30 min/次的效應量最大。
4)干預頻率。納入文獻包含3種干預頻率,不同干預頻率的合并效應量:2次/周:SMD=0.22,95%CI:0.08,0.35,P<0.001;3 次/周 :SMD=0.29,95%CI:0.07,0.50,P<0.000 1;5次/周:SMD=0.21,95%CI:-0.06,0.49,P=0.13。說明每周進行2~3次的體力活動干預對學業(yè)成績的提高具有顯著的中等程度正向效應,3次/周的效應量最大。
5)干預強度。僅有5篇文獻明確報告了體力活動的干預強度,不同干預強度的合并效應量:小強度:SMD=0.00,95%CI:-0.37,0.38,P=0.99;中等強度:SMD=0.23,95%CI:-0.30,0.77,P=0.40;中大強度:SMD=0.29,95%CI:0.15,0.43,P<0.000 1。說明中大強度體力活動對學業(yè)成績具有顯著的中等程度正向效應。
研究質(zhì)量評估結(jié)果顯示,僅有6篇文獻屬于高質(zhì)量研究??梢姡L期體力活動與兒童青少年學業(yè)成績研究領(lǐng)域的高質(zhì)量文獻占比較低,中低質(zhì)量文獻在選擇偏倚、實驗設(shè)計、干擾因素、盲法、測量方法和樣本變化6個維度上表現(xiàn)出方法學缺陷。為了提高實驗質(zhì)量,增加研究的可靠性和可信度,未來在設(shè)計該領(lǐng)域的實驗時應注意:1)樣本最好具有較高代表性,或具有一定代表性且同意參與實驗的樣本比例達80%以上;2)實驗設(shè)計最好為隨機對照實驗;3)注意排除年齡、性別及體力活動水平對學業(yè)成績水平基線的干擾;4)采用單盲或雙盲以排除主觀因素造成的信息偏倚;5)對采用的評估工具進行信效度檢驗;6)注意報告退出實驗的樣本量及原因。
從總體效應來看,長期體力活動對兒童青少年學業(yè)成績有積極影響,這與已有的系統(tǒng)綜述和Meta分析結(jié)果一致(álvarez-Bueno et al.,2017a,2017b;Donnelly et al.,2016;Fedewa et al.,2011)。針對不同科目學業(yè)成績的亞組分析顯示,相較閱讀、寫作等科目,體力活動對提高數(shù)學成績具有更大的作用。這與Fedewa等(2011)和álva‐rez-Bueno等(2017b)的Meta分析結(jié)果吻合,并與方黎明(2020)基于國內(nèi)大規(guī)模樣本數(shù)據(jù)的實證結(jié)果一致,即體力活動對提高學業(yè)成績具有中等效應,對數(shù)學成績的影響效應大于語文和英語。綜合Meta分析結(jié)果和現(xiàn)有研究證據(jù),本研究認為長期體力活動可以促進兒童青少年數(shù)學成績的提高。然而,由于納入研究數(shù)量較少,且絕大多數(shù)研究僅評估了數(shù)學成績的變化,未對物理、化學、外語等學科成績進行測量,故尚不能確定長期體力活動對數(shù)學以外學科成績的影響,未來需要開展更多關(guān)于體力活動對不同學科成績影響的實驗研究。
關(guān)于體力活動究竟是如何提高學業(yè)成績這一問題,神經(jīng)生理學和心理學相關(guān)研究提供了啟示。神經(jīng)生理學研究發(fā)現(xiàn),體力活動可從系統(tǒng)水平(腦結(jié)構(gòu)、腦激活水平、腦功能網(wǎng)絡(luò))、細胞水平(神經(jīng)發(fā)生、突觸可塑性)、分子水平(腦源性神經(jīng)營養(yǎng)因子BDNF、胰島素樣生長因子IGFI、血管內(nèi)皮生長因子VEGF等)誘導腦產(chǎn)生積極的可塑性變化,從而提高相應的認知能力,如執(zhí)行功能、注意、反應抑制、情緒調(diào)節(jié)、組織、計劃等(陳愛國等,2011;鞠恩霞等,2010)促進良好學習表現(xiàn)的形成,進而促進學業(yè)成績提高。心理學研究認為,體力活動不僅可以直接對學業(yè)成績產(chǎn)生影響,還可以通過體能、健康、心理-社會因素等中介變量影響學業(yè)成績,影響效果受年齡、性別、社會經(jīng)濟狀況或文化環(huán)境及背景等調(diào)節(jié)變量的影響(圖3)??梢?,參與體力活動非但不會對學業(yè)成績造成負面影響,反而能夠促進兒童青少年學業(yè)成績的提高,但其對學業(yè)成績的影響可能會因社會經(jīng)濟狀況或文化環(huán)境及背景差異產(chǎn)生不同效果。
圖3 體力活動影響學業(yè)成績的心理學理論模型(Tomporowski et al.,2011)Figure 3. Psychological Theoretical Model of Physical Activity Affecting Academic Achievement(Tomporowski et al.,2011)
從干預方式對學業(yè)成績的效應結(jié)果來看,有氧運動、綜合性學校體育活動計劃和專業(yè)體育與健康課為中等效應量,前兩種方式的效應量明顯高于后者。有氧運動對體質(zhì)健康的益處已成為不爭的話題,因此常被應用于對學業(yè)成績影響的研究中,絕大多數(shù)實驗采用了有氧運動干預(Singh et al.,2019)。有氧運動對學業(yè)成績的積極影響,可能得益于其產(chǎn)生的認知益處(Buck et al.,2008;Chaddock et al.,2010)。此外,綜合性學校體育活動計劃是以增加學生體育活動為目標的綜合性學校體育衛(wèi)生框架,它為學生提供了更多參與體力活動的機會,包括體育課、課間體育活動、嵌入文化課中的體育活動、課前和課后體育活動、教師參與、家庭和社區(qū)參與6部分(CDC,2019)。綜合性學校體育活動計劃在提高學業(yè)成績方面的顯著作用,為學校組織體育活動提供了參考,提示,學校應鼓勵學生參與多種形式的體力活動,并為學生提供更多參與體力活動的機會。
在體力活動劑量分析中,干預持續(xù)時間為5個月及1年以上表現(xiàn)出中等效應量,持續(xù)5個月的效應量更大,而持續(xù)6個月的效應卻不顯著。因持續(xù)6個月的研究僅有1篇,故其結(jié)果不具說服力。干預效果并未隨著持續(xù)時間的增長而提高,可能是干預時間的拉長導致學生產(chǎn)生倦怠感,提示,體力活動干預持續(xù)5個月時對學業(yè)成績的提高達到最佳效果,隨著持續(xù)時間的增長,學業(yè)成績不會表現(xiàn)出更大的提高。單次干預時間為30 min/次的效應量最大,這與部分已有研究存在偏差(王積福等,2016),可能是受納入對比文獻數(shù)量少的影響。干預頻率為2~3次/周可對學業(yè)成績產(chǎn)生積極影響,3次/周的效應量最大,5次/周的效應量不具有統(tǒng)計學意義。提示,干預次數(shù)并非越多越好,次數(shù)過多可能導致身體和精神疲勞,機體和神經(jīng)不能得到有效恢復,進而影響干預效果,3次/周的干預可能最利于學業(yè)成績提高。干預強度為中大的效應量最大,中大強度體力活動(moderate-to-vigorous,MVPA)已被廣泛證明對身心健康有益(武海潭,2014),其在促進學業(yè)成績上也表現(xiàn)出積極作用(Mullender-Wijnsma et al.,2015)??梢姡瑢W校實施MVPA干預有望實現(xiàn)學生身體健康和學業(yè)成績的“雙贏”。
盡管Meta分析顯示,持續(xù)5周、3次/周、30 min/次的中大強度有氧運動干預可能對提高兒童青少年學業(yè)成績最有效,但因納入文獻數(shù)量不足和樣本來自不同國家(地區(qū)),考慮到研究證據(jù)的不足及社會文化背景的差異可能引起的結(jié)果偏差,對于這一劑量結(jié)果的得出和推廣應持保守態(tài)度,需更深入和細致的研究來進一步驗證。此外,探討長期體力活動干預的最佳劑量問題較為復雜,涵蓋變量多,干預方式、持續(xù)時間、單次干預時間、干預頻率、干預強度等都會對干預效果產(chǎn)生影響。例如,相同持續(xù)時間、頻率和強度的體力活動干預,可能會因干預方式或單次干預時間的差異導致結(jié)果不一致。因此,討論體力活動干預劑量時,常常需要對方式、時間、頻率和強度等因素進行綜合考慮,干預效果差異是不同劑量因素共同作用的結(jié)果。因此,長期體力活動干預對兒童青少年學業(yè)成績影響的最佳劑量尚無定論,未來需要開展更多的實驗研究,在控制其余劑量因素的基礎(chǔ)上,進一步探討某一特定劑量因素對學業(yè)成績的影響效果。
1)本研究未能全面收集到前人的所有研究;2)納入文獻數(shù)量較少,樣本量相對不足,高質(zhì)量研究占比較低,有可能存在偏倚風險;3)納入文獻中采用了多種學業(yè)成績測評工具,這些工具的有效性和可靠性存在差異。
長期體力活動能夠提高兒童青少年的學業(yè)成績,且相較閱讀、寫作等科目,對數(shù)學成績的促進效果更好。為獲得更好的學業(yè)成績,兒童青少年參與體力活動可采取的劑量為持續(xù)5周、3次/周、30 min/次的中大強度有氧運動。學??赏ㄟ^實施綜合性學校體育活動計劃,為學生提供足夠的活動空間和機會??刹扇〉拇胧┌ǎ涸绮龠M行小強度的瑜伽或伸展性活動,體育與健康課上保證30 min以上的中大強度運動,每天開展約20 min的中大強度的課間操,在其他文化課上嵌入約5 min的中大強度微運動等,從而促進學生體質(zhì)健康和學業(yè)成績的雙向提高。未來應開展更多的高質(zhì)量實驗研究,在保證方法學質(zhì)量的基礎(chǔ)上,更加注重量化體力活動劑量,準確報告干預的類型、強度、時間和頻率,以便不同研究間的相互比較。