當前,體育學(xué)界的定量研究多數(shù)處于統(tǒng)計相關(guān)性的描述階段,基于因果推斷的解釋能力不足,而在其他學(xué)科(尤其經(jīng)濟學(xué)和計算機學(xué))中,因果推斷已經(jīng)成為“新的學(xué)科前沿”。2020年6月,英國學(xué)者Guan Jing 等在利物浦大學(xué)經(jīng)濟論壇上報告了1 篇文章,主要探討運動與健康的雙向因果關(guān)系。他們指出,當前體育學(xué)界對于因果推斷的運用主要存在2 個問題:①忽略內(nèi)生性;②武斷假設(shè)因果關(guān)系的單一路徑,如只指出運動促進了健康,而未考慮健康的人更愛運動。目前很多國內(nèi)學(xué)者也注意到:內(nèi)生性是影響因果推斷的核心問題。具體而言,回歸分析可通過控制協(xié)變量使不同組別具備可比性(如運動和不運動2組人群的健康程度比較),但總有一些無法觀測到的變量(如基因特征)未被納入控制變量,而它們又與解釋變量(如基因特征、運動偏好)相關(guān),違反回歸分析中“隨機誤差項與解釋變量相互獨立”這一基本假設(shè),從而導(dǎo)致估計參數(shù)(回歸系數(shù))偏誤。這種遺漏變量偏誤是產(chǎn)生內(nèi)生性問題的主要來源。此外,內(nèi)生性問題還源于自選擇偏誤(如參與運動本身即是具備某種特征的人自行選擇的結(jié)果)、樣本選擇偏誤(如僅研究參與運動的群體就得出普遍結(jié)論)和聯(lián)立偏誤(運動與健康存在雙向因果關(guān)系)。針對上述問題,陳云松、梁玉成等國內(nèi)學(xué)者總結(jié)了相應(yīng)的解決辦法,包括工具變量法、傾向值匹配(PSM)、赫克曼(Heckman)兩階段模型等。另外,近年來較流行的“交叉滯后面板模型”亦是一種利用面板數(shù)據(jù)解決雙向因果問題的方法。值得一提的是,當前隨著人工智能的發(fā)展和大數(shù)據(jù)研究的深入,機器學(xué)習(xí)方法在社會現(xiàn)象的“分類”和“預(yù)測”上呈現(xiàn)出強大功能,未來其可助力因果推斷在體育學(xué)界的應(yīng)用和發(fā)展。