邊燕杰,張伊雪,魯肖麟
(1. 西安交通大學 實證社會科學研究所,陜西 西安 710049;2. 西安電子科技大學 體育部,陜西 西安 710126)
體育社會學是一門科學,必然依賴循證為本的定量研究方法以實現(xiàn)其研究目標。作為一門交叉學科,體育社會學聚焦體育與社會的關(guān)系,是構(gòu)建中國特色哲學社會科學學科體系、學術(shù)體系、話語體系的重要陣地。在現(xiàn)實層面,體育社會學關(guān)注體育在推進全民健身、建設(shè)現(xiàn)代化強國、提升國民健康水平和生活質(zhì)量實踐中發(fā)揮的重要作用;致力于理解和指導體育產(chǎn)業(yè)發(fā)展,促進經(jīng)濟社會發(fā)展,為實現(xiàn)中國式現(xiàn)代化作出貢獻[1]。在學科層面,定量研究的客觀性、精確性和可重復性有助于體育社會學研究深入理解體育現(xiàn)象,驗證理論假設(shè),推動理論創(chuàng)新。當下,我國體育社會學定量研究處于上升期,不斷涌現(xiàn)出具有理論價值和現(xiàn)實意義的科研成果,但現(xiàn)有研究在理論導向、問題意識和方法規(guī)范性等方面也遇到了諸多困境,在數(shù)字社會時代面臨新的挑戰(zhàn)[2]。為此,本文重點回答以下兩大問題:體育社會學需要定量研究嗎?如何開展規(guī)范的定量研究才能實現(xiàn)體育社會學的科學研究目標?從以下方面展開論證:①定量研究的科學價值;②體育社會學定量研究的問題意識和深究理論;③我國體育社會學定量研究面臨的困境及解決策略;④體育社會學定量研究的機遇和使命。
體育社會學研究具有鮮明的學科交叉特征。大量體育社會學研究的定量模型來源于經(jīng)濟學領(lǐng)域,使用的調(diào)查數(shù)據(jù)來自社會學領(lǐng)域,研究問題則屬于體育學領(lǐng)域。那么不同學科領(lǐng)域?qū)τ诙糠治龇椒ǖ囊笫且恢碌膯??答案是肯定的。本文簡略回顧定量研究方法在?jīng)濟學、社會學、體育學3 個學科中的發(fā)展和應用脈絡(luò),以便對定量研究方法的普遍應用價值建立歷史唯物主義認知。
(1)經(jīng)濟學中的定量研究。西方經(jīng)濟學定量研究已有三百多年歷史。早在18 世紀,數(shù)學表達就已經(jīng)出現(xiàn)在經(jīng)濟學研究中。在之后的一百多年里,新古典經(jīng)濟學家們逐漸納入描述統(tǒng)計學、回歸分析等數(shù)學手段研究供需關(guān)系、貿(mào)易平衡等經(jīng)濟問題,開啟了實證經(jīng)濟學研究,最后產(chǎn)生了計量經(jīng)濟學[3]。計量經(jīng)濟學是利用數(shù)學和統(tǒng)計學的方法驗證經(jīng)濟學理論的一個經(jīng)濟學分支領(lǐng)域,以1933 年《計量經(jīng)濟學》期刊的創(chuàng)辦為標志[4],成為當代經(jīng)濟學研究的主流。對80 種經(jīng)濟學優(yōu)秀期刊1980—2015 年發(fā)表的全部13 萬篇文章的統(tǒng)計發(fā)現(xiàn),實證類文章的歷年占比均超過50%,至2015 年占比接近70%[5]。
我國經(jīng)濟學的定量研究起步較晚,但發(fā)展勢頭強勁。在我國經(jīng)濟學研究中處于理論指導地位的是馬克思主義經(jīng)濟學,在《資本論》《剩余價值學說史》中將數(shù)學方法作為經(jīng)濟分析的輔助工具,將利潤率視為多種可變函數(shù)的組合,用以分析再生產(chǎn)理論問題[6]。在新中國成立初期的計劃經(jīng)濟體制中,數(shù)學運算和統(tǒng)計分析亦被運用于宏觀經(jīng)濟規(guī)劃,輔助制定經(jīng)濟政策。20 世紀80 年代初,計量經(jīng)濟學方法自美國引入我國,90 年代中后期開始占據(jù)一席之地,21 世紀成為主流研究方法[7]。在我國經(jīng)濟學領(lǐng)域的重要期刊《經(jīng)濟研究》每年的發(fā)文中,使用計量方法的論文比例在1991 年前幾乎為0,1998 年提高到11%,2007 年超過50%[3,8],2019 年超過80%,其中4 期達到100%[9]。由此可見,定量分析在中外當代經(jīng)濟學研究中均為主流方法。
(2)社會學中的定量研究。體育人文社會學知識建構(gòu)來源主要集中在體育學、社會學、應用經(jīng)濟學等一級學科,其中貢獻率僅次于體育學的便是社會學[10]。社會學的研究方法和視角深刻影響著體育社會學,推動了體育社會現(xiàn)象與問題研究的規(guī)范化。早在社會學創(chuàng)立時期,定量實證研究的思想便具有學科奠基作用。19 世紀上半葉,孔德在《實證哲學教程》中首次提出“社會學”概念時,便主張以科學實證代替哲學思辨,強調(diào)使用觀察和實驗等自然科學方法研究人類社會[11]。涂爾干是將定量研究方法納入社會學實證分析的先驅(qū),其在1897 年的著作《自殺論》[12]中利用描述性統(tǒng)計方法分析了自殺現(xiàn)象的社會成因。此后囿于社會現(xiàn)象的復雜性和統(tǒng)計資料與方法的有限性,定性研究長期占據(jù)社會學研究方法的主導地位。20 世紀70 年代以后,計算機技術(shù)與統(tǒng)計學的迅速發(fā)展推動了定量研究方法的長足進步。從20 世紀80 年代起,基于社會調(diào)查數(shù)據(jù)、使用計量模型的定量研究逐漸成為西方社會學研究的主流[13]。一項關(guān)于社會學權(quán)威期刊的研究[14]結(jié)果顯示,使用調(diào)查數(shù)據(jù)的實證論文比例由1940 年的18%上升至2015 年的50%。另一項針對英國社會學權(quán)威期刊論文的研究[15]也印證了類似趨勢:定量分析論文的比例由1977—1979 年的20%上升至1992—1994 年的31%。
我國社會學經(jīng)歷了特殊發(fā)展歷程。20 世紀初社會學自歐洲傳入中國后,經(jīng)歷了50—60 年代的中斷,至改革開放初期恢復重建,與美國社會學界交流頻繁[16]。當時恰逢美國社會學定量研究飛速發(fā)展,所以定量分析方法很快為我國中青年社會學者所接受。據(jù)統(tǒng)計,1986—2016 年社會學領(lǐng)域的重要期刊《社會學研究》刊發(fā)的定量研究論文平均占30%,每年呈波動上升趨勢,最近幾年穩(wěn)定在35%左右[17]。定量研究是我國社會學的主流研究方法之一,早已成為不爭的事實。
(3)體育社會學中的定量研究。體育社會學聚焦于體育、文化和社會結(jié)構(gòu)之間的關(guān)系,被視為“最為活躍、最為碩果累累”的體育學分支學科之一[18]。20 世紀50 年代,體育社會學研究領(lǐng)域迅速擴張,基于定量研究方法的體育社會學研究成果開始出現(xiàn)。早期研究主要采用匯總數(shù)據(jù)、描述性和相關(guān)統(tǒng)計等初級分析方法,受學科交叉整合不足、專業(yè)學者短缺的制約,20 世紀60—70 年代定量研究在體育社會學領(lǐng)域的占比遠低于質(zhì)性研究和理論研究[19]。20 世紀80 年代后,體育社會學也經(jīng)歷了從質(zhì)性研究向定量研究的科學主義轉(zhuǎn)變,定量研究逐步成為主流研究方法。針對《國際體育社會學評論》(International Journal for the Sociology of Sport)的研究[20-21]發(fā)現(xiàn),在1966—1975 年刊發(fā)的定量研究論文平均占比僅為55%,而1986—2005 年間增至70%。
我國體育社會學的定量研究起步較晚。直至20 世紀90 年代后期,問卷調(diào)查與統(tǒng)計模型等定量研究方法才被廣泛運用于該領(lǐng)域[21]。據(jù)統(tǒng)計,在2000—2007 年300 篇體育學博士學位論文中,使用統(tǒng)計分析方法的占38%,其中,體育人文社會學占31%[22]。博士學位論文反映了每個學科最為前沿、最具潛力的發(fā)展方向,因此在可預見的未來,定量研究將在體育社會學研究中占據(jù)主要地位,引領(lǐng)體育社會學研究的科學化發(fā)展趨勢。
經(jīng)濟學、社會學、體育學是相互獨立的社會科學領(lǐng)域,分別有其相對獨特的學科視角和議題。那么,為什么不同的學科視角和議題都依賴同一套定量研究方法實現(xiàn)其研究目標呢?答案是理論。學科視角和議題雖各不相同,但任何學科視角下所能捕捉的現(xiàn)實問題都必須轉(zhuǎn)化為理論問題才能開展以循證為本的科學研究。現(xiàn)實問題是現(xiàn)象層次所能觀察感知的,但其本質(zhì)和內(nèi)在變動邏輯需通過由表及里的理論分析,才能實現(xiàn)從感性認識向理性認識的飛躍。在此過程中,認識現(xiàn)象的本質(zhì)就產(chǎn)生了理論概念,挖掘現(xiàn)象的內(nèi)在變動邏輯就形成多個概念之間相互聯(lián)系的理論命題,而理論創(chuàng)新在狹義上就是指理論概念創(chuàng)新和理論命題創(chuàng)新。定量研究方法之所以具有跨學科的適用性以及普遍的科學研究價值,是因為它可以用來測量理論概念和證明理論命題。問題、理論和證明是所有社會科學領(lǐng)域開展定量研究的3 個核心要素,缺一不可。
自2002 年以來,筆者提出和倡導理論導向?qū)嵶C研究的學術(shù)理念,用“想問題、究理論、重證明”來概括理論導向?qū)嵶C研究的3 個步驟[23],其實就是定量研究的三段式。①“想問題”的問題來自社會實踐過程,來自研究者對相關(guān)社會現(xiàn)象的觀察和感知,具有經(jīng)驗知識成分,但是進入科學實證研究的問題必須是一個理論問題,即用抽象概念認知社會現(xiàn)象的本質(zhì),用因果命題闡述社會現(xiàn)象的內(nèi)在變動邏輯。②“究理論”是通過對已有理論的審視和批判,提出更為切合研究問題的理論假設(shè),通過嚴格定義概念、確定概念聯(lián)系、闡明因果機制的理論分析步驟,實現(xiàn)理論認識的突破和創(chuàng)新。③“重證明”是通過實證方法來驗證理論的真?zhèn)巍N唇?jīng)實證的理論僅僅停留在思辨層面,是缺乏實際支撐的抽象理念,無法確知其真理成分。盡管廣義的實證方法包含定性分析與定量分析,但是定性分析的觀察范圍有限,研究過程欠缺規(guī)范化和可復制性,雖有強大的問題揭示和科學發(fā)現(xiàn)功能,卻不是科學證明的理想方法。相反,定量研究具有數(shù)據(jù)代表性、模型規(guī)范性、分析客觀性的特征,符合科學研究范式,是檢驗理論真?zhèn)渭捌錀l件性的最佳選擇。
按照上述框架,筆者以2023 年6 月發(fā)表在《上海體育學院學報》的論文《種植方式與全民健身:體育鍛煉參與的南北差異及其文化溯源》[24](以下簡稱《南稻北麥》)為例,分析理論導向的實證研究如何展開。該文作者觀察到的經(jīng)驗知識是我國體育鍛煉參與的區(qū)域差異,北方農(nóng)村居民體育鍛煉參與平均水平高于南方。由此提出的理論問題是:如何解釋這一差異?作者從“體育起源于生產(chǎn)勞動”的馬克思主義唯物論觀點出發(fā)[25],尋找我國農(nóng)業(yè)種植方式的地區(qū)差別與體育鍛煉的南北差異的內(nèi)在聯(lián)系。這是《南稻北麥》的“想問題”。面對若干已有理論,包括自然條件論、經(jīng)濟影響論、體育設(shè)施論、文化優(yōu)勢論、社會資本論等,《南稻北麥》認為均不能解釋體育鍛煉參與的北高南低現(xiàn)象,為此提出南稻北麥種植方式的溢出效應論,通過教育中介與閑暇中介2 個理論推導,分別闡述南稻北麥種植方式影響體育鍛煉參與南北差異的因果路徑。這是《南稻北麥》的“究理論”。在“重證明”方面,《南稻北麥》使用2010 年中國家庭追蹤調(diào)查(CFPS)數(shù)據(jù)進行定量分析,檢驗上述研究假設(shè)的真?zhèn)?。通過多元回歸、固定效應模型、工具變量分析、傾向值匹配分析等方法檢驗證明,南稻北麥種植方式對于農(nóng)民體育鍛煉參與程度的影響穩(wěn)定存在??梢钥闯?,《南稻北麥》遵從了科學實證規(guī)范,既有問題意識,又有理論推演,還有扎實的數(shù)據(jù)分析證明,是一篇符合“想問題、究理論、重證明”的定量研究范式的論文。
圍繞近年我國的體育社會學定量研究,可以從問題意識、深究理論和證明方法3 個方面,對相關(guān)困境加以剖析,為提出解決路徑提供范例和建議。
提問題是理論導向?qū)嵶C研究的起點。問題也是引導體育學科高質(zhì)量發(fā)展、有效改造客觀世界的動力[26]。筆者將《上海體育學院學報》近5 年刊載的論文納入觀察范圍。2019 年1 月—2023 年11 月,該刊共發(fā)表了532 篇論文,259 篇為體育人文社會學方向的論文,占48.7%,其中147 篇屬于體育社會學領(lǐng)域的論文,占27.6%。如表1 所示,在方法取向上,體育社會學研究仍以理論分析和文獻綜述為主,占48.3%,定量實證研究占28.6%,質(zhì)性研究占23.1%。
表1 近5 年《上海體育學院學報》刊載體育社會學論文的研究方法與議題分布Table 1 Research methods and topics of sociology of sport papers published in the Journal of Shanghai University of Sport in the past 5 years
論文的議題分布顯示了研究者的問題意識。占比最高的議題是體育參與的影響因素及其結(jié)果,其次是體育政策的演進過程、實施策略、跨國比較等方面。體育文化研究涵蓋了體育文化傳播與傳承、體育領(lǐng)域的象征符號分析等研究方向,體育公共服務議題包括社會體育基礎(chǔ)建設(shè)、體育社會組織、賽事承辦等方面。學科發(fā)展和理論與方法的反思探討占12.2%,體現(xiàn)出體育社會學研究者不斷強化的學科自覺。體育參與和健身活動在健康促進中的作用及其背后的社會因素分析等研究占10.9%,還有少量關(guān)于體育領(lǐng)域女性權(quán)益和性別意識的研究。
體育社會學是從社會學視角開展競技體育和大眾體育問題的研究領(lǐng)域[19]。雖有其他不同定義,但大多數(shù)學者對于體育社會學的界定都強調(diào)“社會學的視角與方法”以體現(xiàn)其學科屬性[27]。結(jié)合社會學視角來審視《上海體育學院學報》近5 年刊載的體育社會學論文發(fā)現(xiàn),研究者的問題意識在3 個方面可進一步提升:①議題的豐富度。體育參與和體育政策等傳統(tǒng)議題研究較為充分,但對于新興的數(shù)字化技術(shù)和社交媒體如何影響體育發(fā)展的研究較少,對體育領(lǐng)域中的社會歧視和邊緣群體的體育參與問題探討亦不足。②研究方法的選擇。定量研究占比低、實證研究不足限制了理論與證據(jù)的結(jié)合。③研究的國際視野。體育社會學研究應加強與國際學界的對話,提升中國研究的主體性。那么,定量研究者的問題意識應如何改進和提高呢?
定量研究中的問題意識需要層次轉(zhuǎn)化?,F(xiàn)實問題是現(xiàn)象層次的、可觀察的,屬于感性認識;而隱藏在現(xiàn)象背后的深層本質(zhì)及內(nèi)在變動邏輯,需要通過理論分析來挖掘,從而實現(xiàn)從感性認識到理性認識的飛躍,即實現(xiàn)從現(xiàn)實問題到學術(shù)研究問題的轉(zhuǎn)化。轉(zhuǎn)化成功與否取決于以下2 個環(huán)節(jié)。
(1)理論概念的提出。學術(shù)研究中的理論創(chuàng)新大多圍繞一個原創(chuàng)理論概念展開理論論證和實證證明。例如,筆者提出體育社會資本的新概念,從社會資本與大眾體育的辯證關(guān)系中論證此概念的理論內(nèi)涵和行為意義,并進行了相關(guān)測量[28]。提出此概念的現(xiàn)實背景是我國的體育強國建設(shè)目標,而廣泛、持續(xù)、深入的大眾體育參與是實現(xiàn)這一目標的社會基礎(chǔ)。從社會學的群體性視角看,大眾體育的本質(zhì)特征是群體性,很多鍛煉形式和運動項目都依靠群體組織和共同參與而開展。從社會學的聯(lián)系性視角看,群體性的大眾體育參與其理論本質(zhì)就是以人際互動為表現(xiàn)的人際聯(lián)系性,由此產(chǎn)生了雙向的體育社會資本效應:一方面,人際聯(lián)系中所蘊藏的彼此認同、相互支持、互相激勵的關(guān)系資源能夠提升大眾體育參與率;另一方面,群體性體育鍛煉參與將擴大和增強人們的社會網(wǎng)絡(luò)與社會資本,提升群眾體育參與率,有利于體育強國目標的實現(xiàn)。簡言之,體育社會資本概念是對大眾體育的群體性和聯(lián)系性雙重理論本質(zhì)的抽象概括。
(2)理論命題的提出。有價值的理論概念應能解釋相關(guān)社會現(xiàn)象,并有助于形成新的理論命題以進行實證研究。理論命題是對2 個概念之間內(nèi)在因果關(guān)系的抽象表述。以體育社會資本的理論框架為例,體育社會資本是一個可測量且有效的分析概念:一方面,社會群體的優(yōu)勢地位提升個體的體育社會資本(命題1);另一方面,體育社會資本顯著提高人們的身心健康水平和生活滿意度(命題2),促使他們更積極地參與體育強國建設(shè)(命題3)[28]。在提出理論命題時,要明確理論概念與現(xiàn)實問題的聯(lián)系。例如,體育社會資本的概念要幫助我們揭示其對個體和群體體育參與的廣泛影響。此外,有效的理論命題應基于數(shù)據(jù)和現(xiàn)實觀察,能夠經(jīng)得起實證研究的驗證。理論命題必須能夠操作化為可檢驗的假設(shè),通過測量核心概念使得數(shù)據(jù)為理論命題提供實證基礎(chǔ)。
提出學術(shù)問題后,首先要深究理論,才能實現(xiàn)理論創(chuàng)新。原創(chuàng)性理論創(chuàng)新的不足正是當下體育社會學研究的局限之一[1]。人類社會行為的差異性、復雜性、發(fā)展變遷性都能夠激發(fā)社會科學的理論創(chuàng)新。針對深究理論、實現(xiàn)創(chuàng)新,筆者提出以下3 條建議。
(1)觀察經(jīng)驗現(xiàn)實,發(fā)現(xiàn)理論問題。發(fā)現(xiàn)理論困惑并提出理論問題往往有3 種角度:①現(xiàn)有理論存在解釋缺陷,其前提假定和內(nèi)在邏輯存在矛盾,例如《南稻北麥》的文獻綜述提出,在體育鍛煉南北差異的已有解釋中,經(jīng)濟投入、氣候環(huán)境、文化因素的解釋邏輯均不成立;②生活經(jīng)驗缺乏理論解釋,這些經(jīng)驗背后的規(guī)律性有待挖掘,《南稻北麥》提出的理論觀點屬于這一角度;③現(xiàn)有理論與現(xiàn)實經(jīng)驗存在矛盾,例如西方理論在解釋本土現(xiàn)象時適用性不強,本土現(xiàn)象的因果機制和適用條件需要進一步研究。這一困惑為研究者挖掘本土知識、推進理論創(chuàng)新提供了絕佳的機會。社會網(wǎng)絡(luò)分析中的“強弱關(guān)系”理論爭辯就是一個范例[29]。西方學者提出的弱關(guān)系理論認為,在諸如求職等社會行動中,弱關(guān)系因為能夠提供異質(zhì)性信息,往往比強關(guān)系更為有效,這一假設(shè)被西方實證研究反復證明。但是中國的生活經(jīng)驗是,強關(guān)系往往才是目標達成的中介機制。這是西方理論與中國現(xiàn)實的矛盾。產(chǎn)生此困惑是由于我們尊重本土生活經(jīng)驗,并結(jié)合經(jīng)典理論對本土經(jīng)驗進行凝練和概括。為此筆者提出了更具本土現(xiàn)實解釋力的“強關(guān)系”假設(shè),并在此基礎(chǔ)上開拓了“關(guān)系社會學”這一中國主體話語體系的學術(shù)研究領(lǐng)域[30],完成了從借鑒西方理論到本土概念創(chuàng)新再到國際傳播的理論創(chuàng)新過程。
(2)文獻挖掘注重相悖的理論邏輯。在提出和深化體育社會學理論問題時,考慮并行和相悖的理論邏輯至關(guān)重要,在此基礎(chǔ)上可以提出對立的或有差異的理論假設(shè)。例如,在分析體育參與與公民健康不平等的關(guān)系時,有研究采納了結(jié)構(gòu)主義和個體主義2 種視角。結(jié)構(gòu)主義強調(diào)社會地位和資源對健康的影響,而個體主義側(cè)重于個人行為對健康的作用。通過這種對比分析,形成關(guān)于體育參與如何影響健康不平等的不同理論假設(shè),如“優(yōu)勢累積與劣勢效應”“年齡中和效應”等可以進行實證檢驗的假設(shè)[31]。這種方法不僅揭示了理論之間的交叉點和潛在沖突,也為理論發(fā)展和實證檢驗提供了新的視角。
(3)善于表述理論。表述理論一般有三步工作:嚴格定義概念、確定概念聯(lián)系、闡述因果機制。在筆者的《體育社會資本的理論建構(gòu)和現(xiàn)實意義》[32]一文中,理論表述的第一步是將體育社會資本定義為通過體育活動建立的人際關(guān)系和網(wǎng)絡(luò)結(jié)構(gòu),展示了概念定義的嚴謹性和原創(chuàng)性。在確定概念聯(lián)系的環(huán)節(jié),厘清核心概念間的聯(lián)系,表述理論命題。論文探討了體育社會資本與個體健康、社會參與和生活滿意度之間的關(guān)系,闡述了這些概念之間的聯(lián)系。最后是闡述因果機制,提出了體育社會資本通過增強社會支持和社會網(wǎng)絡(luò)來提升個體健康水平和生活滿意度的具體因果機制。
深究理論的直接成果是理論創(chuàng)新。理論創(chuàng)新完成了對前人理論認識的突破,但是這種突破是否具有分析有效性,是否具有科學研究價值,這是需要通過實證數(shù)據(jù)的定量分析來證明的,即開展定量分析之前需要實現(xiàn)從深究理論到定量思維的轉(zhuǎn)化,其標志是將抽象的理論概念轉(zhuǎn)化為可測變量,將抽象的理論命題轉(zhuǎn)化為可驗證的研究假設(shè)。
先看理論概念到可測變量的轉(zhuǎn)化,即概念的操作化。概念的操作化過程可以分為界定概念維度、將不同維度轉(zhuǎn)化為指標、設(shè)計測量方法3 個步驟。界定概念是指明確理論概念的不同方面或?qū)傩?。以“體育參與社會資本量表”的開發(fā)為例[33]:第1 步是將社會資本的概念定義為網(wǎng)絡(luò)、信任和互惠3 個關(guān)鍵組成部分;第2 步是將此3 個維度分別轉(zhuǎn)化為可測指標,通過一起參與跑步活動的親朋好友數(shù)量來測量網(wǎng)絡(luò),通過對這些“同跑者”的信任度打分來測量信任,通過詢問與“同跑者”的各種資源的分享程度來測量互惠;第3 步是通過專家小組對上述3 項指標題器開展有效性評估,通過因子分析來驗證和優(yōu)化指標,確保較高的指標效度和信度。由此成功地完成了從理論概念到可測變量的轉(zhuǎn)化。
再看抽象理論命題到可驗證假設(shè)的轉(zhuǎn)化。這是從深究理論到定量思維的關(guān)鍵環(huán)節(jié)。仍以《體育社會資本的理論建構(gòu)和現(xiàn)實意義》為例,筆者分3 個步驟將抽象的理論命題轉(zhuǎn)化為可驗證的假設(shè):①理論命題的提出。論文提出了關(guān)于體育社會資本促進個體身心健康的理論命題。②理論概念的變量化,即將理論命題中的概念轉(zhuǎn)化為可測量的變量。由于數(shù)據(jù)的限制,該文以集體鍛煉項目的參與情況來間接測量體育社會資本的概念,分別用自評健康和壓力感來衡量身體健康與心理健康。③可測量指標的選擇與變量賦值。例如,在體育社會資本的測量中:將不參加任何形式鍛煉的居民賦值為 0,代表不鍛煉群體;將只參加個體項目的居民賦值為 1,代表個體項目鍛煉群體;將既參加集體項目又參加個體項目的群體和只參加集體項目的群體合并,賦值為 2,代表集體項目鍛煉群體。體育社會資本這一抽象概念被具體化為可以通過數(shù)據(jù)和實證研究來檢驗的變量和指標,從而實現(xiàn)了理論命題向定量思維的轉(zhuǎn)換。
如前所述,理論導向的實證研究包括3 個環(huán)節(jié)(問題、理論和證明),而證明是實現(xiàn)前2 個環(huán)節(jié)的保證。能否系統(tǒng)而規(guī)范地利用數(shù)據(jù)證明理論認知的真理成分及其條件性,往往對定量實證研究的質(zhì)量高低起著決定性作用。定量分析作為證明的核心工具,其有效性依賴于3 個關(guān)鍵要素:概念測量、數(shù)據(jù)收集和分析方法。首先,概念測量的準確性直接影響研究結(jié)果的有效性。其次,數(shù)據(jù)收集的全面性和系統(tǒng)性對于確保研究的可靠性至關(guān)重要。最后,選擇恰當?shù)姆治龇椒ㄊ菍崿F(xiàn)理論驗證的關(guān)鍵,這不僅要求研究問題、數(shù)據(jù)類型、方法模型相互匹配,還需要確保分析過程的規(guī)范嚴謹。
3.1.1 理論概念的有效測量
對理論概念的準確測量是定量證明的第1 步,也是實證分析規(guī)范性的基礎(chǔ)。在國內(nèi)現(xiàn)有的體育社會學定量研究中,概念測量的信度和效度存在較為突出的問題。理論概念與測量指標的匹配性如果不高會極大地動搖定量研究的根基。例如,一些研究使用被訪者的“每周上網(wǎng)總時長”來測量“人工智能發(fā)展”這一概念,就是將產(chǎn)業(yè)和地區(qū)層面的人工智能發(fā)展的宏觀概念降維到個人使用層次進行測量,出現(xiàn)了理論與實證的斷裂、分析單位的錯位,另外也混淆了互聯(lián)網(wǎng)使用和人工智能應用這2 種不同的行為,對概念的測量效度不高。這類問題使得實證分析達不到證明理論假設(shè)的研究目標,使所有論證的努力都偏離了方向,會帶來對定量分析結(jié)果有效性的根本質(zhì)疑。
要解決測量效度問題,體育社會學研究者應深入挖掘體育學和社會學兩大母學科的學術(shù)資源,并采用具有堅實理論基礎(chǔ)和符合學術(shù)規(guī)范的測量指標。這一過程涉及對母學科理論與方法的深入理解和應用,包括學術(shù)理論的歷史演變、關(guān)鍵概念的定義發(fā)展,以及研究方法的系統(tǒng)構(gòu)建。概念測量的準確性和系統(tǒng)性可從社會學領(lǐng)域的社會資本經(jīng)典研究中窺見一斑?;趯?jīng)驗的觀察,一些個體通過社會關(guān)系獲得了優(yōu)勢教育資源和優(yōu)質(zhì)的、薪水更高的工作。定量研究者將這一現(xiàn)象概念化為社會資本,包含人際關(guān)系及附著的社會資源兩部分[34],并采用3 個指標測量此概念:①達高性,個人中心網(wǎng)絡(luò)內(nèi)部地位最高的關(guān)系人及其資源;②異質(zhì)性,個人中心網(wǎng)絡(luò)內(nèi)部不同關(guān)系人的地位及資源的差異幅度;③廣泛性,個人中心網(wǎng)絡(luò)內(nèi)部所有關(guān)系人的規(guī)模和資源總量[35]。通過定量研究方法的準確測量,學者們將抽象的社會資本概念轉(zhuǎn)化為可量化的數(shù)學形式,從而方便進一步探索其背后的規(guī)律。因此,從母學科中汲取學術(shù)資源,采用符合學術(shù)規(guī)范的測量指標,不僅能夠更準確地反映研究對象的實際情況,而且還能夠與母學科中的其他研究形成對話,推動知識積累和理論發(fā)展。
3.1.2 一手數(shù)據(jù)的規(guī)范采集
一手數(shù)據(jù)采集的規(guī)范性是實證分析規(guī)范化的重要基礎(chǔ)。目前,可供采集的數(shù)據(jù)類型包括統(tǒng)計數(shù)據(jù)、調(diào)查數(shù)據(jù)、實驗數(shù)據(jù)、線上大數(shù)據(jù)等。統(tǒng)計數(shù)據(jù)多由國家統(tǒng)計局、國家體育總局等機構(gòu)收集并公布,獲取較為方便。調(diào)查和實驗數(shù)據(jù)主要由研究者基于研究目標而設(shè)計并收集。線上大數(shù)據(jù)包括人們的數(shù)字化行為痕跡,一般通過合作機構(gòu)或商業(yè)化平臺進行采集,或通過技術(shù)手段自行獲取。
我國體育社會學領(lǐng)域中相當一部分定量研究使用一手調(diào)查數(shù)據(jù)。一手數(shù)據(jù)的優(yōu)勢在于能夠涵蓋研究者所感興趣的相關(guān)變量,更好地滿足研究者的需求,更有針對性地達到調(diào)查目標。但數(shù)據(jù)采集過程不規(guī)范、數(shù)據(jù)介紹不充分是現(xiàn)有一手數(shù)據(jù)研究中普遍存在的問題。近年來在體育社會學高水平期刊發(fā)表的定量研究中,有相當一部分沒有對調(diào)查的開展過程、抽樣方式、數(shù)據(jù)收集工具、樣本的特征和構(gòu)成等重要信息進行詳盡、充分的介紹。因此,對于抽樣偏差對分析結(jié)果可能帶來的影響也缺乏重視和討論。數(shù)據(jù)來源的規(guī)范性存疑就會損害樣本代表性,從而影響分析結(jié)果的有效性和結(jié)論的推廣意義。
在目前體育社會學最為常用的調(diào)查數(shù)據(jù)采集中,需注意調(diào)查研究的基本原則。調(diào)查研究通過抽樣設(shè)計與隨機抽樣的方法確定被調(diào)查的人群,并借助結(jié)構(gòu)化的調(diào)查問卷,獲得人類行為和態(tài)度等信息。規(guī)范的調(diào)查研究過程需要遵循系統(tǒng)性與客觀性兩大原則。系統(tǒng)性既體現(xiàn)在確定而清晰的抽樣框,還體現(xiàn)在抽樣的隨機性,以保證樣本對于研究對象總體的代表性。客觀性原則體現(xiàn)在:一是調(diào)查設(shè)計過程中減少研究者的主觀性影響;二是數(shù)據(jù)收集過程中減少調(diào)查員對于被調(diào)查者的任何干擾;三是以安全、準確、無偏、共享等原則來使用和傳播數(shù)據(jù)。對大多數(shù)研究者而言,獨立收集系統(tǒng)且客觀的一手大型調(diào)查數(shù)據(jù)是可望不可即的,為此開展廣泛合作建立大型公共數(shù)據(jù)庫迫在眉睫。
3.1.3 公開數(shù)據(jù)庫的使用與建設(shè)
大型公開數(shù)據(jù)庫的建立和使用,以及在此基礎(chǔ)上的規(guī)范測量,是基于調(diào)查數(shù)據(jù)開展高質(zhì)量定量研究的重要路徑。目前社會科學領(lǐng)域的理論創(chuàng)新更多是基于已有的公開數(shù)據(jù)庫,相同領(lǐng)域的研究者往往基于共同的數(shù)據(jù)展開對話,而體育社會學領(lǐng)域常用的公開數(shù)據(jù)庫主要是國家統(tǒng)計局、國家體育總局提供的統(tǒng)計數(shù)據(jù),雖然具有一定的權(quán)威性,但前者涉及體育的指標較少,后者的連續(xù)性和結(jié)構(gòu)性不強。
體育社會學公開調(diào)查數(shù)據(jù)庫的缺失已經(jīng)為該領(lǐng)域的發(fā)展帶來阻礙。首先,缺乏能夠共同使用的數(shù)據(jù),定量分析就無法得到復制研究和科學檢驗,不同研究結(jié)論只能各執(zhí)一詞,缺乏對話的平臺。其次,相同概念的不同測量方法之間由于樣本、數(shù)據(jù)來源不同,也無法相互比較、持續(xù)優(yōu)化。再次,對理論假設(shè)的檢驗如果不能基于共同的數(shù)據(jù)和測量來開展,就無法在諸多結(jié)果的對比中去偽存真,推進理論的創(chuàng)新和發(fā)展。
只有基于優(yōu)質(zhì)的公開調(diào)查數(shù)據(jù)和規(guī)范的測量,才能形成不同研究之間的對話平臺。以社會學為例,中國社會學定量研究者往往共同使用一些公開大型數(shù)據(jù)庫展開實證分析,這些數(shù)據(jù)庫為研究人員提供了豐富的數(shù)據(jù)資源和開放的對話平臺。已經(jīng)取得實效、具有廣泛影響的社會學大型數(shù)據(jù)庫包括:中國人民大學主持的中國綜合社會調(diào)查 (CGSS,2003 年至今)、中國社會科學院主持的中國社會狀況綜合調(diào)查(CSS,2006 年至今)、西安交通大學主持的“社會網(wǎng)絡(luò)與職業(yè)經(jīng)歷”調(diào)查(JSNET,2009 年至今)、北京大學主持的中國家庭追蹤調(diào)查 (CFPS,2010 年至今)、中山大學主持的中國勞動力動態(tài)調(diào)查 (CLDS,2012 年至今)?;谶@些公開調(diào)查數(shù)據(jù),社會學領(lǐng)域持續(xù)產(chǎn)出了大量高質(zhì)量的定量研究成果,對于中國社會學的學科建設(shè)厥功至偉。
建立和使用大型體育社會學公開數(shù)據(jù)庫展開研究,能夠大大提升定量分析的可復制性、可驗證性,使得學術(shù)共同體內(nèi)部形成統(tǒng)一的定量分析規(guī)范,也能夠基于相同的數(shù)據(jù)和分析處理方式,對既有研究進行檢驗和證偽,從而提升體育社會學定量研究的科學性。因此,體育社會學學術(shù)共同體內(nèi)部應建立共識、開展合作、整合資源、共建共享,通過收集一手數(shù)據(jù)、建設(shè)高質(zhì)量公開數(shù)據(jù)庫,進一步推進學科發(fā)展,為促進體育參與、建設(shè)體育強國提供科學依據(jù)。
研究方法與研究問題、理論假設(shè)的高度契合是理論導向落腳于實證分析的關(guān)鍵。目前體育社會學定量研究普遍存在以下2 個問題。①研究方法的選擇與問題、假設(shè)或數(shù)據(jù)不匹配。例如《南稻北麥》就存在此類瑕疵。該文在論述南稻北麥種植方式溢出效應時,基于歷史文化發(fā)展進行理論闡述,但是作者使用的是2010 年的截面數(shù)據(jù),存在時間謬誤風險,需用跨年代數(shù)據(jù)驗證。在數(shù)據(jù)分析中,南北方農(nóng)民的受教育程度和閑暇時間變量在組內(nèi)差異大而組間差異小,導致回歸模型中變量系數(shù)值低,其統(tǒng)計顯著性可能由大樣本引起。②某些研究過分追求復雜模型,忽視基礎(chǔ)方法和描述統(tǒng)計的價值。特別應該避免的做法是,在沒有進行數(shù)據(jù)描述和初步分析的前提下,就開始進行回歸分析和反事實模型分析,這會讓讀者無法分析樣本的基本狀況,無法識別復雜模型分析的有效性。定量分析的目的是證明理論假設(shè)是否成立,而對定量研究方法的不求甚解和一味炫技會將簡單問題復雜化,導致分析結(jié)果看似精美繁復,實則空洞平庸經(jīng)不起推敲。分析方法與數(shù)據(jù)結(jié)構(gòu)、研究問題的匹配才是選擇分析方法的最佳標準。為此,筆者強調(diào)數(shù)據(jù)分析的以下3 類有用性。
3.2.1 單變量描述的有用性
描述研究問題是科學研究的基礎(chǔ)。為此,數(shù)據(jù)的準確描述是獲取確切結(jié)果、形成有效知識傳播的重要前提。在社會科學領(lǐng)域,盡管復雜的社會現(xiàn)象很難用符號和公式充分描述,但定量研究通過變量形式提供了描述體育現(xiàn)象的有用手段。在單變量描述分析中,頻數(shù)分布、集中趨勢、離散趨勢等關(guān)鍵統(tǒng)計量有助于理解變量的基本屬性,例如,均值和標準差不僅能用于群體間比較,識別差異,還能分析樣本的代表性。比較實驗組和控制組的均值和方差能夠揭示不同體育鍛煉方式對健康狀況的潛在影響。頻數(shù)分布有助于發(fā)現(xiàn)異常值,驗證變量測量的有效性。
結(jié)合一些新的數(shù)據(jù)形態(tài),單變量描述統(tǒng)計還能揭示潛在的趨勢和模式,為深入分析提供重要線索。例如:在搜索引擎數(shù)據(jù)中,某些賽事搜索熱度的時間變化趨勢與空間分布特征可以描述體育賽事關(guān)注度的時空規(guī)律[36];來自可穿戴設(shè)備和運動應用程序的數(shù)據(jù)描述可以實時反映鍛煉者的生理狀態(tài)、使用情況、身體活動變化等重要信息[37]。
3.2.2 多變量分析的有用性
多變量分析通常以可視化和數(shù)學建模的形式探索和確證變量間的關(guān)系,包括從簡單到復雜的因果關(guān)系。多變量分析可以識別哪些變量顯著影響某一結(jié)果,以及它們之間因果關(guān)系的方向、條件和路徑。例如,筆者在《找回強關(guān)系:中國的間接關(guān)系、網(wǎng)絡(luò)橋梁和求職》一文中,通過數(shù)學建模驗證了強關(guān)系在中國求職時的優(yōu)勢作用,進一步提升了中國的關(guān)系研究在國際上的影響力[38]。多變量分析中的多元回歸模型允許研究者在控制其他影響因素后,更準確地評估感興趣的自變量的凈效應;多變量分析還允許聯(lián)合估計多個回歸方程;各類反事實模型可以在排除混淆變量的干擾后更準確地推斷因果關(guān)系的存在、大小與方向。
擬合優(yōu)度較高的多變量模型可以用于對未來事件發(fā)展方向進行預測。例如,回歸分析既可以用來預測運動與健康的關(guān)系,也可以解釋疾病發(fā)病率與環(huán)境因素之間的聯(lián)系。近年來,備受青睞的大數(shù)據(jù)已經(jīng)被廣泛應用到經(jīng)濟、政治與社會研究的眾多領(lǐng)域中預測個體或群體的行為。研究者可以使用不同的多變量模型來比較不同的理論假設(shè)或解釋機制,以找出最佳的模型解釋觀察到的數(shù)據(jù)??傊?,多變量分析提供了多層次的工具和方法,可以幫助研究者更深入地理解數(shù)據(jù)、發(fā)現(xiàn)因果關(guān)系、預測未來趨勢,支持科學決策和政策評估。
3.2.3 推論分析的有用性
首先,定量分析有助于獲得有效研究結(jié)論。嚴密的研究設(shè)計能夠清晰界定研究問題,確定適當?shù)臄?shù)據(jù)采集方法;用大樣本和隨機抽樣保證樣本的代表性,有效降低選擇偏差;用問卷調(diào)查和實驗觀察等精確的測量工具確保數(shù)據(jù)的可信度和準確性;用恰當?shù)慕y(tǒng)計方法來分析數(shù)據(jù),保證結(jié)果的可靠性;以數(shù)值形式呈現(xiàn)結(jié)果使之易于理解和解釋。其次,定量分析的代表性樣本和科學性質(zhì)使其結(jié)論可以被廣泛推廣至其他研究和情境,有助于科學研究的復現(xiàn)和擴展。最后,定量分析的方法和結(jié)論可以在不同學科領(lǐng)域之間傳播和應用。例如,體育學定量研究可以用來評估體育設(shè)施建設(shè)對當?shù)亟?jīng)濟的影響。經(jīng)濟學家可以借助這些研究來確定新體育場館、體育中心或運動場的建設(shè)是否值得投資。定量分析之所以成為科學的推論工具,依賴于其使用的一套可復現(xiàn)、可驗證、可交流的數(shù)學語言,這為定量研究在各領(lǐng)域和學科中的應用提供了堅實基礎(chǔ)。
回歸分析是基于調(diào)查數(shù)據(jù)開展推斷統(tǒng)計分析最重要的工具,通常用于探究和檢驗多變量間的相互依賴關(guān)系。但由于缺乏嚴格的實驗設(shè)計,使用基于調(diào)查數(shù)據(jù)的社會科學回歸模型分析得出的因果結(jié)論一直面臨著內(nèi)生性問題的困擾。內(nèi)生性問題在計量經(jīng)濟學中廣泛指代解釋變量與殘差相關(guān)的現(xiàn)象。忽略內(nèi)生性問題會違背高斯-馬爾可夫定理,導致產(chǎn)生有偏的估計量[39]。直到20 世紀70 年代唐納德·魯賓(Donald Rubin)提出潛在結(jié)果模型,才真正揭開了因果推斷的時代序幕[40],多種反事實因果模型相繼而生。近年來,“貝葉斯網(wǎng)絡(luò)之父”朱迪亞·珀爾(Judea Pearl)提出了與“潛在結(jié)果框架”相對應的“結(jié)構(gòu)因果框架”,通過構(gòu)建關(guān)鍵要素的因果圖描述變量之間的因果關(guān)系,研究者能夠更加直觀地進行因果效應的定量評估[41]。因果推斷向調(diào)查數(shù)據(jù)中注入了像自然科學實驗數(shù)據(jù)那樣的隨機性,盡可能得到對因果關(guān)系更為可靠的估計。
近十年來,我國經(jīng)濟學和社會學領(lǐng)域在應對統(tǒng)計分析的內(nèi)生性問題上已經(jīng)達到國際前沿水平[42],但是體育社會學研究者對此問題仍然重視不足。《南稻北麥》是少數(shù)重視內(nèi)生性問題、開展反事實模型分析的體育社會學論文之一。即使如此,《南稻北麥》所使用的反事實模型未必徹底排除了內(nèi)生性問題。例如,作者選取的“省級年平均氣溫與降水量”是否嚴格滿足工具變量的全部條件,值得商榷。又如,文中的工具變量與因變量直接相關(guān),氣溫和降水量在一定程度上也能夠直接影響居民的體育參與,尤其是戶外體育鍛煉的參與。此時模型中觀察到的統(tǒng)計顯著性可能不是由變量之間真實的關(guān)聯(lián)關(guān)系引起的,而是由其他因素造成的。此外,傾向值匹配分析的樣本量僅存不足25% 容易導致樣本嚴重偏誤,也可能會影響模型結(jié)果的推論價值。
在體育社會學定量研究中,首先要對內(nèi)生性問題的來源具有清晰的認識和區(qū)分,才能在此基礎(chǔ)上選擇不同方法。例如,針對聯(lián)立性因果帶來的內(nèi)生性問題,可以引入時間序列,通過面板數(shù)據(jù)的固定效應模型來解決。對于遺漏變量導致的內(nèi)生性問題,工具變量法是較為常見的處理策略。對于樣本選擇偏誤可以用樣本選擇模型來解決,對于自選擇偏誤可以用傾向值匹配法來解決[43]。下文筆者針對體育鍛煉(解釋變量)與健康狀況(結(jié)果變量)的因果關(guān)系,推介下列幾種反事實模型的應用方法。
(1)工具變量法。此方法通過引入與解釋變量(體育鍛煉)相關(guān)但與隨機誤差項無關(guān),而且與結(jié)果變量(健康狀況)無直接關(guān)聯(lián)的第3 個變量來解決內(nèi)生性問題[44]。例如,使用地區(qū)體育設(shè)施的可獲得性作為體育鍛煉的工具變量。2021 年的3 位諾貝爾經(jīng)濟學獎得主正是因引領(lǐng)了因果推斷和經(jīng)濟學中自然實驗的興起、改進了工具變量法而獲此殊榮。已有研究運用這一方法分析體育鍛煉對青少年非認知能力的影響[45]、估計體育鍛煉習慣為居民帶來的收入優(yōu)勢[46]等問題。在難以找到合適工具變量的情況下,隨機前沿模型等新技術(shù)也可用于處理內(nèi)生性問題。該模型使用Copula 方法度量內(nèi)生自變量和隨機項的相關(guān)性,然后使用數(shù)值積分和極大模擬似然方法估計目標模型[47]。
(2)雙重差分法。此方法能夠控制不隨時間變化的不可觀測因素,并估計干預措施的因果效應。通過比較處理組(參與體育鍛煉的人群)和對照組(未參與體育鍛煉的人群)在干預前后的健康狀況變化來估計體育鍛煉的效果[48]。假設(shè)某地區(qū)新建了一批體育設(shè)施,可以將這個地區(qū)的居民作為處理組,而另一個未建設(shè)體育設(shè)施的相似地區(qū)居民作為控制組。比較兩組在建設(shè)前后健康狀況的變化差異,這個差異的差異(“雙重差分”)即可被認為是體育鍛煉對健康影響的凈估計。合成控制法、回歸合成法與此原理類似。我國體育社會學領(lǐng)域已經(jīng)出現(xiàn)了相關(guān)方法的應用探索,通過對比實際情況和“反事實”情況的差值,評估北京2022 年冬奧會對北京旅游業(yè)的影響[49]。
(3)斷點回歸設(shè)計。經(jīng)濟學領(lǐng)域常用的斷點回歸設(shè)計由諾貝爾經(jīng)濟學獎獲得者Imbens 等[50]提出,通過利用自然發(fā)生的“間斷點”來解決內(nèi)生性問題。斷點回歸設(shè)計假設(shè)在某個特定間斷點附近其他所有條件都保持不變,只有一個關(guān)鍵變量發(fā)生了改變[50]。通過比較間斷點兩側(cè)的數(shù)據(jù),可以估計這個關(guān)鍵變量對結(jié)果的影響,有效分離因果關(guān)系和其他可能的影響因素。假設(shè)某個城市為65 歲以上的老人提供免費的體育設(shè)施使用權(quán),可將65 歲作為間斷點,通過比較小于和大于65 歲兩類人群的健康狀況差異,估計免費體育設(shè)施政策對健康的影響。已有研究[51]利用強制退休制度,用體育鍛煉參與在法定退休年齡前后的極限值之差來識別退休對體育鍛煉參與的因果效應。
(4)固定效應模型。如果有同一批樣本的體育鍛煉和健康狀況的多期追蹤數(shù)據(jù),可以使用固定效應模型來控制不隨時間變化的個體特征(如性別、遺傳因素等)和混淆因素,只分析體育鍛煉行為變化與健康狀況變化之間的關(guān)系。此外,基于多期追蹤數(shù)據(jù),還可以使用交叉滯后面板模型(cross-lagged panel model),引入時間效應,從而分離并估計出解釋變量和被解釋變量之間的雙向因果效應。該方法在運動生理學領(lǐng)域已有諸多應用,但在體育社會學研究中尚不普遍[52]。
(5)傾向值匹配模型。傾向值匹配是指通過匹配樣本中處理組和對照組中相似的個體來模擬隨機分配的情況[53]?;谀挲g、性別、社會經(jīng)濟地位等可觀測的個體特征,為每個樣本計算其進行體育鍛煉的概率,即傾向得分。將鍛煉的個體(處理組)與未鍛煉但在傾向得分上相似的個體(對照組)進行匹配,確保處理組和對照組在其他重要特征上是相似的。通過比較匹配后的處理組和對照組在健康指標上的差異,可以估算出體育鍛煉的凈效應。
體育社會學領(lǐng)域中的定量研究不僅是必要的,更是推動該領(lǐng)域科學發(fā)展的關(guān)鍵要素。從經(jīng)濟學、社會學和體育學的發(fā)展脈絡(luò)可以看出,定量研究在社會科學研究中占據(jù)著重要和主流的地位,其客觀性、精確性和可重復性有助于深入理解體育現(xiàn)象,驗證理論假設(shè),實現(xiàn)理論創(chuàng)新。
我國目前的體育社會學定量研究雖然存在諸多困境,但可以從定量研究的3 個核心環(huán)節(jié)來解決困境、提高質(zhì)量,即想問題、究理論、重證明?!跋雴栴}”的要領(lǐng)是首先從經(jīng)驗觀察中發(fā)現(xiàn)現(xiàn)實問題,進而將現(xiàn)實問題用理論概念抽象為學術(shù)研究問題,最后以變量思維將學術(shù)研究問題操作化為可量化、可觀察的測量指標。“究理論”的關(guān)鍵是將研究問題的本質(zhì)通過抽象概念來把握,將概念之間的關(guān)系通過理論命題和研究假設(shè)來表述,并力求在概念、命題、假設(shè)等要素上都有學術(shù)創(chuàng)新和突破?!爸刈C明”的途徑是努力把握概念測量的準確性、數(shù)據(jù)收集的規(guī)范性和分析方法的匹配性,同時嘗試使用恰當?shù)囊蚬茢喾椒▉斫鉀Q相應的內(nèi)生性問題。盡管面臨概念測量和數(shù)據(jù)收集的挑戰(zhàn),但標準化的數(shù)據(jù)收集、規(guī)范的測量、恰當選擇和使用研究方法,以及公共數(shù)據(jù)庫的建設(shè),可以幫助研究者有效地克服這些障礙。
數(shù)據(jù)科學的興起為包括體育社會學在內(nèi)在所有社會科學的定量研究創(chuàng)造了新的發(fā)展機遇。在計算科學、機器學習、人工智能等新技術(shù)日益普及的時代,新設(shè)備、新數(shù)據(jù)的可及性不斷提高,推動社會科學研究范式轉(zhuǎn)型,但在體育社會學領(lǐng)域,利用這些新形態(tài)的數(shù)據(jù)、技術(shù)和方法進行的定量分析還十分有限。例如,在人工智能的運用方面,目前國內(nèi)體育學研究主要集中于自然科學尤其是工程應用領(lǐng)域,而體育社會學領(lǐng)域還停留在圍繞這類新興技術(shù)的理論性探討和綜述[54-56],尚未出現(xiàn)數(shù)量可觀、質(zhì)量過硬的實證研究。少數(shù)已有研究[57-58]對大數(shù)據(jù)、人工智能等新興技術(shù)的應用分析也不夠深入。未來的體育社會學研究可以從以下不同的方向繼續(xù)探索。
(1)計算社會科學賦能理論創(chuàng)新。隨著社會科學和計算科學的深度交叉融合,學者已提出“計算扎根”的新范式[56],強調(diào)通過數(shù)據(jù)挖掘、機器學習和歸因算法篩選自變量,提出新的理論假設(shè),推動理論創(chuàng)新[59]。結(jié)合新興的數(shù)據(jù)結(jié)構(gòu)和計算科學方法,可以幫助體育社會學定量研究建構(gòu)理論體系、提升問題意識,使理論導向與新方法、新技術(shù)相輔相成。新興的數(shù)據(jù)結(jié)構(gòu)和計算科學方法使得研究者可以從大量數(shù)據(jù)中尋找模式和關(guān)系,驗證和改進現(xiàn)有理論,并在必要時建構(gòu)新的理論框架[60]。這種方法論強調(diào)數(shù)據(jù)和理論之間的動態(tài)互動,鼓勵研究者在數(shù)據(jù)分析和理論構(gòu)建之間尋求平衡,提高了對復雜社會現(xiàn)象的預測能力。計算社會科學將社會科學理論導向與新數(shù)據(jù)、新技術(shù)融為一體。這種融合不僅為大數(shù)據(jù)分析提供了新的研究議題和問題意識,而且在數(shù)據(jù)挖掘的結(jié)果中還可以找到建構(gòu)和驗證理論的線索,從而推動預測模型的建構(gòu)。計算社會科學的發(fā)展將社會科學理論引入數(shù)據(jù)挖掘之中,不僅能夠使用新形態(tài)的數(shù)據(jù)來驗證理論中發(fā)展出來的假設(shè),而且在理論機制不夠明晰時,也能從數(shù)據(jù)挖掘結(jié)果中得到啟發(fā)。通過解釋數(shù)據(jù)挖掘的結(jié)果,與相關(guān)理論開展對話,能夠驗證已有理論、發(fā)展新興理論[61]。
(2)新興數(shù)據(jù)形態(tài)拓寬機制分析。物聯(lián)網(wǎng)和分布式存儲等信息技術(shù)的發(fā)展使非結(jié)構(gòu)化大數(shù)據(jù)在社會科學研究中的應用增加。相較于問卷調(diào)查,大數(shù)據(jù)有諸多優(yōu)勢:一是降低經(jīng)濟、時間、人力成本,提升時效性;二是解決樣本代表性不足問題,減少抽樣偏差;三是不受傳統(tǒng)統(tǒng)計假設(shè)限制,可用復雜編程語言分析人類行為[62-63]。此外,大數(shù)據(jù)為社會科學研究者帶來了宏觀視角,研究者得以用較低的成本獲得傳統(tǒng)方法難以企及的宏觀指標及其隨時間變化的全過程[64],為體育政策制定和體育活動的組織提供數(shù)據(jù)支持。例如,通過分析社交媒體平臺上的在線討論、活動分享,以及圍繞特定體育事件的輿情數(shù)據(jù),可以了解體育活動參與者的互動模式和社會關(guān)系,研究大型體育賽事(如奧運會、足球世界杯賽、馬拉松)對城市或國家的社會影響。線上大數(shù)據(jù)與時序分析、空間分析方法相結(jié)合,可以分析賽事前后的社交媒體情緒變化、參與者和觀眾的地理分布[65],以及賽事對本地經(jīng)濟和社會結(jié)構(gòu)的長期影響。通過類似的分析,可以更好地理解體育賽事如何塑造國家認同、促進國際交流、影響社會心態(tài)。通過分析健身追蹤器和智能手表等可穿戴設(shè)備收集的行為數(shù)據(jù),研究人員可以更好地理解體育活動對個人健康的影響[66]。如果能夠?qū)⑴c者的運動頻率、強度、持續(xù)時間、生理響應(如心率、能量消耗)與問卷調(diào)查所反映的社會因素相結(jié)合,就能提供具有社會學意義的深刻洞見。
(3)前沿技術(shù)應用推進范式革新。機器學習和人工智能技術(shù)可以用于分析和預測體育活動對個體和群體的影響,催生了“社會預測”[67]、“理論與數(shù)據(jù)雙向驅(qū)動”[68]、“理論引導的大數(shù)據(jù)分析”[61]等兼具學術(shù)價值、治理價值和話語價值的新范式。機器學習技術(shù)改變了傳統(tǒng)體育社會學只能實現(xiàn)關(guān)聯(lián)分析和因果分析而無法進行預測的歷史。例如,機器學習可以基于歷史數(shù)據(jù)來預測體育活動參與度的變化趨勢,或者預測特定體育項目對特定人群健康的潛在影響,為體育政策制定和活動組織提供更有針對性的數(shù)據(jù)支持[69]。我國體育社會學領(lǐng)域目前也出現(xiàn)了采用機器學習算法對奧運冠軍臨場運動表現(xiàn)的影響因素進行的分類分析[70],以及將ChatGPT 用于輔助體育社會學文獻梳理和數(shù)據(jù)分析的技術(shù)性實踐總結(jié)[71]。這都是體育社會學定量研究中具有重要意義的探索。
新數(shù)據(jù)、新技術(shù)和新方法的應用能夠賦能理論創(chuàng)新、揭示新的因果機制、催生新的研究范式。未來的體育社會學研究不會再局限于單一范式,而應融合過程思維、結(jié)構(gòu)思維、反事實思維和前景思維等多種思維途徑[72]。多元化的研究范式結(jié)合新數(shù)據(jù)、新技術(shù)和新的因果識別策略,將會為體育社會學定量研究帶來新的機遇和可能。體育社會學定量研究應積極利用新技術(shù)和新方法,不僅關(guān)注實證分析的規(guī)范性和創(chuàng)新性,更要探索數(shù)據(jù)和現(xiàn)象背后深層次的社會機制,以開展更富有理論價值、現(xiàn)實意義和國際影響力的研究。
致謝在本文修改過程中,科羅拉多大學張磊博士、西安交通大學繆曉雷博士提出了建設(shè)性意見,特此致謝。
作者貢獻聲明:
邊燕杰:確定論文選題,提出核心觀點和理論框架,指導撰寫論文,修改審定論文;
張伊雪:梳理相關(guān)文獻,起草論文,修訂體例;
魯肖麟:修改論文框架,梳理相關(guān)文獻,撰寫論文。