DING Lin 申亞琴 張 萍
(1長江大學(xué)物理與光電工程學(xué)院,湖北 荊州 434023; 2俄亥俄州立大學(xué)教育學(xué)院,美國 俄亥俄 哥倫布 43210;3北京師范大學(xué)物理學(xué)系,北京 100875)
物理教育研究(Physics Education Research,簡稱PER)是一種有目的、有計劃的活動,研究人員必須依據(jù)研究目的收集數(shù)據(jù)、選擇適合的數(shù)據(jù)分析方法和對結(jié)果給出合理的解釋。調(diào)查研究(survey research)是物理教育量化研究方法中基礎(chǔ)和常用的方法,其目的是在大樣本的人群中定量描述我們感興趣的方面,調(diào)查研究使用的數(shù)學(xué)工具是描述統(tǒng)計[1]。這類研究主要是用來描繪或概括在物理教育研究中獲得數(shù)據(jù)的基本情況,顯示其分布特征,研究不涉及因果[2]。
在收集數(shù)據(jù)之前,研究人員必須明確研究問題或假設(shè)。這些問題或假設(shè)應(yīng)該包括感興趣的變量、測量工具和研究樣本3個方面。
感興趣的變量反映了一個研究人員希望觀察或測量什么。例如研究人員可能希望調(diào)查學(xué)生在一個物理學(xué)課程的學(xué)習(xí)過程中對某些物理概念的理解,或者調(diào)查他們對物理學(xué)本質(zhì)和物理學(xué)習(xí)方法的認識論。這些變量通常是模糊的,不能通過直接觀察得出結(jié)論,因此確定與之相關(guān)的可以直接測量的變量是非常關(guān)鍵的。例如,研究人員通常使用學(xué)生在物理概念測試的得分來研究學(xué)生對物理概念的理解。研究中還需要通過一些理論框架或文獻綜述來獲得一個基準(zhǔn),確定直觀測量量(學(xué)生的分數(shù))和不可觀察的變量(學(xué)生對概念的理解)之間的聯(lián)系。
明確了感興趣的變量后,就要尋找適合的測量工具。PER學(xué)者陸續(xù)開發(fā)出許多測試工具,涵蓋了非常廣泛的主題,包括:物理概念測試、科學(xué)推理和物理認識論等[3]。如果沒有合適的調(diào)查工具,就需要研究者按照科學(xué)范式自行開發(fā)新的測量工具。
調(diào)查研究還需要依據(jù)測試目標(biāo)合理選擇調(diào)查方法、測試時間和抽取樣本。調(diào)查方法包括紙筆測驗、郵寄調(diào)查問卷、網(wǎng)上投票或者訪談等;根據(jù)不同的研究目標(biāo),調(diào)查可以在不同時間點進行,例如在教學(xué)前、教學(xué)中或教學(xué)后。在調(diào)查研究中必須依據(jù)研究目標(biāo)選擇有代表性的樣本,考慮一些重要的因素,包括研究對象的身份(學(xué)生、教育工作者、家長、研究人員、管理者、決策者等等)、主體的數(shù)量、學(xué)歷、年齡、性別、種族、國籍或地區(qū),以及其他可能與試圖研究的問題相關(guān)的因素,使通過樣本獲得的定量結(jié)果可以理想地代表總體。
數(shù)據(jù)收集完成后,研究人員需要謹慎選擇適當(dāng)?shù)臄?shù)據(jù)分析方法。在描述統(tǒng)計中常用的方法包括分析平均值和中位數(shù)、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)分數(shù)、相關(guān)和回歸。相關(guān)和回歸需要兩個或更多數(shù)據(jù)集,其他統(tǒng)計方法都用來描述單個數(shù)據(jù)集。下面我們首先介紹單個數(shù)據(jù)集的統(tǒng)計方法,然后再討論以相關(guān)和回歸為代表的多個數(shù)據(jù)集的分析方法。
對于單組數(shù)據(jù),進行統(tǒng)計分析時,常常計算數(shù)據(jù)的一些特征量,包括集中量(measures of central tendency)和差異量(measures of variability),分別用來解釋一組統(tǒng)計數(shù)據(jù)的集中趨勢和離散程度。
描述一組數(shù)據(jù)集中量的參數(shù)有:平均數(shù),中位數(shù)和眾數(shù)等。在物理教育研究中,應(yīng)用最為廣泛的是算數(shù)平均數(shù)。只有定距 (interval) 和定比(ratio) 數(shù)據(jù)可以進行加減法運算[2],對它們計算平均數(shù)才有意義。平均數(shù)通常不適用于定類(normial) 或定序(ordinal) 數(shù)據(jù),在實際應(yīng)用中,如果定序數(shù)據(jù)是正態(tài)分布的,通??梢越瓶闯啥ň鄶?shù)據(jù)。因此在大部分PER研究中,研究人員經(jīng)常將測試總分(例如大部分的概念測試工具如FCI,F(xiàn)MCE,BEMA 等測得的數(shù)據(jù))視為定距數(shù)據(jù)。但是,對于使用李克特等級量表(Liket-scale inventory)進行問卷調(diào)查時(例如C-LASS,MPEX),通常不能將其得分看成定距數(shù)據(jù),計算其平均數(shù)。
對于定序或定類數(shù)據(jù)的描述統(tǒng)計往往以頻數(shù)(frequency)分布的形式進行。通常的方法是計算定序或定類數(shù)據(jù)中不同類別所占的百分比。例如,為了檢查不同專業(yè)選學(xué)物理課程學(xué)生人數(shù)中的性別分布,研究人員可以分別計算每一個專業(yè)的男、女生數(shù)量,然后計算百分比,找出分布規(guī)律。
在物理教育研究中,許多教育現(xiàn)象或教和學(xué)的行為之間存在著一定的相互關(guān)系,這實質(zhì)上涉及兩組數(shù)據(jù)的相互關(guān)系。在描述統(tǒng)計中使用相關(guān)和回歸分析來研究兩組以上數(shù)據(jù)之間的關(guān)系。
相關(guān)(correlation)的描述統(tǒng)計方法可以用來分析兩組數(shù)據(jù)集之間的共變關(guān)系,相關(guān)系數(shù)r表征兩個變量之間變化方向及密切程度。r的取值在-1到+1之間。r為負表示兩個變量負相關(guān),為正表示兩個變量是正相關(guān)。|r|越高表明兩組數(shù)據(jù)集之間的相關(guān)越高,|r|=1稱完全相關(guān),r=0稱完全不相關(guān)。
由于研究對象的不同,相關(guān)系數(shù)有多種定義方式。需要研究者根據(jù)研究主題和數(shù)據(jù)類型正確選擇。較為常用是皮爾遜相關(guān)系數(shù)(Pearson coefficient),用于計算兩組定距或定比數(shù)據(jù)的線性相關(guān)的程度,要求兩組數(shù)據(jù)均滿足正態(tài)分布,并且具有一一對應(yīng)關(guān)系。在PER中,這種方法經(jīng)常被用于調(diào)查學(xué)生在兩種不同的測驗中的表現(xiàn)是不是彼此相關(guān)。例如,Thornton等人在倫斯勒理工學(xué)院物理課程工作室對大約2000名學(xué)生進行了力的概念測試(Force Concept Inventory簡稱FCI)和力與運動概念評測(Force and Motion Conceptual Evaluation簡稱FMCE)。在這兩個測試中,將學(xué)生測試分數(shù)近似為定距數(shù)據(jù),并用其計算皮爾遜相關(guān)系數(shù)。結(jié)果顯示,盡管在這兩個測試中每個主題在內(nèi)容覆蓋面和題目數(shù)量上有差異,但是FMCE和FCI這兩個測試分數(shù)之間有相當(dāng)高的正相關(guān)(r=0.78,最大值為1),表明這兩項測試所測量的內(nèi)容有很大一部分是重疊的[4]。
對于定序數(shù)據(jù),乃至非正態(tài)分布的定距或定比數(shù)據(jù),我們需要使用斯皮爾曼秩相關(guān)系數(shù)ρ(Spearman’s correlation coefficient for ranked data)來計算相關(guān)[5];而對于定類數(shù)據(jù),如果相關(guān)的計算超出了描述統(tǒng)計的范圍,則是推斷統(tǒng)計的內(nèi)容,但是對于兩個定類數(shù)據(jù)集都是二分變量的特殊情況,我們可以使用Phi(φ)系數(shù)來計算相關(guān),它是皮爾遜相關(guān)系數(shù)對兩個二分變量數(shù)據(jù)集的一種簡化處理。例如,Heller和Huffman用這種方法來計算FCI項目中的二分變量(得分1或者0)的Phi相關(guān)系數(shù)[6,7];基于這些相關(guān),他們進行了數(shù)據(jù)的構(gòu)成分析,用以檢查FCI每個項目是否能被歸入FCI工具設(shè)計的六個主題(維度)之中。
相關(guān)系數(shù)只能說明兩個變量之間的變化方向及密切程度,不揭示事物內(nèi)在的因果關(guān)系。如果需要分析相關(guān)的兩個變量之間的內(nèi)在聯(lián)系,研究者必須對這兩個變量的本質(zhì)意義進行分析。另外,相關(guān)系數(shù)對樣本規(guī)模是非常敏感的(樣本量越小越容易出現(xiàn)偽相關(guān),最極端情況是只有兩個數(shù)據(jù)樣本,兩點一線,其相關(guān)系數(shù)為1,但不具有統(tǒng)計學(xué)意義),因此研究人員在報告相關(guān)時,需要報告樣本規(guī)模和相關(guān)的顯著性水平,從而判定這個樣本是否有統(tǒng)計學(xué)意義。顯著性檢驗超出描述統(tǒng)計,涉及推斷統(tǒng)計,將在后續(xù)文章中詳細介紹。
回歸分析(regression analysis)是相關(guān)分析的延伸,如果一個變量(回歸分析中稱為因變量)和另外一個或多個變量(自變量)存在顯著相關(guān),說明它們之間有某種共變關(guān)系,如何進一步用數(shù)學(xué)模型來描述這種變化關(guān)系,這就涉及回歸分析。粗略地說,回歸分析是尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性。按照研究涉及自變量的多少,分為一元回歸分析和多元回歸分析。依據(jù)自變量和因變量之間的函數(shù)關(guān)系分為線性回歸和非線性回歸。線性回歸關(guān)系相對簡單,因變量的變化和每個自變量的變化都成正比。
在物理學(xué)教育研究中,線性回歸經(jīng)常被用來描述一個感興趣的變量是如何根據(jù)其他變量變化的。所選的自變量和因變量之間具有較強的相關(guān),在理論上具有教育意義和內(nèi)在的可能因果關(guān)系,而不只是形式上的相關(guān)。所選自變量之間的相關(guān)程度不應(yīng)高于自變量與因變量之間的相關(guān)程度,應(yīng)盡可能避免自變量之間高度相關(guān),以免發(fā)生多重共線(multilinearity)問題[8]。
Kortemeyer研究學(xué)生在物理課程期末成績與他們在線學(xué)習(xí)行為之間的關(guān)系[9],研究者將學(xué)生在線學(xué)習(xí)行為分成六種類型,用學(xué)生在線討論時的表現(xiàn)進行測量。該研究使用FCI后測(post-FCI)成績(課程結(jié)束時進行測量)作為因變量,選擇FCI前測(pre-FCI)成績(課程開始前進行測量)為一個自變量,學(xué)生在線討論時某一類行為作為另一個自變量,進行回歸分析。例如,在該研究分類中,有一類學(xué)生學(xué)習(xí)行為是:“只關(guān)注問題的解答(solution),對解決問題過程中的因果推理和涉及的物理本質(zhì)不關(guān)注”,對于這個自變量(solution),研究得出的回歸方程為:
該結(jié)果對于FCI后測分數(shù)而言,其方差(explained variance )的47.9%可被自變量解釋,并且回歸方程中的兩個系數(shù)在統(tǒng)計上都是顯著的。學(xué)生的這類行為表現(xiàn)越典型,行為變量得分越高,系數(shù)-0.042(負斜率)說明:在控制pre-FCI前測成績不變的情況下,學(xué)生在該類型行為得分增加10分(占10%),其post-FCI后測得分減少0.42。在物理教學(xué)中一些教師試圖通過教給學(xué)生解題技巧和記憶題型,幫助學(xué)生直接快速地獲得答案,以此提高學(xué)習(xí)效率。上例中的數(shù)據(jù)表明,學(xué)生以這樣的方式學(xué)習(xí)產(chǎn)生的效果是負向的,因此在教學(xué)中應(yīng)該避免這樣的做法。所以用科學(xué)方法做物理教育研究,可以更好地幫助教師探索、揭示教育規(guī)律,按照規(guī)律辦事。
在物理教育研究中,非線性回歸分析并不經(jīng)常使用。有一個典型的例子是Henderson等人做的一項研究[10]。他們采用邏輯回歸的方法尋求物理教師對基于研究設(shè)計的教學(xué)方法(Research-Based Instruction Strategy簡稱RBIS)的認知和使用這些方法的情況與哪些因素相關(guān)聯(lián),涉及的因素包括:RBIS方面的知識、閱讀相關(guān)期刊、參加相關(guān)講座和研討等20個潛在自變量。感興趣的讀者可以參考原文獻以獲取更多的細節(jié)。
綜上所述,對于一組數(shù)據(jù),其每個數(shù)據(jù)的數(shù)值不同,它們的平均值可以視為這一組數(shù)據(jù)的一個概括,其代表性如何,就要看這組數(shù)據(jù)的離散程度,離散越小,代表性越強。相關(guān)是兩組數(shù)據(jù)的共變關(guān)系,并非一定揭示事物內(nèi)在的因果關(guān)系,但是可以為進一步深入研究指出一個可能的方向。同樣,回歸方程不是變量之間的剛性刻畫,而只是某種平均性質(zhì)的概括。用回歸方程去刻畫一對變量之間的關(guān)系,其代表性如何,取決于它們的相關(guān)系數(shù)。由于回歸方程是在樣本數(shù)據(jù)的基礎(chǔ)上得到的,對于回歸方程是否真實反映了事物之間的統(tǒng)計關(guān)系以及它是否能用于預(yù)測等需要進行統(tǒng)計檢驗[8]。
調(diào)查研究與描述統(tǒng)計是物理教育量化研究方法中最基本的方法,也是其他量化研究方法的基礎(chǔ)。在此我們只概述其中最基本的概念、給出它們在物理教育研究中的應(yīng)用實例,目的是幫助對物理教育量化研究感興趣的教師快速入門,然后在實踐中通過專門化的學(xué)習(xí)提升物理教育量化研究的專業(yè)能力。